Introdução À Teoria de Controle e Programação Dinâmica

steuer
2008/3/11
page
i
i
i
i
i
i
i
i
Conte udo
1 Introdu cao 1
1.1 Apresenta c ao dos Sistemas de Controle . . . . . . . . . . . 1
1.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 Aquecimento de um Quarto . . . . . . . . . . . . . 5
1.2.2 Um Problema de Controle Discreto . . . . . . . . . 7
1.2.3 Um Problema de Tempo Mnimo . . . . . . . . . . 11
1.2.4 Lan camento de um Foguete . . . . . . . . . . . . . 12
1.2.5 Equilbrio de um Bast ao . . . . . . . . . . . . . . . 13
1.2.6 Concentra c ao de Chumbo no Corpo Humano . . . 16
1.2.7 A Braquistocrona . . . . . . . . . . . . . . . . . . . 18
1.2.8 Um Problema de Controle

Otimo . . . . . . . . . . 21
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2 Observabilidade 26
2.1 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . 26
2.2 Subespa co n ao Observavel . . . . . . . . . . . . . . . . . . 33
2.3 Reconstru c ao de Estados . . . . . . . . . . . . . . . . . . . 35
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Controlabilidade 39
3.2 Controlabilidade e Observabilidade . . . . . . . . . . . . . 42
3.3 Sistemas de Controle Aut onomos . . . . . . . . . . . . . . 44
3.4 Forma Normal dos Sistemas Aut onomos . . . . . . . . . . 47
3.5 Controlabilidade e Estrategias

Otimas . . . . . . . . . . . 51
3.6 Atingibilidade de Estados com Restri c oes de Controle . . 54
3.7 Princpio do BangBang e Problemas de Tempo Mnimo . 60
3.8 Controlabilidade de Sistemas Lineares Discretos . . . . . . 65
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
CONTE
UDO
4 Estabilidade 71
4.1 Conceito e Exemplos . . . . . . . . . . . . . . . . . . . . . 71
4.2 Estabilidade de Sistemas Lineares . . . . . . . . . . . . . . 75
4.3 Criterio de RouthHurwitz . . . . . . . . . . . . . . . . . 78
4.4 Perturba c ao de Sistemas Lineares . . . . . . . . . . . . . . 81
4.5 Metodo de Lyapunov . . . . . . . . . . . . . . . . . . . . . 87
4.6 Equa c ao Matricial de Lyapunov . . . . . . . . . . . . . . . 92
4.7 Estabilidade de Sistemas Lineares Discretos . . . . . . . . 96
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5 Estabiliza cao 101
5.2 Coloca c ao de Polos . . . . . . . . . . . . . . . . . . . . . . 105
5.3 Observador Din amico . . . . . . . . . . . . . . . . . . . . 109
5.4 Estabiliza c ao por Realimenta c ao de Sada . . . . . . . . . 114
5.5 Pontos de Opera c ao . . . . . . . . . . . . . . . . . . . . . 116
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6 Identica cao de Parametros 120
6.1 Controle Automatico . . . . . . . . . . . . . . . . . . . . . 120
6.2 Identicabilidade . . . . . . . . . . . . . . . . . . . . . . . 121
6.3 Identica c ao Adaptativa: Introdu c ao . . . . . . . . . . . . 126
6.4 Identica c ao Adaptativa: Estabilidade . . . . . . . . . . . 131
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
7 Calculo Variacional 138
7.1 Problemas Variacionais e Convexidade . . . . . . . . . . . 139
7.2 Lemas de du BoisReymond e Lagrange . . . . . . . . . . 145
7.3 Equa c ao de EulerLagrange . . . . . . . . . . . . . . . . . 147
7.4 Extremais Diferenciaveis por Partes . . . . . . . . . . . . 156
7.5 Problemas Vetoriais . . . . . . . . . . . . . . . . . . . . . 164
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
8 Princpios Variacionais na Mecanica 168
8.1 Mec anica Newtoniana . . . . . . . . . . . . . . . . . . . . 168
8.2 Teoremas Conservativos em Sistemas Fechados . . . . . . 177
8.3 Mec anica Lagrangeana . . . . . . . . . . . . . . . . . . . . 178
8.4 Mec anica Hamiltoniana . . . . . . . . . . . . . . . . . . . 183
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
CONTE
UDO
9 Calculo Variacional e Controle

Otimo 192
9.1 O que e Controle

Otimo . . . . . . . . . . . . . . . . . . . 192
9.2 Problemas Variacionais com Restri c ao . . . . . . . . . . . 194
9.3 Extremais Singulares e Trajetorias

Otimas . . . . . . . . . 202
9.4 Controle

Otimo e Convexidade: condi c oes sucientes . . . 207
9.5 Controle

Otimo e Convexidade: condi c oes necessarias . . 211
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
10 Princpio do Maximo 216
10.1 Problemas com Horizonte Finito . . . . . . . . . . . . . . 217
10.2 Problemas com Horizonte Innito . . . . . . . . . . . . . . 222
10.3 Aplica c oes do Princpio do Maximo . . . . . . . . . . . . . 226
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
11 Programa cao Dinamica Discreta 244
11.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
11.2 Problema do Caminho Simples . . . . . . . . . . . . . . . 246
11.3 Problema da Substitui c ao de Equipamento . . . . . . . . 251
11.4 Problema do Caixeiro Viajante . . . . . . . . . . . . . . . 253
11.5 Problema Linear-Quadratico Discreto . . . . . . . . . . . 256
11.6 Problema de Decis oes Consecutivas . . . . . . . . . . . . . 260
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
12 Programa cao Dinamica Contnua 268
12.1 Fun c ao Valor

Otimo . . . . . . . . . . . . . . . . . . . . . 268
12.2 Princpio de Bellman . . . . . . . . . . . . . . . . . . . . . 274
12.3 Equa c ao de HamiltonJakobiBellman . . . . . . . . . . . 276
12.4 Problema de Controle Linear-Quadratico . . . . . . . . . . 285
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
13 Solu c oes Viscosas e Fun cao Valor 299
13.1 Solu c oes Viscosas de EDPs . . . . . . . . . . . . . . . . . 299
13.2 Formula de HopfLax . . . . . . . . . . . . . . . . . . . . 307
13.3 Fun c ao Valor como Solu c ao Viscosa de HJB . . . . . . . . 312
13.4 Princpio do Maximo . . . . . . . . . . . . . . . . . . . . . 317
13.5 Unicidade de Solu c oes Viscosas . . . . . . . . . . . . . . . 323
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
CONTE
UDO
Apendice A: Equa c oes Diferenciais Ordinarias 329
A.1 Exponencial de uma Matriz . . . . . . . . . . . . . . . . . 329
A.2 Sistemas Lineares Aut onomos . . . . . . . . . . . . . . . . 331
A.3 Sistemas Lineares n ao Aut onomos . . . . . . . . . . . . . 336
A.4 Sistemas n ao Lineares: existencia e unicidade . . . . . . . 342
A.5 Sistemas n ao Lineares: dependencia contnua . . . . . . . 347
A.6 Metodo de Shooting . . . . . . . . . . . . . . . . . . . . . 350
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 353
Apendice B: Demonstra cao do Princpio do Maximo 356
B.1 Otimiza c ao Innita . . . . . . . . . . . . . . . . . . . . . . 356
B.1.1 Um Problema Abstrato de Otimiza c ao . . . . . . . 357
B.1.2 Lineariza c ao do Problema de Otimiza c ao . . . . . 359
B.1.3 Condi c oes Necessarias para o Problema Abstrato . 367
B.2 Um Problema Auxiliar . . . . . . . . . . . . . . . . . . . . 370
B.3 Condi c oes Necessarias para Otimalidade . . . . . . . . . . 379
Lista de Smbolos 383
Bibliograa 385
Indice Remissivo 393

steuer
2008/3/11
page
i
i
i
i
i
i
i
i
Lista de Figuras
1.1 Estrategia de controle de malha aberta . . . . . . . . . . . 3
1.2 Estrategia de controle de malha fechada . . . . . . . . . . 3
1.3 Equilbrio de um bast ao . . . . . . . . . . . . . . . . . . . 14
1.4 Cicloide: solu c ao do problema da Braquistocrona . . . . 20
3.1 Piloto automatico para controle de altitude . . . . . . . . 70
4.1 Campo vetorial com pontos de equilbrio de diferente na-
tureza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.2 Campo vetorial com ponto de equilbrio atrativo porem
n ao estavel . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.3 Ponto de equilbrio assintoticamente estavel (x
tt
+ 2x
t
+
sin x = 0) . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.4 Ponto de equilbrio n ao estavel (x
tt
+ 2x
t
+ sin x = 0) . . . 85
4.5

Orbita do atrator de Lorenz . . . . . . . . . . . . . . . . . 87
7.1 Curva admissvel unindo os pontos P e Q. . . . . . . . . . 153
7.2 Constru c ao da fun c ao g no Teorema 144 . . . . . . . . . 159
8.1 A corda sob tens ao . . . . . . . . . . . . . . . . . . . . . . 181
8.2 Um perl de potencial . . . . . . . . . . . . . . . . . . . . 191
9.1 Condi c ao de transversalidade e fun c oes admissveis . . . . 195
9.2 Trajetoria admissvel que intercepta o extremal singular . 205
9.3 Trajetoria admissvel que n ao intercepta o extremal sin-
gular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
9.4 Condi c ao de transversalidade para a Braquistocrona . . . 213
10.1 Algoritmo do metodo de shooting para sistema hamilto-
niano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
LISTA DE FIGURAS
10.2 Tempo mnimo: trajetorias correspondentes a controles
extremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
10.3 Tempo mnimo: trajetorias correspondentes a controles
constantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
10.4 Tempo mnimo: uma trajetoria otima generica . . . . . . 231
10.5 Alunissagem: condi c oes iniciais para um controle otimo
especial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
10.6 Alunissagem: trajetorias otimas . . . . . . . . . . . . . . . 234
11.1 Mapa da cidade com ruas de m ao unica. . . . . . . . . . 246
11.2 Cidade projetada sobre sistema de coordenadas. . . . . . 249
11.3 Grafo para o problema do caminho mais curto. . . . . . . 267
B.1 Cones tangenciais C(x) e T(C, x). . . . . . . . . . . . . . 359
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
Prefacio
A inten c ao do presente manuscrito e apresentar, de forma intro-
dutoria, diversos aspectos relacionados à teoria de controle. A gama
de aplica c oes desta teoria e bastante ampla, permitindo a abordagem
de problemas atuais (veja, e.g., [KIF], [SHB], [SFG]) oriundos de dife-
rentes areas do conhecimento, tais como matematica, fsica, economia,
engenharia e demais ciencias aplicadas. O texto possui como uma de
suas principais caractersticas o tratamento formal, do ponto de vista
matematico, dos resultados apresentados. Paralelamente à introdu c ao
de conceitos e discuss ao de resultados teoricos, e dada enfase à analise de
exemplos correspondentes, motivados por problemas praticos. A op c ao
por esse tipo de abordagem visa n ao somente permitir uma melhor com-
preens ao dos resultados teoricos, como tambem ilustrar de forma deta-
lhada o vasto espectro de aplica c oes da teoria tratada neste manuscrito.
O texto e, em sua quase totalidade, autocontido. O leitor familia-
rizado com conceitos de algebra linear e an alise real n ao deve ter di-
culdades em acompanhar o manuscrito. Um pre-requisito essencial para
a compreens ao do conte udo e discutido no primeiro apendice. Trata-
se da teoria de equa c oes diferenciais ordin arias (ou EDOs). Uma vez
que tais resultados s ao utilizados ao longo de todo o texto, o objetivo
principal deste apendice e familiarizar o leitor com a nota c ao utilizada.
Tendo em vista os pre-requisitos acima descritos, sugere-se a utiliza c ao
do manuscrito por alunos de ultimo ano de gradua c ao em cursos de
ciencias exatas.
Em algumas poucas sec c oes, s ao utilizados durante o desenvolvi-
mento conceitos matematicos menos elementares, a saber: fundamentos
de teoria da medida e de an alise funcional (especialmente espa cos de
fun c oes e topologias correspondentes). Nestes casos os conceitos ou re-
sultados utilizados s ao sempre discutidos em notas de rodape e, alem
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
disso, s ao fornecidas referencias bibliogracas correspondentes. O leitor
deve car atento particularmente aos seguintes trechos do manuscrito:
nos captulos sobre controlabilidade e sobre controle otimo s ao utiliza-
dos alguns conceitos elementares de teoria de medida e integra c ao de
Lebesgue; nas sec c oes sobre controles restritos e sobre atingibilidade
no captulo de controlabilidade s ao utilizados resultados e deni c oes es-
peccos de analise funcional.
A op c ao pela utiliza c ao de tais ferramentas matem aticas se justica
pela import ancia, dentro da teoria de controle, dos resultados que po-
dem ser demonstrados como decorrencia de sua aplica c ao (e.g., princpio
do BangBang; convexidade e compacidade de conjuntos de estados
atingveis com controles restritos; princpio do maximo para controles
Lebesgue integraveis).
Na escolha dos temas abordados, buscamos o equilbrio entre os
meios (argumentos matematicos, eventualmente n ao elementares) e os
ns (resultados da teoria de controle). Tal tarefa se mostrou n ao tri-
vial, diante do fato de tratar-se de um texto introdutorio e da teoria em
quest ao possuir diversas vertentes. A abordagem de outros resultados
relevantes (e.g., problemas H
; controles impulsivos) foi sacricada em

prol deste compromisso entre meios e ns. Os autores creem que o mate-
rial abordado no manuscrito coloca o leitor a par do desenvolvimento da
teoria de controle, alem de fornecer diversas informa c oes sobre o estado
da arte dos atuais temas de pesquisa.
Visao geral do manuscrito
O manuscrito se divide em tres partes, cada uma das quais trata se-
paradamente de um aspecto relevante da teoria de controle. Na primeira
parte s ao discutidos resultados que permitem a analise da maioria dos
problemas tecnologicos oriundos da engenharia (regulagem, estabiliza-
c ao, . . . ). As duas ultimas partes do manuscrito tem ambas como obje-
tivo, analisar problemas de controle otimo. Entretanto, as abordagens
discutidas nestas partes seguem caminhos bastante distintos. A Parte II
se destina a analisar problemas de otimiza c ao de desempenho (contro-
le otimo) e sua correla c ao com o classico c alculo variacional e com a
mec anica Hamiltoniana. Na Parte III e discutida a rela c ao existente en-
tre solu c oes de distintos problemas pertencentes a uma mesma famlia
de problemas de controle otimo (programa c ao din amica).
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
A primeira parte do texto e iniciada com a apresenta c ao, na forma
de exemplos, de diferentes aspectos da teoria de controle. Na seq uencia
s ao abordados os conceitos de controlabilidade, observabilidade e esta-
bilidade, assim como suas inter-rela c oes. Esta parte e concluida com a
discuss ao de dois problemas cruciais em aplica c oes tecnologicas (veja,
e.g., [An]), a saber: a estabiliza c ao de sistemas e a reconstru c ao (ou
identica c ao) de par ametros.
Em sua segunda parte, o manuscrito trata dos problemas de con-
trole otimo. A abordagem e conduzida atraves de uma incurs ao inicial
pelo c alculo de varia c oes. No que diz respeito às condi c oes necessarias
para otimalidade, a extens ao à teoria de controle otimo dos resultados
classicos do calculo variacional e, no ponto de vista dos autores, o modo
mais natural para se compreender o mecanismo de funcionamento de
tais condi c oes. Na seq uencia, discutimos como condi c oes necessarias
para otimalidade s ao formuladas no contexto da mec anica Hamiltoni-
ana (equa c ao de HamiltonJacobi). O objetivo principal desta parte do
manuscrito e colocar em evidencia a rela c ao entre a equa c ao de Euler
Lagrange e o princpio do m aximo. Por ser extremamente tecnica, a
demonstra c ao do princpio do maximo e apresentada no Apendice B.
A terceira parte do texto trata da metodologia denominada de pro-
grama c ao din amica, que objetiva encontrar solu c oes para problemas de
controle otimo atraves da resolu c ao de uma equa c ao diferencial parcial,
a saber: a equa c ao de HamiltonJacobiBellman (ou HJB). A solu c ao
desta equa c ao e denominada fun c ao valor e esta intrinsecamente rela-
cionada com o problema original de controle otimo. Recentemente,
muito tem sido feito pelo lado analtico da caracteriza c ao das solu c oes da
equa c ao HJB. Este e um topico bastante atual de pesquisa, tendo ren-
dido a um de seus fundadores (P.L. Lions) a medalha Fields em 1996.
Neste sentido o ultimo captulo desta parte e destinado ao estudo das
solu c oes de viscosidade de equa c oes diferenciais parciais e da caracteri-
za c ao da fun c ao valor como solu c ao viscosa da equa c ao HJB.
Descri cao detalhada do conte udo
No Captulo 1 e apresentada, atraves da analise de exemplos, uma in-
trodu c ao à teoria. Em cada exemplo s ao discutidos e ilustrados conceitos
basicos, ao mesmo tempo que e apresentada uma diferente aplica c ao da
teoria de controle. A maior parte destas aplica c oes e discutida nova-
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
mente em detalhes ao longo do texto. Dentre os exemplos abordados
destacamos: aquecimento de um quarto (equa c ao de EulerLagrange
e calculo variacional); problema de controle discreto (multiplicadores
de Lagrange); problema de tempo mnimo (solu c oes tipo BangBang);
equilbrio de um bast ao (estabiliza c ao de sistemas); concentra c ao de
chumbo no corpo (reconstru c ao de par ametros); problema de controle
otimo (princpio do maximo de Pontryagin).
No Captulo 2 discutimos o conceito de observabilidade de sistemas
lineares de controle.

E feita a distin c ao entre os estados observaveis, n ao
observaveis e detectaveis. Na ultima sec c ao e apresentada uma tecnica
de reconstru c ao de estados a partir de observa c oes.
O Captulo 3 se destina a investigar o conceito de controlabilidade
de sistemas. Sistemas lineares e aut onomos s ao analisados separada-
mente. Discutimos a rela c ao entre a controlabilidade de um sistema
linear e a observabilidade do seu sistema adjunto. Apresentamos ainda
o teorema de Kalman (forma normal) para sistemas lineares aut onomos.
Analisamos propriedades topologicas de conjuntos de estados atingveis,
quando o problema de controle e considerado com controladores restri-
tos. O princpio do BangBang e sua rela c ao com os problemas de tempo
mnimo s ao tambem investigados. A ultima sec c ao trata do controle de
sistemas discretos.
No Captulo 4 e discutida a estabilidade de sistemas din amicos. In-
troduzimos o conceito de pontos de equilbrio estaveis e apresentamos
criterios de estabilidade para sistemas lineares. Criterios algebricos para
estabilidade (como o criterio de Hurwitz) s ao tratados em uma sec c ao
a parte. S ao analisados ainda sistemas obtidos por perturba c oes de sis-
temas lineares estaveis. S ao discutidos o criterio de estabilidade de Lya-
punov e a equa c ao matricial de Lyapunov, uma condi c ao necessaria e
suciente para determina c ao de estabilidade. Na ultima sec c ao e abor-
dado o criterio de Lyapunov para sistemas discretos.
No Captulo 5 e analisada uma aplica c ao classica da teoria de con-
trole, a saber: a estabiliza c ao de sistemas.

E feito uso da teoria desen-
volvida nos captulos anteriores a m de tratar este que e, sem sombra de
d uvida, um dos problemas mais importantes relacionado com aplica c oes
à engenharia. Abordamos a estabiliza c ao por realimenta c ao de estado
(state feedback) para sistemas lineares assim como uma quest ao quanti-
tativa relacionada a estabiliza c ao por realimenta c ao de estado.

E ana-
lisado ainda o engenhoso metodo proposto por Luenberger (observador
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
din amico), que permite simultaneamente a reconstru c ao de estados e es-
tabiliza c ao do sistema. Consideramos tambem o problema de estabilizar
sistemas utilizando realimenta c ao de sada (output feedback). Na ultima
sec c ao s ao tratados sistemas com pontos de opera c ao desconhecidos.
No Captulo 6 tratamos uma segunda aplica c ao relevante da teoria
de controle, a denominada identica c ao de par ametros. Estudamos o
problema de determinar par ametros desconhecidos de um sistema de
controle, a partir de certa quantidade de experimentos, nos quais s ao
conhecidos a entrada (input) e a sada (output) do sistema. Inicial-
mente s ao formalizadas deni c oes relevantes. Na seq uencia s ao discuti-
dos metodos iterativos de identica c ao.
O captulo 7 introduz o calculo variacional classico. Na primeira
sec c ao s ao obtidas, sob hipoteses adicionais de convexidade, condi c oes
necessarias e sucientes para otimalidade de um extremal. Na seq uencia
s ao apresentados o lema de du BoisReymond, o desenvolvimento da
equa c ao de EulerLagrange e a obten c ao de diferentes tipos de condi c oes
naturais de contorno. S ao considerados ainda problemas variacionais
que admitem solu c oes diferenciaveis por partes e deduzidas condi c oes
necessarias para otimalidade (equa c ao de EulerLagrange e condi c ao de
WeierstrassErdmann). Na ultima sec c ao, os resultados anteriores s ao
estendidos a problemas vetoriais.
No Captulo 8 discutimos a abordagem variacional para problemas
da mec anica. Na seq uencia apresentamos os formalismos relacionados
as mec anicas Newtoniana, Lagrangeana e Hamiltoniana. O objetivo
principal do captulo e a obten c ao de uma interpreta c ao fsica para a
equa c ao de HamiltonJacobi.
No Captulo 9 e apresentada uma analogia entre os problemas
variacionais e os problemas de controle otimo. Inicialmente s ao tratados
problemas variacionais sujeitos a restri c oes transversais, lagrangeanas e
isoperimetricas, e obtidas as correspondentes condi c oes necessarias para
otimalidade. A analogia com os problemas de controle e feita atraves
de exemplos. Na seq uencia consideramos problemas variacionais que ad-
mitem a existencia de extremais singulares. Neste caso os
problemas de controle correspondentes possuem solu c ao do tipo Bang
SingularBang. Analisamos ainda condi c oes sucientes para otimali-
dade de estrategias de controle, sob hipoteses adicionais de convexidade
da hamiltoniana. Ainda utilizando hipoteses de convexidade, e demons-
trada na ultima sec c ao uma vers ao simplicada do princpio do maximo.
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
No Captulo 10 e formulado o princpio do maximo de Pontrya-
gin. Trata-se de um conjunto de condi c oes necessarias para otimalidade
de problemas de controle que, em sua natureza, muito se assemelha à
equa c ao de EulerLagrange. Uma demonstra c ao do princpio do maximo
e apresentada no apendice B. Nas tres primeiras sec c oes analisamos vari-
antes do princpio do maximo para problemas com horizonte nito, com
horizonte innito e para problemas impulsivos. Na ultima sec c ao s ao re-
solvidos varios problemas atraves da utiliza c ao do princpio do maximo.
No Captulo 11 apresentamos os conceitos basicos da programa c ao
din amica para problemas discretos (tempo discreto). Atraves da analise
de diversos exemplos, s ao introduzidas a fun c ao valor, a equa c ao de oti-
malidade e as condi c oes de contorno correspondentes. Entre os exemplos
mais importantes est ao o caixeiro viajante; din amica linear com custo
quadratico; decis oes consecutivas.
No Captulo 12 apresentamos a forma contnua da programa c ao
din amica.

Enfase e dada à obten c ao da equa c ao da equa c ao de Euler
Lagrange, ao princpio de otimalidade de Bellman e a teoremas sobre a
regularidade da fun c ao valor.
No Captulo 13 e introduzido o conceito de solu c oes viscosas para
equa c ao HJB. A formula de HopfLax e obtida a partir da analise de
uma famlia particular de problemas de controle otimo.

E vericado o
fato da fun c ao valor ser uma solu c ao viscosa da equa c ao HJB e, sob
condi c oes especiais, provamos um resultado de unicidade.
Sugest oes para Utilizacao do manuscrito
O manuscrito, na forma em que se apresenta, pode ser coberto inte-
gralmente em dois cursos de um semestre (carga horaria de quatro horas
por semana).

E ainda possvel preparar, com base no manuscrito, dife-
rentes cursos de um semestre (novamente de quatro horas por semana),
com os seguintes enfoques:
i) Partes I, II e Apendices: curso de teoria de controle.
ii) Partes II, III e Apendice B: curso de controle otimo e programa c ao
din amica.
iii) Captulos 1 a 5, 7, 9, 10, 12: vers ao reduzida do curso de dois
semestres; a demonstra c ao no Apendice B pode ser apresentada
pelos alunos na forma de seminarios.
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
PREF
ACIO
Sobre a confeccao do manuscrito
O projeto de elabora c ao do presente manuscrito iniciou-se com a con-
fec c ao das notas para o minicurso T opicos em teoria de controle, apresen-
tado durante o XXII CNMAC (Santos, 1999) por A. Leit ao. Posterior-
mente, essas notas foram acrescidas das notas de aula dos cursos Teoria
de controle A e B (ministrados pelo mesmo autor em 1998 na UFSC). A
linha mestra destes cursos foi por sua vez fortemente inuenciada pelas
disciplinas Steuerungstheorie e Variationsrechnung, ministradas por J.
Baumeister na Goethe Universitat em 1995 e 1996 respectivamente. A
composi c ao das diferentes notas de aula de ambos os autores deu orgem
ao presente material.
O n umero de problemas e aplica c oes que podem ser tratados no
contexto da teoria de controle vem crescendo de forma consideravel nas
ultimas decadas, o que pode ser comprovado pelo n umero cada vez maior
de grupos de pesquisa e periodicos especializados nesta area. Tal fato
pode ser interpretado como um reexo das necessidades da sociedade
moderna, que cada vez mais prioriza a execu c ao de tarefas de forma
precisa e eciente. Inserida neste contexto esta a proposta do presente
manuscrito, que pretende servir como orienta c ao inicial a todos os que
desejem ingressar nesta interessante e promissora area.
Johann Baumeister Frankfurt am Main
Antonio Leit ao Florianopolis
steuer
2008/3/11
page
i
i
i
i
i
i
i
i
steuer
2008/3/11
page 1
i
i
i
i
i
i
i
i
Captulo 1
Introducao
O objetivo deste captulo e apresentar ao leitor a teoria de controle
atraves da analise de algumas de suas aplica c oes mais relevantes. Com
este intuito s ao introduzidos na Sec c ao 1.1 alguns conceitos elementares,
essenciais para a formula c ao dos problemas de controle. Na Sec c ao 1.2
s ao abordados diferentes problemas no contexto da teoria de controle,
fornecendo assim uma ideia da versatilidade da aplica c ao desta teoria.
Os exemplos mais relevantes apresentados nesta sec c ao s ao posterior-
mente abordados ao longo do texto.
1.1 Apresentacao dos Sistemas de Controle
Considere a famlia de problemas em que um determinado n umero
de variaveis que dependem do tempo x
1
(t), . . . , x
n
(t) tem sua evolu c ao
descrita por uma equa c ao da forma
(1.1) x = F(t, x),
onde F : RR
n
R
n
e uma fun c ao conhecida que descreve a din amica
da evolu c ao e x(t) = (x
1
(t), . . . , x
n
(t)) R
n
e o vetor de vari aveis de
estado, cujas componentes s ao as quantidades que desejamos acompa-
nhar. Tais variaveis representam, no instante de tempo t, as condi c oes
nas quais se encontra o processo que esta sendo modelado. A seguir e
apresentado um exemplo ilustrativo.
steuer
2008/3/11
page 2
i
i
i
i
i
i
i
i
2 [CAP. 1: INTRODUC
AO
Exemplo 1 (Deslocamento de um corpo). Para representar o co-
nhecido problema de deslocamento da cinematica utilizamos o seguinte
modelo:
t : tempo;
m : massa do corpo;
x(t) : velocidade no tempo t;
x(t) : acelera c ao no tempo t;
T(t) : for ca exercida sobre o corpo no tempo t.
Observe que a lei de Newton nos fornece a equa c ao
x(t) =
1
m
T(t),
que e uma caso particular da equa c ao (1.1) 2
Se consideramos a possibilidade de exercer inuencia sobre o
lado direito do sistema (1.1) atraves da escolha dos par ametros livres
u
1
(t), . . . , u
m
(t), a equa c ao (1.1) toma a forma
(1.2) x = F(t, x, u),
onde u(t) = (u
1
(t), . . . , u
m
(t)) R
m
e chamado vetor de vari aveis de
controle ou ainda entrada do sistema.
Um importante caso particular corresponde à situa c ao em que a
din amica do sistema (1.2) e linear tanto na variavel de estado x quanto
na variavel de controle u. Temos assim os sistemas de controle lineares
(1.3) x = A(t) x + B(t) u(t),
onde A(t) R
n,n
e B(t) R
n,m
, para todo t. Muitas vezes considera-se
que a evolu c ao do sistema (1.2) pode ser acompanhada somente atraves
de um vetor y(t) = (y
1
(t), . . . , y
p
(t)) R
p
, que depende da variavel de
estado x e e denominado sada do sistema. Se a fun c ao que descreve a
dependencia de y em rela c ao a x e linear em x, temos
(1.4) y(t) = C(t) x(t),
onde C(t) R
p,n
, para todo t. O caso particular C(t) I corresponde
à situa c ao em que e possvel conhecer a variavel de estado x em todos
os instantes de tempo.
Observe que, ao escolher estrategias de controle diferentes, estamos
alterando a din amica do sistema de forma tambem diferenciada. A
princpio, e possvel distinguir entre dois tipos de escolha para estrategia
de controle:
steuer
2008/3/11
page 3
i
i
i
i
i
i
i
i
[SEC. 1.1: APRESENTAC
AO DOS SISTEMAS DE CONTROLE 3

B t ( ) x A s x s B s u s ds + ( ) ( ) + ( ) ( )
0
0
t u t ( )
x t ( )
C t ( )
y t ( )
Figura 1.1: Estrategia de controle de malha aberta para sistemas lineares
Uma estrategia u e escolhida a priori e levada a cabo sem consi-
derar a sada do sistema. Em outras palavras, a sada do sistema
n ao inui na escolha da entrada do mesmo. Este e o chamado
controle de malha aberta (open-loop control), que e esquematizado
na Figura 1.1;
A escolha da estrategia de controle e feita de acordo com a sada
(ou estado) do sistema. Nesse caso temos um controle de malha
fechada (closed-loop control) ou controle de realimenta c ao de sada
(ou estado); veja Figura 1.2.
Observa cao 2. Alguns autores denominam o primeiro problema de
controle, e o segundo de regulagem. A regulagem e mais complexa de
ser implementada, uma vez que s ao necessarios: i) Coletar informa c oes
a respeito da sada (ou do estado) do sistema; ii) Escolher, a partir da
sada, uma entrada u do sistema. 2
Nos dois exemplos a seguir apresentamos situa c oes espec cas, nas
quais as diferentes estrategias de controle podem ser aplicadas.
B t ( ) x A s x s B s u s ds + ( ) ( ) + ( ) ( )
0
0
t u t ( )
x t ( )
C t ( )
y t ( )
K t ( )
Figura 1.2: Estrategia de controle de malha fechada para sistemas lineares. A
a c ao de realimenta c ao e descrita aqui por u(t) = K(t)y(t), com K(t) R
m,p
Exemplo 3 (Aquecimento de um quarto). Considere o problema
de aquecer um quarto, casa, etc. . . podemos identicar os dois tipos de
estrategia:
No problema de controle, a estrategia de aquecimento e escolhida
dependendo da hora do dia e epoca do ano. A estrategia e periodica.
Na regulagem, a estrategia de aquecimento e escolhida de acordo
com a temperatura do quarto, com a temperatura exterior e com uma
temperatura de referencia.
steuer
2008/3/11
page 4
i
i
i
i
i
i
i
i
4 [CAP. 1: INTRODUC
AO
A regulagem pode compensar interferencias (janela aberta, atraso na
mudan ca das esta c oes, . . . ), enquanto que o controle n ao. 2
Exemplo 4 (Enchimento de um reservat orio dagua). Censidere o
seguinte modelo para representar a varia c ao do nvel de um reservatorio
dagua
t : tempo;
I(t) : uxo de agua que entra no reservatorio no tempo t;
x(t) : quantidade de agua no reservatotio no tempo t;
y(t) : altura do nvel da agua no tempo t;
u(t) : abertura da torneira para entrada de agua no tempo t.
Supondo que I(t) = c
1
u(t) e y(t) = c
2
x(t) temos:
x = I(t) = c
1
u(t) ou x(t) = x(0) +
_
t
0
c
1
u(s) ds.
Note que o reservatorio estara cheio quando x(t) = x
max
ou y(t) = y
max
.
Denimos, usando apenas a eurstica, a seguinte estrategia:
1) Medir no tempo t a sada y(t);
2) Testar se y(t) = y
max
;
3) Abrir ou fechar a torneira;
4) Voltar ao item 1);
Note que usamos apenas dois valores extremos do controlador, que cor-
respondem à torneira totalmente aberta ou totalmente fechada. Tais
controles pertencem a uma famlia especial (controles de BangBang) e
s ao analizados mais detalhadamente no Captulo 3. 2
Observa cao 5. A fun c ao que permite calcular a sada y a partir da
entrada u e denominada fun c ao de transferencia. A seguir, relacionamos
algumas formas especiais desta fun c ao para sistemas com entrada e sada
escalar, i.e. y(t), u(t) R, para todo t.
Transferencia proporcional: y(t) = ku(t);
Transferencia integral: y(t) = y
0
+k
_
t
0
u(s)ds;
1
Transferencia diferencial: y(t) = ku
t
(t);
Transferencia de tempo morto: y(t) = ku(t );
1
No Exemplo 1 temos y(t) = x(t) = x
0
+ 1/m
_
t
0
F(s)ds.
steuer
2008/3/11
page 5
i
i
i
i
i
i
i
i
[SEC. 1.2: EXEMPLOS 5
Sistemas de controle com entrada e sada escalar s ao tambem conhecidos
pela abrevia c ao SISO (single-input single-output). Note que a estrategia
de realimenta c ao ilustrada na Figura 1.2 e a generaliza c ao para o caso
vetorial da transferencia proporcional. 2
Para terminar essa discuss ao inicial e importante chamar aten c ao
para dois conceitos extremamente importantes na teoria de controle que
s ao os de controlabilidade e observabilidade de um sistema. Informal-
mente dizemos que um sistema de controle e control avel quando for
possvel encontrar uma estrategia de controle u que leve o estado inicial
a um estado nal desejado. Por outro lado, dizemos que um sistema de
controle e observ avel quando for possvel reconstruir o estado inicial x
0
a partir da sada y do sistema. Os conceitos acima s ao abordados em
detalhes nos Captulos 2 e 3 respectivamente.
1.2 Exemplos
Os exemplos a seguir tem o objetivo de ilustrar os diferentes tipos
de aplica c oes que podem ser tratadas atraves da teoria de controle e
ao mesmo tempo de apresentar as ferramentas matematicas necessarias
para investiga c ao dos problemas.
1.2.1 Aquecimento de um Quarto
Tratamos do problema de manter um quarto aquecido durante um
determinado tempo, de forma que a energia gasta no processo seja a
menor possvel. Para este m denominamos
t : tempo pertencente ao intervalo [0, T] com T > 0;
w(t) : temperatura do quarto;
w
0
: temperatura do quarto no tempo t = 0 ;
c : temperatura constante fora do quarto;
z(t) : diferen ca de temperatura entre o quarto e o exte-
rior;
z
0
:= w
0
c : diferen ca de temperatura no tempo t = 0;
u(t) : taxa de varia c ao do calor inserido.
Na formula c ao do modelo, supomos a varia c ao de temperatura pro-
porcional tanto à temperatura exterior, quanto a energia utilizada no
mecanismo de controle. Temos assim:
(1.5) z
t
= a z + b u(t),
steuer
2008/3/11
page 6
i
i
i
i
i
i
i
i
6 [CAP. 1: INTRODUC
AO
onde a, b s ao constantes positivas que descrevem a fsica do problema
(isolamento do quarto, . . . ).
Como objetivo denimos que a temperatura inicial z
0
deve evoluir ate
a temperatura z(T) = z
T
no nal do tempo T. Nesse processo deve
ser gasto o mnimo de energia possvel, sendo que o gasto de energia e
descrito pela fun c ao objetivo
(1.6) J(u) :=
1
2
_
T
0
u
2
(t) dt.
Podemos ent ao formular o problema de encontrar uma estrategia de
controle da seguinte forma:
_
_
_
Minimizar J(u)
sujeito à
z
t
= az +bu; z(0) = 0, z(T) = z
T
.
Na formula c ao acima, deixamos em aberto que tipo de controle e con-
siderado admissvel (u C
0
([0, T]), L
2
([0, T]), L
([0, T]), . . . ) e con-

seq uentemente que tipo de solu c ao admitimos para a equa c ao diferencial
(1.5).
Esse problema e particularmente interessante, pois se deixa inserir
no contexto do c alculo das varia c oes. Observe que resolvendo (1.5) para
u e substituindo na fun c ao objetivo em (1.6) obtemos
_
_
_
Minimizar I(z) :=
_
T
0
L(t, z(t), z
t
(t)) dt
sujeito à
z(0) = 0, z(T) = z
T
onde L(t, z(t), z
t
(t)) = b
2
(z
t
(t) + az(t)). Por simplicidade, tomamos
z
0
= 0. Da teoria do calculo das varia c oes, sabemos que uma solu c ao
do problema variacional acima precisa satisfazer a equa c ao de Euler
Lagrange
(1.7)
L
z

d
dt
L
z
t
= 0.
Em nosso problema particular, a Equa c ao diferencial de Euler se escreve
(1.8) z
tt
a
2
z = 0,
steuer
2008/3/11
page 7
i
i
i
i
i
i
i
i
para a qual conhecemos as solu c oes linearmente independentes
sinh(at), cosh(at).
Da condi c ao de contorno z(0) = 0, exclumos a solu c ao cosh(at). Da
outra condi c ao de contorno z(T) = z
T
, obtemos a solu c ao
(1.9) z(t) = z
T
sinh(aT)
1
sinh(at), t [0, T],
que n ao depende do par ametro b. Obtemos ent ao a estrategia de controle
otimo
(1.10) u(t) = z
T
a b
1
sinh(aT)
1
e
at
, t [0, T].
Note que so foi possvel encontrar o controle otimo utilizando a
equa c ao de EulerLagrange. Veremos no exemplo a seguir outro metodo
de analisar este mesmo problema.
1.2.2 Um Problema de Controle Discreto
Analisamos um modelo discreto (tempo discreto) para o qual e poss-
vel determinar condi c oes necessarias para solu c ao do problema. Para
tanto, utilizamos um resultado sobre condi c oes necessarias para um ex-
tremal no contexto de espa cos de dimens ao nita. Considere a equa c ao
de diferen cas escalar:
(1.11) y
k+1
= f
k
(y
k
, u
k
), k = 0, . . . , N 1
e as condi c oes de contorno
(1.12) y
0
= y
0
, y
N
= y
N
.
A fun c ao objetivo e dada por
(1.13) J(y, u) :=
N1
k=0
l
k
(y
k
, u
k
),
onde as fun c oes l
k
, k = 0, . . . , N 1 s ao dadas. Consideramos ent ao o
problema de otimiza c ao
_
Minimizar J(y, u)
sujeito à (1.11), (1.12).
steuer
2008/3/11
page 8
i
i
i
i
i
i
i
i
8 [CAP. 1: INTRODUC
AO
As variaveis do problema de minimiza c ao s ao os vetores:
u = (u
0
, . . . , u
N1
) R
N
, y = (y
1
, . . . , y
N1
) R
N1
.
Supondo agora que as fun c oes f
k
, l
k
envolvidas no problema s ao sucien-
temente diferenciaveis, podemos utilizar o teorema dos Multiplicadores
de Lagrange para deduzir condi c oes necessarias para determina c ao de
um extremal. Tal lema e apresentado a seguir:
Lema: (Multiplicadores de Lagrange) Seja U R
n
aberto e as
fun c oes F : U R e G : U R
m
continuamente diferenci aveis em U,
onde m < n. Se U e um extremo local de F(x) sujeito ` a restri c ao
G(x) = 0 e G() a matriz jacobiana de G no ponto tem posto
m (m aximo), ent ao existe

R
m
de modo que o gradiente da fun c ao
ampliada
(1.14) K(x, ) = F(x) +
m
j=1
j
G
j
(x)
se anula no ponto (,
). Isto e,
K
x
i
(,
) = 0, i = 1, . . . , n, (1.15)
K
j
(,
) = 0, j = 1, . . . , m. (1.16)
Demonstra c ao: Este e um resultado classico da analise no R
n
, podendo
sua demonstra c ao ser encontrada em [Wa1].
As equa c oes (1.15), (1.16) s ao denominadas condi c oes de KuhnTucker.
Em nosso exemplo, a fun c ao K e dada por:
K(y
0
, . . . , y
N
, u
0
, . . . , u
N1
,
0
, . . . ,
N+1
)
=
N1
i=0
l
i
(y
i
, u
i
) +
N1
j=0
j+1
(f
j
(y
j
, u
j
) y
j+1
)
+
0
(y
0
y
0
) +
N+1
(y
N
y
N
),
onde a numera c ao das componentes de e escolhida de forma adequada.
Denindo agora a fun c ao de Hamilton
(1.17)
H(y
0
, . . . , y
N
, u
0
, . . . , u
N1
,
0
, . . . ,
N+1
)
=
N1
i=0
l
i
(y
i
, u
i
) +
N1
j=0
j+1
f
j
(y
j
, u
j
),
steuer
2008/3/11
page 9
i
i
i
i
i
i
i
i
podemos reescrever as equa c oes (1.15), (1.16) como:
y
k
=
H
k
, k = 1, . . . , N (1.18)
k
=
H
y
k
, k = 1, . . . , N 1 (1.19)
0 =
H
u
k
, k = 0, . . . , N 1 (1.20)
(1.21) y
0
= y
0
, y
N
= y
N
.
Note que temos N +(N 1) +N +2 equa c oes para (N +1) +N +N
variaveis.
2
A equa c ao (1.18) e a Equa c ao de Evolu c ao, (1.19) e a Equa c ao
Adjunta e (1.20) e a Condi c ao de Otimalidade.
Um candidato à solu c ao e obtido resolvendo-se o sistema acima. Note
ainda que em problemas concretos temos que vericar a regularidade
das fun c oes exigida no lema dos multiplicadores de Lagrange.
Consideramos agora um exemplo concreto, obtido a partir do pro-
blema contnuo analisado no Exemplo 1.2.1. Tomando N = T e dis-
cretizando (1.5) atraves da aproxima c ao por diferen cas nitas:
(z(t + t) z(t))/t = az(t) +bu(t), obtemos o sistema discreto:
y
k+1
= a y
k
+ b u
k
, k = 0, . . . , N 1
J(y, u) :=
1
2
N1
i=0
u
i
2
y
0
= 0, y
N
= z
T
.
Note que a constante a na equa c ao acima e diferente da constante a em
(1.5). Obtemos ent ao as condi c oes necessarias:
y
k+1
= a y
k
+ b u
k
, k = 0, . . . , N 1 (1.22)
k
= a
k+1
, k = 1, . . . , N 1 (1.23)
u
k
+
k+1
b = 0, k = 0, . . . , N 1 (1.24)
2
Descartamos as equa c oes K/y
0
e K/y
N
referentes ` as vari aveis
0
e
N+1
respectivamente, pois vamos desconsiderar essas vari aveis. O papel delas e somente
garantir que as condi c oes de contorno sejam satisfeitas pelo candidato a extremal.
steuer
2008/3/11
page 10
i
i
i
i
i
i
i
i
10 [CAP. 1: INTRODUC
AO
y
0
= 0, y
N
= z
T
.
Calculando u
k
em (1.23) e substituindo em (1.22) obtemos
y
k+1
= a y
k
b
2
k+1
, k = 0, . . . , N 1 (1.25)
k
= a
k+1
, k = 1, . . . , N 1 (1.26)
Note que (1.26) nos permite calcular
k
recursivamente a partir de
N
:
k
= (a)
Nk
N
, k = 1, . . . , N 1.
Substituindo em (1.25), obtemos a equa c ao de diferen cas:
y
k+1
= a y
k
b
2
(a)
Nk1
N
, k = 0, . . . , N 1,
a qual pode ser resolvida diretamente se usamos a condi c ao inicial y
0
= 0.
Temos ent ao
y
k
=
k1
i=0
(a)
ki1
b
2
(a)
Ni1
N
= b
2
N
(a)
N+k2
k1
i=0
(a)
2i
, k = 1, . . . , N.
Da serie geometrica obtemos agora:
3
(1.27) y
k
= b
2
N
(a)
N+k2
1
_
1
a
2
_
k
1 +
_
1
a
2
_ , k = 1, . . . , N
Falta ainda calcularmos
N
. Para isso, tomamos k = N em (1.27) e
usamos a condi c ao de contorno y
N
= z
T
, obtendo assim (para N par)
z
T
= b
2
N
(1 +a
2N
)
(1 +a
2
)
.
Denindo agora d := b
2
(1 + a
2
)/(1 + a
2N
), temos
N
= dz
T
e de
(1.27) temos por m
y
k
= b
2
d z
T
(a)
N+k
1
_
1
a
2
_
k
1 +a
2
, k = 1, . . . , N 1
u
k
= b d z
T
(a)
N+k+1
_
1
_
1
a
2
_
k+1
1 +a
2
+
1
_
1
a
2
_
k
1 +a
2
_
, k=0, . . ., N1.
3
(1 +q +. . . +q
N
)(1 q) = (1 q
N+1
).
steuer
2008/3/11
page 11
i
i
i
i
i
i
i
i
1.2.3 Um Problema de Tempo Mnimo
O movimento retilneo de um carro de massa m = 1 e descrito por
x = u(t),
onde a fun c ao u : [0, T] R representa a variavel de controle.
4
O
controle corresponde à acelera c ao e à frenagem do veculo. Supomos
que no instante inicial t
0
= 0 o carro se encontra em repouso:
x(0) = 0, x(0) = 0.
No tempo T > 0 o carro deve estar parado em frente a uma parede
que dista uma unidade da orgem.
x(T) = 1, x(T) = 0.
Supomos ainda que as a c oes de controle s ao limitadas por
(1.28) [u(t)[ 1, t [0, T].
O objetivo a ser atingido e:
Encontrar um controle u, que desloque o carro conforme des-
crito acima no menor tempo

T possvel.
A solu c ao e:
T = 2, u(t) =
_
+1 , 0 t < 1
1 , 1 t 2
Observe que a trajetoria x obtida a partir de u satisfaz as condi c oes
de contorno do problema. Mais tarde provaremos que u e

T s ao de fato
otimos. Os multiplicadores de Lagrange utilizados no Exemplo 1.2.2
n ao s ao aplicaveis aqui (caso discretizassemos o sistema), pois o tempo
nal n ao e xado a priori. A estrategia u se enquadra nos chamados
controladores BangBang, onde o controle assume somente os valores
extremos permitidos.
Caso a restri c ao (1.28) n ao seja fornecida, o problema n ao mais pos-
sui solu c ao. Basta observar que T
n
= 2/n e
u
n
(t) :=
_
+n
2
, 0 t < 1/n
n
2
, 1/n t 1/n
s ao estrategias admissveis e lim
n
T
n
= 0. Portanto, n ao existe uma
estrategia otima.
4
A dependencia em rela c ao ao tempo t da vari avel de estado n ao e representada
na equa c ao diferencial.
steuer
2008/3/11
page 12
i
i
i
i
i
i
i
i
AO
1.2.4 Lancamento de um Foguete
Considere o seguinte problema:
Um foguete deve ser lan cado do solo na vertical e deve, a par-
tir de uma estrategia de consumo de combustvel, alcan car a
maior altitude possvel.
Para estudar este problema tomamos:
t : tempo;
m(t) : massa do foguete;
v(t) : velocidade do foguete;
I(t) : impulso do foguete.
Fazemos agora a seguinte hipotese fsica:
(1.29)
Taxa de varia c ao do impulso = Soma das for cas agindo sobre o corpo.
A partir da lei fsica P = mv, temos no intervalo innitesimal de tempo
[t, t + t]:
Massa Velocidade Impulso
t m v mv
t + t m+ m v + v (m+ m)(v + v)
Supondo que combustvel de massa m (pois m < 0) e, depois de
queimado, expelido com velocidade v
0
, temos que o impulso total no
tempo t + t e dado por
mv + v
0
m + mv.
Portanto, a varia c ao do impulso no intervalo innitesimal [t, t + t] e
lim
t0
mv + v
0
m + mv
t
= m v + v
0
m.
Da hipotese em (1.29) conclumos ent ao
(1.30) m v + v
0
m = mG(h) D(v, h),
onde
m, v, h : massa, velocidade e altura do foguete respectivamente;
G(h) : for ca da gravidade;
D(v, h) : resistencia do ar.
steuer
2008/3/11
page 13
i
i
i
i
i
i
i
i
Supondo agora que G(h) = c
1
h
2
, D(v, h) = c
2
v
2
e
h
e que podemos
controlar o empuxo u := v
0
m, obtemos o seguinte sistema:
h = v (1.31)
m = v
1
0
u(t) (1.32)
v = m
1
[u(t) D(v, h)] G(h) (1.33)
Supomos ainda que o empuxo e limitado, ou seja
(1.34) 0 u(t) u
max
.
Note que o tempo nal T n ao e fornecido e que as condi c oes de contorno
s ao:
(1.35) h(0) = 0, v(0) = 0, m(0) = m
0
, m(T) = m
T
,
onde m
T
e a massa do foguete sem combustvel e m
0
a massa do foguete
abastecido. O problema de encontrar a trajetotia otima pode ent ao ser
escrito como:
_
_
_
Maximizar h(t)
sujeito à
(1.31), (1.32), (1.33), (1.34), (1.35)
Fazendo hipoteses adequadas sobre G e D, e possvel garantir a existen-
cia de uma solu c ao da forma (BangSingularBang)
u(t) :=
_
_
_
u
max
, t [0, t
1
]
(0, u
max
) , t (t
1
, t
2
)
0 , t [t
2
, T]
,
onde t
1
, t
2
dependem de m
0
, m
T
, D, G, u
max
.
1.2.5 Equilbrio de um Bastao
Considere um bast ao sem massa, de comprimento unitario, que pos-
sui em sua extremidade superior uma massa pontual m. A extremidade
inferior pode ser deslocada ao longo do eixo x e a acelera c ao correspon-
dente a este deslocamento corresponde ao controle. Sejam assim:
steuer
2008/3/11
page 14
i
i
i
i
i
i
i
i
AO
E
x
c
mg
E
F
Figura 1.3: Equilbrio de um bast ao
t : tempo t > 0;
(t) : posi c ao da base do bast ao ;
u(t) : acelera c ao (horizontal) da base do bast ao;
(t) : angulo entre o bast ao e o eixo vertical;
(x(t), y(t)) : coordenada do ponto de massa m.
Observe que a posi c ao de repouso = 0 n ao e estavel, no sentido que
um deslocamento innitesimal do ponto de equilbrio provoca a queda
do bast ao.
5
Neste exemplo estudamos como estabilizar o sistema na
posi c ao de repouso usando uma estrategia de controle de realimenta c ao
do tipo u = G().
Analisamos inicialmente o modelo. Sobre a massa m agem a gravi-
dade e uma for ca F (na dire c ao do bast ao) provocada pelo movimento
da base do mesmo (veja Figura 1.3). Temos ent ao:
Somatorio das for cas na dire c ao x: F sin()
Somatorio das for cas na dire c ao y: F cos() mg
Supondo que tratamos apenas deslocamentos pequenos da posi c ao de
repouso = 0, fazemos as hipoteses simplicadoras:
(1.36) sin() , cos() 1, y 1, y 0.
Da lei de Newton sabemos que
m y = F(t) mg, m x = F(t) (t),
o que implica em F(t) = mg e m x = mg(t).
Da geometria do problema e das hipoteses em (1.36) temos ainda
x(t) = (t) + (t).
5
Uma an alise rigorosa sobre a natureza dos pontos de equilbrio de um sistema
din amico e apresentada no Captulo 4.
steuer
2008/3/11
page 15
i
i
i
i
i
i
i
i
Observando que

(t) = u(t), obtemos dessa ultima equa c ao
(1.37)

= g u(t).
Reescrevendo (1.37) na forma de sistema, obtemos
z
1
= z
1
z
2
= gz
1
u(t)
Podemos agora vericar que a posi c ao de repouso e de fato instavel. Os
autovalores da matriz
A :=
_
0 1
g 0
_
do sistema s ao
g. Da obtemos a matriz fundamental Z do sistema

z = Az:
Z(t) =
_
e
gt
g e
gt
g
e
gt
g e
gt
g
_
.
Um sistema fundamenal de solu c oes e obtido das colunas de Z(t) e pode-
mos observar que uma das solu c oes cresce exponencialmente, compro-
vando assim a instabilidade do sistema. Tentamos agora escolher uma
estrategia de controle adequada para estabilizar o sistema.
1
a
tentativa de controle de realimenta cao:
u := k(t) = kz
1
,
onde k R. De (1.37) obtemos o sistema
z = A
1
z com A
1
=
_
0 1
g +k 0
_
.
Os autovalores da matriz A
1
s ao
g +k. De onde conclumos que,

para k < g, os autovalores s ao imaginarios puros e as solu c oes corres-
pondentes s ao oscila c oes n ao amortecidas; para k > g, os autovalores
s ao reais e um deles e positivo, portanto a solu c ao correspondente a este
autovalor cresce de forma exponencial; para k = g, as solu c oes s ao do
tipo polinomial e novamente n ao limitadas.
Portanto, n ao e possvel alcan car com estrategias de controle do tipo
k a situa c ao
lim
t
z(t) = 0,
steuer
2008/3/11
page 16
i
i
i
i
i
i
i
i
AO
o que torna inviavel a estabiliza c ao do sistema.
2
a
tentativa de controle de realimenta cao:
u = k
1
k
2

= k
1
z
1
k
2
z
2
,
onde k
1
, k
2
R. De (1.37), obtemos o sistema
z = A
2
z com A
2
=
_
0 1
g +k
1
k
2
_
.
Os autovalores da matriz A
2
s ao k
2
/2
_
k
2
2
/4 +g +k
1
. Escolhendo
por exemplo k
2
= 2 e k
1
= g 1, obtemos os autovalores
1
=
2
=
1. A equa c ao diferencial resultante
+ 2

+ = 0
possui as solu c oes linearmente independentes
(t) = e
t
, (t) = t e
t
,
provando assim que a estrategia u(t) = 2z
1
+ (1 + g)z
2
estabiliza o
sistema.
Para maiores detalhes sobre este problema, tambem denominado de
pendulo invertido, consulte [So], Captulo 3.
1.2.6 Concentracao de Chumbo no Corpo Humano
O modelo utilizado para aproximar o problema em quest ao e o mo-
delo de compartimentos. Tal abordagem consiste em descrever o objeto
de estudo (corpo humano) como uma serie de compartimentos que inte-
ragem entre si, trocando a subst ancia que desejamos analisar (chumbo).
Obviamente essa tecnica e bastante maleavel e permite modelar diferen-
tes tipos de processos fsicos, biologicos, qumicos, etc . . .
Neste exemplo tratamos uma importante aplica c ao da teoria de con-
trole, a qual esta relacionada com a teoria de problemas inversos. Trata-
se da reconstru c ao de par ametros, isto e, o controle e utilizado para
identicar a din amica do sistema, que e a princpio desconhecida. Tal
problema e investigado em detalhes no Captulo 6.
steuer
2008/3/11
page 17
i
i
i
i
i
i
i
i
Consideramos nesta abordagem um modelo simples com apenas 3
compartimentos: Sangue, Tecido e Esqueleto. Denimos ent ao:
t : tempo t > 0;
m
i
: massa do compartimento i;
c
i
(t) : concentra c ao de chumbo no compartimento i;
q
i
(t) : quantidade de chumbo no compartimento i.
Temos assim
q
i
(t) = m
i
c
i
(t), i = 1, 2, 3.
A din amica da troca e descrita por
(1.38) q = f(q) + I(t),
onde q := (q
1
, q
2
, q
3
), f (desconhecida) descreve a taxa de troca, I e
um vetor de entrada. Supondo a din amica linear, i.e., a taxa de troca e
proporcional a diferen ca de concentra c ao, obtemos: f(q) = Aq (A uma
matriz).
Supomos ainda I constante e que existe um ponto de equilbrio q
para o sistema (1.38), i.e.,

q = f( q) + I = 0. Nesta situa c ao e possvel
descobrir a din amica do sistema. Suponha que introduzimos chumbo no
sistema com taxa b(t) R
3
. A concentra c ao q +x da subst ancia satisfaz
ent ao
x =

q + x = f( q +x) + I + b(t).
Supondo que x e pequeno em rela c ao a q, temos
x =
f
q
( q) x + O((x q)
2
) + I + b(t)
=
f
q
( q) x + b(t) + r(t),
onde r(t) R
3
possui componentes pequenas. Como
f
q
( q) = A, obtemos
o sistema
(1.39) x = Ax + b(t).
A matriz desconhecida A deve ser identicada. Um metodo de realizar
tal identica c ao e o seguinte:
Fixe a taxa b e me ca em intervalos de tempo periodicos
a concentra c ao x
i
(t)/m
i
ou a raz ao x
i
(t)/ q
i
(caso q seja co-
nhecido);
Forme assim um conjunto de equa c oes que permita cal-
cular os coecientes de A.
steuer
2008/3/11
page 18
i
i
i
i
i
i
i
i
AO
Outro problema inverso relacionado à teoria de controle (otimo) e a
identica c ao de coecientes na equa c ao de EulerLagrange. Tal proble-
ma n ao e abordado neste manuscrito. O leitor interessado deve consultar
[Lei].
1.2.7 A Braquist ocrona
O calculo das varia c oes teve seu desenvolvimento inicial em grande
parte devido ao problema que discutimos nesta sec c ao. Em 1696, Johann
(John ou Jean) Bernoulli formulou o seguinte problema:
6
Sejam P
0
e P
1
dois pontos dados sobre um plano vertical.
Deve ser encontrada uma curva unindo esses dois pontos de
sorte que um ponto de massa m partindo de P
0
que a percorra
sob a inuencia somente de seu pr oprio peso, alcance P
1
no
menor tempo possvel. Considere ainda a velocidade inicial
v
0
dada.
Tal problema e conhecido como Braquist ocrona (do grego brachystos
mnimo, chronos tempo). A m de obter uma formula c ao matematica
conveniente, restringimo-nos à analise de curvas que s ao gracos de
fun c oes. Portanto, a trajetoria do ponto pode ser descrita por uma
fun c ao y : [x
0
, x
1
] R, onde P
0
= (x
0
, y
0
) e P
1
= (x
1
, y
1
). Seja T o
tempo para se percorrer a trajetoria, l o comprimento de arco de y, s(t)
o comprimento de arco percorrido no tempo t [0, T] e V (t) o valor da
velocidade (tangencial) no tempo t. Temos ent ao
ds
dt
(t) = V (t), t [0, T].
Denotando a mudan ca de variaveis por s = S(t), temos o jacobiano
dS/dt(t) = V (t) de onde segue
T =
_
T
0
dt =
_
l
0
ds
V (S
1
(s))
=
_
l
0
ds
W(s)
,
6
Tal problema foi formulado originalmente por Galileo em 1638, que acreditava
ser a solu c ao do problema um arco de circunferencia. Outros matem aticos da epoca
como Leibniz, Jakob (James ou Jacques) Bernoulli e Newton se interessaram pelo
problema, que foi proposto por Johann Bernoulli na forma de um desao. Para mais
detalhes hist oricos consulte [Gol].
steuer
2008/3/11
page 19
i
i
i
i
i
i
i
i
onde W(s) := V (s
1
(s)). Denindo agora s := l(x) =
_
x
x
0
(1+y
t
(x)
2
)
1/2
dx
e v(x) := W(l(x)) velocidade parametrizada em x para x [x
0
, x
1
],
obtemos
T =
_
l
0
ds
W(s)
=
_
x
1
x
0
(1 +y
t
(x)
2
)
1/2
v(x)
dx.
Usando agora a lei de conserva c ao de energia (energia cinetica + energia
potencial = cte.) temos
mv(x)
2
2mgy(x) = mv
2
0
2mgy
0
,
onde g e a constante gravitacional. Note que o eixo vertical y e tomado
orientado na dire c ao da for ca gravitacional. Denindo a constante c :=
2gy
0
v
2
0
, obtemos a express ao
T =
_
x
1
x
0
(1 +y
t
(x)
2
)
1/2
(2gy(x) c)
1/2
dx,
que nos permite explicitar o tempo de percurso T em fun c ao da para-
metriza c ao (x, y(x)) da curva. Podemos ainda escrever
T = I(y) :=
_
x
1
x
0
L(x, y(x), y
t
(x)) dx,
onde L(x, y, p) := (
1+p
2
2gy+c
)
1/2
, obtendo assim um problema tpico do
calculo das varia c oes.
O mais importante neste problema s ao os metodos usados para
resolve-lo, que constituem o surgimento do calculo das varia c oes tal qual
conhecemos hoje. A solu c ao e a curva denominada cicloide (veja Figu-
ra 1.4), que possui a seguinte parametriza c ao:
: [
0
,
1
] (b +a( + sin ), a(1 + cos )) R
2
,
onde os par ametros a, b s ao determinados pelas condi c oes (
0
) =
(x
0
, y
0
), (
1
) = (x
1
, y
1
).
Johann Bernoulli baseou sua argumenta c ao no ent ao recem divul-
gado princpio de refra c ao de Fermat (1662). Considere um meio con-
stitudo por diversas camadas homogeneas de densidades diferentes e
separadas pelas retas horizontais y = y
. Em cada camada y
< y <
y
+1
a luz viaja com velocidade v
proporcional a (y
h)
1/2
, onde h
e constante. Obtemos ent ao como trajetoria uma poligonal, na qual o
steuer
2008/3/11
page 20
i
i
i
i
i
i
i
i
AO
P
0
P
1
x
y
Figura 1.4: Cicloide: solu c ao do problema da Braquistocrona
seno do angulo entre o raio e o eixo vertical y e proporcional (y
h)
1/2
.
Tomando o limite quando o n umero de camadas tende a innito, e
possvel concluir que o seno do angulo entre a trajetoria do raio e o eixo
y e proporcional a 1/(1 +y
t
(x)
2
)
1/2
, de onde Johann Bernoulli obteve a
equa c ao diferencial
(1.40)
1
_
1 +y
t
2
= K
_
2g(y h)
para a Braquistocrona. Denindo := 2gK
2
(y h) e := 2gK
2
x, onde
= (), obtemos de (1.40) a equa c ao diferencial
(1.41) (1 +
t
2
) = 1.
A equa c ao (1.41) e exatamente a equa c ao de EulerLagrange para o pro-
blema variacional da Braquistocrona. Esta equa c ao pode ser resolvida
atraves do metodo de separa c ao de variaveis. De fato, note que podemos
reescrever (1.41) na forma
t
=
_
(1 )
1
,
ou ainda como
_
_
v(1 v)
1
dv = +c.
A mudan ca de variaveis v := sin
2
t = 2
1
(1 cos 2t), para t [0, 2],
nos fornece ent ao
+c = 2
_
sin
2
t dt = 2
1
(2t cos 2t),
steuer
2008/3/11
page 21
i
i
i
i
i
i
i
i
de onde obtemos a seguinte parametriza c ao da solu c ao:
(t) := 2
1
(1 cos 2t), (t) := 2
1
(2t sin 2t), t R.
Temos assim que
x() = r( sin ), y() = r(1 cos ), R,
com r := (4Kg)
1
e x(0) = y(0) = 0. Note que esta e a parametriza c ao
da cicloide com P
0
na orgem e cujo raio da circunferencia na Figura 1.4
e r.
1.2.8 Um Problema de Controle

Otimo
Seja R
n
compacto e f : R
n
R
n
uma aplica c ao contnua,
Lipschitz na primeira variavel (veja Deni c ao 259) e uniformemente na
segunda. Seja
7
U
ad
:= u : [t
0
, t
1
] R
m
; u(t) q.s. em [t
0
, t
1
]
o conjunto dos controles viaveis. Considere agora a equa c ao de evolu c ao
das variaveis de estado
_
z
t
(t) = f(z(t), u(t)), q.s. em [t
0
, t
1
]
z(t
0
) = z
0
A teoria de equa c oes diferenciais ordinarias garante que, para cada u
U
ad
, o problema acima possui uma unica solu c ao absolutamente contnua
em [t
0
, t
1
]. Nosso objetivo e encontrar um controle u que minimize o
funcional objetivo
J(t, z; u) := L
1
(z(t)) +
_
t
1
t
0
L(z(t), u(t)) dt,
onde as fun c oes L e L
1
denem respectivamente os custos operacional e
nal do modelo. Suponha L C
1
(R
n
) e L
1
C
1
(R
n
).
Tal problema de controle otimo e denominado problema com hori-
zonte nito
8
. Fazemos aqui uma abordagem baseada no metodo dos
7
Nota c ao: q.s. e abrevia c ao de quase sempre e se refere ` a medida de Lebesgue
no intervalo em quest ao.
8
Note que o tempo nal t
1
est a xado, enquanto que o estado nal n ao.
steuer
2008/3/11
page 22
i
i
i
i
i
i
i
i
AO
multiplicadores de Lagrange (veja Exemplo 1.2.2) que nos permite en-
contrar algumas condi c oes necessarias para otimalidade de uma solu c ao
(compare com os resultados do Apendice B).
Denimos inicialmente a vari avel adjunta (ou co-estado) = (t) e
o funcional estendido
I(z, u, ) :=
_
t
1
t
0
[L(z, u) (z
t
f(z, u))] ds + L
1
(z(t
1
)).
Suponha que as fun c oes envolvidas na deni c ao de I s ao sucientemente
regulares e que ( z, u,
) e um mnimo (local) de I. Sejam ainda

i
(t), i =
1, 2, 3 fun c oes regulares com
1
(t
0
) = 0. Denimos ent ao
z
:= z +
1
, u
:= u +
2
,
:=

+
3
e I() := I(z
, u
) R, para [[ pequeno. Logo I() possui um

mnimo local em = 0. Note que
(1.42)
I
d
() =
_
t
1
t
0
_
h
z
1
+
h
u
2
( z
f)
3

1

f
z
1

f
u
2
)
_
dt
+
g
z
(z
(t
1
))
1
(t
1
).
Integramos por partes o termo
1
_
t
1
t
0
1
dt = [
1
]
t
1
t
0

_
t
1
t
0
1
dt =
(t
1
)
1
(t
1
)
_
t
1
t
0
1
dt
e substituimos em (1.42), obtendo
0 =
I
d
=0
=
_
t
1
t
0
_
1
_
L
z
( z, u) +

f
z
( z, u) +

_
+
2
_
L
u
( z, u) +

f
u
( z, u)
_
+
3
(
z +f( z, u))
_
dt
+
1
(t
1
)
_
L
1
z
( z(t
1
))
(t
1
)
_
.
Tomando
1
=
2
= 0 e
3
arbitrario, obtemos a equa c ao de estado
z = f( z, u).
steuer
2008/3/11
page 23
i
i
i
i
i
i
i
i
Tomando
1
= 0 e
2
qualquer, obtemos a condi c ao de otimalidade
L
u
( z, u) +

f
u
( z, u) = 0.
Tomando agora
1
qualquer com
1
(t
1
) = 0, obtemos a equa c ao adjunta
(ou de co-estado)
=
L
z
( z, u)

f
z
( z, u).
Por m, escolhendo
1
qualquer com
1
(t
1
) ,= 0, obtemos a condi c ao de
contorno para a equa c ao adjunta
L
1
z
( z(t
1
))

(t
1
) = 0.
Denimos agora a fun c ao de Hamilton H : R
n
R
n
R
m
R
H(z, , u) := , f(z, u)) + L(z, u)
e supomos que e possvel explicitar (atraves da condi c ao de otimalidade)
o controle em fun c ao das variaveis de estado e adjunta ( u = U( z,

)).
Obtemos das equa c oes de estado e adjunta o sistema hamiltoniano
(1.43)
_
z = +
H
( z,
, U( z,
))
=
H
z
( z,
, U( z,
))
z(t
0
) = z
0
,

(t
1
) =
L
1
z
( z(t
1
))
Note por m que derivando H em rela c ao a u no ponto ( z,

, u)
obtemos da condi c ao de otimalidade
(1.44)
H
u
( z,
, u) =

f
u
( z, u) +
L
u
( z, u) = 0.
Isto e, H( z(t),
(t), ) : R
m
R possui um mnimo local em u = u(t), t
[t
0
, t
1
]. Por este motivo, a condi c ao de otimalidade tambem e conhecida
como condi c ao de mnimo.
As condi c oes necessarias que procuravamos podem ser resumidas em
(1.43) e (1.44), isto e, se ( z, u) e uma solu c ao para o problema de con-
trole otimo, ent ao existe : [t
0
, t
1
] R
n
tal que estas condi c oes s ao
satisfeitas.
steuer
2008/3/11
page 24
i
i
i
i
i
i
i
i
24 EXERC
ICIOS
A analise das condi c oes (1.43) e (1.44) e um dos principais topicos de
interesse na area de controle otimo. A obten c ao destas condi c oes corres-
ponde, no caso geral, ao teorema conhecido na literatura por princpio
do m aximo ou de Pontryagin (veja [PBG], [Tr], [Za]). Retornamos ao
estudo das mesmas no Captulo 10 (um caso particular pode ainda ser
encontrado na Sec c ao 9.5).
Exerccios
1.1. Sejam F, G : R
2
R denidas por
F(x, y) :=
1
2
_
x y
_
_
1 1
1 2
__
x
y
_
+y, G(x, y) := x 3.
a) Utilizando o teorema de multiplicadores de Lagrange, resolva o
seguinte problema de otimiza c ao:
_
_
_
Minimizar F(x, y)
sujeito a
G(x, y) = 0
b) Calcule F( x, y) e G( x, y), onde ( x, y) e a solu c ao encontrada no
item a).
1.2. Encontre a menor dist ancia (vertical) entre a parabola y = ax
2
+
bx +c e a reta y = x +d.
1.3. Um meteoro percorre a orbita hiperbolica descrita por
x
2
a
2

y
2
b
2
= 1
(a Terra esta na orgem (0, 0)), enquanto que um satelite em orbita
geoestacionaria se encontra na posi c ao (x
0
, y
0
). Encontre o ponto da
orbita do meteoro de menor dist ancia ao satelite.
1.4. Considere o seguinte modelo de investimento de capital:
x
k+1
= (1 +r)x
k
+u
k
, k + 1, 2, . . .
onde x
k
e o capital ao nal do k-esimo ano, u
k
e o capital investido ao
longo do ano k e r > 0 e a taxa de juros anual. Suponha que o custo de
steuer
2008/3/11
page 25
i
i
i
i
i
i
i
i
EXERC
ICIOS 25
investimento do capital ao longo dos anos k = 0, . . . , N e descrito pela
fun c ao
C(u) := c
N1
k=0
u
2
k
,
onde u = (u
0
, . . . , u
N
). Encontre uma poltica otima de investimento u
para N = 10, x
10
= 100000, r = 7.
1.5. Considere um circuito com um resistor (de resistencia R) e um
capacitor (de capacit ancia C). Sejam u(t) a tens ao, y(t) a intensidade
da corrente eletrica e q(t) a carga eletrica no tempo t. Temos ent ao as
seguintes hipoteses fsicas:
y(t) e igual à varia c ao temporal de q(t);
a diferen ca de potencial no capacitor e igual a q(t)/C;
a diferen ca de potencial no resistor e igual a Ry(t);
a lei de Kirchho vigora: a voltagem aplicada no circuito e igual ao
somatorio das diferen cas de potencial no circuito.
Obtenha uma equa c ao diferencial para q e resolva-a, obtendo q em fun c ao
de u e q(0) = q
0
.
1.6. A equa c ao diferencial () x = K, onde K ,= 0, descreve
fen omenos da cinematica (e.g., na queda livre: = 1 e K = g, a
constante gravitacional). A partir do sistema x = v, v = K (onde x
e o deslocamento e v a velocidade), obtemos a equa c ao () dv/dx =
(K)/v. Resolva a equa c ao diferencial () e esboce o graco das solu c oes
no plano (x, v) para o caso particular = 1.
1.7. Considere a equa c ao diferencial () do Exerccio 1.6 com a seguinte
estrategia de realimenta c ao:
K = K(x) =
_
b, x > 0
b, x < 0
.
Dada uma condi c ao inicial (x
0
, v
0
) e uma condi c ao nal (x
1
, v
1
), encontre
uma trajetoria correspondente que as una.
(Sugest ao: utilize o esbo co das trajetorias feito no Exerccio 1.6.)
steuer
2008/3/11
page 26
i
i
i
i
i
i
i
i
Captulo 2
Observabilidade
Neste captulo analisamos o problema de adquirir informa c oes sobre
o estado presente de um sistema a partir da observa c ao da sada do
sistema em tempos passados. Conseguimos assim classicar o espa co
de estados em componentes observaveis, n ao observaveis e detectaveis
(para esta ultima e necessaria uma analise do comportamento assintotico
das variaveis de estado). Devido a sua simplicidade, os sistemas lineares
aut onomos s ao estudados separadamente. Na ultima sec c ao e apresen-
tada uma tecnica de reconstru c ao de estados a partir de observa c oes. A
rela c ao existente entre os conceitos de observabilidade e controlabilidade
e analisada no captulo seguinte.
2.1 Sistemas Lineares
Considere o seguinte sistema linear de controle:
(2.1)
_
z
t
= A(t) z +B(t) u
y = C(t) z
onde as variaveis possuem a seguinte interpreta c ao:
z : [t
0
, t
1
] R
n
: vetor das variaveis de estado;
u : [t
0
, t
1
] R
m
: vetor das variaveis de controle (entrada);
y : [t
0
, t
1
] R
l
: vetor de observa c ao (sada).
Os operadores
A : [t
0
, t
1
] R
nn
, B : [t
0
, t
1
] R
nm
e C : [t
0
, t
1
] R
ln
steuer
2008/3/11
page 27
i
i
i
i
i
i
i
i
[SEC. 2.1: SISTEMAS LINEARES 27
s ao supostos contnuos em seus domnios de deni c ao. O sistema de
controle linear (2.1) e denominado abreviadamente por (A, B, C). Se as
fun c oes matriciais A, B, C n ao dependem explicitamente do tempo, o
sistema de controle e dito aut onomo; caso contrario, o sistema e deno-
minado n ao aut onomo.
Considere inicialmente a seguinte quest ao: dado um sistema de con-
trole (A, B, C), em que circunst ancias e possvel a partir do conheci-
mento da entrada do sistema
u : [t
0
, t
1
] R
m
e de sua sada
y : [t
0
, t
1
] R
l
,
reconstruir o estado inicial z
0
:= z(t
0
) R
n
. Uma vez conhecido o
vetor z
0
, e possvel substituir o controle dado u na equa c ao diferencial
em (2.1) e calcular as variaveis de estado z(t) em qualquer instante de
tempo t [t
0
, t
1
].
Como estrategias de controle admissveis consideramos as fun c oes
L
1
([t
0
, t
1
]; R
m
). Conforme resultados do Captulo A, temos que:
y(t) = C(t)
A
(t, t
0
) z
0
+ y
1
(t),
y
1
(t) =
_
t
1
t
0
C(t)
A
(t, s) B(s) u(s) ds, t [t
0
, t
1
].
Note que, conhecida a entrada u, a fun c ao y
1
pode ser calculada a
priori, independente do fato de conhecermos (ou n ao) a condi c ao inicial
z
0
. Portanto, a determina c ao de z
0
a partir do par (y, u) e equivalente
à determina c ao de z
0
a partir da diferen ca y y
1
, a qual corresponde à
sada do sistema homogeneo
z
t
= A(t) z.
Isto signica que, para estudar a determina c ao do estado inicial z
0
de
um sistema linear, basta concentrarmo-nos em sistemas homogeneos da
forma:
(2.2) z
t
= A(t) z, y = C(t) z,
os quais representamos pela nota c ao abreviada (A, , C). Estamos agora
em condi c oes de formalizar o conceito de observabilidade, discutido no
Captulo 1.
steuer
2008/3/11
page 28
i
i
i
i
i
i
i
i
28 [CAP. 2: OBSERVABILIDADE
Deni cao 6. O sistema (A, , C) e denominado observ avel em [t
0
, t
1
]
quando para toda fun c ao z C
1
([t
0
, t
1
]; R
n
) a condi c ao
z
t
(t) = A(t) z(t), C(t) z(t) = 0, t [t
0
, t
1
],
implicar em z(t
0
) = 0. 2
Em outras palavras, a observabilidade do sistema (A, , C) e equiva-
lente ao fato da aplica c ao linear
G : R
n
C([t
0
, t
1
]; R
n
)
z
0
C()
A
(, t
0
) z
0
ser injetiva. No teorema a seguir analisamos uma forma equivalente de
denir a observabilidade de um sistema.
Teorema 7. As seguintes arma c oes s ao equivalentes:
a) O sistema (A, , C) e observ avel em [t
0
, t
1
];
b) A matriz
W(t
0
, t
1
) :=
_
t
1
t
0
A
(t, t
0
)
C(t)
C(t)
A
(t, t
0
) dt
e positiva denida.
Demonstra c ao: (a) = (b) Suponha que W(t
0
, t
1
) n ao e positiva
denida. Por constru c ao, a matriz W(t
0
, t
1
) e simetrica e, alem disto,
satisfaz: x, W(t
0
, t
1
)x) 0, x R
n
. (por que?).
Logo, existe z
0
R
n
0 tal que z
0
, W(t
0
, t
1
)z
0
) = 0. Denindo agora a
fun c ao z() :=
A
(; t
0
)z
0
, temos que esta fun c ao e solu c ao do problema
de valor inicial z
t
= A(t)z, z(t
0
) = z
0
. Alem disso, z satisfaz
_
t
1
t
0
[C(t) z(t)[
2
dt =
_
t
1
t
0
[C(t)
A
(t, t
0
)z
0
[
2
dt
=
_
t
1
t
0
C(t)
A
(t, t
0
)z
0
, C(t)
A
(t, t
0
)z
0
) dt
=
_
t
1
t
0
z
0
,
A
(t, t
0
)
C(t)
C(t)
A
(t, t
0
)z
0
) dt
= z
0
, W(t
0
, t
1
)z
0
) = 0.
Encontramos assim uma fun c ao z satisfazendo
C(t) z(t) = 0, t [t
0
, t
1
] e z(t
0
) = z
0
,= 0,
steuer
2008/3/11
page 29
i
i
i
i
i
i
i
i
o que contradiz a hipotese do sistema ser observavel.
(b) = (a) Suponha que para alguma fun c ao z tenhamos
z
t
(t) = A(t) z(t), C(t) z(t) = 0, t [t
0
, t
1
].
Logo, temos z = (; t
0
)z
0
, onde z
0
:= z(t
0
) e
z
0
, W(t
0
, t
1
) z
0
) =
_
t
1
t
0
C(t)z(t), C(t)z(t)) dt = 0.
Da hipotese de W(t
0
, t
1
) ser positiva denida, segue z
0
= 0.
Os sistemas de controle lineares com matrizes invariantes no tempo
(aut onomos) representam um importante caso especial que e tratado no
teorema a seguir. No texto que segue adotamos a nota c ao: Dada uma
matriz M, representamos por Po(M), Ke(M), Im(M) respectivamente
o posto, o n ucleo e a imagem de M (para detalhes veja [Gan]).
Teorema 8. Seja (A, , C) um sistema de controle aut onomo. As se-
guintes armativas s ao equivalentes:
a) (A, , C) e observ avel em [0, T] para todo T > 0;
b) (A, , C) e observ avel em [0, T] para algum T > 0;
c) A Matriz W
T
:=
_
T
0
e
A
s
C
Ce
As
ds e n ao singular para algum T > 0;
d) A Matrix W
T
:=
_
T
0
e
A
s
C
Ce
As
ds e n ao singular para todo T > 0 ;
e) Po(C
[A
[ . . . [(A
)
n1
C
) = n;
1
f )
n1
k=0
Ke(CA
k
) = 0.
Demonstra c ao: a) = b) Nada a fazer.
b) = c) Seja T > 0 escolhido de acordo com b). Tome z
0
R
n
e
dena a fun c ao z(t) := e
At
z
0
para t R. A identidade
z
0
, W
T
z
0
) =
_
T
0
[C z(s)[
2
ds
e obtida como na demonstra c ao do Teorema 7. Esta identidade e a
hipotese de observabilidade do sistema (A, , C) no intervalo [0, T] impli-
cam em z
0
= 0.
1
A matriz M
0
= (C
[A
[ . . . [(A
)
n1
C
) e chamada matriz de observa c ao do

sitema (A, , C).
steuer
2008/3/11
page 30
i
i
i
i
i
i
i
i
c) = d) Seja T > 0 escolhido de acordo com c) e seja

T > 0. Da
Identidade
z
0
, W
T
z
0
) =
_

T
0
[C z(s)[
2
ds,
temos que z
0
, W
T
z
0
) = 0 implica em
a(t) := C e
At
z
0
= 0, t [0,

T].
Da segue que
(2.3) a
(k)
(0) = C A
k
z
0
= 0, k = 0, 1, . . .
Portanto,
C A
k
s
k
z
0
= 0, k = 0, 1, . . . , s [0, T].
Esta ultima igualdade implica em
z
0
, W
T
z
0
) =
_
T
0
[C e
At
z
0
[
2
ds =
_
T
0
[
k=0
1
k!
CA
k
s
k
z
0
[
2
ds = 0.
A escolha de T implica por m em z
0
= 0.
d) = e) Suponha por contradi c ao que Po(C
[A
[ . . . [(A
)
n1
C
) <
n. Ent ao, as n linhas da matriz n nl (C
[A
[ . . . [(A
)
n1
C
) s ao
linearmente dependentes e existe um elemento z
0
R
n
, z
0
,= 0, satis-
fazendo
(2.4) z
0
(A
)
k
C
= 0, C A
k
z
0
= 0 , k = 0, . . . , n 1.
Seja p
A
() :=
n
+
n1
k=0
k

k
, o polin omio caracterstico da matriz A. O
teorema de CaleyHamilton da algebra linear nos garante que A e um
zero de seu polin omio caracterstico (veja [Gan] ou [So]), isto e
p
A
(A) := A
n
+
n1
k=0
k
A
k
= 0,
de onde conclumos que
A
m
=
n1
k=0
(m)
k
A
k
, m n.
steuer
2008/3/11
page 31
i
i
i
i
i
i
i
i
Isto nos permite escrever
2
e
At
=
n1
k=0
k
(t) A
k
.
Sendo assim, temos de (2.4)
C e
At
z
0
=
n1
k=0
k
(t) C A
k
z
0
= 0, t [0, T],
e portanto,
z
0
, W
T
z
0
) =
_
T
0
[Ce
At
z
0
[
2
dt = 0,
o que contradiz a hipotese em d), pois z
0
,= 0.
e) f) De (2.4) conclumos que z
0

Ke(CA
k
) z
0
(A
k
)
=
0, k = 0, . . . , n 1.
f) = a) Suponha que z
0
R
n
e tal que Ce
At
z
0
= 0, para todo
t [0, T]. Como em (2.3), podemos concluir que CA
k
z
0
= 0 para
k = 0, 1, . . .. A hipotese em f) implica ent ao que z
0
= 0.
Um sistema aut onomo (A, , C) e portanto observavel, quando for
observavel em [0, T] para um T > 0 qualquer.
Exemplo 9. Consideramos um modelo para representar o movimento
de um satelite articial de massa unitaria orbitando a Terra. Denindo
as variaveis:
r : altura da orbita;
0 : velocidade angular;
u
1
: empuxo radial dos motores;
u
2
: empuxo tangencial dos motores;
2
: constante gravitacional (
2
= g);
o sistema de equa c oes que descreve o fen omeno e:
(2.5)
_
r =

0
2
r
2
r
2
+ u
1
0 = 2
0 rr
2
+ r
1
u
2
2
Verique que
k
(t) =
n1
j=0
t
j
j!
+
j=n
t
j
(j)
k
j!
.
steuer
2008/3/11
page 32
i
i
i
i
i
i
i
i
Note que a solu c ao deste sistema para u
1
= u
2
= 0 e dada por r(t) = 1
e 0(t) = t. Portanto, ao denirmos as variaveis normalizadas
z
1
:= r 1, z
2
:= z
1
t
= r, z
3
:= 0 t, z
4
:= z
3
t
=

0 ,
estamos estudando perturba c oes desta solu c ao, a qual representa a orbita
livre (controle u = 0) do satelite. Reescrevendo o sistema a partir das
novas variaveis z
1
, . . . , z
4
, temos
(2.6)
_
_
z
1
t
= z
2
z
2
t
= (z
4
+)
2
(z
1
+ 1)

2
(z
1
+ 1)
2
+ u
1
z
3
t
= z
4
z
4
t
= 2
(z
4
+)z
2
z
1
+ 1
+
u
2
z
1
+ 1
Linearizando agora o sistema (2.6) no ponto
z
1
= z
2
= z
3
= z
4
= u
1
= u
2
= 0,
obtemos o novo sistema
z
t
= Az + Bu,
onde as matrizes A e B s ao dadas por:
A =
_
_
_
_
0 1 0 0
3
2
0 0 2
0 0 0 1
0 2 0 0
_
_
_
_
e B =
_
_
_
_
0 0
1 0
0 0
0 1
_
_
_
_
.
Se supomos que tanto varia c oes no raio da orbita, quanto no angulo
podem ser medidas, ent ao as variaveis z
1
e z
3
s ao conhecidas. Nesse
caso, o vetor de observa c ao y satisfaz:
y = C z onde C =
_
1 0 0 0
0 0 1 0
_
.
A matriz de observa c ao, dada por M
0
:= (C
[ . . . [(A
)
n1
C
), se escreve
neste caso como
M
0
=
_
_
_
_
1 0 0 0 . . .
0 0 1 0 . . .
0 1 0 0 . . .
0 0 0 1 . . .
_
_
_
_
Temos assim que a condi c ao Po(M
0
) = 4 = n e vericada, garantindo a
observabilidade do sistema. 2
steuer
2008/3/11
page 33
i
i
i
i
i
i
i
i
[SEC. 2.2: SUBESPACO N
AO OBSERV
AVEL 33
2.2 Subespaco nao Observavel
Consideramos novamente o sistema aut onomo (A, , C). Como ja foi
discutido na sec c ao anterior, a observabilidade deste sistema e equiva-
lente à injetividade da aplica c ao linear
G : R
n
C([t
0
, t
1
]; R
n
)
z
0
C
A
(, t
0
) z
0
.
Este fato motiva a seguinte deni c ao:
Deni cao 10. O n ucleo da aplica c ao G denida acima e denominado
subespa co n ao observ avel do sistema (A, , C). 2
Exemplo 11. A deni c ao acima pode ser ilustrada pelo sistema (A, , C)
com matrizes
A =
_
1 0
0 1
_
, C =
_
0 1
_
.
Note que nenhuma condi c ao inicial da forma z
0
= ( 0)
R
2
pode ser
observada. A matriz M
0
:= (C
[A
) e dada por
M
0
=
_
0 0
1 1
_
.
2
O Exemplo 11 sugere ainda uma rela c ao entre o subespa co n ao ob-
servavel e Im(M
0
)
. Este fato ca claro no teorema a seguir.

Teorema 12. Seja o sistema aut onomo (A, , C) e N R
n
o seu
subespa co n ao observ avel. Podemos ent ao representar N da seguinte
forma:
N =
n1
k=0
Ke(CA
k
).
Demonstra c ao: Note que, se z
0
N, ent ao C
A
(, t
0
) z
0
0 em [0, T].
Portanto,
C A
k
z
0
=
_
d
k
dt
k
C e
A(tt
0
)
z
0
_
t=t
0
= 0, k = 0, 1, . . . .
Logo, z
0
Ke(CA
k
), k = 0, . . . , n 1, provando que N
Ke(CA
k
).
Reciprocamente, se z
0

Ke(CA
k
), repetimos a argumenta c ao feita
steuer
2008/3/11
page 34
i
i
i
i
i
i
i
i
na demonstra c ao da parte d) = e) do Teorema 8 e conclumos que
z
0
, W
T
z
0
) =
_
T
0
[C e
At
z
0
[
2
dt = 0,
provando assim que z
0
N.
Observa cao 13. Por ser o n ucleo de uma aplica c ao linear, o subespa co
n ao observavel e um subespa co vetorial do R
n
. Alem disso, s ao validas
as seguintes arma c oes:
N Ke(C) ;
A(N) N, i.e. N e invariante por A;
N =
S R
n
[ S Ke(C), A(S) N, i.e.
N e o maior subespa co de Ke(C), que e invariante por A.
As propriedades acima s ao de facil verica c ao e deixadas como exerccio.
2
Se um determinado sistema (A, , C) n ao e observavel (em [t
0
, t
1
] para
todo t
1
> t
0
), podemos ainda assim indagar sobre a observabilidade das
solu c oes que n ao decaem, i.e. aquelas que satisfazem
lim
t
z(t) ,= 0.
Tais solu c oes correspondem aos auto-valores de A com parte real posi-
tiva. A m de analisar melhor esta quest ao, fazemos a seguinte cons-
tru c ao: Seja p
A
o polin omio caracterstico da matriz A. Seja ainda a
decomposi c ao
p
A
() = p
+
() p
(),
onde os polin omios p
+
e p
s ao escolhidos de forma a possuir razes

respectivamente em C[Re() 0 e C[Re() < 0. Estes
polin omios nos permitem denir os espa cos
(2.7) X
+
(A) := Ke(p
+
(A)) e X
(A) := Ke(p
(A)),
com a ajuda dos quais chegamos à seguinte deni c ao.
Deni cao 14. Seja (A, , C) um sistema aut onomo, N seu subespa co
n ao observavel. Sejam ainda X
+
(A), X
(A) denidos como em (2.7).

O sistema (A, , C) e denominado detect avel quando N X
(A). 2
A no c ao de detectabilidade nos permite enm analisar o compromisso
entre os autovalores de A e as trajetorias das solu c oes do sistema.
steuer
2008/3/11
page 35
i
i
i
i
i
i
i
i
[SEC. 2.3: RECONSTRUC
AO DE ESTADOS 35
Teorema 15. Seja (A, , C) um sistema aut onomo detect avel. As se-
guintes armativas s ao equivalentes:
a) Todo autovalor de A satisfaz Re() < 0.
b) A fun c ao matricial V (t) :=
_
t
0
e
A
s
C
Ce
As
ds denida para t
[0, ) e limitada.
Demonstra c ao: a) = b) Tome = maxRe() [ e autovalor de A
e = [[/2. Por hipotese temos < 0 e := + < 0. O Teorema 248
garante a existencia de uma constante c > 0 tal que
|e
At
| c e
t
, t > 0.
Temos desta forma que
|V (t)| c
2
|C|
2
_

0
e
2t
dt < M, t > 0.
b) = a) Seja C um autovalor de A com Re() 0 e u o autovetor
correspondente. Por hipotese existe M > 0 tal que
u, V (t) u) =
_
t
0
e
2Re()s
[Cu[
2
ds < M, t 0.
Tomando o limite quando t temos que Cu = 0, de onde conclui-se
que
C A
k
u =
k
C u = 0, k = 0, 1, . . .
O Teorema 8 garante ent ao que
u N =
n1
k=0
Ke(CA
k
) X
(A).
Assim, temos que u X
(A) X
+
(A) = .
2.3 Reconstrucao de Estados
Se o sistema (A, , C) e observavel (em [t
0
, t
1
]), faz sentido pensar
na reconstru c ao do estado inicial z
0
a partir do vetor de observa c ao y.
Uma primeira tentativa e utilizar um operador de reconstru c ao linear
que seja, na medida do possvel, insensvel a interferencias no vetor de
observa c ao y.
steuer
2008/3/11
page 36
i
i
i
i
i
i
i
i
Nesse sentido denimos o operador de reconstru c ao
(2.8) z
0
=
_
t
1
t
0
R(t) y(t) dt,
onde a fun c ao matricial R e denominada n ucleo de reconstru c ao do sis-
tema. Para esse esquema de reconstru c ao particular temos o seguinte
resultado:
Teorema 16. Seja (A, , C) um sistema observ avel em [t
0
, t
1
] (n ao ne-
cessariamente aut onomo). Ent ao a fun c ao matricial
R(t) := W(t
0
, t
1
)
1
A
(t, t
0
)
C(t)
, t [t
0
, t
1
],
dene um n ucleo de reconstru c ao para o sistema (A, , C). A aplica c ao
'(y) :=
_
t
1
t
0
R(t) y(t) dt
e linear, contnua e est a bem denida de C([t
0
, t
1
]; R
l
) em R
n
.
Demonstra c ao: Do Teorema 7, sabemos que W(t
0
, t
1
) e inversvel, por-
tanto a fun c ao R (e conseq uentemente a aplica c ao ') esta bem denida.
Note ainda que
_
t
1
t
0
R(t) y(t) ds =
_
t
1
t
0
R(t) C
A
(t, t
0
) z
0
ds = z
0
,
provando que R satisfaz (2.8). A linearidade da aplica c ao ' e obvia e
sua continuidade segue da desigualdade
[
_
t
1
t
0
R(t) y(t) dt[ c max
t[t
0
,t
1
]
[y(t)[ = c |y|
.
Observa cao 17.

E possvel ainda demonstrar que a aplica c ao ' denida
acima e contnua quando denida em L
2
([t
0
, t
1
]; R
n
). Mais ainda, entre
todos os n ucleos de reconstru c ao lineares denidos em L
2
([t
0
, t
1
]; R
n
), a
fun c ao denida acima e a de menor norma. 2
steuer
2008/3/11
page 37
i
i
i
i
i
i
i
i
EXERC
ICIOS 37
Observa cao 18 (Observabilidade de sistemas nao lineares). En-
cerramos este captulo mencionando uma importante area de pesquisa
atual relacionada a sistemas n ao lineares. Uma nova teoria de obser-
vabilidade para sistemas n ao lineares foi desenvolvida nos anos 90 por
J.P.Gauthier e I.Kupka [GaKu, GaKu1, GaKu2, JoGa]. Os autores con-
sideram sistemas com din amicas e fun c oes de output ambas aut onomas
e C
, a m de denir um novo conceito de observabilidade atraves da

medida de conjuntos especiais na pre-imagem da aplica c ao input-output
correspondente ao sistema [GaKu, Captulo 2]. Particularmente interes-
sante e o caso em que a aplica c ao estado-inicial trajet oria-output n ao
e regular. Os autores estendem um conceito (aplica c ao nita) da teoria
classica de singularidades para a aplica c ao estado-inicial trajet oria-
output [JoGa], obtendo assim novos resultados relativos à observabili-
dade do sistema [GaKu, Captulo 5]. 2
Exerccios
2.1. Considere o sistema (A, B, C) com
A =
_
_
1 1 0
0 1 0
0 0 2
_
_
, B =
_
_
0
1
1
_
_
, C =
_
1 1 1
_
.
Encontre (se possvel) uma condi c ao inicial z
0
de modo que a sada do
sistema seja da forma y(t) = te
t
.
2.2. Considere o sistema (A, , C) com
A =
_
2 0
0 3
_
, C =
_
a b
_
,
onde a, b R. Sabendo que z
0
,= 0 e que a sada y(t) e medida apenas
nos instantes t
2
> t
1
> 0, encontre os valores de a e b para os quais e
possvel determinar o estado inicial z
0
a partir das observa c oes y(t
1
) e
y(t
2
).
A =
_
0 1
t
2
t
1
_
, C =
_
0 1
_
.
Calcule a matriz de transi c ao do sistema z
t
= Az. Mostre que (A, , C) e
observavel.
steuer
2008/3/11
page 38
i
i
i
i
i
i
i
i
38 EXERC
ICIOS
2.4. Considere um modelo de compartimentos (veja Sec c ao 1.2.6) des-
crito pelo sistema (A, B, C), com
A =
_
_
a
1
b
1
0
a
1
(a
2
+b
1
) b
2
0 a
2
b
2
_
_
, B =
_
_
0
0
1
_
_
, C =
_
1 0 0
_
.
Verique a observabilidade do sistema.
2.5. Demonstre as arma c oes feitas na Observa c ao 13.
A =
_
2 0
1 1
_
, C =
_
0 1
_
.
a) Mostre que o sistema e observavel.
b) Exiba um n ucleo de reconstru c ao para o sistema.
steuer
2008/3/11
page 39
i
i
i
i
i
i
i
i
Captulo 3
Controlabilidade
Neste captulo estudamos prioritariamente o problema de determi-
nar como e quando um estado especco pode ser atingido por um sis-
tema a partir da escolha de uma estrategia de controle apropriada. Na
Sec c ao 3.2 estudamos a rela c ao existente entre os conceitos de observa-
bilidade e controlabilidade de sistemas lineares. No Sec c ao 3.5 encon-
tramos a solu c ao de uma famlia especial de problemas de controle otimo
associados com sistemas lineares aut onomos. Na Sec c ao 3.6 tratamos
da controlabilidade de sistemas com restri c oes na variavel de controle.
Na Sec c ao 3.7 analisamos uma famlia particular de problemas, cujas
solu c oes s ao os controles denominados BangBang.
Consideramos um sistema linear de controle da forma (A, B, C)
z
t
= A(t) z + B(t) u (3.1)
y = C(t) z (3.2)
onde as variaveis z, y e u possuem, como na Sec c ao 2.1, a seguinte
interpreta c ao:
z : [t
0
, t
1
] R
n
: vetor das variaveis de estado;
u : [t
0
, t
1
] R
m
: vetor das variaveis de controle (entrada);
y : [t
0
, t
1
] R
l
: vetor de observa c ao (sada).
O efeito das variaveis de controle sobre a din amica do sistema e
modelado unicamente na equa c ao (3.1), sendo desnecessario considerar a
steuer
2008/3/11
page 40
i
i
i
i
i
i
i
i
40 [CAP. 3: CONTROLABILIDADE
equa c ao de observa c ao y = C(t)z. Adotamos assim a nota c ao abreviada
(A, B) para representar o sistema de controle descrito nas equa c oes (3.1),
(3.2).
A menos que se arme o contrario, as fun c oes matriciais
A : [t
0
, t
1
] R
n,n
, B : [t
0
, t
1
] R
n,m
s ao consideradas contnuas neste captulo. A matriz de transi c ao do
sistema z
t
= A(t)z (veja Deni c ao 256) e representada por
A
(, ).
Como controles admissveis consideramos as fun c oes
1
u L
1
([t
0
, t
1
]; R
m
).
Podemos agora introduzir formalmente o conceito de controlabilidade,
mencionado no Captulo 1.
Deni cao 19. O sistema (A, B) e dito control avel em [t
0
, t
1
]
quando, para todo par de estados z
0
, z
1
R
n
, existe um controle u
L
1
([t
0
, t
1
]; R
m
) de forma que a solu c ao z do problema de valor inicial
z
t
= A(t) z + B(t) u(t), z(t
0
) = z
0
satisfaz tambem a condi c ao de contorno z(t
1
) = z
1
. 2
Observa cao 20. Quando a fun c ao u L
1
([t
0
, t
1
]; R
m
) controla a evolu-
c ao do estado z a partir do estado inicial z
0
R
n
ate o estado nal z
1

R
n
atraves da din amica z
t
= A(t)z +B(t)u(t), conforme a Deni c ao 19,
usamos a nota c ao abreviada
(t
0
, z
0
)
u
(t
1
, z
1
).
2
Observa cao 21. Note que o Teorema 258 garante que um controle u
satisfaz
(t
0
, z
0
)
u
(t
1
, z
1
),
se e somente se
z
1
=
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds.
2
1
O espa co das fun c oes localmente integr aveis de [0, ) em R
m
e denido por
L
1
loc
([0, ); R
m
) := |u L
1
([t
0
, t
1
]; R
m
) para todos 0 t
0
t
1
< .
Por deni c ao, toda fun c ao u L
1
([t
0
, t
1
]; R
m
) possui uma exten c ao trivial u
L
1
loc
([0, ); R
m
).
steuer
2008/3/11
page 41
i
i
i
i
i
i
i
i
Existem ainda outras formas equivalentes de se denir a controlabi-
lidade de sistemas lineares. Este e o resultado do teorema a seguir.
Teorema 22. Dado o sistema linear de controle (A, B), s ao equivalentes
as seguintes arma c oes:
a) O sistema (A, B) e control avel em [t
0
, t
1
];
b) Para todo z
1
R
n
existe uma fun c ao u L
1
([t
0
, t
1
]; R
m
) satis-
fazendo:
(t
0
, 0)
u
(t
1
, z
1
) ;
c) Para todo z
0
R
n
existe uma fun c ao u L
1
([t
0
, t
1
]; R
m
) satis-
fazendo:
(t
0
, z
0
)
u
(t
1
, 0) ;
Demonstra c ao: As implica c oes a) = b) e a) = c) s ao imediatas. As
demais implica c oes decorrem basicamente da Observa c ao 21. De fato,
b) = a) Sejam z
0
, z
1
R
n
. Escolha u L
1
([t
0
, t
1
]; R
m
) tal que
(t
0
, 0)
u
(t
1
, z
1

A
(t
1
, t
0
)z
0
).
Logo,
z
1

A
(t
1
, t
0
) z
0
=
A
(t
1
, t
0
) 0 +
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds
e portanto (t
0
, z
0
)
u
(t
1
, z
1
).
c) = a) Sejam z
0
, z
1
R
n
. Escolha u L
1
([t
0
, t
1
]; R
m
) tal que
(t
0
, z
0

A
(t
1
, t
0
)
1
z
1
)
u
(t
1
, 0).
Logo,
0 =
A
(t
1
, t
0
)(z
0

A
(t
1
, t
0
)
1
z
1
) +
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds,
provando que (t
0
, z
0
)
u
(t
1
, z
1
).
Observa cao 23. A propriedade descrita no item c) do Teorema 22 e
usualmente denominada na literatura por controlabilidade ao zero. 2
Uma analise sobre controlabilidade (assim como observabilidade) de
sistemas de controle n ao lineares pode ser encontrada em [LeMa]. En-
tretanto, os autores consideram somente sistemas de controle do tipo
aut onomo.
steuer
2008/3/11
page 42
i
i
i
i
i
i
i
i
3.2 Controlabilidade e Observabilidade
Existe um forte compromisso entre a controlabilidade do sistema
(A, B) e a observabilidade do sistema (A
, , B
). A investiga c ao desse
fato e o objeto de analise discutido nesta sec c ao.
Teorema 24. Dado o sistema linear de controle (A, B), s ao equivalentes
as arma c oes:
a) (A, B) e control avel em [t
0
, t
1
];
b) N ao existe nenhum z
1
R
n
0 que satisfa ca
B(t)

A
(t
1
, t)
z
1
= 0, t [t
1
, t
0
].
c) A matriz Z(t
0
, t
1
) :=
_
t
1
t
0
A
(t
1
, t)B(t)B(t)
A
(t
1
, t)
dt e n ao sin-
gular;
d) (A
, , B
) e observ avel em [t
0
, t
1
].
Demonstra c ao: a) = b) Seja z
1
R
n
. Escolha u L
1
([t
0
, t
1
]; R
m
) tal
que
(t
0
, 0)
u
(t
1
, z
1
).
Temos, portanto, que
[z
1
[
2
= z
1
, z
1
) = z
1
,
_
t
1
t
0
A
(t
1
, t)B(t)u(t) dt)
=
_
t
1
t
0
B(t)
A
(t
1
, t)
z
1
, u(t)) dt.
Logo, se z
1
R
n
0, temos obrigatoriamente B(t)
A
(t
1
, t)
z
1
, 0
em [t
0
, t
1
].
b) c) De sua deni c ao em c), segue que Z(t
0
, t
1
) e semidenida
positiva. Seja agora z
1
R
n
0. Temos ent ao
z
1
, Z(t
0
, t
1
)z
1
) =
_
t
1
t
0
[B(t)

A
(t
1
, t)
z
1
[
2
dt.
Logo, se z
1
R
n
0, a hipotese em b) implica em z
1
, Z(t
0
, t
1
)z
1
) ,= 0,
provando c).
Reciprocamente, de c) temos que B(t)
A
(t
1
, t)
z
1
0 sse z
1
= 0.
Provando assim b).
steuer
2008/3/11
page 43
i
i
i
i
i
i
i
i
[SEC. 3.2: CONTROLABILIDADE E OBSERVABILIDADE 43
c) = a) Seja z
1
R
n
. A existencia de Z(t
0
, t
1
)
1
e garantida por c).
Dena agora u por
u(t) := B(t)

A
(t
1
, t)
Z(t
0
, t
1
)
1
z
1
, t [t
0
, t
1
].
Temos ent ao
A
(t
1
, t
0
) 0 +
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds =
=
_
t
1
t
0
A
(t
1
, s) B(s) B(s)

A
(t
1
, s)
Z(t
0
, t
1
)
1
z
1
ds
= Z(t
0
, t
1
) Z(t
0
, t
1
)
1
z
1
= z
1
.
O argumento da Observa c ao 21 implica em (t
0
, 0)
u
(t
1
, z
1
). A ar-
ma c ao em a) segue por m do Teorema 22.
c) d) Conforme demonstrado na Sec c ao 2.3, a rela c ao entre as
matrizes de transi c ao
A
(t
0
, t) e
A
(t, t
0
) dos sistemas z
t
= A(t)z e
w
t
= A(t)
w respectivamente, e dada por
A
(t, t
0
) :=
A
(t
0
, t)
.
Seja W(t
0
, t
1
) a matriz de observa c ao do sistema (A
, , B
) (veja Teo-
rema 7) dada por
W(t
0
, t
1
) =
_
t
1
t
0
A
(t, t
0
)
B(t) B(t)

A
(t, t
0
) dt
=
_
t
1
t
0
A
(t
0
, t) B(t) B(t)

A
(t
0
, t)
dt
=
_
t
1
t
0
A
(t
0
, t
1
)
A
(t
1
, t) B(t) B(t)

A
(t
1
, t)

A
(t
0
, t
1
)
dt
=
A
(t
0
, t
1
) Z(t
0
, t
1
)
A
(t
0
, t
1
)
.
Portanto, W(t
0
, t
1
) e singular se e somente se Z(t
0
, t
1
) o for. O resultado
desejado segue agora do Teorema 7, o qual garante que (A
, , B
) e
observavel em [t
0
, t
1
] se e somente se W(t
0
, t
1
) e positiva denida.
Observa cao 25. Na demonstra c ao da implica c ao c) = a) no Teo-
rema 24, construimos um controle especial u, que leva o estado inicial
z
0
= 0 em um estado nal z
1
R
n
arbitrario, i.e.
(t
0
, 0)
u
(t
1
, z
1
) para u(t) := B(t)

A
(t
1
, t)
Z(t
0
, t
1
)
1
z
1
.
2
steuer
2008/3/11
page 44
i
i
i
i
i
i
i
i
3.3 Sistemas de Controle Aut onomos
Caso as matrizes A, B do sistema de controle (A, B) sejam cons-
tantes, este sistema e denominado sistema linear aut onomo de controle.
Neste caso, dispomos da seguinte caracteriza c ao de controlabilidade:
Teorema 26. Seja (A, B) um sistema de controle aut onomo. S ao equi-
valentes as arma c oes:
a) (A, B) e control avel em [0, T] para todo T > 0;
b) (A, B) e control avel em [0, T] para algum T > 0;
c) A matriz W
T
:=
_
T
0
e
As
BB
e
A
s
ds e n ao singular para um T > 0;
d) A matriz W
T
:=
_
T
0
e
As
BB
e
A
s
ds e n ao singular para todo T>0;
e) Po(B[AB[ . . . [A
n1
B) = n.
Demonstra c ao: O teorema segue imediatamente dos Teoremas 8
e 24.
Observa cao 27. A propriedade descrita no item e) do Teorema 26
e usualmente denominada na literatura por criterio de Kalman
(1963). 2
Deni cao 28. Um sistema aut onomo (A, B), para o qual a condi c ao
de posto e) do Teorema 26 e satisfeita, e denominado completamente
control avel (veja [So, Captulo 3]). 2
Exemplo 29. Considere o problema do oscilador harm onico descrito
pela equa c ao diferencial:
x + x = u.
Podemos reescrever a equa c ao acima na forma
_
z
1
= z
2
z
2
= u z
1
que e obtida quando denimos z
1
= x e z
2
= x
t
. Escrevendo na forma
de sistema, temos
z
t
= Az + Bu, onde A =
_
0 1
1 0
_
, B =
_
0
1
_
e z =
_
z
1
z
2
_
.
steuer
2008/3/11
page 45
i
i
i
i
i
i
i
i
[SEC. 3.3: SISTEMAS DE CONTROLE AUT
ONOMOS 45
Como
Po (B[AB) = Po
_
0 1
1 0
_
= 2,
podemos concluir que (A, B) e controlavel. Note que n ao foi feita ne-
nhuma restri c ao às variaveis de controle. 2
Exemplo 30. Consideremos novamente o movimento de um satelite
articial de massa unitaria orbitando a Terra. No Exemplo 9 deduzimos
uma aproxima c ao linear para o modelo que representa o fen omeno, que
e a equa c ao
z
t
= Az + Bu,
onde
A =
_
_
_
_
0 1 0 0
3
2
0 0 2
0 0 0 1
0 2 0 0
_
_
_
_
, B =
_
_
_
_
0 0
1 0
0 0
0 1
_
_
_
_
.
Neste caso temos:
Po (B[AB[A
2
B[A
3
B) = Po
_
_
_
_
0 0 1 0 . . .
1 0 0 2 . . .
0 0 0 1 . . .
0 1 2 0 . . .
_
_
_
_
= 4.
De onde conclumos que o sistema linearizado e controlavel (em [0, T]
para T t ao pequeno quanto se queira). Suponha agora que dispomos
apenas do empuxo radial para controlar a orbita do satelite. Neste caso
a matriz B se torna
B =
_
_
_
_
0
1
0
0
_
_
_
_
e obtemos
Po (B[AB[A
2
B[A
3
B) = Po
_
_
_
_
0 1 0
2
1 0
2
0
0 0 2 0
0 2 0 2
3
_
_
_
_
= 3.
Conclumos portanto, que nesta situa c ao o sistema n ao mais e con-
trolavel.
steuer
2008/3/11
page 46
i
i
i
i
i
i
i
i
Alternativamente, suponha que apenas o empuxo tangencial esteja
disponvel para realizar corre c oes na orbita. A matriz B se torna
B =
_
_
_
_
0
0
0
1
_
_
_
_
e obtemos
Po (B[AB[A
2
B[A
3
B) = Po
_
_
_
_
0 0 2 0
0 2 0 2
3
0 1 0 4
2
1 0 4
2
0
_
_
_
_
= 4.
Sendo assim, nesta situa c ao o sistema e novamente controlavel. 2
Exemplo 31. Considere o sistema (A, B) gerado pela EDO de ordem
n
x
(n)
+
n1
i=0
i+1
x
(i)
= u.
Temos assim
A =
_
_
_
_
_
_
_
_
0 1 0 0
0 1

0
0 0 1
1

2

n
_
_
_
_
_
_
_
_
, B =
_
_
_
_
_
_
_
_
0
1
_
_
_
_
_
_
_
_
.
Um calculo simples mostra que o sistema e controlavel (verique!). 2
O proximo lema nos permite analisar a quest ao da controlabilidade
quando temos perturba c oes de um sistema aut onomo totalmente con-
trolavel.
Lema 32. Seja (A, B) um sistema aut onomo totalmente control avel.
Ent ao, para toda matriz F R
m,n
, o sistema (A + BF, B) tambem e
totalmente control avel.
Demonstra c ao: Seja F R
m,n
. Da controlabilidade de (A, B) segue
que
Po(B[AB[ [A
n1
B) = n.
steuer
2008/3/11
page 47
i
i
i
i
i
i
i
i
[SEC. 3.4: FORMA NORMAL DOS SISTEMAS AUT
ONOMOS 47
Note ainda que
(B[ [(A+BF)
n1
B) = (B[ [A
n1
B) Q,
onde Q = I + N R
nm,nm
e N e uma matriz nilpotente, i.e. N
k
= 0
para algum k N.
A forma exata de N e irrelevante e pode ser calculada recursivamente.
2
O importante e que da identidade Q = I + N podemos concluir que a
matriz Q e n ao singular (verique!) e portanto
Po (B[(A+BF)B[ [(A+BF)
n1
B) = n.
Provando que (A+BF, B) e controlavel.
3.4 Forma Normal dos Sistemas Aut onomos
Os sistemas aut onomos de controle possuem ainda a caracterstica de
poder ser reescritos em uma sistema especial, denominada forma normal
(de Kalman). A vantagem e que na forma normal o sistema pode ser
dividido em 4 blocos, sendo possvel identicar os sub-sistemas:
controlavel e observavel;
controlavel e n ao observavel;
n ao controlavel e observavel;
n ao controlavel e n ao observavel.
Teorema 33. Seja (A, B, C) um sistema de controle aut onomo.
Ent ao existe uma matriz n ao singular P R
n,n
, de modo que o sis-
tema (

A,

B,

C), com matrizes

A = PAP
1
,

B = PB,

C = CP
1
, e da
forma
(3.3)
A=
_
_
_
_
A
11

A
12

A
13

A
14
0

A
22
0

A
24
0 0

A
33

A
34
0 0 0

A
44
_
_
_
_
,

B=
_
_
_
_
B
1
B
2
0
0
_
_
_
_
,

C=
_
0

C
2
0

C
4
_
.
2
Para n = 3 temos:
Q =
_
_
I FB FAB + (FB)
2
I FB
I
_
_
.
steuer
2008/3/11
page 48
i
i
i
i
i
i
i
i
Temos ainda que o sub-sistema
(3.4)
__

A
11

A
12
0

A
22
_
,
_

B
1
B
2
__
e control avel e o sub-sistema
(3.5)
__

A
22

A
24
0

A
44
_
,
_

C
2

C
4
_
_
e observ avel.
Demonstra c ao: Come camos denindo os subespa cos U e V de R
n
por
U := Im(B) + AIm(B) + + A
n1
Im(B), V :=
n1
k=0
Ke(CA
k
).
Dividimos a prova nos seguintes pasos:
(1) A(V ) V ;
(2) A(U) U;
(3) constru c ao da matriz P;
(4) verica c ao de (3.3);
(5) controlabilidade de (3.4);
(6) observabilidade de (3.5).
(1) Seja z V e dena x = Az. Logo, CA
k
x = CA
k+1
z = 0, para k =
0, . . . , n2. Do teorema de Caley-Hamilton, temos A
n
n1
k=0
k
A
k
= 0.
De onde conclumos que
C A
n1
x = C A
n
z =
n1
k=0
k
C A
k
z = 0.
Provamos assim que CA
k
x = 0, para k = 0, . . . , n 1, i.e. x V .
(2) Seja z U. Logo, existem vetores u
k
R
m
tais que
z =
n1
k=0
A
k
Bu
k
.
steuer
2008/3/11
page 49
i
i
i
i
i
i
i
i
[SEC. 3.4: FORMA NORMAL DOS SISTEMAS AUT
ONOMOS 49
Dena agora x = Az. Utilizando novamente o teorema de Caley-
Hamilton, temos
x =
n1
k=0
A
k+1
Bu
k
= A
n
Bu
n1
+
n1
k=1
A
k
Bu
k1
=
_
n1
k=0
k
A
k
_
Bu
n1
+
n1
k=1
A
k
Bu
k1
=
0
Bu
n1
+
n1
k=1
A
k
B(
k
u
n1
+u
k1
) in U.
(3) Primeiro decompomos o R
n
na soma direta
R
n
= X
1
X
2
X
3
X
4
,
onde X
1
= U V ; X
2
e tal que X
1
X
2
= U; X
3
e tal que X
1
X
3
= V
e X
4
= R
n
X
1
X
2
X
3
. Escolha agora uma base w
1
, . . . , w
n
para o
R
n
, que seja composta por bases para os espa cos X
1
, X
2
, X
3
, X
4
. Isto e
X
1
= Span w
1
, . . . , w
d1
, X
2
= Span w
d1+1
, . . . , w
d1+d2
,
X
3
= Span w
d1+d2+1
, . . . , w
d1+d2+d3
,
X
4
= Span w
d1+d2+d3+1
, . . . , w
n
(onde d1 + d2 + d3 + d4 = n). Dena agora a matriz P atraves da

transforma c ao linear
P : R
n
R
n
; Pw
k
= e
k
, 1 k n.
(4) A identidade

AP = PA e (2) implicam que os blocos

A
31
,

A
32
,

A
41
e

A
42
s ao identicamente nulos. A identidade

AP = PA e (1) implicam
que os blocos

A
21
,

A
23
,

A
41
e

A
43
s ao identicamente nulos.
Sejam b
j
R
n
, j = 1, . . . , m os vetores coluna de B. Como Im(B) U,
ent ao b
j
X
1
X
2
e, portanto,
P b
j
=
d1+d2
k=1
k
P w
k
=
d1+d2
k=1
k
e
k
.
steuer
2008/3/11
page 50
i
i
i
i
i
i
i
i
Decorre ent ao que os blocos

B
3
e

B
4
s ao identicamente nulos. Como
V Ke(C), ent ao Cx = 0, x X
1
X
3
. De C =

CP segue agora que
Ce
k
= 0 para k = 1, . . . , d1, d1 +d2 + 1, . . . , d1 +d2 +d3. Portanto, os
blocos

C
1
e

C
3
s ao identicamente nulos.
(5) Seja k := dimU = d1 +d2. Logo, B = Im(U) + A Im(U) + +
A
k1
Im(U).
3
Temos ent ao
Po
_
_

B
1
B
2
_
[ [
_

A
11

A
12
0

A
22
_
k1
_

B
1
B
2
_
_
= Po (

B[ [

A
k1

B)
= Po (B[ [A
k1
B)
= dimU = k.
A controlabilidade de (3.4) segue agora do Teorema 8.
(6) Seja k := dim(X
2
X
4
) = d2 + d4. Logo, V =
k1
j=0
Ke(CA
j
).
4
Seja ainda M
0
a matriz de observa c ao do sub-sistema (3.5) (conforme
Teorema 8). Temos ent ao
Im(M
0
) = Im
_
_
_
_
_
(

C
2
[
C
4
)
.
.
.
(

C
2
[
C
4
)
_

A
22

A
24
0

A
44
_
k1
_
_
_
_
_
= Im
_
_
_
C
.
.
.
C

A
k1
_
_
_
= Im
_
_
_
C
.
.
.
CA
k1
_
_
_
.
3
Isto e conseq uencia da seguinte implica c ao:
A
j
Im(B) Im(U) + +A
j1
Im(U) =
A
i
Im(B) Im(U) + +A
j1
Im(U), i j.
4
Este fato segue da implica c ao:
Ke(CA
j1
) Ke(CA
j
) = Ke(CA
j
) Ke(CA
j+1
) =
V Ke(CA
j+1
).
steuer
2008/3/11
page 51
i
i
i
i
i
i
i
i
[SEC. 3.5: CONTROLABILIDADE E ESTRAT
EGIAS

OTIMAS 51
Po(M
0
) = n dim Ke
_
_
_
C
.
.
.
CA
k1
_
_
_
= n dim V = n dim(X
1
X
3
) = k.
Logo, dim Im(M
0
) = dim Im(M
0
) = k e a observabilidade do sistema
em (3.5) segue do Teorema 26.
3.5 Controlabilidade e Estrategias

Otimas
Ainda investigando a controlabilidade de sistemas aut onomos, vemos
a seguir que e possvel encontrar uma estrategia de controle que leve o
estado (0, z
0
) no estado (T, z
1
) e que seja otima em um sentido particular.
Teorema 34. Seja (A, B) um sitema de controle aut onomo e T > 0.
Dena a matriz V
T
:=
_
T
0
e
As
BB
e
A
s
ds. S ao verdadeiras as seguintes
arma c oes:
a) O controle
(3.6) u(t) := B
e
A
(Tt)
V
T
1
(e
AT
z
0
z
1
), t [0, T]
satisfaz a propriedade
(3.7) (0, z
0
)
u
(T, z
1
).
b) Entre todos os controles admissveis u que satisfazem (3.7), u e aquele
que minimiza o funcional quadr atico
J(u) =
_
T
0
[u(t)[
2
dt
e o valor mnimo atingido por J e
(3.8) J( u) =
_
T
0
[ u(t)[
2
dt = V
T
1
(e
AT
z
0
z
1
), (e
AT
z
0
z
1
)).
Demonstra c ao: Para vericar a) note que a matriz de transi c ao de um
sistema aut onomo e dada por
A
(t, s) = e
A(ts)
. Temos portanto
steuer
2008/3/11
page 52
i
i
i
i
i
i
i
i
A
(T, 0) z
0
+
_
T
0
A
(T, s) B u(s) ds =
= e
AT
z
0

_
T
0
e
A(Ts)
BB
e
A
(Ts)
V
T
1
(e
AT
z
0
z
1
) ds
= e
AT
z
0

__
T
0
e
As
BB
e
A
s
ds
_
V
T
1
(e
AT
z
0
z
1
)
= e
AT
z
0
V
T
V
T
1
(e
AT
z
0
z
1
) = z
1
.
Logo, a) segue da Observa c ao 21. A equa c ao (3.8) segue por sua vez de
_
T
0
[ u(t)[
2
dt =
_
T
0
[B
e
A
(Ts)
V
T
1
(e
AT
z
0
z
1
)[
2
ds
=
_
T
0
e
A(Ts)
BB
e
A
(Ts)
V
T
1
(e
AT
z
0
z
1
) ds,
V
T
1
(e
AT
z
0
z
1
))
= V
T
V
T
1
(e
AT
z
0
z
1
), V
T
1
(e
AT
z
0
z
1
))
= V
T
1
(e
AT
z
0
z
1
), (e
AT
z
0
z
1
)).
Provemos agora b). Seja u L
1
([0, T]; R
m
) um controle qualquer satis-
fazendo (3.7). Podemos supor sem perda de generalidade que J(u) =
_
T
0
[u(t)[
2
dt < .
5
Temos ent ao
_
T
0
u(s), u(s)) ds =
_
T
0
u(s), B
e
A
(Ts)
V
T
1
(e
AT
z
0
z
1
)) ds
=
_
T
0
e
A(Ts)
Bu(s) ds, V
T
1
(e
AT
z
0
z
1
))
= (e
AT
z
0
z
1
), V
T
1
(e
AT
z
0
z
1
)).
(Na ultima passagem utilizamos a Observa c ao 21.) Acabamos de provar,
portanto, que
(3.9)
_
T
0
u(s), u(s)) ds =
_
T
0
u(s), u(s)) ds.
5
Essa hip otese garante que u L
2
([0, T]; R
m
). Note que (3.8) tambem implica em
u L
2
([0, T]; R
m
).
steuer
2008/3/11
page 53
i
i
i
i
i
i
i
i
[SEC. 3.5: CONTROLABILIDADE E ESTRAT
EGIAS

OTIMAS 53
Note porem que o produto interno , no espa co L
2
([0, T]; R
m
) e
denido por
f, g =
_
T
0
f(s), g(s)) ds, f, g L
2
([0, T]; R
m
).
Logo, (3.9) e equivalente a u, u = u, u . Temos da que
u, u + u u, u u
= 2 u, u + u, u 2 u, u
= u, u ,
o que implica em
_
T
0
[u(t)[
2
dt =
_
T
0
[ u(t)[
2
dt +
_
T
0
[u(t) u(t)[
2
dt.
O item b) segue desta ultima identidade, completando a demonstra c ao.
Observa cao 35. O Teorema 34 pode ser interpretado como:
A estrategia de controle u denida em (3.6) e solu c ao do
problema de controle otimo:
_
_
Minimizar
_
T
0
[u(t)[
2
dt
sujeito a
u L
2
([0, T]; R
m
) ;
z
t
= Az +u ; z(0) = z
0
, z(T) = z
1
.
2
Exemplo 36. Considere a equa c ao x = u. Do Exemplo 31, sabemos que
o sistema de controle associado e completamente controlavel. Tratamos
agora do seguinte problema:
Dado T > 0, encontre um controle u que leve o estado inicial
x(0) = x
0
, x(0) = x
1
no estado nal x(T) = x(T) = 0.
O Teorema 34 nos fornece uma receita (um tanto quanto trabalhosa)
para encontrar u
. A solu c ao e:
u(t) =
12
T
3
(
x
0
T
2
2
+
x
1
T
2
3

x
1
tT
2
tx
1
), t [0, T].
2
steuer
2008/3/11
page 54
i
i
i
i
i
i
i
i
3.6 Atingibilidade de Estados com Restric oes
de Controle
Um problema importante que surge em diversas aplica c oes praticas
e aquele em que consideramos restri c oes às variaveis de controle. Sob
essas condi c oes e importante saber quais estados podem ser atingidos
em um determinado intervalo de tempo. Consideramos novamente um
sistema linear da forma (A, B):
(3.10) z
t
= A(t) z + B(t) u,
onde as fun c oes matriciais
A : [t
0
, t
1
] R
n,n
, B : [t
0
, t
1
] R
n,m
s ao supostas contnuas. Impomos agora a seguinte restri c ao às variaveis
de controle: As estrategias (ou a c oes) de controle precisam ser escolhidas
a partir de um conjunto xado a priori. Seja R
m
o conjunto ao
qual esta restrita a escolha das estrategias de controle. Denominamos
conjunto de controle (ou de a c oes) e a partir da denimos o conjunto
6
U
ad
() := u L
1
([t
0
, t
1
]; R
m
) [ u(t) q.s. em [t
0
, t
1
],
que e chamado conjunto dos controles admissveis.
Deni cao 37. Seja z
0
R
n
. O subconjunto do R
n
denido por
R(; t
0
, z
0
, t
1
) := z
1
R
n
[ (t
0
, z
0
)
u
(t
1
, z
1
) para algum u U
ad
()
e denominado conjunto atingvel por z
0
. 2
Pelo que vimos ate agora, podemos garantir que R(; t
0
, z
0
, t
1
) = R
n
quando = R
m
e (A, B) e controlavel em [t
0
, t
1
]. Analisamos nesta
sec c ao o caso em que e um subconjunto proprio de R
m
.
Teorema 38. Sejam , U
ad
(), R(; t
0
, z
0
, t
1
) os conjuntos denidos
acima. Se e convexo e compacto, ent ao R(; t
0
, z
0
, t
1
) tambem e con-
vexo e compacto para todo z
0
R
n
.
6
Nota c ao: q.s. e abrevia c ao de quase sempre e signica que determinada pro-
priedade se verica excepto por um conjunto de medida (de Lebesgue) nula.
steuer
2008/3/11
page 55
i
i
i
i
i
i
i
i
[SEC. 3.6: ATINGIBILIDADE DE ESTADOS COM RESTRIC

OES DE CONTROLE 55
Demonstra c ao: Seja
A
(, ) a matriz de transi c ao do sistema. Temos
ent ao
(3.11)
R(; t
0
, z
0
, t
1
)
= z
1
[ z
1
=
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds, u U
ad
().
Logo, a compacidade de e a continuidade das fun c oes A() e B()
implicam na limita c ao do conjunto R(; t
0
, z
0
, t
1
). Provamos agora que
R(; t
0
, z
0
, t
1
) e fechado. Seja y = lim
l
y
l
, onde y
l
R(; t
0
, z
0
, t
1
) para
todo l N. Logo,
y
l
=
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s) B(s) u
l
(s) ds, u
l
U
ad
(), l N.
Como e limitado, ent ao (u
l
)
lN
e uma seq uencia limitada em
L
1
([t
0
, t
1
]; R
m
) e, portanto, possui uma subseq uencia fracamente conver-
gente.
7
Suponha, sem perda de generalidade, que (u
l
)
lN
e fracamente
convergente. Ent ao existe u L
1
([t
0
, t
1
]; R
m
), tal que
lim
l
_
t
1
t
0
w(t), u
l
(t)) dt =
_
t
1
t
0
w(t), u(t)) dt,
para todo w L
([t
0
, t
1
]; R
m
). Como e fechado, temos que U
ad
()
tambem e fechado.
8
E como e convexo, verica-se facilmente que
U
ad
() tambem e convexo. Sendo U
ad
() convexo e fechado, um resul-
tado conhecido da analise funcional garante que U
ad
() e fracamente
fechado. De onde conclumos que u U
ad
(). Portanto, para todo
7
Dizemos que a seq uencia x
n
converge fraco para x no espa co vetorial normado X
(nota-se x
n
w
x) quando f(x
n
) f(x) para todo funcional linear limitado f X
.
A conclus ao do texto segue de um conhecido teorema da an alise funcional: (veja
demonstra c ao em [Gr, Captulo 3] ou [Leig, Captulo 5]):
Teorema:[BanachAlaoglu] Em todo espa co de Banach (de dimens ao nita ou
n ao) a bola unit aria e fracamente compacta.
8
Aqui usamos o fato da convergencia fraca em L
1
([t
0
, t
1
]; R
m
) de uma seq uencia
implicar na convergencia pontual de uma subseq uencia quase sempre.
steuer
2008/3/11
page 56
i
i
i
i
i
i
i
i
v R
n
temos que
v, y) = lim
l
v, y
l
)
= lim
l
v,
A
(t
1
, t
0
)z
0
) +
_
t
1
t
0
v,
A
(t
1
, s)B(s)u
l
(s)) ds
= v,
A
(t
1
, t
0
)z
0
) + lim
l
_
t
1
t
0
B
(s)
A
(t
1
, s)
v, u
l
(s)) ds
= v,
A
(t
1
, t
0
)z
0
) +
_
t
1
t
0
B
(s)
A
(t
1
, s)
v, u(s)) ds
= v,
A
(t
1
, t
0
)z
0
+
_
t
1
t
0
A
(t
1
, s)B(s)u(s) ds).
y =
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s) B(s) u(s) ds R(; t
0
, z
0
, t
1
).
Provando assim que R(; t
0
, z
0
, t
1
) e fechado. O teorema de Heine-Borel
garante que, em R
n
, ser compacto e equivalente a ser simultaneamente
fechado e limitado, portanto R(; t
0
, z
0
, t
1
) e compacto. A convexi-
dade de R(; t
0
, z
0
, t
1
) segue da representa c ao am de seus elementos
em (3.11) e da convexidade de .
Exemplo 39. Considere o sistema (A, B) com matrizes
A =
_
a 0
0 a
_
, B =
_
1 0
0 1
_
.
O sistema (A, B) e totalmente controlavel, pois Po(B[AB) = 2. Logo,
R(R
2
; 0, z
0
, T) = R
2
para todo z
0
R
2
. Escolha agora = u
R
2
[ [u[ r, z
0
= 0 e t
0
= 0. Como a solu c ao do sistema possui a
representa c ao
z(t) =
_
t
0
e
a(ts)
u(s) ds,
podemos concluir que:
Se a > 0, ent ao R(; t
0
, z
0
, t
1
) = z R
2
[ [z[ ra
1
(e
at
1
1). Logo,
_
T>0
R(; 0, z
0
, T) = R
2
.
steuer
2008/3/11
page 57
i
i
i
i
i
i
i
i

OES DE CONTROLE 57
Se a < 0, ent ao R(; t
0
, z
0
, t
1
) = z R
2
[ [z[ r[a[
1
(1e
at
1
). Logo,
_
T>0
R(; 0, z
0
, T) = z R
2
[ [z[ [a[
1
r.
2
Este exemplo mostra que a investiga c ao do fato de um determi-
nado estado, em particular o estado z = 0, pertencer ao conjunto
R(; t
0
, z
0
, t
1
) para algum t
1
> t
0
e relevante no que diz respeito à
controlabilidade de um sistema. Esta quest ao e especialmente interes-
sante quando observamos que 0 pode ser considerado como estado ideal
a ser atingido.
Deni cao 40. Dado R
m
, o sistema aut onomo (A, B) e denominado
control avel ao zero em z
0
quando
0 R(; z
0
) :=
_
T>0
R(; 0, z
0
, T).
2
No lema a seguir discutimos condi c oes sucientes para obtermos a
controlabilidade ao zero de sistemas de controle aut onomos.
Lema 41. Seja (A, B) um sistema de controle aut onomo, totalmente
control avel e R
m
. Se 0 e um ponto interior de , ent ao para todo
T > 0 existe uma vizinhan ca V de 0 em R
n
tal que 0 R(; 0, z
0
, T)
para todo z
0
V .
9
Demonstra c ao: Seja T > 0 e V
T
:=
_
T
0
e
As
BB
e
A
s
ds. Dena u
L
1
([0, T]; R
m
), conforme o Teorema 34, por
u(t) := B
e
A
(Tt)
V
T
1
e
AT
z
0
, t [0, T].
Este mesmo teorema nos garante que (0, z
0
)
u
(T, 0). Como a aplica c ao
[0, T] t e
tA
R
n,n
e contnua e [0, T] compacto, ent ao existe uma
constante m > 0 tal que
[u(s)[ m[z
0
[ para todo [0, T] e todo z
0
R
n
.
Como 0 Int(), existe R > 0 tal que B
R
(0) . Denindo = Rm
1
e V = B
(0), temos que [u(s)[ m = R, t [0, T], z

0
V , i.e.
u(s) , t [0, T], z
0
V , provando o teorema.
9
Adotamos a seguinte nota c ao: y R
m
e um ponto interior de quando existe
r > 0 tal que B
r
(0) := |v R
m
[ [v[ r . Um conjunto V e denominado
vizinhan ca de y R
m
quando existe r > 0 tal que B
r
(0) V .
steuer
2008/3/11
page 58
i
i
i
i
i
i
i
i
No teorema a seguir analisamos a rela c ao entre a controlabilidade de
um sistema aut onomo e os autovalores da matriz do sistema.
Teorema 42. Seja (A, B) um sistema aut onomo e R
m
limitado.
S ao v alidas as arma c oes:
a) Se 0 e um ponto interior de , o sistema (A, B) e completamente
control avel e existem constantes m 0 e > 0 tais que
(3.12) |e
At
| me
t
, t [0, ),
ent ao 0 R(; z
0
) para todo z
0
R
n
;
b) Se a matriz A possui um autovalor com parte real positiva, ent ao
existe z
0
R
n
tal que 0 , R(; z
0
).
Demonstra c ao: Provamos primeiro a). Seja T
1
> 0. O Lema 41 nos
garante a existencia de uma vizinhan ca W de 0 tal que 0 R(; 0, w
0
, T
1
)
para todo w
0
W. De (3.12) temos que, para todo z
0
R
n
, existe um
T
2
(sucientemente grande) tal que e
AT
2
z
0
W. Dena w
0
:= e
AT
2
z
0
e
escolha a estrategia u L
1
([0, T
1
]; R
m
) de forma que
(0, w
0
)
u
(T
1
, 0).
Note agora que o controle u denido por
u(t) :=
_
0 , 0 t T
2
u(t T
2
) , T
2
t T
2
+T
1
satisfaz (0, z
0
)
u
(T
1
+T
2
, 0).
Provamos agora b). Seja = + i um autovalor de A
com > 0 e
w = w
1
+iw
2
o autovetor correspondente. Temos ent ao
A
w
1
+ iA
w
2
= ( + i)(w
1
+ iw
2
), [w
1
[ +[w
2
[ ,= 0
e portanto
A
w
1
= w
1
w
2
, A
w
2
= w
1
+w
2
.
Tome x R
n
satisfazendo q := x, w
1
)
2
+ x, w
2
)
2
,= 0 e seja
u L
1
loc
([0, ); R
m
). A partir da solu c ao z do sistema z
t
= Az +Bu(t),
z(0) = x, denimos a fun c ao
v(t) := z(t), w
1
)
2
+ z(t), w
2
)
2
, t [0, )
steuer
2008/3/11
page 59
i
i
i
i
i
i
i
i

OES DE CONTROLE 59
e obtemos para t 0 a estimativa
v
t
(t) = 2(z
t
(t), w
1
) z(t), w
1
) + z
t
(t), w
2
) z(t), w
2
))
= 2(z(t), A
w
1
) z(t), w
1
) + z(t), A
w
2
) z(t), w
2
))
+ 2(Bu(t), w
1
) z(t), w
1
) + Bu(t), w
2
) z(t), w
2
))
=: I
1
(t) + I
2
(t).
Da deni c ao de w
1
, w
2
obtemos agora I
1
(t) = 2v(t). Como e limi-
tado, temos ainda
[I
2
(t)[
2
= 4(Bu(t), w
1
) z(t), w
1
) + Bu(t), w
2
) z(t), w
2
))
2
8(c
1
z(t), w
1
)
2
+ c
2
z(t), w
2
)
2
)
c
2
[v(t)[
2
, t 0,
onde a constante c independe de u e x. Logo,
[I
2
(t)[ c
_
v(t), t 0.
Podemos ent ao armar que
v
t
(t) (v(t)), t 0,
onde (s) := 2s c
s, s R. Como (s) > 0 para s > (

c
2
)
2
=: s
0
,
temos que v e monotona crescente caso a escolha de x satisfa ca v(0) >
s
0
.
10
Neste caso a estrategia u n ao podera satisfazer (0, x)
u
(T, 0)
para nenhum T > 0. Como u L
1
loc
([0, ); R
m
) foi escolhido de forma
arbitraria, conclumos que para este x certamente 0 , R(; x). O caso
real = 0 e demonstrado de forma analoga.
Note que a condi c ao imposta em (3.12) no Teorema 42 e equivalente
a exigir que a matriz A possua apenas autovalores negativos.
Exemplo 43. Considere o sistema de controle obtido da EDO
z
(n)
+
n1
j=0
a
j
z
(j)
= u.
Como sabemos, este sistema e totalmente controlavel se tomamos = R
(veja Exemplo 31). Escolha agora como conjunto de controle :=
[, ] R. Caso o polin omio caracterstico do sistema acima possua
apenas razes com parte real negativa, podemos concluir que o sistema
de controle associado a EDO e controlavel ao zero. 2
10
Se n ao for esse o caso, podemos sempre substituir x por um m ultiplo seu ade-
quado, uma vez que c e (e portanto c
0
) independem de x.
steuer
2008/3/11
page 60
i
i
i
i
i
i
i
i
3.7 Princpio do BangBang e Problemas de
Tempo Mnimo
Como na sec c ao anterior, continuamos discutindo problemas com
restri c ao às variaveis de controle. Estamos particularmente interessados
na classica c ao dos problemas que s ao solucionados por controles do tipo
BangBang, i.e. controles u U
ad
() que satisfazem u(t) quase
sempre.
Considere o sistema escalar de controle
(3.13) z
t
= A(t)z +b(t)u, z(t
0
) = z
0
,
com fun c oes matriciais A C([t
0
, t
1
]; R
n,n
), b C([t
0
, t
1
]; R
n
). O con-
junto dos controles admissveis e
U
ad
() := u : [t
0
, t
1
] R [ u mensuravel; u(t) q.s.,
onde R
m
e convexo e compacto. Como vimos na Sec c ao A.3, a
solu c ao do sistema (3.13) e dada por
z(t) = Z(t)Z
1
(t
0
)z
0
+ Z(t)
_
t
t
0
Z
1
(s)b(s)u(s) ds, t [t
0
, t
1
].
Denindo agora o conjunto
S(; t
0
, t) :=
__
t
t
0
Z
1
(s)b(s)u(s) ds [ u U
ad
()
_
R
n
,
temos que R(; t
0
, z
0
, t) = Z(t)z
0
+Z(t)S(; t
0
, t), ou ainda
S(; t
0
, t) = Z
1
(t)R(; t
0
, z
0
, t) z
0
.
Portanto, z
0
R(; t
0
, z
0
, t) se e somente se [Z
1
(t)z z
0
] S(; t
0
, t).
Seguindo a nota c ao da Sec c ao 3.6, denimos o conjunto dos controles
de BangBang
U
bb
() := u U
ad
() [ u(t) q.s.
e o conjunto dos estados atingveis por esse tipo de estrategia de controle
R
bb
(; t
0
, z
0
, t) := z
1
R
n
[ (t
0
, z
0
)
u
(t
1
, z
1
) para algum uU
bb
().
Antes de formular o resultado principal desta sec c ao, necessitamos de
um lema auxiliar um tanto quanto tecnico.
steuer
2008/3/11
page 61
i
i
i
i
i
i
i
i
[SEC. 3.7: PRINC
IPIO DO BANGBANG E PROBLEMAS DE TEMPO M
INIMO 61
Lema 44. Dado t [t
0
, t
1
], a aplica c ao
I : L
([t
0
, t]; R) u
_
t
t
0
Z
1
(s)b(s)u(s) ds R
n
e linear e contnua, quando denida entre U
ad
(), com a topologia fraca
,
e o R
n
, com topologia usual.
Demonstra c ao: A linearidade segue imediatamente da deni c ao de
I. Para provar a continuidade, usamos o seguinte fato:
11
em U
ad
(),
u
n
w
u se e somente se
_
t
t
0
y(s)u
n
(s) ds
_
t
t
0
y(s)u(s) ds, y L
1
([t
0
, t]; R).
Como Z
1
(s)b(s) L
1
([t
0
, t]; R), o lema ca provado.
Apresentamos a seguir o resultado conhecido na literatura como
princpio do BangBang.
Teorema 45. Para qualquer t [t
0
, t
1
], temos R(; t
0
, z
0
, t) =
R
bb
(; t
0
, z
0
, t).
Demonstra c ao: Obviamente R
bb
(; t
0
, z
0
, t) R(; t
0
, z
0
, t). Para pro-
var a inclus ao contraria e suciente vericar que, para todo z S(; t
0
, t),
existe u U
bb
() tal que z = I( u). De fato, dado z R(; t
0
, z
0
, t),
denimos z := Z
1
(t)zZ
1
(t
0
)z
0
S(; t
0
, t). Logo, existe u U
bb
()
tal que z = I( u), de onde segue que
z = Z(t)Z
1
(t
0
)z
0
+Z(t) z =
A
(t, t
0
)z
0
+
_
t
t
0
A
(t, s)b(s) u(s) ds,
provando que z R
bb
(; t
0
, z
0
, t).
Seja portanto z S(; t
0
, t). Dena o conjunto M como a imagem
inversa de z por I, isto e,
M := I
1
(z) U
ad
() = u U
ad
() [ I(u) = z.
M e o subconjunto dos controles admissveis que garantem a inclus ao
de z em S(; t
0
, t). Basta provar ent ao que existe u M U
bb
().
11
Tal fato se justica pela topologia fraca
ser metriz avel em subconjuntos limitados

de L
([t
0
, t]; R).
steuer
2008/3/11
page 62
i
i
i
i
i
i
i
i
Note que S(; t
0
, t) e convexo e compacto por ser uma transla c ao
am de R(; t
0
, z
0
, t) (veja Teorema 38). O Lema 44 garante ent ao
que M L
([t
0
, t], R) e compacto e convexo na topologia fraca
. O
teorema de KreinMilman nos permite concluir que M possui um ponto
extremo,
12
que denominamos u. Provamos a seguir que u(t) q.s.
em [t
0
, t].
Da hipotese, segue que e um intervalo do tipo [a, b], com a, b < .
Suponha por contradi c ao que u(t) , = a, b q.s. em [t
0
, t]. Ent ao,
existe E [a, b] de medida (de Lebesgue) positiva tal que u(s) (a, b),
para todo s E. Denindo agora
E
k
:= s E [ u(s) (a +k
1
, b k
1
), k = 1, 2, . . .
temos E =
k=1
E
k
. Logo, ao menos um dos E
k
possui medida positiva,
de modo que existe > 0 e F E de medida n ao nula tais que
u(s) (a +, b ), s F.
Como a medida de F e positiva, temos que Dim[L
(F; R)] = . Logo,

a aplica c ao
I
F
: L
(F; R) v
_
F
Z
1
(s)b(s)v(s) ds R
n
n ao pode ser injetiva (por que?). Portanto, e possvel escolher v
L
(F; R) com v Ke(I

F
) e v , 0 em F. Estendendo trivialmente v ao
intervalo [t
0
, t], obtemos
v :=
_
v(s), s F
0, s [t
0
, t]/F,
que satisfaz I( v) = 0. Dividindo (se necessario) por uma constante,
temos [ v(s)[ 1 q.s. em [t
0
, t]. Logo, a u(s) v(s) b q.s., de modo
que u v U
ad
(). A linearidade de I implica em I( u v) = I( u) = z,
provando que u v M. Entretanto, isso contradiz o fato de u ser um
ponto extremo de M, pois
u =
1
2
( u + v) +
1
2
( u v).
12
Um ponto e denominado extremo de um conjunto quando n ao pode ser escrito
como combina c ao linear convexa de dois outros pontos do conjunto. Para detalhes
sobre o teorema de KreinMilman consulte [Heu].
steuer
2008/3/11
page 63
i
i
i
i
i
i
i
i
[SEC. 3.7: PRINC
IPIO DO BANGBANG E PROBLEMAS DE TEMPO M
INIMO 63
Na seq uencia analisamos uma famlia particular de problemas de
controle otimo, que tem como caracterstica o fato da fun c ao objetivo
depender unicamente do tempo nal. Tais problemas s ao denominados
problemas de tempo mnimo (veja [HeLa], [Leig]).
Dadas as fun c oes matriciais A C([t
0
, ); R
n,n
), b C([t
0
, ); R
n
)
e R convexo e compacto, considere o seguinte problema de controle
escalar:
(P
Tmin
)
_
_
Minimizar t
1
sujeito a
z
t
= A(t)z +b(t)u(t) ;
z(t
0
) = z
0
, z(t
1
) = z
1
; u U
ad
() ;
onde z
0
, z
1
R
n
s ao dados e o conjunto dos controles admissveis e
denido por
U
ad
() := u L
1
loc
([t
0
, ); R) [ u(t) q.s.,
Observe que o tempo nal t
1
n ao e xado e diferentes controles ad-
missveis podem atingir a condi c ao de contorno nal em diferentes in-
tervalos de tempo. Este e um problema especial de controle otimo com
tempo nal variavel, em que a fun c ao fun c ao objetivo
_
t
1
t
0
f(t, z, z
t
) dt e
da forma f 1.
A m de garantir a existencia de solu c oes para o problema (P
Tmin
)
(veja o Teorema 46), fazemos a seguinte hipotese sobre a controlabilidade
do sistema (A, B):
H) Existem t
1
t
0
e u U
ad
() tais que a trajetoria correspondente
z
u
satisfaz z
u
(t
1
) = z
1
.
Note que a hipotese H) garante que o conjunto limitado inferiormente
T denido por
T := t
1
t
0
[ u U
ad
() com z
u
(t
1
) = z
1
e n ao vazio. O candidato natural à solu c ao de (P

Tmin
) e formado pelo
par (
t, u), onde

t := inft
1
T e u e o controle correspondente.
Teorema 46. Se a hip otese H) e v alida, ent ao existe um controle ad-
missvel u U
ad
() tal que o estado correspondente z satisfaz z(
t) = z
1
,
onde

t := inft
1
T .
steuer
2008/3/11
page 64
i
i
i
i
i
i
i
i
Demonstra c ao: Seja t
n
uma seq uencia minimal, i.e. t
n

t e u
n
U
ad
()
uma seq uencia de controles de modo que os estados correspondentes sa-
tisfa cam z
n
(t
n
) = z
1
para todo n N. Da identidade
13
z
n
(t
n
) z
n
(
t) =
A
(t
n
, t
0
)z
0
+
_
t
n
t
0
A
(t
n
, s)b(s)u
n
(s) ds

A
(
t, t
0
)z
0

_

t
t
0
A
(
t, s)b(s)u
n
(s) ds,
obtemos a estimativa
[z
1
z
n
(
t)[ = [z
n
(t
n
) z
n
(
t)[
[
A
(t
n
, t
0
)z
0

A
(
t, t
0
)z
0
[
+ [Z(t
n
) Z(
t)[
_

t
t
0
Z
1
(s)b(s)u
n
(s) ds
+ [Z(t
n
)
_
t
n
t
Z
1
(s)b(s)u
n
(s) ds[. (3.14)
Os dois primeiros termos do lado direito de (3.14) convergem a zero
quando n , devido à continuidade de Z(t). O terceiro termo em
(3.14) e limitado por
|Z(t
n
)|
_
t
n
t
c [Z
1
(s)b(s)[ ds,
pois u
n
(t) q.s., que e convexo e compacto por hipotese. Portanto,
este termo tambem converge a zero quando n . Provamos assim
que z
n
(
t) z
1
. Logo, z
1
R(; t
0
, z
0
,
t). Como R(; t

0
, z
0
,
t) e com-
pacto (veja Teorema 38), temos que z
1
R(; t
0
, z
0
,
t), o que implica

na existencia de um u U
ad
() satisfazendo
(t
0
, z
0
)
u
(
t, z
1
).
Corolario 47. Se a hip otese H) e v alida, ent ao existe um controle otimo
do tipo bangbang. Caso exista um unico controle otimo, ele e necessari-
amente do tipo bangbang.
Demonstra c ao: Segue diretamente dos Teoremas 45 e 46.
13
Para detalhes sobre nota c ao veja a Sec c ao A.3.
steuer
2008/3/11
page 65
i
i
i
i
i
i
i
i
[SEC. 3.8: CONTROLABILIDADE DE SISTEMAS LINEARES DISCRETOS 65
Condi c oes necessarias e/ou sucientes para existencia e unicidade de
controles bangbang s ao discutidas em [Kra, Captulo 3].
O Lema 44 e os Teoremas 45 e 46 continuam validos para controles
n ao escalares u(t) R
m
q.s. e sistemas gerais da forma z
t
=
A(t)z +B(t)u(t), com B contnua. As demonstra c oes destes resultados
s ao analogas às aqui apresentadas.
Em [AtFa] s ao discutidas diversas aplica c oes relacionadas com tempo
mnimo, como o oscilador harm onico, o oscilador harm onico amortecido,
cinematica sem atrito (Double-integral plants). Tambem s ao discutidos
problemas de consumo mnimo de combustvel, que se assemelham aos
problemas de tempo mnimo e possuem solu c oes do tipo bang-bang.
Problemas de tempo mnimo para sistemas n ao lineares de primeira
e segunda ordem s ao tambem discutidos em [LeMa] e [Fo2]. Este ultimo
baseia sua argumenta c ao em um resultado devido a A. Feldbaum (1962).
Particularmente interessante e o problema de asfaltamento de uma rua,
discutido (em detalhes) em [Fo2, captulo 7].
3.8 Controlabilidade de Sistemas Lineares Dis-
cretos
Tratamos agora dos sistemas de controle discretos, em particular os
aut onomos. Um sistema aut onomo discreto de controle (A, B) e repre-
sentado pelas equa c oes
(3.15) z
k+1
= Az
k
+ Bu
k
, k = 0, . . . , N 1,
onde A R
n,n
e B R
n,m
. Seguindo a deni c ao feita para sistemas
contnuos, dizemos que o sistema discreto em (3.15) e completamente
control avel quando, para todo par de estados x
0
, x
N
R
n
, existe uma
estrategia de controle u = (u
0
, . . . , u
N1
) R
mN
que satisfaz
(3.16) z
k+1
= Az
k
+ Bu
k
, k = 0, 1, . . . , N 1, z
0
= x
0
, z
N
= x
N
.
Quando uma estrategia de controle u satisfaz (3.16), utilizamos a nota c ao
(0, x
0
)
u
(N, x
N
).
De (3.16) obtemos uma representa c ao para z
N
em fun c ao de z
0
e de u:
x
N
= A
N
x
0
+
N1
i=0
A
Ni1
Bu
i
,
steuer
2008/3/11
page 66
i
i
i
i
i
i
i
i
a qual nos fornece uma importante rela c ao para identicar a controla-
bilidade do sistema discreto em (3.15):
(3.17)
x
N
A
N
x
0
= S(A, B) u, onde S(A, B) = (A
N1
B[ [AB[B).
Teorema 48. Seja (A, B) um sistema discreto de controle e S(A, B) a
matriz denida em (3.17). Se a condi c ao de posto
(3.18) Po (S(A, B)) = Po (A
n1
B[ [AB[B) = n
e satisfeita, ent ao o controle u R
mN
denido por
(3.19) u := S(A, B)
(S(A, B)S(A, B)
)
1
(x
N
A
N
x
0
)
e tal que (0, x
0
)
u
(N, x
N
).
Demonstra c ao: Basta vericar que o controle u em (3.19) satisfaz a
equa c ao (3.17). De fato, S(A, B)S(A, B)
e n ao singular por hipotese e

de (3.19) segue que
S(A, B) u = S(A, B)S(A, B)
(S(A, B)S(A, B)
)
1
(x
N
A
N
x
0
)
= x
N
A
N
x
0
.
A matriz S(A, B)
:= S(A, B)
(S(A, B)S(A, B)
)
1
e conhecida
como pseudo inversa (ou inversa de MoorePenrose) de S(A, B).
14
Uti-
lizando multiplicadores de Lagrange e possvel vericar que o controle
denido em (3.19) e a solu c ao do problema de controle otimo discreto:
_
_
Minimizar
N1
j=0
[u
j
[
2
sujeito a
u
j
R
m
, j = 0, . . . , N 1 ;
z
k+1
= Az
k
+Bu
k
, k = 0, . . . , N 1 ;
z
0
= x
0
, z
N
= x
1
.
Conseguimos assim resolver o problema de controle discreto (3.15) para
uma importante classe de sistemas: aqueles que satisfazem a condi c ao
de posto (3.18). Entretanto, a aplica c ao
S(A, B) S(A, B)
,
14
Para detalhes veja [Gr, Captulo 5], ou ainda [Bar, Captulo 6].
steuer
2008/3/11
page 67
i
i
i
i
i
i
i
i
EXERC
ICIOS 67
que leva uma matriz em sua inversa generalizada, n ao e numericamente
estavel. Este fato torna esta estrategia de calcular a estrategia de cont-
role muitas vezes inviavel na pratica.
Observa cao 49 (Controlabilidade de sistemas nao lineares). En-
cerramos este captulo mencionando uma importante area de pesquisa
atual relacionada a sistemas n ao lineares. Resultados de controlabilidade
local podem ser obtidos atraves da utiliza c ao de tecnicas de lineariza-
c ao de sistemas [So]. Alem disso, utilizando os conceitos de algebras
de Lie de campos vetoriais e de distribui c oes (no sentido da geometria
diferencial), e possvel obter um poderoso resultado (criterio de inte-
grabilidade de Frobenius) que garante que uma distribui c ao de posto
constante e completamente integravel se, e somente se, for involutiva
[So, Captulo 4]. 2
Exerccios
3.1. Dado o sistema (A, B) com
A =
_
0 1
1 0
_
, B =
_
cos t
sin t
_
,
mostre que para todo u R a solu c ao do sistema
z
t
= Az +b(t)u, z(0) = 0
esta na superfcie z
1
sin t z
2
cos t = 0. Conclua da que o sistema n ao
e controlavel em [0, t
1
] para qualquer t
1
> 0.
3.2. Mostre que se uma matriz A possui dois ou mais autovetores linear-
mente independentes associados ao mesmo autovalor, ent ao o sistema
com controle escalar z
t
= Az +bu n ao e controlavel.
3.3. Considere o sistema (A, B) com matrizes
A =
_
2 0
1 1
_
, B =
_
1
1
_
.
a) Mostre que (A, B) n ao e controlavel.
b) Encontre o subespa co n ao controlavel do sistema.
steuer
2008/3/11
page 68
i
i
i
i
i
i
i
i
68 EXERC
ICIOS
3.4. Seja A uma matriz simetrica com autovalores
j
p
j=1
e autovetores
v
j,k
n
p
k=1
, onde n
j
e a multiplicidade de
j
, j = 1, . . . , p (note que n
1
+
+n
p
= n). Seja B a matriz formada pelas colunas b
1
, . . . , b
m
. Mostre
que o sistema (A, B) e controlavel sse
Po
_
_
_
_
_
b
1
, v
j,1
) b
m
, v
j,1
)
b
1
, v
j,2
) b
m
, v
j,2
)
.
.
.
.
.
.
.
.
.
b
1
, v
j,n
j
) b
m
, v
j,n
j
)
_
_
_
_
_
= n
j
, j = 1, . . . , p.
3.5. Conclua do exerccio anterior que, para o sistema (A, B) ser con-
trolavel, e necessario que a dimens ao da variavel de controle seja maior
que todos os n
j
, i.e. m n
j
para j = 1, . . . , p.
3.6. Verique a controlabilidade do sistema (A, B) com
A =
_
1 0
1 1
_
, B =
_
1
1
_
.
Encontre u L
1
([0, 1]; R) tal que (0, 0)
u
(1, e
2
).
3.7. Seja(A, B) um sistema aut onomo com A R
n,n
, B R
n,m
.
a) Mostre que (A, B) e controlavel em [0, T] para todo T > 0 se e
somente se R
n
= M
0
+ +M
n1
, onde M
j
:= Im(A
j
B), j = 1, . . . , n1.
b) Sejam F R
n,n
, G R
m,m
, com det(F) ,= 0, det(G) ,= 0. Mostre
que, se (A, B) e controlavel em [0, T], ent ao o sistema (F
1
AF, F
1
BG)
e tambem controlavel em [0, T].
3.8. Considere um sistema de controle (A, B) com fun c oes matriciais
A C([t
0
, t
1
]; R
n,n
), B C([t
0
, t
1
]; R
n,m
). Dado z
1
R
n
, prove que s ao
equivalentes as arma c oes:
a) Existe u L
1
([t
0
, t
1
]; R
m
) tal que (t
0
, 0)
u
(t
1
, z
1
);
b) z
1
Im(Z(t
0
, t
1
)), onde
Z(t
0
, t
1
) :=
_
t
1
t
0
A
(t
1
, s)B(s)B(s)
A
(t
1
, s)
ds.
Se o sistema (A, B) e aut onomo, mostre ainda que Im(Z(t
0
, t
1
)) =
Im(SS
), onde
S := (B[AB[ [A
n1
B).
steuer
2008/3/11
page 69
i
i
i
i
i
i
i
i
EXERC
ICIOS 69
3.9. Complete os detalhes da demonstra c ao do Teorema 26.
3.10. Considere um sistema aut onomo (A, B), com A R
n,n
,
B R
n,m
.
a) Prove que (A, B) e controlavel em [0, T], para todo T > 0, se e so-
mente se para todo w C
n
autovetor de A
vale B
w ,= 0 (criterio de
Hautus (1969); veja [So]).
b) Prove que (A, B) e controlavel em [0, T], para todo T > 0, se e
somente se
R
n
=
n1
_
j=0
M
j
, onde M
j
:= Im(A
j
B), j = 0, . . . , n 1.
c) Dadas matrizes regulares F R
n,n
, G R
m,m
, mostre que, se (A, B)
e controlavel em [0, T], ent ao (F
1
AF, F
1
BG) e tambem controlavel
em [0, T].
3.11. Dado o sistema (A, B) com matrizes
A =
_
_
1 2 1
0 1 0
1 4 3
_
_
, B =
_
_
0
0
1
_
_
,
encontre uma base para o conjunto de estados atingveis R(; 0) para
= R
m
. (veja Deni c ao 40)
3.12. Verique se os sistemas a seguir s ao controlaveis ao zero:
a) z
tt
+z
t
+z = u; = [1, 1];
b) z
tt
= u; = [1, 1].
3.13. Verique a controlabilidade do sistema no Exemplo 31.
3.14. [Piloto automatico]
15
Suponha que um avi ao voa com veloci-
dade constante c (relativa ao solo). Sejam e os angulos que o eixo do
avi ao faz com a horizontal e com a trajetotia do avi ao respectivamente
(veja Figura 3.1). A altitude do avi ao no tempo t e denotada por h(t).
Se os angulos e s ao pequenos, o deslocamento vertical do avi ao e
modelado pelo sistema n ao linear
t
= a( ),
tt
=
2
( bu), h
t
= c ,
15
Este problema e tambem considerado tambem em [So] e [Tr].
steuer
2008/3/11
page 70
i
i
i
i
i
i
i
i
70 EXERC
ICIOS
h
Figura 3.1: Piloto automatico para controle de altitude

onde a, b, c s ao constantes conhecidas e u corresponde ao controle do
sistema (leme de profundidade). Mostre que o sistema e totalmente
controlavel.
3.15. Considere um sistema de controle (A, B) com fun c oes matriciais
A C([t
0
, t
1
]; R
n,n
) e B C([t
0
, t
1
]; R
n,m
). Suponha que U
ad
e um
subespa co denso de L
1
([t
0
, t
1
]; R
m
). Dado z
1
R
m
, prove que s ao
equivalentes as arma c oes:
a) Existe u L
1
([t
0
, t
1
]; R
m
) tal que (t
0
, 0)
u
(t
1
, z
1
);
b) Existe u U
ad
tal que (t
0
, 0)
u
(t
1
, z
1
);
3.16.

E um fato conhecido da teoria dos espa cos L
p
que o conjunto das
fun c oes C
com suporte compacto em [t

0
, t
1
], denido por
C
0
([t
0
, t
1
]; R
m
) :=v C
([t
0
, t
1
]; R
m
) [ v
(j)
(t
0
) = v
(j)
(t
1
) = 0,
j = 1, 2, . . .,
e denso em L
1
([t
0
, t
1
]; R
m
). Como a equivalencia do Exerccio 3.15 se
deixa interpretar à luz deste resultado?
3.17. Calcule o controle otimo u para o problema proposto no Exem-
plo 36.
steuer
2008/3/11
page 71
i
i
i
i
i
i
i
i
Captulo 4
Estabilidade
Estudamos neste captulo o comportamento em perodos longos de
tempo das solu c oes de sistemas aut onomos de equa c oes diferenciais or-
dinarias (EDOs). O principal interesse esta em determinar se uma
solu c ao (trajetoria) permanece ou n ao limitada e, em caso armativo,
se esta converge assintoticamente para algum ponto de equilbrio.
Na Sec c ao 4.1 e denido o conceito de estabilidade de um ponto de
equilbrio. Na Sec c ao 4.2 s ao discutidas condi c oes necessarias e su-
cientes para estabilidade de sistemas lineares aut onomos. A Sec c ao 4.3
se destina a analisar um criterio algebrico (teorema de Hurwitz) para
garantir estabilidade de matrizes. Na Sec c ao 4.4 consideramos sistemas
obtidos por perturba c oes de sistemas lineares estaveis. As Sec c oes 4.5
e 4.6 tratam do criterio de estabilidade formulado por Lyapunov. Na
Sec c ao 4.7 aplicamos o criterio de Lyapunov a sistemas lineares discretos.
4.1 Conceito e Exemplos
Considere a equa c ao diferencial ordinaria
(4.1) z
t
= f(z),
em que o campo vetorial f satisfaz as seguintes condi c oes:
f : D R
n
, D R
n
aberto; (4.2)
0 D, f(0) = 0; (4.3)
f e continuamente diferenciavel em D. (4.4)
steuer
2008/3/11
page 72
i
i
i
i
i
i
i
i
72 [CAP. 4: ESTABILIDADE
Como o sistema e aut onomo, i.e. o campo vetorial f n ao depende ex-
plicitamente do tempo, podemos sem perda de generalidade estudar as
solu c oes a partir do instante de tempo t
0
= 0. A hipotese (4.4) garante,
para toda condi c ao inicial z
0
R
n
, a existencia de uma solu c ao local
para o problema de valor inicial (PVI):
(4.5) z
t
= f(z), z(0) = z
0
.
Essa solu c ao pode ser prolongada a um intervalo m aximo de existencia,
o qual e aqui representado por
1
J(z
0
) = [0, (z
0
)).
Nesse intervalo a solu c ao e unicamente determinada. Este resultado
e conseq uencia do teorema de PicardLindelo.
2
A chave para esse
resultado e considerar a equa c ao integral associada ao PVI (4.5)
z(t) = z
0
+
_
t
0
f(z(s)) ds, t [0, ],
no espa co C([0, ]; R
n
), onde > 0 e escolhido de forma adequada.
Representamos esta solu c ao maximal por z(, z
0
).
A condi c ao (4.3) garante que 0 e um ponto de equilbrio do sistema,
pois o PVI com condi c ao inicial z
0
= 0 possui apenas a solu c ao z(, z
0
)
0 (repouso). Note que a escolha de 0 como ponto de equilbrio n ao e
restritiva, uma vez que e sempre possvel (atraves de transla c oes) alterar
um campo vetorial de forma a atingir esta congura c ao, desde que o
campo possua apenas um zero.
3
1
Estamos interessados apenas no futuro.
2
Maiores detalhes na literatura especializada em EDO; por exemplo [Sot] ou [Wa2].
3
Na deni c ao a seguir e no resto do texto adotamos a seguinte nota c ao: Para
r 0, temos
B
r
(x) = |v R
n
[ [x v[ < r,

B
r
(x) = |v R
n
[ [x v[ r,
B
r
= B
r
(0),

B
r
=

B
r
(0).
steuer
2008/3/11
page 73
i
i
i
i
i
i
i
i
[SEC. 4.1: CONCEITO E EXEMPLOS 73
Deni cao 50. O ponto de equilbrio z = 0 do sistema (4.1) e denomi-
nado est avel quando:
> 0 > 0 tq z
0
B
( z) = J(z
0
) = [0, )
e z(t, z
0
) B
t 0 ;
e denominado atrativo quando:
> 0 tq z
0
B
( z) = J(z
0
) = [0, ) e lim
t
z(t, z
0
) = 0 ;
e denominado assintoticamente est avel quando e simultaneamente estavel
e atrativo. 2
Exemplo 51. Considere o problema do pendulo n ao linear modelado
pela equa c ao diferencial
x + sin x = 0.
O sistema correspondente e:
z
t
= f(z) com f(z) :=
_
z
2
sin z
1
_
,
cujo campo vetorial e mostrado na Figura 4.1.
E de simples verica c ao o fato dos pontos

_
0
0
_
e
_
k
0
_
, k N,
serem pontos de equilbrio do sistema. Atraves de uma transla c ao, o
ponto de equilbrio (, 0) pode ser levado na origem e ent ao analisado
no sentido da Deni c ao 50.

E intuitivamente claro que os pontos de
equilbrio (0, 0) e (, 0) s ao de natureza diferente. Sem entrar em deta-
lhes, comentamos por hora que (0, 0) e um ponto de equilbrio estavel,
enquanto que (, 0) n ao o e. 2
Exemplo 52. Consideremos agora o conhecido sistema n ao linear de
Lorenz:
(4.6) z
t
= f(z) com f(z) =
_
_
s(z
2
z
1
)
rz
1
z
2
z
1
z
3
z
1
z
2
bz
3
_
_
,
steuer
2008/3/11
page 74
i
i
i
i
i
i
i
i
-4
-2
0
2
4
y
-10 -5 0 5 10
x
Figura 4.1: Campo vetorial de x
tt
+ sin x = 0
onde s, r e b s ao constantes positivas. Este sistema foi utilizado por
Lorenz como modelo de dimens ao nita para um fen omeno fsico (a
convec c ao de RayleighBenard).
Em particular, a escolha dos par ametros s = 10, r = 28 e b = 8/3
gera um atrator estranho, que foi observado numericamente e tem sido
objeto intensivo de estudo de varios grupos de pesquisadores.
4
Para
r > 1, o sistema possui tres pontos de equilbrio:
z =
_
_
0
0
0
_
_
, z =
_
_
_
b(r 1)
_
b(r 1)
r 1
_
_
e z =
_
_
_
b(r 1)
_
b(r 1)
r 1
_
_
.
4
Maiores detalhes por exemplo em [Je].
steuer
2008/3/11
page 75
i
i
i
i
i
i
i
i
[SEC. 4.2: ESTABILIDADE DE SISTEMAS LINEARES 75
A estabilidade destes 3 pontos de equilbrio pode ser analisada quando
conhecemos um pouco melhor a aproxima c ao linear do campo vetorial.
E possvel assim, vericar de forma clara a natureza instavel do sistema.

2
Observa cao 53.

E importante observar que a atratividade n ao implica,
em geral, na estabilidade assintotica. Um exemplo e encontrado no
sistema n ao linear
_
x
t
= (x
2
(y x) +y
5
) / (x
2
+y
2
)(1 + (x
2
+y
2
)
2
)
y
t
= y
2
(y 2x) / (x
2
+y
2
)(1 + (x
2
+y
2
)
2
)
cuja din amica e ilustrada na Figura 4.2. Entretanto, para sistemas
aut onomos, as deni c oes de atratividade e estabilidade assintotica s ao
equivalentes. Tal fato e analisado na proxima sec c ao. Sistemas estaveis
mas n ao atrativos s ao mais faceis de ser encontrados. Considere, por
exemplo, f(z) = Az, onde A corresponde à matriz de rota c ao pelo angulo
de /2. 2
4.2 Estabilidade de Sistemas Lineares
Analisamos nesta sec c ao o importante caso particular do sistema
(4.1) em que a din amica do sistema e descrita pela equa c ao
(4.7) z
t
= A z,
onde A R
n,n
. O objetivo principal e esclarecer a quest ao da estabili-
dade do ponto de equilbrio z = 0. Neste caso e usual referirmo-nos ao
sistema (4.7) como sistema estavel.
Teorema 54. Seja o sistema (4.7). S ao equivalentes as seguintes ar-
ma c oes:
a) O ponto de equilbrio z = 0 e assintoticamente est avel;
b) O ponto de equilbrio z = 0 e atrativo;
c) maxRe() [ e autovalor de A < 0.
Demonstra c ao: a) = b) Segue imediatamente da Deni c ao 50.
b) = c) Suponha que A possui um autovalor = + i com 0.
Se v e um autovetor correspondente, denimos atraves de
z(s) := Re (e
s
v), s 0
steuer
2008/3/11
page 76
i
i
i
i
i
i
i
i
-1.5
-1
-0.5
0
0.5
1
1.5
y
-1 -0.5 0.5 1
x
Figura 4.2: A origem e um ponto de equilbrio atrativo, porem n ao e
estavel
steuer
2008/3/11
page 77
i
i
i
i
i
i
i
i
[SEC. 4.2: ESTABILIDADE DE SISTEMAS LINEARES 77
uma solu c ao que claramente n ao satisfaz lim
t
z(t) = 0.
c) = a) Do Teorema 248 temos que
|e
At
| ce
t
, t 0,
com constantes c 0 e > 0. Observando que a solu c ao do sistema e
z(t, z
0
) = e
At
z
0
, conclumos que z = 0 e assintoticamente estavel.
Observa cao 55. Se o ponto de equilbrio z = 0 e assintoticamente
estavel, podemos concluir do Teorema 54 que todas as solu c oes de (4.7)
convergem exponencialmente para 0 quando t . Esta propriedade
e denominada estabilidade exponencial. Fica claro, portanto, que os
conceitos de estabilidade assintotica e exponencial s ao equivalentes no
caso dos sistemas lineares aut onomos. 2
Observa cao 56. Caso o ponto de equilbrio z = 0 do sistema (4.7) seja
assintoticamente estavel, ent ao o sistema
(4.8) z
t
= A z + b(t), t 0,
e BIBOest avel (Bounded-Input Bounded-Output). Isto e, se b
L
([0, ); R
n
), ent ao toda solu c ao de (4.8) esta tambem em L
([0, );
R
n
). Este fato segue imediatamente da representa c ao da solu c ao para o
problema n ao homogeneo. Tal propriedade e entretanto perdida quando
o ponto de equilbrio z = 0 e somente estavel (veja o proximo exemplo).
2
Exemplo 57. Considere o oscilador harm onico modelado pela equa c ao
diferencial
x + a
2
x = b(t)
e o respectivo sistema
_
z
1
t
z
2
t
_
=
_
0 1
a
2
0
__
z
1
z
2
_
+
_
0
b(t)
_
.
Note que z = 0 e um ponto de equilbrio do sistema
_
z
1
t
z
2
t
_
=
_
0 1
a
2
0
__
z
1
z
2
_
.
Como uma matriz fundamental para esse sistema e dada por
_
sin at cos at
a cos at a sinat
_
, t 0,
steuer
2008/3/11
page 78
i
i
i
i
i
i
i
i
podemos concluir que o ponto de equilbrio e estavel.
Considere agora como inomogeniedade (entrada) a fun c ao limitada
b(t) := cos t. A solu c ao correspondente e dada por
x(t) =
_
t
2
sin t , para = a
1
a
2
2
(cos t cos at) , para ,= a
A interpreta c ao da solu c ao obtida e a seguinte:
Para ,= a, a solu c ao e formada pela composi c ao de duas vibra c oes
com frequencias respectivamente a/2 (frequencia da energia do sis-
tema) e /2 (frequencia da for ca externa).
No caso a = , observamos o fen omeno de resson ancia: com o tempo
o sistema ganha cada vez mais energia e a solu c ao se torna ilimitada. Na
pratica, o sistema acaba sendo destrudo, devido à sobrecarga de energia
acumulada. 2
Observa cao 58. Suponha que no sistema (4.7) tenhamos max Re()[
e autovalor de A = 0. Nesse caso o ponto z = 0 sera estavel exata-
mente quando todos os blocos de Jordan relativos aos autovalores com
Re() = 0 tiverem forma diagonal (por que?). 2
Deni cao 59. Uma matriz M R
n,n
que satisfaz
max Re() [ e autovalor de M < 0.
e denominada matriz est avel. 2
4.3 Criterio de RouthHurwitz
Como sabemos, os autovalores da matriz A R
n,n
do sistema (4.7)
s ao as razes do polin omio caracterstico de A (aqui denominado p
A
).
Suponha que p
A
e da forma
p
A
(r) = r
n
+
n
i=1
a
i
r
ni
.
Pela Deni c ao 59 a matriz A e estavel quando todas as razes de p
a
estiverem no semi-plano esquerdo do plano complexo. Discutimos nesta
sec c ao uma condi c ao necessaria (criterio de RouthHurwitz) para a es-
tabilidade de uma matriz.
steuer
2008/3/11
page 79
i
i
i
i
i
i
i
i
[SEC. 4.3: CRIT
ERIO DE ROUTHHURWITZ 79
Lema 60. Se A e uma matriz est avel, ent ao todos os coecientes
a
1
, . . . , a
n
de p
A
s ao positivos.
Demonstra c ao: Denotando por
k
os autovalores reais de A e por
j
os
autovalores com parte imaginaria n ao nula, temos que
p
A
(r) =
k
(r
k
)
j
(r
2
2Re(
j
)r +[
j
[
2
).
A hipotese da estabilidade de A implica em
k
> 0, 2Re(
j
) > 0.
Provando assim que os coecientes de p
A
s ao positivos.
Uma desvantagem obvia da aplica c ao deste criterio e a necessidade
do conhecimento do polin omio caracterstico p
A
. O exemplo a seguir
mostra que o criterio n ao e suciente para garantir a estabilidade de A.
Exemplo 61. Considere a equa c ao diferencial
x
(3)
+ x
(2)
+ x
(1)
+ x = 0.
O polin omio caracterstico do sistema correspondente e
p(r) = r
3
+ r
2
+ r + 1
e possui razes 1, i. Portanto, o ponto de equilbrio z = 0 do sistema
correspondente e estavel, mas n ao e assintoticamente estavel. 2
Observa cao 62. No caso dos polin omios de grau menor ou igual a 4, e
possvel encontrar condi c oes sucientes para garantir a estabilidade da
matriz A a partir da aplica c ao do teorema fundamental da algebra (veja
[Gon]). De fato, os polin omios
i) r +a
ii) r
2
+ar +b
iii) r
3
+ar
2
+br +c
iv) r
4
+ar
3
+br
2
+cr +d
com coecientes reais possuem apenas razes com parte real negativa se
e somente se as seguintes condi c oes s ao respectivamente satisfeitas:
i
) a > 0
ii
) a > 0, b > 0
iii
) a > 0, b > 0, c > 0 e ab > c

iv
) a > 0, b > 0, c > 0, d > 0 e abc > c

2
+a
2
d.
2
steuer
2008/3/11
page 80
i
i
i
i
i
i
i
i
Exemplo 63. Considere um circuito com um resistor (de resistencia
R), dois indutores (cada um com indut ancia L) e um capacitor (de
capacit ancia C), onde as constantes R, L e C s ao positivas. O problema
e modelado pela equa c ao diferencial escalar
L
2
Cx
(3)
+ RLCx
(2)
+ 2Lx
(1)
+ Rx = 0.
A fun c ao x representa a diferen ca de potencial (DDP). Da Observa c ao 62
segue a estabilidade assintotica do circuito (veja ainda a Observa c ao 55).
2
O proximo passo e a obten c ao de uma condi c ao suciente para o caso
geral de (4.7). O criterio apresentado a seguir foi descoberto por Routh
em 1877. Seja
p(r) = r
n
+
n
i=1
a
i
r
ni
um polin omio com coecientes reais positivos. Dena os polin omios U
e V (com coecientes tambem reais positivos) de modo que
U(r) + iV (r) = p(ir), r R.
Temos ent ao:
Grau de U = n e grau de V = n 1, se n for par;
Grau de U = n 1 e grau de V = n, se n for mpar.
Denimos a partir de U e V os seguintes polin omios:
q
1
:= U, q
2
:= V, se n e par;
q
1
:= V, q
2
:= U, se n e mpar.
q
3
, . . . , q
m
s ao obtidos a partir do algoritmo de divis ao de Euclides
aplicado ao par q
1
, q
2
. Temos assim:
5
q
k1
=
k
q
k
q
k+1
, k = 2, . . . , m1 e q
m1
=
m
q
m
.
Apos esta constru c ao estamos prontos para enunciar o teorema de
Routh.
5
Note que q
m
e (a menos de uma constante) o maior divisor comum de q
1
, q
2
.
steuer
2008/3/11
page 81
i
i
i
i
i
i
i
i
[SEC. 4.4: PERTURBAC
AO DE SISTEMAS LINEARES 81
Teorema 64. Sejam U, V , q
1
, . . . , q
m
denidos como acima. As se-
guintes arma c oes s ao equivalentes:
a) O polin omio p possui apenas razes com Re() < 0;
b) m = n + 1 e os sinais dos coecientes de maior grau de q
1
, . . . , q
n+1
alternam.
A demonstra c ao deste resultado foge aos nossos objetivos e n ao e
apresentada. O leitor interessado pode encontrar em [Gan] uma de-
monstra c ao baseada em um teorema de resduos da analise complexa.
4.4 Perturba cao de Sistemas Lineares
Consideramos nesta sec c ao sistemas da forma
(4.9) z
t
= A z + g(z),
onde A R
n,n
e g : R
n
R
n
. Supomos ainda que as hipoteses em (4.3)
e (4.4) sejam satisfeitas pela fun c ao
f(z) := Az + g(z), z D := R
n
.
O teorema a seguir nos fornece uma condi c ao suciente para garantir
a estabilidade do ponto de equilbrio do sistema (4.9).
Teorema 65. Seja A uma matriz est avel e g : R
n
R
n
uma aplica c ao
satisfazendo lim
[z[0
[g(z)[/[z[ = 0. Ent ao o ponto de equilbrio z = 0 do
sistema (4.9) e assintoticamente est avel.
Demonstra c ao: Das hipoteses temos que
c 0, > 0 tq (|e
At
| ce
2t
), t 0,
> 0 tq ([g(y)[ c
1
[y[), y B
.
Seja z : [0, T) R
n
uma solu c ao local do sistema
z
t
= A z + g(z).
steuer
2008/3/11
page 82
i
i
i
i
i
i
i
i
(A existencia desta solu c ao e garantida pela hipotese (4.4).) Temos ent ao
z(t) = e
At
z(0) +
_
t
0
e
A(ts)
g(z(s)) ds,
[z(t)[ |e
At
| [z(0)[ +
_
t
0
|e
A(ts)
| [g(z(s))[ ds
c e
2t
[z(0)[ +
_
t
0
e
2(ts)
[z(s)[ ds, t [0, T).
Denindo w(t) := e
2t
[z(t)[ para t [0, T), obtemos a estimativa
w(t) c [z(0)[ +
_
t
0
w(s) ds, t [0, T).
Temos agora como resultado do lema de Gronwall (veja Lema 264) que
w(t) c [z(0)[ e
t
, t [0, T),
de onde segue
(4.10) z(t) c [z(0)[ e
t
, t [0, T).
Podemos ent ao concluir que a solu c ao local z pode ser prolongada ao
intervalo [0, ). Logo, a estimativa (4.10) vale para T = e o teorema
ca provado.
Observa cao 66. A import ancia do Teorema 65 e a forma pela qual ele
pode ser aplicado na analise da estabilidade dos pontos de equilbrio dos
sistemas de controle em (4.9):
Expanda o campo vetorial f no ponto de equilbrio z = 0. O
sistema resultante e da forma (4.9), onde A = df(0) e g(z) =
f(z) df(0)g. (A hipotese de g estar denida em todo R
n
n ao
e restritiva, pois na demonstra c ao necessitamos de g somente em
uma vizinhan ca de z = 0.)
Verique se A = df(0) e uma matriz estavel.
A hipotese lim
[z[0
[g(z)[/[z[ = 0 e trivialmente satisfeita, pois f
e suposta continuamente diferenciavel.
steuer
2008/3/11
page 83
i
i
i
i
i
i
i
i
Note, entretanto, que este metodo de lineariza c ao fornece apenas uma
condi c ao suciente para a estabilidade. Tal condi c ao e por demasiado
restritiva e esta longe de ser necessaria (veja o Exemplo 69). 2
Exemplo 67. Aplicamos o metodo de lineariza c ao ao oscilador n ao
linear com amortecimento a > 0, que e descrito pela equa c ao diferencial
x + 2a x + sin x = 0.
O sistema correspondente e:
(4.11) z
t
= f(z) com f(z
1
, z
2
) =
_
z
2
2az
2
sin z
1
_
e a lineariza c ao do sistema no ponto de equilbrio z = 0 nos fornece a
matriz
A = df(0) =
_
0 1
1 2a
_
.
E facil vericar que os autovalores da matriz A s ao:
= a
_
a
2
1.
A matriz A e portanto estavel e o ponto de equilbrio z = 0 e assintotica-
mente estavel. O sistema (4.11) possui ainda outro ponto de equilbrio,
a saber: z = (, 0). A lineariza c ao neste ponto gera a matriz
A = df( z) =
_
0 1
1 2a
_
,
que possui um autovalor com Re() > 0. O Teorema 65 n ao se aplica,
entretanto o ponto de equilbrio z n ao e estavel. Nas Figuras 4.3 e 4.4
e mostrado o campo em vizinhan cas dos pontos z = 0 e z = (, 0),
respectivamente. 2
Exemplo 68. Consideremos novamente o sistema de Lorenz (veja
Exemplo 52), descrito pela equa c ao diferencial
(4.12) z
t
= f(z) com f(z) =
_
_
s(z
2
z
1
)
rz
1
z
2
z
1
z
3
z
1
z
2
bz
3
_
_
,
steuer
2008/3/11
page 84
i
i
i
i
i
i
i
i
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
y
-1 -0.5 0.5 1
x
tt
+ 2ax
t
+ sin x = 0 (para a = 1) em
uma vizinhan ca do ponto z = 0.
steuer
2008/3/11
page 85
i
i
i
i
i
i
i
i
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
y
2 2.5 3 3.5 4
x
tt
+ 2ax
t
+ sin x = 0 (para a = 1) em
uma vizinhan ca do ponto z = (, 0).
steuer
2008/3/11
page 86
i
i
i
i
i
i
i
i
onde s, r e b s ao constantes positivas.

E facil vericar que, para r > 1,
existem tres pontos de equilbrio:
z =
_
_
0
0
0
_
_
, z =
_
_
_
b(r 1)
_
b(r 1)
r 1
_
_
e z =
_
_
_
b(r 1)
_
b(r 1)
r 1
_
_
.
Linearizando o sistema nestes pontos, obtemos respectivamente as ma-
trizes:
A = df( z) =
_
_
s s 0
r 1 0
0 0 b
_
_
,
A = df( z) =
_
_
s s 0
1 1
_
b(r 1)
_
b(r 1)
_
b(r 1) b
_
_
,
e
A = df( z) =
_
_
s s 0
1 1
_
b(r 1)
_
b(r 1)
_
b(r 1) b
_
_
.
Para o ponto de equilbrio z obtemos o polin omio caracterstico
p() = ( +b) (
2
+ (s + 1) s(r 1)),
o qual possui duas razes negativas e uma positiva. Portanto, a estabi-
lidade numa vizinhan ca de z e improvavel.
Os pontos de equilbrio z e z est ao associados ao mesmo polin omio
caracterstico:
p() =
3
+ (s + 1 +b)
2
+b(s +r) + 2bs(r 1).
O criterio de RouthHurwitz e aplicavel quando
6
(s + 1 +b)b(s +r) 2bs(r 1) > 0
Este e o caso se
s > b + 1 , r < r
c
:= s
s + 3 +b
s b 1
,
6
Veja Observa c ao 62.
steuer
2008/3/11
page 87
i
i
i
i
i
i
i
i
[SEC. 4.5: M
ETODO DE LYAPUNOV 87
0
10
20
30
40
-20
-10
0
10
20
-15
-10
-5
0
5
10
15
20
Figura 4.5:

Orbita do atrator de Lorenz (4.12) para os par ametros s =
10, r = 28 e b = 8/3; condi c ao inicial: z(0) = (0.1, 0.1, 0.1).
quando ent ao podemos concluir que os pontos de equilbrio z e z s ao
assintoticamente estaveis. Para os valores especiais s = 10, r = 28 e
b = 8/3, temos r > r
c
24.74 e os tres pontos de equilbrio n ao mais
s ao estaveis. Entretanto, os polin omios caractersticos de z e z ainda
possuem uma raiz negativa, fato que contribui para o comportamento
mpar das orbitas do sistema (veja Figura 4.5). 2
4.5 Metodo de Lyapunov
Um metodo eciente de se vericar a estabilidade e o desenvolvido
por A.M. Lyapunov (1893). O metodo trata de sistemas n ao lineares da
forma (4.1) e se baseia na analise de autovalores. Analisamos a seguir
um exemplo que serve de motiva c ao para o metodo apresentado nesta
sec c ao.
steuer
2008/3/11
page 88
i
i
i
i
i
i
i
i
Exemplo 69. Considere o sistema
(4.13) z
t
= f(z) com f(z
1
, z
2
) =
_
3z
2
z
1
5
2z
2
+z
1
5
_
.
Os autovalores da matriz A = df(0) s ao 0 e 2. Logo, A n ao e uma
matriz estavel e a quest ao da estabilidade do ponto de equilbrio 0 per-
manece em aberto.
Dena V (z
1
, z
2
) := z
1
6
+ 9z
2
2
e seja z = (z
1
, z
2
) R
2
uma solu c ao
do sistema (4.13). Temos ent ao
d
dt
V (z
1
(t), z
2
(t)) = 6z
1
(t)
10
36z
2
(t)
2
0,
de onde segue
0 V (z
1
(t), z
2
(t))
= V (z
1
(0), z
2
(0))
_
t
0
(6z
1
(s)
10
+ 36z
2
(s)
2
) ds, t 0.
A estabilidade do ponto de equilbrio 0 e agora uma conseq uencia direta
desta desigualdade. Alem disto, temos ainda que lim
t
z(t) = 0. De
fato, como a fun c ao t V (z
1
(t), z
2
(t)) e monotona n ao crescente, existe
o limite a := lim
t
V (z
1
(t), z
2
(t)).
Como V (z
1
, z
2
) = 0 se e somente se (z
1
, z
2
) = 0, basta vericar que
a = 0. Suponha por contradi c ao que a > 0. Temos ent ao que
0 < a V (z
1
(t), z
2
(t)) V (z
1
(0), z
2
(0)), t 0.
Dena
m := inf6z
1
10
+ 36z
2
2
[ (z
1
, z
2
) R
2
; a V (z
1
, z
2
) V (z
1
(0), z
2
(0)).
Como V e contnua, temos que m > 0. Para t 0 temos agora
0 V (z
1
(t), z
2
(t)) V (z
1
(0), z
2
(0)) m
_
t
0
dt
= V (z
1
(0), z
2
(0)) mt.
Como o lado direito da ultima express ao se torna negativo para t su-
cientemente grande, chegamos à desejada contradi c ao. 2
steuer
2008/3/11
page 89
i
i
i
i
i
i
i
i
[SEC. 4.5: M
Deni cao 70. Uma fun c ao V : U R, onde U e uma vizinhan ca
qualquer de z = 0, e denominada fun c ao de Lyapunov para o sistema
z
t
= f(z) quando satisfaz:
i) V e contnua em U e continuamente diferenciavel em U0;
ii) V (0) = 0, V (x) > 0 para todo x U, x ,= 0;
iii) V (x), f(x)) 0 para todo x U0.
V e denominada fun c ao de Lyapunov estrita quando, ao inves da condi c ao
iii), satiszer:
iii
) V (x), f(x)) < 0 para todo x U0.

2
Teorema 71. Seja U uma vizinhan ca qualquer de z = 0 e V : U R
uma fun c ao de Lyapunov para o sistema z
t
= f(z). S ao verdadeiras as
armativas:
a) z = 0 e um ponto de equilbrio est avel ;
b) z = 0 e um ponto de equilbrio atrativo se e somente se existe
vizinhan ca W de 0 de modo que a solu c ao estacion aria e a unica
solu c ao z : [0, ) U de z
t
= f(z) com z(0) W e
d
dt
V (z(t)) =
0, t [0, ).
Demonstra c ao: Provamos primeiro o item a). Seja r > 0 tal que B
2r

U. Dena := minV (x) [ [x[ = r e U
:= x U [ V (x) <

B
r

B
r
. Ent ao > 0 e a continuidade de V implica que U
,= e que U
e
uma vizinhan ca de 0. Seja z uma solu c ao de
z
t
= f(z), z(0) = z
0
U
.
Temos ent ao V (z(0)) < e
(4.14)
d
dt
V (z(t)) = V (z(t)), z
t
(t))
= V (z(t)), f(z)) 0, t [0, (z
0
)),
onde (z
0
) e o maior real que satisfaz z(t)

B
r
, t [0, (z
0
)]. Se
existisse t
1
(0, (z
0
)] tal que [z(t
1
)[ = r, teramos
V (z(0)) < V (z(t
1
))
steuer
2008/3/11
page 90
i
i
i
i
i
i
i
i
pela deni c ao de e
V (z(t
1
)) V (z(0))
como conseq uencia de (4.14), nos levando a uma contradi c ao. Portanto,
temos necessariamente z(t) B
r
, para todo t [0, (z
0
)]. Isto porem
contradiz a maximalidade do intervalo [0, (z
0
)], provando assim que
(z
0
) = e z(t) B
r
para todo t [0, ). Fica assim provado que
z = 0 e um ponto de equilbrio estavel.
Provamos agora b). Dena inicialmente W := U
.
(=) Como z e atrativo, existe > 0 tal que, para todo z
0
B
, a
solu c ao correspondente z(, z
0
) converge para z quando t . Caso
W , B
, redena W := U
. Seja z : [0, ) U uma solu c ao de

z
t
= f(z); z(0) = z
0
W satisfazendo
d
dt
V (z(t)) = 0, t [0, ). Temos
ent ao
V (z(0)) = lim
t
V (z(t)) = V ( lim
t
z(t)) = V (0) = 0.
Logo, z(0) = 0 e de V (z(t)) = V (z(0)), t, conclumos que z(t) = 0, t
[0, ).
(=) Seja z uma solu c ao de z
t
= f(z) com z(0) W. Do item a) temos
que z : [0, ) B
r
. Logo, para toda seq uencia (t
n
)
nN
com lim
n
t
n
=
, a seq uencia (z(t
n
))
nN
possui uma subseq uencia convergente. Para
provar que 0 e um ponto de equilbrio atrativo, basta vericarmos que
o limite lim
n
z(t
n
) e sempre 0. Suponhamos por contradi c ao que existe
uma seq uencia (t
n
)
nN
com limt
n
= e lim
n
z(t
n
) = z ,= 0. Se
[ z[ = r chegaramos (como em a)) à contradi c ao: V (z(0)) < V ( z)
e V ( z) V (z(0)). Logo z B
r
. Note ainda que a hipotese V ( z) =
implica na mesma contradi c ao acima. Logo V ( z) < e portanto z
U
= x U [ V (x) <

B
r
.
Considere agora a solu c ao z do sistema
z
t
= f( z), z(0) = z.
Do item a) temos que
z : [0, ) B
r
,
Como z ,= 0 e V ( z(t)) e monotona n ao crescente, ent ao V ( z(t))
V ( z(0)) = V ( z), t. Caso a igualdade sempre se vericasse, a hipotese
em b) implicaria em z(t) 0 e z = 0. Portanto, existe um > 0 com
V ( z()) < V ( z).
steuer
2008/3/11
page 91
i
i
i
i
i
i
i
i
[SEC. 4.5: M
A equa c ao diferencial e aut onoma, logo as fun c oes z
n
: [0, ) R
n
denidas por z
n
(t) := z(t
n
+ t) s ao solu c oes respectivamente de z
t
n
=
f(z
n
), z
n
(0) = z(t
n
). Como lim
n
z(t
n
) = z, segue do Lema 266 que
lim
n
[z
n
(t) z(t)[ = lim
n
[z(t
n
+t) z(t)[ = 0, t [0, ].
Isto e, lim
n
z
n
(t) = z(t), t [0, ]. Temos, portanto,
lim
n
V (z(t
n
+)) = V ( z()) < V ( z).
Isto porem e um absurdo, pois sendo V (z(t)) monotona n ao crescente, e
possvel encontrar, para todo n N, um m N tal que V (z(t
n
+))
V (z(t
m
)) V ( z) = lim
n
V (z(t
n
)).
Corolario 72 (Lyapunov). Seja V uma fun c ao de Lyapunov estrita
em U, uma vizinhan ca de 0, para o sistema z
t
= f(z). Ent ao, o ponto
de equilbrio z = 0 e assintoticamente est avel.
Demonstra c ao: O Teorema 71 a) garante estabilidade de z em alguma
vizinhan ca B
r
U. Note agora que, para toda solu c ao de z
t
= f(z)
que permanece em B
r
para t 0, a aplica c ao t V (z(t)) e monotona
estritamente decrescente. Portanto, a unica dentre essas solu c oes que
satisfaz
d
dt
V (z(t)) = 0, t 0 e a solu c ao estacionaria z(t) 0. Do
Teorema 71 b) segue que z e atrativo.
Exemplo 73. Considere novamente o sistema n ao linear
z
t
= f(z) com f(z
1
, z
2
) =
_
3z
2
z
1
5
2z
2
+z
1
5
_
.
No Exemplo 69 introduzimos a fun c ao de Lyapunov estrita
V (z
1
, z
2
) := z
1
6
+ 9z
2
2
, (z
1
, z
2
) R
2
a m de analisar este sistema. Podemos agora concluir diretamente do
Corolario 72 que o ponto de equilbrio z = 0 e assintoticamente estavel.
2
Exemplo 74. Considere a equa c ao diferencial para o circuito eletrico
RLC:
CL x + RC x +x = 0,
steuer
2008/3/11
page 92
i
i
i
i
i
i
i
i
cujo sistema associado e
z
t
= f(z) com f(z
1
, z
2
) =
_
0 1
[LC]
1
RL
1
_ _
z
1
z
2
_
,
onde R, L e C s ao constantes positivas. Uma fun c ao de Lyapunov para
este sistema e
V (z
1
, z
2
) := Lz
2
2
+ C
1
z
1
2
, (z
1
, z
2
) R
2
,
de onde calculamos
V (z
1
, z
2
), f(z
1
, z
2
)) = 2Rz
2
2
, (z
1
, z
2
) R
2
.
Logo, V n ao e uma fun c ao de Lyapunov estrita e o Teorema 71 a) garante
que z = 0 e estavel. Note porem que a condi c ao 2Rz
2
(t)
2
= 0, para
todo t 0, implica em z
2
(t) = z
t
2
(t) = 0, t 0. Da equa c ao diferencial
temos ent ao z
1
(t) = 0, t 0. Assim sendo, o Teorema 71 b) garante que
z = 0 e tambem atrativo e, portanto, assintoticamente estavel. 2
Exemplo 75. Considere agora o sistema
z
t
= f(z) com f(z
1
, z
2
) =
_
0 1
1 0
_ _
z
1
z
2
_
.
Uma fun c ao de Lyapunov e dada por V (z
1
, z
2
) = z
1
2
+z
2
2
. O Teorema 71
garante que z = 0 e um ponto de equilbrio estavel mas n ao atrativo
(verique!). 2
4.6 Equacao Matricial de Lyapunov
Iniciamos esta sec c ao recordando alguns importantes conceitos da
algebra linear, relacionados com os autovalores de uma matriz.
Deni cao 76. Uma matriz simetrica M R
n,n
e denominada
Positiva denida quando x, Mx) > 0, para todo x R
n
, x ,= 0;
Positiva semi-denida quando x, Mx) 0, para todo x R
n
;
Negativa denida quando M e positiva denida. 2
No lema a seguir apresentamos a solu c ao de uma equa c ao matricial
que e fundamental para a formula c ao do criterio de Lyapunov.
steuer
2008/3/11
page 93
i
i
i
i
i
i
i
i
[SEC. 4.6: EQUAC
AO MATRICIAL DE LYAPUNOV 93
Lema 77. Sejam U R
n,n
, V R
m,m
e W R
n,m
. Se U e V s ao
matrizes est aveis, ent ao a solu c ao unica da equa c ao matricial
UX + XV + W = 0 (X R
n,m
)
e a matriz est avel X denida por
X :=
_

0
e
tU
We
tV
dt.
Demonstra c ao: Do Teorema 248 e da hipotese, temos que existem cons-
tantes c 0 e > 0 tais que
|e
tU
| ce
t
, |e
tV
| ce
t
, t 0.
Note que para T > 0, temos
e
TU
We
TV
W =
_
T
0
d
dt
(e
tU
We
tV
) dt
=
_
T
0
(Ue
tU
We
tV
+e
tU
WV e
tV
) dt
=
_
T
0
(Ue
tU
We
tV
+e
tU
We
tV
V ) dt.
Tomando o limite quando T , temos que
X =
_

0
e
tU
We
tV
dt
e solu c ao da equa c ao matricial W = UX+XV , cando assim provada
a existencia de solu c oes. Para provar unicidade, suponha que X
1
, X
2
s ao ambas solu c oes de UX+XV +W = 0 e dena

X := X
1
X
2
. Logo,
X R
n,m
e solu c ao de
U

X +

XV = 0.
Temos ent ao
d
dt
(e
tU

Xe
tV
) = e
tU
(U

X +

XV )e
tV
= 0
e portanto,
e
tU

Xe
tV
= e
0U

Xe
0V
=

X.
Tomando o limite quando t , obtemos

X = 0.
steuer
2008/3/11
page 94
i
i
i
i
i
i
i
i
No teorema a seguir e apresentada uma equa c ao matricial, que fornece
uma forma equivalente de denir a estabilidade de uma matriz.
Teorema 78. Dada uma matriz A R
n,n
, s ao equivalentes as as
seguintes arma c oes:
a) A e uma matriz est avel;
b) Existe uma matriz positiva denida P R
n,n
tal que
(4.15) A
P + PA = I.
Demonstra c ao: Se a matriz A e estavel, a existencia de P segue do
Lema 77 com U = A
, V = A e X = P. Reciprocamente, se P satisfaz
a equa c ao (4.15), dena
V (x) := x, Px), x R
n
.
Logo, a fun c ao diferenciavel V satisfaz V (0) = 0, V (x) > 0, x ,= 0 e
ainda
V (x), Ax) = Px +P
x, Ax)
= A
Px, x) + x, PAx)
= (A
P +PA)x, x)
= x, x).
Isto e, V e uma fun c ao de Lyapunov estrita. O Corolario 72 implica que
o ponto de equilbrio z = 0 e assintoticamente estavel. O Teorema 54
garante por m que os autovalores de A possuem parte real estritamente
negativa.
Observa cao 79. No Teorema 78, a equa c ao (4.15) pode ser substituda
pela exigencia de A
P +PA ser negativa denida. 2

Teorema 80. Sejam A, X, W R
n,n
e C R
l,n
matrizes satisfazendo
A
X +XA = W;
W C
C e positiva semi-denida;
(A, , C) e observ avel.
Ent ao a matriz A e est avel se X for positiva denida.
steuer
2008/3/11
page 95
i
i
i
i
i
i
i
i
[SEC. 4.6: EQUAC
AO MATRICIAL DE LYAPUNOV 95
Demonstra c ao: (=) Seja A uma matriz estavel. Do Lema 77 temos
que X =
_
0
e
tA
We
tA
dt. Logo, para x R
n
temos
x, Xx) =
_

0
e
tA
x, We
tA
x) dt
_

0
e
tA
x, C
Ce
tA
x) dt
=
_

0
[Ce
tA
x[
2
dt.
Como (A, , C) e observavel, conclumos que Ce
tA
x = 0, t 0 se x = 0.
7
O que prova que X e positiva denida.
(=) Suponha X positiva denida. Dena como na demonstra c ao do
Teorema 78 a fun c ao
V (x) := x, Xx), x R
n
.
Como W C
C e positiva semi-denida, ent ao W tambem o e. Logo,

V e uma fun c ao de Lyapunov, pois V (z(t)), Az(t)) = z, Wz) (veja
Observa c ao 79). Seja agora z uma solu c ao de z
t
= Az com
d
dt
V (z(t)) =
0, t 0. Temos ent ao
0 =
d
dt
V (z(t)) = z(t), Wz(t)).
Logo,
0 z(t), (W C
C)z(t)) = Cz(t), Cz(t)), t 0.

Portanto, Cz(t) = 0, t 0, e da observabilidade de (A, , C) temos
z(0) = 0. O Teorema 71 b) garante que o ponto de equilbrio z =
0 e assintoticamente estavel e do Teorema 54 segue a estabilidade da
matriz A.
A equa c ao matricial (4.15) e denominada equa c ao matricial de Lya-
punov. Igualmente interessante na analise da estabilidade de sistemas
n ao lineares e o criterio de Popow, que fornece condi c oes sucientes para
garantir a estabilidade absoluta de sistemas de loop fechado. Para deta-
lhes sobre o conceito de estabilidade absoluta e sobre o criterio de Popow
veja [Fo3].
7
Veja Deni c ao 6.
steuer
2008/3/11
page 96
i
i
i
i
i
i
i
i
4.7 Estabilidade de Sistemas Lineares Discretos
Uma analise de estabilidade semelhante à realizada na Sec c ao 4.2
para problemas contnuos pode ser estendida para sistemas de evolu c ao
discretos da forma
(4.16) x
k+1
= Ax
k
, k = 0, 1, . . .
onde A R
n,n
e x
k
R
n
, k 0.
Deni cao 81. O ponto de equilbrio x = 0 do sistema (4.16) e denomi-
nado:
est avel quando: dado > 0, para todo x
0
B
, temos x
k
B
, k =
1, 2, . . .
atrativo quando: para todo x
0
R
n
, temos lim
k
x
k
= 0. 2
Como nos sistemas contnuos aut onomos, a atratividade implica na
estabilidade. A analise da estabilidade de tais sistemas e bastante sim-
ples e e esclarecida com os seguintes lemas:
Lema 82. Dado um sistema linear discreto da forma (4.16), s ao equi-
valentes as arma c oes:
a) O ponto de equilbrio x = 0 e atrativo;
b) O operador A considerado como elemento do espa co L(R
n
, R
n
) e
contrativo, i.e.
|A| := sup
xR
n
\0
|Ax|
|x|
< 1.
Demonstra c ao: a) = b) Seja um autovalor de A e x
0
o respectivo
autovetor. Logo, x
k
= A
k
x
0
=
k
x
0
. Da hipotese temos agora
lim
k
[[
k
|x
0
| = 0,
o que implica em < 1. Como e arbitrario, b) ca provado.
b) = a) Dado x
0
R
n
, temos da hipotese
lim
k
|x
k
| |x
0
| lim
k
|A|
k
= 0
e o teorema ca provado.
steuer
2008/3/11
page 97
i
i
i
i
i
i
i
i
[SEC. 4.7: ESTABILIDADE DE SISTEMAS LINEARES DISCRETOS 97
No que se refere à verica c ao da estabilidade do ponto de equilbrio
de (4.16) temos o lema a seguir, que por sua semelhan ca com o Lema 82
e deixado para o leitor como exerccio.
Lema 83. Dado o sistema linear discreto (4.16), s ao equivalentes as
arma c oes:
a) O ponto de equilbrio x = 0 e est avel;
b) O operador A considerado como elemento do espa co L(R
n
, R
n
) e n ao
expansivo, i.e.
|A| := sup
xR
n
\0
|Ax|
|x|
1.
O criterio de Lyapunov tambem se aplica a sistemas discretos, com
a nalidade de estabelecer condi c oes sucientes para estabilidade.
Deni cao 84. Uma fun c ao V : R
n
R e denominada fun c ao de Lya-
punov quadr atica para o sistema x
k+1
= Ax
k
quando satisfaz:
i) V e da forma: V (x) = x, Px), com P positiva denida;
ii) V (Ax) < V (x) para todo x R
n
0.
2
Lema 85. Seja V uma fun c ao de Lyapunov quadr atica para o sistema
(4.16). Ent ao o ponto de equilbrio x = 0 e atrativo.
Demonstra c ao: Seja um autovalor de A e x o respectivo autovetor.
Por hipotese temos
[[
2
x, Px) = Ax, PAx) < x, Px),
provando assim que [[ < 1. Como e arbitrario, o lema ca provado.
Do Lema 85, obtemos para sistemas discretos um resultado analogo
ao Teorema 78.
Lema 86. O ponto de equilbrio x = 0 do sistema x
k+1
= Ax
k
e atrativo
se e somente se existe matriz denida positiva P tal que A
PA P e
negativa denida.
Demonstra c ao: (=) Como |A| < 1, e facil vericar que P = I (a
matriz identidade) e tal que A
PAP e negativa denida. (Na verdade

para qualquer matriz positiva denida P a express ao acima e negativa
steuer
2008/3/11
page 98
i
i
i
i
i
i
i
i
98 EXERC
ICIOS
denida.)
(=) Basta observar que V (x) := x, Px) dene uma fun c ao de Lya-
punov quadratica para o sistema.
A equa c ao A
PAP = I e denominada equa c ao matricial discreta

de Lyapunov.
Corolario 87. Se o ponto de equilbrio x = 0 do sistema x
k+1
= Ax
k
e atrativo, ent ao existe uma fun c ao de Lyapunov quadr atica para o sis-
tema.
Demonstra c ao: Segue imediatamente do Lema 86.
Exerccios
4.1. Verique que o ponto de equilbrio do sistema no Exemplo 75 e
estavel mas n ao atrativo.
4.2. Considere o sistema do oscilador n ao linear amortecido (veja
Exemplo 67)
x
1
= x
2
, x
2
= x
2
sin(x
1
),
onde > 0 e > 0 s ao constantes.
a) Mostre que V (x
1
, x
2
) := 2
1
x
2
2
cos x
1
e uma fun c ao de Lyapunov
para o sistema;
b) Verique que todas as solu c oes do sistema possuem intervalo de
existencia [0, );
c) Prove que toda solu c ao (x
1
, x
2
) do sistema satisfaz
lim
t
(x
1
(t), x
2
(t)) = (2k, 0),
onde k N depende da condi c ao inicial (x
1
(0), x
2
(0)).
4.3. Encontre para o sistema
x
1
= x
2
, x
2
= x
1
+ 2x
3
1
x
2
uma fun c ao de Lyapunov da forma
V (x
1
, x
2
) = a
11
x
2
1
+ 2a
12
x
1
x
2
+a
22
x
2
2
,
provando assim que a origem e um ponto de equilbrio assintoticamente
estavel.
steuer
2008/3/11
page 99
i
i
i
i
i
i
i
i
EXERC
ICIOS 99
4.4. Encontre para o sistema
x
1
= x
1
+ 2x
1
x
2
, x
2
= x
2
+x
3
, x
3
= x
2
4x
3
uma fun c ao de Lyapunov da forma
V (x
1
, x
2
, x
3
) = a
11
x
2
1
+a
22
x
2
2
+a
33
x
2
3
+2a
12
x
1
x
2
+2a
23
x
2
x
3
+2a
13
x
1
x
3
.
4.5. Complete os detalhes da demonstra c ao do Lema 83.
4.6. Para sistemas n ao aut onomos, o metodo de lineariza c ao n ao pode,
via de regra, ser utilizado na analise de estabilidade. Tal fato se torna
claro mesmo para sistemas lineares. Considere o sistema z
t
= A(t) z,
com
A(t) =
_
1 2 cos 4t 2 + 2 sin 4t
2 + 2 sin 4t 1 + 2 cos 4t
_
.
a) Calcule os autovalores de A(t);
b) Mostre que a origem e um ponto de equilbrio instavel;
(Dica: Observe que a equa c ao diferencial possui uma solu c ao da forma:
e
t+it
.)
4.7. O que se pode armar, a partir do metodo de lineariza c ao, sobre a
estabilidade do ponto de equilbrio (0, 0, 0) do sistema no Exerccio 4.4?
4.8. Considere novamente o oscilador harm oninco ( > 0, > 0)
x +F
( x) +x = 0, com F
(s) :=
_
, s > 0
, s < 0
a) Fa ca um esbo co da famlia de solu c oes no plano (x, x);
b) Encontre os pontos de equilbrio (x, x) do sistema.
4.9. Considere o sistema ( > 0, b > 0)
x = U(t), com U(t) :=
_
b, t > 0
b, t < 0
a) Fa ca um esbo co da famlia de solu c oes no plano (x, x);
b) Mostre que existem solu c oes periodicas e calcule o perodo da orbita.
steuer
2008/3/11
page 100
i
i
i
i
i
i
i
i
100 EXERC
ICIOS
4.10. Mostre que a matriz
A =
_
_
1 1 1
1 1 1
1 1 0
_
_
e positiva indenida, i.e. n ao e nem positiva denida nem negativa
denida.
4.11. Considere o sistema
x
1
= 3x
2
, x
2
= x
1
+ 4x
2
.
a) Mostre que o ponto de equilbrio (0, 0) e assintoticamente estavel;
b) Prove que V (x
1
, x
2
) :=
5
3
x
2
1
+2x
1
x
2
+x
2
2
e uma fun c ao de Lyapunov
estrita;
c) Considere a solu c ao correspondente à condi c ao inicial x
1
(0) = 0,
x
2
(0) = 2. Estime o tempo t
s
> 0 em que a solu c ao (x
1
, x
2
) alcan ca a
regi ao x
2
1
+x
2
2
0.02.
(Dica: Encontre a > 0 com

V (x) aV (x).)
4.12. Prove que o polin omio p(t) = t
3
+ 6r
2
+ 12r + 9 possui somente
raizes com parte real negativa.
4.13. Seja A R
n,n
e R. Prove a equivalencia das arma c oes
abaixo:
a) max Re() [ e autovalor de A < ;
b) Para cada matriz positiva denida W R
n,n
, a equa c ao matricial
A
W +XA+ 2X = W
possui uma unica solu c ao positiva denida X.
steuer
2008/3/11
page 101
i
i
i
i
i
i
i
i
Captulo 5
Estabilizacao
Neste captulo utilizamos o conceito de estabilidade introduzido no
Captulo 4 e analisamos a seguinte quest ao: Como e quando e possvel
tornar estavel um sistema de controle. Tal tarefa, denominada de estabi-
liza c ao, tem se mostrado nos ultimos anos como uma das aplica c oes mais
importantes da teoria de controle em problemas de engenharia e tecnolo-
gia. A forma classica de realiza-la e obter a entrada (ou controle) a partir
do estado ou da sada do sistema. Falamos ent ao de realimenta c ao de
estado ou de sada. A quest ao da estabiliza c ao permite abordagens tanto
qualitativas quanto quantitativas, ambas aqui discutidas.
Na Sec c ao 5.1, denimos os sistemas lineares estabilizaveis e dis-
cutimos um resultado sobre estabiliza c ao de sistemas aut onomos con-
trolaveis. A seguir e analisada uma condi c ao necessaria e suciente para
estabiliza c ao de sistemas aut onomos. Na Sec c ao 5.2, consideramos o pro-
blema quantitativo relacionado à estabiliza c ao. O metodo de coloca c ao
de polos nos fornece uma estratetiga de estabiliza c ao, na qual e possvel
escolher o grau de estabilidade do sistema estabilizado. Na Sec c ao 5.3 e
apresentada a estrategia de Luenberger (observador din amico), atraves
da qual o estado de um sistema paralelo e utilizado para estabilizar o
sistema dado. Na Sec c ao 5.4 e discutido um metodo de estabiliza c ao
que combina o observador din amico com a realimenta c ao de sada. Na
Sec c ao 5.5 consideramos o problema de estabilizar o ponto de opera c ao
(desconhecido) de um sistema linear.
steuer
2008/3/11
page 102
i
i
i
i
i
i
i
i
102 [CAP. 5: ESTABILIZAC
AO
Em aplica c oes s ao utilizadas essencialmente estrategias de realimen-
ta c ao de sada e de realimenta c ao de estado, com o objetivo de alterar
a din amica do sistema livre (sem controle) obtendo determinadas pro-
priedades, que podem ser:
BIBOestabilidade; (qualitativo)
Estabilidade assintotica; (qualitativo)
Acelera c ao do retorno ao ponto de equilbrio. (quantitativo)
No caso dos sistemas de controle lineares aut onomos, as propriedades
acima est ao intrinsecamente relacionadas com os autovalores da matriz
do sistema. Dadas A R
n,n
e B R
n,m
, considere o sistema de controle
(5.1) z
t
= Az + Bu.
Supondo que o controle u e obtido a partir do estado z por uma lei
linear, escrevemos
u = F z,
onde F R
m,n
. Substituindo em (5.1), obtemos
(5.2) z
t
= (A+BF) z.
A m de tornar o ponto de equilbrio z = 0 assintoticamente estavel,
devemos escolher F de modo que A+BF seja uma matriz estavel (veja
Deni c ao 59).
Deni cao 88. O sistema de controle (A, B) e denominado estabiliz avel
quando existe F R
m,n
tal que a matriz A+BF R
n,n
e estavel. 2
O sistema (5.1), quando escrito com o controle de malha fechada,
toma a forma (A+BF, B). Como foi visto no Lema 32, a controlabilidade
de (A, B) implica na controlabilidade de (A + BF, B). Este argumento
nos leva ao seguinte teorema:
Teorema 89. Seja (A, B) e um sistema aut onomo control avel. Ent ao
(A, B) e estabiliz avel pela matriz de realimenta c ao
F := B
W
1
T
,
steuer
2008/3/11
page 103
i
i
i
i
i
i
i
i
onde
W
T
:=
_
T
0
e
tA
BB
e
tA
dt, T > 0.
Demonstra c ao: A ideia e uilizar o Teorema 80 com
(A, , C) = ((A+BF)
, , B
) e X = W
T
.
Para garantir a estabilidade de (A + BF) ou equivalentemente de
(A+BF)
basta vericar que:

(1) W
T
e positiva denida;
(2) ((A+BF)
, , B
) e observavel;
(3) W := (A+BF)W
T
W
T
(A+BF)
e tal que
W BB
e positiva semi-denida.
(1) Por constru c ao, W
T
e positiva semi-denida. O Teorema 26 garante
que W
T
e n ao singular para T > 0. Logo, W
T
e positiva denida.
(2) Como (A, B) e controlavel, (A, B) tambem o e. O Teorema 32
garante agora a controlabilidade de ((A + BF), B). Por m, do Teo-
rema 24 segue a observabilidade de ((A+BF)
, , B
).
(3) Observe que
(A+BF)W
T
+W
T
(A+BF)
= AW
T
BB
+W
T
A
BB
=
_
T
0
d
dt
(e
tA
BB
e
tA
) dt 2BB
= e
TA
BB
e
TA
+BB
2BB
= e
TA
BB
e
TA
BB
.
Chegamos assim à identidade
W = e
TA
BB
e
TA
+BB
,
a qual nos permite concluir que W BB
e positiva semi-denida.
Observa cao 90. O Teorema 89 garante que sistemas aut onomos con-
trolaveis s ao estabilizaveis por realimenta c ao de estado. A recproca
entretanto n ao e verdadeira, conforme podemos vericar no seguinte
exemplo trivial:
_
A matriz estavel, B = 0
z
t
= Az + Bu
2
steuer
2008/3/11
page 104
i
i
i
i
i
i
i
i
AO
A m de esclarecer a quest ao levantada na Observa c ao 90, investi-
gamos condi c oes sucientes para garantir a controlabilidade de sistemas
estabilizaveis. Este e o objetivo do teorema
Teorema 91. Seja (A, B) um sistema aut onomo de controle. Ent ao
(A, B) e control avel se e somente se (A, B) e (A, B) s ao ambos es-
tabiliz aveis.
Demonstra c ao: Seja (A, B) controlavel. Ent ao (A, B) e controlavel
e a estabilidade de (A, B) e (A, B) segue do Teorema 89. Recipro-
camente, sejam (A, B) e (A, B) estabilizaveis. O Teorema 33 nos
permite escrever os sistemas (A, B) na forma normal
_
x
1
t
x
2
t
_
=
_
A
11
A
12
0 A
22
_

_
B
1
0
_
u,
onde (A
11
, B
1
) e controlavel. O sistema
__
A
11
A
12
0 A
22
_
,
_
B
1
0
__
e estabilizavel quando existe uma matriz F = (F
1
, F
2
) tal que
_
A
11
+B
1
F
1
A
12
+B
1
F
2
0 A
22
_
e uma matriz estavel. Conclumos da que os blocos A
22
possuem
somente autovalores com parte real estritamente menor que zero. Como
essa condi c ao n ao pode ser satisfeita simulteneamente para A
22
e A
22
,
temos que o bloco A
22
n ao pode existir na forma normal. O Teorema 33
nos garante ent ao que
A = P
1
A
11
P, B = P
1
B
1
,
onde P e n ao singular. A controlabilidade de (A, B) segue agora da
controlabilidade de (A
11
, B
1
).
Exemplo 92. Considere novamente o problema do equilbrio de um
bast ao visto na Sec c ao 1.2.5. A equa c ao diferencial e
g = u(t),
steuer
2008/3/11
page 105
i
i
i
i
i
i
i
i
[SEC. 5.2: COLOCAC
AO DE P
OLOS 105
que se escreve na forma do sistema
z
t
= Az +Bu com A =
_
0 1
g 0
_
, B =
_
0
1
_
.
O sistema (A, B) e controlavel devido à condi c ao de posto. Logo, o
Teorema 91 garante sua estabilidade. O Teorema 89 nos permite ainda
calcular a matriz de ganho F, isto porem exige algumas contas longas.
2
O problema da estabiliza c ao de sistemas n ao lineares e discutido em
[Is]. Em particular os sistemas Single-Input Single-Output (SISO) n ao
lineares s ao tratados no Captulo 4, onde e possvel identicar seme-
lhan cas com a abordagem aqui apresentada para sistemas lineares. Uma
tecnica baseada na utiliza c ao de series de Fourier (equilbrio harm onico)
pode ser encontrada em [Fo1, Captulo 2].
5.2 Colocacao de P olos
Uma vez esclarecida a quest ao de que todo sistema controlavel pode
ser estabilizado por uma estrategia de controle de realimenta c ao do tipo
u = Fz, concentramo-nos no problema de escolher a posi c ao no plano
complexo dos autovalores da matriz do sistema
z
t
= (A+BF)z.
Esta tarefa e equivalente à de escolher os polos de uma fun c ao racional
coloca c ao de polos. Tratamos nesta sec c ao apenas de sistemas com
controle escalar (m = 1), isto e, da forma
z
t
= Az +bu com A R
n,n
, b R
n
.
Investigamos a princpio um resultado do tipo formanormal.
Lema 93. Seja A R
n,n
e b R
n
. S ao equivalentes as arma c oes:
a) (A, b) e control avel;
steuer
2008/3/11
page 106
i
i
i
i
i
i
i
i
AO
b) Existe P R
n,n
inversvel tal que o sistema (A, b) nas coorde-
nadas x = Pz tenha a forma x
t
=

Ax +
bu com
A =
_
_
_
_
_
_
_
_
_
0 1 0 0 0
0 0 1 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 1 0
0 0 0 0 1
a
0
a
1
a
2
a
n2
a
n1
_
_
_
_
_
_
_
_
_
,

b =
_
_
_
_
_
_
_
_
_
0
0
.
.
.
0
0
1
_
_
_
_
_
_
_
_
_
.
Os n umeros a
0
, . . . , a
n1
s ao os coecientes do polin omio caracterstico
p de A: p(r) = r
n
+
n1
i=0
a
i
r
i
.
Demonstra c ao: a) = b) Basta encontrar uma base w
1
, . . . , w
n
para
R
n
, de modo que a matriz P R
n,n
denida pelas equa c oes
Pw
k
= e
k
, 1 k n,
satisfa ca
(i) Pb = e
n
,
(ii) PAP
1
e
1
= a
0
e
n
,
(iii) PAP
1
e
k+1
= e
k
a
k
e
n
, 1 k < n.
Denimos w
k
recursivamente por
w
n
= b, w
k
= Aw
k+1
+a
k
b, 1 k < n.
Temos ent ao
(5.3) w
k
= A
nk
b +
nk
j=1
a
nj
A
nkj
b, 1 k n.
Como b, Ab, . . ., A
n1
b s ao linearmente independentes (devido à contro-
labilidade de (A, b)), temos de (5.3) que w
1
, . . . , w
n
tambem o s ao. Do
teorema de CaleyHamilton, temos que p(A) = 0. Logo,
Pb = Pw
n
= e
n
(provando (i)) ;
Aw
1
= A
n
b +
n1
j=1
a
nj
A
nj
b a
0
b = p(A)b a
0
b = a
0
b
= a
0
w
n
(provando (ii)) ;
Aw
k+1
= w
k
a
k
e
n
, 1 k n (provando (iii)).
steuer
2008/3/11
page 107
i
i
i
i
i
i
i
i
[SEC. 5.2: COLOCAC
AO DE P
OLOS 107
b) = a) Seja agora o sistema (

A,
b) satisfazendo as hipoteses do item

b). O criterio do posto nos garante que esse sistema e controlavel. Logo,
(A, b) e tambem controlavel.
O teorema a seguir esclarece o resultado principal sobre a coloca c ao
de razes dos polin omios caractersticos de sistemas de controle.
Teorema 94. Seja (A, b) um sistema control avel e
1
, . . .,
r
R,
r+1
,
r+1
, . . .,
s
,

s
CR n umeros complexos dados, com r +2(sr) = n.
Ent ao existe f R
n
tal que o polin omio caracterstico de A+bf possui
como razes
1
, . . .,
r
,
r+1
,

r+1
, . . .,
s
,

s
.
Demonstra c ao: Seja f um vetor com componentes f
0
, . . . , f
n1
. O
Lema 93 nos permite escrever o sistema A+bf (a menos de uma mudan ca
de variaveis) na forma
A+bf =
_
_
_
_
_
_
_
_
_
0 1 0 0 0
0 0 1 0 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 1 0
0 0 0 0 1
f
0
a
0
f
1
a
1
f
2
a
2
f
n2
a
n2
f
n1
a
n1
_
_
_
_
_
_
_
_
_
,
onde a
0
, . . . , a
n1
, 1 s ao os coecientes do polin omio caracterstico de
A. Logo, o polin omio caracterstico p de A+bf satisfaz
p(r) = r
n
+
n1
i=0
(f
i
a
i
)r
i
.
Como os coecientes f
i
a
i
, i = 0, . . . , n 1 s ao determinados pelas
razes do polin omio, podemos determinar f
0
, . . . , f
n1
(observe que e
preciso resolver um sistema n ao linear com n variaveis e n equa c oes).
Exemplo 95. Considere novamente o sistema linear (veja Sec c ao 1.2.5
e Exemplo 92)
A =
_
0 1
g 0
_
, b =
_
0
1
_
.
A estabiliza c ao com f =
_
f
0
f
1
_
R
2
nos leva à matriz
A+bf =
_
0 1
g f
0
f
1
_
,
cujo polin omio caracterstico e:
2
+ f
1
+ (f
0
g). Se escolhemos os
autovalores
= 1, obtemos os coecientes f
0
= g + 1, f
1
= 2. 2
steuer
2008/3/11
page 108
i
i
i
i
i
i
i
i
AO
Observa cao 96.

E possvel obter um resultado semelhante ao apresen-
tado no Teorema 94 para sistemas genericos (A, B) com m 1. Neste
caso, a demonstra c ao baseia-se na forma normal obtida no Teorema 33.
Discutimos aqui o caso geral na forma de algoritmo.
Seja o sistema de controle
z
t
= Az +Bu, com A R
n,n
, B R
n,m
.
Procuramos uma matriz F R
m,n
tal que os autovalores de A + BF
sejam os n umeros
1
, . . . ,
n
C dados (note que os autovalores com-
plexos aparecem com seus conjulgados).
Os autovetores de A+BF devem ser encontrados satisfazendo:
(A+BF) v
i
=
i
v
i
, 1 i n.
Denindo q
i
:= Fv
i
, 1 i n, obtemos
(A
i
I)v
i
+Bq
i
= 0, 1 i n.
Portanto,
_
v
i
q
i
_
Ke(A
i
I[B), 1 i n, F = (q
1
[ [q
n
)(v
1
[ [v
n
)
1
,
caso det(v
1
[ [v
n
) ,= 0. Essa ultima condi c ao e satisfeita quando
A + BF e diagonalisavel, o que por sua vez pode ser garantido pela
escolha dos autovalores
1
, . . . ,
n
C. 2
Exemplo 97. Considere o sistema de controle com matrizes
A =
_
_
0 1 0
0 0 1
4 4 1
_
_
, B =
_
_
1 0
0 0
0 1
_
_
.
Os autovalores do sistema livre (u = 0) s ao 1, 2, 2. Escolhemos para
novos autovalores os valores:
1
= 2,
2
= 3,
3
= 4. Calculamos
a seguir o n ucleo de (A
i
I [ B) i = 1, 2, 3, onde
(A
i
I [ B) =
_
_
i
1 0 1 0
0
i
1 0 0
4 4
i
1 0 1
_
_
.
steuer
2008/3/11
page 109
i
i
i
i
i
i
i
i
[SEC. 5.3: OBSERVADOR DIN
AMICO 109
Um simples calculo nos permite obter Ke(A
i
I [ B), sendo estes para
i = 1, 2, 3 respectivamente
span(1, 2, 4, 0, 0)
, (1, 0, 0, 2, 4)
,
span(3, 2, 6, 5, 0)
, (2, 3, 9, 0, 26)
,
span(2, 1, 4, 9, 0)
, (2, 4, 16, 0, 36)
.
Podemos escolher ent ao:
v
1
=
_
_
0
1
2
_
_
, q
1
=
_
1
2
_
, v
2
=
_
_
1
0
0
_
_
, q
2
=
_
3
52
5
_
,
v
3
=
_
_
0
1
4
_
_
, q
3
=
_
1
8
_
.
Obtemos assim a matriz de ganho
F =
_
3 1 0
52
5
12 5
_
,
e a matriz do sistema de malha fechada e
A+BF =
_
_
3 0 0
0 0 1
72
5
8 6
_
_
.
2
Uma interessante aplica c ao da coloca c ao de polos para um modelo
de um reator qumico e discutida em [KnKw] (ver exemplo 5.5). Neste
problema a variavel de estado (z R
5
) corresponde à temperatura em
diferentes partes do reator, enquanto que o controle (u R
3
) correspon-
de à abertura de tres valvulas de refrigera c ao disponveis.
5.3 Observador Dinamico
Dadas A R
n,n
, B R
n,m
, C R
l,n
considere o sistema de con-
trole (A, B, C). Na Sec c ao 5.1, vimos que para estabilizar um sistema
utilizando uma estrategia de realimenta c ao de estado da forma u = Fz
temos que encontrar F de modo a tornar a matriz (A+BF) estavel.
steuer
2008/3/11
page 110
i
i
i
i
i
i
i
i
AO
Fazemos agora o desenvolvimento equivalente para o problema de re-
alimenta c ao de sada, quando procuramos controladores da forma
u = Fy. Note que
u = Fy = FCz, F R
m,l
.
O objetivo e ent ao encontrar F de modo que o ponto de equilbrio
z = 0 do sistema z
t
= (A + BFC)z seja assintoticamente estavel. Tal
abordagem encontra serios obstaculos à sua realiza c ao, pois mesmo as
hipoteses
(A, B) controlavel, (A, , C) observavel
n ao s ao sucientes para garantir a estabilidade da matriz (A + BFC).
Tal fato pode ser comprovado no simples exemplo a seguir.
Exemplo 98. Considere o problema de controle descrito por
x +x = u, y = x.
Na forma de sistema temos
_
z
t
=
_
0 1
1 0
_
z +
_
0
1
_
u
y = (1 0)
_
z
1
z
2
_
E facil vericar que os sistemas (A, B) e (A, , C) s ao respectivamente

controlavel e observavel. Escolhendo agora uma estrategia de controle
linear de realimenta c ao de sada, temos
u := fy, com f R
1,1
.
Obtemos assim a equa c ao x +(1 f)x = 0, que corresponde ao sistema
z
t
= (A+BfC)z, com
(A+BfC) =
_
0 1
f 1 0
_
.
Calculando o polin omio caracterstico deste novo sistema, obtemos
p(r) = r
2
+ (1 f) = 0, que possui razes:
=
_
f 1.
Obviamente e impossvel encontrar f R que satisfa ca Re(
+
) < 0
e Re(
) < 0 ao mesmo tempo. Portanto, o sistema n ao e estabili-

zavel. 2
steuer
2008/3/11
page 111
i
i
i
i
i
i
i
i
AMICO 111
Na Sec c ao 5.4 e analisada uma alternativa para a estabiliza c ao por
realimenta c ao de sada, que consiste de duas etapas: inicialmente o es-
tado e recontrudo a partir da sada; em um segundo passo utiliza-se a
aproxima c ao do estado na realimenta c ao.
A m de reconstruir dinamicamente o estado z a partir da observa c ao
y, utilizamos a seguinte ideia:
O sistema (A, B, C) e simulado por outro com a mesma
estrutura;
Seja x o estado desse sistema paralelo e w = Cx sua sada;
O controle do sistema paralelo e constitudo pelo controle
do sistema usual adicionado de uma componente da forma
L(w y), com L R
n,l
;
Obtemos assim o sistema
x
t
= Ax +Bu +L(Cx y), w = Cx,
que e denominado observador din amico;
1
A diferen ca entre os estados do observador e do sistema
original e denida por := z x e satisfaz
t
= A L(Cx Cz) = (A+LC) ;
L e escolhido tal que (A+LC) seja estavel, garantindo assim
lim
t
(t) = 0.
A analise da estabilidade de (A + LC) nos leva ao conceito de de-
tectabilidade discutido no Captulo 2 (veja Deni c ao 14). O teorema a
seguir estabelece a equivalencia entre a detectabilidade de um sistema
(A, , C) e a estabilidade da matriz do observador din amico (A+LC).
Teorema 99. Dadas A R
n,n
e C R
l,n
, s ao equivalentes as arma-
c oes:
a) (A, , C) e detect avel;
1
A escolha da letra L para o observador se deve a D.G. Luenberger, que introduziu
esta ideia.
steuer
2008/3/11
page 112
i
i
i
i
i
i
i
i
AO
b) Se v C
n
e autovetor de A e seu autovalor satisfaz Re() 0,
ent ao Cv ,= 0;
c) (A
, C
) e estabiliz avel;
d) Existe L R
n,l
tal que a matriz (A+LC) e est avel.
Demonstra c ao: a) = b) Sejam v e como em b). Considere as
solu c oes especiais do problema de valor inicial z
t
= Az, z(0) = v dadas
por
z
r
(t) := Re(e
t
v), z
i
(t) := Im(e
t
v), t R.
Note que, se Cv = 0, ent ao v pertence ao subespa co n ao observavel de
(A, , C). Neste caso, lim
t
z
r
(t) ,= 0, contradizendo a detectabilidade de
(A, , C).
b) = c) O Teorema 33 nos permite escrever o sistema (A
, C
) na
forma normal
A =
_
A
I

0 A
II
_
,

C =
_
C
I
0
_
,
com (A
I
, C
I
) controlavel. Analisamos separadamente as duas possveis
situa c oes:
Se o bloco A
II
n ao existir, temos (A
, C
) = (P
1
A
I
P, P
1
C
I
). Logo,
(A
, C
) e controlavel. O item c) segue agora do Teorema 89.

Suponha que o bloco A
II
esteja presente na forma normal. Se e um
autovalor de A
II
e w um autovetor correspondente, temos para v =
_
0
w
_
que
v = v,

Cv = 0.
Da hipotese em b) segue que Re() < 0, provando assim que A
II
(e
conseq uentemente A
II
) e uma matriz estavel. Da controlabilidade de
(A
I
, C
I
) segue sua estabilizabilidade, i.e. existe F
I
tal que (A
I
+C
I
F
I
)
e estavel. Temos ent ao que a matriz
A +

C (F
I
[ 0) =
_
A
I
+C
I
F
I

0 A
II
_
e estavel. Como

F = (F
I
[0) estabiliza (

A,

C) e (P
1

AP, P
1

C) =
(A
, C
), ent ao F =

FP estabiliza (A
, C
).
c) = d) Por hipotese, existe uma matriz D tal que a matriz A
+
(C
)(D) e estavel. Logo, A+LC e estavel com a escolha L := D
.
steuer
2008/3/11
page 113
i
i
i
i
i
i
i
i
AMICO 113
d) = a) Dado z
0

n1
k=0
Ke(CA
k
) dena z(t) := e
tA
z
0
, t R. Do
teorema de CaleyHamilton segue Cz(t) = 0, para t 0. Logo, z
tambem e solu c ao de
z
t
= (A+LC) z.
Como os autovalores da matriz (A + LC) possuem parte real negativa,
temos que lim
t
z(t) = 0.
Exemplo 100. Vamos aplicar a ideia do observador din amico ao sistema
(A, B, C) com matrizes
A =
_
1 3
0 2
_
, B =
_
1
1
_
, C =
_
1 0
_
.
E facil ver que (A, B) e controlavel e (A, , C) observavel, e portanto

tambem detectavel. Os autovalores de A+LC com L =
_
l
1
l
2
_
s ao obtidos
resolvendo-se a equa c ao
(5.4) 0 = det(I (A+LC)) =
2
+ (3 l
1
) + (2 2l
1
3l
2
).
Escolhemos para a matriz A + LC os autovalores
1
= 9,
2
= 10.
Resolvendo (5.4) para (l
1
, l
2
), obtemos l
1
= 16, l
2
= 56/3. O obser-
vador din amico possui ent ao a seguinte estrutura:
x
t
=

Ax + Bu Ly,
com
A =
_
17 3
56/3 2
_
, B =
_
1
1
_
, L =
_
16 56/3
_
.
O observador din amico nos permite reconstruir a componente z
2
do
estado note que a componente z
1
ja e observada. Suponha que temos
a seguinte situa c ao:
u(t) 1, z(0) =
_
0
_
, x(0) =
_
0
0
_
,
com R. O erro de reconstru c ao := z x satisfaz
_
_
_
t
= (A+LC)
(0) =
_
0
_
steuer
2008/3/11
page 114
i
i
i
i
i
i
i
i
AO
Os autovalores de A + LC s ao
1
= 9,
2
= 10 e os respectivos
autovetores s ao v
1
=
_
1
8/3
_
e v
2
=
_
1
7/3
_
. Temos ent ao
(t) =
_

1
(t)
2
(t)
_
=
_
3e
9t
3e
10t
8e
9t
7e
10t
_
.
Nos interessa saber o qu ao rapido
2
converge a zero. Para t = 0.5, temos
e
2
(t) = 0.041 (aproximadamente 4% do erro inicial) e para t = 0.9,
temos e
2
(t) = 0.015 (i.e. 0.1% do erro inicial). 2
E possvel utilizar sistemas auxiliares observadores tambem para sis-

temas de controle n ao lineares. Para maiores detelhes, consulte [KIF],
[Is]. Ainda no contexto de sistems aut onomos, o leitor pode encontrar
em [KnKw] detalhes sobre o observador reduzido (semelhante ao obser-
vador discutido nesta sec c ao).
5.4 Estabiliza cao por Realimentacao de Sada
O Exemplo 98 nos mostra que a forma classica da estabiliza c ao por
realimenta c ao de sada u = Fy = FCx nem sempre e possvel. Uma
alternativa e utilizar o observador din amico para encontrar uma aproxi-
ma c ao para o estado, e, a partir desta aproxima c ao, escolher o controle.
O observador din amico e denido pelo sistema (veja Sec c ao 5.3)
(5.5)
_
x
t
= Ax +Bu +L(w y)
w = Cx
.
A partir do estado x escolhemos um controle de realimenta c ao da forma
u = Fx. Substituindo esse controlador no sistema (A, B), obtemos para
(z, x) o sistema acoplado:
(5.6)
_
z
t
= Az +BFx
x
t
= (A+BF +LC)x LCz
que esta associado à matriz
A =
_
A BF
LC A+BF +LC
_
.
Se a matriz

A for estavel, conseguimos atingir o nosso objetivo inicial de
estabilizar (A, B, C) atraves do sistema acoplado (5.6) constitudo de
steuer
2008/3/11
page 115
i
i
i
i
i
i
i
i
[SEC. 5.4: ESTABILIZAC
AO POR REALIMENTAC
AO DE SA
IDA 115
processo mais observador. Note que esta abordagem nos permite, alem
de estabilizar o processo, reconstruir seu estado.
Dena agora w := z x. O sistema (5.6) se escreve nas novas
variaveis (z, w) como
(5.7)
_
z
t
= (A+BF)z +BFw
w
t
= (A+LC)w
Conclumos assim que a matriz

A e semelhante à matriz
A =
_
A+BF BF
0 A+LC
_
.
A tarefa de estabilizar

A e portanto equivalente à de estabilizar

A. Note,
porem, que a estrutura de

A nos permite escrever
p
A
= p
(A+BF)
p
(A+LC)
,
onde p
M
representa o polin omio caracterstico da matriz M. Sendo
assim, nossa tarefa se reduz a:
Determinar F tal que a matriz A+BF e estavel;
Determinar L tal que a matriz A+LC e estavel.
Conhecemos, entretanto, da Deni c ao 88 e do Teorema 99 condi c oes
necessarias e sucientes para que os objetivos acima possam ser al-
can cados. S ao essas respectivamente:
(A, B) estabilizavel,
(A, , C) detectavel.
Exemplo 101. Considere o sistema (A, B, C) do Exemplo 100 com
matrizes:
A =
_
1 3
0 2
_
, B =
_
1
1
_
, C =
_
1 0
_
.
Vimos naquele exemplo que a matriz
L =
_
16
56/3
_
steuer
2008/3/11
page 116
i
i
i
i
i
i
i
i
AO
e tal que A + LC possui autovalores 9 e 10. Se F =
_
f
1
f
2
_
, os
autovalores de A+BF s ao dados pelas razes do polin omio caracterstico
det(I (A+BF)) =
2
+ (3 f
1
f
2
) + (2 5f
1
f
2
).
Escolhendo para A + BF os autovalores
1
= 5,
2
= 6, obtemos
para F os coecientes: f
1
= 5, f
2
= 3. Portanto, a matriz do sistema
(5.7) assume a forma
A =
_
_
_
_
6 0 5 3
5 5 5 3
0 0 17 3
0 0 56/3 2
_
_
_
_
.
2
A estabiliza c ao por realimenta c ao de sada para sistemas SISO n ao
lineares especiais e considerada em [KIF].
5.5 Pontos de Operacao
Nesta sec c ao consideramos os problemas de determina c ao e estabi-
liza c ao de pontos de opera c ao. Considere um sistema de controle (A, B),
no qual a variavel de controle u se decomp oe em uma entrada xa u
(desconhecida) e um sinal de controle v. O sistema se escreve ent ao
como
(5.8) z
t
= Az +B( u +v).
O ponto de opera c ao z
o
do sistema (5.8) corresponde ao ponto de equi-
lbrio do sistema livre (i.e. v 0). Temos assim
z
o
= A
1
B u.
O problema abordado nesta sec c ao e o de encontrar uma estrategia de
controle v que torne o ponto de opera c ao assintoticamente estavel e que,
se possvel, nos permita identica-lo.
Note que se u e conhecido, recamos no problema de estabiliza c ao do
sistema (A, B). De fato, uma vez calculado z
o
, basta fazer a mudan ca de
variavel x = zz
o
para que o estado x satisfa ca a din amica x
t
= Ax+Bv.
steuer
2008/3/11
page 117
i
i
i
i
i
i
i
i
[SEC. 5.5: PONTOS DE OPERAC
AO 117
Utilizando uma abordagem semelhante à do observador din amico, e
possvel n ao somente estabilizar o ponto de opera c ao, como tambem de-
termina-lo. Vamos aproximar o estado z por x satisfazendo a din amica:
x
t
= L(z x),
onde L R
n,n
e n ao singular. Escolhemos agora para (5.8) um controle
da forma
v = F(z x).
Fazendo a mudan ca de variaveis z = z z
o
, x = x z
o
, obtemos
x
t
= L(z x) = L( z x)
e ainda
z
t
= z
t
= Az +B u +BF(z x) = A z +BF z BF x.
Temos ent ao, para o par ( z x), o sistema
(5.9)
_
z
t
x
t
_
=
_
A+BF BF
L L
_ _
z
x
_
.
Portanto, basta encontrar matrizes F e L, tais que a matriz do sistema
(5.9) seja estavel. Note que, se Ae estavel, uma escolha possvel e F = 0,
L = I.
Exemplo 102. Considere o sistema de controle (A, B) com matrizes:
A =
_
1 3
0 2
_
, B =
_
1
1
_
.
Supomos F e L da forma:
F =
_
f
1
f
2
_
, L =
_
l
1
l
2
l
2
l
1
_
.
A m de torna a matriz A + BF estavel, escolhemos f
1
= f
2
= 3,
obtendo assim:
A+BF =
_
2 0
3 5
_
.
steuer
2008/3/11
page 118
i
i
i
i
i
i
i
i
AO
Temos ent ao
_
A+BF BF
L L
_
=
_
_
_
_
2 0 3 3
3 5 3 3
l
1
l
2
l
1
l
2
l
2
l
1
l
2
l
1
_
_
_
_
,
cujo polin omio caracterstico e:
p() =
4
+ (7 + 2l
1
)
3
+ (10 + 8l
1
+l
2
1
l
2
2
6l
2
)
2
+ (8l
1
+l
2
1
l
2
2
12l
2
) + 2(l
2
2
l
2
1
).
A observ ancia do criterio de Hurwitz (veja Teorema 64) nos leva a es-
colher os coecientes l
1
= 1, l
2
= 3. As razes obtidas s ao
1
=
2
= 2,
3
= 1,
4
= 4.
Logo, F =
_
3 3
_
e L =
_
1 3
3 1
_
estabilizam o ponto de opera c ao.
Para ns de calculo, suponha u = 2. O ponto de opera c ao cor-
respondente e z
o
= A
1
B u =
_
5
1
_
. Suponha as condi c oes iniciais:
z(0) =
_
5
0
_
e x(0) = 0. Temos ent ao
_
z(0)
x(0)
_
=
_
_
_
_
0
1
5
1
_
_
_
_
e a solu c ao do sistema ( z
t
x
t
) e:
_
z(t)
x(t)
_
=
_
_
_
_
66e
t
+ 66e
2t
+ 48te
2t
33e
t
34e
2t
48te
2t
77e
t
+ 96te
2t
+ 12e
4t
+ 60e
2t
55e
t
44e
2t
96te
2t
12e
4t
_
_
_
_
.
2
Observa cao 103 (Estabiliza cao de sistemas nao lineares). Encer-
ramos este captulo mencionando um importante resultado relacionado
a estabiliza c ao de sistemas n ao lineares. Para din amicas aut onomas de
classe C
1
e possvel obter uma condi c ao necessaria para estabilidade lo-
cal do sistema. O criterio de Brockett garante que, para que um sistema
seja localmente estabilizavel em um determinado estado e necessario que
a imagem da fun c ao descrevendo a din amica contenha uma vizinhanca
desse estado [So, Captulo 5]. 2
steuer
2008/3/11
page 119
i
i
i
i
i
i
i
i
EXERC
ICIOS 119
Exerccios
5.1. Considere o sistema SISO (A, b) com
A =
_
_
1 6 1
1 1 1
2 2 0
_
_
, b =
_
_
1
1
1
_
_
.
Encontre a forma normal (

A,
b) do sistema (
b = (0, 0, 1)).
5.2. Considere o sistema SISO (A, b) com
A =
_
_
0 1 0
0 0 1
2 3 0
_
_
, b =
_
_
0
0
1
_
_
.
Encontre uma estrategia de realimenta c ao de estado u = fx, com f =
(f
1
, f
2
, f
3
), tal que o sistema de malha fechada A+bf possua autovalores
1 +i, 1 i, 4.
5.3. Considere o sistema (A, B) com
A =
_
_
1 1 0
1 0 1
0 0 1
_
_
, B =
_
_
0 1
1 0
0 1
_
_
.
a) Mostre que (A, B) e controlavel;
b) Encontre uma estrategia de realimenta c ao de estado u = Fx, tal que
o sistema de malha fechada A+BF possua autovalores 4, 5, 6.
5.4. Construa um observador din amico para o sistema
A =
_
_
1 0 0
2 2 2
1 0 3
_
_
, C =
_
1 1 1
_
,
tal que A+LC possua autovalores 8, 9, 10.
5.5. Encontre uma estrategia de realimenta c ao F e um observador L
para o sistema (A, B, C) com
A =
_
_
1 0 0
2 2 2
1 0 3
_
_
, B =
_
_
1
0
1
_
_
, C =
_
1 1 1
_
,
tal que A+BF possua autovalores 4, 5, 6 e A+LC possua auto-
valores 8, 9, 10.
steuer
2008/3/11
page 120
i
i
i
i
i
i
i
i
Captulo 6
Identicacao de Parametros
Consideramos neste captulo o problema de identicar par ametros
desconhecidos na din amica de sistemas de controle. Tais problemas
de reconstru c ao podem ser encontrados em varias aplica c oes da teo-
ria de controle à engenharia e à tecnologia, uma vez que os par ametros
a ser determinados quase sempre descrevem propriedades importantes
do modelo em estudo (coecientes de rigidez, difus ao, permeabilidade,
elasticidade, etc . . . ).
Ainda que os par ametros de um sistema sejam conhecidos no tempo
inicial, estes podem vir a variar (lentamente) com o tempo devido a in-
uencias externas ou a propria natureza do problema. Este e outro fator
que motiva a tarefa de identica c ao. Discutimos algumas estrategias de
identica c ao para problemas lineares n ao aut onomos e n ao homogeneos.
Alguns exemplos simples s ao utilizados para ilustrar a complexidade da
tarefa a ser realizada.
Na Sec c ao 6.1 e apresentada, no contexto dos sistemas lineares, a
aplica c ao denominada controle automatico. Na Sec c ao 6.2 e discutida
a tarefa principal dentro do controle automatico, que e a de identicar
par ametros do sistema. Na Sec c ao 6.3 s ao analisados alguns metodos
iterativos para executar a tarefa de identica c ao.
6.1 Controle Automatico
Considere o sistema de controle aut onomo (A, B, C):
(6.1) z
t
= Az +Bu, y = Cz,
steuer
2008/3/11
page 121
i
i
i
i
i
i
i
i
[SEC. 6.2: IDENTIFICABILIDADE 121
onde A R
n,n
, B R
n,m
, C R
l,n
. O conceito de controle autom atico
se refere ao fato de que a a c ao de controle u deve ser obtida a partir
da sada y e deve conduzir a trajetoria z ao ponto de equilbrio z = 0.
Eventualmente, tal objetivo deve ser atingido com conhecimento apenas
parcial das matrizes A, B, C, assim como da condi c ao inicial z
0
.
A estrategia a ser seguida e a seguinte: Deve-se projetar um sistema
auxiliar linear, denominado sistema de referencia, que permita, a partir
da entrada u e da sada y do sistema real, acompanhar a evolu c ao do
estado do sistema real. O sistema de referencia nos fornece uma sada,
que deve ser comparada com a sada do sistema real atraves de um
criterio de erro. Desta compara c ao e gerada uma entrada para o sistema
real e o sistema de referencia e ajustado. O sistema real e o modelo s ao
denominados sistema modelo de referencia adaptativa (MRAS; model
reference adaptive system).
Assim sendo, a m de implementar o controle automatico, e neces-
sario, simultaneamente (on line) a evolu c ao do sistema real, realizar as
seguintes tarefas:
Reconstru c ao do estado a partir de observa c oes incompletas, even-
tualmente com conhecimento apenas parcial do sistema real;
Identica c ao de par ametros do sistema (coecientes de A, B e/ou
C) a partir de dados incompletos;
Escolha da estrategia de controle (entrada) do sistema real.
Neste captulo, analisamos exclusivamente a tarefa de reconstruir
(identicar) par ametros de opera c ao do sistema a partir de dados do
sistema real. O problema de acoplar esta reconstru c ao com a estabi-
liza c ao do sistema real, utilizando controle de realimenta c ao, n ao e aqui
discutida.
6.2 Identicabilidade
Inicialmente analisamos o problema de, a partir da sada de um sis-
tema, obter informa c oes sobre os par ametros do mesmo. Apesar de
considerarmos apenas sistemas de controle lineares, o problema de iden-
tica c ao e, em geral, n ao linear. Considere um sistema da forma
(6.2) z
t
= A(p)z +B(p)u, y = C(p)z ;
steuer
2008/3/11
page 122
i
i
i
i
i
i
i
i
122 [CAP. 6: IDENTIFICAC
AO DE PAR
AMETROS
onde p e um par ametro desconhecido, sobre o qual temos a informa c ao:
p Q R
k
. Supomos ainda que, dado q Q, as matrizes A(q) R
n,n
,
B(q) R
n,m
, C(q) R
l,n
est ao bem denidas.
Nosso objetivo e, a partir de experimentos com condi c oes iniciais
z
0
:= z(0) e controles pre-escolhidos u, identicar qual par ametro p Q
corresponde à sada y obtida.
Seja Z
0
R
n
o conjunto das condi c oes iniciais admissveis (exemplo
Z
0
= B
R
(0), com R grande) e o conjunto das possveis a c oes de
controle. Logo, o conjunto dos controles admissveis e
U := u L
1
([0, T]; R
m
) [ u(t) q.s. em (0, T).
Supomos ainda que e aberto. Note que, para cada (z
0
, u, p) Z
0

U Q, a solu c ao z = z(; z
0
, u) de (6.2) esta bem denida. Logo, as
aplica c oes
L : Z
0
U Q (z
0
, u, p) z(, z
0
, u, p) C([0, T]; R
n
),
L : Z
0
U Q (z
0
, u, p) C(p)L(, z
0
, u, p) C([0, T]; R
l
)
tambem est ao bem denidas. A seguir e apresentado um conceito essen-
cial para essa discuss ao:
Deni cao 104. O par ametro q Q e denominado identic avel atraves
do experimento (z
0
, u) Z
0
U, quando
L(z
0
, u, p) ,= L(z
0
, u, q) para todo q Q, p ,= q.
O par ametro q Qe denominado identic avel, quando q for identicavel
por algum experimento (z
0
, u). 2
z
t
= pz +u, y = z,
com Z
0
:= 0, Q := R, = R. A sada y e dada por
y(t) =
_
t
0
e
p(ts)
u(s) ds, t 0.
Observe que o experimento (0, 0) n ao identica nenhum par ametro, en-
quanto que qualquer par ametro e identicado pelo experimento (0, u),
u(t) := t, t R. 2
steuer
2008/3/11
page 123
i
i
i
i
i
i
i
i
z
t
1
= (p
1
+p
2
)z
1
+ p
2
z
2
u
z
t
2
= p
2
z
1
p
3
z
2
y = z
1
para Z
0
:= (0, 0), Q := (q
1
, q
2
, q
3
) R
3
[ q
1
, q
2
, q
3
0, = R.
Dados q Q e u 1, considere a equa c ao
L(z
0
, u, p) = L(z
0
, u, q),
para p Q. Por diferencia c ao (note que o campo vetorial resultante e
analtico), obtemos equa c oes da forma
L(z
0
, u, p)(0) =

L(z
0
, u, q)(0), = 0, 1, . . .
O caso = 1 n ao e interessante. Porem, para = 2, obtemos a equa c ao
(p
1
+p
2
) = (q
1
+q
2
).
Por hora abandonamos os calculos neste ponto. Adiante no texto, uma
solu c ao e obtida de forma mais simples (veja Exemplo 109). 2
Retomamos agora a ideia apresentada no exemplo anterior. Para
tanto, utilizamos as seguintes representa c oes (veja Apendice A):
y(t) = C(p)e
A(p)t
z
0
+
_
t
0
C(p)e
A(p)(ts)
B(p)u(s)ds, t 0,
i.e.,
(6.3)
L(z
0
, u, p)(t) = C(p)e
A(p)t
z
0
+
_
t
0
C(p)e
A(p)(ts)
B(p)u(s)ds, t 0.
Denindo as fun c oes Y
j
(p) := C(p)A(p)
j
B(p) , p Q, j = 0, 1, . . .,
podemos formular o seguinte lema:
Lema 107. Sejam os par ametros p, q Q. S ao equivalentes as arma-
tivas:
a) L(z
0
, u, p) = L(z
0
, u, q) para todo experimento (z
0
, u) Z
0
U;
steuer
2008/3/11
page 124
i
i
i
i
i
i
i
i
AO DE PAR
AMETROS
b) Y
j
(p) = Y
j
(q), j = 0, 1, . . .;
c) Y
j
(p) = Y
j
(q), j = 0, 1, . . . , 2n 1.
Demonstra c ao: b) = c) e b) = a): nada a fazer.
a) = b) Da representa c ao em (6.3), temos
_
t
0
_
C(p)e
A(p)(ts)
B(p) C(q)e
A(q)(ts)
B(q)
_
u(s)ds = 0, t 0,
para todo u U. Como e aberto por hipotese, temos
v(t) := C(p)e
A(p)t
B(p) = C(q)e
A(q)t
B(q) =: w(t), t [0, T].
O item b) segue agora de v
(j)
(0) = w
(j)
(0), j = 0, 1, . . .
c) = b) Seja r Q e p
A(r)
() =
n
n1
i=0
i
(r)
i
o polin omio carac-
terstico de A(p). Do teorema de CaleyHamilton, segue
A(r)
n
=
n1
i=0
i
(r)A(r)
i
.
De onde temos que
(6.4) Y
j
(r) =
n1
i=0
i
(r)Y
jn+i
(r), j n.
Sejam a
i
:=
i
(p)
i
(q), 0 i n1. Usando um argumento indutivo
em N, provamos agora que, para N 2n, as seguintes identidades s ao
validas:
i) Y
j
(p) = Y
j
(q), j = 0, 1, . . . , N 1.
ii) Y
j
(p) = Y
j
(q) =
n1
i=0
a
i
Y
jn+i
(p), j = n, . . . , N.
Para N = 2n, temos que i) e ii) s ao verdadeiras devido a (6.4). Note
steuer
2008/3/11
page 125
i
i
i
i
i
i
i
i
ainda que de (6.4) segue que
Y
N
(p) Y
N
(q) =
n1
i=0
a
i
Y
Nn+i
(p)
=
n1
i=0
a
i
n1
l=0
l
Y
Nn+in+l
(p)
=
n1
l=0
l
(p)
n1
i=0
a
i
Y
N+i2n+l
(p)
=
n1
l=0
l
(p)(Y
N+ln
(p) Y
N+ln
(q))
= 0
e
Y
N+1
(p) Y
N+1
(q) =
n1
i=0
(
i
(p)Y
N+1n+i
(p)
i
(q)Y
N+1n+i
(q))
=
n1
i=0
a
i
Y
N+1n+i
(p).
Deste modo, a argumenta c ao indutiva ca completa. O item b) segue
agora de ii).
Teorema 108. O par ametro q Q e identic avel se e somente se, para
todo p Q, existir j 0, . . . , 2n 1 com Y
j
(p) ,= Y
j
(q).
Demonstra c ao: Segue diretamente do Lema 107.
Exemplo 109. Consideramos novamente o sistema do Exemplo 106:
z
t
1
= (p
1
+p
2
)z
1
+ p
2
z
2
u
z
t
2
= p
2
z
1
p
3
z
2
y = z
1
onde Z
0
:= (0, 0), Q := (q
1
, q
2
, q
3
) R
3
[ q
1
, q
2
, q
3
0, = R.
Temos ent ao
Y
0
(p) = 1, Y
1
(p) = (p
1
+p
2
), Y
2
(p) = (p
1
+p
2
)
2
+p
2
2
,
steuer
2008/3/11
page 126
i
i
i
i
i
i
i
i
AO DE PAR
AMETROS
Y
3
(p) = (p
1
+p
2
)(p
1
2
+ 2p
1
p
2
+ 3p
2
2
) p
2
2
p
3
.
Podemos ent ao concluir que todo par ametro q Q com p
3
> 0 e identi-
cavel. 2
Observa cao 110. A matriz
M(p) := (Y
0
(p) [ [ Y
2n1
) R
m,2nl
e denominada matriz de par ametros de Markov. Note que a aplica c ao
Q p M(p) R
m,2nl
e injetiva em uma vizinhan ca de p Q, caso a matriz jacobiana
M
p
(p)
possua posto maximo. 2
6.3 Identica cao Adaptativa: Introducao
Nesta sec c ao consideramos sistemas do tipo
(6.5) z
t
=

Az +f(t), t 0, y = z,
onde f C([0, ); R
n
). Supomos ainda que o sistema e observavel em
todo intervalo [0, T], T > 0 (veja Deni c ao 6). Nosso objetivo e discutir
a identicabilidade de

A.
Em compara c ao com a abordagem da sec c ao anterior, os par ametros
a serem identicados s ao os proprios coecientes da matriz

A. A es-
trategia de identica c ao e assim resumida:
Ajuste dinamicamente um par ametro A(t) R
n,n
na base
formada pelos vetores z(t), de modo a obter
lim
t
A(t) =

A.
A realiza c ao desta ideia pode ser levada a cado da seguinte forma:
Passo 1. Projete um modelo:
(6.6) x
t
= G(x, A; z(t), f(t)), t 0;
Passo 2. Projete uma regra de adapta c ao
(6.7) A
t
= F(x, A; z(t)), t 0;
steuer
2008/3/11
page 127
i
i
i
i
i
i
i
i
[SEC. 6.3: IDENTIFICAC
AO ADAPTATIVA: INTRODUC
AO 127
Passo 3. Mostre que
(6.8) lim
t
x(t) z(t) = 0, lim
t
A(t) =

A.
Note que x e A em (6.8) s ao solu c oes de (6.6) e (6.7), respectivamente.
(As condi c oes iniciais ainda precisam ser escolhidas.) O sistema (6.6),
(6.7) juntamente com o processo (6.5) e denominado sistema de re-
ferencia adaptativo.
Dena
w(t) := x(t) z(t), R(t) := A(t)

A, t 0.
A realiza c ao dos passos 1. e 2. pode ser feita atraves de um dos seguintes
metodos:
M1 Metodo de resduos:
Modelo: x
t
= Az(t) +f(t), t 0;
Regra de adapta c ao: A
t
= Q(x z(t))z(t)
, t 0;
A matriz Q R
n,n
e a matriz de passo. Note que w, R satisfazem
o sistema
(6.9) w
t
= Rz(t), R
t
= Qwz(t)
, t 0.
M2 Metodo do gradiente:
Modelo: x
t
= Ax +f(t), t 0;
t
= Q(x z(t))x
, t 0;
A matriz Q R
n,n
e a matriz de passo. Para w, R obtemos um
sistema n ao linear, que n ao pode ser desacoplado de x e A.
M3 Metodo do gradiente linearizado:
Modelo: x
t
= Cx + (AC)z(t) +f(t), t 0,
onde a matriz C R
N,N
precisa ser escolhida adequadamente (veja
abaixo);
t
= Q(x z)z(t)
, t 0;
A matriz Q R
n,n
e a matriz de passo. Para w, R obtemos o
sistema linear n ao aut onomo:
(6.10) w
t
= Cw +Rz(t), R
t
= Qwz(t)
, t 0.
steuer
2008/3/11
page 128
i
i
i
i
i
i
i
i
AO DE PAR
AMETROS
Sobre a nomenclatura gradiente linearizado mencionamos, sem entrar
em detalhes, que este metodo pode ser interpretado como um metodo
de gradiente adaptativo.
Nesse ponto ca claro que a verica c ao de
lim
t
x(t) z(t) = 0, lim
t
A(t) =

A
esta relacionada com a estabilidade do ponto de equilbrio (0,

A). En-
tretanto, os sistemas a serem analisados s ao n ao aut onomos, o que torna
a utiliza c ao da teoria espectral quase que impraticavel. A m de levar
adiante a analise, consideramos com mais cuidado a ideia por tras de
cada um dos metodos descritos acima.
O metodo M1 esta baseado na ideia de ajustar o par ametro A,
utilizando como informa c ao o erro (resduo) na equa c ao de estado. A
equa c ao do modelo desempenha um papel secundario, pois a adapta c ao
do par ametro A e feita considerando-se unicamente a sada y = z do
sistema. A equa c ao de evolu c ao do erro (6.9) sugere, qualitativamente,
como a matriz Q deve ser escolhida. De (6.9) temos
|R|
2
t
(t) = R(t), QR(t))z(t)z(t)
, t 0.
Na equa c ao acima, o produto interno e a norma em R
n,n
s ao denidos
da seguinte forma:
M,

M) :=
n
i,j=1
m
ij
m
ij
, |M| :=
_
M, M),
onde M = (m
ij
),

M = ( m
ij
) R
n,n
.
O metodo M3 e discutido a seguir em maiores detalhes. Note que
dispomos de uma equa c ao para o modelo da forma:
x
t
= Cx + (AC)z(t) +f(t), t 0.
(Note que a equa c ao acima descreve um modelo linear.) A regra de
adapta c ao utilizada e
x
t
= F(x, z(t)), t 0.
Logo, obtemos para w, R o seguinte sistema:
(6.11) w
t
= Cw +Rz(t), R
t
= F(w +z(t), z(t)), t 0.
steuer
2008/3/11
page 129
i
i
i
i
i
i
i
i
AO ADAPTATIVA: INTRODUC
AO 129
Procuramos agora um candidato à fun c ao de Lyapunov (note que, para
sistemas n ao aut onomos, n ao dispomos de maiores informa c oes analticas
sobre o metodo de Lyapunov) da forma
V (w, R) :=
1
2
(w, Qw) +|R|
2
),
onde a matriz Q ainda precisa ser escolhida. Calculando a derivada total
de V ao longo das trajetorias do sistema (6.11), obtemos
V (t) =
d
dt
V (w(t), R(t))
= w(t), Ww(t)) +Qw(t)z(t)
, R(t))
+F(w(t) +z(t), z(t)), R(t)),
onde W e dado por
(6.12) C
Q+QC =
1
2
W.
Escolhemos agora a regra de adapta c ao
A
t
= Q(x z(t))z(t)
, t 0,
e a matriz Q, de forma a garantir que W seja positiva denida. Assim,
temos que
V (t) 0, t 0.
Resumindo, precisamos implementar o seguinte esquema:
i) Escolher uma matriz estavel C;
ii) Escolher uma matriz positiva denida W;
iii) Calcular Q atraves da equa c ao (6.12);
iv) Escolher uma condi c ao inicial A
0
para A(0);
v) Calcular a solu c ao do sistema
x
t
= Cx + (AC)z(t) +f(t), t 0, x(0) = z
0
,
A
t
= Q(x z)z(t)
, t 0, A(0) = A
0
.
Note que o Teorema 78 garante a existencia de uma solu c ao Q (positiva
denida) para a equa c ao (6.12).
steuer
2008/3/11
page 130
i
i
i
i
i
i
i
i
AO DE PAR
AMETROS
Exemplo 111. Considere o sistema em que
A =
_
2 1
1 4
_
, z(t) =
_
d
1
sin e
1
t
d
2
sin e
2
t
_
, t 0.
A fun c ao f e o estado inicial z
0
podem ser calculados a partir da. A
seguir aplicamos o metodo M3, resolvendo o problema de valor inicial
atraves do metodo de RungeKutta.
1
o
problema: d
1
= d
2
= e
1
= 1, e
2
= 2. Escolhemos as matrizes
C =
_
10 0
0 10
_
, W =
_
50 0
0 50
_
, A
0
=
_
5 5
5 5
_
.
Resolvendo o problema de valor inicial, obtemos
A(3) =
_
2.0076 1.0014
1.0059 4.0014
_
.
2
o
problema: d
1
= d
2
= e
1
= e
2
= 1. Escolhemos agora as matrizes
C =
_
10 0
0 10
_
, W =
_
50 0
0 50
_
, A
0
=
_
5 5
5 5
_
.
A(3) =
_
1.5002 1.5002
2.5002 2.5002
_
.
3
o
problema: d
1
= 1, d
2
= 0, e
1
= 1, e
2
= 2 e matrizes
C =
_
10 0
0 10
_
, W =
_
50 0
0 50
_
, A
0
=
_
5 5
5 5
_
.
A(3) =
_
2.0001 +5.0000
1.0001 +5.0000
_
.
A compara c ao entre os resultados obtidos para os tres problemas
e inevitavel. Uma analise detalhada e apresentada na proxima sec c ao.
Por hora observe que, enquanto a trajetoria do primeiro problema possui
duas componentes distintas, as componentes da trajetoria do segundo
problema s ao identicas. Ja no terceiro problema, uma das componentes
se anula identicamente. 2
steuer
2008/3/11
page 131
i
i
i
i
i
i
i
i
AO ADAPTATIVA: ESTABILIDADE 131

6.4 Identica cao Adaptativa: Estabilidade
A analise do metodo de identica c ao adaptativa M3 depende t ao
somente de (6.10), o sistema de evolu c ao do erro (w, R) = (xz, A

A).
Recordando, o sistema e
(6.13)
w
t
= Cw +Rz(t), w(0) = w
0
, R
t
= QRwz(t)
, R(0) = R
0
, t 0.
Uma vez que a trajetoria z e uma fun c ao contnua, podemos, argumen-
tando como na Sec c ao A.4, garantir a existencia de solu c oes locais para
o sistema. Fazemos agora as seguintes hipoteses adicionais:
z e limitada, Q e positiva denida, C e uma matriz estavel.
Lema 112. O sistema (6.13) possui uma unica solu c ao (global), a qual
est a denida no intervalo [0, ). Para esta solu c ao (w, R), s ao ver-
dadeiras as armativas:
a) Existe constante positiva c, independente de w e R, tal que
(6.14) sup
t0
_
[w(t)[
2
+|R(t)|
2
_
+
_

0
|w(s)|
2
ds c;
b) (w, R) C
1
((0, ); R
n
R
n,n
);
c) w L
([0, ); R
n
) L
2
([0, ); R
n
);
d) R L
([0, ); R
n,n
), R
t
L
([0, ); R
n,n
) L
2
([0, ); R
n,n
);
e)

V := lim
t
V (w(t), R(t)) existe, onde V e denida por V (w, R) :=
1
2
(w, Qw) +|R|
2
).
Demonstra c ao: Uma vez que existe uma solu c ao local, obtemos de
(6.13) para cada t pertencente ao intervalo de existencia da solu c ao local
V (w(t), R(t)) V (w(0), R(0)) =
_
t
0
w(s), Ww(s))ds,
w(t), Qw(t))+|R(t)|
2
+
_
t
0
w(s), Ww(s))ds = w(0), Qw(0))+|R(0)|
2
,
c
1
[w(t)[
2
+|R(t)|
2
+c
2
_
t
0
[w(s)[
2
ds c
3
,
steuer
2008/3/11
page 132
i
i
i
i
i
i
i
i
AO DE PAR
AMETROS
onde as constantes c
1
, c
2
, c
3
independem de w e R. Este e exatamente
o argumento que precisamos para garantir que a solu c ao local pode ser
estendida ao intervalo [0, ). Note ainda que a estimativa (6.14) segue
da ultima linha acima.
As armativas b) e c) seguem diretamente de (6.14). A armativa d)
segue de R
t
= QRwz(t)
, juntamente com (6.14). A armativa e) e

conseq uencia do fato da aplica c ao t V (w(t), R(t)) ser monotona n ao
crescente.
Do Teorema 112, temos que o sistema
x
t
= Cx + (AC)z(t) +f(t), t 0, x(0) = z
0
,
A
t
= Q(x z)z(t)
, t 0, A(0) = A
0
possui uma unica solu c ao (x, A) denida no intervalo [0, ) e ainda que
esta solu c ao possui as seguintes propriedades:
(x, A) C
1
((0, ); R
n
R
n,n
), (x, A) L
([0, ); R
n
R
n,n
).
Teorema 113. Seja w, R a slou c ao de (6.13) para a condi c ao inicial
w
0
, R
0
. Temos ent ao para x := w +z e A := R +

A que
lim
t
x(t) z(t) = 0.
Demonstra c ao: De w
t
= Cw +Rw, segue que
d
dt
w, Qw) = w, Ww) + 2Qw, Rz).
Da desigualdade (6.14), obtemos agora para 0 t
1
t
2
[w(t
2
), Qw(t
2
)) w(t
1
), Qw(t
1
))[
t
2
_
t
1
w(s), Ww(s))ds
+ 2
t
2
_
t
1
Qw(s), R(s)z(s))ds
c
1
_
t
2
t
1
[w(s)[
2
ds + 2
_
t
2
t
1
[Qw(s)[ [R(s)z(s)[ds
c
1
_
t
2
t
1
[w(s)[
2
ds + 2c
2
_
t
2
t
1
[w(s)[ |R(s)| [z(s)[ds
c
1
_
t
2
t
1
[w(s)[
2
ds + 2c
3
_
t
2
t
1
[w(s)[ds
c
1
_
t
2
t
1
[w(s)[
2
ds + 2c
3
t
2
t
1
_
_
t
2
t
1
[w(s)[
2
ds
_1
2
steuer
2008/3/11
page 133
i
i
i
i
i
i
i
i

(6.15) r > 0, > 0, t
0
0 :
t
1
, t
2
> t
0
, [t
2
t
1
[ < r, temos [w(t
2
), Qw(t
2
))w(t
1
), Qw(t
1
))[ < .
Suponha por contradi c ao que w n ao converge para 0 quando t .
Neste caso, existe > 0 e uma seq uencia t
n
nN
satisfazendo
t
n+1
t
n
2, n N, lim
nN
t
n
= , lim
nN
w(t
n
), Ww(t
n
)) .
De (6.15), obtemos para r = 1, = /2, um n
0
N tal que
w(t), Ww(t)) /2, t (t
n
, t
n
+ 1), n n
0
.
Temos ent ao que
_

0
[w(s)[
2
ds c
_

0
w(s), Qw(s))ds
c
n=n
0
w(s), Qw(s))
n=n
0
2

2
= .
Esta ultima desigualdade, entretanto, contradiz (6.14).
Uma conseq uencia obvia do Teorema 113 e que, no metodo M3, a
sada x do modelo converge para a sada y = z do sistema real. Neste
caso, diz-se que o metodo possui a caracterstica de identicar a sada.
A propriedade que realmente procuramos, i.e. que o par ametro A(t)
fornecido pela regra de adapta c ao convirja para

A, n ao pode ser obtida
sem hipoteses adicionais (lembre do Exemplo 111).
Lema 114. Seja R(t) = A(t)

A. S ao verdadeiras as armativas:
a) O limite

R := lim
t
|R(t)| existe;
b) R
t
L
2
([0, ); R
n,n
), lim
t
R
t
(t) = 0.
Demonstra c ao: O item a) segue dos Lema 112 e Teorema 113. O item
b) e conseq uencia do Teorema 113 e do fato de w L
2
([0, ); R
n
) (que
segue do Lemma 112).
steuer
2008/3/11
page 134
i
i
i
i
i
i
i
i
AO DE PAR
AMETROS
Teorema 115. Suponha que existem > 0, > 0, T > 0 e uma
seq uencia t
k
kN
com lim
k
t
k
= e
(6.16)
V R
n,n
, k N, s
k
[t
k
, t
k
+T] tal que
_
s
k
+
s
k
V z(s)ds
|V |.
Temos ent ao
lim
t
x(t) z(t) = 0, lim
t
A(t) =

A.
Demonstra c ao: Do Lema 114 sabemos que

R := lim
t
|R(t)| existe.
Suponha que

R > 0. Podemos ent ao, sem perda de generalidade, supor
que
|R(t
k
)| a :=

R/2, k N.
Da equa c ao diferencial w
t
= Cw +Rz(t), obtemos para 0 t
1
t
2
(6.17)
_
t
2
t
1
R(s)z(s)ds
[w(t
2
)[+[w(t
1
)[+c
t
2
t
1
_
_
t
2
t
1
[w(s)[
2
ds
_1
2
.
Da equa c ao diferencial R
t
= Qwz(t)
, obtemos agora
(6.18) |R(t
2
) R(t
1
)| c
t
2
t
1
_
_
t
2
t
1
[w(s)[
2
ds
_1
2
.
Alem disso temos, para todo t 0, a seguinte desigualdade:
(6.19)
_
_
_
_
t+
t
R(t)z(s)ds
_
t+
t
R(s)z(s)ds
_
_
_c
_
t+
t
|R(t)R(s)|ds.
Dena V
k
:= |R(t
k
)|
1
R(t
k
), k N, onde t
k
kN
e a seq uencia for-
necida na hipotese do teorema. Argumentando agora com (6.16) e com
a tecnica de subseq uencias diagonais, podemos garantir a existencia de
uma seq uencia s
k
kN
com
(6.20) s
k
[t
k
, t
k
+T], k N,
_
s
k
+
s
k
V
k
z(s)ds
c, k N.
De (6.17), (6.18), (6.19) temos que
_
s
k
+
s
k
R(s)z(s)ds = 0, lim
kN
|R(t
k
) R(s
k
)| = 0,
steuer
2008/3/11
page 135
i
i
i
i
i
i
i
i

lim
kN
_
s
k
+
s
k
|R(t
k
) R(s)|ds = 0,
que, por sua vez, implica em
lim
kN
_
|R(t
k
)|
_
s
k
+
s
k
V
k
z(s)ds
_
=
_
s
k
+
s
k
R(t
k
)z(s)ds
= 0.
Esta ultima identidade contradiz (6.20), cando assim provado o teo-
rema.
Sem a hipotese adicional (6.16) e ainda possvel provar a convergencia
de A(t) para

A. Entretanto, como a unicidade do par ametro

A e (em
geral) desconhecida, o limite lim
t
A(t) depende da escolha da condi c ao
inicial A
0
. Analisamos a seguir um resultado dessa natureza.
Teorema 116. Suponha que a sada y = z e uma fun c ao T-peri odica.
Ent ao temos
lim
t
x(t) z(t) = 0, lim
t
A(t) = A
+T(A
0
),
onde T e a proje c ao ortogonal do R
n,n
sobre o subespa co
/
o
:= A R
n,n
[ Az(s) = 0, s [0, T]
e A
e o elemento de norma mnima no subespa co am / :=

A+/
o
.
Demonstra c ao: Podemos supor, sem perda de generalidade, que A
0

/
o
(e facil ver que o caso geral sempre pode ser reescrito desta forma).
Da equa c ao diferencial x
t
= Cx + (A C)z(t) + f(t), t 0, segue
que A(t) /
o
, para t 0. Como a seq uencia R(kT)
kN
e limi-
tada, podemos extrair uma subseq uencia k
j
jN
, tal que o limite

R :=
lim
j
R(k
j
T) existe. Como /
o
e fechado e A(t) =

A+R(t), t 0, temos
A :=

A+

R /
o
.
Sejam t
1
, t
2
[0, T] com 0 t
1
t
2
T e sejam
t
1,j
:= t
1
+k
j
T, t
2,j
:= t
2
+k
j
T, j N.
Argumentando como na demonstra c ao do Teorema 115 com a extra c ao
de subseq uencias diagonais, concluimos que
lim
j
_
t
2,j
t
1,j
R(s)z(s)ds = 0, lim
j
_
t
2,j
t
1,j
(R(s) R(k
j
T))ds = 0.
steuer
2008/3/11
page 136
i
i
i
i
i
i
i
i
AO DE PAR
AMETROS
Da periodicidade de z segue agora que
lim
j
_
t
2,j
t
1,j
R(s)z(s)ds = lim
j
_
t
2,j
t
1,j
R(k
j
T)z(s)ds
= lim
j
_
t
2
t
1
R(k
j
T)z(s)ds =
_
t
2,j
t
1,j
Rz(s)ds.
Como t
1
, t
2
[0, T] s ao arbitrarios, temos

Rz(s) = 0 para todo s [0, T].
Portanto,
R /
o
e

A =

A+

R / /
o
.
Isto prova que

A e a unica matriz de norma mnima procurada. Da
unicidade de

A, conclumos agora que a seq uencia A(kT)
kN
con-
verge necessariamente para

A. Da equa c ao diferencial A
t
= Qwz(t)
obtemos, argumentando como na demonstra c ao do Teorema 115, que

lim
t
A(t) =

A.
Comparando agora os resultados obtidos nos problemas do Exem-
plo 111 com o Teorema 116, ca claro o porque de termos encontrado
aproxima c oes distintas para

A.
Observa cao 117. Os metodos descritos acima podem ainda ser utiliza-
dos quando a sada e conhecida apenas em intervalos nitos da forma
[0, T]. Para tanto, basta reiniciar o metodo utilizando como condi c ao
inicial A
0
= A(T), onde A(T) e a primeira aproxima c ao obtida para

A.
Obviamente, o metodo pode ser reiniciado quantas vezes se desejar. 2
Exemplo 118. Considere novamente o sistema do Exemplo 111 em que
A =
_
2 1
1 4
_
, z(t) =
_
d
1
sin e
1
t
d
2
sin e
2
t
_
, t 0.
Reconstruimos o par ametro

A utilizando o metodo M3, de acordo com
a Observa c ao 117 com T = 1. Como no Exemplo 111, os problemas de
valor inicial s ao resolvidos atraves do metodo de RungeKutta.
Considere o primeiro problema, em que d
1
= d
2
= e
1
= 1, e
2
= 2 e
C =
_
10 0
0 10
_
, W =
_
50 0
0 50
_
, A
0
=
_
5 5
5 5
_
.
Reiniciando o metodo M3 por tres vezes, obtemos a seguinte aproxima-
c ao para

A:
_
2.0060 1.0017
1.0042 4.0015
_
.
2
steuer
2008/3/11
page 137
i
i
i
i
i
i
i
i
EXERC
ICIOS 137
Exerccios
6.1. Considere o sistema
z
t
= pz +u, y = z,
com Z
0
:= 0, Q := R, = R, do Exemplo 105. Verique que qualquer
par ametro p R e identicado pelo experimento (0, u), u(t) := t, para
t R.
Quais par ametros p R podem ser identicados pelo experimento (0, u),
u(t) 1?
6.2. Considere o sistema do Exemplo 109:
z
t
1
= (p
1
+p
2
)z
1
+ p
2
z
2
u
z
t
2
= p
2
z
1
p
3
z
2
y = z
1
onde Z
0
:= (0, 0), Q := (q
1
, q
2
, q
3
) R
3
[ q
1
, q
2
, q
3
0, = R.
Verique a arma c ao de que todo par ametro q Q com p
3
> 0 e
identicavel.
Encontre q
1
, q
2
Q tais que L(z, u, q
1
) = L(z, u, q
2
), para todo (z, u)
Z
0
.
steuer
2008/3/11
page 138
i
i
i
i
i
i
i
i
Captulo 7
Calculo Variacional
Neste captulo s ao discutidos resultados preliminares da teoria co-
nhecida como calculo variacional. De forma simplicada, tal teoria
pode ser entendida como extens ao à uma famlia particular de proble-
mas de otimiza c ao (em espa cos de dimens ao innita), de resultados da
analise em varias variaveis, os quais permitem caracterizar os candidatos
à solu c ao de problemas de otimiza c ao em R
n
. Um papel fundamental
no desenvolvimento da teoria e desempenhado pelo teorema de multipli-
cadores de Lagrange e pelas condi c oes de KuhnTucker, discutidos no
Apendice B (veja Sec c ao B.1).
Na Sec c ao 7.1 s ao apresentados os problemas variacionais e intro-
duzidos os conceitos de mnimos locais e de varia c oes de G ateaux. Sob
hipoteses adicionais de convexidade, e apresentado um resultado sobre
condi c oes sucientes para otimalidade (equa c ao de EulerLagrange). Na
Sec c ao 7.2 e apresentado um lema auxiliar (lema de du BoisRaymond)
de fundamental import ancia para obten c ao de condi c oes necessarias. Na
Sec c ao 7.3 analisamos condi c oes necessarias para otimalidade, apresen-
tadas na forma da equa c ao de EulerLagrange e de sua primeira integral.
Nas Sec c oes 7.4 e 7.5 estendemos os resultados anteriores para proble-
mas com trajetorias contnuas por partes e para problemas vetoriais
respectivamente.
steuer
2008/3/11
page 139
i
i
i
i
i
i
i
i
[SEC. 7.1: PROBLEMAS VARIACIONAIS E CONVEXIDADE 139
7.1 Problemas Variacionais e Convexidade
Um problema tpico do calculo das varia c oes e a minimiza c ao de
funcionais do tipo
(7.1) I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt,
onde o intervalo [a, b] e xo e a aplica c ao L : [a, b] R R R e
conhecida. A minimiza c ao do funcional denido em (7.1) e realizada
entre as fun c oes y : [a, b] R continuamente diferenciaveis em [a, b].
1
E comum considerar o problema de minimizar (7.1) sujeito a dife-

rentes restri c oes como:
Impor condi c oes a y nas extremidades do intervalo, i.e. y(a) = y
a
e/ou y(b) = y
b
;
Exigir que g(t, y(t), y
t
(t)) 0 para t [a, b], onde g : [a, b]RR R;
Exigir que
_
b
a
g(t, y(t), y
t
(t)) dt = c, onde g : [a, b]RR R e c R;
O primeiro tipo de restri c ao e denominado condi c ao de contorno e pode
ser exigido em ambos ou em apenas um dos extremos do intervalo [a, b].
O segundo tipo e denominado restri c ao lagrangeana, devido à sua seme-
lhan ca com as restri c oes feitas nos problemas de otimiza c ao restritos em
dimens ao nita. O terceiro tipo e chamado restri c ao isoperimetrica (ou
integral), devido ao fato dos primeiros problemas de interesse relaciona-
dos a esta restri c ao exigirem que os condidatos y tivessem todos o mesmo
comprimento, o que esta relacionado com a escolha g(t, y, y
t
) = [y
t
[.
As restri c oes acima podem aparecer de forma combinada, de modo
que um mesmo problema pode estar sujeito a restri c oes de diferentes
tipos, ou a varias restri c oes do mesmo tipo. Analisamos inicialmente o
tipo mais simples de restri c ao, a saber: as condi c oes de contorno. Proble-
mas variacionais sujeitos a restri c oes lagrangeanas e isoperimetricas s ao
discutidos na Sec c ao 9.2. Sendo assim, considere a famlia de problemas
1
Adotamos no texto a seguinte nota c ao:
C[a, b] := |y : [a, b] R [ y contnua,
C
1
[a, b] := |y : [a, b] R [ y diferenci avel em [a, b], y
C[a, b].
steuer
2008/3/11
page 140
i
i
i
i
i
i
i
i
140 [CAP. 7: C
ALCULO VARIACIONAL
variacionais
(7.2)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y Y
ad
:= y C
1
[a, b] [ y(a) = y
a
, y(b) = y
b
.
O conjunto Y
ad
e denominado conjunto das fun c oes admissveis
(ou viaveis). Da analise real, sabemos que e preciso distinguir entre
mnimos locais e globais do funcional I.
Deni cao 119. y Y
ad
e denominado mnimo global de I : Y
ad
R
quando
I(y) I( y),
para todo y Y
ad
. 2
Denimos a seguir os mnimos locais. A import ancia destes mnimos
vem do fato de que condi c oes apenas necessarias, em geral, os englobam
juntamente com os mnimos globais. Antes da deni c ao, porem, relem-
bramos alguns fatos importantes sobre a topologia dos espa cos C[a, b] e
C
1
[a, b].
O espa co vetorial C[a, b] e completo (espa co de Banach) com a norma
do supremo (ou de Tschebysche), denida por
|f|
:= sup
t[a,b]
[f(t)[, f C[a, b].
Assim sendo, esta norma induz uma metrica (dist ancia) em C[a, b],
denida por
dist(f, g) := |f g|
, f, g C[a, b].
Analogamente, podemos construir uma metrica para C
1
[a, b] com a
dist ancia
|f g|
1,
:= |f g|
+ |f
t
g
t
|
, f, g C
1
[a, b].
Uma vez relembrados estes conceitos, caracterizamos a seguir os pontos
de mnimo local de um funcional I : Y
ad
R.
Deni cao 120. y Y
ad
e denominado mnimo local fraco de I quando
> 0 tq y Y
ad
com |y y|
1,
< temos I(y) I( y).
steuer
2008/3/11
page 141
i
i
i
i
i
i
i
i
y Y
ad
e denominado mnimo local forte de I quando
> 0 tq y Y
ad
com |y y|
< temos I(y) I( y).

2
De especial interesse para os problemas variacionais s ao os mnimos
locais fracos. Note que uma vizinhan ca forte de y Y
ad
possui mais ele-
mentos do que a vizinhan ca fraca correspondente. Portanto, a exigencia
de y ser mnimo local forte e mais restritiva.
A seguir, e apresentada uma deni c ao que estende o conceito de
derivada parcial de aplica c oes f : R
n
R e e de import ancia funda-
mental para a caracteriza c ao de uma solu c ao do problema (7.2).
Deni cao 121. Seja Y um espa co vetorial e I : Y R. Dados y, v Y ,
denimos a varia c ao de G ateaux de I em y na dire c ao de v como
I(y; v) := lim
0
I(y +v) I(y)
,
quando o limite existe. 2
Note que a Deni c ao 121 nos permite concluir que
I(y; v) =
d
d
I(y +v)
=0
,
caso a derivada total em rela c ao à variavel da aplica c ao real
R I(y +v) R
esteja bem denida em = 0. Da Deni c ao 121 segue ainda a linearidade
da varia c ao de G ateaux em rela c ao ao funcional I, i.e. xados y, v Y
temos
(7.3) (I
1
+I
2
)(y; v) = I
1
(y; v) +I
2
(y; v), , R.
Pressuposto, e claro, que as varia c oes envolvidas existam. Outra pro-
priedade interessante se verica em rela c ao à dire c ao de deriva c ao:
(7.4) I(y; v) = I(y; v), R.
Novamente supondo que as varia c oes envolvidas existam.
steuer
2008/3/11
page 142
i
i
i
i
i
i
i
i
142 [CAP. 7: C
ALCULO VARIACIONAL
Exemplo 122. Seja Y = R
n
e f C
1
(Y ; R). Dados y, v Y , temos
f(y; v) = lim
0
f(y +v) f(y)
= f(y), v),
que e a derivada parcial de f em y na dire c ao do vetor v. 2
Exemplo 123. Seja Y = C
1
[a, b] e I : Y y
_
b
a
L(t, y(t), y
t
(t)) dt
R, onde L e uma aplica c ao C
1
([a, b] R
2
; R). Dados y, v Y , temos
I(y; v) =
d
d
I(y +v)
=0
=
_
b
a
_
d
d
L(t, y +v, y
t
+v
t
)
_
=0
dt
=
_
b
a
_
L
y
(t, y(t), y
t
(t))v(t) + L
y
(t, y(t), y
t
(t))v
t
(t)
dt.
2
Os primeiros resultados relativos à caracteriza c ao das solu c oes de
(7.2) surgem quando trabalhamos com hipoteses sobre a convexidade da
fun c ao objetivo. Isto justica a introdu c ao do seguinte conceito.
Deni cao 124. Dado um espa co vetorial Y e um funcional I : D
Y R, dizemos que I e convexo em D quando, para todo par de
elementos y, v Y , temos
I(y + (1 )v) I(y) + (1 )I(v), [0, 1].
I e denominado estritamente convexo em D quando a desigualdade na
express ao acima for estrita. 2
Caso a varia c ao de G ateuax I(y; v) do funcional I esteja denida
para todos elementos y, y + v D, e possvel fornecer uma deni c ao
equivalente de convexidade:
Lema 125. Seja Y um espa co vetorial e I : D Y R tal que, para
todo par de elementos y, v de Y satisfazendo y, y + v D, a varia c ao
de G ateaux I(y; v) existe. S ao equivalentes as arma c oes:
a) I e convexo em D;
b) Para todo par de elementos y, v Y com y, y +v D, temos
I(y +v) I(y) I(y; v).
steuer
2008/3/11
page 143
i
i
i
i
i
i
i
i
E ainda, I e estritamente convexo em D quando a igualdade na desigual-
dade do item b) ocorre se e somente se v = 0.
Demonstra c ao:

E bastante demonstrarmos a equivalencia entre a) e b).
a) = b) Note que, para 0 < < 1, podemos escrever y +v na forma
da combina c ao linear convexa
y +v = (1 )y +(y +v),
com = [0, 1]. Da deni c ao de convexidade, segue que
I(y +v) (1 )I(y) +I(y +v),
de onde obtemos
1
_
I(y +v) I(y)
I(y +v) I(y).

Tomando agora o limite quando 0, obtemos a desigualdade em b).
b) = a) Dados y, v Y e [0, 1], dena w := y + (1 )v. Da
hipotese b) segue
I(w; h
1
) I(v) I(w), I(w; h
2
) I(y) I(w),
para h
1
= (v y), h
2
= (1 )(y v). De (7.4) segue agora que
1
_
I(v) I(w)
I(w; (v y))
1
(1 )
_
I(w) I(y)
,
de onde obtemos I(y) +(1 )I(v) I(w) e o teorema ca provado.
Apresentamos agora uma condi c ao suciente para um problema de
otimiza c ao em que a fun c ao objetivo e convexa.
Lema 126. Dado um espa co vetorial Y e um funcional convexo I : D
Y R, ent ao cada y que satisfaz
I( y; v) = 0, y +v D,
minimiza I em D. Se I e estritamente convexo, ent ao y e unico.
Demonstra c ao: Dado y D, dena v := y y Y . Logo,
I(y) I( y) = I( y +v) I( y) I( y; v) = 0.
A unicidade de y e consequencia imediata da deni c ao de convexidade
estrita.
steuer
2008/3/11
page 144
i
i
i
i
i
i
i
i
144 [CAP. 7: C
ALCULO VARIACIONAL
Estamos agora aptos para formular um resultado que fornece condi c oes
sucientes para determinar a solu c ao do problema (7.2).
Teorema 127. Seja Y = C
1
[a, b], Y
ad
= y Y ; y(a) = y
a
, y(b) = y
b
,
I : Y
ad
y
_
b
a
L(t, y, y
t
)dt R, onde L C
1
([a, b] R
2
; R) satisfaz
(7.5) L(t, y +v, z +w) L(t, y, z) L
y
(t, y, z)v + L
z
(t, y, z)w,
para todo (t, y, z), (t, y + z, z + w) [a, b] R
2
. S ao verdadeiras as
arma c oes:
a) I e convexo em Y
ad
;
b) Se L e tal que a igualdade em (7.5) ocorre se e somente se vw = 0,
ent ao I e estritamente convexo em Y
ad
;
c) Cada y Y
ad
que satisfaz a equa c ao diferencial
(7.6)
d
dt
L
y
(t, y, y
t
) = L
y
(t, y, y
t
), t [a, b]
e um mnimo global de I em Y
ad
.
d) Se a hip otese do item b) e vericada, o elemento y Y
ad
que satisfaz
a equa c ao diferencial do item c) e o unico mnimo global de I em Y
ad
.
Demonstra c ao: Dados y, y +v Y
ad
, a desigualdade (7.5) implica em
(7.7) L(t, y +v, y
t
+v
t
) L(t, y, y
t
) L
y
(t, y, y
t
)v + L
y
(t, y, y
t
)v
t
.
Integrando, obtemos
_
b
a
[L(t, y+v, y
t
+v
t
)L(t, y, y
t
)] dt
_
b
a
[L
y
(t, y, y
t
)v+L
y
(t, y, y
t
)v
t
] dt,
i.e. I(y + v) I(y) I(y; v), provando o item a). Se a hipotese em
b) e verdadeira, ent ao dados y, y + v Y
ad
a igualdade em (7.7) ocorre
se e somente se v(t)v
t
(t) 0 em [a, b]. Note que v(t)v
t
(t) = 1/2(v
2
(t))
t
,
logo v(t)v
t
(t) 0 se e somente se v
2
(t) e constante. Note ainda que
v
2
(a) = 0.
2
Portanto, I(y + v) I(y) = L(y; v) se e somente se v 0
e o item b) ca provado.
2
De fato, como y e y +v pertencem a Y
ad
, ent ao v(a) = v(b) = 0.
steuer
2008/3/11
page 145
i
i
i
i
i
i
i
i
[SEC. 7.2: LEMAS DE DU BOISREYMOND E LAGRANGE 145
Os tens c) e d) s ao os mais importantes do teorema. Suponha que
y Y
ad
e solu c ao da equa c ao diferencial (7.6). Logo, para v Y com
y +v Y
ad
temos
I( y; v) =
_
b
a
[L
y
(t, y, y
t
)v +L
y
(t, y, y
t
)v
t
] dt
=
_
b
a
_
d
dt
L
y
(t, y, y
t
)v
_
dt
= [L
y
(t, y(t), y
t
(t))v(t)]
b
a
= 0.
Como I e convexo (veja o item a)), o item c) segue do Lema 126. Se
a hipotese do item b) e vericada, ent ao I e estritamente convexo e a
unicidade de y segue da segunda parte do Lema 126.
A equa c ao diferencial (7.6) e a conhecida equa c ao de EulerLagrange
uma das mais importantes do calculo variacional. O Teorema 127,
alem de fornecer condi c oes sucientes para garantir a convexidade do
funcional I, garante ainda que, se I e convexo, a equa c ao de Euler
Lagrange representa uma condi c ao suciente para otimalidade de y
Y
ad
. Voltaremos a analisar esta equa c ao diferencial de segunda ordem na
Sec c ao 7.3, quando investigamos condi c oes necessaria para otimalidade.
7.2 Lemas de du BoisReymond e Lagrange
Nesta sec c ao estudamos um lema, cuja formaliza c ao impulsionou
fortemente o desenvolvimento do calculo variacional. Trata-se do lema
de du BoisReymond, que foi objeto de investiga c ao de matematicos
como Euler e Lagrange, tendo sido apresentado por P. du BoisReymond
no ano de 1879. Foi entretanto K. Weierstrass que em seus seminarios
(18751882) apresentou pela primeira vez uma demonstra c ao clara e
completa. A demonstra c ao deste lema utiliza um resultado auxiliar que
enunciamos a seguir.
Lema 128. Seja h C[a, b] tal que
_
b
a
h(t) v
t
(t) dt = 0,
steuer
2008/3/11
page 146
i
i
i
i
i
i
i
i
146 [CAP. 7: C
ALCULO VARIACIONAL
para todo v C
1
0
[a, b] := w C
1
[a, b] [ w(a) = w(b) = 0. Ent ao a
fun c ao h e constante no intervalo [a, b].
Demonstra c ao: Dado c R dena a fun c ao v(t) :=
_
t
a
(h(s) c)ds,
t [a, b]. Por constru c ao, v C
1
[a, b] e v(a) = 0. A escolha particular
c := 1/(b a)
_
b
a
h(s)ds gera uma uma fun c ao v que satisfaz
0
_
b
a
(h(t) c)
2
dt =
_
b
a
(h(t) c) v
t
(t) dt
=
_
b
a
h(t) v
t
(t) dt [ c v]
b
a
= 0,
provando assim que h(t) = c, para t [a, b].
Lema 129 (du BoisReymond). Seja f C[a, b] tal que, para todo
v C
1
[a, b] com v(a) = v(b) = 0, tenhamos
_
b
a
f(t) v(t) dt = 0.
Ent ao, f 0 em [a, b].
Demonstra c ao: Denindo g(t) :=
_
t
a
f(s)ds, segue da hipotese (inte-
grando por partes) que
_
b
a
g(s)v
t
(t) dt = 0, v C
1
0
[a, b].
O Lema 128 implica que g(t) = c, t [a, b]. O lema de du Bois-Reymond
segue agora da identidade g
t
= f.
As fun c oes v utilizadas nos Lemas 128 e 129 s ao denominadas fun c oes
teste, devido ao papel por elas desempenhado. O espa co C
1
0
[a, b] e
tambem denominado espa co de fun c oes teste. Discutimos a seguir uma
generaliza c ao do lema de du BoisReymond, formulada por Lagrange.
Lema 130 (Lagrange). Seja fC[a, b] tal que, para todo vC
k
0
[a, b] :=
v C
k
[a, b] [ v
(j)
(a) = v
(j)
(b) = 0, j = 0, 1, . . . , k, tenhamos
_
b
a
f(t) v(t) dt = 0.
steuer
2008/3/11
page 147
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
AO DE EULERLAGRANGE 147
Ent ao f 0 em [a, b].
Demonstra c ao: Suponha que f(t
0
) > 0 para algum t
0
(a, b). Como f
e contnua, existe [c, d] (a, b) tal que
t
0
(c, d) e f(t)
1
2
f(t
0
) > 0, t (c, d).
Denindo a fun c ao
v(t) :=
_
[(t c)(d t)]
k+1
, t [c, d]
0 , t [a, b]/[c, d]
observamos que v e n ao negativa e v C
k
0
[a, b]. Por constru c ao, temos
que
_
b
a
fv dt =
_
d
c
fv dt > 0, o que contradiz a hipotese. Logo, f(t) 0,
t (a, b). A continuidade de f implica que f(t) 0 em [a, b]. Analoga-
mente, provamos que f(t) 0 em [a, b].
7.3 Equacao de EulerLagrange
Suponha que L : [a, b] R
2
R e duas vezes continuamente dife-
renciavel e que o mnimo local fraco y Y
ad
:= y C
1
[a, b] [ y(a) =
y
a
, y(b) = y
b
do funcional I satisfaz y C
2
[a, b]. Dados C
1
0
[a, b]
e
0
> 0 sucientemente pequeno, denimos a famlia de fun c oes ad-
missveis
y(; ) := y() + (), (
0
,
0
).
Por constru c ao, temos |y(; ) y|
1,
= [[||
1,
. Note ainda que, pelo
fato de y ser mnimo local fraco de I em Y
ad
, temos
J() := I(y(; )) I( y) = J(0), (
0
,
0
).
Isto e, = 0 e mnimo local da fun c ao real J, denida pela composi c ao
de I com a famlia y(; ). Da analise real sabemos que uma condi c ao
necessaria para que isto aconte ca (caso J seja diferenciavel) e que
d
d
J()
=0
= 0.
Da Deni c ao 121, segue que
(7.8) I( y; ) =
d
d
I( y +)
=0
=
d
d
J()
=0
= 0
steuer
2008/3/11
page 148
i
i
i
i
i
i
i
i
148 [CAP. 7: C
ALCULO VARIACIONAL
e uma condi c ao necessaria para que y seja mnimo local de I em Y
ad
.
Uma vez que L e, em particular, continuamente diferenciavel, temos
(veja Exemplo 123)
(7.9) I( y; ) =
_
b
a
[ L
y
(t, y(t), y
t
(t))(t) + L
y
(t, y(t), y
t
(t))
t
(t) ] dt.
Note que a fun c ao
: [a, b] t L
y
(t, y(t), y
t
(t)) R
e continuamente diferenciavel em [a, b], devido às hipoteses feitas sobre L
e y. Como satisfaz as condi c oes de contorno (a) = (b) = 0, obtemos
integrando (7.9) por partes
(7.10) I( y; ) =
_
b
a
_
L
y
(t, y(t), y
t
(t))
d
dt
(t)
_
(t) dt.
Note que (7.10) e valida para todo C
1
0
[a, b]. Logo, segue do lema de
du BoisReymond (Lema 129) que
(7.11) L
y
(t, y(t), y
t
(t))
d
dt
L
y
(t, y(t), y
t
(t)) = 0, t [a, b].
Em (7.11) podemos reconhecer a equa c ao de EulerLagrange obtida na
Sec c ao 7.1 (veja equa c ao (7.6)). Esta equa c ao diferencial de segunda or-
dem nos fornece uma condi c ao necessaria para determina c ao de mnimos
locais de um funcional. Como foi visto no Teorema 127, esta condi c ao
e tambem suciente para otimalidade, caso o funcional I seja convexo.
Podemos resumir a discuss ao acima no seguinte teorema:
Teorema 131. Seja L : [a, b] R R R duas vezes continuamente
diferenci avel e y C
2
[a, b] um mnimo local fraco do problema (7.2).
Ent ao, y e solu c ao do problema de valor de contorno
(7.12)
_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
) = 0, t (a, b)
y(a) = y
a
, y(b) = y
b
.
Demonstra c ao: Veja desenvolvimento acima.
steuer
2008/3/11
page 149
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
Observa cao 132 (problemas com fronteira livre). Analogos ao
problema (7.2) s ao os problemas em que apenas uma condi c ao de con-
torno e imposta, por exemplo a condi c ao y(b) = y
b
. Construindo a
famlia de fun c oes admissveis
y(; ) := y() + (), C
1
[a, b], (b) = 0,
obtemos atraves de um desenvolvimento analogo ao anterior, a condi c ao
necessaria
(7.13)
0 = I( y; ) = L
y
(a, y(a), y
t
(a))(a)
_
b
a
_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
)
_
(t) dt,
para todo C
1
[a, b] com (b) = 0. Note que (7.13) vale em parti-
cular para C
1
0
[a, b], de onde segue (novamente argumentando com
o Lema 129) a equa c ao de EulerLagrange. Tomando agora em (7.13)
C
1
[a, b] com (b) = 0 e (a) ,= 0, obtemos a condi c ao extra
(7.14) L
y
(a, y(a), y
t
(a)) = 0.
Sendo assim, para problemas com com fronteira livre, obtemos, alem da
equa c ao de EulerLagrange, uma condi c ao de contorno para y no ex-
tremo do intervalo [a, b], onde o problema n ao exige nenhuma restri c ao.
Tal condi c ao surge naturalmente da formula c ao variacional do problema
de otimiza c ao, sendo por isso denominada condi c ao de contorno natural.
Resumindo, para que y seja solu c ao do problema
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y y C
1
[a, b] [ y(b) = y
b
e necessario que y seja solu c ao do problema de valor de contorno

_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
) = 0
y(b) = y
b
, L
y
(a, y(a), y
t
(a)) = 0.
Note que, como ocorre no Teorema 131, obtemos uma condi c ao necessaria
expressa na forma (implcita) de uma equa c ao diferencial de segunda or-
dem (equa c ao de EulerLagrange) com duas condi c oes de contorno. 2
steuer
2008/3/11
page 150
i
i
i
i
i
i
i
i
150 [CAP. 7: C
ALCULO VARIACIONAL
As hipoteses y C
2
[a, b] e L C
2
([a, b] R
2
; R) s ao demasiado
restritivas e devem ser enfraquecidas. Esta considera c ao nos leva a ana-
lisar uma aplica c ao do lema de du BoisReymond diferente da utilizada
na obten c ao da equa c ao (7.10) (veja exerccio 7.3).
Teorema 133. Seja L : [a, b] RR R continuamente diferenci avel
e y C
1
[a, b] um mnimo local fraco para o problema (7.2). Ent ao, a
aplica c ao
[a, b] t L
y
(t, y(t), y
t
(t)) R
e continuamente diferenci avel e y e solu c ao do problema de valor de
contorno (7.12) no Teorema 131.
Demonstra c ao: Repetindo a argumenta c ao feita na demonstra c ao do
Teorema 131, obtemos para C
1
0
[a, b]
(7.15)
_
a
b
[L
y
(t, y(t), y
t
(t)) (t) + L
y
(t, y(t), y
t
(t))
t
(t)] dt = 0.
Integrando por partes e observando que (a) = (b) = 0, segue que
_
b
a
_
_
t
a
L
y
(s, y(s), y
t
(s)) ds + L
y
(t, y(t), y
t
(t))
_
t
(t) dt = 0.
O Lema 128 implica na existencia de uma constante c que sasfaz
(7.16)
_
t
a
L
y
(s, y(s), y
t
(s)) ds + L
y
(t, y(t), y
t
(t)) = c, t [a, b].
Como a aplica c ao
[a, b] t
_
t
a
L
y
(s, y(s), y
t
(s)) ds R
e continuamente diferenciavel, segue de (7.16) que a aplica c ao
[a, b] t L
y
(t, y(t), y
t
(t)) R
tambem e continuamente diferenciavel (apesar de exigirmos apenas y
C
1
[a, b]). Podemos ent ao derivar em rela c ao a t a express ao (7.16),
obtendo assim a equa c ao de EulerLagrange.
3
3
N ao e possvel deduzir a equa c ao de EulerLagrange integrando (7.15) por
partes, como na demonstra c ao do Teorema 131, pois para diferenciar a aplica c ao
t L
y
(t, y(t), y
(t)) e preciso usar a regra de cadeia e a fun c ao y, envolvida na

composi c ao, n ao e sucientemente regular. Entretanto, e possvel provar a diferen-
ciabilidade de y
em todo t
0
[a, b] com L
y
y
(t
0
, y(t
0
), y
(t
0
)) ,= 0, caso L seja uma
fun c ao C
3
.
steuer
2008/3/11
page 151
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
As considerac oes feitas na Observa c ao 132 sobre as condi c oes de
contorno naturais continuam validas no caso L C
1
, y C
1
, como o
leitor pode facilmente vericar.
Deni cao 134. As solu c oes da equa c ao diferencial de EulerLagrange
(sem condi c ao de contorno) s ao denominadas fun c oes estacion arias ou
extremais, independente do fato de serem ou n ao solu c oes do problema
variacional. 2
Observa cao 135. Suponha que L e uma aplica c ao continuamente dife-
renciavel e que y Y
ad
e uma fun c ao estacionaria. Integrando a equa c ao
de EulerLagrange, obtemos
(7.17) L
y
(t, y, y
t
) =
_
t
a
L
y
(s, y(s), y
t
(s)) ds + const.
Fazendo a hipotese extra y C
2
[a, b], segue da equa c ao de Euler
Lagrange
d
dt
L(t, y, y
t
) = L
t
(t, y, y
t
) + L
y
(t, y, y
t
)y
t
+ L
y
(t, y, y
t
)y
tt
= L
t
(t, y, y
t
) +
d
dt
[L
y
(t, y, y
t
)y
t
],
que pode ser reescrito como
L
t
(t, y, y
t
) =
d
dt
[L(t, y, y
t
) y
t
L
y
(t, y, y
t
)].
Integrando esta express ao, obtemos a equa c ao
(7.18) L(t, y, y
t
) y
t
L
y
(t, y, y
t
) =
_
t
a
L
t
(s, y(s), y
t
(s)) ds + const.
que e conhecida como primeira integral da equa c ao de EulerLagrange.
Note a semelhan ca com a equa c ao (7.17) e tambem o fato da exigencia
y C
2
[a, b] n ao aparecer explicitamente na equa c ao.
A equa c ao (7.18) pode ainda ser deduzida no caso geral em que
o extremal y e uma fun c ao apenas C
1
[a, b]. Uma demonstra c ao sim-
ples, porem trabalhosa, pode ser encontrada em [Tr, Captulo 6]. Essa
demonstra c ao e levada a cabo acoplando-se a abordagem variacional com
mudan cas de coordenadas convenientes.
No caso aut onomo, i.e., quando a fun c ao L = L(y, y
t
) n ao depende
explicitamente de t, e possvel obter a equa c ao (7.18) para extremais
steuer
2008/3/11
page 152
i
i
i
i
i
i
i
i
152 [CAP. 7: C
ALCULO VARIACIONAL
y C
1
[a, b] de uma forma simples. De fato, da equa c ao de Euler
Lagrange segue que
0 = y
t
_
L
y
(y, y
t
)
d
dt
L
y
(y, y
t
)
_
= L
t
(y, y
t
) + y
t
L
y
(y, y
t
) y
tt
L
y
(y, y
t
) y
t
d
dt
L
y
(y, y
t
)
=
d
dt
L(y, y
t
)
d
dt
[y
t
L
y
(y, y
t
)].
Integrando esta ultima express ao, obtemos a equa c ao (7.18) para o caso
aut onomo
L(y, y
t
) y
t
L
y
(y, y
t
) = const.
2
Os tres exemplos a seguir ilustram como a equa c ao de EulerLagrange
e utilizada para determinar a solu c ao de alguns problemas classicos do
calculo variacional. S ao esses: determina c ao de geodesicas no plano; de-
termina c ao de geodesicas na esfera; a Braquistocrona (ver Sec c ao 1.2.7).
Exemplo 136. Analisamos o problema de encontrar, dados dois pontos
(t
0
, y
0
) e (t
1
, y
1
) no plano, a curva de menor comprimento que os une.
Representamos as curvas admissveis com parametriza c oes do tipo
y : [t
0
, t
1
] t y(t) R; y(t
0
) = y
0
, y(t
1
) = y
1
.
Supondo as curvas admissveis continuamente diferenciaveis, obtemos o
seu comprimento pela express ao
J(y) :=
_
t
1
t
0
_
1 +y
t
(t) dt.
Podemos ent ao resumir o problema como:
_
_
Minimizar J(y) =
_
t
1
t
0
L(t, y(t), y
t
(t)) dt
sujeito a
y C
1
[t
0
, t
1
] [ y(t
0
) = y
0
, y(t
1
) = y
1
onde L(t, y, y
t
) = (1+(y
t
)
2
)
1/2
. Da equa c ao de EulerLagrange obtemos
0 = L
y

d
dt
L
y
= 0
d
dt
_
y
t
(1 + (y
t
)
2
)
1/2
_
.
steuer
2008/3/11
page 153
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
t
t=a
Meridianos
(t,y(t))
P
Q
t=b
Figura 7.1: Curva admissvel unindo os pontos P e Q.
Logo,
y
t
(1 + (y
t
)
2
)
1/2
= const.,
o que implica em y
t
constante, ou em y ser linear. 2
Exemplo 137. Consideramos agora o problema de, xados dois pontos
P e Q na superfcie da esfera de raio r, encontrar a curva de menor
comprimento que os une. Estando a esfera centrada na origem, parame-
trizamo-a localmente pelas coordenadas:
r(cos t cos y, sin t cos y, sin y) com t (0, 2), y (
2
,

2
).
S ao consideradas apenas curvas que cortem cada meridiano em apenas
um ponto. Tais curvas podem ser parametrizadas usando a latitude t
como par ametro. A longitude y de um ponto da curva e dada por uma
fun c ao y(t) da variavel independente t (veja Figura 7.1). Uma curva e
ent ao representada por
[a, b] t r(cos t cos y(t), sin t cos y(t), sin y(t)) R
3
.
Suponha que os pontos a serem unidos sejam parametrizados por:
(a, y
a
), (b, y
b
). Quando y e continuamente diferenciavel, o comprimento
da curva correspondente e dado por
I(y) =
_
b
a
r
_
cos
2
y(t) +y
t
(t)
2
dt.
steuer
2008/3/11
page 154
i
i
i
i
i
i
i
i
154 [CAP. 7: C
ALCULO VARIACIONAL
Logo, L(t, y, y
t
) = r(cos
2
y(t) + y
t
(t)
2
)
1/2
e da primeira integral da
equa c ao de Euler (7.18) obtemos a identidade
cos
2
y = A
_
cos
2
y + (y
t
)
2
,
onde A e constante. Obviamente A (1, 0) e ainda
A
2
(y
t
)
2
= cos
4
y A
2
cos
2
y.
Usando separa c ao de variaveis, temos
Ady
(cos
4
y A
2
cos
2
y)
1/2
= dt.
Logo,
_
Ady
cos y(cos
2
y A
2
)
1/2
= (t a) + B,
onde B e constante. Fazendo a mudan ca de variaveis u = tan y, obtemos
nalmente
y(t) = arctan(
1 A
2
A
sin((t a) +B)),
sendo as constantes A e B determinadas a partir dos dados a, b, y
a
, y
b
.
Note que o equador y = 0 (A = 1) e um extremal. Contudo, se
b a > , uma das partes do equador n ao e o caminho mais curto. Tal
fato nos leva a concluir que pequenas partes desta curva determinam o
caminho mais curto, enquanto que longas partes n ao o fazem.
4
2
Exemplo 138 (Braquist ocrona). Voltamos agora a tratar do pro-
blema apresentado na Sec c ao 1.2.7. Como ja foi visto, o problema de
encontrar a curva de tempo mnimo se deixa formular como
_
_
Minimizar J(y) :=
_
x
1
x
0
_
1 + (y
t
)
2
2gy +c
_
1/2
dx
sujeito a
y C
1
[x
0
, x
1
] [ y(x
0
) = y
0
, y(x
1
) = y
1
4
O tratamento de problemas como o surgido neste exemplo foi motivo de inves-
tiga c ao por Carl Jacobi, que atraves da teoria de campos de extremais conseguiu
esclarecer quando uma fun c ao estacion aria deixa de ser solu c ao do problema varia-
cional. Maiores detalhes podem ser encontrados em [Tr, Captulo 9].
steuer
2008/3/11
page 155
i
i
i
i
i
i
i
i
[SEC. 7.3: EQUAC
onde g e a constante gravitacional e c = c
g,v
0
,y
0
e a energia total do
corpo (cinetica + potencial) no instante inicial. Note que o integrando
e aut onomo, i.e. L = L(y, y
t
). Logo, segue da primeira integral da
equa c ao de Euler (7.18) que
const. = L(y, y
t
) y
t
L
y
(y, y
t
) =
(1 + (y
t
)
2
)
1/2
(2gy +c)
1/2
y
t
(1 + (y
t
)
2
)
1/2
(2gy +c)
1/2
y
t
.
Apos alguma manipula c ao algebrica, obtemos a equa c ao diferencial
(7.19) (2gy +c) (1 + (y
t
)
2
) = const.
Fazendo a hipotese simplicadora c = 0 (que corresponde ao caso par-
ticular v
0
= y
0
= 0), obtemos no lugar de (7.19) a equa c ao diferencial
(7.20) y (1 + (y
t
)
2
) = A.
(Compare com a equa c ao (1.41), obtida na Sec c ao 1.2.7 a partir do
princpio de refra c ao de Fermat.) Para resolver esta equa c ao diferencial
supomos o extremal y da forma
y(x) = A sin
2
(
1
2
(x)).
Substituindo em (7.20), obtemos y
t
=
_
(Ay)/y. De onde segue
A sin(
2
) cos(
2
)
d
dx
=
cos(
2
)
sin(
2
)
.
Portanto, dx = Asin
2
(
2
)d, ou ainda
x = B +
1
2
A( sin ).
Sendo assim, obtemos para o extremal y a seguinte parametriza c ao:
: [
0
,
1
] (b +a( + sin ), a(1 + cos )) R
2
,
onde os par ametros a, b s ao determinados pelas condi c oes de contorno
(
0
) = (x
0
, y
0
), (
1
) = (x
1
, y
1
). A curva descrita pela parametriza c ao
acima e conhecida por cicl oide (veja Figura 1.4). 2
steuer
2008/3/11
page 156
i
i
i
i
i
i
i
i
156 [CAP. 7: C
ALCULO VARIACIONAL
7.4 Extremais Diferenciaveis por Partes
Na Sec c ao 7.3 consideramos como admissveis apenas as fun c oes con-
tinuamente diferenciaveis. Essa hipotese e bastante restritiva e faz com
que determinados problemas variacionais n ao possuam solu c ao (veja
Exemplo 139). Nesta sec c ao exigimos menos regularidade dos candidatos
à solu c ao do problema variacional e obtemos novamente um conjunto de
condi c oes necessarias para otimalidade.
Exemplo 139. Considere o problema variacional com integrando
L(t, y(t), y
t
(t)) := (1 (y
t
)
2
)
2
.
Obviamente temos L(t, y, y
t
) = 0 quando [y
t
[ = 1 e L(t, y, y
t
) > 0, caso
contrario. Portanto, as fun c oes com derivada igual a 1 por partes, s ao
as candidatas naturais à solu c ao do problema variacional
_
_
Minimizar I(y) :=
_
b
a
(1 [y
t
(t)]
2
)
2
dt
sujeito a
y Y
ad
:= y C
1
[0, 1] [ y(0) = y
0
, y(1) = y
1
.
Entretanto, apenas para poucos pares de condi c oes de contorno y
0
, y
1
existe uma solu c ao C

1
[0, 1] para o problema variacional. Em muito
maior n umero s ao as condi c oes iniciais para as quais o problema varia-
cional admite solu c oes apenas contnuas, do tipo zig-zag. 2
O Exemplo 139 ilustra a necessidade de denirmos classes de fun c oes,
que s ao contnuas a menos de um n unero nito de pontos.
Deni cao 140. Uma fun c ao y : [a, b] R e denominada contnua por
partes, nota-se y

C[a, b], quando existe uma parti c ao a = t
0
< <
t
n+1
= b tal que, para todo i = 0, . . . , n, a restri c ao y[
(t
i
,t
i+1
)
possui uma
extens ao contnua ao intervalo [a, b].
Uma fun c ao contnua y : [a, b] R e denominada contnuamente
diferenci avel por partes, nota-se y

C
1
[a, b], quando existe uma parti c ao
a = t
0
< < t
n+1
= b tal que, para todo i = 0, . . . , n, a restri c ao
y[
(t
i
,t
i+1
)
possui uma extens ao continuamente diferenciavel ao intervalo
[a, b]. 2
Observa cao 141. Os conjuntos

C[a, b] e

C
1
[a, b] s ao espa cos vetoriais
(normalisaveis) sobre R. Como

C
1
[a, b] C[a, b], ent ao ||
dene uma
steuer
2008/3/11
page 157
i
i
i
i
i
i
i
i
[SEC. 7.4: EXTREMAIS DIFERENCI
AVEIS POR PARTES 157

norma em

C
1
[a, b]. Entretanto, de especial interesse para este espa co e
a norma denida por
[[f[[
1,
:= max
t[a,b]
[f(t)[ + max
t[a,b]
[f
t
(t)[.
E importante ressaltar que o espa co vetorial normado assim obtido n ao

e completo (Banach) com a topologia induzida pela norma [[ [[
1,
.
(O n umero de pontos de descontinuidade em uma sequencia de fun c oes
pode se tornar ilimitado.) 2
No lema a seguir e apresentada uma vers ao do teorema fundamental
do calculo, que e utilizada no decorrer da sec c ao.
Lema 142. Seja y

C
1
[a, b]. Ent ao vale a identidade
y(t) = y(a) +
_
t
a
y
t
(s) ds, t [a, b].
Demonstra c ao: Note que y
t
e contnua a menos de um n umero nito
de pontos, portanto existe a integral (de Riemann)
_
t
a
y
t
(s) ds, t [a, b].
Sejam t
1
, . . . , t
n
os pontos de descontinuidade de y
t
. Para t [t
k
, t
k+1
],
temos
y(t) y(a) = y(t) y(t
k
) +
k1
l=0
[y(t
l+1
) y(t
l
)]
=
_
t
t
k
y
t
(s) ds +
k1
l=0
_
t
l+1
t
l
y
t
(s) ds =
_
t
a
y
t
(s) ds.
Corolario 143. Seja y

C
1
[a, b]. S ao verdadeiras as arma c oes:
a) Se
_
b
a
y
t
(s)
2
ds = 0, ent ao y
t
0;
b) Se y
t
(t) = 0 em todos os pontos t onde y e diferenci avel, ent ao y e
constante.
steuer
2008/3/11
page 158
i
i
i
i
i
i
i
i
158 [CAP. 7: C
ALCULO VARIACIONAL
Demonstra c ao: Sejam t
1
, ..., t
n
os pontos de descontinuidade de y
t
, t
0
=
a e t
n+1
= b. Da identidade
0 =
_
b
a
y
t
(s)
2
ds =
n
k=0
_
t
k+1
t
k
y
t
(s)
2
ds,
temos que
y
t
[
[t
k
,t
k+1
]
= 0, 0 k n.
Provando assim o item a). O item b) segue imediatamente do Lema 142.
O lema a seguir discute um modo de encontrar uma aproxima c ao
suave para uma fun c ao diferenciavel por partes, i.e., aproximar uma
fun c ao apenas

C
1
por outra C
1
.

E importante observar que, no processo
descrito, a derivada da aproxima c ao e mantida limitada pela derivada
da fun c ao original.
Lema 144. Seja y

C
1
[a, b] e t
1
, . . . , t
n
os pontos de descontinuidade
de y
t
. Ent ao, e possvel encontrar constantes A R e
0
> 0 tais que,
para todo (0,
0
), existe y C
1
[a, b] satisfazendo
a) y[
R
= y, onde R = [a, b]
n
l=0
[t
l
, t
l
+];
b) max
t[a,b]
[y
t
(t)[ 4 max
t[a,b]
[ y
t
(t)[;
c) max
t[a,b]
[y(t) y(t)[ A.
Demonstra c ao: Basta provar o resultado para parti c oes com apenas um
ponto

t. Escolha
0
> 0 tal que [
t
0
,
t +
0
] (a, b). Seja (0,
0
).
A ideia por tras da suaviza c ao consiste em substituir a derivada y
t
por uma poligonal contnua em [
t ,
t + ] e n ao alterar y fora deste

intervalo. Dada uma constante h R, dena a fun c ao
g(t) :=
_
_
_
y
t
(t) , [t
t[ >
(t
t)
1
y
t
(
t ) + (t
t +)
1
h , t [
t ,
t]
(t
t )
1
h + (t
t)
1
y
t
(
t +) , t [
t,
t +]
A partir da, dena a fun c ao y C
1
[a, b]
y(t) := y(a) +
_
t
a
g(s) ds, t [a, b].
steuer
2008/3/11
page 159
i
i
i
i
i
i
i
i
t

t

t+
h
g(t)
y
t
(t)
A
1
A
2
Figura 7.2: Constru c ao da fun c ao g no Teorema 144
Escolhemos agora h, de modo que y = y em [a, b][
t,
t+], satisfazendo
assim a). Este e o caso quando a condi c ao
_

t+
t
g(s) ds =
_

t+
t
y
t
(s) ds =: A
e satisfeita. Na Figura 7.2, observamos que isto equivale a exigir que as

areas A
1
e A
2
sejam iguais. Note que A
= h +

2
[ y
t
(
t ) + y
t
(
t +)].
Escolhemos portanto
h =
A

1
2
[ y
t
(
t ) + y
t
(
t +)].
Denindo agora M := max
t[a,b]
[ y
t
(t)[, obtemos
[A
[ 2M e [h[ 3M.
Da deni c ao de g, segue agora para todo t [a, b]
[y
t
(t)[ = [g(t)[
max [ y
t
(t)[, [ y
t
(
t )[ +[h[, [h[ +[ y
t
(
t +)[
M +[h[ 4M,
provando assim b). Para determinar A em c), basta observar que
[y(t) y(t)[
_
t
t
[y
t
(s) y
t
(s)[ ds
_

t+
t
([y
t
(s)[ +[ y
t
(s)[) ds 10M
e a demonstra c ao ca completa.
steuer
2008/3/11
page 160
i
i
i
i
i
i
i
i
160 [CAP. 7: C
ALCULO VARIACIONAL
Estamos agora em condi c oes de obter condi c oes necessarias para
solu c oes de classe

C
1
de um problema variacional. Antes porem, ana-
lisamos uma importante correspondencia existente entre as solu c oes do
problema (7.2) e do problema
(7.21)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y

Y
ad
:= y

C
1
[a, b] [ y(a) = y
a
, y(b) = y
b
.
Para simplicar a nota c ao, denominamos os problemas (7.2) e (7.21)
por problemas (P) e (

P) respectivamente. A m de analisar as solu c oes
do problema (

P), observe que o conceito de mnimo local fraco na
Deni c ao 120 e naturalmente estendido ao problema (

P), bastando para
isto substituir o espa co Y
ad
por

Y
ad
naquela deni c ao.
Teorema 145. Seja L : [a, b] RR R uma aplica c ao contnua. Se
y Y
ad
e um mnimo local fraco para o problema (P), ent ao y tambem
e mnimo local fraco para o problema (

P).
Demonstra c ao: Se y e mnimo local fraco de (P), ent ao existe > 0 tal
que
I( y) I(v), v S
:= v Y
ad
[ |v y|
1,
< .
Tome y

Y
ad
com | y y|
1,
< /5. Dado > 0 sucientemente
pequeno, o Lema 144 garante a existencia de v
,
C
1
[a, b] tal que
|v
,
v|
A e |v
t
,
|
4|v
t
|
,
onde v := y y

C
1
[a, b] e a constante A depende apenas de y e y.
Denindo a fun c ao y
:= y +v
,
Y
ad
, temos
|y
y|
1,
= |v
,
|
1,
= |v
,
|
+ |v
t
,
|
|v
,
v|
+ |v|
+ 4 |v
t
|
A + 4 | y y|
1,
A +
4
5
.
steuer
2008/3/11
page 161
i
i
i
i
i
i
i
i

Logo, y
se escolhermos < /5A. Temos ent ao que

I( y) I(y
) [I(y
) I( y)[
I( y) [I( y +v
,
) I( y +v)[
I( y)
_

t+
t
[L(t, y +v
,
, ( y +v
,
)
t
)
[L(t, y +v, ( y +v)
t
)[ dt.
Tomando o limite quando 0, a integral do lado direito converge a
zero e obtemos I( y) I( y).
Resumindo, o Teorema 145 garante que toda solu c ao C
1
e tambem
uma solu c ao

C
1
do problema variacional. Um resultado analogo para
mnimos globais pode tambem ser formulado, assim como resultados
relativos a problemas em que faltam condi c oes de contorno (veja Ob-
serva c ao 132).
A recproca do Teorema 145 n ao e verdadeira, conforme ilustra o
exemplo a seguir.
Exemplo 146. Considere a fun c ao L(t, y, y
t
) := y
2
(1y
t
)
2
denida em
[a, b] = [1, 1], e as condi c oes de contorno y
a
= 0, y
b
= 1. Observe que
a fun c ao
y(t) :=
_
0 , t 0
t , t 0
e um mnimo global de I em

Y
ad
, pois I( y) = 0. Vericamos a seguir
que n ao existe outro mnimo global. Suponha que y

Y
ad
e um outro
mnimo. Como y(1) = 1, o escalar denido por
:= inf [1, 1] [ y(t) > 0, < t 1
necessariamente satisfaz [1, 1]. Da identidade I(y) = I( y) = 0,
obtemos y
t
(t) = 1, para t (, 1], i.e.
y(t) = t, t [, 1].
Como y e contnua, segue da deni c ao de que = 0. Logo,
y(t) = t, t [0, 1].
Note agora que y(1) = y(0) = 0. Note ainda que, para todo t (1, 0)
com y(t) ,= 0, temos necessariamente y
t
(t) = 1. Podemos ent ao concluir
que y(t) = 0, t [1, 0]. Sendo assim, o problema variacional n ao possui
solu c ao em Y
ad
e a unica solu c ao em

Y
ad
e a fun c ao y. 2
steuer
2008/3/11
page 162
i
i
i
i
i
i
i
i
162 [CAP. 7: C
ALCULO VARIACIONAL
O proximo teorema fornece as desejadas condi c oes necessarias para
otimalidade do problema variacional (

P).
Teorema 147. Seja L : [a, b] R R continuamente diferenci avel e
y

Y
ad
um mnimo local fraco para o problema (

P). Ent ao, existe uma
constante c R tal que
(7.22) L
y
(t, y(t), y
t
(t)) =
_
t
a
L
y
(s, y(s), y
t
(s)) ds + c, t [a, b]
e ainda
(7.23) L
y
(t, y(t), y
t
(t)) = L
y
(t, y(t+), y
t
(t+)), t (a, b).
Demonstra c ao: Dado
0
> 0, escolha

C
1
[a, b] com (a) = (b) = 0.
Como y e mnimo local, temos I( y; ) = 0. Da hipotese de diferencia-
bilidade de L, segue que 0 = I( y; ) =
d
d
I( y +)[
=0
, i.e.
_
b
a
[ L
y
(s, y(s), y
t
(s)) (s) + L
y
(s, y(s), y
t
(s))
t
(s) ] ds = 0.
Integrando por partes, obtemos
(7.24)
_
b
a
_
_
s
a
L
y
(r, y(r), y
t
(r)) dr + L
y
(s, y(s), y
t
(s))
_

t
(s) ds = 0.
Escolhemos agora a constante c (usando o teorema do valor medio) de
forma que a fun c ao v

C
1
[a, b] denida por
v(t) :=
_
t
a
_
_
s
a
L
y
(r, y(r), y
t
(r)) dr + L
y
(s, y(s), y
t
(s)) c
_
ds
satisfa ca a condi c ao
v(a) = v(b) = 0.
Tomando agora f(s) :=
_
s
a
L
y
(r, y(r), y
t
(r)) dr + L
y
(s, y(s), y
t
(s)),
s [a, b], segue da equa c ao (7.24)
_
b
a
v
t
(s)
2
ds =
_
b
a
[f(s) c]
2
ds
=
_
b
a
f(s) [f(s) c] ds c
_
b
a
[f(s) c] ds
= 0 c
_
b
a
f(s) ds + c
2
(b a) = 0.
steuer
2008/3/11
page 163
i
i
i
i
i
i
i
i

O Corolario 143 nos permite concluir que v
t
0 em [a, b], ou seja
(7.25) L
y
(t, y(t), y
t
(t)) =
_
t
a
L
y
(s, y(s), y
t
(s)) ds + c, t [a, b].
Para provar a segunda parte do teorema, basta observar que (7.25) im-
plica na continuidade da aplica c ao t L
y
(t, y(t), y
t
(t)) em [a, b].
Corolario 148. Seja L : [a, b] RR R continuamente diferenci avel
e y

Y
ad
um mnimo local fraco para o problema (

P). Ent ao, y satis-
faz a equa c ao de EulerLagrange nos pontos t (a, b) de continuidade
de y
t
.
Demonstra c ao: De fato, se y
t
e contnua no ponto t (a, b), segue de
(7.22) que a aplica c ao
s L
y
(s, y(s), y
t
(s))
e continuamente diferenciavel em uma vizinhan ca de t. A Equa c ao de
EulerLagrange segue agora derivando-se (7.22), como na demonstra c ao
do Teorema 133.
Resumindo, o Teorema 147 garante que um mnimo local fraco do
problema (

P) satisfaz a equa c ao de EulerLagrange nos pontos de con-
tinuidade de sua derivada. Alem disso, as unicas descontinuidades ad-
missveis em um mnimo local fraco s ao aquelas que preservam a con-
tinuidade da aplica c ao
t L
y
(t, y(t), y
t
(t)).
A condi c ao formulada em (7.23) e denominada condi c ao de
WeierstraErdmann.

E possvel ainda provar que um mnimo local
fraco do problema (

P) satisfaz a primeira integral de equa c ao de Euler
Lagrange e que a aplica c ao
t L(t, y(t), y
t
(t)) y
t
(t) L
y
(t, y(t), y
t
(t))
e contnua. Esta ultima condi c ao e denominada segunda condi c ao de
WeierstraErdmann.
steuer
2008/3/11
page 164
i
i
i
i
i
i
i
i
164 [CAP. 7: C
ALCULO VARIACIONAL
7.5 Problemas Vetoriais
Generalizamos nesta sec c ao para problemas variacionais vetoriais os
resultados obtidos ate agora ao longo do captulo. Considere o problema
(7.26)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y

Y
ad
:= y

C
1
([a, b]; R
n
) [ y(a) = y
a
, y(b) = y
b
,
onde L C
1
([a, b] R
2n
; R) e y
a
, y
b
R
n
s ao dados. Os problemas
vetoriais se caracterizam pelo fato dos canditados serem fun c oes vetoriais
y(t) = (y
1
(t), . . . , y
n
(t)), com y
j

C
1
[a, b].
O teorema a seguir generaliza para o problema (7.26) as condi c oes
necessarias obtidas para o problema variacional escalar (7.21).
Teorema 149. Seja L : [a, b] R
2n
R continuamente diferenci avel e
y

Y
ad
um mnimo local fraco para o problema (7.26). Ent ao, y satisfaz
a equa c ao vetorial de EulerLagrange
d
dt
L
y
(t, y, y
t
) = L
y
(t, y, y
t
)
nos pontos t [a, b] de continuidade de y
t
. Tambem e satisfeita a
primeira integral da equa c ao de Euler
L(t, y, y
t
) y
t
(t), L
y
(t, y, y
t
))
=
_
t
a
L
t
(s, y(s), y
t
(s)) ds + const., t [a, b].
(Note que esta equa c ao e escalar, enquanto a equa c ao de EulerLagrange
e vetorial.) Nos pontos t [a, b] de descontinuidade de y
t
s ao satisfeitas
as condi c oes de WeierstraErdmann
L
y
(t, y(t), y
t
(t)) = L
y
(t+, y(t+), y
t
(t+)),
[L y
t
, L
y
)](t) = [L y
t
, L
y
)](t+).
(Note que a primeira condi c ao e vetorial e a segunda e escalar.)
Demonstra c ao:

E totalmente analoga às demonstra c oes anteriores,
bastando deduzir as equa c oes vetoriais componente a componente.
steuer
2008/3/11
page 165
i
i
i
i
i
i
i
i
EXERC
ICIOS 165
Nos problemas vetoriais considerados nesta sec c ao a fun c ao objetivo
e escalar. Em muitos problemas de controle otimo (e em seus correspon-
dentes variacionais) e conveniente considerar fun c oes objetivo vetoriais,
i.e. I :

Y
ad
R
k
. Neste caso, utiliza-se o conceito de Pareto otimalidade
para eleger uma estrategia otima. Para maiores detalhes consulte [Lei].
Exerccios
7.1. Calcule a primeira integral da Equa c ao de EulerLagrange quando
L = L(t). Mostre que as fun c oes lineares s ao estacionarias.
7.2. Calcule a primeira integral da Equa c ao de EulerLagrange quando
L = L(t, y).
7.3. Prove que | |
1,
dene uma norma em

C
1
[a, b]. Mostre que o
espa co vetorial normado assim obtido n ao e completo.
7.4. Prove que, se g, h C[a, b] s ao tais que
_
b
a
[g(t)v(t) + h(t)v
t
(t)] dt = 0,
para todo v C
1
0
[a, b], ent ao h C
1
[a, b] e h
t
= g.
(Sugest ao: Veja demonstra c ao do Teorema 133.)
7.5. Demonstre o lema de du BoisReymond (Lema 129) utilizando o
Exerccio 7.4.
7.6. Se L = L(y, y
t
) e uma aplica c ao C
1
, mostre que toda fun c ao
estacionaria y

Y
ad
satisfaz a primeira integral da Equa c ao de Euler
Lagrange
L( y, y
t
) y
t
L
y
( y, y
t
) = const.
nos pontos t (a, b) de continuidade de y
t
.
7.7. Seja L uma aplica c ao C
1
e y

Y
ad
uma fun c ao estacionaria.
Mostre que a segunda condi c ao de WeierstrassErdmann
(L y
t
L
y
)(t
) = (L y
t
L
y
)(t
+
), t [a, b]
e satisfeita.
(Sugest ao: Utilize o fato do extremal y satisfazer a primeira integral da
Equa c ao de EulerLagrange: L(t, y, y
t
) yL
y
(t, y, y
t
) =
_
t
a
L
t
(s, y, y
t
)ds+
const.)
steuer
2008/3/11
page 166
i
i
i
i
i
i
i
i
166 EXERC
ICIOS
7.8. Dada L C
1
([a, b] R
3
; R), calcule a varia c ao de G ateaux da
aplica c ao I : C
2
[a, b] R denida por
I(y) :=
_
b
a
L(t, y(t), y
t
(t), y
tt
(t)) dt.
a) Dada y Y
ad
:= C
2
[a, b] [ y(a) = y
a
; y(b) = y
b
; y
t
(a) = y
t
a
, dena
g(t) :=
_
t
a
L
y
(s, y, y
t
, y
tt
)ds e h(t) :=
_
b
t
[L
y
(s, y, y
t
, y
tt
) g(y)]ds.
Mostre que, para todo v Y
0
:= C
2
[a, b] [ v(a) = v(b) = v
t
(a) = 0,
temos
I(y, v) =
_
b
a
[h(t) +L
y
(t, y, y
t
, y
tt
)]v
tt
(t) dt
_
h(t)v
t
(t)
b
a
.
b) Conclua que uma condi c ao necessaria para que y seja mnimo local
de I em Y
ad
e
I( y, v) =
_
b
a
[h(t) L
y
(t, y, y
t
, y
tt
)]v
tt
(t) dt = 0, v Y
0
.
c) Use o Exerccio 7.9 para garantir que a aplica c ao t L
y
(t, y, y
t
, y
tt
)
e diferenciavel e obtenha a equa c ao de EulerLagrange para problemas
de segunda ordem
d
dt
_
d
dt
L
y
L
y
_
= L
y
, t (a, b).
7.9. Seja k > 0 xo. Mostre que, se h C[a, b] e tal que
_
b
a
h(t)v
(k)
(t) dt = 0, v C
k1
0
[a, b],
ent ao h e um polin omio de grau < k.
7.10. Seja L C
1
([a, b] R
3
; R). Mostre que se y C
3
[a, b] e solu c ao
da equa c ao de EulerLagrange do Exerccio 7.8, ent ao y e solu c ao da
primeira integral da Equa c ao de EulerLagrange (para problemas de
segunda ordem)
L y
t
_
L
y

d
dt
L
y
_
y
tt
L
y
=
_
b
a
L
t
(s, y, y
t
, y
tt
)ds + const.
steuer
2008/3/11
page 167
i
i
i
i
i
i
i
i
EXERC
ICIOS 167
7.11. Seja L C
1
([a, b] R
k+1
; R). Mostre que um mnimo local de
I(y) :=
_
b
a
L(t, y(t), . . . , y
(k)
(t)) dt
em Y
ad
:= y C
k
[a, b] [ y(a) = a
1
, y(b) = b
1
, . . . , y
(
k 1)(a) = a
k1
,
y
(
k 1)(b) = b
k1
satisfaz a equa c ao de EulerLagrange de k-esima
ordem
L
y

d
dt
L
y
+
d
2
dt
2
L
y
. . . + (1)
k
d
k
dt
k
L
y
(
k)
= 0.
7.12. Considere o problema variacional
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t))dt
sujeito a y y C
1
[a, b] [ y(b) = y
b
, y(a) y
a
.
a) Mostre que para y ser solu c ao deste problema variacional e necessario
que satisfa ca
_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
) = 0
y(b) = y
b
, L
y
(a, y(a), y
t
(a)) 0.
b) Prove que a igualdade na condi c ao de contorno natural L
y
(a, y(a),
y
t
(a)) 0 ocorre exatamente quando y(a) = y
a
.
7.13. Complete os detalhes da demonstra c ao do Teorema 149.
7.14. Prove a identidade nas equa c oes (7.3) e (7.4) do texto.
steuer
2008/3/11
page 168
i
i
i
i
i
i
i
i
Captulo 8
Princpios Variacionais na
Mecanica
Neste captulo investigamos formula c oes variacionais para problemas
de mec anica (cinematica). O objetivo e apresentar diferentes abordagens
para problemas relacionados à mec anica (devidas a Newton, Lagrange
e Hamilton) e deduzir a equa c ao de HamiltonJacobi como condi c ao
necessaria para otimalidade de um problema de minimiza c ao.
Na Sec c ao 8.1 s ao estudados, sob a otica da mec anica Newtoni-
ana, alguns problemas da cinematica, de onde deduzimos as leis de
Newton e Kepler. Na Sec c ao 8.3 e apresentado o formalismo introduzido
por Lagrange, que e exemplicado para o problema dos N-corpos. Na
Sec c ao 8.4 analisamos a mec anica Lagrangeana sob a otica de Hamilton,
que toma como ponto de partida a equa c ao diferencial de Euler.
8.1 Mecanica Newtoniana
O que hoje e denominado mec anica cl assica foi fundado no seculo
XVII por Newton e em primeira m ao delineado por Huygens, Leibniz
e Bernoulli (Johann). A contribui c ao de Newton foi ter colocado na
forma de uma equa c ao de movimento as grandezas for ca e acelera c ao.
Formulamos a seguir as Leis de Newton em sua forma original:
I) Todo corpo conserva o seu estado de repouso ou movimento retil-
neo uniforme, quando n ao for obrigado, por uma for ca externa, a
alterar o seu movimento.
steuer
2008/3/11
page 169
i
i
i
i
i
i
i
i
[SEC. 8.1: MEC
ANICA NEWTONIANA 169

II) A altera c ao no movimento e proporcional à for ca externa e ocorre
na dire c ao da linha reta na qual esta for ca atua.
III) A toda a c ao corresponde uma a rea c ao proporcional e em sentido
contrario a primeira.
No texto acima, corpo tem o signicado de massa pontual, i.e. partculas
pontuais de massa que n ao se deformam. Na Lei I), o termo movimento
corresponde à curva t r(t) descrita pelo ponto de massa no espa co;
r(t) descreve a posi c ao do ponto de massa no instante de tempo t, que
funciona como par ametro da curva.
As experiencias praticas motivaram que o espa co na mec anica classica
fosse considerado homogeneo (i.e. todos os pontos do espa co desfrutam
das mesmas propriedades) e isotr opico (i.e. o espa co n ao possui dire c oes
privilegiadas). Desta forma, o espa co onde se passa o movimento e um
espa co am: A especica c ao da posi c ao r(t) n ao e importante, mas sim
a especica c ao de r(t) relativa à posi c ao de um observador no mesmo
instante de tempo. Escolhendo uma origem para o espa co am, obtemos
a partir da o espa co vetorial R
3
e podemos, com o auxlio da repre-
senta c ao vetorial dos pontos deste, considerar r(t) como vetor posi c ao
do ponto de massa.
O tempo representa na fsica n ao relativista uma fun c ao especial.
Considerando-se que o ponto de massa possua seu proprio sistema de
contagem de tempo (e.g., caso ele possua um relogio de pulso), o obser-
vador mede em seu relogio
(8.1) t
B
=
B
+
B
,
onde
B
e uma constante positiva, que representa a proporcionalidade
entre as unidades de tempo do observador e do ponto de massa; e
B
representa a rela c ao entre os tempos iniciais do observador e do ponto de
massa. A equa c ao (8.1) pode ser escrita na forma da equa c ao diferencial:
(8.2)
d
2
t
B
d
2
= 0.
Da podemos concluir que o tempo e descrito por um espa co unidi-
mensional am e apartir da escolha de um tempo zero, podemos dis-
cernir entre os conceitos de antes e depois. A ocorrencia de um movi-
mento, descrito por uma trajet oria t r(t), corresponde a um ponto
steuer
2008/3/11
page 170
i
i
i
i
i
i
i
i
170 [CAP. 8: PRINC
IPIOS VARIACIONAIS NA MEC
ANICA
(t, r(t)) RR
3
. A trajetoria r e geralmente representada, em rela c ao
a um sistema especial de coordenadas, por:
r(t) = (x(t), y(t), z(t)) (coordenadas cartesianas)
r(t) = (r(t), (t), (t)) (coordenadas polares).
A partir do conhecimento da trajetoria t r(t), derivamos o con-
ceito de velocidade
1
v(t) :=
dr
dt
(t) = r(t)
e o conceito de acelera c ao
a(t) :=
dv
dt
(t) = v(t).
O estado de repouso e descrito por r(t) = 0 para todos os tempos t,
enquanto que o movimento retilneo uniforme (velocidade constante) e
descrito por
(8.3) r(t) = r
0
+v
0
t.
A Lei I) diz que (8.3) representa o movimento de um corpo, sobre o
qual n ao e exercida nenhuma for ca externa. Se um corpo e lan cado
da posi c ao P para a posi c ao Q, sem interferencia de for cas externas,
seu movimento descreve o caminho mais curto unindo os pontos P e Q
(desde que, e claro, o sistema referencial o observador n ao esteja
sujeito a acelera c oes).
Deni cao 150. Um sistema referencial, para o qual a Lei I) vigore na
forma r(t) = 0 para todos os tempos t e denominado sistema referencial
inercial. 2
Para um sistema referencial inercial, as leis I) e II) assumem a forma:
mr = F,
ou mais detalhadamente
(8.4) mr(t) = F(t, r(t), r(t)), para todo t,
1
Utilizamos a nota c ao fsica para derivadas: y, y, originalmente introduzidas por
Newton.
steuer
2008/3/11
page 171
i
i
i
i
i
i
i
i
[SEC. 8.1: MEC

onde F e a resultande de todas as for cas agindo sobre o corpo de massa
m. O movimento e obtido, integrando-se a equa c ao diferencial (8.4).
Para tanto, s ao necessarias as condi c oes iniciais r(0) e r(0).
No caso de utilizarmos um sistema referencial sujeito a acelera c oes,
a equa c ao (8.4) assume uma forma mais complexa.

E facil ver que
qualquer sistema que se movimente uniformemente em rela c ao a um
sistema inercial e, ele proprio, um sistema referencial inercial.
O conceito de movimento na Lei II) pode ser identicado com o
impulso (tambem denominado quantidade de movimento)
p(t) := m r(t).
Sendo assim, a equa c ao (8.4) toma a forma
(8.5) p(t) = F(t, r(t), r(t)) para todo t.
Observa cao 151. A hipotese de que a massa m do corpo independe do
movimento ocorre em muitos casos. Entretanto, se quisermos ser mais
precisos, a massa de um corpo e fun c ao de sua massa quando em repouso
m
0
e da velocidade com a qual o corpo se move, na forma
(8.6) m =
m
0
_
1
[v(t)[
2
c
2
,
onde a constante c representa a velocidade da luz (veja Sec c ao 8.2). Para
todas as velocidades, pequenas em rela c ao à velocidade da luz, [v[c
1
e
muito menor que 1 e podemos considerar a massa constante ao longo
do movimento (note que discutimos aqui sobre pontos de massa e n ao
sobre avi oes ou foguetes, que perdem massa ao longo do movimento).
2
As mais importantes das for cas fundamentais da natureza s ao a
for ca gravitacional e a for ca de Coulomb. Inuencias fortes e fracas de
partculas elementares n ao desempenham papel importante na mec anica.
A for ca gravitacional
(8.7) F
AB
= Gm
A
m
B
r
A
r
B
[r
A
r
B
[
3
atua constantemente sobre a linha reta unindo os pontos de massa A e
B. Aqui G e a constante de atra c ao gravitacional de Newton e m
a
, m
b
steuer
2008/3/11
page 172
i
i
i
i
i
i
i
i
172 [CAP. 8: PRINC
ANICA
representam as massas dos respectivos corpos. Segundo a lei de Coulomb
temos
(8.8) F
AB
= e
A
e
B
r
A
r
B
[r
A
r
B
[
3
.
Aqui a situa c ao e outra: A intensidade e a dire c ao de atua c ao da for ca
depende das cargas e
A
, e
B
das partculas A, B. A constante depende
da escolha da escala para unidade de massa.
A Lei III) se torna importante, quando fontes de for ca interagem
mutuamente entre si. Este e o caso, por exemplo, quando consideramos
dois corpos de massas parecidas. Entretanto, se a rela c ao entre as massas
for muito desigual, podemos desprezar a rea c ao do corpo mais leve. Esta
e geralmente a situa c ao, quando consideramos o movimento dos planetas
em torno do sol.
Seja F um campo conservativo, i.e. um campo de for cas cuja in-
uencia sobre um corpo nele includo, depende somente da posi c ao que
o corpo ocupa. Logo F = F(r). A m de que um corpo percorra um
caminho unindo os pontos P, Q dentro deste campo, e necessario que
seja efetuado um certo trabalho. Este trabalho e a soma innitesimal do
produto da for ca pelo deslocamento. Portanto, se P = r
0
e Q = r
1
, o
trabalho e descrito pela integral ao longo do caminho
(8.9) A
PQ
=
_
F, dr).
Consideramos o trabalho como uma grandeza, que pode ser inserida em
um corpo e nele permane ca armazenada, ou que possa ser retirada do
corpo. Tal grandeza e denominada energia.
Para a abordagem feita nesta sec c ao utilizamos o sistema de medidas
M-K-S. Se identicamos massa com peso, encontramos para a constante
gravitacional de Newton o valor (experimental)
G 6.67510
11
m
3
kg
1
s
2
,
enquanto que para a velocidade da luz obtemos
c 10
8
m s
2
.
Consideremos agora movimentos em campos de for cas. Suponha que
dispomos de um campo central, i.e. que possua a representa c ao
(8.10) F(r) = f([r[)
r
[r[
, r R
3
0,
steuer
2008/3/11
page 173
i
i
i
i
i
i
i
i
[SEC. 8.1: MEC

onde f e uma fun c ao escalar. Tal campo e na verdade um campo gradi-
ente, pois satisfaz
(8.11) F(r) = U
t
([r[)
r
[r[
, r R
3
0, com U(r) :=
_
r
r
0
f(r
t
)dr
t
,
onde r
0
e uma constante a priori escolhida. A fun c ao U e denominada
potencial do campo
2

E imediato observar que podemos obter outro po-
tencial simplesmente adicionando a U uma constante.
Exemplo 152. Considere dois pontos de massa, com massas respecti-
vamente m
1
e m
2
, sujeitos à a c ao gravitacional. Temos
m
1
r
1
= F
12
, m
2
r
2
= F
21
= F
12
, onde F
ij
= Gm
1
m
2
r
i
r
j
[r
i
r
j
[
3
.
Denindo a coordenada do centro de massa
r
S
:=
m
1
r
1
+m
2
r
2
m
1
+m
2
,
temos r
S
= 0, i.e. o centro de massa se encontra em movimento retilneo
uniforme. A din amica real se encontra no movimento relativo dos pontos
de massa. Seja r := r
1
r
2
. Temos ent ao
r
1
= r
S
+
m
2
m
1
+m
2
r, r
2
= r
S

m
1
m
1
+m
2
r
e ainda
(8.12) r = Gm
1
m
2
r
[r[
3
com :=
m
1
m
2
m
1
+m
2
,
onde e denominada massa reduzida. Desta forma, o sistema de dois
corpos se reduz ao movimento de uma partcula de massa em rela c ao
à coordenada do centro de massa. A massa reduzida esta submetida à
a c ao do campo de for ca. Seu potencial e
(8.13) U(r) :=
u
r
, r R0,
onde u := Gm
1
m
2
. 2
2
O sinal negativo a frente do potencial representa uma nota c ao fsica.
steuer
2008/3/11
page 174
i
i
i
i
i
i
i
i
174 [CAP. 8: PRINC
ANICA
Consideremos agora o caso geral de uma partcula de massa m sujeita
a um campo central. A energia total
E(r, v) =
m
2
[v[
2
+U([r[)
e composta da energia cinetica E
kin
:=
m
2
[v[
2
e da energia potencial
E
pot
:= U([r[).

E valido o seguinte teorema de conserva c ao de energia:
(8.14) E(r(t), v(t)) = E
0
:= E(r(0), v(0)), t R,
uma vez que
dE
dt
(r(t), v(t)) = mv(t), v(t)) +F(r(t)), v(t)) = 0.
O momento angular J no sistema e denido por
J(r, v) := mr v.
E valido o seguinte teorema de conserva c ao do momento angular:

(8.15) J(r(t), v(t)) = J
0
:= J(r(0), v(0)) , t R,
uma vez que
dJ
dt
(r(t), v(t)) = mr(t) v(t) = r(t) f([r(t)[)
r(t)
[r(t)[
= 0.
Desta forma, o movimento transcorre em um plano perpendicular a J
0
=
mr(0)v(0). Isto sugere a utiliza c ao de coordenadas polares neste plano
(denominado x y):
x(t) = r(t) cos (t), y(t) = r(t) sin (t),
de forma que o momento angular possua somente uma componente na
coordenada z:
(8.16) J
z
= mr
2
, i.e. =
J
z
mr
2
.
A conserva c ao de energia, nessas coordenadas, signica que
(8.17)
m
2
( r
2
+r
2

2
) +U(r) = E
0
.
steuer
2008/3/11
page 175
i
i
i
i
i
i
i
i
[SEC. 8.1: MEC

Explicitando agora r em (8.16) e (8.17), temos
r =
_
2(E
0
U(r))
m

J
2
z
m
2
r
2
.
Ou ainda, escrevendo na forma
dr
d
, que
(8.18)
1
r
2
dr
d
=
2m(E
0
U(r))
J
2
z
1
r
2
.
Levando agora em considera c ao a forma especial do potencial U(r) :=
u
r
e introduzindo a fun c ao () :=
1
r()
, obtemos a equa c ao diferen-
cial:
(8.19)
d
d
=
2m(E
0
+u)
J
2
z
2
.
Denindo agora as constantes
p :=
J
2
z
um
, :=
_
1 +
2E
0
J
2
z
mu
2
,
temos que
(8.20)
_
d
d
_
2
+
_

1
p
_
2
=

2
p
2
.
Note que esta equa c ao e resolvida por
() :=
1
p
+

p
cos(
0
).
Portanto,
(8.21) r() =
p
1 + cos(
0
)
.
E sabido que (8.21) e a representa c ao do corte de um cone em coorde-

nadas polares:
> 1 : Hiperbole = 1 : Parabola < 1 : Elipse.
steuer
2008/3/11
page 176
i
i
i
i
i
i
i
i
176 [CAP. 8: PRINC
ANICA
Consideremos agora o problema do movimento planetario em nosso
sistema solar. O campo de for cas e o campo gravitacional gerado pelo sol
(de massa M). Um planeta de massa m esta sujeito à for ca gravitacional:
(8.22) F(r) := GmM
r
[r[
3
, r R
3
0,
que e um campo central (o sol no centro). Da dedu c ao acima, obtemos
a primeira lei de Keppler, pois, devido às nossas observa c oes, E
0
< 0.
1
a
Lei de Keppler: Os planetas se movem em orbitas
elpticas em torno do sol, que se encontra no foco das res-
pectivas trajetorias.
A taxa de varia c ao da area

A no plano da orbita e obtida, a partir do
raio da orbita (solplaneta), da rela c ao:
A(t + t) A(t) =
1
2
r(t) r(t + t)
1
2
r(t) v(t)t.
Temos assim
A(t) =
1
2
[r(t) v(t)[ =
J
z
2m
;
isto e,

A e constante. Obtemos da a segunda lei de Keppler:
2
a
Lei de Keppler: O vetor do raio da orbita do sol ao
planeta percorre, em intervalos de tempo iguais, areas iguais.
A area A de uma elipse e dada por ab, onde a, b s ao os semi-eixos. Na
nota c ao acima, obtemos para a orbita elptica dos planetas:
a =
p
1
, b =

pa.
Denominando por T o perodo de uma orbita completa de um planeta,
temos que A =
TJ
z
2m
. A partir da obtemos (utilizando as constantes p,
J
z
, u) que
a
3
T
2
=
J
2
z
4
2
m
2
p
=
GM
4
2
.
Este e o conte udo da terceira lei de Keppler:
3
a
Lei de Keppler: A raz ao entre o cubo do semi-eixo
maior e o quadrado do perodo da orbita e constante.
steuer
2008/3/11
page 177
i
i
i
i
i
i
i
i
[SEC. 8.2: TEOREMAS CONSERVATIVOS EM SISTEMAS FECHADOS 177
8.2 Teoremas Conservativos em Sistemas Fecha-
dos
Considere um sistema constitudo de N pontos de massa P
1
, . . . ,
P
N
, com respectivas massas m
1
, . . . , m
N
, submetido às for cas internas
F
ik
(atuando entre P
i
e P
k
) e às for cas externas K
i
. As for cas internas
s ao for cas centrais com potenciais U
ik
. A equa c ao de movimento e
(8.23) m
i
r
i
=
k,=i
F
ik
(r
ik
) +K
i
, i = 1, . . . , N,
onde r
ik
:= r
i
r
k
. Em nota c ao simplicada, temos:
Impulso T: T :=
N
i=1
m
i
r
i
;
Centro de massa o: r
S
:=
m(r
1
, . . . , r
N
)
M
,
onde m(r
1
, . . ., r
N
):=
N
i=1
m
i
r
i
, M:=
N
i=1
m
i
;
Energia c: c :=
1
2
N
i=1
m
i
[ r
i
[
2
+
N
i=1
N
l=i+1
U
il
([r
il
[);
Momento angular : :=
N
i=1
m
i
r
i
r
k
.
De um algebrismo elementar, obtemos
(8.24)
Mr
S
=
N
i=1
K
i
,
dT
dt
=
N
i=1
K
i
,
d
dt
=
N
i=1
r
i
K
i
,
dc
dt
=
N
i=1
r
i
, K
i
).
Em um sistema fechado, i.e. um sistema em que n ao atuam for cas exter-
nas (K
1
= = K
N
= 0), temos os seguintes teoremas de conserva c ao:
Conserva cao de Impulso :
dT
dt
= 0
Conserva cao de Energia :
dc
dt
= 0
Conserva cao do Centro de massa :
dr
S
dt
=
T
M
Conserva cao do Momento angular :
d
dt
= 0
Se torna importante a seguinte pergunta: Quais mudan cas de coorde-
nadas levam sistemas referenciais inerciais em outros sistemas referen-
steuer
2008/3/11
page 178
i
i
i
i
i
i
i
i
178 [CAP. 8: PRINC
ANICA
ciais inerciais? S ao as denominadas Transforma c oes de Galilei:
( : (t, r) (t +, Qr +wt +a),
onde Q e uma matriz ortogonal, = 1 e det(Q) = 1.
3
Uma segunda
classe de transforma c oes de Galilei e denida quando tomamos = 1 e
det(Q) = 1. O importante e vericar que as transforma c oes de Galilei
formam um grupo, o denominado grupo ort ocrono. Cada uma dessas
transforma c oes possui, no caso N = 1, dez par ametros livres:
Q depende de 3 par ametros ( angulos);
w depende de 3 par ametros;
a depende de 3 par ametros;
depende de 1 par ametro.
N ao e por acaso que existem dez quantidades escalares nas grandezas
conservadas: Impulso, Energia, Centro de massa, Momento angular. A
invari ancia da lei de Newton:
mr = F(t, r, r)
tem, em rela c ao às transforma c oes de Galilei, conseq uencias que ja foram
mencionadas. Uma transla c ao no tempo: t t + age de forma que F
n ao dependa explicitamente do tempo. Uma transla c ao espacial: r
wt + q age de forma que F dependa somente das coordenadas r
i
r
j
,
r
i
r
j
. Uma invari ancia em rela c ao à rota c ao: r Qr signica que
F(Qr, Q r) = QF(r, r).
8.3 Mecanica Lagrangeana
O fato desta teoria ser denominada mec anica Lagrangeana e devido
aos matematicos (fsicos) do seculo XVIII: dAlembert, Euler, Legendre,
Maupertuis e Lagrange.
Na determina c ao das posi c oes no sistema de N corpos, precisamos
obter N vetores de posi c ao, i.e. 3N coordenadas escalares. Em geral,
denomina-se por grau de liberdade o n umero de variaveis (escalares) a
serem determinadas dentro de um sistema. As variaveis do sistema
n ao precisam necessariamente tratarem-se de coordenadas cartesianas.
3
N ao apresentamos o desenvolvimento aqui. Para detalhes veja [Sc].
steuer
2008/3/11
page 179
i
i
i
i
i
i
i
i
[SEC. 8.3: MEC
ANICA LAGRANGEANA 179

Quando um conjunto qualquer q
1
, . . . , q
d
de coordenadas determina to-
talmente o estado de um sistema (nesse caso com d graus de liberdade),
denominamo-as por coordenadas generalizadas e as derivadas correspon-
dentes por velocidades generalizadas.
4
O espa co R
d
R
d
e denominado
espa co de fase.
A especica c ao das coordenadas generalisadas juntamente com as
velocidades generalizadas em um tempo qualquer possibilita o conheci-
mento completo do sistema e permite, a princpio, que possamos des-
cobrir a trajetoria no futuro. Da concluimos que, conhecidas todas
as coordenadas q
i
e velocidades q
i
em um tempo qualquer, tambem a
acelera c ao q
i
neste instante de tempo esta unicamente determinada. A
equa c ao que relaciona a acelera c ao com a coordenada e a velocidade e
denominada din amica do sistema.
Newton deriva as equa c oes de movimento das por ele denominadas
leis de movimento. Uma formula c ao generalizada dessas leis de movi-
mento e descrita pelo denominado princpio da a c ao mnima. Mauper-
tuis
5
procurou, da mesma forma que Fermat, por tal princpio geral
que abrangesse todas as leis da mec anica. A sua ideia foi formular este
princpio a partir do impulso mvs (m = massa, v = velocidade, s =
dist ancia), porem seu formalismo e impreciso. Euler buscou uma formula
que possusse como ponto central a integral de a c ao. Tal princpio foi -
nalmente denominado princpio Hamiltoniano. Por este princpio, todo
sistema mec anico com d graus de liberdade e caracterizado por uma
fun c ao: a fun c ao Lagrangeana L, da forma
(8.25)
(t, q
1
, . . . , q
d
, q
1
, . . . , q
d
) L(t, q
1
, . . . , q
d
, q
1
, . . . , q
d
) =: L(t, q, q).
Nas aplica c oes que vamos aqui analisar, a hipotese de L ser uma fun c ao
duas vezes continuamente diferenciavel e razoavel.
De onde surgem entretanto as equa c oes de movimento? De forma
indireta. As equa c oes de movimento surgem como aplica c ao do princpio
da a c ao mnima à fun c ao lagrangeana L. Um movimento [a, b] t
4
Por exemplo, no problema do pendulo simples (com suporte xo) temos um unico
grau de liberdade, a saber: o angulo.
5
Maupertuis e tambem conhecido como grand aplatisseur pois tomou, na disputa
entre as escolas Cartesiana e Newtoniana, partido pela ultima, armando que a Terra
era achatada nos p olos e n ao no equador. Sua conclus ao se baseou em medi c oes reali-
zadas durante uma expedi c ao cientca realizada em 1736, que objetivou determinar
o comprimento de um grau ao longo de um meridiano.
steuer
2008/3/11
page 180
i
i
i
i
i
i
i
i
180 [CAP. 8: PRINC
ANICA
q(t) R
d
ocorre quando a integral
_
b
a
L(t, q(t), q(t))dt, sujeita a restri c ao
q
a
:= q(a), q
b
:= q(b), e minimizada.
A integral
_
b
a
L(t, q(t), q(t)dt e denominada integral de a c ao, pois L
pode ser interpretado como energia e o produto de energia por tempo e
denominado a c ao.
Fica assim claro qual e a forma da equa c ao de movimento:

E a
equa c ao diferencial de Euler para o seguinte problema variacional:
P
/
(a, b; q
a
, q
b
)
_
_
_
Minimizar J(a, b; q
a
, q
b
) :=
_
b
a
L(t, q(t), q(t))dt
sujeito às restri c oes q(a) = q
a
, q(b) = q
b
.
Para o problema dos N corpos de massas m
1
, . . . , m
N
, descrito na
Sec c ao 8.2, temos d := 3N graus de liberdade e as coordenadas gene-
ralizadas s ao as coordenadas do deslocamento dos corpos. Denimos a
fun c ao Lagrangeana
(8.26) L(t, q
1
, . . . , q
d
, q
1
, . . . , q
d
) :=
1
2
N
i=1
m
i
r
i

N
i=1
N
l=i+1
U
il
([r
il
[).
Utilizando a nota c ao
U(r
1
, . . . , r
N
) :=
N
i=1
N
l=i+1
U
il
([r
il
[)
para o potencial, obtemos
L
q
k
=
U
q
k
,
d
dt
L
q
k
= m
k
q
k
,
onde m
k
e uma nota c ao simplicada (n ao enumerada) para as coor-
denadas. Da equa c ao diferencial de Euler para o problema correspon-
dente P
/
(a, b; q
a
, q
b
), deduzimos as leis de movimento Newtonianas. O
princpio da a c ao mnima nos leva, portanto, de volta aos fundamen-
tos da mec anica classica. (Note que o princpio da a c ao maxima, ou
princpio de Fermat, nos leva a mesma conclus ao.)
Observa cao 153. Uma vez escolhido para um determinado sistema a
fun c ao lagrangeana, e possvel deduzir as equa c oes de movimento.Tais
equa c oes de movimento permanecem inalteradas, caso seja inserido na
equa c ao Lagrangeana o diferencial de uma fun c ao suave (t, q) M(t, q).
steuer
2008/3/11
page 181
i
i
i
i
i
i
i
i
[SEC. 8.3: MEC
ANICA LAGRANGEANA 181

Figura 8.1: A corda sob tens ao
A integral de a c ao, neste caso, ca alterada apenas por uma constante.
2
O princpio Hamiltoniano de a c ao mnima e valido n ao somente para
o movimento de uma partcula, mas para problemas mais complicados,
conforme ilustra o exemplo a seguir.
Exemplo 154. Considere que em uma corda de comprimento 4l est ao
pendurados dois pontos de massa, conforme a Figura 8.1. S ao conside-
rados somente deslocamentos verticais e, alem disso, s ao considerados
apenas pequenos deslocamentos (para deslocamentos grandes, as consi-
dera c oes feitas aqui n ao se aplicam). Sejam y
1
(t), y
2
(t) os deslocamentos
no tempo t das massas m
1
= m e m
2
= 2m respectivamente. A energia
cinetica do sistema (oscilando) e dada por
m
2
y
1
(t)
2
+m y
2
(t)
2
.
E uma hipotese sicamente importante considerar a energia potencial

proporcional à distens ao da corda. Obtemos assim, para a parte que
corresponde à distens ao do lado esquerdo do o (a esquerda de m
1
), a
express ao
_
(2l)
2
+y
1
(t)
2
2l = 2l(
_
1 + (
y
1
(t)
2l
)
2
1).
Como estamos considerando apenas pequenas distens oes da corda, a
express ao correspondente à raiz pode ser aproximada por
1 +
1
2
(
y
1
(t)
2l
)
2
.
steuer
2008/3/11
page 182
i
i
i
i
i
i
i
i
182 [CAP. 8: PRINC
ANICA
Obtemos assim para a energia potencial correspondente a express ao
y
1
(t)
2
4l
.
Considera c oes analogas nos permitem obter para os dois outros segmen-
tos do o (no centro e à direita de m
2
) as seguintes express oes para a
energia potencial:
[ y
2
(t) y
1
(t) [
2
2l
,
y
2
(t)
2
2l
.
Temos assim a energia potencial total do sistema dada por
V (y
1
, y
1
) = (
y
1
(t)
2
4
+
[ y
2
(t) y
1
(t) [
2
2
+
y
2
(t)
2
2
),
onde e uma constante de proporcionalidade entre a elasticidade do o
e o seu comprimento. A fun c ao Lagrangeana correspondente e
L(t, y, y) =
m
2
( y
1
2
+ 2 y
2
2
)

4
(y
2
1
+ 2(y
2
y
1
)
2
+ 2y
2
2
).
A equa c ao diferencial de Euler para o problema variacional resultante
nos fornece o seguinte sistema
y
1
=

2m
(3y
1
+ 2y
2
), y
2
=

2m
(y
1
2y
2
).
Temos assim
d
2
dt
2
(y
1
+y
2
) =
( 3)
2m
(y
1
+
2 2
3
y
2
).
Se escolhemos de forma que = (2 2) ( 3)
1
, i.e. = 2 ou
= 1, obtemos para u := y
1
+ y
2
, = 2 ou = 1, a seguinte
equa c ao diferencial
u =
2
u bzw. u = 4
2
u,
com :=

2m
. Resolvendo-a, obtemos as solu c oes linearmente indepen-
dentes
u
1
(t) = a
1
cos (t
1
), u
2
(t) = a
2
cos 2(t
2
),
steuer
2008/3/11
page 183
i
i
i
i
i
i
i
i
[SEC. 8.4: MEC
ANICA HAMILTONIANA 183

com constantes de integra c ao a
1
,
1
, a
2
,
2
. A partir da, obtemos a
solu c ao geral para o movimento, como combina c ao linear da forma
y
1
:=
1
3
(u
1
+ 2u
2
), y
2
:=
1
3
(u
1
u
2
).
Por exemplo, para a condi c ao inicial
y
1
(0) = b, y
1
(0) = 0, y
2
(0) = b, y
2
(0) = 0,
obtemos a solu c ao
y
1
(t) = b cos t, y
2
(t) = b cos t
correspondente. 2
8.4 Mecanica Hamiltoniana
A mec anica Lagrangeana foi investigada por Hamilton no seculo
XVIII em um novo contexto. Partimos da fun c ao Lagrangeana
L : [a, b] R
d
R
d
R e da respectiva equa c ao diferencial de Eu-
ler
(8.27)
L
q

d
dt
L
q
= 0.
Esta equa c ao gera um sistema com d equa c oes diferenciais de segunda
ordem, que em geral e n ao linear. Portanto, n ao simples de ser integrado.
Tentamos a seguir uma tecnica que facilita esta tarefa. Denimos o
momento conjugado
p :=
L
q
(t, q, q)
e obtemos de (8.27)
p =
L
q
(t, q, q) , p =
L
q
(t, q, q).
Este e agora um sistema de equa c oes de primeira ordem, implcito em
rela c ao a q. Tornamos a seguir essa dependencia explcita. Resolvendo
o momento conjugado em q, atraves da hipotese
q = G(t, q, p),
steuer
2008/3/11
page 184
i
i
i
i
i
i
i
i
184 [CAP. 8: PRINC
ANICA
obtemos o seguinte sistema explcito
q = G(t, q, p), p =
L
q
(t, q, G(t, q, p)).
Note que o teorema de fun c oes implcitas (veja [Wa1]) nos fornece as
condi c oes sucientes para a solubilidade local:
(8.28) det
_

2
L
q
i
q
j
_
,= 0.
A solubilidade global ao longo de um extremal requer considera c oes mais
detalhadas.
Denimos agora
H(t, q, p) := p, G(t, q, p)) L(t, q, G(t, q, p))
e denominamos L a correspondente fun c ao de Hamilton. Da regra da
cadeia, obtemos (utilizamos a seguir nota c ao simplicada)
H
p
i
= G
i
+
_
p,
G
p
i
_
_
L
q
,
G
p
i
_
=G
i
+
_
p,
G
p
i
_
_
p,
G
p
i
_
=G
i
,
H
q
i
=
_
p,
G
q
i
_
L
q
i
_
L
q
,
G
q
i
_
=
_
p,
G
q
i
_
L
q
i
_
p,
G
q
i
_
=
L
q
i
,
H
t
=
_
p,
G
t
_
L
t

_
L
q
,
G
t
_
=
_
p,
G
t
_
L
t

_
p,
G
t
_
=
L
t
.
Essas equa c oes nos levam ao sistema
(8.29) q =
H
p
(t, q, p), p =
H
q
(t, q, p),

H =
H
t
(t, q, p),
pois
dH
dt
=
H
t
+
_
H
q
, q
_
+
_
H
q
, p
_
.
Em (8.29) temos um sistema com 2d+1 equa c oes diferenciais de primeira
ordem. Essas equa c oes s ao denominadas equa c oes can onicas de movi-
mento. Elas s ao completadas por condi c oes de contorno para q e uma
condi c ao inicial para H.
Quando obtemos a aplica c ao G atraves do teorema de fun c oes impl-
citas, G e m1 vezes continuamente diferenciavel sempre que a fun c ao
Lagrangeana e m vezes continuamente diferenciavel (verique!). Das
steuer
2008/3/11
page 185
i
i
i
i
i
i
i
i
[SEC. 8.4: MEC

equa c oes do sistema (8.29), obtemos ent ao que a fun c ao de Hamilton e
tambem m vezes continuamente diferenciavel. Logo, n ao ha perda de
regularidade quando introduzimos o momento conjugado.
Observa cao 155. O sistema de equa c oes can onicas desfruta de uma
propriedade interessante. Se uma gura A
0
R
d
R
d
e transformada
pelo sistema de equa c oes can onicas na gura A(t) no tempo t, ent ao
temos Volume(A
0
) = Volume(A(t)) (ate mesmo a orienta c ao e conser-
vada). Isto e conseq uencia da formula de evolu c ao de volume em uma
equa c ao diferencial ordinaria. Para a equa c ao y
t
= f(y), esta formula
nos diz que
v(t) = v(0) +
_
A
0
div(f)(x) dx +O(t
2
),
onde v(t) := Volume(A(t)) e div(f) e o divergente do campo vetorial f.
Como em um campo vetorial can onico
f := (
H
p
,
H
q
),
quando este e continuamente diferenciavel, o divergente
div(
H
p
,
H
q
) =

2
H
pq

2
H
qp
e identicamente nulo e a fun c ao volume v e constante. Este resultado e
conhecido como teorema de Liouville (veja [Wa2]). 2
Caso H n ao dependa explicitamente do tempo, a equa c ao diferencial
para H e trivial. O sistema restante pode ser escrito na forma compacta
z
t
= JH(z), J :=
_
0 I
I 0
_
, z := (q, p).
Deni cao 156. Uma fun c ao M : [a, b] R
2d
R e denomindada
uma (primeira) integral, quando para toda solu c ao (q, p) das equa c oes
can onicas (8.29), existir uma constante k com M(t, q(t), p(t)) = k, para
todo t. 2
A denomina c ao integral vem do fato que, eventualmente, integrando
as equa c oes can onicas e utilizando uma formula do tipo M(t, q, p) = k e
possvel obter o movimento. Note que a primeira integral n ao e suciente
steuer
2008/3/11
page 186
i
i
i
i
i
i
i
i
186 [CAP. 8: PRINC
ANICA
para este objetivo (q(t) R
d
). Entretanto, no caso aut onomo, se dispo-
mos de d integrais, podemos tentar obter completamente o movimento
a partir das formulas:
M
1
(q, p) = k
1
, . . . , , M
d
(q, p) = k
d
.
No problema do movimento planetario obtivemos, apos a redu c ao do
problema a um plano, duas integrais (energia e momento angular) e o
movimento pode ser calculado. Uma interpreta c ao geometrica da inte-
gral e que o movimento ocorre sobre a superfcie de nvel M(q, p) = k.
Primeiras integrais s ao obtidas da seguinte forma: Se H independe
de alguma variavel q
i
ou p
i
, ent ao a proje c ao sobre esta variavel e uma
primeira integral. Em particular a fun c ao de Hamilton e uma primeira
integral, caso ela n ao dependa explicitamente do tempo.
Seja M : [a, b]R
2d
R uma aplica c ao continuamente diferenciavel.
Seja ainda (q, p) uma solu c ao conhecida de (8.29) em [a, b]. Ao longo
desta solu c ao, temos que
dM
dt

M
t
=
_
M
q
, q
_
+
_
M
p
, p
_
=
_
M
q
,
H
p
_
_
M
p
,
H
q
_
=: [H, M],
onde [H, M] e denominado colchete de Poisson. Portanto, para que M
seja uma primeira integral e necessario e suciente que
(8.30)
M
t
(t, q, p) + [H, M](t, q, p) = 0, (t, q, p) [t
0
, t
1
] R
2d
.
E de simples verica c ao o fato de o colchete de Poisson de duas integrais

gerar uma outra integral (possivelmente trivial).
Exemplo 157. Seja a fun c ao Lagrangeana
L(t, q, q) :=
_
(t
2
+q
2
)(1 + q
2
).
A resolu c ao da equa c ao
p =
L
q
(t, q, q)
em rela c ao a q nos fornece a rela c ao
q =
p
_
t
2
+q
2
p
2
.
steuer
2008/3/11
page 187
i
i
i
i
i
i
i
i
[SEC. 8.4: MEC

Obtemos assim a fun c ao de Hamilton
H(t, y, p) =
p
2
_
t
2
+q
2
p
2
_
t
2
+q
2
_
1 +
p
(t
2
+q
2
p
2
)
=
_
t
2
+q
2
p
2
.
As equa c oes can onicas s ao
q =
p
_
t
2
+q
2
p
2
, p =
q
_
t
2
+q
2
p
2
.
Obviamente, temos que
M(q, p) := p
2
q
2
dene uma primeira integral. 2
Ainda uma observa c ao sobre tecnicas de transforma c ao. Suponha
que f : R R e uma fun c ao estritamente convexa, da qual desejamos
descobrir o ponto de mnimo. Suponha ainda que f
t
dene um difeo-
morsmo, i.e. f
t
: R R e bijetiva e f
tt
() > 0, para todo R.
Dena
f
(p) := sup
R
p f(), p R.
O supremo e atingido em um ponto com f
t
() = p. A transforma c ao
p e denominada transforma c ao de Legendre e f
e a transformada
de Legendre de f. Note que f
e novamente convexa. Por constru c ao,

temos que (f
= f e
(8.31) f() +f
(p) p, p, R.
Note ainda que a seguinte equivalencia e valida:
(8.32) f() +f
(p) = p f
t
() = p.
Fazendo uma compara c ao com a deni c ao anterior da fun c ao de Hamil-
ton, observamos que H(t, y, p) pode ser escrita como
H(t, q, p) = L(t, q, .)
(p).
Este e o ponto de partida para uma formula c ao geral do princpio Hamil-
toniano. A teoria necessaria para analise de transforma c oes de Lagrange
genericas e a analise convexa.
steuer
2008/3/11
page 188
i
i
i
i
i
i
i
i
188 [CAP. 8: PRINC
ANICA
Exemplo 158. Suponha
f() :=
1
[[
, R, > 1.
Logo, f
t
() =
1
e obtemos da que
f
(p) =
1
[p[
, p R,
onde
1
+
1
= 1. Observe a conex ao entre f e f
na dualidade dos
espa cos l
, l
e L
(X), L
(X) (X R
d
). 2
Exemplo 159. Considere novamente o movimento de uma partcula de
massa m em um campo central. Supomos que o movimento ocorre o
plano (plano (xy)) e usamos a representa c ao por coordenadas polares
x(t) = r(t) cos (t) , y(t) = r(t) sin (t) .
Uma fun c ao Lagrangeana e
L(r, , r, ) :=
m
2
( r
2
+r
2

2
) U(r).
Neste caso, temos q
1
= r, q
2
= , p
1
= m r =: p
r
, p
2
= mr
2
=: p
. A
fun c ao de Hamilton e
H(q, p) =
p
2
r
2m
+
p
2
2mr
2
+U(r),
de onde obtemos as equa c oes can onicas
(8.33) r =
p
r
m
, =
p
mr
2
, p
r
=
p
2
mr
3
U
t
(r), p
= 0.
Podemos novamente detectar quais grandezas s ao conservadas neste pro-
blema. 2
Observa cao 160. Transforma c oes no espa co R
d
R
d
geram trans-
forma c oes nas equa c oes Hamiltonianas. Tais transforma c oes se tor-
nam interesantes quando preservam estruturas especiais (simpleticas)
nas equa c oes can onicas. Tal analise nos conduz ao grupo o
2d
(R) das
matrizes simpleticas. S ao matrizes M tais que
M
T
JM = J,
steuer
2008/3/11
page 189
i
i
i
i
i
i
i
i
EXERC
ICIOS 189
isto e matrizes ortogonais com rela c ao à estrutura simpletica. Em
outras palavras, a forma bilinear em R
d
R
d
denida por (x, y)
[x, y] := x, Jy) e invariante a mudan cas de coordenada geradas por
uma matriz simpletica, i.e. [x, y] = [Mx, My], para todo x, y R
d
.
O contexto abstrato para analise geometrica da mec anica Lagrangeana/
Hamiltoniana e o das variedades simpleticas. Aqui, a fun c ao Lagrangeana
e considerada como uma fun c ao denida no espa co tangente ao espa co
de coordenadas. 2
Observa cao 161. Quando consideramos o problema P
/
(a, b; q
a
, q
b
),
tomamos xos b, q
b
e consideramos a famlia de problemas P
/
(, b; , q
b
).
Da obtemos uma fun c ao de a c ao
(8.34) o(t, q) := inf P
/
(t, b; q, q
b
), (t, q) [a, b] R
d
.
Calculando formalmente, obtemos
(8.35)
o
q
(t, q) = p,
o
t
(t, q) = H(t, q, p).
Portanto, a fun c ao de a c ao e solu c ao da equa c ao parcial
(8.36)
o
t
+H(t, q,
o
q
) = 0, (t, q) [a, b] R
d
,
e satisfaz as condi c oes de contorno
(8.37) o(b, q) = 0, q R
d
.
A equa c ao (8.36) e denominada equa c ao de HamiltonJacobi.
Uma serie de quest oes surge do desenvolvimento acima, como por
exemplo: diferenciabilidade de o; validade das equa c oes em (8.35),
(8.36); solubilidade do problema de valor inicial (8.36), (8.37). Uma
analise destas quest oes no contexto da teoria de controle otimo e apre-
sentada nos Captulos 11 e 12, quando estudamos a fun c ao valor otimo.
2
Exerccios
8.1. Considere a fun c ao Lagrangeana L(t, q, p) := p
2
in [a, b]. Obtenha
a fun c ao Hamiltoniana H e a equa c ao de HamiltonJakobi.
steuer
2008/3/11
page 190
i
i
i
i
i
i
i
i
190 EXERC
ICIOS
8.2. Considere a fun c ao Lagrangeana L(t, q, p) := f(q)
_
1 +p
2
em
[a, b]. Obtenha a fun c ao Hamiltoniana H e a equa c ao de Hamilton
Jakobi.
8.3. Considere a fun c ao Lagrangeana L(t, q, p) :=
_
t
2
+q
2
_
1 +p
2
em
[a, b]. Obtenha a fun c ao Hamiltoniana e os extremais.
8.4. Considere a integral de a c ao
1
2
_
b
a
(m q(t)
2
cq(t))dt.
a) Obtenha a equa c ao diferencial de Euler;
b) Formule as equa c oes can onicas (coordenadas p, q) e obtenha a fun c ao
de Hamilton;
c) Calcule os colchetes de Poisson [q, p], [q, H] e [p, H]. O que podemos
concluir da primeira integral?
8.5. Seja f(x) := e
[x[
[x[ 1, x R. Calcule a transformada de
Legendre f
(f
(y) := sup
xR
(xy f(x)), y R).
8.6. A fun c ao de Hamilton para o movimento de um ponto de massa
em um campo de for cas com potencial U e dada por
H(q, p) :=
1
2m
[p[
2
+U(q), q, p R
3
.
Calcule a fun c ao de Hamilton em coordenadas cilndricas e esfericas.
8.7. Considere a fun c ao Lagrangeana
L(t, x, x) :=
m
2
x
2

[x +[

[x [
.
(Campo de Coulomb com dois centros xos.) Obtenha a a fun c ao de
Hamilton e as equa c oes can onicas.
8.8. Considere o sistema escalar x = U
t
(x), com U : R R duas
vezes continuamente diferenciavel. Suponha que U seja qualitativamente
da forma apresentada na Figura 8.2.
a) O que representam os extremos locais de U para o movimento?
Como se distinguem os maximos dos mnimos locais de U em rela c ao ao
steuer
2008/3/11
page 191
i
i
i
i
i
i
i
i
EXERC
ICIOS 191
U
E
x
0
Figura 8.2: Um perl de potencial
movimento?
b) Fa ca um esboco da curva correspondente ao movimento no plano de
fase x x;
c) Calcule lim
EE
0
T(E), onde T(E) e o perodo de tempo do movimento
para E proximo a E
0
.
8.9. Fa ca um esbo co do potencial unidimensional
U(r) := 5re
r
+r
4
+
2
r
e da curva correspondente ao movimento no plano de fase x x, para
uma partcula de massa unitaria, como fun c ao da energia e da posi c ao
inicial.
8.10. Considere dois pendulos identicos de comprimento l e massa
m, acoplados por um o ideal. O o esta estendido quando ambos os
pendulos est ao em repouso. Para pequenas perturba c oes, a energia total
e dada por
E =
1
2m
(q
2
2
+q
2
4
) +
1
2
m
2
0
(q
2
1
+q
2
3
) +
1
2
m
2
1
(q
1
q
3
)
2
.
a) Identique os termos na equa c ao acima;
b) Obtenha as equa c oes de movimento;
c) Encontre uma mudan ca de variaveis que desacople as equa c oes de
movimento e resolva as novas equa c oes encontradas.
steuer
2008/3/11
page 192
i
i
i
i
i
i
i
i
Captulo 9
Calculo Variacional e
Controle

Otimo
Analisamos neste captulo a conex ao existente entre problemas do
calculo variacional e problemas de controle otimo. Na Sec c ao 9.1 e
feita uma breve apresenta c ao dos problemas de controle otimo. Na
Sec c ao 9.2 s ao estudados problemas variacionais sujeitos às restri c oes
transversais, isoperimetricas e lagrangeanas, descritas na Sec c ao 7.1. Os
resultados obtidos s ao estendidos aos problemas de controle otimo cor-
respondentes. Na Sec c ao 9.3 analisamos uma famlia de restri c oes muito
utilisada em aplica c oes, que esta associada a um tipo de solu c ao seme-
lhante às solu c oes bangbang (veja Sec c ao 3.7).
Nas duas ultimas Sec c oes, 9.4 e 9.5, estudamos, sob hipoteses adi-
cionais de convexidade, a suciencia e necessidade para otimalidade de
um conjunto particular de condi c oes. Damos assim o primeiro passo na
dire c ao de um dos principais resultados na teoria de controle otimo, a
saber: o princpio do maximo de Pontryagin.
9.1 O que e Controle

Otimo
Em um problema de controle, uma vari avel de estado z = z(t) R
n
dependente do tempo evolui de acordo com uma dada din amica
(9.1) z
t
(t) = f(t, z(t), u(t)), t > t
0
,
a partir de um estado inicial z(t
0
) = z
0
. Aqui f : R R
n
R
m
R
n
corresponde ao modelo estudado, z
0
R
n
e o estado inicial do sistema
steuer
2008/3/11
page 193
i
i
i
i
i
i
i
i
[SEC. 9.1: O QUE

E CONTROLE

OTIMO 193
e u : R R
m
e um par ametro livre inuenciando a din amica, deno-
minado controle do sistema. Em muitos problemas e tambem fornecida
uma condi c ao de contorno nal z(t
1
) = z
1
, ou ainda uma condi c ao de
contorno transversal. A equa c ao (9.1) e denominada equa c ao de estado.
Nos problemas de controle otimo considerados neste captulo, a tarefa
que se imp oe e a de minimizar funcionais do tipo
J(u, z) :=
_
t
1
t
0
L(t, z(t), u(t)) dt,
com L : RR
n
R
m
R, onde z e u est ao relacionados pela din amica
z
t
= f(t, z, u), t (t
0
, t
1
) e ainda z(0) = z
0
, z(t
1
) = z
1
, u |
ad
.
O conjunto |
ad
e denominado conjunto de controles admissveis
e usualmente e escolhido como subconjunto de C([t
0
, t
1
]; R
m
),
C([t
0
, t
1
]; R
m
) ou L
1
([t
0
, t
1
]; R
m
). Note que diferentes escolhas de |
ad
implicam em diferentes graus de regularidade de z e tambem determi-
nam o conceito que deve ser utilizado para denir a solu c ao do problema
de valor inicial em (9.1).
Podemos formular o problema de controle otimo descrito acima do
seguinte modo
_
_
Minimizar J(u, z) :=
_
t
1
t
0
L(t, z(t), u(t)) dt
sujeito a u |
ad
,
z
t
= f(t, z, u), t (t
0
, t
1
), z(0) = z
0
, z(t
1
) = z
1
.
A analogia entre os problemas de controle otimo e os problema do calculo
de varia c oes se torna evidente quando observamos que, no caso particu-
lar f(t, z, u) = u, o problema acima toma a forma do problema varia-
cional (7.2).

E exatamente esta semelhan ca que nos permite comparar
as condi c oes de otimalidade para ambas as classes de problemas.
Assim como os problemas variacionais, os problemas de controle
otimo podem ser formulados com condi c oes de contorno transversais,
restri c oes lagrangeanas ou restri c oes isoperimetricas. Nas proximas duas
sec c oes tratamos problemas variacionais restritos, assim como problemas
de controle que s ao de certa forma analogos a estes problemas varia-
cionais.
No problema acima, os instantes de tempo inicial e nal s ao dados
(problemas de tempo xo). Porem, o instante de tempo nal pode ser
steuer
2008/3/11
page 194
i
i
i
i
i
i
i
i
194 [CAP. 9: C
ALCULO VARIACIONAL E CONTROLE

OTIMO
uma das incognitas no problema de controle otimo (problemas de tempo
livre). De interesse s ao ainda os problemas formulados no intervalo
[t
0
, ) (problemas com horizonte innito), assim como problemas em
que s ao admitidas descontinuidades na variavel de estado z (proble-
mas impulsivos). Com excess ao dos problemas impulsivos, os demais
problemas de controle s ao abordados no Captulo 10, juntamente com
uma formula c ao bastante geral do problema acima.
9.2 Problemas Variacionais com Restricao
Com a inten c ao de contruir uma ponte, que permita estender aos
problemas de controle otimo os resultados conhecidos da teoria do calculo
variacional, analisamos nesta sec c ao famlias especcas de problemas,
a saber: aqueles em que s ao impostas restri c oes extras às trajetorias
admissveis.
Come camos por estudar os problemas variacionais com condi c oes de
contorno transversais. Considere o problema
(9.2)
_
_
Minimzar I(y, T) :=
_
T
a
L(t, y(t), y
t
(t)) dt
sujeito a
T > a ; (T, y(T)) = 0 ; y y C
1
[a, T] [ y(a) = y
a
;
onde L C
1
([a, b] R
2
; R), y
a
R e C
1
([a, b] R; R), com ,=
0.
1
Note que nem o tempo nal nem a condi c ao de contorno nal s ao
especicados. A condi c ao nal para as fun c oes admissveis e fornecida
pela curva de nvel zero da fun c ao (veja Figura 9.1).
Suponha que ( y,

T) com y C
1
[a,

T] e um mnimo local fraco para
o problema (9.2). Logo, para fun c oes teste C
1
0
[a,

T], temos
d
d
I( y +,

T)
=0
= 0,
de onde concluimos, argumentando como na Sec c ao 7.3, que y satis-
faz a equa c ao de EulerLagrange em (a,

T). Temos assim as condi c oes
necessarias
y(a) = y
a
,
d
dt
L
y
(t, y, y
t
) = L
y
(t, y, y
t
), t (a,

T).
1
A constante b R e tomada grande o bastante, de forma a n ao interferir na
formula c ao do problema.
steuer
2008/3/11
page 195
i
i
i
i
i
i
i
i
[SEC. 9.2: PROBLEMAS VARIACIONAIS COM RESTRIC
AO 195
a
y
a
T
1
T
2
(t, y) = 0
y
1
(t)
y
2
(t)
t
y
Figura 9.1: Condi c ao de transversalidade e fun c oes admissveis
Falta ainda obter, como na Observa c ao 132, uma condi c ao de con-
torno natural que relacione o tempo nal

T com a fun c ao , que descreve
a condi c ao nal. Essa condi c ao natural e obtida como conseq uencia do
teorema de multiplicadores de Lagrange.
Dena Y
ad
:= y C
1
[a, b] [ y(a) = y
a
. Note que os candidatos
à solu c ao do problema variacional (9.2) s ao pares da forma (y, T)
Y
ad
R C
1
[a, b] R =: Y . Note ainda que Y e um espa co vetorial
normado com a norma do produto cartesiano |(y, T)| := |y|
1,
+ [T[.
A fun c ao objetivo I esta bem denida como uma aplica c ao de Y em R
e a varia c ao de I em ( y,

T) na dire c ao (, ) Y e dada por
2
I( y,

T; , ) = L(
T, y, y
t
) +
_

T
a
[L
y
(t, y, y
t
)(t) +L
y
(t, y, y
t
)
t
(t)] dt
e como y e estacionaria em (a,

T), usamos a equa c ao de EulerLagrange
para reescrever o integrando da express ao acima, obtendo
I( y,

T; , ) = L(

T, y, y
t
) +
_

T
a
d
dt
_
L
y
(t, y, y
t
)(t)
dt
= L(
T, y, y
t
) +
_
L
y
(t, y, y
t
)(t)

T
a
.
Observe que a condi c ao nal de transversalidade pode ser reescrita como
G(y, T) = 0, onde G : Y (y, T) (T, y(T)) R. Calculando a
varia c ao de G ateaux de G em ( y,

T) na dire c ao (, ) Y , obtemos
3
G( y,

T; , ) =
t
(
T, y) +
y
(
T, y) [ y
t
(
T) +(
T)].
2
Lembre que I( y,

T; , ) = (d/d) I( y +,

T +)[
=0
.
3
Note que G( y,

T; , ) = (d/d) (

T +, ( y +)(

T +))[
=0
. Para simplicar
a nota c ao escrevemos (

T, y) ao inves de (

T, y(
T)).
steuer
2008/3/11
page 196
i
i
i
i
i
i
i
i
196 [CAP. 9: C

OTIMO
O teorema de multiplicadores de Lagrange nos garante agora que se
( y,

T) e um mnimo local de I sujeito à restri c ao G(y, T) = 0, ent ao
ou G( y,

T; , ) 0, ou existe um multiplicador R, tal que (I +
G)( y,

T; , ) 0. Como o primeiro caso implica em (

T, y(
T)) = 0,
podemos descarta-lo devido às hipoteses do problema (9.2).
Tomando fun c oes teste C
1
0
[a,

T] e ,= 0, temos
(9.3)
0 = (I+G)( y,

T; , ) = L(
T, y, y
t
) +[
t
(
T, y)+
y
(
T, y) y
t
(
T)] .
Enquanto que escolhendo (, ) com = (a) = 0 e (

T) ,= 0, obtemos
L
y
(
T, y, y
t
) (
T) +
y
(
T, y) (
T) = 0,
i.e., = L
y
(
T, y, y
t
) /
y
(
T, y). Substituindo em (9.3), temos

(9.4) L(
T, y, y
t
)
y
(
T, y) = L
y
(
T, y, y
t
) [
t
(
T, y) +
y
(
T, y) y
t
(
T)],
que e a condi c ao natural que buscavamos. A condi c ao (9.4) e denomi-
nada condi c ao de transversalidade. Podemos resumir a discuss ao acima
na forma do seguinte teorema:
Teorema 162. Seja L C
1
([a, b] R
2
; R), C
1
([a, b] R; R) com
,= 0. Se ( y,

T) e um mnimo local fraco de I em Y
ad
R restrito a
(T, y(T)) = 0, ent ao ( y,

T) e solu c ao do problema de valor de contorno
_
_
L
y
(t, y, y
t
)
d
dt
L
y
(t, y, y
t
) = 0, t (a, T)
y(a) = y
a
, L(T, y, y
t
)
y
(T, y)
= L
y
(T, y, y
t
) [
t
(T, y) +
y
(T, y) y
t
(T)].
Observa cao 163. Tomando (T, y) = t b no Teorema 162, xamos o
tempo nal T = b e deixamos livre a condi c ao de contorno nal. Neste
caso, a condi c ao de transversalidade se escreve como
L
y
(b, y(b), y
t
(b)) = 0,
que e exatamente a condi c ao natural para os problemas com fronteira
livre, obtida na Observa c ao 132.
Tomando (T, y) = y y
b
no Teorema 162, deixamos o tempo nal
livre e xamos a condi c ao de contorno nal y(T) = y
b
. Neste caso a
condi c ao de transversalidade se escreve como
L(T, y(T), y
t
(T)) = y
t
(T) L
y
(T, y(T), y
t
(T)).
steuer
2008/3/11
page 197
i
i
i
i
i
i
i
i
AO 197
Tais problemas s ao denominados na literatura por problemas de hori-
zonte livre. 2
Antes de prosseguirmos com a analise de problemas sujeitos a restri-
c oes isoperimetricas e lagrangeanas, apresentamos uma vers ao do teo-
rema de multiplicadores de Lagrange em espa cos vetoriais genericos.
Para tanto, consideramos que a fun c ao objetivo e a restri c ao s ao descri-
tas por aplica c oes G ateaux diferenciaveis.
Teorema 164 (Lagrange). Seja Y um espa co vetorial normado e
I, G aplica c oes de Y em R. Suponha que as varia c oes de G ateaux
I(y, v), G(y, v) est ao bem denidas para y, v Y e ainda que, para
cada y, v Y tenhamos I(y
n
, v) I(y, v), G(y
n
, v) G(y, v) sem-
pre que y
n
y em Y .
4
Se y e um mnimo local de I sujeito ` a restri c ao
G(y) = 0, ent ao ou G( y, ) 0, em Y ou existe um multiplicador
R, tal que
I( y, v) = G( y, v), v Y.
Demonstra c ao: Veja [Tr, Captulo 5].
Na realidade, o teorema acima continua valido se exigimos con-
tinuidade fraca de I e G apenas em y. Uma conseq uencia imediata do
teorema de Lagrange e que os conjuntos de nvel y Y ; I(y) = I( y) e
y Y ; G(y) = 0 possuem o mesmo hiperplano tangente em y.
Tratamos a seguir dos problemas variacionais com restri c oes isope-
rimetricas (ou integrais). Considere o problema
(9.5)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y Y
ad
:= y C
1
[a, b] [ y(a) = y
a
, y(b) = y
b
;
F(y) :=
_
b
a
G(t, y(t), y
t
(t)) dt = c ;
onde L, G C
1
([a, b] R
2
; R) e y
a
, y
b
, c R s ao dados. Como con-
seq uencia imediata do teorema de Lagrange, obtemos o seguinte resul-
tado:
4
Tal propriedade e denominada continuidade fraca da varia c ao de G ateaux.
steuer
2008/3/11
page 198
i
i
i
i
i
i
i
i
198 [CAP. 9: C

OTIMO
Teorema 165. Sejam L, G C
1
([a, b] R
2
; R) e c R, tais que
F(y; ) , 0 no conjunto de nvel c do funcional F, denido por
F
c
:= y C
1
[a, b] [ F(y) = c.
Se y e um mnimo local fraco do problema (9.5), ent ao existe um mul-
tiplicador R, tal que y e solu c ao do problema de valor de contorno
_
(L +G)
y
(t, y, y
t
)
d
dt
(L +G)
y
(t, y, y
t
) = 0, t (a, b)
y(a) = y
a
, y(b) = y
b
.
Demonstra c ao:

E deixada como exerccio para o leitor.
A seguir obtemos condi c oes necessarias para problemas variacionais
com restri c oes lagrangeanas. Considere o problema
(9.6)
_
_
Minimizar I(y) :=
_
b
a
L(t, y(t), y
t
(t)) dt
sujeito a
y Y
ad
:= y C
1
([a, b]; R
n
) [ y(a) = y
a
, y(b) = y
b
;
G(t, y(t)) = 0, t [a, b] ;
onde L : [a, b] R
2n
R, G : [a, b] R
n
R e y
a
, y
b
R
n
s ao dados.
Note que no caso particular n = 1, o problema de minimiza c ao perde o
sentido, pois a restri c ao G(t, y(t)) = 0 na maioria dos casos determina y
completamente.
Teorema 166. Sejam L C
2
([a, b] R
2n
; R), G C
2
([a, b] R
n
; R)
com G
y
(t, y) ,= 0. Se y Y
ad
e um mnimo local fraco de I em Y
ad
sujeito ` a restri c ao lagrangeana G(t, y(t)) = 0, t [a, b], ent ao existe
uma fun c ao (multiplicador) C[a, b], tal que
d
dt
[L +G]
y
= [L +G]
y
, t (a, b).
Demonstra c ao: Seja (a, b). Como G
y
(, y()) ,= 0, ent ao para pelo
menos um ndice 1 j n, temos G
y
j
(, y()) ,= 0. Por conveniencia
representamos y R
n
por (y
j
, Y ), onde y
j
e a j-esima componente de
y e Y R
n1
e o vetor contendo as demais componentes.
5
O teorema
5
Em particular temos y(t) = ( y
j
(t),

Y (t)).
steuer
2008/3/11
page 199
i
i
i
i
i
i
i
i
AO 199
da fun c ao implcita (ver [Ru2] ou [Wa1]) garante a existencia de uma
fun c ao g C
2
(R R
n1
, R) denida em uma vizinhan ca de (,

Y ()),
tal que G(t, y) = 0 se e somente se y
j
= g(t, Y ). Sendo assim, podemos
reescrever (localmente) a restri c ao do problema (9.6) como: [c, d]
(a, b) com (c, d) e y
j
(t) = g(t, Y (t)), t [c, d].
Denindo o conjunto V := Y C
1
([a, b]; R
n1
) [ Y (t) =

Y (t), t ,
(c, d), podemos construir para cada Y V a fun c ao
y
j
(t) :=
_
g(t, Y (t)) , t (c, d)
y
j
(t) , t , (c, d)
obtendo assim y(t) := (y
j
(t), Y (t)) Y
ad
que obviamente satisfaz
G(t, y(t)) = 0, t [a, b]. Denimos agora o funcional
I : C
1
([a, b]; R
n1
) R
Y (t) I(g(, Y ), Y )
Por constru c ao, temos
I(Y ) =
_
b
a
L(t, y
j
, Y, y
t
j
, Y
t
) dt,
onde
y
j
(t) = g((t), Y (t)) e y
t
j
(t) = (d/dt) g((t), Y (t)) = g
t
(t, Y ) +g
Y
(t, Y )Y
t
.
Denindo

L(t, Y, Y
t
) := L(t, y
j
, Y, y
t
j
, Y
t
), podemos escrever
I(Y ) =
_
b
a
L(t, Y, Y
t
) dt =
_
d
c
L(t, Y, Y
t
) dt + const.,
para todo Y V . Como y e mnimo local do problema (9.6), ent ao

Y e
mnimo local de

I em V (por que?). Portanto,

Y satisfaz
(9.7)
d
dt
L
Y
=

L
Y
, t (c, d).
Por constru c ao, temos

L
Y
= L
y
j
g
Y
+ L
Y
e

L
Y
= L
y
j
g
Y
+ L
Y
+
L
y
j
[g
t
+g
Y
Y
t
]
Y
. Substituindo em (9.7), temos
(9.8)
d
dt
[L
y
j
g
Y
+ L
Y
] = L
y
j
g
Y
+ L
Y
+ L
y
j
[g
t
+g
Y
Y
t
]
Y
, t (c, d).
steuer
2008/3/11
page 200
i
i
i
i
i
i
i
i
200 [CAP. 9: C

OTIMO
Usando agora a identidade [g
t
+g
Y
Y
t
]
Y
= (d/dt) g
Y
, obtemos de (9.8)
d
dt
L
Y
L
Y
=
_
d
dt
L
y
j
+ L
y
j
_
g
Y
, t (c, d).
Como G(t, g(t, Y ), Y ) 0 em uma vizinhan ca de (,

Y ()), temos que
G
y
j
(t, g(t, Y ), Y )g
Y
+G
Y
(t, g(t, Y ), Y ) = 0.
Logo, para qualquer fun c ao C[c, d], temos
d
dt
[L +G]
Y
[L +G]
t
Y
=
d
dt
L
Y
L
Y
G
Y
=
d
dt
L
Y
L
Y
+ G
y
j
g
Y
=
_
d
dt
L
y
j
+ L
y
j
+ G
y
j
_
g
Y
.
A escolha (t) = [(d/dt) L
y
j
L
y
j
]/G
y
j
C[c, d] (lembre que G
y
j
,= 0
em [c, d]) nos fornece a equa c ao
(9.9)
d
dt
[L +G]
Y
[L +G]
t
Y
= 0, t (c, d).
Provamos assim que para essa escolha de multiplicador, a equa c ao de
EulerLagrange e satisfeita em uma vizinhan ca de t = . Como
(a, b) e arbitrario, concluimos que o teorema e valido localmente no
intervalo (a, b).
Note que e possvel cobrir o intervalo compacto [a, b] com uma
famlia nita de subintervalos, tais que em cada um deles, G
y
j
,= 0
para algum j. A escolha do multiplicador em cada subintervalo de-
pende apenas deste fato, o que justica a conclus ao de que e possvel
escolher C[a, b], de modo que (9.9) seja satisfeita em todo intervalo
(a, b).
Observa cao 167.

E possvel formular o problema (9.6) com G =
G(t, y, y
t
) e, ainda assim, obter um resultado analogo ao apresentado
no Teorema 166. A verica c ao deste resultado mais geral pode ser en-
contrada, e.g., em [Tr, Captulo 11]. 2
O interesse no estudo dos problemas (9.2), (9.5) e (9.6) para a teoria
de controle otimo, deve-se ao fato de diversas famlias de problemas
steuer
2008/3/11
page 201
i
i
i
i
i
i
i
i
AO 201
possurem equa c ao de din amica da forma: z
t
(t) = u(t); ou ainda z
t
(t) =
f
1
(t, z) +f
2
(t, z)u(t), com f
2
(t, z) ,= 0. Neste caso, e possvel reescrever
os problemas de controle otimo como problemas variacionais e assim
utilizar as condi c oes necessarias apresentadas nesta sec c ao.
Nos exemplos a seguir, apresentamos alguns problemas variacionais
e de controle otimo sujeitos a restri c oes como aquelas discutidas acima.
A analise dos problemas e conduzida nos exerccios ao nal do captulo.
Exemplo 168. Considere o problema variacional da Braquistocrona
_
_
_
Minimizar I(y) :=
_
T
0
_
1 +y
t
(t)
2
/
ydt
sujeito a y Y
ad
:= y C
1
[0, T] [ y(0) = 0,
T > 0, (T, y(T)) = 0,
onde a condi c ao de contorno nal e descrita pela curva de nvel zero da
fun c ao continuamente diferenciavel : R R (t, y) (t, y) R.
2
Exemplo 169. Considere o problema de controle
_
_
_
Minimizar I(z, u) :=
_
1
0
u(t)
4/3
dt
sujeito a z
t
= u, t (0, 1);
z(0) = 5/4, z(1) = 5 ;
_
1
0
tz
t
(t)dt = 5.
O prolema variacional correspondente e
_
_
_
Minimizar I(y) :=
_
1
0
y
t
(t)
4/3
dt
sujeito a y Y
ad
:= y C
1
[0, 1] [ y(0) = 5/4, y(1) = 5,
_
1
0
G(t, y, y
t
)dt = 5,
onde o integrando da restri c ao isoperimetrica e dado pela fun c ao
G(t, y, y
t
) = ty
t
. 2
Exemplo 170. Considere os prolemas variacionais
_
_
_
Minimizar I(y) :=
_
1
0
[y
t
(t)
2
+y(t)y
t
(t)
4
]dt
sujeito a y Y
ad
:= y C
1
[0, 1] [ y(0) = 1, y(1) = 0, y(t) 0 ;
F(y) :=
_
1
0
ty
t
(t)
4
dt = 1/2
e
_
_
_
Minimizar I(y) :=
_
1
0
[y
t
(t)
2
+y(t)y
t
(t)
4
]dt
sujeito a y Y
ad
:= y C
1
[0, 1] [ y(0) = 1, y(1) = 0, y(t) 0 ;
G(t, y, y
t
) := (y
t
)
4
1 0.
Note que o primeiro problema e formulado com uma restri c ao isoperi-
metrica, enquanto que o segundo com uma restri c ao lagrangeana. 2
steuer
2008/3/11
page 202
i
i
i
i
i
i
i
i
202 [CAP. 9: C

OTIMO
9.3 Extremais Singulares e Trajet orias

Otimas
Nesta sec c ao utilizamos o formalismo do calculo variacional para
obter, atraves da analise de condi c oes necessarias, a solu c ao para uma
importante famlia de problemas de controle otimo, a saber: problemas
em que as variaveis de controle s ao limitadas por fun c oes que dependem
do tempo e da variavel de estado.
Sob hipoteses adequadas e possvel encontrar uma rela c ao entre as
solu c oes da equa c ao de EulerLagrange (extremais) e as trajetorias oti-
mas do problema de controle correspondente. Come camos por analisar
o seguinte problema variacional
(9.10)
_
_
Minimizar I(z) :=
_
t
1
t
0
[G(t, z(t)) + H(t, z(t))z
t
(t)] dt
sujeito a
A(t, z(t)) z
t
(t) B(t, z(t)), t [t
0
, t
1
] ;
z(t
0
) = z
0
, z(t
1
) = z
1
.
Note que no problema (9.10) s ao feitas restri c oes sobre a derivada das
fun c oes admissveis. Importante na analise a seguir e o fato de L(t, z, z
t
)
ser uma fun c ao am na variavel z
t
. Observe ainda que o problema (9.10)
pode ser interpretado como decorrente do seguinte problema de controle
otimo
_
_
Minimizar I(z) :=
_
t
1
t
0
[L
1
(t, z(t)) + L
2
(t, z(t))u(t)] dt
sujeito a
z
t
= g(t, z) +f(t, z)u(t), t [t
0
, t
1
] ;
z(t
0
) = z
0
, z(t
0
) = z
1
, u(t) := [u
m
, u
M
].
De fato, explicitando u em fun c ao de z e z
t
na equa c ao diferencial
(supondo f(t, z) ,= 0) e substituindo no funcional I, obtemos um pro-
blema como (9.10), onde
G(t, z) = L
1
(t, z) L
2
(t, z)
g(t, z)
f(t, z)
; H(t, z) = L
2
(t, z)
1
f(t, z)
;
A(t, z) = min
u(t)
g(t, z) +f(t, z)u ; B(t, z) = max
u(t)
g(t, z) +f(t, z)u.
steuer
2008/3/11
page 203
i
i
i
i
i
i
i
i
[SEC. 9.3: EXTREMAIS SINGULARES E TRAJET
ORIAS

OTIMAS 203
Suponha agora as aplica c oes G, H, A, B : [t
0
, t
1
]R R continuamente
diferenciaveis e dena o conjunto das trajetorias admissveis
Z
ad
:= z

C
1
[t
0
, t
1
] [ A(t, z(t)) z
t
(t) B(t, z(t)),
t [t
0
, t
1
]; z(t
0
) = z
0
, z(t
1
) = z
1
.
Esquecendo por um momento as restri c oes sobre a derivada das fun c oes
admissveis, o problema (9.10) pode ser escrito como um problema usual
do calculo das varia c oes:
_
_
_
Minimizar I(z) :=
_
t
1
t
0
[G(t, z(t)) + H(t, z(t))z
t
(t)] dt
sujeito a z

C
1
[t
0
, t
1
], z(t
0
) = z
0
, z(t
1
) = z
1
.
A equa c ao de EulerLagrange associada a esse problema e
(9.11)
G
z
(t, z(t))
H
t
(t, z(t)) = 0, t (t
0
, t
1
).
Fazemos agora as seguintes hipoteses:
h1) Existe um extremal singular z
s
para o problema variacional, i.e.
uma fun c ao z
s

C
1
[t
0
, t
1
] que e solu c ao da equa c ao diferencial
(9.11) e satisfaz simultaneamente a restri c ao A(t, z
s
(t)) z
s
t
(t)
B(t, z
s
(t)), t (t
0
, t
1
).
6
h2) O extremal singular z
s
divide a faixa S := [t
0
, t
1
] R em duas
semi-faixas:
E
+
:= (t, z) [t
0
, t
1
] R [ z > z
s
(t),
E
:= (t, z) [t
0
, t
1
] R [ z < z
s
(t),
nas quais se verica:
G
z
(t, z)
H
t
(t, z) > 0, (t, z) E
+
,
G
z
(t, z)
H
t
(t, z) < 0, (t, z) E
.
6
Note que z
s
n ao pertence necessariamente a Z
ad
.
steuer
2008/3/11
page 204
i
i
i
i
i
i
i
i
204 [CAP. 9: C

OTIMO
Como o funcional I e linear no argumento z
t
, e de se esperar que, nos
pontos em que uma solu c ao n ao coincide com o extremal singular, ela
esta na fronteira da admissibilidade, i.e. z
t
(t) = A(t, z(t)) ou z
t
(t) =
B(t, z(t)). A m de formular mais precisamente esta ideia denimos a
fun c ao de identica c ao : S R
(9.12) (t, z) :=
_
_
_
A(t, z), (t, z) E
+
z
s
(t) , z = z
s
(t)
B(t, z), (t, z) E
Estamos agora em condi c oes de formular um resultado que nos per-

mite identicar as solu c oes do problema variacional (9.10) e do problema
de controle otimo correspondente.
Teorema 171. Suponha que G, H, A e B s ao fun c oes continuamente
diferenci aveis e que as condi c oes (h1) e (h2) s ao satisfeitas. Seja a
fun c ao de identica c ao denida em (9.12). Se existir uma trajet oria
admissvel z Z
ad
que intercepta o extremal singular z
s
em um ponto
de (t
0
, t
1
), ent ao a fun c ao z denida por
_
z
t
= (t, z(t)), t [t
0
, t
1
]
z(t
0
) = z
0
, z(t
1
) = z
1
e uma trajet oria otima de (9.10).
Demonstra c ao: Suponha z
s
(0) < z
0
(o caso z
0
< z
s
(0) e analogo).
Seja z uma trajetoria admissvel qualquer que intercepta z
s
no ponto
(t
0
, t
1
). Considere agora o problema de valor inicial
z
t
= A(t, z(t)), z(t
0
) = z
0
.
Tal problema possui uma solu c ao local, que denominamos z. Como
z
t
(t
0
) A(t
0
, z(t
0
)) = z
t
(t
0
),
ent ao z(t) z(t), para t [t
0
, t
0
+ ]. Por hipotese z() = z
s
(), ent ao
existe
1
(t
0
, ], tal que z(
1
) = z
s
(
1
) (veja Figura 9.2). Note ainda
que, da desigualdade z
s
(t
0
) < z
0
= z(t
0
) temos
z(t) > z
s
(t), t (t
0
,
1
).
Dena agora a fun c ao z por
steuer
2008/3/11
page 205
i
i
i
i
i
i
i
i
[SEC. 9.3: EXTREMAIS SINGULARES E TRAJET
ORIAS

OTIMAS 205
E
t
0
T
z
1
t
1
z
s
(t
0
)
z
s
z
0
z
1
z
D
Figura 9.2: Trajetoria admissvel que intercepta o extremal singular
z(t) :=
_
_
_
z(t) , t [t
0
,
1
)
z
s
(t) , t [
1
, ]
z(t) , t (, t
1
]
que e admissvel por constru c ao. Seja D E
+
a regi ao cuja fornteira
D e a curva de Jordan formada pelos segmentos
(t, z(t)), t [t
0
,
1
] ; (t, z
s
(t)), t [
1
, ] ; (t, z(t)), t [t
0
,
1
] ;
orientada no sentido anti-horario. Como z(t) = z(t), t , temos
I(z) I( z) =
_

t
0
[G(t, z(t)) + H(t, z(t))z
t
(t)] dt
_

t
0
[G(t, z(t)) +H(t, z(t)) z
t
(t)] dt
=
_
D
[G(t, z) dt + H(t, z) dz]
=
_ _
D
_
G
z

H
t
_
(t, z) dz dt
(para obter a ultima igualdade utilizamos a formula de Green). Como
a hipotese (h2) implica que [
G
z

H
t
](t, z) > 0, para (t, z) E
+
, temos
ent ao
I(z) I( z) > 0,
quando
1
< . (Caso contrario obtemos apenas I(z) I( z) 0.)
Repetindo a argumenta c ao na extremidade t
1
do intervalo, obtemos
I(z) I( z).
steuer
2008/3/11
page 206
i
i
i
i
i
i
i
i
206 [CAP. 9: C

OTIMO
E
t
0
T
z
1
t
1
z
s
z
s
(t
0
)
z
z
0
z
D
Figura 9.3: Trajetoria admissvel que n ao intercepta o extremal singular
Para completar a demonstra c ao basta provar que para toda trajetoria
admissvel z que n ao intercepta z
s
, temos I(z) I( z). Como supomos
z
s
(0) < z
0
, uma condi c ao necessaria para que exista uma trajetoria
admissvel nessas condi c oes e z
s
(t
1
) < z
1
. Temos ent ao
I(z) I( z) =
_
t
1
t
0
[G(t, z) + H(t, z)z
t
] dt
_
t
1
t
0
[G(t, z
s
) + H(t, z
s
)(z
s
)
t
] dt
=
_ _
D
_
G
z

H
t
_
(t, z) dz dt > 0,
onde D e a regi ao situada entre as curvas z e z, conforme a Figura 9.3
Observa cao 172. Caso uma das condi c oes de contorno n ao seja for-
necida, por exemplo z(t
1
) = z
1
, obtemos em seu lugar a condi c ao de
contorno natural (veja Observa c ao 132)
L
y
(t
1
, z(t
1
), z
t
(t
1
)) = H(t
1
, z(t
1
)) = 0.
Neste caso, mesmo que a condi c ao H(t
1
, z(t
1
)) = 0 dena z(t
1
) de forma
unica, e ainda possvel aplicar o Teorema 171. 2
Observa cao 173. O Teorema 171 garante que a trajetoria otima para
o problema e da forma bangsingularbang.
steuer
2008/3/11
page 207
i
i
i
i
i
i
i
i
[SEC. 9.4: CONTROLE

OTIMO E CONVEXIDADE: CONDIC

OES SUFICIENTES 207
No caso particular em que o extremal satisfa ca z
s
(t
0
) = z
0
ou
z
s
(t
1
) = z
1
, as trajetorias otimas s ao do tipo singularbang e bang
singular, respectivamente. 2
9.4 Controle

Otimo e Convexidade: condic oes
sucientes
Continuamos nesta sec c ao a analogia iniciada na Sec c ao 9.3 entre os
problemas de calculo variacional e os problemas de controle otimo. Nosso
objetivo e mostrar que, sob certas hipoteses de convexidade, a equa c ao
de EulerLagrange fornece condi c oes sucientes para determinar a es-
trategia otima de problemas de controle, que n ao possuem restri c ao nas
variaveis de controle.
E importante notar semelhan ca entre o resultado principal desta

sec c ao, apresentado no Teorema 174, e o Teorema de condi c oes su-
cientes 127. Come camos por considererar o problema de controle otimo
(9.13)
_
_
_
t
1
t
0
L(t, z(t), u(t)) dt
sujeito a z

C
1
([t
0
, t
1
]; R
n
) ; u

C([t
0
, t
1
]; R
m
) ;
z
t
(t) = f(t, z, u), t (t
0
, t
1
) ;
z(t
0
) = z
0
, z(t
1
) = z
1
;
onde os tempos inicial e nal t
0
, t
1
s ao xos, L : [t
0
, t
1
] R
n
R
m
R,
f : [t
0
, t
1
] R
n
R
m
R
n
, z
0
, z
1
R
n
s ao dados. O conjunto das
trajetorias admissveis e dado por
Z
ad
:= z

C
1
([t
0
, t
1
]; R
n
) [ z(t
0
) = z
0
, z(t
1
) = z
1
.
Como n ao s ao feitas restri c oes às variaveis de controle em (9.13), o con-
junto dos controles admissveis e simplesmente U
ad
:=

C([t
0
, t
1
]; R
m
).
Os candidatos à solu c ao do problema de otimiza c ao restrita (9.13)
s ao os processos admissveis (z, u) Z
ad
U
ad
. Podemos ent ao consi-
derar o problema (9.13) como um problema do calculo variacional com
restri c oes lagrangeanas
(9.14)
_
_
_
Minimizar I(z, u)
sujeito a (z, u) Z
ad
U
ad
G(t, z, u) = f(t, z, u) z
t
= 0, t (t
0
, t
1
) ;
steuer
2008/3/11
page 208
i
i
i
i
i
i
i
i
208 [CAP. 9: C

OTIMO
Nossa experiencia com problemas do calculo variacional sujeitos a
restri c oes lagrangeanas (veja Sec c ao 9.2) sugere que a solu c ao de (9.14)
esta relacionada com a minimiza c ao do funcional estendido
I(z, u, ) :=
_
t
1
t
0
L(t, z(t), u(t)) dt,

onde

L(t, z, u) = L(t, z, u) + (t)G(t, z, u) e

C
1
([t
0
, t
1
]; R
n
) e um
multiplicador. Denimos agora a fun c ao auxiliar
H : [t
0
, t
1
] R
n
R
m
R
n
R
(t, z, u, ) , f(t, z, u)) + L(t, z, u),
denominada fun c ao de Hamilton. Por constru c ao, temos

L(t, z, u) =
H(t, z, u, ) (t)z
t
. A equa c ao de EulerLagrange para o problema
variacional irrestrito em

I possui uma componente relativa a z e outra
a u.
7
Temos assim,
d
dt
[L +G]
z
= [L +G]
z
e
d
dt
[L +G]
u
= [L +G]
u
.
Utilizando a deni c ao de H, podemos reescrever as equa c oes acima na
forma
t
(t) = H
z
(t, z, u, ) e 0 = H
u
(t, z, u, ).
Note ainda que a equa c ao de evolu c ao do problema (9.13) z
t
= f(t, z, u)
(que e a restri c ao lagrangeana do problema (9.14)) pode ser reescrita
como z
t
= H
(t, z, u, ).
Observe que as condi c oes de WeierstraErdmann, que dizem res-
peito a continuidade das aplica c oes
L
z
(t, z, u) = (t) e

L
u
(t, z, u) = 0,
s ao trivialmente satisfeitas devido às hipoteses de regularidade do mul-
tiplicador .
A pergunta que investigamos nesta sec c ao e a seguinte: As condi c oes
z
t
(t) = H
(t, z, u, ),
t
(t) = H
z
(t, z, u, ) e H
u
(t, z, u, ) = 0
7
A componente da equa c ao de EulerLagrange relativa ao multiplicador e sim-
plesmente a restri c ao G(t, z, u) 0 do problema (9.14), como o leitor pode facilmente
vericar.
steuer
2008/3/11
page 209
i
i
i
i
i
i
i
i
[SEC. 9.4: CONTROLE


OES SUFICIENTES 209
s ao sucientes para caracterizar um mnimo local (ou global) do proble-
ma (9.13)? A resposta e sim, desde que fa camos hipotesees adequadas
sobre a convexidade da fun c ao de Hamilton. Na Sec c ao 9.5 investigamos
a suciencia destas mesmas condi c oes.
A analise conduzida neste captulo utiliza argumentos elementares,
devido ao fato de supormos convexidade parcial da fun c ao de Hamil-
ton, em rela c ao as variaveis z e u. No captulo seguinte analisamos o
papel das condi c oes acima em rela c ao à otimalidade da solu c ao de um
problema de controle generico.
Teorema 174. Seja L C
1
([t
0
, t
1
] R
n
R
m
; R), f C
1
([t
0
, t
1
]
R
n
R
m
; R
n
). Suponha que a fun c ao de Hamilton H satisfaz
(9.15)
H(t, z +v, u+w, ) H(t, z, u, ) H
z
(t, z, u, ) v +H
u
(t, z, u, ) w,
v R
n
, w R
m
em [t
0
, t
1
] R
n
R
m
R
n
. S ao verdadeiras as arma c oes:
a) Se ( z, u,
)

C
1
([t
0
, t
1
]; R
n
)

C([t
0
, t
1
]; R
m
)

C
1
([t
0
, t
1
]; R
n
) e
solu c ao de
(9.16)
_
_
_
z
t
(t) = H
(t, z, u, ),
t
(t) = H
z
(t, z, u, ),
H
u
(t, z, u, ) = 0, t (t
0
, t
1
),
z(t
0
) = z
0
, z(t
1
) = z
1
,
ent ao ( z, u) e mnimo global de I em Z
ad
U
ad
sujeito ` a restri c ao
lagrangeana G(t, z, u) = f(t, z, u) z
t
= 0, t [t
0
, t
1
].
b) Caso a igualdade em (9.15) ocorra se e somente se [v[[w[ = 0,
ent ao o processo ( z, u) no item a) e o unico mnimo global de I
em Z
ad
U
ad
.
Demonstra c ao: Da hipotese (9.16) segue imediatamente que ( z, u)
Z
ad
U
ad
e ainda que G(t, z, u) 0 em [t
0
, t
1
]. Seja (z, u) Z
ad
U
ad
um processo admissvel satisfazendo a restri c ao G(t, z, u) 0. Temos
steuer
2008/3/11
page 210
i
i
i
i
i
i
i
i
210 [CAP. 9: C

OTIMO
ent ao
(9.17)
I(z, u) I( z, u)
=

I(z, u,
)

I( z, u,
)
=
_
t
1
t
0
[H(t, z, u,
) H(t, z, u,
)

(t)(z
t
(t) z
t
(t))] dt
_
t
1
t
0
[H
z
(t, z, u,
)(z z) +H
u
(t, z, u,
)(u u)

(z z)
t
] dt
=
_
t
1
t
0
[
t
(z z)
t

(z z)
t
] dt
= [
(z z)]
t
1
t
0
= 0,
provando o item a). Quanto ao item b), basta observar que, se (z, u) ,=
( z, u) e outro processo admissvel satisfazendo a restri c ao G(t, z, u)
0, ent ao (9.17) e obtida com desigualdade estrita, provando assim que
I(z, u) I( z, u) > 0.
Observa cao 175. Caso a condi c ao de contorno z(t
1
) = z
1
n ao seja
fornecida, o conjunto das trajetorias admissveis correspondente e Z
ad
:=
z

C
1
([t
0
, t
1
]; R
n
) [ z(t
0
) = z
0
e o Teorema 174 continua valido se
substituimos a condi c ao de contorno z(t
1
) = z
1
em (9.16) pela condi c ao
natural (t
1
) = 0.
Analogamente, se a condi c ao de contorno nal para o problema (9.13)
for da forma (z(t
1
)) = 0, onde a aplica c ao : R
n
R
p
satisfaz ,= 0,
o conjunto das trajetorias admissveis correspondente e Z
ad
:= z
C
1
([t
0
, t
1
]; R
n
)[ z(t
0
) = z
0
, (z(t
1
)) = 0.
Neste caso, o Teorema 174 continua valido se substituimos a condi c ao
z(t
1
) = z
1
em (9.16) pela condi c ao natural de transversalidade (t
1
) =
z
(z(t
1
)) para R
p
e pela exigencia que (z) : R
n
R seja uma
fun c ao convexa. De fato, Se (z, u) Z
ad
U
ad
satisfaz G(t, z, u) 0,
denimos

1(z, u, , ) :=

I(z, u, ) + (z(t
1
)) e obtemos
I(z, u) I( z, u) =

1(z, u,
, )
1( z, u,
, )
[
(z z)]
t
1
t
0
+ (z(t
1
)) ( z(t
1
))
[
(z z)]
t
1
t
0
+
z
( z(t
1
)) [z(t
1
) z(t
1
)]
= [
(t
1
) +
z
( z(t
1
))] [z(t
1
) z(t
1
)] = 0.
Para obter a ultima das desigualdade acima usamos a convexidade de
steuer
2008/3/11
page 211
i
i
i
i
i
i
i
i
[SEC. 9.5: CONTROLE


OES NECESS
ARIAS 211
(z). Note que R
p
e o multiplicador associado com a restri c ao
(z(t
1
)) = 0. 2
Das hipoteses do Teorema 174 conclumos que, xados os valores
de t, z, , a fun c ao H(t, z, , ) : R
m
R e convexa, no sentido da
Deni c ao 125. De fato, tomando v = 0 em (9.15), temos
H(t, z, u +w, ) H(t, z, u, ) H
u
(t, z, u, ) w, u, w R
m
.
Logo, uma conseq uencia da condi c ao H
u
(t, z(t), u(t),
(t)) = 0, t
(t
0
, t
1
) em (9.16) e que u(t) e um mnimo local de H(t, z(t), ,

(t)),
para cada t (t
0
, t
1
), fato que pode ser escrito na forma
(9.18) H(t, z(t), u(t),
(t)) = min
uR
m
H(t, z(t), u,
(t)), t (t
0
, t
1
).
A condi c ao expressa em (9.18), que e conseq uencia do pacote de condi-
c oes sucientes (9.16), e extremamente importante na teoria de controle
otimo. Na Sec c ao 9.5, ainda utilizando a hipotese de convexidade parcial
da fun c ao de Hamilton, provamos que esta condi c ao e tambem necessaria
para otimalidade de solu c oes do Problema 9.13. A verica c ao da neces-
sidade dessa condi c ao e, no caso geral, tecnicamente mais complicada e
e discutida no Captulo 10.
A condi c ao (9.18) e denominada condi c ao de m aximo (ou condi c ao
de otimalidade), apesar de ser aqui apresentada na forma de mnimo.
Isto, entretanto, deve-se t ao somente à natureza do problema de controle
otimo a ser estudado, cujo objetivo pode ser tanto maximizar quanto
minimizar o funcional I. A primeira apresenta c ao formal deste resultado
foi feita em [PBG].
9.5 Controle

Otimo e Convexidade: condic oes
necessarias
Vericamos nesta sec c ao que as condi c oes propostas em (9.16) e em
especial a condi c ao de maximo (9.18) s ao, sob hipoteses adequadas,
necessarias para otimalidade de solu c oes do problema de controle otimo
(9.13). Assim como nos problemas variacionais restritos, as condi c oes
necessarias s ao obtidas utilizando um teorema de multiplicadores.
Suponha que, xados (t, z, ) RR
n
R
n
, a aplica c ao H(t, z, , ) :
R
m
R e convexa (utilizamos a nota c ao da Sec c ao 9.4). Seja ( z, u)
steuer
2008/3/11
page 212
i
i
i
i
i
i
i
i
212 [CAP. 9: C

OTIMO
Y
ad
U
ad
um processo otimo para o problema (9.13). O teorema de
multiplicadores de Lagrange garante a existencia de

C
1
([t
0
, t
1
]; R
n
),
tal que ( z, u,
) e mnimo local do funcional

I.
Dada uma tripla qualquer de fun c oes teste (
1
,
2
,
3
)

C
1
0

C
0

C
1
0
,
sabemos que a varia c ao
I( z, u,
;
1
,
2
,
3
)
=
_
t
1
t
0
[
1
(L
z
+

f
z
)
t
1
+
2
(L
u
+

f
u
) +
3
(f z
t
)] dt
=
_
t
1
t
0
[
1
(L
z
+

f
z
+

t
) +
2
(L
u
+

f
u
) +
3
(f z
t
)] dt
sempre se anula. Sendo assim, escolhendo
1
=
2
0 e
3

C
1
0
[t
0
, t
1
]
qualquer, obtemos a equa c ao de estado
z
t
(t) = f(t, z, u), t (t
0
, t
1
).
Tomando
1

C
0
[t
0
, t
1
] qualquer e
2
0, obtemos a equa c ao adjunta
t
= L
z
(t, z, u)

f
z
(t, z, u), t (t
0
, t
1
).
Tomando agora
2

C
0
[t
0
, t
1
] qualquer, obtemos a equa c ao de otimali-
dade
0 = L
u
(t, z, u) +

f
u
(t, z, u) = H
u
(t, z, u,
), t (t
0
, t
1
).
Como z satisfaz por constru c ao as condi c oes de contorno do problema
(9.13), conclumos que ( z, u,
) satisfazem (9.16). A condi c ao de maximo

(9.18) e portanto satisfeita para o controle otimo u.
O teorema a seguir e conseq uencia direta da argumenta c ao acima.
Trata-se de uma variante do princpio do maximo, para o caso em que
a hamiltoniana e convexa.
Teorema 176 (Princpio do Maximo). Sejam L e f aplica c oes con-
tinuamente diferenci aveis, t
0
< t
1
xos, z
0
, z
1
R
n
dados. Suponha
ainda que a fun c ao de Hamilton H e convexa na vari avel u. Se ( z, u) e
um mnimo local fraco de I em Y
ad
U
ad
, sujeito a restri c ao G(t, z, u) :=
f(t, z, y) z
t
0, ent ao existe um multiplicador

C
1
([t
0
, t
1
]; R
n
), tal
que
_
z
t
(t) = H
(t, z, u, ),
t
(t) = H
z
(t, z, u, ), t (t
0
, t
1
),
z(t
0
) = z
0
, z(t
1
) = z
1
,
steuer
2008/3/11
page 213
i
i
i
i
i
i
i
i
EXERC
ICIOS 213
y
(t, y) = 0
t
Figura 9.4: Condi c ao de transversalidade para a Braquistocrona
e ainda, o controle otimo u satisfaz a condi c ao de m aximo
H(t, z(t), u(t),
(t)) = min
uR
m
H(t, z(t), u,
(t)), t (t
0
, t
1
).
Exerccios
9.1. Considere o problema do Exemplo 168 (veja Figura 9.4).
a) Verique que a solu c ao do problema necessariamente satisfaz a
condi c ao transversal
L
y
= L
y
[
t
+
y
y
t
],
onde L(t, y, y
t
) :=
_
1 + (y
t
)
2
/
y.
b) Conclua do item a) que a cicloide, unindo a origem à curva de nvel,
satisfaz
y
=
t
y
t
, i.e. a cicloide intercepta ortogonalmente a curva de
nvel.
c) Formule o problema de controle correspondente.
9.2. Considere o problema do Exemplo 169.
a) Calcule o multiplicador de Lagrange (escalar) correspondente e en-
contre a solu c ao do problema variacional.
b) Encontre a trajetoria otima para o problema de controle e o controle
otimo correspondente.
steuer
2008/3/11
page 214
i
i
i
i
i
i
i
i
214 EXERC
ICIOS
9.3. Considere os problemas do Exemplo 170.
a) Formule os problemas de controle correspondentes.
b) Verique que cada um dos problemas variacionais possui como unica
solu c ao y(t) = 1 t e que os respectivos multiplicadores de Lagrange
s ao dados por = 3/4 e (t) = 3/4t.
9.4. Verique os detalhes da demonstra c ao do Teorema 165.
9.5. Encontre a solu c ao do problema
_
_
_
_
1
0
u
2
(t)dt
s.a. z
t
= 2z +u, t (0, 1);
z(0) = 1, z(1) = 0.
A solu c ao encontrada e unica?
_
_
_
_
1
0
(2 5t)u(t)dt
s.a. z
t
= 2z + 5e
2t
u, t (0, 1);
z(0) = 0, z(1) = e
2
; [u(t)[ 1, t [0, 1].
a) A solu c ao encontrada e unica?
b) Considere o problema anterior com a din amica z
t
= 2z + 4e
2t
u.
Encontre a solu c ao.
(Sugest ao: Utilize a fun c ao auxiliar v(t) := e
2t
z(t).)
9.7. Considere o problema
_
_
_
_
1
0
(u(t) + 1)dt
s.a. z
t
= u, t (0, 1);
z(0) = z(1) = 0.
Mostre que cada controle u

C[0, 1], que satisfaz
_
1
0
u(t)dt = 0, e otimo
para o problema.
_
_
_
_
1
0
[u
2
(t) 2u(t)]dt
s.a. z
t
= t[u[, t (0, 1);
z(0) = 0;
_
1
0
z
t
(t)dt
1
6
.
steuer
2008/3/11
page 215
i
i
i
i
i
i
i
i
EXERC
ICIOS 215
_
_
_
_
1
0
[z
t
(t) 2t + 1]
2
dt
s.a. z
t
= u, t (0, 1);
z(0) = z(1) = 0; z(t) 0.
9.10. Considere o problema escalar
_
Minimizar
_
1
0
[3z(t)
2
+u(t)
2
]dt
s.a. z
t
= z +u, t (0, 1), z(0) = 1.
a) Obtenha o problema variacional correspondente.
b) Encontre a equa c ao de EulerLagrange e as condi c oes de contorno
correspondentes.
c) Determine o controle otimo.
steuer
2008/3/11
page 216
i
i
i
i
i
i
i
i
Captulo 10
Princpio do Maximo
Neste captulo e analisado um conjunto de condi c oes necessarias para
otimalidade de solu c oes de problemas de controle otimo. Tal resultado e
conhecido na literatura como princpio do m aximo
1
e muito se assemelha
a um teorema de multiplicadores de Lagrange, formulado em espa cos de
dimens ao innita.
Como vimos na Sec c ao 9.5, com hipoteses adicionais de convexidade,
o princpio do maximo pode ser demonstrado utilizando-se argumentos
elementares de analise. Em particular, a condi c ao de maximo (9.18) e
obtida a partir da equa c ao de EulerLagrange. No caso geral (sem a
hipotese de convexidade da Hamiltoniana), a demonstra c ao da necessi-
dade da condi c ao de maximo e mais complicada e necessita de alguns
resultados oriundos da teoria de otimiza c ao em espa cos de dimens ao
innita (veja Apendice B).
A autoria do princpio do maximo e controversa. A maioria dos au-
tores credita a condi c ao (9.18) ao grupo liderado pelo matematico russo
L.S. Pontryagin (1956). Entretanto, tal condi c ao pode ser encontrada
em um texto anterior, porem pouco divulgado, de M.R. Hestenes (1950).
Para maiores detalhes consulte [Hes], [PBG], assim como o artigo de
Hestenes
2
em [BaNe].
O captulo e organizado da seguinte forma: Na Sec c ao 10.1 apre-
sentamos o princpio do maximo para problemas de controle otimo com
horizonte nito. Algumas variantes do resultado, correspondentes a di-
ferentes condi c oes de contorno, s ao tambem analisadas nesta sec c ao. Na
1
Tambem conhecido como princpio do mnimo, ou princpio de Pontryagin.
2
Hestenes, M.R., Variational theory and optimal control theory, 1 22
steuer
2008/3/11
page 217
i
i
i
i
i
i
i
i
[SEC. 10.1: PROBLEMAS COM HORIZONTE FINITO 217
Sec c ao 10.2 consideramos o princpio do maximo para problemas com
horizonte innito. Na Sec c ao 10.3 s ao discutidas diversas aplica c oes,
nas quais o princpio do maximo e utilizado na identica c ao de proces-
sos otimos.
10.1 Problemas com Horizonte Finito
Come camos por discutir uma formula c ao bastante geral para proble-
mas de controle otimo com horizonte nito. Considere o problema de
controle
P(t
0
, z
0
)
_
_
Minimizar J(z, u) := L
1
(t
1
, z(t
1
)) +
_
t
1
t
0
L(t, z(t), u(t)) dt
sujeito a
t
1
t
0
; u L
1
([t
0
, t
1
]; R
m
), u(t) q.s. em [t
0
, t
1
] ;
z(t)=z
0
+
_
t
t
0
f(s, z(s), u(s)) ds, t[t
0
, t
1
] ; (t
1
, z(t
1
))=0
onde
L : [t
0
, ) R
n
R
m
R, L
1
: [t
0
, ) R
n
R,
f : [t
0
, ) R
n
R
m
R
n
, : [t
0
, ) R
n
R
p
e R
m
. O tempo inicial t
0
e a condi c ao inicial z
0
s ao fornecidos,
enquanto que o tempo nal t
1
e a condi c ao nal s ao, a princpio, desco-
nhecidos.
Note que o fato da din amica do sistema ser descrita por uma equa c ao
integral ao inves de diferencial, permite-nos considerar trajeorias ad-
missveis menos regulares. O conjunto das estrategias de controle ad-
missveis e
|
ad
:= L
1
loc
([0, ); R
m
).
Desta forma, as trajetorias correspondentes s ao fun c oes absolutamente
contnuas em [t
0
, t
1
].
Deni cao 177. Sejam f, L as fun c oes denidas acima. A aplica c ao
H : [t
0
, ) R
n
R
n
R
m
R,
(t, z, , u) , f(t, z, u)) + L(t, z, u)
e denominada fun c ao de Hamilton (note que a origem da constante
precisa ainda ser esclarecida). 2
steuer
2008/3/11
page 218
i
i
i
i
i
i
i
i
218 [CAP. 10: PRINC
IPIO DO M
AXIMO
No teorema a seguir apresentamos o princpio do m aximo. Por ser
longa e tecnica, a demonstra c ao e apresentada no Apendice B. A argu-
menta c ao utilizada na demontra c ao segue a linha das notas de aula de
M. Brokate (veja [Br]).
Como referencias auxiliares o leitor pode consultar [PBG], [Hes],
[Ber], [Know], [MaSt], [Za], entre outros. A obten c ao do princpio do
maximo para problemas com tempo nal xo (t
1
= T conhecido) e mais
simples, podendo ser encontrada em [FlRi, Captulo 2], [Ho, Captulo 9]
ou [Tr, Teorema 11.8]. Uma demonstra c ao alternativa baseada em ar-
gumentos de programa c ao din amica e apresentada na Sec c ao 13.4.
Teorema 178. Suponha que L, f s ao aplica c oes C
2
e que L
1
, s ao
C
1
. Se ( z, u,

t
1
) e uma solu c ao do problema P(t
0
, z
0
), tal que
z
(
t
1
, z(
t
1
)) ,= 0 e (L
1
)
z
(
t
1
, z(
t
1
)) ,= 0,
ent ao existe uma fun c ao : [t
0
,

t
1
] R
n
e constantes 0, R
p
que satisfazem:
i) Equa c ao de estado
z(t) = z
0
+
_
t
t
0
f(s, z(s), u(s)) ds, t [t
0
,

t
1
] ;
ii) Equa c ao adjunta
_
_
(t) =
1
+
_

t
1
t
H
z
(s, z(s), (s), u(s)) ds, t [t
0
,

t
1
],
1
:=
L
1
z
(
t
1
, z(
t
1
))

z
(
t
1
, z(
t
1
))
;
iii) Equa c ao de evolu c ao da fun c ao de Hamilton
_
_
H(t, z(t), (t), u(t)) = H
1
_

t
1
t
H
t
(s, z(s), (s), u(s)) ds, t [t
0
,

t
1
],
H
1
:=
L
1
t
(
t
1
, z(
t
1
)) +
_
t
(
t
1
, z(
t
1
)),
_
;
iv) Condi c ao de otimalidade
H(t, z(t), (t), u(t)) = min
u
H(t, z(t), (t), u), q.s. em [t
0
,

t
1
] ;
v) Condi c ao de n ao acoplamento +[[ ,= 0.
Demonstra c ao: Veja Apendice B.
steuer
2008/3/11
page 219
i
i
i
i
i
i
i
i
A demonstra c ao do Teorema 178 constitui-se na aplica c ao de um
teorema de multiplicadores a um problema auxiliar, obtido de P(t
0
, z
0
)
por uma mudan ca de variaveis denominada transforma c ao no tempo e
cuja solubilidade esta relacionada a de P(t
0
, z
0
). As constantes e
surgem na demonstra c ao como componentes de um vetor normal a um
hiperplano, que separa conjuntos de nvel associados à fun c ao objetivo
J e à condi c ao nal (t, z(t)) = 0.
Observa cao 179. A denomina c ao princpio do m aximo e motivada
pelo item iv) do Teorema 178, que, entretanto, refere-se à determina c ao
de um mnimo. Note, porem, que a elementar substitui c ao de J por
J permite-nos trocar o problema de minimiza c ao por um de maxi-
miza c ao, alterando assim o min da condi c ao iv) para max. Sem d uvida,
as condi c oes mais interessantes do Teorema 178 s ao
_
_
_
z
t
= H
(t, z, , u), z(t

0
) = z
0
, (t
1
, z(t
1
)) = 0,
t
= H
z
(t, z, , u), (t
1
) =
L
1
z
(t
1
, z(t
1
))

z
(t
1
, z(t
1
))
;
H(t, z, , u) = min
w
H(t, z(t), (t), w), q.s. em [t
0
, t
1
] .
Note que o par (z, ) e solu c ao de um sistema hamiltoniano para a
fun c ao H. 2
Observa cao 180. Analogamente aos problemas variacionais, os pro-
blemas de controle otimo tambem podem ser formulados com diferentes
tipos de condi c oes de contorno. A cada um destes tipos corresponde uma
variante do Teorema 178, que se diferencia deste apenas pelas condi c oes
de contorno da variavel adjunta e da fun c ao de Hamilton. Enunci-
amos a seguir algumas variantes do problema P(t
0
, z
0
) que surgem com
maior freq uencia nas aplica c oes. Apresentamos tambem as condi c oes
necessarias correspondentes para cada problema.
Considere o problema P(t
0
, z
0
) com t
1
xo (t
1
> t
0
) e L
1
0.
Se a condi c ao nal e xada (z(t
1
) = z
1
), n ao ha nenhuma condi c ao
para (t
1
) (corresponde à escolha (t, z) := (t t
1
, z z
1
) R
2
).
Se a condi c ao nal e livre (z(t
1
) qualquer), a variavel adjunta satisfaz
(t
1
) = 0 (corresponde à escolha (t, z) := t t
1
R).
Se a condi c ao nal e da forma: z(t
1
) z
1
(no caso escalar), a variavel
adjunta satisfaz (t
1
) 0, ocorrendo a igualdade quando z(t
1
) > z
1
.
Considere o problema P(t
0
, z
0
) com L
1
0. Neste caso, as condi c oes
steuer
2008/3/11
page 220
i
i
i
i
i
i
i
i
220 [CAP. 10: PRINC
IPIO DO M
AXIMO
para (t
1
) discutidas acima n ao se alteram e, alem disso,
H(t
1
, z(t
1
), (t
1
), u(t
1
)) = 0 .
Esta equa c ao extra corresponde à variavel adicional do problema, repre-
sentada pelo tempo nal desconhecido t
1
. 2
O princpio do maximo pode, em alguns casos, ser utilizado para
efetivamente determinar uma solu c ao do problema P(t
0
, z
0
). Para tanto,
aplica-se a seguinte estrategia: Inicialmente explicitamos o controle u em
fun c ao das variaveis z e , obtendo assim
u() = U
(, z(), ()) .
O proximo passo e substituir essa express ao no problema de valor de
contorno da Observa c ao 179 (eliminando a variavel u):
z
t
= H
(t, z, , U
), z(t
0
) = z
0
, (t
1
, z(t
1
)) = 0 ; (10.1)
t
= H
z
(t, z, , U
), (t
1
) =
L
1
z
(t
1
, z(t
1
)) (10.2)

z
(t
1
, z(t
1
))
;
H
t
=
H
t
(t, z, , U
) , (10.3)
H(t
1
, z(t
1
), (t
1
), U
(t
1
)) =
L
1
t
(t
1
, z(t
1
)) +
_
t
(t
1
, z(t
1
)),
_
Este sistema e ent ao resolvido, com o intuito de obter um candidato
à solu c ao do problema de controle P(t
0
, z
0
). Entretanto, nem sem-
pre e possvel obter a representa c ao U
(, z, ) o extremal singular
na Sec c ao 9.3 e um exemplo e nesses casos fala-se da existencia de
uma estrategia de controle singular.
O sistema resultante de (10.1), (10.2), (10.3) pela substitui c ao u() =
U
(, z, ) pode ser resolvido por um metodo do tipo shooting (veja

Sec c ao A.6), conforme mostra o esquema na Figura 10.1 (supomos = 1
no Teorema 178).
Observa cao 181. O problema de valor de contorno (10.1), (10.2),
(10.3) possui, tomando o controle u xo, 2n + 1 variaveis (z, , H) e
p + 1 par ametros (, ). Temos assim 2n +p + 2 graus de liberdade, os
quais est ao sujeitos a 2n + p + 1 equa c oes. Aparentemente, temos um
steuer
2008/3/11
page 221
i
i
i
i
i
i
i
i
1. Estime
0
:= (t
0
) e ;
2. Resolva o problema de valor inicial
_
_
_
z
t
= +
H
(t, z, , 1, U
(t, z, )), z(t

0
) = z
0
,
t
=
H
z
(t, z, , 1, U
(t, z, )), (t
0
) =
0
;
3. Aprimore a estimativa (p.ex. atraves do metodo de
Newton)
com o objetivo de satisfazer as equac~ oes
(t
1
, z(t
1
)) = 0, (t
1
) =
L
1
z
(t
1
, z(t
1
))

z
(t
1
, z(t
1
))
;
4. Retorne ao passo 2.
Figura 10.1: Algoritmo do metodo de shooting para sistema hamiltoni-
ano
grau de liberdade a mais. Note, porem, que a condi c ao de n ao acopla-
mento v) garante que e n ao s ao ambos nulos, sendo portanto sempre
possvel simplicar o sistema (10.1), (10.2), (10.3) em rela c ao a ou
a uma das componentes de . Sendo assim, o Teorema 178 pode ser
formulado alternativamente como:
. . . existem : [t
0
,

t
1
] R
n
, = 0 ou = 1, R
p
que satisfazem i),
. . . , v).
2
Observa cao 182.

E simples vericar que a equa c ao de EulerLagrange
do calculo variacional pode ser obtida do princpio do maximo. De
fato, o problema de minimiza c ao (7.2) do calculo variacional pode ser
interpretado como
_
_
_
Minimizar J(z, u) :=
_
b
a
L(t, z(t), u(t)) dt
sujeito a z
t
= u(t) .
steuer
2008/3/11
page 222
i
i
i
i
i
i
i
i
222 [CAP. 10: PRINC
IPIO DO M
AXIMO
Logo, a condi c ao de maximo iv) do Teorema 178 implica em
0 =
H
u
(t, z,
, u) =

u
[
, u) + L(t, z, u)] =

+
L
u
(t, z, u)
e, portanto,
(10.4)

=
L
u
(t, z, u) .
O sistema hamiltoniano para as variaveis de estado e adjunta se escreve
(10.5)
_
_
_
d z
dt
= +
H
= u
d
dt
=
H
z
=
L
z
(t, z, u)
De (10.4) e (10.5), temos
L
z
(t, z, u) =
d
dt
_
L
u
(t, z, u)
_
ou
L
z
(t, z, ( z)
t
)
d
dt
_
L
z
t
(t, z, ( z)
t
)
_
= 0 .
2
10.2 Problemas com Horizonte Innito
Analisamos nesta sec c ao condi c oes necessarias para problemas de
controle otimo com horizonte innito. Os problemas de controle dessa
natureza tem ganho import ancia nas ultimas decadas devido aos mo-
delos matematicos oriundos das ciencias econ omicas e biologicas que os
utilizam.
Os primeiros trabalhos a tratar de problemas de otimiza c ao com hori-
zonte innito s ao devidos aos economistas. Uma referencia classica e o
artigo escrito em 1928 por F. Ramsey (veja [Ra]), que trata de proble-
mas do tipo consumo investimento (veja Aplica c ao 190). A primeira
extens ao do princpio do maximo para problemas com horizonte innito
foi apresentada por H. Halkin em 1964 (veja [Ha]). Um apanhado do de-
senvolvimento da teoria pode ser encontrado em [CaHa]. Na abordagem
aqui apresentada, seguimos os passos descritos em [Leit], que utiliza um
conceito de otimalidade diferente dos encontrados em [Ha] e [CaHa].
steuer
2008/3/11
page 223
i
i
i
i
i
i
i
i
[SEC. 10.2: PROBLEMAS COM HORIZONTE INFINITO 223
In umeros modelos econ omicos (de horizonte nito e innito) s ao
tratados, sob a otica do controle otimo e programa c ao din amica, em
[SeSy]. Nesta referencia tambem s ao analisados problemas de explora c ao
de recursos naturais. O leitor interessado em aplica c oes desta natureza
deve consultar ainda [SeZh].
Aplica c oes a modelos biologicos podem ser encontradas em [Cl].
Um interessante problema relacionado à explora c ao otima de recursos
biorenovaveis (pescaria otima) e analisado em [CCM], e [BaLe].
A seguir analisamos um caso particular do problema abordado na
Sec c ao 10.1. Trata-se de problemas de controle otimo com tempo nal
xo. A abordagem nesta sec c ao de tais problemas (de horizonte nito)
e justicada pelo fato das condi c oes necessarias para estes problemas
serem utilizadas na demonstra c ao do princpio do maximo para os pro-
blemas com horizonte innito.
Suponha que no problema P(t
0
, z
0
) o tempo nal t
1
= T e o estado
nal z
1
= z
T
s ao dados. Temos assim o seguinte problema de controle
otimo:
P
T
(z
0
)
_
_
_
T
0
L(t, z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
0
f(s, z(s), u(s)) ds, t [0, T], z(T) = z
T
;
u L
1
([0, T]; R
m
), u(t) q.s. em [0, T] ;
Argumentando como na Observa c ao 180, obtemos um conjunto de con-
di c oes necessarias para otimalidade de uma solu c ao do problema P
T
(z
0
):
Corolario 183. Suponha que L, f s ao aplica c oes C
2
. Se ( z, u) e uma
solu c ao do problema P
T
(z
0
), ent ao existe uma fun c ao : [0, T] R
n
e
= 1 ou = 0 que satisfazem
i) Sistema hamiltoniano
_
_
_
( z)
t
(t) = H
(t, z, , u), q.s. em [0, T],
t
(t) = H
z
(t, z, , u), q.s. em [0, T],
z(t
0
) = z
0
, z(T) = z
T
;
ii) Condi c ao de otimalidade
H(t, z(t), (t), u(t)) = min
u
H(t, z(t), (t), u), q.s. em [0, T] ;
steuer
2008/3/11
page 224
i
i
i
i
i
i
i
i
224 [CAP. 10: PRINC
IPIO DO M
AXIMO
iii) Condi c ao de n ao acoplamento +||
,= 0.
Demonstra c ao: Segue imediatamente do Teorema 178 e da Observa-
c ao 180.
Analisamos agora os problemas com horizonte innito. Considere o
seguinte problema de controle otimo:
P
(z
0
)
_
_
_

0
e
t
L(z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
0
f(z(s), u(s)) ds, t [0, ) ;
u L
1
loc
([0, ); R
m
), u(t) q.s. em [0, ) ;
onde as fun c oes L : R
n
R
n
R, f : R
n
R
n
R
n
, o conjunto
R
m
e a constante > 0 s ao dados. Vericamos a seguir um resultado
que fornece condi c oes necessarias para otimalidade de uma solu c ao de
P
(z
0
).
Teorema 184. Suponha que L, f s ao aplica c oes C
2
. Se ( z, u) e uma
solu c ao de P
(z
0
), ent ao existe uma aplica c ao : [0, ) R
n
e cons-
tantes = 0 ou = 1,
0
R
n
que satisfazem:
i) Equa c ao de estado
z(t) = z
0
+
_
t
0
f(s, z(s), u(s)) ds, t [0, ) ;
ii) Equa c ao adjunta
(t) =
0
+
_
t
0
H
z
(s, z(s), (s), u(s)) ds, t [0, ) ;
iii) Condi c ao de otimalidade
H(t, z(t), (t), u(t)) = min
u
H(t, z(t), (t), u), q.s. em [0, ) .
Demonstra c ao: Seja ( z, u) um processo otimo para P
(z
0
). Dado
T > 0, as fun c oes e
t
L : [0, T] R
n
R
m
e f : [0, T] R
n
R
m
sa-
tisfazem as condi c oes do Corolario 183. Logo, este corolario nos fornece
condi c oes necessarias para otimalidade de cada problema
steuer
2008/3/11
page 225
i
i
i
i
i
i
i
i
[SEC. 10.2: PROBLEMAS COM HORIZONTE INFINITO 225
P
T
k
(z
0
)
_
_
_
T
k
0
e
t
L(t, z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
0
f(s, z(s), u(s)) ds, t [0, T
k
],
z(T
k
) = z
k
:= z(T
k
) ;
u L
1
([0, T
k
]; R
m
), u(t) q.s. em [0, T
k
] ;
onde T
k
. Como consequencia do princpio de otimalidade de Bell-
man, temos que ( z, u)[
[0,T
k
]
e uma solu c ao de P
T
k
(z
0
). Juntando os fatos,
podemos garantir a existencia de
k
0,
k
: [0, T
k
] R
n
, tal que
|
k
|
+
k
> 0 ;
( z,
k
) e solu c ao do sistema Hamiltoniano
3
d z(t) = H
(t, z(t),
k
(t), u(t)) dt, t [0, T
k
]
d
k
(t) = H
x
(t, z(t),
k
(t), u(t)) dt, t [0, T
k
]
z(0) = z
0
, z(T
k
) = z
k
;
H(t, z(t),
k
(t), u(t)) = max
u
H(t, z(t),
k
(t), u), q.s. in [0, T
k
].
Considere agora a seq uencia
k
(0),
k
kN
. Normalizando os multi-
plicadores de Lagrange, podemos supor que [
k
(0)[ +
k
= 1, k N.
Tomando subseq uencias (se necessario), podemos garantir a existencia
de
0
R
n
e 0 satisfazendo
(10.6) [
0
[ + = 1, lim
k
k
(0) =
0
, lim
k
k
= .
Seja agora T > 0 xo. Logo T
k
> T, para k > k
0
e como o sis-
tema Hamiltoniano desfruta da propriedade de dependencia contnua
das condi c oes iniciais, podemos garantir que existe : [0, T] R
n
, tal
que
k
converge uniformemente para em [0, T]. Essa convergencia im-
plica nas desejadas condi c oes de otimalidade para o problema P
(x
0
),
uma vez que T > 0 e arbitrario.
Observa cao 185. Duas diferen cas basicas devem ser observadas na for-
mula c ao do Teorema 184 em rela c ao ao Teorema 178:
3
Note que H(t, z,
k
, u) =
k
, F(t, z, u)) +
k
L(t, z, u).
steuer
2008/3/11
page 226
i
i
i
i
i
i
i
i
226 [CAP. 10: PRINC
IPIO DO M
AXIMO
Falta uma condi c ao de contorno nal para a variavel adjunta (even-
tualmente uma condi c ao de decaimento do tipo lim
t
(t) = 0);
Falta a condi c ao de n ao acoplamento (neste caso +[
0
[ ,= 0). 2
Uma analise para problemas do tipo linear-quadratico com horizonte
innito e tambem possvel via programa c ao din amica (veja Captulo 12).
Atraves de um processo de limite, e possvel obter a fun c ao valor resol-
vendo-se a equa c ao algebrica de Riccati (veja [So, Captulo 7]).
10.3 Aplica c oes do Princpio do Maximo
Nesta sec c ao analisamos, à luz do princpio do maximo, alguns pro-
blemas de controle otimo. Na Aplica c ao 186 e discutido formalmente o
problema de tempo mnimo introduzido na Sec c ao 1.2.3. A Aplica c ao 187
e uma extens ao da primeira. Nela e analisada uma famlia maior de
problemas, composta pelos denominados problemas de tempo mnimo
ate a origem.
Na Aplica c ao 188 o princpio do maximo e utilizado para vericar que
uma estrategia do tipo bang-bang e a unica estrategia otima existente
para um problema de alunissagem. Na Aplica c ao 189 consideramos um
problema com controle singular. Aqui, a solu c ao e obtida pelo princpio
do maximo, entretanto este problema pode tambem ser tratado seguindo
a linha apresentada na Sec c ao 9.3.
Na Aplica c ao 190 consideramos um modelo econ omico classico, que
foi formulado por F. Ramsey em 1928 (veja [Ra]). Utilizando a equa c ao
de EulerLagrange, obtemos a poltica otima para um problema de con-
sumo investimento com horizonte innito.
Em [BMS] podem ser encontradas diversas aplica c oes do princpio
do maximo a problemas aeroespaciais, dentre as quais citamos: Desenho
otimo de uma miss ao a Netuno; Ascenss ao otima de um veculo espacial
hipers onico; Alcance maximo de v oo para uma asa delta atravessan-
do uma termica. Em [Ho] s ao discutidas (entre outras) as seguintes
aplica c oes: Oscilador harm onico com custo de combustvel; controle de
epidemias; Pescaria otima; Contra c ao do ventrculo esquerdo do cora c ao;
Compra e venda de a c oes.
Aplica cao 186 (Tempo mnimo I). Considere a tarefa de encontrar
uma estrategia u (acelera c ao e frenagem) que permita levar, no menor
tempo possvel, um carro que se encontra na origem e em repouso, ate
steuer
2008/3/11
page 227
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC

OES DO PRINC
IPIO DO M
AXIMO 227
uma parede distante de uma unidade. Ao chegar na parede o carro deve
ter novamente velocidade nula.
Supondo que o carro de massa unitaria e desprezando os atritos,
temos o modelo:
x(t) = u(t), t [0,
t],
onde x(t) representa o deslocamento, x(t) a velocidade e x(t) a acelera c ao
do veculo no tempo t. As condi c oes de contorno s ao:
x(0) = 0, x(0) = 0 ;
x(
t) = 1, x(
t) = 0 .
Podemos ent ao escrever o problema na forma P(t
0
, z
0
) como
_
_
Minimizar
_
T
0
1 dt
sujeito a
z
t
=
_
0 1
0 0
_
z +
_
0
1
_
u, z(0) = 0 ;
(T, z(T)) :=
_
1
0
_
z(T) = 0
onde T 0, u L
1
[0, T] e u(t) := [1, 1] q.s. em [0, T]. Como o sis-
tema e aut onomo, a aplica c ao U
= U
(z, ) n ao depende explicitamente

do tempo. Do princpio do maximo, obtemos as seguintes condi c oes
necessarias:
z
t
=
_
z
2
u
_
, z(0) = 0, z(T) =
_
1
0
_
;
t
=
_
0
1
_
, (T) = (
2
) ;
H(t, z, , u) = z
2
1
+ u
2
+ ;
z
2
1
+ U
(z, )
2
+ = min
u[1,1]
z
2
1
+u
2
+, q.s. em [0, T] ;
+ [
1
[ + [
2
[ ,= 0 .
A condi c ao de optimalidade nos permite encontrar
(10.7) U
(z, ) =
_
sign
2
,
2
,= 0
? ,
2
= 0
Calculando agora z(t), (t) para t [0, T], obtemos
4
(10.8) z
2
(t) =
_
t
0
u(s) ds, z
1
(t) =
_
t
0
_
s
0
u(r) dr ds, t [0, T] ;
4
Note que e calculado para tr as no tempo.
steuer
2008/3/11
page 228
i
i
i
i
i
i
i
i
228 [CAP. 10: PRINC
IPIO DO M
AXIMO
(10.9)
1
(t) =
1
,
2
(t) = (T t)
1
+
2
, t [0, T] .
Analisando (10.7), conclumos que basta identicar o sinal e os zeros
da fun c ao
2
para obtermos a estrategia otima de controle. Estudamos
assim os seguintes casos:

2
n ao possui zeros: de (10.7), segue que u(t) 1 ou u(t) 1.
Entretanto, essas estrategias n ao s ao admissveis, pois as respecti-
vas trajetorias n ao alcan cam o estado nal;

2
possui zeros em [0, T): de (10.9), temos que
2
e uma fun c ao
linear em t. Logo,
2
possui apenas um zero em [0, T), o qual
denominamos .
Temos assim duas famlias de candidatos a controle otimo:
u(t) =
_
1, t <
1, t >
e u(t) =
_
1, t <
1, t >
.
Note que com os controles da segunda famlia n ao e possvel atingir o
estado nal z(T) = (
1
0
) para nenhum T > 0. Substituindo a express ao
restante em (10.8), temos
z() =
_
1
2
_
; z(T) =
_

1
2
T
2
+ 2T
2
2 T
_
.
Da condi c ao de contono z(T) = (
1
0
), obtemos para o par (, T) o sistema
n ao linear
_
1 =
1
2
T
2
+ 2T
2
0 = 2 T
cuja solu c ao e = 1, T = 2, como se verica facilmente. Portanto, a
solu c ao do problema de controle e
T = 2, u(t) =
_
1, 0 t < 1
1, 1 t 2
2
Aplica cao 187 (Tempo mnimo II). Consideramos agora uma vari-
ante da aplica c ao anterior. Suponha que no tempo t = 0 nosso carro
se encontra na posi c ao a R com velocidade b R. Nosso objetivo e
leva-lo ate a origem no menor tempo possvel, de forma que ao chegar
ao destino, o carro tenha velocidade nula.
steuer
2008/3/11
page 229
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC

OES DO PRINC
IPIO DO M
AXIMO 229
Temos agora o seguinte problema de controle
_
_
Minimizar
_
T
0
1 dt
sujeito a
z
t
=
_
0 1
0 0
_
z +
_
0
1
_
u, z(0) = (
a
b
) ;
(T, z(T)) := z(T) = 0
onde T 0, u L
1
[0, T] e u(t) := [1, 1] q.s. em [0, T]. As
condi c oes necessarias fornecidas pelo princpio do maximo s ao as mes-
mas, com excess ao das condi c oes de contorno para a variavel de estado
z
t
=
_
z
2
u
_
, z(0) =
_
a
b
_
, z(T) = 0 .
U
(z, ) e novamente dada pela equa c ao (10.7) e os multiplicadores de

Lagrange por (10.9). Portanto,
2
e linear e muda de sinal no maximo
uma vez em [0, T]. Sendo assim, basta estudar os seguintes casos:
1
o
Caso: u n ao muda de sinal em [0, T].
Se u 1, temos
z
2
(t) = b +t, z
1
(t) = a +bt +
t
2
2
, t [0, T] .
Como z(T) = 0, tais estrategias s ao admissveis apenas para condi c oes
iniciais do tipo (a, b) = (T
2
/2, T), com T > 0.
Se u 1, temos
z
2
(t) = b t, z
1
(t) = a +bt
t
2
2
, t [0, T] .
Como z(T) = 0, tais estrategias s ao admissveis apenas para condi c oes
iniciais do tipo (a, b) = (T
2
/2, T), com T > 0.
A curva ( na Figura 10.2 e composta pelas condi c oes iniciais (a, b),
para as quais as estrategias u 1 ou u 1 s ao otimas. As respectivas
trajetorias correspondem à parte da curva ( limitada por (a, b) e pela
origem.
2
o
Caso: u muda de sinal em (0, T).
No caso anterior vimos que, se u 1, ent ao z
2
(t)
2
= 2z
1
(t) + const;
enquanto que u 1 implica em z
2
(t)
2
= 2z
1
(t) + const. Portanto,
as trajetorias correspondentes a tais controles s ao necessariamente pa-
ralelas a um dos arcos de parabola mostrados na Figura 10.3. De onde
steuer
2008/3/11
page 230
i
i
i
i
i
i
i
i
230 [CAP. 10: PRINC
IPIO DO M
AXIMO
z
2
z
1
(
u1
u1
a
b
Figura 10.2: Trajetorias correspondentes aos controles otimos u 1 ou
u 1
conclumos que a trajetoria otima e necessariamente composta por dois
arcos: cada um pertencente a uma das famlias na Figura 10.3 (lembre
que u muda de sinal uma unica vez no intervalo [0, T]).
Note que a parte nal da trajetoria otima e necessariamente como na
Figura 10.2 (caso contrario a trajetoria n ao seria admissvel). Para deter-
minar a parte inicial da trajetoria, observe que, dada uma condi c ao ini-
cial (a, b) R
2
, existe uma unica curva pertencente às famlias mostradas
na Figura 10.3, que intercepta tanto o ponto (a, b) quanto a curva ( (o
caso a > 0, b > 0 e mostrado na Figura 10.4). O princpio do maximo
nos permite concluir que existe uma unica trajetoria associada a con-
troles do tipo
u(t) =
_
1, t <
1, t >
ou u(t) =
_
1, t <
1, t >
z
2
z
1
z
2
z
1
Figura 10.3: Trajetorias correspondentes a controles constantes
steuer
2008/3/11
page 231
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC

OES DO PRINC
IPIO DO M
AXIMO 231
z
2
z
1
(
u1
u1
a
b
c
P
Figura 10.4: Trajetoria otima para a condi c ao inicial z(0) = (a, b)
que e admissvel para a condi c ao inicial (a, b). Tal trajetoria e composta
por dois arcos: um da curva c limitado por (a, b) e pelo ponto P e outro
da curva ( limitado por P e pela origem. Para calcular (instante
em que trocamos o controle de 1 para 1) n ao e necessario calcular
as constantes
1
,
2
na equa c ao (10.9). No caso a > 0, b > 0, basta
descobrir para qual > 0 a curva (z
1
(t), z
2
(t)) = (a + bt t
2
/2, b t)
satisfaz a condi c ao
z
2
() < 0, z
2
()
2
= 2z
1
() .
Um calculo simples mostra que e dado por uma das razes b
_
b
2
/2 a.
2
Aplica cao 188 (Alunissagem). Considere o problema de controlar a
descida de uma espa conave na Lua, utilizando para isso a menor quan-
tidade possvel de combustvel. Em um modelo simplicado, temos
5
t : tempo;
h(t) : altura da espa conave;
v(t) : velocidade da espa conave;
m(t) : massa da espa conave + combustvel;
u(t) : empuxo dos motores da espa conave.
Seja M a massa da espa conave sem combustvel, F a quantidade ini-
cial de combustvel, h
0
a altura inicial, v
0
a velocidade inicial, u
max
o
empuxo maximo dos motores da nave (0 u(t) u
max
, t 0), g a
constante gravitacional da Lua (considerada constante) e k a constante
de proporcionalidade entre o empuxo e a taxa de queima do combustvel.
5
Este modelo e tambem discutido em [FlRi], [Ho] e [Know].
steuer
2008/3/11
page 232
i
i
i
i
i
i
i
i
232 [CAP. 10: PRINC
IPIO DO M
AXIMO
As variaveis de estado (h, v, m) satisfazem a seguinte din amica:
_
_
_
h
t
= v(t)
v
t
= g + u(t)/m(t)
m
t
= ku(t)
Denindo z(t) = (h(t), v(t), m(t)), temos o sistema n ao linear
(10.10)
_
_
z
t
=
_
_
z
2
g +u/z
3
ku
_
_
=: f(t, z, u)
z(0) = (h
0
, v
0
, M +F), z(T) = (0, 0, ?) .
A condi c ao nal segue da hipotese que um pouso suave ocorre quando
h(T) = 0 e v(T) = 0, sendo para m somente relevante que m(T) M.
Como o custo a ser minimizado corresponde ao gasto de combustvel,
temos que maximizar
m(T) = M + F k
_
T
0
u(t) dt .
O problema de controle otimo pode ser escrito como:
_
_
Minimizar J(T, z, u) =
_
T
0
u(t) dt
sujeito a
u L
1
[0, T] [ u(t) := [0, u
max
] q.s. em [0, T],
z
t
= f(z, u), z(0) = (h
0
v
0
M +F) R
3
,
(T, z(T)) = (z
1
(T) z
2
(T)) = 0 R
2
A fun c ao de Hamilton e
H(t, z, , u) = , u)+L(t, z, u) =
1
z
2
+
2
(g+u/z
3
)
3
ku+u .
Minimizando a fun c ao de Hamilton em rela c ao a u obtemos
(10.11) U
(z, ) =
_
_
_
0 , +
2
/z
3
k
3
> 0
? , +
2
/z
3
k
3
= 0
u
max
, +
2
/z
3
k
3
< 0
Tomamos por simplicidade u
max
= 1. A m de tornar o problema
sicamente coerente, supomos ainda
steuer
2008/3/11
page 233
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC

OES DO PRINC
IPIO DO M
AXIMO 233
z
1
= h
z
2
= v
=TF/k
Figura 10.5: Condi c oes iniciais (h, v) que s ao levadas pelo controle u 1
à condi c ao nal (0, 0, m(T)) com m(T) M.
1 = empuxo maximo > for ca gravitacional = (M +F)g,
isto e 1/(M + F) > g.

E razoavel considerar que existe uma estrategia
otima do tipo bangbang, i.e. da forma
(10.12) u(t) =
_
0 , t [0, )
1 , t [, T]
Calculamos inicialmente a trajetoria associada à estrategia u. Como
u 1 em [, T], usamos o sistema (10.10) e as condi c oes de contorno
z
1
(T) = z
2
(T) = 0 e z
3
() = M + T a m de determinar z no instante
t = . Obtemos assim
_
_
z
1
() =
1
2
g(T )
2
M+F
k
2
ln
_
M+Fk(T)
M+F
_

T
k
z
2
() = g(T ) +
1
k
ln
_
M+Fk(T)
M+F
_
z
3
() = M +F
Tra cando o graco de z
1
() por z
2
(), obtemos a curva da Figura 10.5,
que e formada pelos estados da forma z() = (h(), v(), M + F) que
s ao levados pelo controle u(t) = 1, t [, T] no estado nal z(T) =
(0, 0, m(T)) com m(T) M. Note que o comprimento dessa curva e
limitado pois, como u 1, temos m
t
= k e o combustvel se esgotara
apos F/k unidades de tempo. Temos assim a limita c ao T F/k
(alem de T 0, obviamente).
steuer
2008/3/11
page 234
i
i
i
i
i
i
i
i
234 [CAP. 10: PRINC
IPIO DO M
AXIMO
z
1
= h
z
2
= v
u=0
u=1
(v
0
,h
0
)
Figura 10.6: Trajetoria correspondente à estrategia bang-bang u.
Como inicialmente u 0, a nave se encontra em queda livre durante
o intervalo de tempo [0, ]. A trajetoria correspondente e
_
_
z
1
(t) =
1
2
gt
2
+v
0
t +h
0
z
2
(t) = gt +v
0
z
3
(t) = M +F
t [0, ] .
Explicitando z
1
(= h) em fun c ao de z
2
(= v), obtemos:
h(t) = h
0

1
2g
[v
2
(t) v
2
0
], t [0, ] .
A curva (v(t), h(t)) e uma parabola no plano de fase vh. Unindo os dois
trechos da trajetoria correspondente a u, obtemos a curva mostrada na
Figura 10.6. Segundo essa trajetoria, a nave cai em queda livre ate que o
estado (v, h) alcance a curva da Figura 10.5. Nesse momento os motores
s ao acionados na potencia maxima ate um estado nal admissvel ser
atingido ((T, z(T)) = 0).
Observe que se a intersec c ao das duas curvas na Figura 10.6 ocorre
em um ponto (v(), h()) com < T F/k, a quantidade de combus-
tivel n ao e suciente para realizar um pouso suave. Enquanto que se
a condi c ao inicial (v
0
, h
0
) se encontra abaixo da curva na Figura 10.5,
mesmo empregando empuxo maximo u(t) = 1, t [0, T], o solo lunar e
atingido com v(T) < 0.
Atraves do princpio do maximo vericamos agora que a estrategia de
controle denida em (10.12) e um candidato a controle otimo. Suponha
steuer
2008/3/11
page 235
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC

OES DO PRINC
IPIO DO M
AXIMO 235
(0) = (l
1
l
2
l
3
). Substituindo na equa c ao adjunta
_
_
_
t
1
= 0
t
2
=
1
t
3
=
2
u/z
2
3
temos:
1
(t) = l
1
, t [0, T] ;
2
(t) = l
2
l
1
t, t [0, T] ;
3
(t) = l
3
, t [0, ] .
Como z
3
(t) = M + F k(t ), t [, T], podemos calcular
3
no
intervalo nal de tempo, obtendo
3
(t) = l
3
+
_
t
l
2
l
1
s
[k( s) +M +F]
2
ds, t [, T] .
Dena agora r(t) := +
2
(t)/z
3
(t) k
3
(t), t [0, T]. De (10.11)
sabemos que a escolha do controle u no tempo t depende de sign(r(t)).
Portanto, como a estrategia de controle u salta de 0 para 1 em t = ,
temos obrigatoriamente
r() = +

2
()
z
3
()
k
3
() = 0 .
Escolhendo = 1 (que satisfaz condi c ao de transversalidade), reescreve-
mos a equa c ao acima como
1 +
l
2
l
1
M +F
k l
3
= 0 .
A escolha de u em (10.12) implica em r(t) > 0, t [0, ). Portanto,
l
1
> 0, necessariamente.
O princpio do maximo fornece-nos ainda uma condi c ao inicial para
a equa c ao adjunta:
(T) =
z
(T, z(T))
=
_
1 0 0
0 1 0
_
_

1
2
_
=
_
_
2
0
_
_
,
steuer
2008/3/11
page 236
i
i
i
i
i
i
i
i
236 [CAP. 10: PRINC
IPIO DO M
AXIMO
3
(T) = 0. Obtemos assim para l
1
, l
2
, l
3
o
sistema sub-determinado de equa c oes lineares
_
_
1 + (M +F)
1
(l
2
l
1
) k l
3
= 0
l
3
+
_
T
l
2
l
1
s
[k( s) +M +F]
2
ds = 0
Considerando
2
como par ametro, o sistema se reescreve como
_
(M +F)
1
l
1
+ k l
3
= 1 + l
2
(M +F)
1
T l
1
l
3
= Ql
2
onde T=
_
T
s[k( s) +M +F]
2
ds e Q=
_
T
[k( s) +M +F]
2
ds
s ao constantes positivas. Resolvendo o novo sistema obtemos:
(10.13)
_
l
1
l
3
_
=
_
[1 + ((M +F)
1
+kQ)l
2
] / [(M +F)
1
+kT]
T[1 + ((M +F)
1
+kQ)l
2
] / [(M +F)
1
+kT] Ql
2
_
Note que para t [, T), temos
r(t) = 1 + (l
2
l
1
t)/z
3
(t) k
3
(t)
< 1 + l
2
/M k l
3
+ (T /(M +F))l
1
. (10.14)
Substituindo em (10.14) as express oes encontradas em (10.13) para l
1
e l
3
, obtemos uma restri c ao linear para escolha de l
2
. Outra restri c ao
(tambem linear) para l
2
e dada por l
1
> 0 e (10.13). Como o proble-
ma assim colocado possui solu c ao n ao unica, e possvel encontrar uma
condi c ao inicial (l
1
, l
2
, l
3
), de forma que a fun c ao r satisfa ca
_
r(t) > 0, t [0, )
r(t) < 0, t (, T]
provando que u satisfaz as condi c oes do princpio do maximo.
Vericamos agora que u e o unico candidato fornecido pelo princpio
de Pontryagin. A fun c ao r(t) obtida de (10.11) determina quando ocor-
rem saltos na estrategia de controle. Note ainda que, como
1
l
1
,
ent ao
t
2
l
1
e temos
r
t
(t) = (
t
2
z
3

2
z
t
3
)z
2
3
k
t
3
=
t
2
/z
3

2
(ku)z
2
3
k
2
uz
2
3
= l
1
/z
3
(t), t [0, T] .
Analisamos separadamente as situa c oes possveis:
steuer
2008/3/11
page 237
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC

OES DO PRINC
IPIO DO M
AXIMO 237
l
1
,= 0: Como z
3
(t) = m(t) > 0, ent ao r e monotona. Se l
1
> 0,
obtemos um controle do tipo u. Se l
1
< 0, obtemos uma estrategia
oposta, i.e. inicialmente u = 1 e depois u = 0. Com essa estrategia
n ao e possvel obter um pouso suave. De fato, ou (v
0
, h
0
) se situa
abaixo ou acima do graco na Figura 10.5. No primeiro caso, ja
vimos que v(T) < 0. No segundo caso, como u e da forma
u(t) =
_
1, t [0, )
0, t [, T]
obtemos do sistema adjunto
v(T) v() =
_
T
v
t
(t) dt =
_
T
g dt = g(T ) .
Logo, uma condi c ao necessaria para v(T) = 0 e que T = v()/g+.
Novamente do sistema adjunto obtemos
h() = h(T) h() =
_
T
h
t
(t) dt =
_
T
v(t) dt
=
_
T
g(T t) dt =
g
2
(T )
2
,
isto e h() = v
2
()/2g < 0. Portanto, a transi c ao de 1 para 0
na estrategia de controle ocorre abaixo da superfcie da Lua, e o
pouso obviamente n ao e suave.
l
1
= 0: Neste caso, r
t
= 0 e r e constante. Se r ,= 0, os possveis
candidatos s ao u 0 e u 1. O primeiro controle obviamente
n ao permite pouso suave. Ja o segundo sera otimo somente se
(v
0
, h
0
) pertence à curva na Figura 10.5, quando a estrategia se
torna identica a u. Por m, se r = 0, temos
1 + l
2
1
z
3
(t)
+ k
3
(t) = 0, t [0, T],
isto e, as fun c oes 1, z
1
3
,
3
s ao linearmente dependentes. Mas
isto e uma contradi c ao pois
z
3
(t) = M +F k
_
t
0
u(s) ds,
3
(t) = l
2
_
t
T
u(s)z
3
(s)
2
ds .
steuer
2008/3/11
page 238
i
i
i
i
i
i
i
i
238 [CAP. 10: PRINC
IPIO DO M
AXIMO
Portanto, o unico controle admissvel que satisfaz as condi c oes do princpio
do maximo e u denido em (10.12). 2
Aplica cao 189 (Controle singular). Considere o problema escalar
de controle
_
_
Minimizar
1
2
_
3
0
z(t)
2
dt
sujeito a
u L
1
[0, 3], u(t) := [1, 1] q.s. em [0, 3],
z
t
= u, z(0) = z(3) = 1.
O tempo nal T = 3 e a condi c ao nal para a trajetoria z(T) = 1 s ao
xados atraves da condi c ao:
(T, z(T)) =
_
1 z
T 3
_
= 0 R
2
.
Do princpio do maximo, obtemos as condi c oes necessarias:
z
t
= u, z(0) = z(3) = 1 ;
t
= z,
1
=
1
;
H(t, z, , u) = u +
1
2
z
2
, H
1
=
2
;
+[
1
[ +[
2
[ ,= 0 .
A condi c ao de maximo implica em U
(z, ) = sign . Note que = 0

n ao pode ocorrer, pois implica em
t
= 0. Logo, u 1 ou u 1, mas
ambas as estrategias n ao s ao admissveis. Suponha ent ao = 1. Logo
t
(0) = 1. Supondo (0) 0, temos:
Se (0) 0 e (t) < 0, t [0, 3], ent ao u 1, o que implica em
z(3) = 4 (contradizendo a condi c ao de contorno nal).
Se (0) 0, (t
1
) = 0 para algum t
1
> 0 e (t) < 0, t (0, t
1
),
ent ao
t
(t
1
) 0. Mas
u(t) 1, t (0, t
1
) z(t) > 0, t (0, t
1
]
t
(t) < 0, t (0, t
1
],
contradizendo a conclus ao
t
(t
1
) 0.
steuer
2008/3/11
page 239
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC

OES DO PRINC
IPIO DO M
AXIMO 239
Conclumos assim que (0) > 0. De forma analoga prova-se que (3) <
0. Portanto, a fun c ao possui pelo menos um zero em (0, 3). Seja t
1
o
menor e t
2
o maior zero de em (0, 3). Provamos agora que t
1
= 1 e
t
2
= 2:
Note que t
1
,= t
2
, pois se possui apenas um zero, ent ao z(t) =
_
1t, t[0,3/2]
t2, t[3/2,3]
, que obviamente n ao e uma trajetoria otima;
Em [0, t
1
) temos: u(t) = 1, z(t) = 1 t, (t) = (0) t +
1
2
t
2
.
Como (t
1
) = 0, ent ao t
1
= 1
_
1 2(0). Se t
1
assume o valor
da maior raiz, temos t
1
> 1 e a trajetoria associada a n ao e
otima, pois z(t) :=
_
z(t), z(t)0
0 , z(t)<0
satisfaz
_
3
0
z(t)
2
dt <
_
3
0
z(t)
2
dt .
Logo, t
1
= 1
_
1 2(0) 1.
Se t
1
< 1, ent ao
t
(t
1
) = z(t
1
) < 0. Seja

t > 1, tal que (t) < 0,
t (t
1
,
t) e (
t) = 0. Logo,
t
(
t) 0.
De (t) < 0, segue u(t) 1, t (t
1
,
t). Como z(t

1
) > 0 e
z
t
(t) = u(t) = 1, t (t
1
,
t), temos z(t) 1 t

1
> 0, t [0,
t].
Ent ao
t
(
t) = z(
t) < 0 (contradi c ao).

Conclumos assim que t
1
= 1. De modo analogo, prova-se que t
2
= 2.
Provamos agora que (t) = 0, t (t
1
, t
2
). De fato, se (t) > 0 (o caso
< 0 e analogo) para algum t (t
1
, t
2
), ent ao existem

t
1
,

t
2
[t
1
, t
2
] tais
que (t) > 0, t (
t
1
,
t
2
) e (
t
1
) = (
t
2
) = 0. Logo, u(t) = 1, t
(
t
1
,
t
2
) e portanto
tt
(t) = (z(t))
t
= u(t) = 1, t (
t
1
,
t
2
), o que e
claramente uma contradi c ao. Portanto, a estrategia otima de controle
tem de ser
u(t) =
_
_
_
1, t [0, 1]
0 , t (1, 2)
+1, t [2, 3]
.
(Note que a trajetoria z 0 e um extremal singular do problema e a
trajetoria otima z e do tipo: bangsingularbang.) 2
Aplica cao 190 (Consumo Investimento). Tratamos a seguir um
problema classico da economia, que foi um dos primeiros a ser con-
siderado sob a otica do calculo variacional. Consideramos o seguinte
steuer
2008/3/11
page 240
i
i
i
i
i
i
i
i
240 [CAP. 10: PRINC
IPIO DO M
AXIMO
problema macroecon omico: Como equacionar a rela c ao entre consumo
e investimento, a m de otimizar o desenvolvimento econ omico?
Suponha que a economia de uma na c ao e representada pelas variaveis
K(t) : Capital no tempo t;
C(t) : Consumo;
Y (t) : Produ c ao (produto interno);
K
t
(t) : Investimento (varia c ao do Capital);
ao longo do intervalo de tempo t [0, ). Considere ainda o seguinte
modelo simplicado:
i) Y = g(K), onde g
t
> 0 e g
tt
0;
ii) C = Y K
t
(parte da produ c ao e consumida e o restante e rein-
vestido);
iii) K(0) = K
0
(o capital inicial e conhecido);
iv) U = U(C) e a utilidade do capital, onde U
t
> 0, U
tt
< 0;
v) > 0 e o fator de desconto.
O objetivo e encontrar uma poltica otima de investimento para o pro-
blema:
_
_
_
Maximizar
_

0
e
t
U(C(t))dt
sujeito a K
t
= g(K) C, K(0) = K
0
.
Este problema foi originalmente formulado e resolvido por Ramsey em
1928 (veja [Ra]). A hipotese C = g(K) K
t
permite-nos analisar este
problema utilizando calculo variacional (veja Sec c ao 9.2). Note que a
equa c ao de EulerLagrange e dada por
K
tt
g
t
(K)K
t
+
U
t
(g(K) K
t
)
U
tt
(g(K) K
t
)
( g
t
(K)) = 0 .
No caso geral esta equa c ao n ao pode ser resolvida analiticamente. Faze-
mos aqui a hipotese simplicadora:
U(r) =
1
1 q
r
1q
, g(r) = br,
steuer
2008/3/11
page 241
i
i
i
i
i
i
i
i
[SEC. 10.3: APLICAC

OES DO PRINC
IPIO DO M
AXIMO 241
onde b > 0, q (0, 1). Neste caso particular a equa c ao de Euler
Lagrange ca simplicada, na forma de uma equa c ao que sabemos re-
solver:
qK
tt
+ ( b qb)bK
t
+b(b )K = 0.
Calculando as razes do polin omio caracterstico, temos
1
= b,
2
=
a := q
1
(b ). Portanto, as solu c oes que satisfazem a condi c ao inicial
K(0) = K
0
s ao da forma:
K(t) = (K
0
A)e
at
+Ae
bt
, t 0,
onde Ae um par ametro livre. Suponha agora que b > a, i.e. > (1q)b.
Neste caso, as hipoteses do modelo:
C(t) = g(K(t)) K
t
(t) > 0, t 0 e lim
t
K(t) 0
s ao satisfeitas respectivamente para A 0 e A < K
0
. Para determi-
nar o par ametro A [0, K
0
) e necessaria uma condi c ao de contorno
para a equa c ao da din amica por exemplo K
t
(0) ou K(). Como tal
condi c ao n ao e explicitamente fornecida, e preciso analisar a equa c ao de
HamiltonJacobiBellman, que para este problema aut onomo se escreve
como
V (x) + min
u
_
V
x
, g(x) u) +
1
1 q
u
1q
_
= 0, x R
n
(note que = b qa).

E facil vericar que V (x) := (1 q)/(b a)
q
x
1q
,
x 0 e solu c ao da equa c ao acima. Note ainda que se A = 0 a condi c ao
liminf
t
e
t
V (

K(t)) = 0
e satisfeita, pois a(1q) < 0 por hipotese. Portanto, V (x) e a trajetoria
K(t) = K
0
e
at
satisfazem as condi c oes do teorema, de onde conclumos
que uma estrategia otima de consumo e dada por
C(t) = (b a)K
0
e
at
, t 0.
2
steuer
2008/3/11
page 242
i
i
i
i
i
i
i
i
242 EXERC
ICIOS
Exerccios
10.1. Considere o problema de Bolza
_
_
Minimizar
1
2
_
1
0
u(t)
2
dt +z
1
(1)
2
+z
2
(1)
2
sujeito a
u L
1
[0, 1], z
t
1
= z
2
, z
t
2
= u, z
1
(0) = z
2
(0) = 0.
a) Formule o princpio do maximo para o problema acima.
b) Obtenha o processo otimo.
10.2. Considere o problema de controle otimo
_
_
Minimizar
_
T
0
_
z
1
(t)
2
+u(t)
2
dt
sujeito a
u L
1
[0, T], z
t
1
= z
2
, z
t
2
= z
2
+u, z
1
(0) = 1, z
2
(0) = 0.
10.3. Considere o problema de controle otimo escalar
_
_
Minimizar
1
2
_
1
0
_
3z(t)
2
+u(t)
2
dt
sujeito a
u L
1
[0, 1], z
t
= z +u, z(0) = 1.
10.4 (Problema de Investimento). Suponha que um determinado
produto e fabricado com a taxa z(t). No tempo t > 0 uma fra c ao u(t)
da produ c ao e reinvestida para aumentar a produ c ao, sendo o restante
vendido para gera c ao de lucro. O objetivo e determinar uma poltica
de investimento otima, de forma a maximizar o lucro total no horizonte
xo de tempo [0, T]. Temos assim o problema
_
_
Maximizar
_
T
0
(1 u(t))z(t)dt
sujeito a
z
t
= uz, z(0) = z
0
> 0, z(t) 0, u

C[0, T]
steuer
2008/3/11
page 243
i
i
i
i
i
i
i
i
EXERC
ICIOS 243
a) Reescreva o problema como um problema variacional com restri c oes
lagrangeanas: y
t
(t) 0, y
t
(t) y(t).
b) Obtenha condi c oes necessarias para o novo problema.
c) Encontre a taxa otima de produ c ao y.
10.5 (Problema do Cafe). Uma xcara cheia de cafe à temperatura de
100
o
C deve ser esfriada a temperatura de 0
o
C por adi c ao de uma quan-
tidade xa de creme de leite. Uma equa c ao aproximada para evolu c ao
da temperatura z da mistura e dada por
z
t
= z 25u uz/4.
As condi c oes de contorno s ao z(0) = 100, z(T) = 0.
a) Obtenha condi c oes necessarias para o problema de tempo otimo
sujeito às restri c oes 0 u(t) 1, t [0, T],
_
T
0
u(t)dt = 1, impostas ao
uxo externo de lquido u.
b) Use o fato z
t
< 0 para obter um problema equivalente com intervalo
de tempo xo. O que se pode armar sobre a unicidade da solu c ao
obtida no item a).
(Sugest ao: A nova variavel livre e s = z.)
steuer
2008/3/11
page 244
i
i
i
i
i
i
i
i
Captulo 11
Programacao Dinamica
Discreta
Tratamos neste captulo dos problemas de controle otimo com di-
n amica discreta, em particular, problemas relacionados com o princpio
de Bellman. A analise esta baseada em um procedimento denominado
programa c ao din amica, o qual permite a determina c ao de condi c oes ne-
cessarias para otimalidade de problemas de controle.
Na Sec c ao 11.1 e apresentado o princpio de Bellman em uma forma
bastante generica. Nas Sec c oes 11.2 a 11.5 s ao analisados problemas
de otimiza c ao com din amica discreta. Para cada problema encontramos
estruturas (uma fun c ao, uma equa c ao e condi c oes de contorno) que per-
mitem determinar as solu c oes otimas. Entre os problemas analisados
est ao o da substitui c ao de equipamento e o do caixeiro viajante. Na
Sec c ao 11.6 abordamos um modelo generico para problemas discretos
de decis oes consecutivas, sendo um resultado de existencia discutido em
detalhes.
11.1 Introducao
Em otimiza c ao o conceito de programa esta relacionado com o pro-
blema de dominar, de forma otima, uma situa c ao proposta. Tal conceito
surgiu originalmente na economia e diz respeito ao desenvolvimento de
planejamentos otimos de produ c ao.
Iniciamos a abordagem considerando um problema generico. Con-
steuer
2008/3/11
page 245
i
i
i
i
i
i
i
i
[SEC. 11.1: INTRODUC
AO 245
sidere o problema de otimiza c ao da forma
1
_
Minimizar g(x)
sujeito a x X
ad
A fun c ao g(x) e denominada fun c ao objetivo e X
ad
e o conjunto dos pon-
tos admissveis (e.g., X
ad
: conjunto das estrategias de produ c ao viaveis;
g(x): custo lquido da realiza c ao do plano x X
ad
). Os diversos pro-
blemas e os respectivos metodos de solu c ao s ao denominados de acordo
com as caractersticas particulares:
Programa c ao Linear (linear programming)
Problema: g linear, X
ad
poliedro convexo em R
m
.
Programa c ao Geometrica (fractional programming)
Problema: g quociente de aplica c oes lineares, X
ad
poliedro convexo
em R
m
.
Programa c ao Convexa (convex programming)
Problema: g convexa, X
ad
subconjunto convexo de um espa co
vetorial.
Programa c ao n ao linear (nonlinear programming)
Problema: demais casos.
A metodologia conhecida como programa c ao din amica (dynamic pro-
gramming) foi desenvolvida por R.E. Bellman em ns dos anos 50. Ela
pode ser aplicada para solucionar problemas de controle bastante gerais
(n ao lineares, n ao aut onomos) e e uma alternativa à abordagem varia-
cional estudada no Captulo 10 sob o nome de princpio do m aximo. O
ponto de partida da programa c ao din amica e o chamado princpio de
otimalidade de Bellman:
2
Uma estrategia otima possui a seguinte propriedade: inde-
pendente das decis oes tomadas em instantes de tempo ante-
riores ao atual, as decis oes futuras relativas ao estado, ao
qual as decis oes passadas levaram, tem que ser escolhidas de
forma otima.
1
Note que problemas de maximiza c ao tambem podem sempre ser formulados deste
modo.
2
Veja, e.g., [BeDr], Sec c ao 1.11.
steuer
2008/3/11
page 246
i
i
i
i
i
i
i
i
246 [CAP. 11: PROGRAMAC
AO DIN
AMICA DISCRETA
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
A B
H
K
C
D
O
P
E
G
L
N
F M
I
J
1
5
2
7
1
3
5
2
2
2
4
1 0
3
4
4
2
2
1
4
8
3
5
2
Figura 11.1: Mapa da cidade com ruas de m ao unica.
Em outras palavras, o modo de escolher a estrategia otima de controle
independe tanto das decis oes tomadas em tempos anteriores, quanto dos
respectivos estados atravessados pelo sistema ate o tempo atual.
Uma analise detalhada do princpio de Bellman e apresentada na
Sec c ao 12.2. Nas sec c oes a seguir, o formalismo da programa c ao din amica
e introduzido atraves da investiga c ao de alguns exemplos de grande
aplicabilidade. O leitor interessado encontra em [BeDr] varias outras
aplica c oes a problemas discretos.
11.2 Problema do Caminho Simples
Suponha que numa cidade imaginaria as ruas (todas de m ao unica)
estejam dispostas de acordo com a congura c ao mostrada na Figura 11.1.
Cada letra representa uma esquina e os n umeros representam o custo
(tempo, combustvel, . . . ) para se utilizar a respectiva rua. O nosso
objetivo e encontrar o caminho de A ate B que possua o menor custo
associado possvel.
O metodo mais simples de resolver o problema e enumerar todos
os caminhos possveis e comparar os custos totais de cada caminho.
Analisemos o esfor co computacional necessario para executar este me-
todo:
steuer
2008/3/11
page 247
i
i
i
i
i
i
i
i
[SEC. 11.2: PROBLEMA DO CAMINHO SIMPLES 247
Existem 20 diferentes caminhos de A ate B.
3
De fato, de H a B
existe um unico caminho e dem de K a B. De I a B existem 3
caminhos e dem de J a B. Logo, existem 4 caminhos de E a B,
4 caminhos de G a B e 6 caminhos de F a B. Ent ao, existem 10
caminhos de C a B e 10 caminhos de D a B.
Para cada caminho realizamos 5 somas, a m de computar o custo
total.
Precisamos ainda de 19 compara c oes para encontrar o menor custo.
Utilizando o princpio de otimalidade desenvolvemos agora a ideia da
programa c ao din amica.
Um caminho otimo de A ate B passa obrigatoriamente ou por C
ou por D.
Se P
c
e um caminho otimo de C ate B de custo p
c
e P
d
e um
caminho otimo de D ate B de custo p
d
, e possvel determinar o
caminho otimo de A ate B somando a p
c
o custo da rua de A a C,
somando a p
d
o custo da rua de A a D e escolhendo a menor das
duas somas.
Desta forma o caminho otimo ca estabelecido. Observe que o procedi-
mento acima descrito e baseado no princpio de Bellman:
Uma vez descoberto o caminho ate C (ou D), determine o
restante do caminho de modo que este seja otimo de C (ou
D) ate B.
Seja V (Q
1
, Q
2
) o custo do caminho otimo de Q
1
a Q
2
e d(Q
1
, Q
2
) o
custo da rua unindo Q
1
e Q
2
. De acordo com o princpio de otimalidade
temos:
V (A, B) = minV (C, B) +d(A, C); V (D, B) +d(A, D).
Note que v(C, B) e v(D, B) s ao ainda desconhecidos. Para calcula-los
precisamos conhecer os caminhos otimos de C a B e de D a B, respectiva-
mente. Para isso aplicamos recursivamente o princpio de otimalidade.
3
No nal da sec c ao, mostramos que o n umero de caminhos e dado pela combina c ao
_
6
3
_
.
steuer
2008/3/11
page 248
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
Os proximos valores que precisamos s ao os de V (E, B) e V (F, B). A
partir deles calculamos
V (C, B) = minV (E, B) +d(C, E); V (F, B) +d(C, F),
V (D, B) = minV (F, B) +d(D, F); V (G, B) +d(D, G).
Prosseguindo desta forma chegamos nalmente a
V (M, B) = minV (O, B) +d(M, O); V (P, B) +d(M, P).
Mas V (O, B) = d(O, B) e V (P, B) = d(O, P) s ao conhecidos. Sendo
assim, podemos calcular os caminhos otimos de tras para frente, sim-
plesmente calculando os valores da fun c ao V (, ).
Temos ent ao para o exemplo numerico da Figura 11.1:
V (O, B) = 2, V (P, B) = 1;
V (L, B) = 5 + 2 = 7, V (N, B) = 4 + 1 = 5, V (M, B) = min2 +
2, 1 + 8 = 4
(i.e., quando o caminho otimo passa por M ele tem que continuar
por O);
V (H, B) = 3 + 5 + 2 = 10, V (K, B) = 2 + 4 + 1 = 7,
V (J, B) = min4 + 2, 5 + 2 = 6 (caminho JM. . . ),
V (I, B) = min7 + 3, 4 + 4 = 8 (caminho IM. . . );
V (E, B) = min10 + 2, 8 + 1 = 9 (caminho EI. . . ),
V (F, B) = min8 + 1, 6 + 2 = 8 (caminho FJ. . . ),
V (G, B) = min6 + 5, 7 + 4 = 11 (caminho GJ. . . ou GK. . . );
V (C, B) = min9 + 5, 8 + 4 = 12 (caminho CF. . . ),
V (D, B) = min8 + 7, 11 + 3 = 14 (caminho DG. . . );
V (A, B) = min12 + 1, 14 + 0 = 13 (caminho AC. . . ).
O caminho otimo de A a B e ent ao: A-C-F-J-M-O-B e o custo mnimo
e V (A, B) = 13.
Em contraposi c ao a um metodo usual de minimiza c ao denido no
conjunto dos caminhos viaveis de A ate B (por exemplo um metodo ite-
rativo), o procedimento acima n ao fornece nenhuma solu c ao aproximada
antes do termino de todos os calculos. Findos os calculos, observamos
steuer
2008/3/11
page 249
i
i
i
i
i
i
i
i
[SEC. 11.2: PROBLEMA DO CAMINHO SIMPLES 249
T
E
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
1
1
2
2
3
3
4
-1
5
-2
6
-3
A B
Figura 11.2: Cidade projetada sobre sistema de coordenadas.
que este metodo nos fornece muito mais do que simplesmente o caminho
otimo de A ate B. Podemos calcular de forma direta o caminho otimo
de qualquer ponto ate B e ainda sabemos a priori qual o custo otimo
(dado por V (, B)).
Por exemplo, o custo do caminho otimo de E a B e V (E, B) = 9 e o
caminho otimo e: E-I-M-O-B.
Este problema pode ser ainda analisado de outra forma. Considere a
nossa cidade projetada sobre um plano coordenado, onde os pontos Ae B
correspondem às coordenadas (0, 0) e (6, 0), respectivamente, conforme
mostrado na Figura 11.2. Em cada ponto existem 2 dire c oes possveis
a seguir: nordeste (u) e sudeste (d). Usamos a seguinte nota c ao para
representa-las:
(x, y)
u
(x + 1, y + 1) ; custo: c
u
(x, y),
(x, y)
d
(x + 1, y 1) ; custo: c
d
(x, y).
Denimos ent ao a fun c ao valor otimo
V (x, y) := Custo do caminho otimo de (x, y) ate (6, 0).
steuer
2008/3/11
page 250
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
Note que podemos estender a deni c ao das fun c oes c
u
, c
d
e V a todo
Z
2
. Basta denir o custo de ruas n ao existentes na cidade como .
Desta forma, podemos usar a nota c ao acima para denir recursivamente
a fun c ao valor otimo:
V (x, y) = minc
u
(x, y) +V (x + 1, y + 1); c
d
(x, y) +V (x + 1, y 1),
(x, y) Z
2
.
Esta equa c ao e denominada equa c ao de otimalidade. Exigimos ainda
que a condi c ao de contorno V (6, 0) = 0 seja satisfeita. Note que o custo
de viajar de (6, 0) a (6, 0) e zero, pois o destino ja foi alcan cado.
Consideremos agora uma formula c ao mais geral do nosso problema.
Suponha que para chegar de A ate B tenhamos que passar por N ruas
(onde N e par). Um caminho pode ser representado por uma palavra
de N letras pertencentes ao conjunto u, d. O n umero de letras u e d
tem que ser o mesmo, para que o caminho leve de A a B, portanto o
n umero de caminhos admissveis de A a B e igual ao n umero de palavras
constitudas por N/2 us e N/2 ds (podemos nos concentrar apenas na
posi c ao dos us, pois as demais posi c oes s ao obviamente preenchidas por
ds). Logo, o n umero de caminhos viaveis e dado por
_
N
N/2
_
. Pode-
mos agora comparar o esfor co computacional de realizar os metodos de
enumera c ao+compara c ao e de programa c ao din amica.
Pelo metodo de compara c ao, realizamos
_
N
N/2
_
(N 1) somas e
_
N
N/2
_
1 compara c oes. Com a Programa c ao Din amica s ao necessarias
2(N1)+(N/2)
2
adi c oes e (N/2)
2
compara c oes. Por exemplo, para N =
20 a programa c ao din amica requer 220 adi c oes e 100 compara c oes, en-
quanto que pela enumera c ao+compara c ao precisamos de mais de 310
6
somas e 184.000 compara c oes. Quanto maior a dimens ao do problema,
maior a vantagem da programa c ao din amica.
Outra variante do problema e encontrar alem do caminho otimo de A
ate B tambem os caminhos otimos de A ate os demais pontos da cidade.
Para tanto, consideramos uma outra fun c ao valor otimo.
V (x, y) := Custo do caminho otimo de (0, 0) ate (x, y).
A fun c ao V e calculada recursivamente pela equa c ao de otimalidade
V (x, y) = minc
u
(x 1, y 1) +V (x 1, y 1);
c
d
(x 1, y + 1) +V (x 1, y + 1),
steuer
2008/3/11
page 251
i
i
i
i
i
i
i
i
[SEC. 11.3: PROBLEMA DA SUBSTITUIC
AO DE EQUIPAMENTO 251
e pela condi c ao de contorno V (0, 0) = 0.
Observa cao 191. O metodo de programa c ao din amica para problemas
de otimiza c ao esta relacionado à trade:
Fun c ao valor, Equa c ao de otimalidade, Condi c oes de contorno.
2
11.3 Problema da Substituicao de Equipamento
Analisamos nesta sec c ao um problema semelhante ao discutido na
Sec c ao 11.2. Este, entretanto, e mais realista. Comum aos dois proble-
mas e o fato que, a cada intervalo de tempo, apenas duas alternativas
de decis ao s ao possveis.
Consideramos aqui o problema de substitui c ao de apenas um equipa-
mento (ex. carro, trator, . . . ) que se deteriora com o tempo. Nossa
tarefa e decidir quando troca-lo por um novo. Suponha que precisamos
possuir tal equipamento pelos proximos N anos (ou outra unidade de
tempo qualquer) e que o custo de operar o equipamento por um ano
e dado exclusivamente em fun c ao da idade do mesmo. Sempre que o
equipamento se torna intoleravelmente velho, precisamos substitu-lo.
Nesse momento, pagamos um valor xo pelo equipamento novo e re-
cebemos uma determinada quantia pela venda do equipamento usado, a
qual depende somente da idade desse equipamento.
Para formular o problema precisamos conhecer a dura c ao total N do
processo, a idade da maquina original que possumos no tempo k = 0 e
ainda:
c(k) = custo de opera c ao por um ano de um equipamento de idade
k;
p = pre co de um equipamento novo;
v(k) = valor de venda de um equipamento com k anos de uso;
r(k) = valor de resgate recebido por um equipamento que com-
pleta k anos de uso no ano N + 1.
Temos que decidir a cada ano se devemos ou n ao substituir o equipa-
mento atual, de modo a minimizar o custo total no perodo de N anos.
steuer
2008/3/11
page 252
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
Temos ent ao a seguinte formula c ao via programa c ao din amica:
Fun c ao valor otimo:
V (k, y) := Custo mnimo de possuir um equipamento do
ano k ao ano N, quando no ano k possumos
um equipamento de y anos de uso.
Equa c ao de otimalidade:
V (k, y) = min p v(x) +c(0) +V (k + 1, 1); c(x) +V (k + 1, x + 1).
Condi c ao de contorno:
V (N + 1, x) = r(x).
Note que o primeiro termo na equa c ao de otimalidade corresponde à
compra de um novo equipamento no ano k, enquanto o segundo termo
representa a manuten c ao do equipamento durante esse ano. A condi c ao
de contorno signica que um rabate (custo negativo) de r(x) e obtido
quando possumos ao nal do processo um equipamento que completa x
anos no ano N + 1.
Exemplo 192. Considere o problema da substitui c ao de equipamento
com os seguintes dados: N = 5, y = 2, p = 50. As fun c oes c, v e r s ao
dadas na tabela abaixo.
ano 0 1 2 3 4 5 6
c 10 13 20 40 70 100 100
v 32 21 11 5 0 0
r 25 17 8 0 0 0
As condi c oes de contorno s ao:
4
V (6, 1) = 25, V (6, 2) = 17, V (6, 3) = 8,
V (6, 4) = V (6, 5) = V (6, 7) = 0.
4
Note que os estados nais que podem ser alcan cados a partir de (0, y) s ao os da
forma (x, N) para x |0, . . . , N, y +N.
steuer
2008/3/11
page 253
i
i
i
i
i
i
i
i
[SEC. 11.4: PROBLEMA DO CAIXEIRO VIAJANTE 253
A partir da temos:
V (5, 1) = min{50 32 + 10 + V (6, 1); 13 + V (6, 2)} = 4 (manter),
V (5, 2) = min{50 21 + 10 + V (6, 1); 20 + V (6, 3)} = 12 (manter),
V (5, 3) = min{24; 40} = 24 (comprar),
V (5, 4) = min{30; 70} = 30 (comprar),
V (5, 6) = min{35; 100} = 35 (comprar) ;
V (4, 1) = min{28 + V (5, 1); 13 + V (5, 2)} = 24 (comprar),
V (4, 2) = min{35; 44} = 35 (comprar),
V (4, 3) = min{45; 70} = 45 (comprar),
V (4, 5) = min{56; 135} = 56 (comprar) ;
V (3, 1) = min{52; 48} = 48 (manter),
V (3, 2) = min{63; 65} = 63 (comprar),
V (3, 4) = min{79; 126} = 79 (comprar) ;
V (2, 1) = min{76; 76} = 76 (comprar
ou manter),
V (2, 3) = min{97; 119} = 97 (comprar) ;
V (1, 2) = min{115; 117} = 115 (comprar).
Temos ent ao as estrategias otimas: C-C-M-C-M ou C-M-C-C-M, onde
C = comprar e M = manter. Calculando diretamente o custo das es-
trategias, temos:
custo(CCMCM) = p v(2) +c(0) + p v(1) +c(0) + c(1) +
p v(2) +c(0) + c(1) r(2) = 115,
custo(CMCCM) = p v(2) +c(0) + c(1) + p v(2) +c(0) +
p v(1) +c(0) + c(1) r(2) = 115,
raticando nossa conclus ao.
2
11.4 Problema do Caixeiro Viajante
Consideramos um grafo com N vertices (representando cidades). As
cidades s ao enumeradas arbitrariamente de 1 a N e denotamos por d
ij
o tempo de viagem (dist ancia, custo, . . . ) para ir da cidade i à cidade
j. Um caixeiro viajante deseja sair da cidade 1, percorrer cada uma das
steuer
2008/3/11
page 254
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
outras cidades exatamente uma vez e retornar por m à cidade 1 (tal
caminho e denominado tour).
O problema que se p oe e encontrar o tour mais curto para o caixeiro
viajante. Dena para tanto N
j
:= 2, . . . , j 1, j + 1, . . . , N, para
j = 2, . . . , N. Para cada j = 2, . . . , N, i = 1, . . . , N 2, e M N
j
,
subconjunto com exatamente i elementos, denimos
(11.1)
V (i, j, m) := Comprimento do caminho mais curto da cidade 1 à
cidade j atravessando exatamente as i cidades de M
como fun c ao valor otimo. Como equa c ao de otimalidade, escolhemos:
(11.2) V (i, j, M) = min
kM
V (i 1, k, Mk) +d
kj
;
e como condi c ao de contorno, tomamos:
V (0, j, ) = d
1j
, j = 2, . . . , N.
Calculando recursivamente, obtemos como solu c ao
(11.3) min
j2,...,N
V (N 2, j, N
j
) +d
j1
.
O valor de j que minimiza a express ao em (11.3) corresponde à ultima
cidade percorrida no tour otimo antes de retornar à cidade 1. Vericamos
heuristicamente a validade da equa c ao de otimalidade, das condi c oes de
contorno e da fun c ao valor otimo atraves de argumento indutivo.
A verica c ao do caso i = 1 ca a cargo do leitor (basta usar as
condi c oes de contorno). Seja i > 1 e suponha que queremos calcular
V (i, j, M). Considere o caminho mais curto da cidade 1 à cidade j via
cidades de M e seja k M a ultima cidade de M que e percorrida por
este caminho. Como as cidades de Mk tem que ser percorridas de
forma otima, o comprimento deste sub-caminho e V (i 1, k, Mk)
e o comprimento do caminho original e V (i 1, k, Mk) + d
kj
. Isto
garante que
V (i, j, M) min
kM
V (i 1, k, Mk) +d
kj
.
A desigualdade oposta segue da deni c ao de V em (11.1).
A m de calcular o caminho mais curto, calculamos inicialmemte
V (1, , ) a partir da condi c ao inicial V (0, , ). Ent ao, calculamos V (2, , )
steuer
2008/3/11
page 255
i
i
i
i
i
i
i
i
[SEC. 11.4: PROBLEMA DO CAIXEIRO VIAJANTE 255
a partir de V (1, , ) e assim por diante ate chegarmos a V (N 2, j, N
j
),
j = 1, . . . , N (compare com (11.3)). O tour otimo e calculado de tras
para frente.
Exemplo 193. Considere o problema do caixeiro viajante com 4 cidades
cujas dist ancias s ao dadas na tabela abaixo.
i j 1 2 3 4
1 0 3 1 5
2 1 0 5 4
3 5 4 0 2
4 3 1 3 0
Temos ent ao as condi c oes de contorno:
V (0, 2, ) = d
12
= 3, V (0, 3, ) = d
13
= 1, V (0, 4, ) = d
14
= 5.
A partir da equa c ao de otimalidade, calculamos agora:
V (1, 2, 3) = V (0, 3, ) +d
32
= 1 + 4 = 5 (3),
V (1, 2, 4) = 5 + 1 = 6 (4),
V (1, 3, 2) = 3 + 5 = 8 (2),
V (1, 3, 4) = 5 + 3 = 8 (4),
V (1, 4, 2) = 3 + 4 = 7 (2),
V (1, 4, 3) = 1 + 2 = 3 (3) ;
V (2, 2, 3, 4) = minV (1, 3, 4) +d
32
; V (1, 4, 3) +d
42
= min8 + 4; 3 + 1 = 4 (4),
V (2, 3, 2, 4) = minV (1, 2, 4) +d
23
; V (1, 4, 2) +d
43
= min6 + 5; 7 + 3 = 10 (4),
V (2, 4, 2, 3) = minV (1, 2, 3) +d
24
; V (1, 3, 2) +d
34
= min5 + 4; 8 + 2 = 9 (2),
Por m, obtemos o comprimento do tour otimo
min
j2,3,4
V (3, j, 2, 3, 4j)+d
j1
= min 4+1, 10+5, 9+3 = 5 (2).
A ultima cidade do tour (antes de retornar à 1) e portanto a cidade 2.
Como o mnimo no calculo de V (2, 2, 3, 4) e obtido para j = 4, esta
e a pen ultima cidade. A antepen ultima so pode ser a cidade 3. O tour
otimo e portanto: 1-3-4-2-1.
2
steuer
2008/3/11
page 256
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
Analisemos agora o esfor co computacional para realizar esta estra-
tegia de programa c ao din amica. A cada estagio i, o valor de V (i, j, M)
tem de ser calculado para (N 2)
_
N2
i
_
diferentes pares j, M. Cada
um desses calculos exige i somas e i 1 compara c oes. Somando sobre
todos os estagios i = 1, . . . , N 2 obtemos:
Adi c oes: (N 1)(N 2)2
N3
,
Compara c oes: (N 1)
N2
i=1
(i 1)
_
N2
i
_
(N 1)(N 4)2
N3
.
(Note que desconsideramos as ultimas (N 1) adi c oes e (N 2) com-
para c oes a m de calcular o comprimento do tour otimo.) Sendo assim,
o n umero de opera c oes cresce de forma exponencial e n ao polinomial.
A estrategia vista aqui n ao e a mais eciente conhecida. A busca por
algoritmos rapidos representa um extenso ramo de pesquisa atualmente.
Nossa estrategia requer para um problema com 20 cidades algo em torno
de 85 10
6
opera c oes.
Note ainda que a quantidade de memoria necessaria para execu c ao
do algoritmo e um problema extra. Se N 256, precisa-se, para cada
i, de (N 1)
_
N2
i
_
Bytes para armazenar os valores de V (1, , ). Por
exemplo, para N = 20, precisa-se de aproximadamente 925 KB para
armazenar V (9, , ) e para N = 100 s ao necessarios 2.3 10
21
GB para
armazenar V (50, , ).
11.5 Problema Linear-Quadratico Discreto
Considere o sistema discreto
(11.4) z
k+1
= Az
k
+ Bu
k
, k = 0, . . . , N 1,
e a fun c ao objetivo
(11.5) J(z, u) :=
1
2
[z
N
, Sz
N
) +
N1
k=0
(z
k
, Qz
k
) +u
k
, Ru
k
)) ],
onde z
k
R
n
, k = 0, . . . , N, u
k
R
m
, k = 0, . . . , N 1 e as matrizes
S R
n,n
, Q R
n,n
, R R
m,m
. S ao dadas ainda as condi c oes iniciais
(11.6) z
0
= z
0
R
n
.
steuer
2008/3/11
page 257
i
i
i
i
i
i
i
i
[SEC. 11.5: PROBLEMA LINEAR-QUADR
ATICO DISCRETO 257

O problema que analisamos e:
_
_
_
Minimizar J(z, u)
sujeito as restri c oes
(11.4) e (11.6).
Fazemos ainda as seguintes hipoteses sobre as matrizes do problema: S
e R s ao positivas denidas; Q e positiva semi-denida.
A condi c ao R > 0 reete o fato de n ao impormos nenhuma restri c ao
às variaveis de controle (u R
m
). Ela signica que o fato de exercer
uma estrategia qualquer de controle esta associado a um custo.
Quando consideramos o problema sob a optica da programa c ao di-
n amica, escolhemos a fun c ao valor otimo
V (k, x) := minJ
k
(z, u) [ (z, u) Z
k
(x) R
(Nk)m
,
onde
J
k
(z, u) :=
1
2
[z
N
, Sz
N
) +
N1
j=k
(z
j
, Qz
j
) +u
j
, Ru
j
)) ],
Z
k
(x) := z R
(Nk+1)n
[ z
k
= x, z
j+1
= Az
j
+Bu
j
, j = k, . . . , N1 ;
a equa c ao de otimalidade
V (k, x) = minV (k + 1, Ax +Bu) +
1
2
(x, Qx) +u, Ru)) [ u R
m
;
V (N, x) =
1
2
x, Sx).
Observe que a equa c ao de otimalidade pode ser resolvida recursiva-
mente (k = N 1, . . . , 1), pois as aplica c oes envolvidas em sua deni c ao
s ao diferenciaveis e em cada passo k temos que resolver um problema
de minimiza c ao convexo (para o qual as condi c oes necessarias para exis-
tencia de solu c ao s ao tambem sucientes).
Consideremos o caso k = N 1. Temos
(11.7)
V (N 1, x)
= min
1
2
((Ax +Bu), S(Ax +Bu)) +x, Qx) +u, Ru)) [ u R
m
.
steuer
2008/3/11
page 258
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
Como R e S s ao positivas denidas, uma condi c ao necessaria e suciente
para que u
N1
seja mnimo de (11.7) e que satisfa ca
Ru +B
S(Ax +Bu) = 0.
Resolvendo esta equa c ao para u, obtemos
u
N1
:= (B
SB +R)
1
B
SAx.
A m de executar o calculo recursivamente, denimos as matrizes
S
N
:= S,
K
N1
:= (B
SB +R)
1
B
SA,
S
N1
:= (ABK
N1
)
S
N
(ABK
N1
) +K
N1
RK
N1
+Q.
Podemos ent ao escrever
u
N1
= K
N1
x, V (N 1, x) =
1
2
x, S
N1
x).
Podemos repetir o raciocnio para o passo k = N 2 (apartir de N 1),
bastando para isso que troquemos S
N
por S
N1
. Da mesma forma
procedemos para os passos k = N 3, . . . , 0, obtendo assim a fun c ao
valor otimo para cada passo. Escrevendo na forma de algoritmo, temos:
S
N
:= S;
para k = N 1, . . . , 0 calcule
K
k
:= (B
S
k+1
B +R)
1
B
S
k+1
A ;
S
k
:= (ABK
k
)
S
k+1
(ABK
k
) +K
k
RK
k
+Q ;
Uma vez calculadas as matrizes K
k
e S
k
, a tarefa de encontrar a es-
trategia otima de controle ca bastante simples. Basta executar o algo-
ritmo:
z
0
:= z
0
;
V (0, z
0
) :=
1
2
z
0
, S
0
z
0
) ;
para k = 0, . . . , N 1, calcule
u
k
:= K
k
z
k
;
z
k+1
:= Az
k
+Bu
k
;
V (k + 1, z
k+1
) :=
1
2
z
k+1
, S
k+1
z
k+1
) ;
e obtemos o controle otimo (u
0
, . . . , u
N1
), a trajetoria otima (z
0
, . . . , z
N
)
e o custo mnimo V (0, z
0
).
Observa cao 194. O metodo acima fornece mais informa c ao do que
procuravamos inicialmente. O controle otimo e obtido na forma de con-
trole de realimenta c ao a partir das matrizes de ganho K
k
. Para diferen-
tes valores iniciais z
0
, podemos encontrar a estrategia otima, bastando
steuer
2008/3/11
page 259
i
i
i
i
i
i
i
i
[SEC. 11.5: PROBLEMA LINEAR-QUADR
ATICO DISCRETO 259

para isso executar o algoritmo acima (na verdade podemos descobrir a
trajetoria otima a partir de qualquer z R
n
e passo k). O custo mnimo
e conhecido a cada passo k e dado por V (k, z
k
). 2
Abordamos agora o problema formulado com duas condi c oes de con-
torno (nos tempos k = 0 e k = N). Considere o seguinte problema de
controle:
_
_
_
Minimizar J(z, u) =
1
2
N1
k=0
(z
k
, Qz
k
) +u
k
, Ru
k
))
sujeito a
z
k+1
= Az
k
+Bu
k
, k = 0, . . . , N 1, z
0
= z
0
, z
N
= z
N
,
onde z
k
R
n
, u
k
R
m
, Q R
n,n
e R R
m,m
. Observe que substi-
tuimos a penalidade 1/2z
N
, Sz
N
) no funcional anterior pela condi c ao
de contorno z
N
= z
N
. Supomos agora s.p.g. que z
N
= 0. Sob o ponto
de vista da programa c ao din amica, temos a trade formada por: fun c ao
valor otimo
V (k, x) := minJ
k
(z, u) [ (z, u) Z
k
(x) R
(Nk)m
,
onde
J
k
(z, u) :=
1
2
N1
j=k
(z
j
, Qz
j
) +u
j
, Ru
j
)),
Z
k
(x) := z R
(Nk+1)n
[ z
k
= x, z
j+1
= Az
j
+Bu
j
, j = k, . . . , N1 ;
equa c ao de otimalidade
V (k, x) = minV (k + 1, Ax +Bu) +
1
2
(x, Qx) +u, Ru)) [ u R
m
;
condi c oes de contorno
V (N, x) =
_
0 , se x = 0
, se x ,= 0
.
Repetindo a constru c ao feita anteriormente, temos:
V (N 1, x) =
1
2
x, S
N1
x),
sempre que o estado z
N
= 0 for atingvel a partir de x. Sendo assim,
podemos tratar este problema com o mesmo algoritmo ja visto para o
problema com apenas uma condi c ao de contorno.
steuer
2008/3/11
page 260
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
11.6 Problema de Decis oes Consecutivas
Iniciamos a sec c ao analisando um modelo generico para problemas
discretos de decis oes consecutivas, nos quais a fun c ao objetivo permite
a abordagem via programa c ao din amica. A seguir apresentamos um
resultado que garante existencia e unicidade de solu c oes para o modelo.
Problemas Markovianos de decis oes consecutivas s ao tratados em [Pi],
onde em particular e analisado o algoritmo de Howard.
Descri cao do Modelo
Suponha que um determinado processo evolui em intervalos de tempo
discretos t = j 0, 1, . . . , N + 1 e que, a cada instante de tempo j, o
estado seja representado por z
j
R
n
. O vetor de decis oes (ou controle)
e representado por v
j

j
R
m
, j 0, . . . , N, de modo que a evolu c ao
da variavel de estado e descrita por:
z
j+1
= T
j
(z
j
, v
j
), j 0, . . . , N,
onde o estado inicial z
0
e as fun c oes T
j
que descrevem a din amica do
sistema s ao conhecidos. Suponha ainda que as decis oes tenham que ser
tomadas de forma a minimizar a fun c ao objetivo (custos)
g(z
0
, . . . , z
N+1
, v
0
, . . . , v
N
) :=
N
j=0
l
j
(z
j
, z
j+1
, v
j
).
Para fun c oes objetivo dessa forma e possvel abordar o problema atraves
da programa c ao din amica. Temos:
V (j, z):= min
N
k=j
l
k
(z
k
, z
k+1
, v
k
) [ z
j
=z, z
k+1
=T
k
(z
k
, v
k
), v
k
k
,
k = j, . . . , N.
V (j, z) = min
v
V (j + 1, T
j
(z, v)) +l
j
(z, T
j
(z, v), v).
Condi c oes de contorno:
V (N + 1, z) = 0, z Z
ad
.
steuer
2008/3/11
page 261
i
i
i
i
i
i
i
i
[SEC. 11.6: PROBLEMA DE DECIS
OES CONSECUTIVAS 261

A tarefa que se imp oe e descobrir V (0, z
0
).
Processos particularmente interessantes s ao aqueles em que as fun c oes
T
j
e l
j
s ao constantes (processos estacionarios), i.e., T
j
= T e l
j
= l, j.
Neste caso, uma alternativa para descobrir a fun c ao valor otimo e ana-
lisar a equa c ao funcional
(11.8) f(z) = min
v
f(T(z, v)) +l(T(z, v), v),
a qual e satisfeita por

V (z) := lim
j
V (j, z), caso o limite exista para
todo z.
Exemplo 195 (Investimento de Capital). Suponha que no incio do
ano dispomos de um capital de z US-dolares, o qual pode ser aplicado
em duas atividades produtivas que geram no nal do ano os lucros g
1
(z)
e g
2
(z), respectivamente. A variavel de decis ao v corresponde à fra c ao
de z investida na primeira atividade. Logo, o lucro no nal do ano e
dado pela express ao
g
1
(zv) + g
2
(z(1 v)),
onde v [0, 1] = . Suponha ainda que associado à aplica c ao do capital
estejam determinados custos como propaganda, impostos, . . . ). Deste
modo, ao nal do ano temos a disposi c ao apenas o capital
z := vz + z(1 v),
onde , [0, 1) s ao dados. Consideramos o processo ao longo de N
anos, tendo um capital inicial de z
0
US-dolares. O objetivo e maximizar
o lucro (minimizando para isto o lucro negativo). Denimos
T(z, v) := v +(z v) e l(z, v) := g
1
(zv) g
2
(z(1 v)),
obtendo assim a fun c ao valor otimo:
V (j, z) := min
N
k=j
l(z
k
, v
k
) [ z
j
= z, z
k+1
= T(z
k
, v
k
), v
k
[0, 1], k = j, . . . , N
e a equa c ao de otimalidade:
V (j, z) = min
v
V (j + 1, T(z, v)) +l(z, v).
steuer
2008/3/11
page 262
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
Observe que a equa c ao (11.8) se escreve como
f(z) = (F(f))(z) := min
v[0,1]
f(vz +z(1v))g
1
(zv)g
2
(z(1v))
para este exemplo. 2
Um Teorema de Existencia
Dados os conjuntos Z
ad
R
n
e U
ad
R
m
respectivamente dos
estados e decis oes admissveis, considere a equa c ao funcional
(11.9) f(z) = min
uU
ad
(z, u)f(T(z, u)) +(z, u), z Z
ad
,
onde , : Z
ad
U
ad
R, T : Z
ad
U
ad
Z
ad
s ao dados e f : Z
ad
R
e a incognita. A existencia de solu c oes para equa c ao (11.9) e garantida
pelo seguinte resultado:
Teorema 196. Suponha que as seguintes condi c oes s ao satisfeitas:
U
ad
e compacto, Z
ad

B
(0) e fechado, 0 Z
ad
;
T(, u) e contnua, uniformemente em u U
ad
e existe [0, 1) tal
que
(11.10) [T(z, u)[ [z[, (z, u) Z
ad
U
ad
;
(, u) e contnua, uniformemente em u U
ad
e
(11.11) [(z, u)[ 1, (z, u) Z
ad
U
ad
;
(, u) e contnua, uniformemente em u U
ad
e
(11.12) (0, u) = 0 para todo u U
ad
;
(11.13)
n=0
h(
n
) < , onde h(r) := max
zZ
ad
, [z[r
max
uU
ad
[(z, u)[, 0 r .
Ent ao existe uma unica aplica c ao contnua f : Z
ad
R satisfazendo
f(0) = 0 e (11.9).
Demonstra c ao: Um desenvolvimento analogo ao apresentado na primeira
parte desta sec c ao nos permite escrever a equa c ao (11.9) como uma
steuer
2008/3/11
page 263
i
i
i
i
i
i
i
i
[SEC. 11.6: PROBLEMA DE DECIS
OES CONSECUTIVAS 263

equa c ao de ponto xo. Construmos agora nossa solu c ao atraves da
itera c ao de ponto xo:
f
0
(z) := min
uU
ad
(z, u), z Z
ad
;
f
n+1
(z) := min
uU
ad
(z, u)f
n
(T(z, u)) +(z, u), z Z
ad
. (11.14)
Mostramos inicialmente que, para n N, vale a desigualdade:
(11.15) max
zZ
ad
,[z[r
[f
n+1
(z) f
n
(z)[ max
zZ
ad
,[z[r
[f
n
(z) f
n1
(z)[.
Para n = 1: tome z Z
ad
.
Sejamu
1
, u
2
U
ad
tais que f
i
(z) = (z, u
i
)f
i1
(T(z, u
i
))+(z, u
i
), i =
1, 2. A existencia de u
1
, u
2
e garantida pela compacidade de U
ad
e pela
continuidade de f
0
e f
1
. Temos ent ao:
f
2
(z) f
1
(z) (z, u
1
) f
1
(T(z, u
1
)) + (z, u
1
)
. .
f
2
(z)
[(z, u
1
) f
0
(T(z, u
1
)) + (z, u
1
)]
. .
= f
1
(z)
= (z, u
1
) [f
1
(T(z, u
1
)) f
0
(T(z, u
1
))]
f
2
(z) f
1
(z) (z, u
2
) f
1
(T(z, u
2
)) + (z, u
2
)
. .
= f
2
(z)
[(z, u
2
) f
0
(T(z, u
2
)) + (z, u
2
)]
. .
f
1
(z)
= (z, u
2
) [f
1
(T(z, u
2
)) f
0
(T(z, u
2
))]
Portanto, para z Z
ad
com [z[ r, temos de (11.10) e (11.11)
[f
2
(z) f
1
(z)[ max
uU
ad
[(z, u)[ [f
1
(T(z, u)) f
0
(T(z, u))[
max
zZ
ad
|z|r
[f
1
(z) f
0
(z)[.
steuer
2008/3/11
page 264
i
i
i
i
i
i
i
i
AO DIN
AMICA DISCRETA
Para n > 1, a verica c ao e feita de forma analoga, cando assim provada
a desigualdade (11.15). Observe que o mesmo artifcio nos permite esti-
mar [f
1
(z) f
0
(z)[ por
(11.16) max
zZ
ad
|z|r
[f
1
(z) f
0
(z)[ max
zZ
ad
|z|r
max
uU
ad
[(z, u)[ = h(r).
Denindo agora para n N
0
h
n
(r) := max
zZ
ad
, [z[r
[f
n+1
(z) f
n
(z)[, 0
r , obtemos de (11.15) e (11.16)
h
n
(r) h
n1
(r) h
0
(
n
r) h(
n+1
r), 0 r .
De (11.13), obtemos para z Z
ad
n=0
[f
n+1
(z) f
n
(z)[
n=0
h(
n
) < ,
provando que a serie
n=0
(f
n+1
(z) f
n
(z)) converge uniformemente em
Z
ad
. Dena agora a fun c ao f(z) :=
n=0
(f
n+1
(z)f
n
(z))+f
0
(z), z Z
ad
.
f e contnua por constru c ao. A propriedade f(0) = 0 segue de
f
0
(0) = 0 (devido a (11.12)),
f
n
(0) = 0 (devido a (11.10) e (11.12)).
A equa c ao (11.9) e obtida de (11.14) tomando o limite n e usando
o fato da sequencia (f
n
)
nN
convergir uniformemente para f em Z
ad
.
Para provar a unicidade, suponha que

f e uma outra solu c ao de (11.9).
Dena
k() := max
zZ
ad
|z|r
[f(z)

f(z)[, 0 r .
O mesmo procedimento utilizado acima nos fornece agora
max
zZ
ad
|z|r
[f(z)

f(z)[ max
zZ
ad
|z|r
[f(z)

f(z)[, 0 r .
Isto e , k(r) k(r) k(
n
r) . . . Tomando o limite n ,
obtemos (f e

f s ao contnuas)
k(r) k(0) = [f(0)

f(0)[ = 0, 0 r ,
completando assim a demonstra c ao.
steuer
2008/3/11
page 265
i
i
i
i
i
i
i
i
EXERC
ICIOS 265
Exerccios
11.1. Dados c > 0 e n N, considere o problema de minimiza c ao
_
_
_
Minimizar
n
i=1
x
i
sujeito a x
1
+. . . +x
n
= c.
a) Formule o problema acima como um problema de programa c ao
din amica, i.e. encontre fun c ao valor, equa c ao de otimalidade e condi c oes
de contorno.
b) Resolva o problema do tem a).
11.2. Um navio com capacidade para transportar 730 toneladas de
carga deve ser carregado com tres tipos de gr aos. As cargas a serem
transportadas s ao dadas na tabela abaixo:
Grao Peso (Ton) Valor
G1 100 360
G2 125 475
G3 250 1000
a) Usando programa c ao din amica, determine a forma otima (com rela c ao
ao valor da carga) de carregar o navio.
b) Resolva novamente o problema usando programa c ao linear.
11.3. Dados c N
0
, n N, considere o problema
_
_
_
Minimizar
n
i=1
p
i
z
i
sujeito a

n
i=1
w
i
z
i
c, z
i
N
0
, i = 1, . . . , n,
onde p
i
, w
i
N
0
, i = 1, . . . , n, s ao constantes fornecidas. Dena para
k = 1, . . . , n, j = 0, . . . , c a fun c ao
f
k
(j) := max
k
i=1
p
i
z
i
[
k
i=1
w
i
z
i
j, z
i
N
0
, i = 1, . . . , k.
a) Verique que f
k
(j) e a fun c ao valor para o problema de programa c ao
din amica correspondente. Determine a equa c ao de otimalidade e as
condi c oes de contorno.
b) Mostre que f
k
(j) e monotona n ao decrescente.
steuer
2008/3/11
page 266
i
i
i
i
i
i
i
i
266 EXERC
ICIOS
c) Resolva o problema para os dados n = 4, c = 14, p = (7, 8, 9, 24),
w = (5, 4, 6, 10).
11.4 (Problema do Caminho Mais Curto). Considere um Grafo
com vertices K
1
, . . . , K
N
. Suponha que cada par de vertices (K
i
, K
j
)
esteja unido por uma aresta de comprimento d
ij
. Os seguintes valores
s ao admissveis para d
ij
:
d
ij
<0 (Lucro!) ; d
ij
>0 (Custos!) ; d
ij
= (N ao existe comunica c ao!).
O objetivo e encontrar o caminho mais curto entre os vertices K
1
e K
N
.
a) Mostre que a fun c ao valor e da forma
(11.17)
V (i, k) := Comprimento do caminho mais curto de K
1
a K
k
, que atravessa no maximo i arestas.
b) Verique que a equa c ao de otimalidade e dada por:
(11.18) V (i, k) :=
_
min
j,=k
V (i 1, j) +d
jk
, k ,= 1
min
j1,...,N
V (i 1, j) +d
j1
, k = 1
.
c) Mostre que as condi c oes de contorno s ao da forma
V (0, k) :=
_
0 , k = 1
, k > 1
, V (1, 1) := 0.
d) Considere o grafo da Figura 11.3. Observe que as condi c oes iniciais
s ao
V (0, 1) = 0 , V (0, 2) = V (0, 3) = V (0, 4) = .
Encontre o caminho mais curto do vertice K
1
ao vertice K
4
.
11.5 (Problema da Aloca cao de Recursos). Este problema n ao
e exatamente din amico, ou seja n ao requer uma seq uencia de decis oes.
Suponha que, dadas X unidades de um determinado recurso (materia
prima, capital, . . . ), temos que distribu -las por N atividades A
1
, . . . ,
A
N
. Para cada atividade A
k
, temos uma fun c ao r
k
(x), que representa
o retorno (lucro) obtido pela atividade A
k
quando uma determinada
quantidade de recursos x 0, . . . , X e alocada a esta atividade (as
fun c oes r
k
s ao monotonas n ao decrescentes por hipotese). O obje-
tivo e encontrar uma aloca c ao otima dos X recursos pelas atividades
A
1
,. . . , A
n
, de modo a maximizar a fun c ao de produtividade
N
j=1
r
j
(x
j
).
steuer
2008/3/11
page 267
i
i
i
i
i
i
i
i
EXERC
ICIOS 267
K
1
K
2
K
3
K
4
d
d
d
d
d
d
d
d
T
c
2 3
5 1
-4 6
Figura 11.3: Grafo para o problema do caminho mais curto.
a) Verique que o problema pode ser escrito como
_
_
Maximizar

N
j=1
r
j
(x
j
)
sujeito a
(x
1
, . . . , x
n
) Z
N
, x
j
0, j = 1, . . . , N,
N
j=1
x
j
= X
A m de usar a programa c ao din amica, precisamos de uma variavel
que torne possvel denir a equa c ao de otimalidade de forma indutiva.
Armamos por hora que esta variavel e k, o ndice das atividades con-
sideradas (veja ultimo item do exerccio). Dena a fun c ao valor:
V (k, x) := Produtividade maxima obtida quando x unidades de
recurso s ao distribuidas pelas atividades A
k
, . . . , A
N
;
onde x 0, . . . , X e k 1, . . . , N.
b) Mostre que a fun c ao valor satisfaz a equa c ao de otimalidade
(11.19) V (k, x) = max
y0,...,x
V (k + 1, x y) +r
k
(y)
V (N, x) = r
N
(x).
c) Prove que o maximo da fun c ao de produtividade e dado por V (1, X).
steuer
2008/3/11
page 268
i
i
i
i
i
i
i
i
Captulo 12
Programacao Dinamica
Contnua
Consideramos neste captulo aplica c oes da programa c ao din amica a
problemas de controle com din amica contnua. A formula c ao dos proble-
mas aqui estudados e generica, abrangendo problemas n ao lineares, n ao
aut onomos, assim como restri c oes às variaveis de controle. Em contra-
partida, a obten c ao dos resultados que dizem respeito a situa c oes t ao
gerais exige a formula c ao de condi c oes muito restritivas e muitas vezes
difceis de ser comprovadas.
O ponto principal deste captulo e a analise da fun c ao valor otimo
(ou fun c ao valor). Na Sec c ao 12.1 s ao demonstrados alguns resulta-
dos referentes à regularidade (Lipschitz continuidade) desta fun c ao. Na
Sec c ao 12.2 e obtida uma rela c ao implcita entre a fun c ao valor e os
processos otimos, o princpio de Bellman. Na Sec c ao 12.3 analisamos
uma equa c ao diferencial parcial n ao linear de primeira ordem (equa c ao
de HamiltonJakobiBellman) e a rela c ao de suas solu c oes com a fun c ao
valor (teoremas de verica c ao). Na Sec c ao 12.4 estudamos os problemas
de controle com din amica linear e fun c ao objetivo quadratica. Para esta
famlia especial de problemas e possvel, resolvendo a equa c ao diferencial
de Riccati, obter a fun c ao valor e os controles otimos correspondentes.
12.1 Funcao Valor

Otimo
Nesta sec c ao associamos a uma dada famlia de problemas de con-
trole (que diferem apenas pela condi c ao inicial) uma fun c ao que esta
steuer
2008/3/11
page 269
i
i
i
i
i
i
i
i
[SEC. 12.1: FUNC
AO VALOR

OTIMO 269
intrinsecamente relacionada com a solu c ao de cada um dos problemas
desta famlia. Esta rela c ao e expressa atraves de um princpio de otima-
lidade e de uma equa c ao diferencial, que constituem o objeto do estudo
das sec c oes subseq uentes.
Seja T > 0 xo. Dados t
0
[0, T] e z
0
R
n
, considere a seguinte
famlia de problemas de controle:
P(t
0
, z
0
)
_
_
Minimizar J(t
0
, z
0
; u, z) :=
_
T
t
0
L(t, z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
t
0
f(s, z(s), u(s)) ds, t [t
0
, T],
u L
1
([t
0
, T]; R
m
), u(t) q.s. em [t
0
, T],
onde L : [0, T] R
n
R
m
R, f : [0, T] R
n
R
m
R
n
e R
m
.
Observe que a din amica do sistema e descrita por uma equa c ao integral,
o que nos permite admitir trajetorias menos regulares. O conjunto dos
controles admissveis e dado por
U
ad
[t
0
, T] := u L
1
([t
0
, T]; R
m
) [ u(t) q.s. em [t
0
, T].
Denominamos por processos os pares (u, z
u
) U
ad
[t
0
, T] C([t
0
, T]; R
n
)
formados por controle e trajetoria correspondente. O conjunto dos pro-
cessos admissveis para P(t
0
, z
0
) e
T
t
0
,z
0
:= (u, z
u
) [ u U
ad
[t
0
, T], J(t
0
, z
0
; u, z
u
) < .
Deni cao 197. Dado u U
ad
[t
0
, T], denotamos a trajetoria correspon-
dente por z
u
. A fun c ao valor otimo e a aplica c ao V : [0, T] R
n
R
denida por
V (t
0
, z
0
) := infJ(t
0
, z
0
; u, z
u
) [ u U
ad
[t
0
, T].
Um controle u U
ad
[t
0
, T] e denominado controle otimo para P(t
0
, z
0
),
quando
V (t
0
, z
0
) = J(t
0
, z
0
; u, z
u
).
Neste caso, z := z
u
e denominada trajet oria otima e o par ( u, z) e
chamado de solu c ao ou processo otimo para o problema P(t
0
, z
0
).
2
Observa cao 198. Existencia e unicidade de solu c oes para o problema
P(t
0
, z
0
) podem ser garantidas ao impormos restri c oes especiais às fun-
c oes L e f. Se supomos, por exemplo, que as fun c oes envolvidas na
steuer
2008/3/11
page 270
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
formula c ao do problema de controle otimo s ao apenas C
1
, podemos ter
situa c oes do tipo:
_
_
Minimizar J(t
0
, z
0
; u, z) :=
_
1
t
0
_
z
2
(s) + (u
2
(s) 1)
2
ds
sujeito a
z
t
(s) = u(s), q.s. em [0, 1], z(t
0
) = z
0
,
u L
1
([t
0
, 1]; R) [ u(t) R q.s. em [t
0
, 1].
Note que V (0, 0) = infJ(0, 0; u, z) [ u admissvel para P(0, 0) = 0, pois
a seq uencia de controles
u
n
(t) =
_
_
_
1 , t
(n3)/2
k=0
[2kh, (2k + 1)h]
1 , t
(n2)/2
k=0
[(2k + 1)h, (2k + 2)h]
com h = 1/n, n N, satisfaz [u
n
(t)[ = 1 q.s. em [0, 1] e ainda
J(0, 0; u
n
, z
u
n
) 0, quando n . Entretanto, n ao existe estrategia
u tal que J(0, 0; u, z
u
) = 0, pois isto implicaria em z
u
0 e, ao mesmo
tempo, [(z
u
)
t
(t)[ = 1 q.s. em [0, 1]. 2
Fazemos agora as seguintes hipoteses sobre a formula c ao do problema
P(t
0
, z
0
):
H1) Existe uma constante positiva K
1
tal que
[f(t, x, u)f(t, y, u)[+[L(t, x, u)L(t, y, u)[ K
1
[xy[, x, y R
n
para todo t [0, T], u ;
H2) Dado x R
n
, as fun c oes L(, x, ) e f(, x, ) s ao mensuraveis;
H3) Existe uma constante positiva K
2
tal que
[f(t, x, u)[ +[L(t, x, u)[ K
2
(1 +[x[), x R
n
,
para todo t [0, T], u ;
H4) Dados t [0, T], u , as fun c oes f(t, , u), L(t, , u) s ao continu-
amente diferenciaveis e as derivadas parciais f
z
, L
z
s ao contnuas
em [0, T] R
n
;
H5) e fechado.
steuer
2008/3/11
page 271
i
i
i
i
i
i
i
i
[SEC. 12.1: FUNC
AO VALOR

OTIMO 271
Note que H3) e a mais interessante das hipoteses. Denominada por
crescimento linear, esta hipotese n ao somente garante existencia e uni-
cidade de solu c oes para a equa c ao da din amica, como tambem limita o
crescimento do integrando da fun c ao objetivo.
A m de obtermos as propriedades relevantes da fun c ao valor, pre-
cisamos de um lema auxiliar que estime o crescimento das trajetorias de
um sistema din amico.
Lema 199. Suponha que H1),. . . , H5) s ao satisfeitas. Seja s [0, T] e
x, x
1
R
n
com [x[ R, [x
1
[ R. Dado u U
ad
[s, T], dena
z(r) := x +
_
r
s
f(q, z(q), u(q))dq, z
1
(r) := x
1
+
_
r
s
f(q, z
1
(q), u(q))dq,
para r [s, T]. Ent ao existe constante K (que n ao depende de u) tal
que
(12.1) [z(r) x[ K(1 +R)[r s[, r [s, T];
(12.2) [z(r) z
1
(r)[ K(1 +R)[x x
1
[, r [s, T].
Demonstra c ao: Note que
[z(r) x[
_
r
s
[f(q, z(q), u(q)) f(q, x, u(q))[dq +
_
r
s
[f(q, x, u(q))[dq
K
1
_
r
s
[z(q) x[dq +K
2
_
r
s
(1 +[x[)dq.
Do Lema de Gronwall 264, obtemos
[z(r) x[ K(1 +[x[)[r s[, r [s, T],
provando (12.1). Para provar (12.2) note que
z(r) z
1
(r) =
_
r
s
_
f(q, z(q), u(q)) f(q, z
1
(q), u(q))
dq + (x x
1
).
Usando novamente o lema de Gronwall e H1) o teorema segue.
1
No teorema a seguir vericamos que as condi c oes H1), . . . H5) s ao
sucientes para que V esteja bem denida. Alem disso s ao discutidas
algumas propriedades da fun c ao valor.
1
Para mais detalhes sobre a constante K, veja o Exerccio 12.1.
steuer
2008/3/11
page 272
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
Lema 200. Suponha que as hip oteses H1), . . . , H5) s ao satisfeitas.
Ent ao s ao verdadeiras as armativas:
a) J(s, z; u, z
u
) est a bem denido para todo (s, z) [0, T] R
n
e todo
u U
ad
[s, T].
b) V (s, z) est a bem denida para todo (s, z) [0, T] R
n
;
c) V e localmente lipschitz contnua em [0, T] R
n
, i.e. existe uma
constante K (que depende de T) tal que
(12.3) [V (s
1
, z
1
) V (s
2
, z
2
)[ K(1 +R)([s
1
s
2
[ +[z
1
z
2
[),
para todo (s
1
, z
1
), (s
2
, z
2
) [0, T] R
n
com [z
1
[ R, [z
2
[ R.
Demonstra c ao: Seja (s, z) [s, T] R
n
e u U
ad
[s, T]. Temos
ent ao
[J(s, z; u, z
u
)[
_
T
s
[L(r, z
u
(r), u(r)) L(r, z, u(r))[dr
+
_
T
s
[L(r, z, u(r))[dr
_
T
s
K
1
[z
u
(r) z[dr +
_
T
s
K
2
(1 +[z[)dr.
De (12.1), temos
(12.4)
[J(s, z; u, z
u
)[ K
1
K(1+[z[)
_
T
s
[rs[ds + K
2
T(1+[z[) < M < ,
provando a). Para provar b), basta observar que as constantes K, K
1
,
K
2
em (12.4) n ao dependem de u, logo a estimativa obtida e uniforme
em U
ad
[s, T].
O item c) e o mais interessante do teorema. Sejam (s
1
, z
1
), (s
2
, z
2
)
[s, T] R
n
com [z
i
[ R (suponha s
1
s
2
). Dado > 0 escolha
u
1
U
ad
[s
1
, T] e u
2
U
ad
[s
2
, T] tais que
V (s
i
, z
i
) J(s
i
, z
i
; u
i
, z
u
i
) /2, i = 1, 2.
Isto e sempre possvel, pois como vimos no item a), V esta bem denida.
Dena agora
u
1
(t) :=
_
u
1
(t) , t [s
1
, s
2
)
u
2
(t) , t [s
2
, T]
e u
2
:= u
1
[
[s
2
,T]
.
steuer
2008/3/11
page 273
i
i
i
i
i
i
i
i
[SEC. 12.1: FUNC
AO VALOR

OTIMO 273
Temos ent ao
V (s
1
, z
1
) V (s
2
, z
2
) V (s
1
, z
1
) J(s
2
, z
2
; u
2
, z
u
2
) + /2
J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
) + /2,
e, analogamente,
V (s
1
, z
1
) V (s
2
, z
2
) J(s
1
, z
1
; u
1
, z
u
1
) /2 J(s
2
, z
2
; u
2
, z
u
2
).
[V (s
1
, z
1
) V (s
2
, z
2
)[ + [J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
)[
+[J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
)[.
Basta, portanto, estimar os termos
[J(s
1
, z
1
; u
1
, z
u
1
)J(s
2
, z
2
; u
2
, z
u
2
)[, [J(s
1
, z
1
; u
1
, z
u
1
)J(s
2
, z
2
; u
2
, z
u
2
)[.
Da deni c ao do funcional J, temos
[J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
)[
_
s
2
s
1
L(r, z
u
1
(r), u
1
(r))dr
_
T
s
2
_
L(r, z
u
1
(r), u
1
(r)) L(r, z
u
2
(r), u
2
(r))
dr
_
s
2
s
1
L(r, z
u
1
(r), u
1
(r))dr
_
T
s
2
_
L(r, z
u
1
(r), u
2
(r)) L(r, z
u
2
(r), u
2
(r))
dr
K
2
_
s
2
s
1
(1 +[z
u
1
(r)[)dr +K
1
_
T
s
2
[z
u
1
(r) z
u
2
(r)[dr
K(1 +R)[s
1
s
2
[ +K(1 +R)[z
1
z
2
[,
onde K depende apenas de T, K
1
e K
2
. Para obter a ultima desigualdade
utilizamos o Lema 199 e a desigualdade
[z
u
1
(s
2
) z
u
2
(s
2
)[ [z
u
1
(s
2
) z
u
1
(s
1
)[ +[z
u
1
(s
1
) z
u
2
(s
2
)[.
De modo analogo provamos que
[J(s
1
, z
1
; u
1
, z
u
1
) J(s
2
, z
2
; u
2
, z
u
2
)[ K(1 +R)([s
1
s
2
[ +[z
1
z
2
[).
steuer
2008/3/11
page 274
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
Podemos ent ao concluir que
[V (s
1
, z
1
) V (s
2
, z
2
)[ +K(1 +R)([s
1
s
2
[ +[z
1
z
2
[),
onde a constante K n ao depende de z
1
, z
2
, s
1
, s
2
e . Como > 0 e
arbitrario, o teorema ca provado.
O item a) do Teorema 200 garante que, dado (s, z) [0, T] R
n
,
todo controle u U
ad
[s, T] esta associado a um processo de custo nito,
i.e. J(s, z; u, z
u
) < . Uma conseq uencia imediata deste fato e que,
para todo (s, z) [0, T] R
n
, temos
T
s,z
= (u, z
u
) [ u U
ad
[s, T].
O leitor atento percebe que a hipotese de crescimento linear H3)
permite a obten c ao das constantes K em (12.1), (12.2) e (12.3), sem que
seja preciso supor limitado. Resumindo, H3) nos permite provar a
Lipschitzcontinuiade da fun c ao valor, ainda que o conjunto de controles
seja ilimitado (veja Exerccio 12.4).
Observa cao 201. O teorema de Rademacher (veja [Mo]) garante que
uma fun c ao Lipschitz contnua e diferenciavel quase sempre. Portanto,
uma conseq uencia do item c) do Teorema 200 e que a fun c ao valor e dife-
renciavel em [0, T] R
n
quase sempre em rela c ao à medida de Lebesgue.
2
12.2 Princpio de Bellman
Apresentamos nesta sec c ao um resultado de fundamental import ancia
para a verica c ao da otimalidade de processos admissveis. Trata-se do
princpio de otimalidade de Bellman. Este resultado e, por sua vez,
conseq uencia do seguinte lema chave da programa c ao din amica:
Lema 202. Seja (t
0
, z
0
) [0, T) R
n
, u U
ad
[t
0
, T] e z := z
u
, com
z(t
0
) = z
0
. Se as hip oteses H1), . . . , H5) s ao satisfeitas, s ao verdadeiras
as armativas:
a) Para todo s
1
, s
2
[t
0
, T], com s
1
s
2
, temos
(12.5) V (s
1
, z(s
1
)) V (s
2
, z(s
2
)) +
_
s
2
s
1
L(r, z(r), u(r))dr;
steuer
2008/3/11
page 275
i
i
i
i
i
i
i
i
[SEC. 12.2: PRINC
IPIO DE BELLMAN 275

b) O controle u U
ad
[t
0
, T] e otimo para P(t
0
, z
0
) se e somente se para
todo s
1
, s
2
[t
0
, T], com s
1
s
2
, temos
(12.6) V (s
1
, z(s
1
)) = V (s
2
, z(s
2
)) +
_
s
2
s
1
L(r, z(r), u(r))ds.
Demonstra c ao: Provamos inicialmente a). Seja u U
ad
(s
2
, T) um
controle admissvel para o problema P(s
2
, z(s
2
)). Logo, o controle u
denido por
u(t) :=
_
u(t) , t [s
1
, s
2
)
u(t) , t [s
2
, T]
,
e admissvel para P(s
1
, z(s
1
)) para qualquer s
1
[t
0
, s
2
]. Tomando
z := z
u
, temos da deni c ao da fun c ao valor
V (s
1
, z(s
1
))
_
T
s
1
L(s, z(s), u(s)) ds
=
_
s
2
s
1
L(s, z(s), u(s)) ds + J(s
2
, z(s
2
); u, z).
Como u U
ad
(s
2
, T) e um controle admissvel qualquer, a desigualdade
(12.5) segue da deni c ao de V . Para provar b), suponha que u e um
controle otimo para P(t
0
, z
0
). Segue ent ao do item a) e da deni c ao da
fun c ao valor
V (t
0
, z
0
) V (s
1
, z(s
1
)) +
_
s
1
t
0
L(s, z(s), u(s)) ds
V (s
2
, z(s
2
)) +
_
s
2
t
0
L(s, z(s), u(s)) ds
_
T
s
2
L(s, z(s), u(s)) ds +
_
s
2
t
0
L(s, z(s), u(s)) ds
= J(t
0
, z
0
; u, z) = V (t
0
, z
0
).
Reciprocamente, suponha que o controle u e tal que (12.6) e satis-
feita. Tomando s
1
:= t
0
e s
2
:= T em (12.6), temos que V (t
0
, z
0
) =
J(t
0
, z
0
; u, z). Logo, u e um controle otimo para P(t
0
, z
0
). (Usamos
tacitamente a identidade V (T, z(T)) = 0, a qual segue da deni c ao da
fun c ao valor.)
steuer
2008/3/11
page 276
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
Corolario 203. Dado (t
0
, z
0
) [0, T] R
n
, seja u U
ad
[t
0
, T] um
controle otimo para P(t
0
, z
0
) e z := z
u
a trajet oria correspondente com
z(t
0
) = z
0
. Ent ao, a restri c ao u[
[t,T]
e um controle otimo para P(t, z(t)),
para todo t [t
0
, T).
Demonstra c ao: Segue diretamente do item b) do Lema 202 quando
escolhemos s
1
= t e s
2
= T.
Resumindo as conclus oes acima, o Corolario 203 nos permite enun-
ciar o princpio de optimalidade de Bellman da seguinte forma:
2
Se u U
ad
[t
0
, T] e um controle otimo para o problema P(t
0
, z
0
),
ent ao, para todo t [t
0
, T], a restri c ao u[
[t,T]
e um controle
otimo para o problema P(t, z
u
(t)).
Na sec c ao seguinte utilizamos a equa c ao (12.6) para obter uma equa-
c ao diferencial parcial, da qual a fun c ao valor otimo (quando composta
com a trajetoria otima do problema) e solu c ao.
12.3 Equacao de HamiltonJakobiBellman
Usando a nota c ao da sec c ao anterior, consideramos a fun c ao valor
otimo V ao longo da trajetoria otima denida no intervalo [t
0
, T] do
problema P(t
0
, z
0
)
V (t, z(t)) =
_
T
t
L(s, z(s), u(s)) ds.
Derivando formalmente em rela c ao a t obtemos a identidade
V
t
(t, z(t)) +

V
z
(t, z(t)), f(t, z(t), u(t))
_
= L(t, z(t), u(t)),
a qual motiva a formula c ao da principal equa c ao da programa c ao din a-
mica para problemas de controle otimo contnuos.
Teorema 204. Considere o problema P(t
0
, z
0
) sujeito ` as hip oteses
H1), . . . , H5). S ao v alidas as seguintes armativas:
a) Se V e diferenci avel em (t, z) [t
0
, T] R
n
, ent ao
(12.7)
V
t
(t, z) +

V
z
(t, z), f(t, z, u)
_
+ L(t, z, u) 0,
2
Veja Sec c ao 11.1.
steuer
2008/3/11
page 277
i
i
i
i
i
i
i
i
[SEC. 12.3: EQUAC
AO DE HAMILTONJAKOBIBELLMAN 277
para todo u ;
b) Seja u U
ad
[t
0
, T] um controle otimo para P(t
0
, z
0
). Se V e di-
ferenci avel ao longo da trajet oria otima (t, z(t)), para todo t (t
0
, T),
ent ao
(12.8)
V
t
(t, z(t)) + min
u
_
V
z
(t, z(t)), f(t, z(t), u)
_
+ L(t, z(t), u)
_
= 0,
para todo t (t
0
, T), sendo o mnimo obtido em u = u(t) para cada t.
Demonstra c ao: Seja u e z uma solu c ao local
3
de
z(s) = z +
_
s
t
f(r, z(r), u) dr.
Logo, existe > 0 tal que a trajetoria (s, z(s)) esta bem denida no
intervalo [t, t + ]. Seja agora u
um controle admissvel qualquer para

P(t +, z(t +)) e dena
u(r) :=
_
u , r [t, t +)
u
(r), r [t +, T]
.
O controle assim construdo satisfaz u U
ad
[t, T] e sua trajetoria corres-
pondente e tal que z
u
(s) = z(s), s [t, t +). Do item a) do Lema 202,
temos que para todo 0 < h
V (t, z(t)) V (t +h, z(t +h)) +
_
t+h
t
L(r, z(r), u(r)) dr.
Logo,
1
h
[V (t +h, z(t +h)) V (t, z(t))]
1
h
_
t+h
t
L(r, z(r), u) dr.
Tomando o limite h 0, obtemos (12.7), provando assim o item a). A
m de provar b), repetimos a constru c ao feita no item anterior para o
ponto (t, z) := (t, z(t)), obtendo assim para todo u
0
d
dt
V (t, z(t)) + L(t, z(t), u)
=
V
t
(t, z(t)) +

V
x
(t, z(t)), f(t, z(t), u)
_
+ L(t, z(t), u).
3
A existencia de tal solu c ao local e garantida pela hip otese sobre a regularidade
de f feita em H2).
steuer
2008/3/11
page 278
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
Note ainda que o item b) do Lema 202 com s
1
:= t e s
2
:= t +h implica
em
1
h
[V (t +h, z(t +h)) V (t, z(t))] =
1
h
_
t+h
t
L(r, z(r), u(r)) dr.
Tomando o limite h 0, obtemos (12.8) e o teorema ca provado.
Observa cao 205. Para utilizar o Teorema 204 precisamos antes garan-
tir a regularidade enunciada para V . Na Observa c ao 201, conclumos
que V e diferenciavel quase sempre, o que ainda n ao nos basta. Via de
regra, n ao e de se esperar que V seja mais do que diferenciavel quase
sempre, como podemos vericar no seguinte exemplo:
_
_
Minimizar J(t
0
, z
0
; u, z) := [z(1) z
0
]
sujeito a
u U
ad
[t
0
, 1] := w L
1
([t
0
, 1]; R) [ w(s) [0, 1] q.s. em [t
0
, 1],
z
t
= z u, q.s. em [t
0
, 1], z(t) = z
0
.
Temos aqui L(t, z, u) = zu, f(t, z, u) = zu, T = 1 e = [0, 1] R.
Note que
[f(t, x
1
, u)f(t, x
2
, u)[ +[L(t, x
1
, u)L(t, x
2
, u)[2[x
1
x
2
[, x
1
, x
2
R,
[f(t, x, u)[ +[L(t, x, u)[ 2(1 +[x[), x R,
para todo (t, u) [0, T] . Logo as hipoteses H1), . . . , H5) s ao
satisfeitas.

E de simples verica c ao o fato da fun c ao valor ser dada por
V (t, z) =
_
z ze
1t
, z 0
0 , z < 0
,
pois os controles otimos s ao u 0 para z 0 e u 1 para z > 0. A
fun c ao V obviamente n ao e continuamente diferenciavel em [0, T] R.
Note ainda que V e apenas localmente lipschitz contnua em [0, T] R.
2
O Teorema 204 n ao e em geral muito util na determina c ao do con-
trole otimo, pois a fun c ao valor otimo e, a princpio, desconhecida. En-
tretanto, o teorema nos permite intuir que a fun c ao valor otimo pode
ser denida pela equa c ao diferencial parcial
(12.9)
V
t
(t, z) + min
u
_
V
z
(t, z), f(t, z, u)
_
+ L(t, z, u)
_
= 0.
steuer
2008/3/11
page 279
i
i
i
i
i
i
i
i
[SEC. 12.3: EQUAC
Resultados dessa natureza s ao conhecidos na literatura como teoremas
de verica c ao. A m de analisarmos tais resultados, denimos, como no
Captulo 10, a fun c ao de Hamilton
H : [0, T] R
n
R
n
R
m
R,
(t, z, , u) , f(t, z, u)) + L(t, z, u)
e a fun c ao auxiliar
H : [0, T] R
n
R
n
R,
(t, z, ) min
u
, f(t, z, u)) + L(t, z, u).
Teorema 206. Suponha que H1), . . . , H5) s ao satisfeitas. Seja W :
[0, T] R
n
R uma aplica c ao continuamente diferenci avel satisfazendo
(12.10)
W
t
(t, z) + min
u
_
W
z
(t, z), f(t, z, u)
_
+L(t, z, u) = 0,
em (t, z) (0, T) R
n
e ainda a condi c ao nal
(12.11) W(T, z) = 0, z R
n
.
Ent ao, dado (t
0
, z
0
) [0, T] , um controle u U
ad
[t
0
, T] e sua tra-
jet oria correspondente z := z
u
formam um processo otimo para P(t
0
, z
0
)
se
H(t, z(t),
W
z
(t, z(t)), u(t)) = H(t, z(t),
W
z
(t, z(t))), t [t
0
, T].
Neste caso, ao longo da trajet oria otima temos
W(t, z(t)) = V (t, z(t)), t [t
0
, T].
Demonstra c ao: Seja t [t
0
, T), u U
ad
[t, T] um controle admissvel
para P(t, z(t)) e z := z
u
. Temos ent ao
J(t, z(t); u, z)
=
_
T
t
L(r, z(r), u(r)) dr
=
_
T
t
L(r, z(r), u(r)) dr + W(t, z(t)) +
_
T
t
d
dr
W(r, z(r)) dr
=
_
T
t
_
L(r, z(r), u(r)) +
W
dr
(r, z(r)) +H(r, z(r),
W
z
(r, z(r))
_
dr
+W(t, z(t)) W(t, z(t)),
steuer
2008/3/11
page 280
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
onde a ultima desigualdade e conseq uencia de (12.10). De forma analoga,
obtemos
W(t, z(t)) = W(t, z(t)) +
_
T
t
_
L(r, z(r), u(r)) +
d
dr
W(r, z(r))
_
dr
= W(T, z(T)) +
_
T
t
L(r, z(r), u(r)) dr
= J(t, z(t); u, z).
Como o controle u U
ad
[t, T] e arbitrario, temos que W(t, z(t)) =
J( z, u; t, z(t)) = V (t, z(t)) e o teorema segue.
A equa c ao (12.10) e a conhecida equa c ao de HamiltonJakobi
Bellman (HJB). A equa c ao leva o nome dos tres pioneiros que con-
tribuiram para o seu desenvolvimento com as seguintes abordagens:
Hamilton obteve resultados relacionando o calculo variacional e a me-
c anica classica (fun c ao de Hamilton); Jakobi investigou a teoria de con-
di c oes sucientes no calculo variacional (campos de trajetorias); Bell-
man trouxe esses resultados para a programa c ao din amica e chegou à
formula c ao aqui apresentada. Note que podemos utilizar a fun c ao de
Hamilton para reescrever a equa c ao HJB na forma
(12.12)
V
t
(t, z) + H(t, z,
V
z
(t, z)) = 0, (t, z) (0, T) R
n
(compare com a condi c ao de maximo do Teorema 178).
Caso a fun c ao valor n ao seja diferenciavel, e possvel usar resultados
da chamada an alise n ao suave para, ainda assim, caracterizar a fun c ao
valor como solu c ao da equa c ao HJB. Neste caso tanto os conceitos de
derivada, quanto os de solu c ao de uma equa c ao diferencial s ao diferen-
tes dos usados no Teorema 206: o conceito de derivada corresponde às
derivadas de Dini enquanto que para a equa c ao HJB usa-se os conceitos
de subsolu c ao e supersolu c ao de Dini. O leitor interessado encontra
maiores detalhes em [BaCa] ou [CLSW]. Em particular, o Captulo 4 de
[CLSW] e dedicado a aplica c oes da analise n ao suave à teoria de controle
otimo e a programa c ao din amica. Em [BaCa] s ao tratados problemas
de controle otimo em horizonte innito de tempo (veja Sec c ao 10.2 e
Aplica c ao 190). Em ambas as referencias acima, assim como em [BLS2],
e vericado o fato dos conceitos de solu c ao de Dini e solu c ao viscosa
(veja Captulo 13) coincidirem.
steuer
2008/3/11
page 281
i
i
i
i
i
i
i
i
[SEC. 12.3: EQUAC
Observa cao 207. O Teorema 206 nos permite desenvolver um esquema
para calcular tanto o controle otimo, quanto a fun c ao valor:
Encontre U
(t, z, ) tal que

(12.13)
, f(t, z, U
(t, z, ))) + L(t, z, U
(t, z, ))
= inf
u
, f(t, z, u)) + L(t, z, u)
(aqui e um par ametro de U
).
Obtenha a solu c ao V = V (t, z) da equa c ao diferencial parcial (em
geral n ao linear):
(12.14)
V
t
+

V
z
, f(t, z, U
(t, z;
V
z
))
_
+ L(t, z, U
(t, z,
V
z
)) = 0,
com a condi c ao de contorno V (T, z) = 0, z R
n
.
Substitua :=
V
z
(t, z) na express ao de U
. Assim, o controle otimo

para P(t
0
, z
0
) e obtido na forma de controle de realimenta c ao:
u() := U
(, z(),
V
z
(, z())),
onde z(t) = z
0
+
_
t
t
0
f(r, z(r), u(r))dr.
Em muitos problemas de import ancia pratica, o esquema acima n ao
pode ser levado a cabo. Na Sec c ao 12.4 investigamos uma famlia espe-
cial de problemas (linear-quadraticos), para os quais o esquema acima
fornece efetivamente o controle otimo para qualquer condi c ao inicial.
2
Observa cao 208. O Teorema 206 nos leva a concluir que a programa c ao
din amica para problemas de controle contnuos se baseia na seguinte
estrutura:
V (t, z) := inf J(t, z; u, z
u
) [ u e admissvel para P(t, z);
V
t
(t, z) + H(t, z,
V
z
(t, z)) = 0, (t, z) (0, T) R
n
;
Condi c ao de contorno:
V (T, z) = 0, z R
n
.
Neste ponto, um paralelo com a programa c ao din amica para problemas
discretos e facilmente tra cado (veja Observa c ao 191). 2
steuer
2008/3/11
page 282
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
Observa cao 209. O item b) do Teorema 204 fornece condi c oes neces-
sarias para otimalidade de uma estrategia de controle. As condi c oes
de otimalidade discutidas no Captulo 10 (princpio do maximo) podem
ser obtidas a partir da equa c ao HJB, desde que determinadas hipoteses
sobre a regularidade de V e U
possam ser asseguradas (como vimos na

Observa c ao 205, n ao e de se esperar que a fun c ao valor seja, em geral,
continuamente diferenciavel).
Suponha que V e U
s ao continuamente diferenciaveis em seus res-

pectivos domnios de deni c ao. Derivando a equa c ao HJB em rela c ao a
z, obtemos
V
tz
+ f
z
V
z
+ U
z
f
u
V
z
+ V
zz
f + L
z
+ U
z
L
u
= 0.
Logo,
V
tz
V
zz
f = U
z
(f
u
V
z
+L
u
) + f
z
V
z
+ L
z
.
Quando o termo U
z
(f
u
V
z
+L
u
) e identicamente nulo, a fun c ao adjunta
denida por (t) := V
z
(t, z(t)) satisfaz
t
= f
z
V
z
L
z
,
que e a denominada equa c ao adjunta. Observando a regularidade das
fun c oes envolvidas, obtemos o seguinte conjunto de condi c oes necessarias
para otimalidade de um processo (z, u):
z
t
= +
H
, z(t
0
) = z
0
,
t
=
H
z
, (T) = 0,
H(t, z(t), (t), u(t)) = min
w
H(t, z(t), (t), w),
onde H = H(t, z, , u) e a fun c ao de Hamilton. O sistema acima para
as variaveis (z, ) e denominado sistema Hamiltoniano.
Para maiores detalhes sobre a rela c ao entre a programa c ao din amica
e o princpio do maximo, consulte [FlRi, Sec c ao 4.8]. 2
Exemplo 210. Calculamos neste exemplo a fun c ao valor otimo para o
problema na Observa c ao 198:
_
_
Minimizar J(t
0
, z
0
; u, z) :=
_
1
t
0
_
z
2
(s) + (u
2
(s) 1)
2
ds
sujeito a
z
t
(s) = u(s), q.s. em [t
0
, 1], z(t
0
) = z
0
,
u L
1
([t
0
, 1]; R) [ u(t) R q.s. em [t
0
, 1],
steuer
2008/3/11
page 283
i
i
i
i
i
i
i
i
[SEC. 12.3: EQUAC
onde t
0
[0, 1]. Vericamos na Observa c ao 198 que V (0, 0) = 0. Um
argumento analogo nos permite concluir que V (t
0
, 0) = 0 e ainda que
n ao existe estrategia otima para o problema P(t
0
, 0).
Se z
0
,= 0 e [z
0
[ < 1 t
0
, o controle u com u(s) = sign(z
0
),
s [t
0
, ], onde = t
0
+[z
0
[ < 1, nos permite atingir o estado z() = 0.
A partir da, argumentamos como no problema P(, 0) para concluir que
n ao existe estrategia otima.
Se z
0
,= 0 e [z
0
[ > 1 t
0
, e facil vericar que o controle dado por
u(s) = sign(z
0
), s [t
0
, 1] e otimo para P(t
0
, z
0
).
A argumenta c ao acima nos permite calcular a fun c ao valor otimo:
V (t, z) =
_
_
_
1
3
[z[
3
, [z[ < 1 t
0 , z = 0
1
3
[z[
3
1
3
([z[ +t 1)
3
, [z[ > 1 t
.
A equa c ao HJB se escreve como
4
V
t

V
z
+ z
2
= 0, (t, z) [0, 1] R.
A verica c ao do fato de P(t
0
, z
0
) n ao possuir solu c ao para [z
0
[ < 1 t
0
pode ainda ser feita atraves do Teorema 206, pois n ao existe controle
admissvel u tal que o mnimo na equa c ao HJB (12.10) (substituindo W
por V ) ocorra em w = u(t). 2
Exemplo 211. Calculamos neste exemplo a fun c ao valor otimo para o
problema
_
_
Minimizar J(t
0
, z
0
; u, z) :=
_
1
t
0
z
2
(s) ds
sujeito a
z
t
(s) = u(s), q.s. em [t
0
, 1]; z(t
0
) = z
0
,
[u(t)[ 1 q.s. em [t
0
, 1].
A fun c ao de Hamilton e a fun c ao auxiliar H s ao dadas por
H(t, z, u, ) = u + z
2
e H(t, z, ) = [[ + z
2
.
4
Como H(t, z, u, ) = , f(t, z, u)) +L(t, z, u) = u +z
2
+ (u 1)
2
, temos
1(t, z, ) = min
u
|H(t, z, u, ) = [[ + z
2
.
steuer
2008/3/11
page 284
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
Portanto, U
e dado por
U
(t, z, ) =
_
sign() , ,= 0
? , = 0
.
A equa c ao HJB e dada por
V
t

V
z
+ z
2
= 0, (t, z) [0, 1] R,
e a condi c ao de contorno e V (1, z) = 0, z R. Resolvendo a equa c ao
diferencial, encontramos a fun c ao valor otimo
V (t, z) =
_
1
3
[z[
3
, t +[z[ < 1
1
3
[z[
3
1
3
([z[ +t 1)
3
, t +[z[ 1
.
2
Exemplo 212. Nos problemas de controle relacionados com o calculo
variacional, e possvel deduzir a equa c ao de EulerLagrange a partir do
sistema Hamiltoniano apresentado na Observa c ao 209 (compare com o
Exemplo 1.2.8). Considere o seguinte problema:
_
_
_
Minimizar I(z) :=
_
t
1
t
0
L(t, z(t), z
t
(t)) dt
sujeito a
z
t
= u, z(t
0
) = z
0
, z(t
1
) = z
1
.
Podemos analisa-lo no contexto dos problemas de controle, denindo
f(t, z, u) = u e impondo a condi c ao nal (t
1
, z
1
) = 0, onde (t, z) =
(t t
1
, z z
1
). Se z e uma trajetotia otima para o problema, a variavel
adjunta correspondente satisfaz a equa c ao diferencial
t
(t) = L
z
(t, z(t), z
t
(t)).
A condi c ao U
z
(f
u
V
z
+ L
u
) = U
z
(V
z
+ L
u
) 0 (ver Observa c ao 209) e
satisfeita se exigirmos V
z
= L
u
. Logo, da deni c ao da variavel adjunta
temos
t
(t) =
d
dt
_
V
z
_
=
d
dt
_
L
u
_
.
Substituindo na equa c ao adjunta, temos
L
z

d
dt
_
L
z
t
_
= 0,
que e a equa c ao de EulerLagrange para o problema variacional. 2
steuer
2008/3/11
page 285
i
i
i
i
i
i
i
i
[SEC. 12.4: PROBLEMA DE CONTROLE LINEAR-QUADR
ATICO 285
Exemplo 213. Neste exemplo calculamos o controle otimo para o pro-
blema
_
_
Minimizar J(u, z) :=
_
2
0
[tz(t)
2
+u(t)
2
)] dt
sujeito a
[u(s)[ 1/2 q.s. em [0, 2]
z
t
= u, z(0) = 1
Como o tempo nal e xo, escolhemos em nossa formula c ao (t
1
, z) :=
t
1
2. Este e um problema especial em que a equa c ao diferencial da
din amica e linear e a fun c ao objetivo e quadratica e estritamente con-
vexa. Na Sec c ao 12.4, verica-se que essas condi c oes s ao sucientes para
garantir tanto existencia quanto unicidade de solu c oes para o problema
de controle. A equa c ao HJB se escreve:
W
t
(t, z) + min
[u[1/2
_
W
z
(t, z)u + tz
2
+ u
2
_
= 0,
de onde obtemos:
2U
(t, z; ) =
_
_
_
1 , < 1
, 1 1
1 , > 1
.
Substituindo U
na equa c ao HJB, obtemos para a fun c ao valor otimo

uma equa c ao diferencial parcial n ao linear de difcil solu c ao. Uma vez
resolvida esta equa c ao, podemos encontrar o controle otimo usando a
estrategia descrita na Observa c ao 207. Desta forma, obtemos
u(t) =
_
1/2 , t [0, 1]
t/2 1 , t [1, 2]
como sendo a unica solu c ao do problema. 2
12.4 Problema de Controle Linear-Quadratico
Com o objetivo de ilustrar as ideias aqui investigadas, iniciamos a
sec c ao considerando o seguinte problema de controle:
_
_
Minimizar J(t
0
, z
0
; u, z) :=
1
2
_
1
t
0
qu(t)
2
dt +
1
2
z(1)
2
sujeito a
u U
ad
[t
0
, 1] := L
1
([t
0
, 1]; R
m
),
z
t
= z +u(t), q.s. em [t
0
, 1], z(t
0
) = z
0
,
steuer
2008/3/11
page 286
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
com condi c ao inicial (t
0
, z
0
) [0, 1] R
n
. Tal problema e denominado
P(t
0
, z
0
). A hipotese q > 0 reete o fato da execu c ao de uma estrategia
de controle estar associada a custos. A fun c ao de Hamilton e dada por:
H(t, z, u, ) = , f(t, z, u)) + L(t, z, u) = (z +u) +
1
2
qu
2
,
de onde obtemos
H(t, z, ) = z

2
2q
.
A equa c ao HJB se escreve
V
t
(t, z) + z
V
z
(t, z)
1
2q
_
V
z
(t, z)
_
2
= 0
e as condi c oes de contorno s ao
V (1, z) =
1
2
z
2
, z R.
A m de determinar a fun c ao valor, supomos que esta se deixa escrever
na forma
V (t, z) :=
1
2
v(t)z
2
, (t, z) [0, 1] R.
Substituindo na equa c ao HJB, obtemos para v o problema de valor ini-
cial:
_
v
t
=
v
2
q
2v
v(1) = 1
.
Atraves do metodo de separa c ao de variaveis encontramos a solu c ao:
v(s) =
2qe
2(1s)
e
2(1s)
+ (2q 1)
, s [0, 1].
Uma vez conhecida a fun c ao valor, podemos calcular a estrategia otima
de controle e a respectiva trajetoria otima para o problema P(0, z
0
).
Obtemos desta forma
u(t) = U
(t, z,
V
z
(t, z)) =
v(t)
q
z, (t, z) [0, 1] R
(note que U
(t, z, ) = /q). O controle otimo e assim obtido na forma

de controle de realimenta c ao de estado.
5
5
E possvel provar que u e unico pois, como q > 0, a fun c ao objetivo e estritamente
convexa em u.
steuer
2008/3/11
page 287
i
i
i
i
i
i
i
i
ATICO 287
Analisamos agora a famlia de problemas de controle com din amica
linear e fun c ao objetivo quadratica. Considere o funcional
J(t
0
, z
0
; z, u) :=
1
2
z(T), Dz(T))
+
1
2
T
_
t
0
_
(z(t), u(t)),
_
M(t) R(t)
R(t)
N(t)
__
z(t)
u(t)
_
_
dt,
(onde z = z
u
) e o problema de controle
P(t
0
, z
0
)
_
_
Minimizar J(t
0
, z
0
; u, z)
sujeito a
u U
ad
:= L
1
([t
0
, T]; R
m
),
z
t
= A(t)z +B(t)u, z(t
0
) = z
0
,
onde t
0
[0, T], z
0
R
n
, A, M : [0, T] R
n,n
, B, N : [0, T] R
n,m
, R :
[0, T] R
m,m
e D R
n,n
. Consideramos na formula c ao do problema
as seguintes hipoteses:
A1) N ao s ao feitas restri c oes às variaveis de controle ( = R
m
);
A2) O tempo nal T e xado;
A3) As aplica c oes A, B, M, N, R s ao contnuas;
A4) D e positiva semidenida e N e positiva denida para todo t
[t
0
, t
1
];
A5)
_
M(t) R(t)
R(t)
N(t)
_
e positiva semidenida para todo t [0, T].
Observa cao 214. A exigencia N(t) > 0 substitui a ausencia de restri-
c oes no controle, enquanto que as hipoteses sobre D e (
M R
R
N
) asseguram
que a fun c ao objetivo representa os custos correspondentes à execu c ao
de uma estrategia de controle.
2
Note que o problema linear-quadratico pode ser tratado seguindo a
abordagem apresentada na Observa c ao 207. A fun c ao de Hamilton, que
e dada por
H(t, z, u, ) := , A(t)z +B(t)u) +
1
2
_
z, M(t)z) + z, R(t)u)
+ u, R
(t)z) + u, N(t)u)
_
,
steuer
2008/3/11
page 288
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
depende quadraticamente da variavel de controle. Portanto, temos
6
U
(t, z, ) = N
1
(t) (B
(t) + R
(t)z),
de onde segue que
H(t, z, ) = , A(t)z B(t)N
1
(t)R
(t)z) +
1
2
z, M(t)z)
1
2
_
, B(t)N
1
(t)B
(t)) +z, R(t)N

1
(t)R
(t)z)
_
e a equa c ao HJB se escreve
V
t
+
_
V
z
, A(t)z B(t)N
1
(t)R
(t)z
_
1
2
_
V
z
, B(t)N
1
(t)B
(t)
V
z
_
+
1
2
_
z, M(t)z) z, R(t)N
1
(t)R
(t)z)
= 0.
Fazemos agora a hipotese mais importante do desenvolvimento, que nos
permite efetivamente determinar V . Suponha que a fun c ao valor para o
problema linear-quadratico e da forma:
V (t, z) :=
1
2
z, Q(t)z), (t, z) [0, T] R
n
,
onde Q : [0, T] R
n,n
e continuamente diferenciavel. Como a fun c ao
objetivo representa somente custos (i.e. J 0), podemos supor ainda
que Q(t) e positiva semidenida para todo t [0, T]. Substituindo a
express ao de V na equa c ao HJB, obtemos
7
0 = z, Y (t)z),
6
Observe que
H
u
(t, z, u, ) = B
(t) + R
(t) z + N(t) u.
7
No problema linear-quadr atico, a dependencia de U
em rela c ao ao multiplicador
de Lagrange pode ser retirada, pois por hip otese (t) = V
z
(t, z) = Q(t)z(t). Temos
assim
U
(t, z,
V
z
) = U
(t, z) = N(t)
1
(B
(t)Q(t) +R
(t)) z.
steuer
2008/3/11
page 289
i
i
i
i
i
i
i
i
ATICO 289
onde
Y (t) = Q
t
(t) + Q(t)A(t) + A
(t)Q(t) + M(t)
(Q(t)B(t) +R(t)) N(t)
1
(B
(t)Q(t) +R(t)).
A tarefa que se imp oe, portanto, e a de encontrar uma fun c ao matricial
Q tal que Y (t) 0. O teorema apresentado a seguir e o desdobramento
natural dos resultados ate aqui obtidos.
Teorema 215. Suponha que as hip oteses A1), . . . , A5) s ao satisfeitas.
Ent ao o problema linear-quadr atico P(t
0
, z
0
) possui como unica solu c ao
o par ( z, u), onde o controle otimo u e da forma
(12.15) u(s) = U
(s, z) := N(s)
1
(B
(s)Q(s)+R(s))z, s [t
0
, T].
A fun c ao matricial Q e solu c ao de
(12.16)
dQ
dt
=QA(t) A
(t)Q M(t)
+ (QB(t) +R(t)) N(t)
1
(B
(t)Q+R(t))
no intervalo (0, T) e satisfaz a condi c ao de contorno nal
(12.17) Q(T) = D.
Demonstra c ao: A solu c ao Qde (12.16), (12.17) esta unicamente denida
em um intervalo maximo de existencia (t
t
, T], com t
t
< T. Sabemos
ainda que Q e simetrica, pois todas as matrizes-coeciente da equa c ao
diferencial de Riccati o s ao (veja Exerccio 12.3).
Dena a fun c ao W : (t
t
, T] R
n
R por W(t, x) := x, Q(t)x) e con-
sidere o seguinte problema de controle:
P(s, x)
_
_
_
Minimizar z(T), Dz(T)) +
_
T
s
L(r, z(r), u(r)) dr
sujeito a
z
t
= A(r)z +B(r)u, z(s) = x,
onde
L(r, y, w) :=
_
(y w),
_
M(r) R(r)
R(r)
N(r)
__
y
w
__
, (r, y) (t
t
, T)R
n
.
Da escolha de Q como solu c ao de (12.16), conclumos que, para todo
(s, x) (t
t
, T) R
n
, vale
W
t
(s, x) + min
wR
m
__
W
x
(s, x), A(s)x +B(s)w
_
+ L(s, x, w)
_
= 0,
steuer
2008/3/11
page 290
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
sendo o mnimo atingido em w = U
(s, x) = N(s)
1
(B
(s)Q(s) +
R(s))x. Alem disso, temos ainda que W(T, x) = x, Dx), x R
n
.
Agora, dados (s, x) (t
t
, T) R
n
, denimos z : [s, T] R
n
como a
solu c ao do problema de valor inicial
z
t
= A(t)z + B(t)U
(t, z), z(s) = x,

e u : [s, T] R
m
e denido por u(t) := U
(t, z(t)). Ent ao, u e admissvel

para P(s, x) e z = z
u
. Do Teorema 206, conclumos que u e um controle
otimo para P(s, x) e que o custo otimo e dado por W(s, x). Portanto,
basta provarmos que t
t
t
0
para que o teorema que, a menos da
quest ao da unicidade, demonstrado. Da deni c ao de W, temos que
0 W(s, x) = x, Q(s)x), (s, x) (t
t
, T] R
n
.
Escolhendo para o problema P(s, x) o controle admissvel u 0 e de-
nominando a respectiva trajetoria por z, temos
x, Q(s) x) z(T), D z(T)) +
_
T
s
z(r)
M(r) z(r) dr c(s) [ x[

2
,
onde a constante c(s) depende somente das matrizes D, M e da ma-
triz de transi c ao
A
do sistema z
t
= A(t)z.
8
Como Q(s) e simetrica
semipositiva denida para s [t
0
, t
1
], segue da ultima desigualdade
|Q(s)| c := supc(r) [ r [0, T], s [0, T].
Portanto, o intervalo de existencia da solu c ao Q de (12.16) contem [0, T],
isto e t
t
t
0
. Provamos por m a unicidade de solu c oes para o problema
linear-quadratico. Seja u um controle otimo para P(t
0
, z
0
) e u ,= u um
controle admissvel qualquer para o mesmo problema. Dado > 0,
considere o controle admissvel
u
:= u + (u u).
Denotamos a trajetoria correspondente por z
:= z
u
e o custo associado
por I() := J(t
0
, z
0
; u
, z
). A aplica c ao I() n ao so e duas vezes

continuamente diferenciavel, como e quadratica, de onde segue
I() = I(0) +I
t
(0) +
1
2
2
I
tt
(0).
8
A constante c e calculada no Exerccio 12.2.
steuer
2008/3/11
page 291
i
i
i
i
i
i
i
i
ATICO 291
Note que I
t
(0) = 0, pois u e mnimo global de J (logo, = 0 e mnimo
local de I), enquanto que
I
tt
(0) =
_
T
t
0
(u(t) u(t)), N(t)(u(t) u(t))

_
dt.
Como N(t) e positiva denida para todo t [t
0
, T], ent ao
J(t
0
, z
0
; u
, z
) J(t
0
, z
0
; u, z
u
) = I() I(0) > 0.
Como u U
ad
e > 0 s ao arbitrarios, a unicidade ca provada.
A equa c ao (12.16) e denominada equa c ao diferencial de Riccati. Esta
equa c ao diferencial corresponde a uma forma particular da equa c ao de
EulerLagrange para os problemas linear-quadraticos.
Corolario 216. Seja u o controle otimo obtido no Teorema 215, z := z
u
sua trajet oria correspondente e Q a solu c ao da equa c ao diferencial de
Riccati (12.16). Dena a aplica c ao
: [t
0
.T] t Q(t) z(t) R
n
.
S ao v alidas as armativas:
a) A fun c ao

e solu c ao da equa c ao diferencial
t
(t) = A(t)
(t) M(t) z(t) R(t) u(t), t (t

0
, T);
b) A aplica c ao [t
0
, T] t
(t), z(t)) R dene a fun c ao valor otimo

sobre a trajet oria otima do problema linear-quadr atico, i.e.
(t), z(t)) = z(T), D z(T))

+
_
T
t
_
( z(t), u(t)),
_
M(t) R(t)
R(t)
N(t)
__
z(t)
u(t)
__
dt,
= J(t, z(t); u[
[t,T]
, z[
[t,T]
)
= V (t, z(t)),
para todo t [t
0
, T].
Demonstra c ao: Para provar a), basta substituir as express oes obtidas
para u e Q
t
em (12.15) e (12.16) na equa c ao
t
(t) = Q
t
(t) z(t) + Q(t) (A(t) z(t) +B(t) u).
Quanto ao item b), a armativa ja foi provada na demonstra c ao do
Teorema 215, quando vericamos que V (t, z) = z, Q(t)z), para (t, z)
[0, T] R
n
.
steuer
2008/3/11
page 292
i
i
i
i
i
i
i
i
AO DIN
AMICA CONT
INUA
Uma analise da solubilidade das equa c oes diferenciais de Riccati (n ao
somente as oriundas do problema linear-quadratico, como tambem a
equa c ao geral de Riccati) pode ser encontrada em [Bar, Captulo 5].
Corolario 217 (Princpio do Maximo). Seja u o controle otimo
fornecido pelo Teorema 215 para o problema P(t
0
, z
0
). Dena a aplica c ao
H : [0, T] R
n
R
n
R
m
R por
(12.18)
H(t, z, , u) :=, A(t)z +B(t)u)
+
1
2
_
(z, u),
_
M(t) R(t)
R(t)
N(t)
__
z
u
__
.
Ent ao o problema de valor de contorno
z
t
= +
H
(t, z, , u(t)), z(t

0
) = z
0
, (12.19)
t
=
H
z
(t, z, , u(t)), (T) = Dz(T) (12.20)
possui solu c ao ( z,
), a qual satisfaz
(12.21) H(t, z(t),
(t), u(t)) = min

uR
m
H(t, z(t),
(t), u), t [t
0
, T].
Demonstra c ao: Seja z a trajetoria correspondente ao controle u e es-
colha

de acordo com o Corolario 216. Um simples calculo prova que
(12.19), (12.20) s ao satisfeitas pelo par ( z,

). A equa c ao (12.21), por
sua vez, esta esta de acordo com o fato do controle otimo u satisfazer
(12.15).
Do Corolario 217 ca claro que a aplica c ao H denida em (12.18) e
a fun c ao de Hamilton para o problema P(t
0
, z
0
). No exemplo a seguir
estudamos a utiliza c ao desse corolario para determinar a solu c ao de um
problema escalar.
Exemplo 218. Considere o problema de controle otimo escalar:
_
_
_
Minimizar
_
T
0
(u(t)
2
+z(t)
2
) dt
sujeito a
z
t
= z +u, z(0) = z
0
.
As condi c oes (12.19), (12.20) e (12.21) nos levam às seguintes equa c oes:
z
t
= z +u, z(0) = z
0
,
t
= z, (T) = 0,
E
(t, z, ) = , t [0, T].

steuer
2008/3/11
page 293
i
i
i
i
i
i
i
i
ATICO 293
Eliminando u nas duas primeiras equa c oes, obtemos o sistema
_
z
t
= z , z(0) = z
0
,
t
= z +, (T) = 0.
Este problema de valor de contorno pode ser facilmente resolvido utili-
zando-se a teoria de sistemas lineares, pois a solu c ao geral deste tipo de
problema e conhecida. A equa c ao diferencial de Riccati e a condi c ao de
contorno se escrevem neste caso como
Q
t
+ 2QQ
2
= 1, Q(T) = 0.
Ou seja, a equa c ao diferencial de Riccati e escalar. Apesar de ser n ao
linear, podemos obter, atraves de uma mudan ca de variaveis, uma re-
presenta c ao implcita para Q = Q(t). De fato, se r
1
e r
2
s ao as razes
do polin omio r
2
2r 1 = 0, temos que
T t =
_
T
t
dt =
_
0
Q
ds
(s r
1
)(s r
2
)
=
1
r
2
r
1
__
0
Q
ds
s r
1
_
0
Q
ds
s r
2
_
,
que e a representa c ao procurada. 2
Observa cao 219. Em problemas do tipo linear-quadratico, as condi c oes
(12.19), (12.20) e (12.21) s ao sucientes para otimalidade de uma solu c ao
do problema de controle P(t
0
, z
0
). Para maiores detalhes, veja o Cap-
tulo 10 e a Sec c ao 9.4, onde s ao discutidas condi c oes sucientes para
otimalidade.
Essas condi c oes sucientes podem ser utilizadas para calcular uma
aproxima c ao numerica para a solu c ao de P(t
0
, z
0
). Para isto procedemos
da seguinte forma:
Elimine u do sistema (12.19), (12.20), denindo a fun c ao auxiliar E
u(t) = E
(t, z, ) := N(t)
1
(B(t)
+R(t)z);
Obtenha assim o problema de valor de contorno:
_
_
_
z
t
= +
H
(t, z, , E
(t, z, )), z(t

0
) = z
0
,
t
=
H
z
(t, z, , E
(t, z, )), (t
1
) = Dz(t
1
);
steuer
2008/3/11
page 294
i
i
i
i
i
i
i
i
294 EXERC
ICIOS
O problema resultante pode ser resolvido numericamente pelo procedi-
mento conhecido como metodo de shooting (veja Sec c ao A.6), utilizando-
se um algoritmo do tipo:
1. Encontre uma aproximac~ ao inicial
0
para (t
0
);
2. Resolva o problema de valor de contorno
_
_
_
z
t
= +
H
(t, z, , E
(t, z, )) , z(t
0
) = z
0
,
t
=
H
z
(t, z, , E
(t, z, )) , (t
0
) =
0
;
3. Aprimore a aproximac~ ao inicial (e.g., atraves do
metodo de
Newton) com o objetivo de satisfazer a equac~ ao
(t
1
) = Dz(t
1
);
4. Retorne ao passo 2;
2
Exerccios
12.1. Verique que a constante K em (12.1), (12.2) e da forma c
1
e
c
2
T
,
com c
i
> 0 dependendo apenas de K
1
e/ou de K
2
as constantes em
H1) e H3).
12.2. Mostre que a fun c ao c(s) usada para estimar as trajetorias do
problema linear-quadratico na demonstra c ao do Teorema 215 e da forma
c(s) = |D| |
A
(T, s)|
2
+
_
T
s
|M(r)| |
A
(t, r)|
2
dr.
12.3. Verique que uma solu c ao Q da equa c ao diferencial matricial de
Riccati (12.16) e simetrica.
12.4. Suponha que o conjunto dos controles R
m
seja, alem de
fechado, tambem limitado. Formule uma hipotese mais fraca do que H3),
que ainda permita vericar a Lipschitz continuidade (local) da fun c ao
valor.
steuer
2008/3/11
page 295
i
i
i
i
i
i
i
i
EXERC
ICIOS 295
12.5. Suponha que u U
ad
[0, T] e um controle otimo para o problema
P(0, z
0
). Prove que, para todo [0, T], a restri c ao u[
[0,]
e um controle
otimo para o problema
_
_
Minimizar
_
0
L(t, z(t), u(t)) dt
sujeito a
z(t) = z
0
+
_
t
0
f(s, z(s), u(s)) ds, t [0, ],
u L
1
([0, ]; R
m
), u(t) q.s. em [0, ],
(Tal resultado tambem e valido para problemas com horizonte innito;
veja Exerccio 12.11.)
12.6. Suponha que a fun c ao de Hamilton H(t, z, , u) = , f(t, z, u))+
L(t, z, u) e convexa.
a) Obtenha a partir da Observa c ao 209 uma condi c ao suciente para
otimalidade de uma estrategia de controle.
(Sugest ao: Observe a rela c ao entre H(t, z, , u) e o termo U
z
(f
u
V
z
+L
u
).)
b) Compare o resultado obtido no item a) com o Teorema 174.
12.7. Considere o problema de tempo mnimo
_
_
_
Minimizar t
1
sujeito a z
t
= z
1
4
uz 25u, z(0) = 80, z(t
1
) = 40,
0 u(t) 1, t [0, t
1
],
_
t
1
0
u(s)ds = 1.
Tal problema possui a seguinte interpreta c ao:
9
Em uma xcara com
cafe, inicialmente a 80
o
C, e despejado leite frio. A temperatura nal
da mistura cafe com leite deve ser de 40
o
C e a quantidade de leite e
limitada.
a) Interprete a equa c ao diferencial e as restri c oes do problema.
b) Transforme a restri c ao integral em uma equa c ao diferencial, obtendo
para esta condi c oes inicial e nal.
c) Obtenha a equa c ao de HamiltonJacobiBellman para o problema.
12.8. Calcule a solu c ao do problema
_
Minimizar
_
1
0
_
3z(t)
2
+u(t)
2
dt
sujeito a z
t
= z +u, z(0) = z
0
.
9
Especialmente interessante para matem aticos, conhecidos por transformarem cafe
em teoremas.
steuer
2008/3/11
page 296
i
i
i
i
i
i
i
i
296 EXERC
ICIOS
12.9. Dado T > 0, considere o problema
_
Minimizar z(T)
2
+
_
T
0
u(t)
2
dt
sujeito a z
t
= z +u, z(0) = 1.
a) Obtenha a equa c ao de HamiltonJacobiBellman.
b) Encontre a fun c ao valor otimo.
c) O que se pode armar sobre a fun c ao valor no limite T ?
12.10. Dados T > 0, a R
n
, A R
n,n
, B R
n,m
, considere o
problema
_
_
_
Minimizar a, z(T))
sujeito a z
t
= Az +Bu, z(0) = z
0
R
n
,
[u
i
[ 1, t [0, T], 1 i m.
a) Obtenha a equa c ao de HamiltonJacobiBellman.
b) Mostre que a fun c ao valor otimo e dada por
W(t, x) :=

a, e
A(tT)
x
_

_
T
t
m
i=1
a, e
A(sT)
b
i
_
ds,
onde B = (b
1
[ [b
m
).
c) Encontre o controle otimo para o problema.
_
Minimizar z
1
(1)
2
+z
2
(1)
2
+
_
1
0
u(t)
2
dt
sujeito a z
t
1
= z
2
, z
t
2
= u, (z
1
(0), z
2
(0)) = (1, 0).
a) Resolva a equa c ao diferencial de Riccati correspondente.
b) Calcule o controle otimo.
12.11. [Horizonte innito] Sejam A, M : R R
n,n
, B : R R
n,m
,
N : R R
m,m
, fun c oes matriciais continuamente diferenciaveis, com
M(t) > 0, N(t) > 0, t 0. Considere o problema linear-quadratico
10
_
_
_
_
0
[z, Mz) +u, Nu)] dt
sujeito a
z
t
= Az +Bu(t), t [0, ), z(0) = z
0
R
n
.
10
Para detalhes sobre programa c ao din amica em horizonte innito, veja [Leit]. Em
particular os problemas linear-quadr aticos em horizonte innito s ao considerados rm
[So].
steuer
2008/3/11
page 297
i
i
i
i
i
i
i
i
EXERC
ICIOS 297
a) Suponha que Q e solu c ao da equa c ao diferencial de Riccati
dQ
dt
= QA A
Q M + QBN
1
B
Q, t (, 0],
Q(0) = 0.
Dena Q(t) := Q(t) e obtenha uma equa c ao diferencial, cuja solu c ao
seja Q.
b) Mostre que V (0, z) = z, Q(T)z), onde V e a fun c ao valor para o
problema linear quadratico formulado no intervalo nito [0, T].
c) Prove que, para todo t
2
> t
1
0, temos z, Q(t
2
)z) z, Q(t
1
)z),
z R
n
.
d) Suponha que o sistema (A, B) e controlavel para todo t > 0. Prove
que o limite Q := lim
t
Q(t) existe.
(Sugest ao: Mostre que dado z
0
R
n
, a aplica c ao t z
0
, Q(t)z
0
) e
limitada superiormente por J(z
u
, u) para algum processo (z
u
, u) com
z
u
(0) = z).
e) Prove que a matriz Q, denida no item d), e solu c ao da equa c ao
algebrica de Riccati
11
QA A
Q M + QBN
1
B
Q = 0.
f ) Mostre que z
0
, Qz
0
) J(z
u
, u), para todo processo admissvel (z
u
, u)
com z
u
(0) = z
0
.
g) Verique que a fun c ao valor para o problema de horizonte innito e
V (z) = z, Qz).
h) Mostre que o controle otimo para o problema com horizonte innito
e dado pela lei de realimenta c ao u(t) = M(t)
1
B
Qz(t), t 0, e ainda
que J( z, u) < .
i) Prove que lim
t
z(t), Q z(t)) = 0, para todo z
0
R
n
.
j) Mostre que o controle u do item h) e o unico controle otimo para o
problema.
11
Para detalhes sobre a solubilidade da equa c ao algebrica de Riccati consulte [Bar],
captulo 5.
steuer
2008/3/11
page 298
i
i
i
i
i
i
i
i
298 EXERC
ICIOS
12.12. Suponha que u U
ad
[0, ) e o controle otimo para o problema
do Exerccio 12.11. Prove que, para todo [0, ), a restri c ao u[
[0,]
e
o controle otimo para o problema
_
_
_
Minimizar
_
0
[z, Mz) +u, Nu)] dt
sujeito a
z
t
= Az +Bu(t), t [0, ], z(0) = z
0
R
n
.
steuer
2008/3/11
page 299
i
i
i
i
i
i
i
i
Captulo 13
Soluc oes Viscosas e Funcao
Valor
Neste captulo estudamos o conceito de solu c oes de viscosidade de
equa c oes diferenciais parciais (ver [CrLi]). Em particular, estamos inte-
ressados nas solu c oes viscosas da equa c ao HJB, apresentada no Cap-
tulo 12. Nosso objetivo e considerar problemas de controle otimo, cuja
fun c ao valor correspondente e (Lipschitz) contnua e vericar que, nesses
casos, a fun c ao valor e a unica solu c ao de viscosidade da equa c ao HJB.
Na Sec c ao 13.1 e introduzido o conceito de solu c oes viscosas. Na
Sec c ao 13.2 analisamos a formula de HopfLax, um caso particular
da equa c ao de EulerLagrange quando o integrando da fun c ao obje-
tivo depende somente de z
t
. Na Sec c ao 13.3 vericamos que a fun c ao
valor e uma solu c ao de viscosidade da equa c ao HJB. Na Sec c ao 13.4 o
princpio do maximo e demonstrado para problemas com horizonte nito
(tempo nal xo) utilizando-se tecnicas de programa c ao din amica. Na
Sec c ao 13.5 provamos um resultado de unicidade para solu c oes viscosas
da equa c ao HJB.
13.1 Soluc oes Viscosas de EDPs
O conceito de solu c ao de viscosidade pode ser formulado para qual-
quer equa c ao diferencial parcial (EDP), linear ou n ao. Estamos parti-
steuer
2008/3/11
page 300
i
i
i
i
i
i
i
i
300 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
cularmente interessados no problema
t
v +H(t, x,
x
v) = 0, (t, x) (0, 1) R
n
, (13.1)
v(1, x) = g(x), x R
n
. (13.2)
O problema de solucionar a equa c ao (13.1) sujeito à condi c ao nal (13.2)
e, daqui para frente, denominado de problema (H, g). Inicialmente o
problema (H, g) e analisado sujeito às seguintes hipoteses:
H C([0, 1] R
n
R
n
; R), g C(R
n
; R).
Note que (13.1) e uma equa c ao diferencial de primeira ordem. Tal
equa c ao e, em geral, n ao linear. Este e certamente o caso quando (13.1) e
a equa c ao HJB associada a uma famlia de problemas de controle otimo.
Sendo assim, o metodo de curvas caractersticas n ao se aplica, da mesma
forma n ao se aplica uma abordagem variacional utilizando distribui c oes
e derivadas generalizadas. A alternativa de considerar solu c oes Lips-
chitz contnuas de (13.1) que, por serem diferenciaveis quase sempre
1
,
satisfazem a equa c ao diferencial a menos de um conjunto de medida (de
Lebesgue) nula, n ao e muito atraente, uma vez que podem existir muitas
dessas solu c oes.
Nos anos 80 foi desenvolvido por M.G. Crandall e P.L. Lions (medalha
Fields em 1996) um trabalho pioneiro na dire c ao de solubilidade de
equa c oes parciais n ao lineares. Por eles foi introduzido o conceito de
solu c oes de viscosidade, que n ao so possibilita um tratamento adequado
da equa c ao HJB para solu c oes n ao continuamente diferenciaveis, como
tambem abre caminho para a dedu c ao do princpio do maximo (veja
Sec c ao 13.4).
Deni cao 220. Uma fun c ao v : [0, 1] R
n
R e denominada solu c ao
viscosa da equa c ao (13.1) quando satisfaz:
a) v e contnua;
b) Para toda C
1
((0, 1) R
n
; R) tal que v possui um maximo
local em (t, x) (0, 1) R
n
, temos
t
(t, x) +H(t, x,
x
(t, x)) 0.
c) Para toda C
1
((0, 1) R
n
; R) tal que v possui um mnimo
local em (t, x) (0, 1) R
n
, temos
t
(t, x) +H(t, x,
x
(t, x)) 0.
1
Consulte o teorema de Hademacher, por exemplo em [Mo].
steuer
2008/3/11
page 301
i
i
i
i
i
i
i
i
[SEC. 13.1: SOLUC

OES VISCOSAS DE EDPS 301
Caso satisfa ca somente a) e b), a fun c ao v e denominada sub-solu c ao
viscosa. Caso v satisfa ca somente a) e c), e denominada super-solu c ao
viscosa. As fun c oes utilizadas na caracteriza c ao das solu c oes viscosas
s ao as chamadas fun c oes teste. 2
Observa cao 221. Na literatura, muitas vezes e utilizada na deni c ao
das solu c oes viscosas, ao inves da condi c ao a), a exigencia: v uni-
formemente contnua e limitada. No contexto da teoria de controle tal
exigencia e por demais restritiva, pois o domnio de deni c ao de v e
ilimitado. O carater da Deni c ao 220 e estritamente local e e de simples
verica c ao o fato de que, uma fun c ao v que a satisfa ca, tambem satisfara
a outra variante em qualquer subconjunto compacto de [0, 1] R
n
.
Na Deni c ao 220 podemos usar como espa co de fun c oes teste
C
((0, 1) R
n
; R), ao inves de C
1
((0, 1) R
n
; R) e, ainda assim, obter
o mesmo conceito de solu c ao (veja Lema 222).
E possvel denir solu c oes viscosas para equa c oes diferenciais parciais
genericas de primeira e segunda ordem. Isto entretanto foge aos nossos
objetivos. O leitor interessado deve consultar [FlSo]. 2
Como qualquer novo conceito de solu c ao, a teoria de solu c oes viscosas
tem como objetivo natural a investiga c ao dos seguintes temas:
1. Esclarecimento de quest oes inerentes ao conceito de solu c ao, como:
existencia, unicidade, estabilidade (dependencia contnua de con-
di c oes iniciais);
2. Utiliza c ao do conceito na teoria de controle, a m de esclarecer as
seguintes perguntas:
A fun c ao valor e uma solu c ao viscosa de HJB? O princpio do
maximo pode ser novamente obtido?
Neste captulo investigamos o conceito de solu c oes viscosas exclusiva-
mente no contexto da teoria de controle otimo. Existem aplica c oes
extremamente interessantes desta teoria para equa c oes parciais n ao li-
neares de segunda ordem (como o metodo da viscosidade esvanescente).
O leitor interessado na teoria de EDPs pode encontrar maiores deta-
lhes na obra de J.L. Lions (veja por exemplo [Li]). A origem do termo
viscosidade e esclarecida no nal desta sec c ao.
Lema 222. Seja u : R
m
R contnua e diferenci avel no ponto x
0

R
m
. Ent ao existe C
1
(R
m
) tal que u(x
0
) = (x
0
) e u possui
steuer
2008/3/11
page 302
i
i
i
i
i
i
i
i
302 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
um mnimo local estrito em x
0
.
Demonstra c ao: Podemos supor sem perda de generalidade que x
0
= 0,
u(x
0
) = 0, u(x
0
) = 0 (de fato, caso contrario basta provar o teorema
para u(x) := u(x+x
0
) u(x
0
) u(x
0
), x)). Das hipoteses, temos que
u(x) = [x[v(x), x R
n
, com lim
x0
v(x) = 0.
Dena
(r) := max
[x[r
[v(x)[, r 0.
Logo, e contnua, monotona n ao decrescente e (0) = 0. Dena agora
: R
m
R por
(x) :=
_
2[x[
[x[
(r)dr +[x[
2
.
De [(x)[ [x[(2[x[) +[x[
2
, x R
n
, segue que
(0) = 0, (0) = 0.
Para x ,= 0, temos
(x) = 2x[x[
1
(2[x[) x[x[
1
([x[) + 2x.
Podemos ent ao concluir que C
1
(R
m
). Agora, para x ,= 0, temos
u(x) (x) = [x[v(x)
_
2[x[
[x[
(r)dr [x[
2
[x[([x[)
_
2[x[
[x[
(r)dr [x[
2
[x[
2
.
Logo,
u(x) (x) < 0 = u(0) (0), x ,= 0,
completando a demonstra c ao.
Teorema 223. Seja v uma solu c ao viscosa de (13.1), tal que v e dife-
renci avel no ponto (t
0
, x
0
) (0, 1) R
n
. Ent ao temos
t
v(t
0
, x
0
) +H(t
0
, x
0
,
x
v(t
0
, x
0
)) = 0.
Demonstra c ao: Aplicando o Lema 222, temos que existe C
1
(R
R
n
), tal que v possui um mnimo local em (t
0
, x
0
). Esta fun c ao
steuer
2008/3/11
page 303
i
i
i
i
i
i
i
i
[SEC. 13.1: SOLUC

e agora convoluida com um mollier
2
, gerando uma fun c ao
(R R
n
) da seguinte forma:
(t, x) := (
)(t, x)
:=
_

_
R
n
(t , x )(, )dd, (t, x) R R

n
.
Temos assim a convergencia
,
t

t
,
x
uniforme em uma vizinhan ca compacta A de (t

0
, x
0
). Portanto, v
possui um maximo (t
, x
) em A.

E facil ver que (t
, x
) (t
0
, x
0
). Da
Deni c ao 220 segue que
(t
, x
) +H(t
, x
,
x
(t
, x
)) 0.
Tomando o limite quando 0, obtemos
t
(t
0
, x
0
) +H(t
0
, x
0
,
x
(t
0
, x
0
)) 0.
Entretanto, como
t
(t
0
, x
0
) =
t
v(t
0
, x
0
),
x
(t
0
, x
0
) =
x
v(t
0
, x
0
),
ca provado que
t
v(t
0
, x
0
) +H(t
0
, x
0
,
x
v(t
0
, x
0
)) 0.
A desigualdade
t
v(t
0
, x
0
) +H(t
0
, x
0
,
x
v(t
0
, x
0
)) 0
e provada de forma analoga.
Deni cao 224. Seja A R
n
aberto e F : A R uma aplica c ao
contnua. Os conjuntos
+
F(x) := p R
n
[ limsup
yx
(F(y) F(x) p, y x)) [y x[
1
0,
F(x) := p R
n
[ liminf
yx
(F(y) F(x) p, y x)) [y x[
1
0
s ao denominados respectivamente de superdiferential e subdiferential de
F no ponto x A. 2
2
Denominamos por mollier as fun c oes C
(R R
n
) que satisfazem
_
R
_
R
n
(t, x) dtdx = 1. Maiores detalhes sobre essas fun c oes, assim como sobre a
opera c ao de convolu c ao de fun c oes s ao encontrados em [Ru2].
steuer
2008/3/11
page 304
i
i
i
i
i
i
i
i
304 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
As deni c oes acima correspondem à tentativa de recuperar o con-
ceito de derivada para aplica c oes n ao suaves. Os conjuntos
+
F(x) e
F(x) contem elementos que servem a este proposito. Note que os

casos
+
F(x) = ,
F(x) = n ao est ao excludos. Entretanto, para

aplica c oes Lipschitz contnuas a possibilidade que isto n ao aconte ca au-
menta drasticamente. Este e um dos pontos de interesse da denominada
an alise n ao suave. No contexto da analise convexa esta quest ao esta
bem esclarecida.
Para fun c oes de varias variaveis utilizamos ainda a no c ao de
sub(super)diferenciais parciais
+
x
F(x, y) ou
y
F(x, y), . . . , sendo esses
denidos de forma obvia.
Lema 225. Seja v : [0, 1] R
n
R contnua. S ao equivalentes as
arma c oes:
a) v e solu c ao viscosa de (13.1);
b) Os conjuntos
+
v(t, x),
v(t, x) satifazem:
b.1) q +H(t, x, p) 0, (q, p)
+
v(t, x), (t, x) (0, 1) R
n
;
b.2) q +H(t, x, p) 0, (q, p)
v(t, x), (t, x) (0, 1) R

n
.
Demonstra c ao: (a) = (b) Seja (t, x) (0, 1) R
n
e (q, p)
+
v(t, x).
Construmos a seguir uma fun c ao teste , com (q, p)
+
(t, x) e
v(s, y) (s, y) v(t, x) (t, x), para todo (s, y) em uma vizinhan ca
adequada. Para tanto considere:
v(s, y) v(t, x) q(t s) p, y x
max
v(s, y) v(t, x) q(s t) p, y x

|s t| + |y x|
, 0
(|s t| + |y x|)
2(s,y)
(s,y)
sup
0<(s
,y
)r
max
v(s
, y
) v(t, x) q(s
t) p, y
x
|s
t| + |y
x|
, 0
dr
,
onde (s, y) :=
_
[s t[
2
+[y x[
2
. Dena
g(s, y) :=
v(s, y) v(t, x) q(s t) p, y x)
[s t[ +[y x[
,
para (s, y) > 0 e
G(s, y) :=
_
sup0, g(s, y) , se (s, y) > 0
0 , sen ao.
steuer
2008/3/11
page 305
i
i
i
i
i
i
i
i
[SEC. 13.1: SOLUC

Note que G e contnua, pois (q, p)
+
v(t, x). Agora dena
h(r) := sup
0(s,y)r
G(s, y), r 0.
Obviamente h e contnua. Dena ainda atraves de
(s, y) := q(s t) +p, y x) +
_
2(s,y)
(s,y)
h(r
t
)dr
t
.
Logo, C
1
((0, 1) R
n
; R) e, da constru c ao acima, segue que
v(s, y) (s, y) v(t, x) (t, x) (s, y) (0, 1) R
n
.
(Note que a constru c ao acima pode ser antecipada a partir do Lema 222.)
Como v e uma solu c ao viscosa, o item b.1) segue agora da deni c ao de
. A desigualdade no item b.2) e obtida de forma analoga.
(b) = (a) Seja (t, x) (0, 1) R
n
e C
1
((0, 1) R
n
; R) uma fun c ao
teste, tal que v posui um maximo local em (t, x). Sem perda de
generalidade temos
v(s, y) (s, y) v(t, x) (t, x) (s, y) [0, 1] R
n
.
Seja (q, p)
+
(t, x). Como e diferenciavel, o conjunto
+
(t, x) e
constituido de exatamente um elemento: a derivada de (veja Lema 226
a seguir). Temos ent ao
limsup
(s,y)(t,x)
v(s, y) v(t, x) q(s t) p, y x)
[s t[ +[y x[
limsup
(s,y)(t,x)
(s, y) (t, x) q(s t) p, y x)
[s t[ +[y x[
= 0.
Portanto, (q, p)
+
v(t, x) e, da desigualdade no item b.1), segue que
t
(t, x) +H(t, x,
x
(t, x)) 0.
Assim, ca provada a desigualdade b) da Deni c ao 220. A desigualdade
c) desta deni c ao e provada de forma analoga. Logo, v e uma solu c ao
viscosa de (13.1).
steuer
2008/3/11
page 306
i
i
i
i
i
i
i
i
306 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
Lema 226. Seja v : [0, 1] R
n
R contnua. S ao verdadeiras as
armativas:
a)
+
v(t, x),
v(t, x) s ao convexos para todo (t, x) [0, 1] R

n
;
b) Se v e diferenci avel em (t, x) (0, 1) R
n
, ent ao
+
v(t, x) =
v(t, x) =
_
_
v
t
(t, x),
v
t
(t, x)
_
_
;
c) Se v e lipschitz contnua em [0, 1] R
n
, i.e. v satisfaz
[v(s, y) v(t, x)[
_
[s t[
2
+[y x[
2
, (s, y) [0, 1] R
n
para algum 0, ent ao
_
q
2
+[p[
2
,
para todo (q, p)
+
v(t, x)
v(t, x), (t, x) (0, 1) R

n
.
Demonstra c ao: O item a) segue imediatamente das deni c oes de sub
e superdiferencial, da mesma forma que o item b). A m de provar c),
tome (q, p)
+
v(t, x). Temos ent ao
+ (q
2
+[p[
2
)
1/2
= + sup
(h,z)R
n+1
qh p, z)
(h
2
+[z[
2
)
1/2
= + limsup
(h,z)0
qh p, z)
(h
2
+[z[
2
)
1/2
limsup
(h,z)0
v(t +h, x +z) v(t, x) qh p, z)
(h
2
+[z[
2
)
1/2
0,
onde e a constante de Lipschitz de v. Um resultado analogo e obtido
para o caso (q, p)
v(t, x), completando assim a demonstra c ao.

Fica assim claro que, nos pontos em que uma solu c ao viscosa de
(13.1) e diferenciavel, ela satisfaz a equa c ao diferencial no sentido classico.
Note ainda que, caso v possua um maximo local em (t
0
, x
0
), pode-
mos (no que diz respeito à deni c ao das solu c oes de viscosidade) supor
que este maximo e estrito. De fato, denindo a fun c ao
(t, x) := (t, x) +([x x
0
[
2
+[t t
0
[
2
), ( onde > 0),
temos que v possui um maximo local estrito em (t
0
, x
0
) e ainda que
os gradientes de e coincidem no ponto (t
0
, x
0
).
steuer
2008/3/11
page 307
i
i
i
i
i
i
i
i
[SEC. 13.2: F
ORMULA DE HOPFLAX 307

Conclumos esta sec c ao fazendo uma referencia à origem do termo
viscosidade, utilizado na Deni c ao 220. Uma vez formulado o pro-
blema (13.1), (13.2), considere o seguinte problema auxiliar (do tipo
parabolico):
v
+
t
v
+ H(t, x,
x
v
) = 0, (t, x) (0, 1) R
n
, (13.3)
v
(1, x) = g(x), x R
n
. (13.4)
Com hipoteses relativamente fracas sobre a regularidade de H e g e
possvel garantir, para cada > 0, a existencia de uma solu c ao suave
v
. Como nos modelos relacionados à uido-din amica, o termo v esta

associado com a viscosidade do uido (onde v representa um campo
de velocidades), a estrategia de aproximar a solu c ao de (13.1), (13.2)
introduzindo o termo de viscosidade articial v
e fazendo 0 e
conhecida como metodo da viscosidade esvanescente.
Dena v como o limite (localmente uniforme) da seq uencia v
. Dada
uma fun c ao teste C
((0, 1)R
n
; R) tal que v possui um maximo
local no ponto (t
0
, x
0
), ent ao v
possuem maximos locais nos pontos

(t
, x
) e ainda lim
0
t
= t
0
, lim
0
x
= x
0
. Da segue que
t
v
(t
, x
) =
t
(t
, x
),
x
v
(t
, x
) =
x
(t
, x
),
v
(t
, x
) (t
, x
),
de onde obtemos
t
v
(t
, x
) +H(t
, x
,
x
(t
, x
)) = v
(t
, x
) (t
, x
).
Como conseq uencia da convergencia (localmente) uniforme v
v,
temos
t
(t
, x
) +H(t
, x
,
x
(t
, x
)) 0,
de onde segue a desigualdade utilizada na Deni c ao 220.
13.2 F ormula de HopfLax
Nesta sec c ao, consideramos sob a otica da programa c ao din amica um
problema comum ao calculo variacional e à teoria de controle otimo.
P(t, x)
_
_
_
Minimizar
_
1
t
L(z
t
(s))ds + g(z(1))
sujeito a z(t) = x
steuer
2008/3/11
page 308
i
i
i
i
i
i
i
i
308 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
Por V (t, x) denominamos a fun c ao valor associado ao problema P(t, x),
[0, 1] R
n
(t, x) V (t, x) R. Consideramos o problema fomulado
com as seguintes hipoteses:
L1) A fun c ao L e convexa e coerciva, i.e. lim
[q[
L(q)
[q[
= ;
L2) A fun c ao g e Lipschitz contnua (com constante de Lipschitz l
g
).
Denimos agora
W(t, x) := inf
yR
(1 t)L((y x)/(1 t)) +g(y), 0 t < 1, x R
n
.
Da coercividade de L e da Lipschitz continuidade de g, segue que W(t, x)
esta bem denida, podendo inclusive o nmo, na deni c ao de W, ser
substitudo por mnimo.
Lema 227. Suponha que L e g satisfazem as hip oteses L1), L2). Temos
ent ao, para todo (t, x) [0, 1) R
n
, que
V (t, x) = W(t, x) = min
yR
n
(1 t)L(1 t)
1
(y x)) +g(y).
Demonstra c ao: Seja (t, x) [0, 1) R
n
. Dado y R
n
, dena z(s) :=
x +
s t
1 t
(y x), para s [t, 1]. Como z(t) = x, temos que
V (t, x)
_
1
t
L((yx)/(1t))ds+g(y) = (1t)L((yx)/(1t))+g(y).
Como y R
n
e arbitrario, temos que V (t, x) W(t, x). Seja agora
z C
1
([t, 1]; R
n
) com z(t) = x. Da desigualdade de Jensen (veja [Wa1]),
obtemos para y := z(1)
(1 t)L
_
(1 t)
1
_
1
t
z
t
(s)ds
_
+g(y)
_
1
t
L(z
t
(s))ds +g(y),
cando assim provado que V (t, x) W(t, x).
Lema 228. Suponha que L e g satisfazem as hip oteses L1), L2). Temos
ent ao, para 0 t < s < 1, que
V (t, x) = min
zR
n
(s t)L((z x)/(s t)) +V (s, z).
steuer
2008/3/11
page 309
i
i
i
i
i
i
i
i
[SEC. 13.2: F

Demonstra c ao: Sejam 0 t < s < 1. Dado z R
n
, escolha y R
n
tal
que
(1 s)L((y z)/(1 s)) +g(y) = V (s, z).
Temos ent ao
V (t, x) (1 t)L((y x)/(1 t)) +g(y)
= (1 t)L(
1 s
1 t
(y z)/(1 s)
+ (1
1 s
1 t
)(z x)/(s t)) +g(y)
(1 t)
1 s
1 t
L((y z)/(1 s))
+ (1
1 s
1 t
L((z x)/(s t)) +g(y)
= (s t)L((z x)/(s t)) +V (s, z).
Escolha y R
n
satisfazendo V (t, x) = (1 t)L((y x)/(1 t)) +g(y) e
dena
z :=
1 s
1 t
x + (1
1 s
1 t
)y.
Temos ent ao
(s t)L((z x)/(s t)) + V (s, z)
(s t)L((y x)/(1 t))
+ (1 s)L((y x)/(1 t)) + g(y)
= (1 t)L((1 t)
1
(y x)) + g(y)
= V (t, x),
de onde segue o lema.
Lema 229. Suponha que L e g satisfazem as hip oteses L1), L2). Ent ao
a fun c ao valor V e Lipschitz contnua.
Demonstra c ao: Seja t [0, 1) e u, v R
n
. Escolha y R
n
satisfazendo
V (t, u) = (1t)L((yu)/(1t))+g(y). Denindo agora w := v+gu,
temos
V (t, v) V (t, u) (1 t)L((w v)/(1 t)) + g(w)
(1 t)L((y u)/(1 t)) g(y)
g(v +y u) g(y) l
g
[v u[.
steuer
2008/3/11
page 310
i
i
i
i
i
i
i
i
310 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
(l
g
e a constante de Lipschitz de g.) Por simetria, obtemos
(13.5) [V (t, v) V (t, u)[ l
g
[v u[.
Esta desigualdade vale tambem para t = 1, pois V (1, v) = g(v) e
V (1, u) = g(u). Seja agora x R
n
e t [0, 1), temos ent ao
V (t, x) (1 t)L(0) +g(x)
e ainda
V (t, x) g(x) + min
yR
n
(1 t)L((y x)/(1 t)) +g(y) g(x)
g(x) (1 t) max
wR
n
l
g
[w[ L(w)
= g(x) (1 t) max
[g[l
g
max
wR
n
w, q) L(w).
Portanto, [V (t, x) g(x)[ c[1 t[. De (13.5) e da equa c ao de otimali-
dade do Lema 228, segue ainda que
[V (t
1
, x) V (t
2
, x)[ c[t
1
t
2
[, 0 t
1
< t
2
1, x R
n
.
Juntando essas desigualdades, o lema ca provado.
Lema 230. Suponha que L e g satisfazem as hip oteses L1), L2) e que
existe constante c > 0 tal que
g(x +z) 2g(x) +g(x z) c[z[
2
, x, z R
n
.
Ent ao temos
V (t, x +z) 2V (t, x) +V (t, x z) c[z[
2
, x, z R
n
, t [0, 1].
Demonstra c ao: Escolhendo y R
n
com V (t, x) = (1t)L((y x)/(1
t)) +g(y), temos
V (t, x +z) 2V (t, x) V (t, x z)
(1 t)L((y +z x z)/(1 t)) + g(y +z)
2(1 t)L((y x)/(1 t)) 2g(y)
+ (1 t)L((y z x +z)/(1 t)) + g(y z)
= g(y +z) 2g(y) +g(y z)
c[z[
2
steuer
2008/3/11
page 311
i
i
i
i
i
i
i
i
[SEC. 13.2: F

Denimos agora a fun c ao de Hamilton
H(p) := inf
wR
n
p, w) +L(w), p R
n
correspondente ao problema P(t, x). No teorema a seguir vericamos
que a fun c ao valor e uma solu c ao viscosa da equa c ao HJB.
Teorema 231. Suponha que L e g satisfazem as hip oteses L1), L2).
Ent ao a fun c ao valor V e uma solu c ao viscosa da equa c ao diferencial
t
v +H(
x
v) = 0.
Demonstra c ao: Seja (t
0
, x
0
) (0, 1) R
n
e C
1
([0, 1] R
n
; R) uma
fun c ao teste, tal que V possui um maximo local em (t
0
, x
0
). Para
t
0
< s < 1, temos
V (t
0
, x
0
) (s t
0
)L((s t
0
)
1
(z x
0
)) +V (s, z).
Agora, como V possui um maximo local em (t
0
, x
0
), temos que
(t
0
, x
0
) (t, x) V (t
0
, x
0
) V (t, x),
para todo (t, x) em uma vizinhan ca apropriada de (t
0
, x
0
). Logo, para
q R
n
e h > 0 sucientemente pequeno, temos
(t
0
+h, x
0
+hq)(t
0
, x
0
) V (t
0
+h, x
0
+hq)V (t
0
, x
0
) hL(q).
Portanto,
t
(t
0
, x
0
) +
t
(t
0
, x
0
), q) L(q), i.e.
t
(t
0
, x
0
) +H(
x
)(t
0
, x
0
) 0.
Seja agora C
1
([0, 1] R
n
; R) tal que V possui um mnimo local
em (t
0
, x
0
). Suponha que existe r > 0, para o qual
t
(t
0
, x
0
) +H(
x
)(t
0
, x
0
) r.
Tome h > 0 sucientemente pequeno e escolha z R
n
com V (t
0
, x
0
) =
hL(h
1
(z x
0
)) +V (t
0
+h, z). Temos ent ao, para q := h
1
(z x
0
), que
(t
0
+h, z) (t
0
, x
0
)
= h
_
1
0
_
x
(t
0
+sh, sz + (1 s)x
0
), q)
+
t
(t
0
+sh, sz + (1 s)x
0
ds
hr hL(q) = hr V (t
0
, x
0
) +V (t
0
+h, z),
steuer
2008/3/11
page 312
i
i
i
i
i
i
i
i
312 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
que pode ser reescrito como
V (t
0
+h, z) (t
0
+h, z) +hr V (t
0
, x
0
) (t
0
, x
0
).
Porem, esta desigualdade contradiz o fato de (t
0
, x
0
) ser mnimo local
de V .
13.3 Funcao Valor como Solucao Viscosa de HJB
Considere novamente a famlia de problemas de controle otimo do
Captulo 10
P(s, y)
_
_
Minimizar J(s, y; u) :=
_
1
s
L(t, z(t), u(t))dt +g(z(1))
sujeito a
u U
ad
[s, 1] := w : [s, 1] R
m
[ w mensuravel,
w(t) q.s. em [s, 1],
z
t
(t) = f(t, z(t), u(t)), q.s. em [s, 1], z(s) = y,
onde L : [0, 1] R
n
R
m
R, g : R
n
R, f : [0, 1] R
n
R
m
R
n
,
R
m
, satisfazem as seguintes hipoteses:
A1) f, L s ao contnuas e f(, , u), L(, , u) s ao contnuas em (t, z),
uniformemente em u ,= ;
A2) Para todo (t, u) [0, 1] , as aplica c oes f(t, , u), L(t, , u), g()
s ao continuamente diferenciaveis;
A3) Existe K > 0 tal que, para todo (t, u) [0, 1] e todo x, z R
n
,
temos:
[f(t, x, u)f(t, z, u)[+[L(t, x, u)L(t, z, u)[+[g(x)g(z)[K[xz[,
[f(t, x, u)[ +[L(t, x, u)[ +[g(x)[ K(1 +[x[).
A fun c ao de Hamilton H e denida por
H(t, x, , p) := p, f(t, x, )) +L(t, x, ), (t, x, , p) [0, 1] R
n
R
n
.
A fun c ao valor otimo
V : [0, 1] R
n
(s, y) inf
uU
ad
[s,1]
J(s, y; u) R
steuer
2008/3/11
page 313
i
i
i
i
i
i
i
i
[SEC. 13.3: FUNC
AO VALOR COMO SOLUC
AO VISCOSA DE HJB 313

esta bem denida pelo Lema 200 e e, em particular, contnua na faixa
[0, 1] R
n
. Alem disso, vale o princpio de otimalidade de Bellman:
(13.6)
V (s, y) = inf
uU
ad
[s,1]
_
_
t
s
L(r, z
u,y
(r), u(r))dr +V (t, z
u,y
(t))
_
, t [s, 1],
onde a trajetoria z
u,y
e a solu c ao do problema de valor inicial
(13.7) z
t
= f(t, z, u(t)) q.s. em [s, 1], z(s) = y.
Dado t [s, 1], denimos agora a aplica c ao T
s,t
que associa a cada fun c ao
: R
n
R a fun c ao (T
s,t
) : R
n
R, denida por
(T
s,t
)(y) := inf
uU
ad
[s,t]
_
_
t
s
L(r, z
u,y
(r), u(r))dr +(z
u,y
(t))
_
.
E de simples verica c ao o fato de

V (s, y) = (T
s,t
V (t, ))(y).
(Em particular V (s, y) = (T
s,1
g)(y).) A m de considerar o problema
(13.1), (13.2) associado a P(s, y), denimos a fun c ao
H(t, x, p) := inf
_
p, f(t, x, )) +L(t, x, ), (t, x, p) [0, 1] R
n
R
n
.
Teorema 232. A fun c ao valor V do problema P(0, y) e uma solu c ao
viscosa da equa c ao de HamiltonJacobiBellman (13.1).
Demonstra c ao: Seja C
1
((0, 1)R
n
) uma fun c ao teste tal que V
possui um maximo local em (t
0
, x
0
) (0, 1) R
n
. Podemos sempre
supor V (t
0
, x
0
) = (t
0
, x
0
) (por que?). Logo, existe uma vizinhan ca
[t
0
, t
0
+] A de (t
0
, x
0
) onde temos
(t, x) V (t, x) para todo (t, x) [t
0
, t
0
+] A.
Seja h (0, ) e um elemento qualquer. Escolha agora u
1

U
ad
[t
0
, 1] com u
1
(t) = , t [t
0
, t
0
+ ]. Logo, existe h
0
(0, ) com
steuer
2008/3/11
page 314
i
i
i
i
i
i
i
i
314 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
z
u
1
,x
0
(t
0
+h) A, para todo h (0, h
0
). Para h (0, h
0
), temos
0 = h
1
(V (t
0
, x
0
) (t
0
, x
0
))
= h
1
inf
uU
ad
[t
0
,t
0
+h]
_
_
t
0
+h
t
0
L(r, z
u,x
0
(r), u(r))dr
+V (t
0
+h, z
u,x
0
(t
0
+h)) (t
0
, x
0
)
_
h
1
inf
uU
ad
[t
0
,t
0
+h]
_
_
t
0
+h
t
0
L(r, z
u,x
0
(r), u(r))dr
+(t
0
+h, z
u,x
0
(t
0
+h)) (t
0
, x
0
)
_
h
1
_
t
0
+h
t
0
L(r, z
u
1
,x
0
(r), u
1
(r))dr
+h
1
_
(t
0
+h, z
u
1
,x
0
(t
0
+h)) (t
0
, x
0
)
_
De onde obtemos
0
t
(t
0
, x
0
) +f(t
0
, x
0
, ),
x
(t
0
, x
0
)) +L(t
0
, x
0
, ).
Portanto,
t
(t
0
, x
0
) +H(t
0
, x
0
,
x
(t
0
, x
0
)) 0.
Como e arbitrario, o item b) da Deni c ao 220 ca provado.
Seja agora C
1
((0, 1) R
n
) uma fun c ao teste tal que V possui
um mnimo local em (t
0
, x
0
) (0, 1) R
n
. Novamente podemos supor
sem perda de generalidade que V (t
0
, x
0
) = (t
0
, x
0
). Logo, existe uma
vizinhan ca [t
0
, t
0
+] A de (t
0
, x
0
) tal que
(t, x) V (t, x) para todo (t, x) [t
0
, t
0
+] A.
Escolha agora para cada n N um controle u
n
U
ad
[t
0
, 1], tal que
_
T
t
0
,t
0
+
1
n
(t
0
+
1
n
, )
_
(x
0
)
1
n
2
+
_
t
0
+
1
n
t
0
L(r, z
n
(r), u
n
(r))dr
+
_
t
0
+
1
n
, z
n
(t
0
+
1
n
)
_
,
onde z
n
:= z
u
n
,x
0
e o estado (denido em [t
0
, 1]) correspondente ao
controle u
n
. Podemos supor, sem perda de generalidade, que z
n
(t
0
+
1
n
)
A para todo n N. Temos ent ao
steuer
2008/3/11
page 315
i
i
i
i
i
i
i
i
[SEC. 13.3: FUNC
AO VALOR COMO SOLUC
AO VISCOSA DE HJB 315

0 = n
_
_
T
t
0
,t
0
+
1
n
V (t
0
+
1
n
, )
_
(x
0
) (t
0
, x
0
)
_
n
_
_
T
t
0
,t
0
+
1
n
(t
0
+
1
n
, )
_
(x
0
) (t
0
, x
0
)
_

1
n
+n
_
t
0
+
1
n
t
0
L(r, z
n
(r), u
n
(r))dr
+ n
_
(t
0
+
1
n
, z
n
(t
0
+
1
n
)) (t
0
, x
0
)
_
=
1
n
+n
_
t
0
+
1
n
t
0
L(r, z
n
(r), u
n
(r))dr
+ n
_
t
0
+
1
n
t
0
_
t
(r, z
n
(r)) +
f(r, z
n
(r), u
n
(r)),
x
(r, z
n
(r))
_
_
dr
=
t
(t
0
, x
0
) +n
_
t
0
+
1
n
t
0
L(t
0
, x
0
, u
n
(r))dr
+n
_
t
0
+
1
n
t
0
f(t
0
, x
0
, u
n
(r)),
x
(t
0
, x
0
))
_
dr +R
n
,
onde
R
n
= n
_
t
0
+
1
n
t
0
[
t
(r, z
n
(r))
t
(t
0
, x
0
)]dr
+
_
t
0
+
1
n
t
0
_
L(r, z
n
(r), u
n
(r)) L(t
0
, x
0
, u
n
(r)
_
dr
1
n
+n
t
0
+
1
n
_
t
0
_
f(r, z
n
(r), u
n
(r)),
x
(r, z
n
(r))
_
f(t
0
, x
0
, u
n
(r)),
x
(t
0
, x
0
)
_
_
dr.
Portanto,
n
_
_
T
t
0
,t
0
+
1
n
(t
0
+
1
n
, )
_
(x
0
) (t
0
, x
0
))

t
(t
0
, x
0
) +
f
n
,
x
(t
0
, x
0
)
_
+l
n
+R
n
,
steuer
2008/3/11
page 316
i
i
i
i
i
i
i
i
316 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
onde
f
n
:= n
_
t
0
+
1
n
t
0
f(t
0
, x
0
, u
n
(r))dr, l
n
:= n
_
t
0
+
1
n
t
0
L(t
0
, x
0
, u
n
(r))dr.
Da hipotese (A3) segue agora que lim
rt
0
z
n
(r) = x
0
uniformemente em
n. Da continuidade de L e f segue ainda que lim
n
R
n
= 0. Dena
B :=(f, l) R
n
R [ (f, l)
= (f(t
0
, x
0
, ), L(t
0
, x
0
, )) para algum .
Temos ent ao da deni c ao de f
n
, l
n
que
(f
n
, l
n
) co(B) para todo n N.
Temos, portanto, que
0 liminf
n
n
_
_
T
t
0
,t
0
+
1
n
(t
0
+
1
n
, )
_
(x
0
) (t
0
, x
0
)
_

t
(t
0
, x
0
) + inf
(f,l)coB
f,
x
(t
0
, x
0
)) +l
=
t
(t
0
, x
0
) + inf
(f,l)B
f,
x
(t
0
, x
0
)) +l
=
t
(t
0
, x
0
) + inf
H(t
0
, x
0
, ,
x
(t
0
, x
0
)).
Note que, para obter a pen ultima linha acima, usamos a identidade
inf
(f,l)coB
f,
x
(t
0
, x
0
)) +l = inf
(f,l)B
f,
x
(t
0
, x
0
)) +l,
que e justicada pelo fato de estarmos lidando com uma fun c ao linear
em (f, l).
Exemplo 233. Considere o problema
t
v +H(t, x, v) = 0, em (0, 1) (1, 1), v(1, x) = 0, em [1, 1],
onde H(t, x, v) := (
x
v)
2
+1.

E de simples verica c ao o fato da fun c ao
v(t, x) :=
_
1 [x[ , [x[ t
1 t , [x[ < t
ser uma solu c ao da equa c ao HJB. 2
steuer
2008/3/11
page 317
i
i
i
i
i
i
i
i
[SEC. 13.4: PRINC
IPIO DO M
AXIMO 317
13.4 Princpio do Maximo
Investigamos novamente o princpio do maximo apresentado no Ca-
ptulo 10. Para tanto, utilizamos a fun c ao de Hamilton correspondente
ao problema P(s, y)
H(t, x, u, p) := p, f(t, x, u)) +L(t, x, u).
Como vimos na Sec c ao 10.1, este teorema de condi c oes necessarias para
otimalidade nos garante que, dado um processo otimo ( u, z) para P(s, y),
ent ao:
Existe um multiplicador : [s, 1] R
n
tal que o par ( z, ) e uma
solu c ao do problema de valor de contorno (sistema Hamiltoniano)
z
t
= f(t, z, u(t)), z(s) = y,
t
=
f
x
(t, z, u(t))

L
x
(t, z, u(t))
, (1) = g(z(1))

E satisfeita a condi c ao de maximo (ou de otimalidade)
H(t, z(t), u(t), (t)) = inf
w
H(t, z(t), w, (t)).
A fun c ao e denominada vari avel adjunta e o conjunto de condi c oes
acima e denominado simplicadamente por MP(s, y). Nesta sec c ao,
consideramos a tarefa de obter estas condi c oes utilizando uma abor-
dagem na linha da programa c ao din amica.
Lema 234. Seja ( u, z) um processo admissvel para P(0, y) e (, ) a
matriz de transi c ao para a equa c ao diferencial
w
t
=
f
x
(t, z(t), u(t))w.
S ao verdadeiras as armativas:
a) sup
srt1
[(t, r)[ < ;
b)
t
(, s) =
f
x
(t, z(t), u(t))(, s) em [0, 1], (s, s) = I, s [0, 1].
c) Se e uma solu c ao do problema de valor inicial
t
=
f
x
(t, z(t), u(t))

L
x
(t, z(t), u(t)), (1) = g( z(1)),
steuer
2008/3/11
page 318
i
i
i
i
i
i
i
i
318 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
ent ao temos
(t) = (1, t)
g( z(1)) +
_
1
t
(r, t)
L
x
(r, z(r), u(r))dr, t [s, 1].
Demonstra c ao: Tais resultados s ao padr ao na teoria de equa c oes dife-
renciais ordinarias lineares, e podem ser obtidos diretamente dos resul-
tados apresentados no Apendice A.
Teorema 235. Seja ( u, z) um processo otimo para P(s, y) e seja a
vari avel adjunta correspondente. Temos ent ao, para todo t (s, 1), que
x
V (t, z(t)) (t)
+
x
V (t, z(t)).
Demonstra c ao: Seja t (s, 1) e x R
n
. Denotamos por z := z
u,x
a
trajetoria correspondente ao controle u, satisfazendo a condi c ao inicial
z(t) = x, i.e.
z(q) = x +
_
q
t
f(r, z(r), u(r))dr, q [t, 1].
Temos ent ao, para q [t, 1], que
z(q) z(q) = x z(t) +
_
q
t
(f(r, z(r), u(r)) f(r, z(r), u(r)))dr
= x z(t) +
_
q
t
f
x
(r, z(r), u(r))(z(r) z(r))dr
+
_
q
t
(r, x)dr,
onde
(r, x) := f(r, z(r), u(r))f(r, z(r), u(r))
f
x
(r, z(r), u(r))(z(r) z(r)).
Da hipotese A2), segue que
lim
x z(t)
(r, x)[z(r) z(r)[
1
= 0, r [t, 1], sup
r[t,1],xR
n
[(r, x)[ < .
Utilizando agora a matriz de transi c ao , podemos escrever
z(q) z(q) = (q, t)(x z(t)) +
_
q
t
(q, r)(r, x)dr,
steuer
2008/3/11
page 319
i
i
i
i
i
i
i
i
[SEC. 13.4: PRINC
IPIO DO M
AXIMO 319
obtendo assim
V (t, x) V (t, z(t)) g(z(1)) g( z(1))
+
_
1
t
_
L(r, z(r), u(r)) L(r, z(r), u(r))
_
dr
=

g( z(1)), z(1) z(1)
_
+
0
_
1
t
L
x
(r, z(r), u(r)), z(r) z(r)
_
dr
+
_
1
t
1
(r, x)dr,
onde
0
:= g(z(1)) g( z(1))
g( z(1)), z(1) z(1)

_
,
1
(r, x) := L(r, z(r), u(r)) L(r, z(r), u(r))
_
L
x
(r, z(r), u(r)), z(r) z(r)
_
.
Podemos ent ao concluir que
V (t, x) V (t, z(t))
g( z(1)), (1, t)(x z(t))

_
+
_
1
t
(1, r)(r, x)dr +
0
+
_
1
t
1
(r, x)dr
+
_
1
t
_
L
x
(r, z(r), u(r)), (r, t)(x z(t))
_
dr
+
_
1
t
_
r
t
(r, r
t
)(r
t
, x)dr
t
dr
= (t), x z(t)) +
2
(t, x),
onde lim
x z(t)
2
(r, x)[x z(t)[
1
= 0. Portanto, (t)
+
x
V (t, z(t)). Por
outro lado, se p
x
V (t, z(t)), ent ao
0 liminf
x z(t)
__
V (t, x) V (t, z(t)) p, x z(t))
_
[x z(t)[
1
_
liminf
x z(t)
(t) p, x z(t))[x z(t)[
1
,
steuer
2008/3/11
page 320
i
i
i
i
i
i
i
i
320 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
uma vez que
limsup
x z(t)
(t) p, x z(t))[x z(t)[
1
= limsup
x z(t)
(t) p, x z(t))[x z(t)[
1
.
Logo, p = (t) e o teorema ca provado.
Lema 236. Seja ( u, z) um processo otimo para P(s, y). Ent ao,
a menos de um conjunto de medida nula de (s, 1), temos que, se (q, p)
+
V (t, z(t))
V (t, z(t)),
3
ent ao
p = (t), q = H(t, z(t), u(t), p) = inf
H(t, z(t), , p).

Demonstra c ao: Note que
liminf
h0
h
1
_
t+h
t
f(r, z(r), u(r))dr = f(t, z(t), u(t)),
liminf
h0
h
1
_
t+h
t
L(r, z(r), u(r))dr = L(t, z(t), u(t))
quase sempre em [s, 1], pois a aplica c ao r (f(r, z(r), u(r)),
L(r, z(r), u(r)) e integravel. Seja t (s, 1) tal que os limites acima
existam. Tome agora (q, p)
+
V (t, z(t))
V (t, z(t)). Da deni c ao

do subdiferencial
+
V (t, z(t)), temos que
limsup
h0
V (t +h, z(t +h)) V (t, z(t)) qh p, z(t +h) z(t))
h +[ z(t +h) z(t)[
0.
Logo, segue da equa c ao de otimalidade (13.6)
0 limsup
h0
1
h
_
_
t+h
t
L(r, z(r), u(r))dr qh
_
t+h
t
p, f(r, z(r), u(r))

_
dr
_
= L(t, z(t), u(t)) q p, f(t, z(t), u(t))).
3
Como vimos no Lema 226, esta condi c ao e equivalente a exigir a diferenciabilidade
de V no ponto (t, z(t)).
steuer
2008/3/11
page 321
i
i
i
i
i
i
i
i
[SEC. 13.4: PRINC
IPIO DO M
AXIMO 321
De onde obtemos que
q +H(t, z(t), u(t), p) 0.
De forma analoga, provamos que q H(t, z(t), u(t), p). Como, em
particular, p
x
V (t, z(t)), segue do Teorema 235 que p = (t), onde
e a variavel adjunta. Note ainda que (q, p)
+
V (t, z(t))
V (t, z(t)),
o que juntamente com o Lema 225 nos permite concluir que
H(t, z(t), u(t), (t)) = inf
H(t, z(t), , (t)) = H(t, z(t), (t)).

Fica assim provado o lema.
Exemplo 237. Considere o problema
_
_
Minimizar z(1)
sujeito a
z
t
= zu, z(0) = 0,
u(t) [0, 1] q.s. em [0, 1].
E imediato vericar que u 1, z 0 formam um processo otimo, e que

a fun c ao valor e dada por
V (s, y) =
_
ye
1s
, y > 0
y , y 0
Para (s, y) = (0, 0), temos
x
V (0, 0) = ,
+
x
V (0, 0) = [e, 1], (0) =
1. 2
Teorema 238. Seja ( u, z) um processo otimo para P(s, y). Ent ao, a
menos de um conjunto de medida nula de (s, 1), temos que
V (t, z(t))
__
H(t, z(t), u(t), (t)), (t)
__

+
V (t, z(t)).
Demonstra c ao: A primeira inclus ao e conseq uencia direta dos Lemas 234
e 236. A m de provar a segunda inclus ao, tome t (s, 1) com
liminf
h0
h
1
_
t+h
t
f(r, z(r), u(r))dr = f(t, z(t), u(t)),
liminf
h0
h
1
_
t+h
t
L(r, z(r), u(r))dr = L(t, z(t), u(t)).
steuer
2008/3/11
page 322
i
i
i
i
i
i
i
i
322 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
Seja > t e x R
n
. Considere a restri c ao u := u[
[,1]
e dena a
trajetoria correspondente z := z
u,x
(i.e. z() = x, z
t
= f(, z, u), q.s.).
Para r [, 1], temos
z(r) z(r) = x y +
_
r
f(r
t
, z(r
t
), u(r
t
))dr
t

_
r
t
f(r
t
, z(r
t
), u(r
t
))dr
t
= x y
_

t
f(r
t
, z(r
t
), u(r
t
))dr
t
+
_
r
f(r
t
, z(r
t
), u(r
t
)) f(r
t
, z(r
t
), u(r
t
))dr
t
= x y
_

t
f(r
t
, z(r
t
), u(r
t
))dr
t
+
_
r
_
f
x
(r
t
, z(r
t
), u(r
t
)) +(r
t
; , x)
_
(z(r
t
) z(r
t
))dr
t
,
onde
lim
t
x z(t)
(; , x) = 0,
uniformemente. Utilizando agora o metodo de varia c ao de constantes,
obtemos
z(r) z(r) = (r, )
_
x y
_

t
f(r
t
, z(r
t
), u(r
t
))dr
t
_
+
_
r
(r, 0)
_
0
(r
t
; , x)(z(r
t
) z(r
t
))dr
Do Teorema 238, conclumos que a fun c ao valor V satisfaz a equa c ao
diferencial HJB no sentido classico, caso ela seja diferenciavel.
Teorema 239. Seja ( u, z) um processo otimo para P(s, y). Ent ao s ao
v alidas as condi c oes MP(s, y) do princpio do m aximo.
Demonstra c ao: Como
_
H(t, z(t), u(t), (t)), (t)
_

+
V (t, z(t)) q.s.
em (s, 1), temos que
H(t, z(t), u(t), (t)) inf
H(t, z(t), , (t)).

O teorema segue agora desta desigualdade.
steuer
2008/3/11
page 323
i
i
i
i
i
i
i
i
[SEC. 13.5: UNICIDADE DE SOLUC

OES VISCOSAS 323
13.5 Unicidade de Soluc oes Viscosas
Considere os seguintes problemas de valor inicial:
t
u +H(t, x,
x
u) = f(t, x), (t, x) (0, T) R
n
, (13.8)
u(0, x) = u
0
(x), x R
n
,
t
v +H(t, x,
x
v) = g(t, x), (t, x) (0, T) R
n
, (13.9)
v(0, x) = v
0
(x), x R
n
.
(Em compara c ao com o problema (13.1), (13.2), trocamos a condi c ao -
nal por uma inicial e consideramos um intervalo de tempo [0, T] generico.)
Consideramos a seguir as seguintes hipoteses:
B1) H : [0, T] R
n
R
n
R, f, g : [0, T] R
n
R, u
0
, v
0
: R
n
R
s ao contnuas;
B2) [f(t, x)[ + [g(t, x)[ + [u
0
(x)[ + [v
0
(x)[ K(1 + [x[), para (t, x)
[0, T] R
n
.
Teorema 240. Suponha que as hip oteses B1) e B2) s ao satisfeitas.
Sejam u
0
, v
0
fun c oes uniformemente contnuas e u, v solu c oes viscosas
de (13.8) e (13.9), respectivamente. Ent ao, temos para todo t [0, T]:
(13.10)
sup
xR
n
(u(t, x)v(t, x)) sup
xR
n
(u
0
(x)v
0
(x))+
_
t
0
sup
xR
n
(f(s, x)g(s, x))ds.
Demonstra c ao: Suponha, sem perda de generalidade, que o lado direito
de (13.10) e nito, i.e.
sup
xR
n
(u
0
(x)v
0
(x)) < ,
_
t
0
sup
xR
n
(f(s, x)g(s, x))ds < t [0, T].
Das hipoteses B1) e B2), conclumos que:
1. sup
xR
n(u(t, x) v(t, x)) < , para todo t [0, T];
2. sup
xR
n(f(t, x) g(t, x)) < , q.s. em [0, T];
3. sup
xR
n(f(t, x) g(t, x)) < , para todo t [0, T];
4. [0, T] t sup
xR
n(u(t, x) v(t, x)) e contnua;
steuer
2008/3/11
page 324
i
i
i
i
i
i
i
i
324 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
5. [0, T] t sup
xR
n(f(t, x) g(t, x)) e contnua;
6. Existe c > 0 com [u(t, x) v(s, y)[ c(1 + [x y[), para todo
x, y R
n
, t, s [0, T].
Suponha por contradi c ao que (13.10) n ao e valida. Logo, existe
0
> 0
com
sup
t[0,T]
_
sup
xR
n
(u(t, x) v(t, x))
_
t
0
sup
xR
n
(f(s, x) g(s, x))ds
_
> sup
xR
n
(u
0
(x) v
0
(x)) +
0
.
Dados , > 0, dena
(t, x, s, y) := u(t, x) v(s, y)
1
2
[x y[
2
1
2
[t s[
2
1
2
_
t
0
sup
x
R
n
(f(, x) g(, x))d
1
2
_
s
0
sup
x
R
n
(f(, x) g(, x))d.
Por conta do crescimento linear de u, v, f, g (hipotese B2)), temos
lim
[x[+[y[
(t, x, s, y) = .
Portanto, e limitada superiormente e existe (t
0
, x
0
, y
0
, s
0
) tal que
(t
0
, x
0
, s
0
, y
0
) +
0
> sup(t, x, s, y) [ x, y R
n
, t, s [0, T].
Temos ent ao que
(t
0
, x
0
, t
0
, x
0
) +(s
0
, y
0
, s
0
, y
0
) < 2(t
0
, x
0
, s
0
, y
0
) + 2
0
.
De onde segue
1
[x
0
y
0
[
2
+
1
[t
0
s
0
[
2
< u(t
0
, x
0
) u(s
0
, y
0
)
+v(t
0
, x
0
) v(s
0
, y
0
) + 2
0
c(1 +[x
0
y
0
[) + 2
0
,
steuer
2008/3/11
page 325
i
i
i
i
i
i
i
i

OES VISCOSAS 325
onde c > 0. Temos ent ao
1
[x
0
y
0
[
2
+
1
[t
0
s
0
[
2
c +
c
2
2
+
1
2
[x
0
y
0
[
2
+ 2
0
,
1
2
[x
0
y
0
[
2
+
1
[t
0
s
0
[
2
c +
c
2
2
+ 2
0
.
Da obtemos que
[x
0
y
0
[ c
com lim
0
c
= 0, [t
0
s
0
[ c
com lim
0
c
= 0.
Portanto, existe
0
> 0 e
0
> 0 com t
0

0
, s
0

0
independentes
de , (0,
0
). De fato, se assim n ao fosse, existiriam seq uencias
nN
,
n
nN
, t
n
nN
, x
n
nN
, s
n
nN
, y
n
nN
tais que
lim
n
n
= lim
n
n
= 0, lim
n
t
n
= 0 ou lim
n
s
n
= 0,
e ainda
(t
n
, x
n
, s
n
, y
n
) +
0
> sup(t, x, s, y) [ t, s [0, T], x, y R
n
,
para todo n N. Teramos ent ao lim
n
(x
n
y
n
) = 0, lim
n
t
n
= lim
n
s
n
=
0. Isso implicaria, para cada n N, que
sup(t, x, t, x) [ t [0, T], x R
n
sup(t, x, s, y) [ t, s [0, T], x, y R

n
< (t
n
, x
n
, s
n
, y
n
) +
0
u(t
n
, x
n
) v(s
n
, y
n
)
1
2
_
t
n
0
sup
xR
n
(f(, x) g(, x))d
1
2
_
s
n
0
sup
xR
n
(f(, x) g(, x))d +
0
.
Tomando o limite n e observando a continuidade uniforme de u e
v, obteramos a contradi c ao
sup(t, x, t, x) [ t [0, T], x R
n
sup
xR
n
(u
0
(x) v
0
(x)) +
0
.
Sejam, portanto, , (0,
0
), e (0,
1
2
0
). Temos que
(t
0
, x
0
, s
0
, y
0
) + > sup(t, x, s, y) [ x, y R
n
, t, s [0, T].
steuer
2008/3/11
page 326
i
i
i
i
i
i
i
i
326 [CAP. 13: SOLUC

OES VISCOSAS E FUNC
AO VALOR
Tome C
0
(R
n
R
n
) com
(x
0
, y
0
) = 1, 0 1, [[ 1.
Para (0,

0
2T
) xo, dena
(t, x, s, y) := (t, x, s, y) +(x, y) t, t, s [0, T], x, y R
n
.
Da deni c ao de e do fato de possuir suporte compacto, podemos
garantir a existencia de (t
1
, x
1
, s
1
, y
1
) tal que
(t
1
, x
1
, s
1
, y
1
) = sup(t, x, s, y) [ x, y R
n
, t, s [0, T].
Como (0,
1
2
0
) e 0 1, segue da que
(t
1
, x
1
, s
1
, y
1
) +
0
> sup(t, x, s, y) [ x, y R
n
, t, s [0, T].
Portanto, (veja acima)
[x
1
y
1
[ c
, [t
1
s
1
[ c
.
Dena agora
1
(t, x) := u(t, x) (t, x, s, y) (x, y) +t,
2
(t, x) := v(t, x) (t, x, s, y) +(x, y) t.
Temos ent ao
u
1
possui um maximo em (t
1
, x
1
),
v
2
possui um maximo em (s
1
, y
1
).
Como u, v s ao solu c oes de viscosidade, temos que
1
(t
1
s
1
) +
1
2
sup
x
R
n
(f(t
1
, x
t
) g(t
1
, x
t
)) +
+H(t
1
, x
1
,
1
(x
1
y
1
)
x
(x
1
, y
1
)) f(t
1
, x
1
),
1
(t
1
s
1
)
1
2
sup
x
R
n
(f(s
1
, x
t
) g(s
1
, x
t
)) +
+H(s
1
, y
1
,
1
(x
1
y
1
) +
y
(x
1
, y
1
)) g(s
1
, y
1
).
steuer
2008/3/11
page 327
i
i
i
i
i
i
i
i

OES VISCOSAS 327
Subtraindo as desigualdades acima, obtemos
f(t
1
, x
1
) g(s
1
, y
1
) +
1
2
sup
x
R
n
_
f(t
1
, x
t
) g(t
1
, x
t
)
_
+ sup
x
R
n
_
f(s
1
, x
t
) g(s
1
, x
t
)
_
+H
_
t
1
, x
1
,
1
(x
1
y
1
)
x
(x
1
, y
1
)
_
H
_
s
1
, y
1
,
1
(x
1
y
1
) +
y
(x
1
, y
1
)
_
.
Da segue que
f(t
1
, x
1
) g(s
1
, y
1
) +
H,R
([t
1
s
1
[ +)
+
1
2
sup
x
R
n
_
f(t
1
, x
t
) g(t
1
, x
t
)
_
+ sup
x
R
n
_
f(s
1
, x
t
) g(s
1
, x
t
)
_
,
onde
H,R
(r) := sup[H(t, p) H(s, q)[ [ [t s[ +[p q[ r, [p[, [q[ R
e R = R
=
c
+
0
, pois
1
[x
1
y
1
[ +[
x
(x
1
, y
1
)[
1
[x
1
y
1
[ +
c
+
0
.
Temos assim que

f,g
([t
1
s
1
[ +[x
1
y
1
[) +
H,R
([t
1
s
1
[ +),
onde
f,g
(r) :=
1
2
sup[f(t, x)f(s, y)[+[g(t, x)g(s, y)[ [ [ts[+[xy[ r.
Tomando o limite 0, 0, obtemos

f,g
([t
1
s
1
[ +[x
1
y
1
[) .
Tomando agora o limite 0, obtemos nalmente a contradi c ao 0.
steuer
2008/3/11
page 328
i
i
i
i
i
i
i
i
328 EXERC
ICIOS
Exerccios
13.1. Seja H : (0, 1) R
n
R
n
R contnua e sejam v
k
, k N,
solu c oes viscosas de
t
v + H(t, x,
x
v) = 0, (t, x) (0, 1) R
n
.
Mostre que se v
k
converge uniformemente para v, ent ao v tambem e
solu c ao viscosa da equa c ao diferencial.
13.2. Considere a equa c ao
[v
t
(x)[ = 1, x (1, 1). ()
a) Verique que v
1
(x) := 1 [x[, x [1, 1] e uma solu c ao viscosa de
(), enquanto v
2
(x) := [x[ 1, x [1, 1] n ao o e.
b) Encontre uma solu c ao viscosa de
[v
t
(x)[ = 1, x (1, 1), v(1) = v(1) = 0. ()
13.3. Seja U R
n
aberto e limitado. Dena
v(x) := dist(x, U), x U.
a) Mostre que v e lipschitz contnua em U.
b) Verique que v e uma solu c ao viscosa de [v(x)[ = 1, x U.
c) Analise os itens a) e b), caso U seja apenas aberto.
steuer
2008/3/11
page 329
i
i
i
i
i
i
i
i
Apendice A
Equac oes Diferenciais
Ordinarias
Neste captulo s ao discutidos resultados relacionados com a teoria
de resolu c ao de sistemas de equa c oes diferenciais ordinarias (EDOs).
Tal analise e fundamental para a teoria de controle, pois os sistemas de
controle podem ser interpretados como problemas de evolu c ao nos quais
temos a liberdade de escolher determinados par ametros que inuenciam
sua din amica.
Os topicos aqui abordados dizem respeito à representa c ao de solu c oes,
assim como à analise de resultados sobre existencia, unicidade e de-
pendencia contnua em rela c ao às condi c oes iniciais. As tres primeiras
sec c oes tratam de sistemas lineares de EDOs, sendo problemas aut ono-
mos e n ao aut onomos tratados separadamente. Nas Sec c oes A.4 e A.5
s ao estudados resultados relacionados com a teoria geral de equa c oes
ordinarias. A Sec c ao A.6 se destina a analisar um metodo iterativo para
aproximar solu c oes de sistemas de EDOs com condi c oes de contorno
especiais.
A.1 Exponencial de uma Matriz
Ao resolver a equa c ao diferencial ordinaria escalar
z
t
(t) = az,
steuer
2008/3/11
page 330
i
i
i
i
i
i
i
i
330 [AP
ENDICE A: EQUAC

OES DIFERENCIAIS ORDIN
ARIAS
onde a R, obtemos a seguinte formula para a solu c ao do problema
com condi c ao inicial z(0) = z
0
R:
z(t) = z
0
e
at
, t R; z
0
constante.
Nesta e na proxima sec c ao discutimos a equa c ao analoga quando a e
uma matriz n n com coecientes reais e z : R R
n
.
Adotamos no texto as seguintes nota c oes:
Representamos uma norma qualquer nos espa cos R
n
ou C
n
por | |.
1
Normas especiais nestes espa cos s ao as normas-p, | |
p
, 1 p ,
denidas por
|x|
p
:=
_
(
n
i=1
[x
i
[
p
)
1/p
, 1 p <
max
1in
[x
i
[ , p = ,
onde x = (x
1
, . . . , x
n
) R
n
. Nos espa cos R
m,n
(C
m,n
) dos operadores
lineares de R
n
em R
m
(de C
n
em C
m
) s ao de particular interesse as
normas denidas por
|A| := max|Ax|
a
[ |x|
b
1 = max|Ax|
a
/ |x|
b
[ x ,= 0,
onde | . |
a
e | . |
b
s ao duas normas quaisquer para os espa cos R
m
e R
n
,
respectivamente.
Observa cao 241. Com essas deni c oes, R
n
, C
n
, R
m,n
, C
m,n
s ao espa cos
vetoriais normados completos (espa cos de Banach) e podemos falar em
convergencia de seq uencias, seq uencias de Cauchy, series de elementos,
. . . Podemos, enm, dispor de todos os resultados associados à estrutura
dos espa cos de Banach. 2
Deni cao 242. Seja a matriz A C
n,n
. A matriz denida formalmente
pela serie
(A.1)
k=0
1
k!
A
k
e denominada exponencial da matriz A. Para representa-la usamos a
nota c ao e
A
ou ainda exp(A). 2
1
Em espa cos euclidianos de dimens ao nita todas as normas s ao equivalentes. (veja
e.g. [Kre, Cap`tulo 2] ou [Ru1])
Duas normas | |
a
e | |
b
s ao ditas equivalentes quando existem constantes c
1
e
c
2
tais que c
1
|x|
a
< |x|
b
< c
2
|x|
a
, x.
steuer
2008/3/11
page 331
i
i
i
i
i
i
i
i
[SEC. A.2: SISTEMAS LINEARES AUT
ONOMOS 331
Note que, para toda matriz A C
n,n
, a serie na Deni c ao 242 con-
verge. De fato, da desigualdade
|e
A
|
i=0
1
k!
|A|
k
e
|A|
,
que e obtida da propriedade |AB| |A| |B|,
2
conclumos que a serie
em (A.1) converge absolutamente e, portanto, e uma serie convergente.
Lema 243. Seja 0 a matriz identicamente nula, I a matriz identidade
e M uma matriz inversvel qualquer. As seguintes propriedades da ex-
ponencial de matrizes s ao v alidas:
a) e
0
= I;
b) e
A+B
= e
A
e
B
, quando AB = BA;
c) e
A
= (e
A
)
1
;
d) e
MAM
1
= Me
A
M
1
;
e) Ae
A
= e
A
A.
Demonstra c ao: Tais propriedades s ao conseq uencia imediata da De-
ni c ao 242.
E importante observar que a condi c ao AB = BA no item b) do

Lema 243 n ao pode ser negligenciada, conforme nos mostra o simples
exemplo a seguir:
A =
_
0 1
0 0
_
, B =
_
0 0
1 0
_
.
A.2 Sistemas Lineares Aut onomos
Nesta sec c ao consideramos equa c oes diferenciais ordinarias lineares
com coecientes constantes
(A.2) z
t
(t) = Az(t),
onde A R
n,n
. Como na Sec c ao A.1, procuramos solu c oes do tipo
exponencial para esta equa c ao diferencial. Observe que a identidade
e
(t+h)A
e
tA
h
= e
tA
e
hA
I
h
2
Esta propriedade e satisfeita pela norma | . | do espa co C
n,n
.
steuer
2008/3/11
page 332
i
i
i
i
i
i
i
i
332 [AP
ENDICE A: EQUAC

ARIAS
nos permite concluir que
lim
h0
h
1
(e
(t+h)A
e
tA
) = e
tA
lim
h0
h
1
(e
hA
I)
= e
tA
lim
h0
h
1
k=0
h
k
k!
A
k
I
= e
tA
lim
h0
(A+
hA
2
2!
+
h
2
A
3
3!
+. . .)
= e
tA
A.
Portanto, a aplica c ao
R t e
tA
R
n,n
e diferenciavel e sua derivada e dada por
(A.3) R t Ae
tA
= e
tA
A R
n,n
.
O teorema a seguir fornece uma resposta ao questionamento feito no
incio da sec c ao sobre a forma da solu c ao do sistema (A.2).
Teorema 244. O problema de valor inicial
(A.4) z
t
= Az , z(0) = z
0
possui como unica solu c ao a aplica c ao
R t e
tA
z
0
R
n
.
Demonstra c ao: De (A.3) temos que a aplica c ao t e
tA
z
0
e uma solu c ao
da equa c ao diferencial. Note que a condi c ao inicial tambem e satisfeita
por esta aplica c ao. Para vericar a unicidade, suponha que t v(t) e
uma outra solu c ao do problema de valor inicial. Logo, a fun c ao w(t) :=
e
tA
v(t) satisfaz
w
t
(t) = Ae
tA
v(t) + e
tA
v
t
(t) = Ae
tA
v(t) + e
tA
Av(t) = 0.
Isto e, w e uma fun c ao constante. Temos assim w(t) = e
0A
v(0) = z
0
.
Portanto, v(t) = e
tA
w(0) = e
tA
z
0
.
steuer
2008/3/11
page 333
i
i
i
i
i
i
i
i
ONOMOS 333
Corolario 245. As colunas da matriz Z(t) := e
tA
geram n solu c oes
linearmente independentes para o sistema de equa c oes diferenciais (A.2).
Demonstra c ao: Para cada z
0
R
n
, a aplica c ao t Z(t)z
0
e uma
solu c ao de (A.2) com condi c ao inicial z(0) = z
0
. Denotando por
e
1
, . . . , e
n
a base can onica do R
n
, obtemos da escolha z
0
= e
j
, que
as colunas de Z(t) s ao solu c oes de (A.2). A independencia linear (no
espa co das fun c oes contnuas de R em R
n
) e conseq uencia do fato dos
vetores unitarios e
1
, . . . , e
n
serem linearmente independentes.
Seja t
0
R xo. A fun c ao matrical
A
(t, t
0
) := e
(tt
0
)A
, t R
e denominada matriz de transi c ao do sistema, pois ela descreve a transi c ao
do estado z
0
no tempo t
0
para o estado z(t) no tempo t atraves da
din amica do sistema (A.2). Note ainda que a aplica c ao
t
A
(t, t
0
) z
0
e solu c ao do problema de valor inicial (ou problema de Cauchy)
z
t
= Az , z(t
0
) = z
0
.
Resta-nos, portanto, resolver o problema de como calcular a fun c ao
e
tA
. Da algebra linear sabemos que toda matriz pode ser transformada
em uma forma can onica chamada forma can onica de Jordan. Importante
nesse fato e que se trata de uma transforma c ao de semelhan ca. Esse
resultado e formulado no lema a seguir.
Lema 246. Dada uma matriz A C
n,n
, existem matrizes M C
n,n
e
J
1
, . . . , J
p
que satisfazem:
A = MJM
1
,
J = diag(J
1
, . . . , J
p
),
J
i
=
i
I +N
i
, 1 i p,
onde
i
C s ao os autovalores de A,
diag(J
1
, . . . , J
p
) :=
_
_
_
J
1
0
.
.
.
0 J
p
_
_
_
steuer
2008/3/11
page 334
i
i
i
i
i
i
i
i
334 [AP
ENDICE A: EQUAC

ARIAS
e
N
i
=
_
_
_
_
_
_
0 1 0
.
.
.
.
.
.
.
.
.
1
0 0
_
_
_
_
_
_
, 1 i p.
Demonstra c ao: Pode ser encontrada em [Gan].
Esse resultado e tambem conhecido na literatura como teorema da
decomposi c ao espectral, uma vez que as colunas da matriz M correspon-
dem aos autovetores da matriz A. O Lema 246 permite-nos reescrever
a exponencial e
tA
na forma
e
tA
= e
tMJM
1
= M e
tJ
M
1
= M diag(e
tJ
1
, . . . , e
tJ
p
) M
1
.
Note ainda que
e
tJ
i
= e
t(
i
I+N
i
)
= e
t
i
e
tN
i
.
Portanto, para calcular-mos e
tA
basta que saibamos calcular e
tN
i
, 1
i p. Como as matrizes N
i
s ao idempotentes, i.e. N
i
k
= 0 para algum
k N (verique!), as series que denem e
tN
i
s ao na verdade somas
nitas, o que permite o calculo da exponencial e
tN
i
de forma direta.
Exemplo 247. Seja a matriz
A =
_
0 1
1 0
_
.
Calculando as potencias de A, temos
A
2k
=
_
(1)
k
0
0 (1)
k
_
, A
2k1
=
_
0 (1)
k+1
(1)
k
0
_
.
Portanto, a exponencial de tA e dada formalmente pela express ao
e
tA
=
_
_
_
_
k=0
(1)
k t
2k
(2k)!
k=1
(1)
k+1 t
2k1
(2k 1)!
k=1
(1)
k t
2k1
(2k 1)!
k=0
(1)
k t
2k
(2k)!
_
_
_
_
.
Recordando a deni c ao das fun c oes analticas sin t e cos t (veja [Ru2]),
conclumos que
e
tA
=
_
cos t sin t
sin t cos t
_
.
steuer
2008/3/11
page 335
i
i
i
i
i
i
i
i
ONOMOS 335
Calculemos agora e
tA
a partir da forma can onica de Jordan. Os autova-
lores de A s ao i e os respectivos autovetores s ao (i, 1), (i, 1). Podemos
ent ao calcular a matriz de transforma c ao M e sua inversa M
1
M =
_
i i
1 1
_
e M
1
=
1
2
_
i 1
i 1
_
.
Obtemos assim
J = M
1
AM =
_
i 0
0 i
_
, e
tJ
=
_
e
it
0
0 e
it
_
.
Usando as identidades: cos(t) = (e
it
+ e
it
)/2, sin(t) = (e
it
e
it
)/2i,
segue que
e
tA
= M e
tJ
M
1
=
_
cos t sin t
sin t cos t
_
.
Note que as colunas de e
tA
nos fornecem duas solu c oes linearmente in-
dependentes da equa c ao z
t
= Az. 2
Teorema 248. Seja A R
n,n
e R denido por
:= maxRe() [ autovalor de A.
Para cada > 0, existe uma constante c (dependendo de e A) tal que
|e
tA
| c e
(+)t
, t 0.
Demonstra c ao: Utilizando a forma can onica de Jordan temos:
|e
tA
|
2
= |Me
tM
1
AM
M
1
|
2
c
1
|e
tM
1
AM
|
2
= c
1
|e
tJ
|
2
c
2
p
i=1
|e
tJ
i
|
2
= c
3
p
i=1
[e
i
t
[
2
|e
tN
i
|
2
c
4
e
2t
p
i=1
|e
tN
i
|
2
.
Como as express oes |e
tN
i
| s ao apenas polinomiais em t, podemos limitar
seu crescimento por ce
t
, onde c > 0 e uma constante adequada, e o
resultado segue.
Conclumos a sec c ao obtendo solu c oes para problemas de valor inicial
n ao homogeneos, isto e problemas do tipo
(A.5) z
t
= Az + f(t), z(t
0
) = z
0
,
steuer
2008/3/11
page 336
i
i
i
i
i
i
i
i
336 [AP
ENDICE A: EQUAC

ARIAS
onde A R
n,n
e f L
1
([t
0
, t
1
]; R
n
).
3
Aceitamos como solu c ao para
(A.5) as solu c oes z C([t
0
, t
1
]; R
n
) da equa c ao integral
(A.6) z(t) = z
0
+
_
t
t
0
[Az(s) +f(s)] ds, t [t
0
, t
1
].
A rela c ao entre as solu c oes de (A.5) e (A.6), assim como a garantia
de existencia de solu c ao para tais problemas e analisada no teorema a
seguir.
Teorema 249. O problema de valor inicial n ao homogeneo (A.5) possui
exatamente uma solu c ao, a qual e expressa por
(A.7) z(t) = e
(tt
0
)A
z
0
+
_
t
t
0
e
(ts)A
f(s) ds, t [t
0
, t
1
].
Demonstra c ao: A fun c ao z denida em (A.7) satisfaz tanto a equa c ao
diferencial quanto a condi c ao inicial em (A.5), resolvendo assim a ques-
t ao da existencia.
Quanto à unicidade, caso v seja uma outra solu c ao de (A.5), ent ao w =
z v e solu c ao do problema homogeneo: w
t
= Aw com condi c ao inicial
w(t
0
) = 0. Como esse problema possui apenas a solu c ao trivial, temos
que 0 = w(t) = (z v)(t), para t [t
0
, t
1
], concluindo a demonstra c ao.
A.3 Sistemas Lineares nao Aut onomos
Consideramos a seguir sistemas homogeneos do tipo
(A.8) z
t
= A(t) z.
A existencia de solu c oes e conhecida quando A : [t
0
, t
1
] A(t) R
n,n
e
uma aplica c ao contnua, conforme nos revela o seguinte teorema:
Teorema 250. Seja A C([t
0
, t
1
]; R
n,n
), ent ao o problema de valor
inicial
(A.9) z
t
= A(t) z, z(t
0
) = z
0
3
Representamos por L
p
([t
0
, t
1
]; R
n
), 1 p < , n N, o espa co das fun c oes
p-Lebesgue integr aveis em [t
0
, t
1
] assumindo valores em R
n
.
steuer
2008/3/11
page 337
i
i
i
i
i
i
i
i
[SEC. A.3: SISTEMAS LINEARES N
AO AUT
ONOMOS 337
possui exatamente uma solu c ao z C
1
([t
0
, t
1
]; R
n
).
Demonstra c ao: Uma condi c ao necessaria para existencia de solu c oes do
problema (A.9) e que a equa c ao integral
(A.10) z(t) = (Fz)(t) := z
0
+
_
t
t
0
A(s) z(s) ds , t [t
0
, t
1
]
possua uma solu c ao z X := C([t
0
, t
1
]; R
n
). Note que F : X X esta
bem denida. Observe que, para toda constante real r, a norma denida
por
|z|
r
:= max[z(t)[ e
r(tt
0
)
[ t [t
0
, t
1
]
e equivalente à norma usual do espa co X: |z|
X
=|z|
=max[z(t)[ [ t
[t
0
, t
1
].
Denindo agora c(A) = max|A(t)| [ t [t
0
, t
1
] e tomando r > 2c(A),
temos para todo z, x X e t [t
0
, t
1
] que:
[Fz(t) Fx(t)[ = [
_
t
t
0
A(s) (z(s) x(s)) ds[
_
t
t
0
|A(s)| [z(s) x(s)[ ds
c(A)
_
t
t
0
e
r(st
0
)
e
r(st
0
)
[z(s) x(s)[ ds
c(A) |z x|
r
_
t
t
0
e
r(st
0
)
ds
c(A) r
1
e
r(tt
0
)
|z x|
r
.
Logo,
|Fz Fx|
r
1/2 |z x|
r
,
provando que a aplica c ao F e Lipschitz contnua em (X, | |
r
). Mais
que isso, provamos que F e uma contra c ao (i.e. |F| < 1) no espa co
normado completo X.
4
O teorema do ponto xo de Banach
5
garante
que F possui um ponto xo z C([t
0
.t
1
]; R
n
).
Da deni c ao de F e da identidade z = F z, podemos ainda concluir que
a fun c ao z esta em C
1
([t
0
, t
1
]; R
n
). Portanto, e uma solu c ao de (A.9).
4
Como (X; | |
) e completo e as normas | |
e | |
r
s ao equivalentes, ent ao
(X; | |
r
) tambem e completo.
5
Uma demonstra c ao pode ser encontrada em [Kre], Captulo 4.
steuer
2008/3/11
page 338
i
i
i
i
i
i
i
i
338 [AP
ENDICE A: EQUAC

ARIAS
A unicidade de solu c ao para (A.9), equivalentemente para equa c ao
Fz = z, e garantida novamente pelo teorema do ponto xo de Banach.
Observa cao 251. O resultado de existencia e unicidade do teorema
anterior pode ser tambem obtido da ideia de congelamento do tempo.
Para tanto, reescrevemos o problema a m de obter um sistema proximo
de ser aut onomo e n ao homogeneo.
z
t
= A(t
0
)z + (A(t) A(t
0
)) z, z(t
0
) = z
0
.
Para todo z C([t
0
, t
1
]; R
n
), a aplica c ao t [A(t) A(t
0
)]z(t) e ob-
viamente L
1
integravel. O Teorema 249 nos garante que a solu c ao da
equa c ao acima pode ser procurada entre as solu c oes da equa c ao integral
(A.11)
z(t) = (Fz)(t) := e
(tt
0
)A(t
0
)
z
0
+
_
t
t
0
e
(ts)A(t
0
)
(A(s) A(t
0
)) z(s) ds, t [t
0
, t
1
].
Equipando novamente o espa co X := C([t
0
, t
1
]; R
n
) com a norma |z|
r
podemos concluir que F e Lipschitzcontnua em (X; | |
r
), se esco-
lhermos r de forma adequada. De fato, denindo c(A) = max|A(t)
A(t
0
)| [ t [t
0
, t
1
], temos para todo z, x X e t [t
0
, t
1
]
[Fz(t) Fx(t)[ = [
_
t
t
0
e
(ts)A(t
0
)
(A(t) A(t
0
)) (z(s) x(s)) ds[
_
t
t
0
|e
(ts)A(t
0
)
| |A(t) A(t
0
)| [z(s) x(s)[ ds
c(A)
_
t
t
0
e
(ts)|A(t
0
)|
e
r(st
0
)
e
r(st
0
)
[z(s) x(s)[ ds
c(A) e
(tt
0
)|A(t
0
)|
|z x|
r
_
t
t
0
e
r(st
0
)
ds
c(A) e
(t
1
t
0
)|A(t
0
)|
|z x|
r
r
1
e
r(tt
0
)
.
Escolhendo r > 2 c(A) e
(t
1
t
0
) |A(t
0
)|
, temos
|Fz Fx|
r
1/2 |z x|
r
.
A partir deste ponto procedemos como na demonstra c ao do Teorema 249.
2
steuer
2008/3/11
page 339
i
i
i
i
i
i
i
i
AO AUT
ONOMOS 339
Observa cao 252. Sem o artifcio de redenir a norma do espa co
X := C([t
0
, t
1
]; R
n
) usando uma norma equivalente à norma usual de
(X, ||
), as hipoteses do Teorema 249 nos permitiriam garantir apenas

a existencia de uma solu c ao z em um intervalo de tempo [t
0
, ], onde
depende de A e n ao necessariamente = t
1
. Este problema pode porem
ser reparado prolongando esta solu c ao local, a m de obter uma solu c ao
global. 2
Observa cao 253.

E possvel concluir da demonstra c ao do Teorema 250
que a hipotese A C([t
0
, t
1
]; R
n
) pode ser enfraquecida para A
L
1
([t
0
, t
1
]; R
n
), desde que o conceito de solu c ao da EDO seja modi-
cado de forma adequada. 2
No teorema a seguir discutimos uma importante propriedade do con-
junto das solu c oes de um sistema linear n ao aut onomo.
Teorema 254. Seja A C([t
0
, t
1
]; R
n,n
). Ent ao o espa co c das solu c oes
do sistema
(A.12) z
t
= A(t) z
e um subespa co n-dimensional de C
1
([t
0
, t
1
]; R
n
).
Demonstra c ao: Escolhendo em (A.9) z
0
= e
i
, obtemos uma solu c ao
correspondente que denominamos z
i
. Deste modo, conseguimos obter
n solu c oes z
1
, . . . , z
n
, as quais s ao linearmente independentes (LI), uma
vez que os vetores can onicos e
1
, . . . , e
n
s ao LI. Portanto, Dim(c) n.
Sejam agora z
1
, . . . , z
n+1
solu c oes distintas. Como os vetores
z
1
(0), . . . , z
n+1
(0) est ao em R
n
, ent ao s ao necessariamente linearmente
dependentes (LD). Logo, existem constantes
1
, . . . ,
n+1
R tais que
n+1
k=1
[
k
[ ,= 0 e
n+1
k=1
k
z
i
(0) = 0.
Ent ao a fun c ao z(t) :=
n+1
k=1

k
z
k
(t) satisfaz
z(0) = 0 e z
t
= A z.
Como z C
1
([t
0
, t
1
]; R
n
), o Teorema 250 garante a unicidade de solu c ao
para este problema e temos z 0.
steuer
2008/3/11
page 340
i
i
i
i
i
i
i
i
340 [AP
ENDICE A: EQUAC

ARIAS
Deni cao 255. Seja A C([t
0
, t
1
]; R
n,n
). Denominamos por sistema
fundamental toda base z
1
, . . . , z
n
para espa co de solu c oes do sistema
(A.13) z
t
= A(t) z.
A matriz correspondente
Z(t) := (z
1
(t)[ . . . [z
n
(t)), t [t
0
, t
1
]
e denominada matriz fundamental do sistema (A.13). 2
Uma vez conhecida a matriz fundamental Z do sistema (A.13), pode-
mos escrever
Z
t
= A(t) Z.
Usando argumentos de unicidade e possvel concluir que
det Z(t) ,= 0, t [t
0
, t
1
].
Fica, portanto, claro que a unica solu c ao do problema de valor inicial
(A.14) z
t
= A(t) z , z(s) = z
0
,
para qualquer s [t
0
, t
1
], e dada por
z(t) = Z(t) Z(s)
1
z
0
, t [t
0
, t
1
].
Novamente usando argumentos de unicidade, conclumos que a fun c ao
matricial
[t
0
, t
1
] t Z(t) Z(s)
1
R
n,n
n ao pode depender da matriz fundamental Z. Portanto, duas matrizes
fundamentais diferem somente por uma matriz constante n ao singular
(verique!). Sendo assim, se torna importante a seguinte deni c ao:
Deni cao 256. Seja Z uma matriz fundamental para (A.13). A fun c ao
matricial denida pela aplica c ao (, s) : [t
0
, t
1
] R
n,n
A
(t, s) := Z(t) Z(s)
1
e denominada matriz de transi c ao do sistema (A.13).
6
2
6
Note que para sistemas aut onomos a matriz de transi c ao e
A
(t, s) = e
A(ts)
=
e
tA
e
sA
, conforme denido na Sec c ao A.2.
steuer
2008/3/11
page 341
i
i
i
i
i
i
i
i
AO AUT
ONOMOS 341
Lema 257. As seguintes opera c oes s ao v alidas:
A
(t, t) = I; (A.15)
A
(t, s) =
A
(t, r)
A
(r, s) (propriedade de semigrupo); (A.16)
A
(t, s)
1
=
A
(s, t); (A.17)
A
t
(t, s) = A(t)
A
(t, s), t [t
0
, t
1
]; (A.18)
Demonstra c ao:

E deixada como exerccio para o leitor.
Consideremos agora o seguinte problema de valor inicial n ao ho-
mogeneo
(A.19) z
t
= A(t) z + f(t) , z(t
0
) = z
0
,
onde A C([t
0
, t
1
]; R
n
) e f L
1
([t
0
, t
1
]; R
n
). Se consideramos como
solu c oes as fun c oes z C([t
0
, t
1
]; R
n
), que satisfazem a equa c ao integral
z(t) = z
0
+
_
t
t
0
[A(s)z(s) +f(s)] ds, t [t
0
, t
1
],
ent ao temos ao nosso dispor o seguinte teorema:
Teorema 258. Dados A C([t
0
, t
1
]; R
n
), f L
1
([t
0
, t
1
]; R
n
), z
0
R
n
,
o problema de valor inicial
(A.20) z
t
= A(t) z + f(t), z(t
0
) = z
0
possui uma unica solu c ao C([t
0
, t
1
]; R
n
), que e dada por
(A.21) z(t) =
A
(t, t
0
) z
0
+
_
t
t
0
A
(t, s) f(s) ds, t [t
0
, t
1
].
Demonstra c ao: Seja z a fun c ao denida em (A.21). De (A.15), temos
z(t
0
) = z
0
e de (A.18), temos
z
t
(t) = A(t)
A
(t, t
0
) z
0
+
_
t
t
0
A(t)
A
(t, s) f(s) ds +
A
(t, t) f(t)
= A(t) z + f(t), t [t
0
, t
1
],
vericando assim a existencia. A unicidade segue do fato do sistema
(A.19) possuir apenas solu c ao trivial quando z
0
= 0.
steuer
2008/3/11
page 342
i
i
i
i
i
i
i
i
342 [AP
ENDICE A: EQUAC

ARIAS
Outro problema abordado neste manuscrito e o associado com o sis-
tema adjunto ao sistema (A.13). Dada uma fun c ao matricial A : [t
0
, t
1
]
t A(t) R
n,n
, considere o sistema
(A.22) w
t
= A(t)
w,
onde a matriz A(t)
e a transposta de A(t) para t [t

0
.t
1
]. Seja Z
uma matriz fundamental para a equa c ao (A.13). De (A.15) obtemos a
identidade
I = Z(t) Z(t)
1
, t [t
0
, t
1
].
Derivando a identidade acima em rela c ao a t temos
0 =
dZ()
dt
(t) Z(t)
1
+Z(t)
dZ()
1
dt
(t) = A(t)
A
(t, t) +Z(t)
dZ()
1
dt
(t),
que implica em
0 = Z(t)
1
A(t) +
A
(t, t)
1
dZ()
1
dt
(t) = Z(t)
1
A(t) +
dZ()
1
dt
(t),
de onde nalmente obtemos
dZ()
1
dt
(t) = Z(t)
1
A(t) ou ainda
d
dt
(Z(t)
1
)
= A(t)
(Z(t)
1
)
.
Portanto, (Z(t)
1
)
e uma matriz fundamental do sistema adjunto

(A.22) e a matriz de transi c ao deste sistema e dada por
A
(t, s) := (
A
(t, s)
1
)
=
A
(s, t)
.
A.4 Sistemas nao Lineares: existencia e unici-
dade
Discutimos nesta sec c ao resultados relativos à teoria de existencia
e unicidade de solu c oes para sistemas din amicos n ao lineares e n ao
aut onomos. Iniciamos a discuss ao introduzindo um conceito de regu-
laridade de fun c oes, que e fundamental para a analise subseq uente.
Deni cao 259. Seja D um subconjunto do R
n
. Uma fun c ao f : D R
e denominada Lipschitz contnua em D quando existe uma constante
L > 0 tal que
[f(x) f(y)[ L [x y[,
para todos x, y D. 2
steuer
2008/3/11
page 343
i
i
i
i
i
i
i
i
[SEC. A.4: SISTEMAS N
AO LINEARES: EXIST
ENCIA E UNICIDADE 343

Na seq uencia analisamos um teorema que garante existencia local de
solu c oes para sistemas de equa c oes de primeira ordem. O leitor atento
nota que a demonstra c ao, baseada no denominado metodo de aproxima-
c oes sucessivas, se assemelha a do Teorema 250.
Teorema 260. Seja D R
n
aberto, f : [T
0
, T
1
]

D R
n
Lipschitz
contnua com respeito a segunda vari avel (com constante de Lipschitz
L) e (t
0
, z
0
) (T
0
, T
1
) D. Existe > 0 tal que o problema de valor
inicial (ou problema de Cauchy)
z
t
(t) = f(t, z(t)), t (T
0
, T
1
), z(t
0
) = z
0
possui uma solu c ao (local) z C
1
((t
0
, t
0
+); R
n
).
Demonstra c ao: Por hipotese, existem a, b > 0 tais que o ret angulo R de
lados [a, a][b, b]
n
e centrado em (t
0
, z
0
) esta contido em (T
0
, T
1
)D.
Dena
M := |f|
;R
e := maxa, b/M.
Se z e solu c ao do problema de valor inicial, ent ao
z(t) = z
0
+
_
t
t
0
f(t, z(t)) dt.
Argumentando como na demonstra c ao do Teorema 250, a existencia ca
provada se encontrarmos uma solu c ao z C
1
[t
0
, t
0
+ ] da equa c ao
de ponto xo Tz = z, onde o operador T : C
1
C
1
e denido por
(Tz)(t) := z
0
+
_
t
t
0
f(t, z(t)) dt, t [t
0
, t
0
+].
O metodo das aproxima c oes sucessivas nos fornece um modo construtivo
para determinar tal solu c ao. Para k = 0, dena z
(0)
(t) z
0
e para k 1,
dena
z
(k)
(t) = (Tz
(k1)
)(t), t [t
0
, t
0
+].
Dado t [t
0
, t
0
+], podemos estimar
[z
(1)
z
0
[
_
t
t
0
[f(t, z
0
)[ dt M[t t
0
[ M b.
steuer
2008/3/11
page 344
i
i
i
i
i
i
i
i
344 [AP
ENDICE A: EQUAC

ARIAS
Aplicando o argumento acima sucessivamente, obtemos [z
(k)
(t)z
0
[ b.
Provamos a seguir que a seq uencia z
(k)
converge uniformemente e que
o seu limite z e uma solu c ao de Tz = z. Inicialmente reescrevemos
z
(k)
= z
(0)
+ [z
(1)
z
(0)
] + + [z
(k)
z
(k1)
].
Concentremo-nos por um momento nos termos da soma acima. Recorde
que [z
(1)
z
0
[ M[t t
0
[. Usando um argumento indutivo provamos
que (verique!)
[z
(k)
z
(k1)
[ L
k1
M
[t t
0
[
k
k!
.
Temos assim a estimativa
[z
(k)
(t)[ [y
0
[ +
k
j=1
M
L
(L)
k
k!
.
Isto e, reescrevemos z
(k)
como soma parcial de uma serie que e limi-
tada pela serie exponencial. Portanto, a seq uencia z
(k)
converge uni-
formemente em [t
0
, t
0
+ ] e seu limite z := lim
k
z
(k)
e uma fun c ao
C
1
([t
0
, t
0
+]; R
n
). A convergencia uniforme de z
(k)
e a continuidade
de f implicam em
f(t, z
(k)
(t))
unif
f(t, z(t)).
De fato, esta arma c ao segue da desigualdade [f(t, z
(k)
(t))f(t, z(t))[
L[z
(k)
(t) z(t)[. Portanto, temos que
(Tz)(t) = z
0
+
_
t
t
0
lim
k
f(t, z
(k)
(t)) dt
= lim
k
(Tz
(k)
)(t) = lim
k
(z
(k+1)
(t)) = z(t),
provando o teorema.
Note que o metodo das aproxima c oes sucessivas na demonstra c ao
acima substitui o teorema de ponto xo de Banach usado na demons-
tra c ao do Teorema 250. Com esse metodo construmos uma seq uencia
de Cauchy especial no espa co de Banach (C
1
(t
0
, t
0
+ ); | |
1;
) e
utilizamos argumentos classicos da analise real para demonstrar que o
limite dessa seq uencia e uma solu c ao do problema de valor inicial.
No teorema a seguir vericamos que a solu c ao encontrada no Teo-
rema 260 e a unica solu c ao do problema de valor inicial.
steuer
2008/3/11
page 345
i
i
i
i
i
i
i
i
AO LINEARES: EXIST
ENCIA E UNICIDADE 345

Teorema 261. Seja D R
n
aberto, f : [T
0
, T
1
]

D R
n
Lipschitz
contnua com respeito a segunda vari avel (com constante de Lipschitz L)
e (t
0
, z
0
) (T
0
, T
1
) D. Sejam ainda > 0 e z C
1
((t
0
, t
0
+); R
n
)
denidos como na demonstra c ao do Teorema 260. Ent ao a fun c ao z e
a unica solu c ao do problema de valor inicial
z
t
(t) = f(t, z(t)), t (T
0
, T
1
), z(t
0
) = z
0
.
Demonstra c ao: Suponha que z e outra solu c ao do problema de valor
inicial em [t
0
, t
0
+ ]. Para provar a unicidade de solu c ao, basta
provar que a seq uencia z
(k)
denida na demonstra c ao do Teorema 260
converge uniformemente para z em [t
0
, t
0
+].
Para t [t
0
, t
0
+], temos
z(t) = z
0
+
_
t
t
0
f(t, z(t)) dt,
de onde obtemos [ z(t) z
(0)
(t)[ M[t t
0
[. Da deni c ao de z
(k)
segue
que
[ z(t) z
(1)
(t)[
_
t
t
0
[f(t, z(t)) f(t, z
(0)
(t))[ dt
L
_
t
t
0
[ z(t) z
(0)
(t)[ dt LM
[t t
0
[
2
2!
.
Utilizando um argumento indutivo (verique!) provamos que, para todo
t [t
0
, t
0
+] e k 1,
[ z(t) z
(k)
(t)[
M
A
(A[t t
0
[)
k+1
(k + 1)!

M
A
(A)
k+1
(k + 1)!
.
Como o lado direito da express ao acima converge para zero quando k
, ca provada a convergencia uniforme de z
(k)
para z em [t
0
, t
0
+].
Observa cao 262. Existe uma forma alternativa de se provar unicidade
sem utilizar o Teorema de existencia 260. Suponha que z
1
, z
2
C
1
s ao
duas solu c oes locais do problema de valor inicial
z
t
(t) = f(t, z(t)), t (t
0
, t
0
+), z(t
0
) = z
0
.
steuer
2008/3/11
page 346
i
i
i
i
i
i
i
i
346 [AP
ENDICE A: EQUAC

ARIAS
Integrando a equa c ao diferencial, temos que
(A.23)
[z
1
(t) z
2
(t)[
_
t
t
0
[f(s, z
1
(s)) f(s, z
2
(s))[ ds
L
_
t
t
0
[z
1
(s) z
2
(s)[ ds,
onde L e a constande de Lipschitz de f. Note que a fun c ao escalar
denida por
(t) := max[z
1
(t) z
2
(t)[; t (t
0
, t)
e n ao negativa, n ao decrescente e (t
0
) = 0. Para provar o teorema,
basta vericar que 0. Suponha por contradi c ao que existe
t
1
[t
0
, t
0
+) tal que
(t) = 0, t [t
0
, t
1
] e (t) > 0, t (t
1
, t
1
+)
para > 0 pequeno. De (A.23) segue que
[(t)[ L
_
t
t
1
[(s)[ ds L(t)[t t
1
[, t (t
1
, t
1
+),
o que e claramente um absurdo. Fica assim provado que 0 em
[t
0
, t
0
+ ). Um argumento analogo nos permite concluir que 0 em
(t
0
, t
0
], completando a demonstra c ao. 2
A demonstra c ao alternativa do Teorema 260, descrita na observa c ao
acima, ca em muito simplicada quando utilizamos o lema de Gronwall
(veja Lema 264) para provar que 0 em (t
0
, t
0
+].
Observa cao 263. Note que, sem a hipotese de f ser Lipschitz contnua,
o resultado acima n ao e necessariamente valido. De fato, a fun c ao
f(t, z) = z
1/3
e contnua na origem, mas o problema
_
z
t
(t) = f(t, z), t (h, h)
z(0) = 0
admite as solu c oes
z
1
0 e z
2
(t) =
_
(
2
3
t)
3/2
, t 0
0, t < 0
,
como o leitor pode facilmente vericar. 2
steuer
2008/3/11
page 347
i
i
i
i
i
i
i
i
AO LINEARES: DEPEND
ENCIA CONT
INUA 347
A.5 Sistemas nao Lineares: dependencia cont-
nua
Iniciamos esta sec c ao demonstrando a estimativa conhecida na lite-
ratura como lema de Gronwall, a qual e utilizada na demonstra c ao do
Teorema 65.
Lema 264. Dadas as constantes , > 0, se uma fun c ao contnua
w : [0, T] R satisfaz
w(t) +
_
t
0
w(s) ds, t [0, T],
podemos estimar o crescimento de w por
w(t) e
t
, t [0, T].
Demonstra c ao: Seja > 0 e dena v(t) := ( +)e
t
para t [0, T]. A
fun c ao v satisfaz a equa c ao diferencial v
t
= v. Logo, v tambem satisfaz
a equa c ao integral
v(t) = + +
_
t
0
v(s) ds, t [0, T].
Dena S := t [0, T] [ w(s) < v(s) para s [0, t]. Por constru c ao,
temos 0 S. Dena agora t
0
:= inft; t [0, T]S. Suponha que
t
0
< T. Como w e v s ao contnuas, segue da deni c ao de S e t
0
que
w(t
0
) = v(t
0
). Porem, da desigualdade
w(t
0
) +
_
t
0
0
w(s) ds < + +
_
t
0
0
v(s) ds = v(t
0
)
obtemos uma contradi c ao à hipotese t
0
< T. Temos, portanto, que
t
0
= T. De onde conclumos que
w(t) ( +) e
t
, t [0, T].
Como > 0 e arbitrario, o lema ca provado.
Existem diversas variantes do Lema 264. No lema a seguir apresen-
tamos uma delas, que e utilizada neste manuscrito.
steuer
2008/3/11
page 348
i
i
i
i
i
i
i
i
348 [AP
ENDICE A: EQUAC

ARIAS
Lema 265. Dadas a constante > 0 e fun c oes contnuas w, u : [0, T]
R satisfazendo u(t) 0 e
w(t) +
_
t
0
u(s) w(s) ds, t [0, T],
ent ao podemos estimar o crescimento de w por
w(t) e
t
0
u(s)ds
, t [0, T].
Demonstra c ao: Para 0 dado, denimos a fun c ao
w
(t) := + +
_
t
0
u(s)w(s) ds, t [0, T].
Temos assim que w
t
(s) = u(s)w(s). Usando as hipoteses, segue que
w
t
(s) u(s)w
(s), o que pode ser reescrito na forma w
t
(s)(w
(s))
1
u(s). Integrando esta ultima express ao obtemos

ln w
(t) ln w
(0)
_
t
0
u(s) ds, t [0, T].
Tomando a exponencial dos dois lados, obtemos
w
(t)(w
(0))
1
e
t
0
u(s)ds
, t [0, T].
Utilizando agora a desigualdade w(t) w
(t) e a identidade w
(0) =
+, obtemos
w(t) ( +)e
t
0
u(s)ds
, t [0, T].
Como > 0 e arbitrario, o lema ca provado.
Provamos agora o resultado principal da sec c ao, o qual garante que,
sob hipoteses apropriadas, a solu c ao de um problema de valor inicial
depende continuamente das condi c oes iniciais.
Lema 266. Seja D R
n
aberto e f : D D Lipschitz contnua em
D com constante de Lipschitz L. Seja ainda z : D D uma solu c ao
de z
t
= f(z), z(0) = z
0
e y C
1
(D; D) continuamente diferenci avel
satisfazendo
[y(0) z(0)[ a, [y
t
(t) f(y(t))[ b, t [0, T].
steuer
2008/3/11
page 349
i
i
i
i
i
i
i
i
AO LINEARES: DEPEND
ENCIA CONT
INUA 349
Ent ao vale a estimativa
[y(t) z(t)[ (a +bT) e
Lt
, t [0, T].
Demonstra c ao: Para t [0, T], temos
[y(t) z(t)[ = [y(0) z(0) +
_
t
0
(y
t
(s) z
t
(s)) ds[
a +
_
t
0
([y
t
(s) f(y(s))[ +[f(y(s)) f(z(s))[) ds
a +bt +
_
t
0
L[y(s) z(s)[ ds
a +bT +
_
t
0
L[y(s) z(s)[ ds.
Denindo w(t) := [y(t) z(t)[, obtemos da desigualdade acima que
w(t) a +bT +L
_
t
0
w(s) ds, t [0, T].
A estimativa desejada segue agora do lema de Gronwall (Lema 264)
aplicado à fun c ao w com = a +bT e = L.
Corolario 267. Seja D R
n
aberto e f : D D Lipschitz contnua em
D com constante de Lipschitz L. Sejam ainda z, y : D D solu c oes
de z
t
= f(z), satisfazendo z(0) = z
0
e y(0) = y
0
, com
[y(0) z(0)[ a.
Ent ao vale a estimativa
[y(t) z(t)[ a e
Lt
, t [0, T].
Demonstra c ao: Tome b = 0 na demonstra c ao do Lema 266
Observa cao 268. Na verdade, e possvel obter uma estimativa melhor
do que a apresentada no Lema 266. De fato, e possvel provar que
[y(t) z(t)[ ae
Lt
+bL
1
(e
Lt
1), t [0, T].
Para detalhes consulte [Sot]. 2
steuer
2008/3/11
page 350
i
i
i
i
i
i
i
i
350 [AP
ENDICE A: EQUAC

ARIAS
A.6 Metodo de Shooting
Analisamos nesta sec c ao um metodo iterativo para solucionar uma
famlia especial de problemas de valor de contorno, a saber: aqueles em
que parte das condi c oes de contorno e dada no tempo inicial e parte no
tempo nal. Estudamos inicialmente o caso linear, que corresponde aos
sistemas da forma
(A.24)
_
_
_
z
t
= A(t) z + f(t), t (t
0
, t
1
)
z
i
(t
0
) = c
i
, i = 1, . . . , r
z
i
(t
1
) = d
i
, i = r + 1, . . . , n,
onde as constantes c
i
, d
i
R e 0 < r < n s ao dadas, assim como as
fun c oes A C([t
0
, t
1
]; R
n
), f L([t
0
, t
1
]; R
n
).
O objetivo e identicar as condi c oes iniciais z
i
(t
0
), i = r + 1, . . . , n,
para ent ao tratar o problema (A.24) como um problema de valor inicial.
Para tanto, considere o sistema adjunto ao sistema z
t
= Az, i.e. o
sistema
w
t
= A
w, w(t
0
) = w
0
.
Como vimos na Sec c ao A.3, as solu c oes dos problemas de valor inicial
para sistemas adjuntos satisfazem
z(t
1
) =
A
(t
1
, t
0
) z
0
+
_
t
1
t
0
A
(t
1
, s)f(s) ds, t [t
0
, t
1
],
w(t
1
) =
A
(t
0
, t
1
)
w
0
.
Logo,
w(t
1
)
z(t
1
) = w(t
1
)
A
(t
1
, t
0
) z(t
0
) +
_
t
1
t
0
w(t
1
)
A
(t
1
, s)f(s) ds
= w(t
0
)
z(t
0
) +
_
t
1
t
0
w(t
1
)
A
(t
1
, s)f(s) ds
= w(t
0
)
z(t
0
) +
_
t
1
t
0
w(s)
f(s) ds. (A.25)

Dena agora as solu c oes w
(i)
, i = 1, . . . , n r dos seguintes problemas
de valor inicial (com condi c ao nal em t = t
1
):
w
t
= A
w, w(t
1
) = e
r+i
,
steuer
2008/3/11
page 351
i
i
i
i
i
i
i
i
[SEC. A.6: M
ETODO DE SHOOTING 351

onde e
i
e o i-esimo vetor can onico do R
n
. Por constru c ao, temos que
w
(i)
(t
1
)
z(t
1
) = z
r+i
(t
1
) = d
r+i
, para i = 1, . . . , n r. Substituindo em
(A.25), obtemos para cada i = 1, . . . , n r que
d
r+i
= w(t
0
)
z(t
0
) +
_
t
1
t
0
w(s)
f(s) ds.
Desta identidade conclumos que
(A.26)
n
j=r+1
w
(i)
j
(t
0
)z
j
(t
0
) = d
r+i

r
j=1
w
(i)
j
(t
0
)c
j
_
t
1
t
0
w
(i)
(s)
f(s) ds, i = 1, . . . , n r.
Note que (A.26) e um sistema linear comnr equa c oes para as incognitas
z
r+1
(t
0
), . . ., z
n
(t
0
). Resolvendo-o, obtemos todas as condi c oes iniciais
em t = t
0
para o problema (A.24) e podemos soluciona-lo como um
problema de valor inicial usual. A inversibilidade da matriz [w
(i)
j
(t
0
)]
do sistema (A.26) se deve ao fato de w
(1)
, . . . , w
(nr)
serem solu c oes
linearmente independentes do sistema adjunto.
Caso r n/2, podemos minimizar os calculos a serem realizados se
obtivermos um sistema analogo ao (A.26) para reconstruir as condi c oes
nais z
1
(t
1
), . . . , z
r
(t
1
), bastando para isso trocar os papeis das condi c oes
iniciais e nais no desenvolvimento acima. O metodo descrito acima e
denominado metodo de equa c oes adjuntas.
Analisamos a seguir o denominado metodo de shooting, que fornece
aproxima c oes para a solu c ao do seguinte problema de valor de contorno:
_
_
_
z
t
= f(z), t (t
0
, t
1
)
z
i
(t
0
) = c
i
, i = 1, . . . , r
z
i
(t
1
) = d
i
, i = r + 1, . . . , n
Como no metodo de equa c oes adjuntas, o objetivo e determinar as
condi c oes iniciais z
r+1
(t
0
), . . . , z
n
(t
0
), a m de obter um problema de
valor inicial e resolve-lo por um metodo de integra c ao adequado.
O metodo iterativo e iniciado escolhendo-se arbitrariamente valores
z
(0)
r+1
, . . . , z
(0)
n
. Estes s ao utilizados juntamente com as condi c oes iniciais
fornecidas c
i
, i = 1, . . . , r para resolver o problema de valor inicial (PVI)
correspondente. A solu c ao deste PVI e denominada z
(0)
. O proximo
steuer
2008/3/11
page 352
i
i
i
i
i
i
i
i
352 [AP
ENDICE A: EQUAC

ARIAS
passo e escolher para k 0, fun c oes
(k)
: [t
0
, t
1
] R
n
, de modo que
z
(k+1)
denida por
z
(k+1)
(t) := z
(k)
(t) +
(k)
(t),
satisfa ca z
(k+1)
(t) = f(z
(k+1)
) e ainda
(A.27)
z
(k+1)
i
(t
0
) = c
i
, i = 1, . . . , r e z
(k+1)
i
(t
1
) = d
i
, i = r + 1, . . . , n.
Se
(k)
e escolhida desta forma, temos

(k)
(t) = z
(k+1)
(t) z
(k)
(t) = f(z
(k+1)
) f(z
(k)
)
_
f
i
z
j
(z
(k)
)
_
(z
(k+1)
(t) z
(k)
(t)) = J(z
(k)
)
(k)
(t), (A.28)
onde J e o jacobiano de f. Das condi c oes de contorno (A.27), temos
ainda que
(k)
i
(t
0
) = 0, i = 1, . . . , r e
(k)
i
(t
1
) = d
i
z
(k)
i
(t
1
), i = r+1, . . . , n.
Portanto, cada
(k)
e solu c ao de um problema de valor de contorno
linear, a saber:
_
_

(k)
= J(z
(k)
)
(k)
, t [t
0
, t
1
]
(k)
i
(t
0
) = 0, i = 1, . . . , r
(k)
i
(t
1
) = d
i
z
(k)
i
(t
1
), i = r + 1, . . . , n,
o qual pode ser resolvido pelo metodo de equa c oes adjuntas, discutido no
incio da sec c ao. O metodo iterativo ca assim bem denido. Um criterio
de parada usualmente utilizado e calcular o erro |z
(k+1)
(t
1
)z
(k)
(t
1
)| =
|
(k)
(t
1
)| e terminar o algoritmo quando este for pequeno o bastante.
E possvel demonstrar que o metodo de shooting descrito acima e

uma aplica c ao particular do metodo de NewtonRaphson. Portanto, se
a aproxima c ao inicial estiver proxima o bastante da solu c ao, se J(z
(k)
)
for n ao singular e se o intervalo [t
0
, t
1
] n ao for muito grande, e possvel
obter convergencia do metodo. O metodo de shooting pode ser resumido
na forma do algoritmo apresentado na Tabela A.1
Variantes do metodo de shooting (n ao linear; com condi c oes de con-
torno implcitas; shooting m ultiplo) s ao discutidas em [Know].
steuer
2008/3/11
page 353
i
i
i
i
i
i
i
i
EXERC
ICIOS 353
1. k := 0; Escolha z
(0)
r+1
(t
0
), . . . , z
(0)
n
(t
0
) R;
2. Resolva o PVI
_
z
t
= f(z), t [t
0
, t
1
]
z(t
0
) = (c
1
, . . . , c
r
, z
(k)
r+1
(t
0
), . . . , z
(k)
n
(t
0
))
e obtenha a solu c ao z
(k)
(t);
3. Resolva pelo metodo de equa c oes adjuntas o PVC linear
_
_
_
= J(z
(k)
) , t [t
0
, t
1
]
i
(t
0
) = 0, i = 1, . . . , r
i
(t
1
) = d
i
z
(k)
i
(t
1
), i = r + 1, . . . , n
e obtenha a solu c ao
(k)
(t).
7
Na verdade nos interessa apenas
calcular as ultimas n r componentes do vetor
(k)
(t
0
);
4. Calcule z
(k+1)
(t
0
) := z
(k)
(t
0
) +
(k)
(t
0
);
5. Se |
(k)
(t
1
)| e pequeno o bastante PARE;
Sen ao k := k + 1; volte ao Passo 2.
Tabela A.1: Algoritmo para o metodo de shooting
Exerccios
A.1. Escreva a EDO z
tt
3z
t
+2z = 0 na forma de sistema e calcule a
matriz de transi c ao.
A.2. Dado > 0, resolva o PVI z
tt
3z
t
+2z = f(t), z(0) = 1, z
t
(0) = 0,
onde
f(t) =
_
_
_
0, t < 2
1/, t [2, 2 +)
0, t 2 +
.
A.3. Dada A C
n,n
, dena formalmente a matriz
sin A :=
k=1
(1)
k
1
(2k 1)!
A
2k1
.
7
Note que o sistema adjunto ao sistema (A.28) e w
(k)
= J(z
(k)
)
w
(k)
.
steuer
2008/3/11
page 354
i
i
i
i
i
i
i
i
354 EXERC
ICIOS
Para quais matrizes A a serie acima converge? Calcule sin A para
A =
_
3 2
2 3
_
.
A.4. Considere o problema de valor de contorno
z
t
= A(t)z +f(t), t [t
0
, t
1
], Rz = g,
onde Rz := Cz(t
0
) + Dz(t
1
), g R
n
, C, D R
n,n
. Seja Z(t) a matriz
fundamental do sistema z
t
= A(t)z. Prove a equivalencia das arma c oes
abaixo:
a) O problema homogeneo z
t
= Az, Rz = 0 possui apenas solu c ao
trivial;
b) A matriz CZ(t
0
) +DZ(t
1
) e regular;
c) Dadas f C([t
0
, t
1
]; R
n
), g R
n
o PVC possui exatamente uma
solu c ao.
A.5. Para quais matrizes A C
n,n
existe uma matriz correspondente
R C
n,n
, tal que e
R
= A? (A matriz R e denominada logaritmo de A.)
(Dica: Construa R para blocos de Jordan, de forma analoga à serie
ln(1 +) =
k=0
(1)
k
k + 1

k+1
,
denida para [[ < 1.)
A.6. Reescreva a demonstra c ao sugerida na Observa c ao 262 utilizando
o lema de Gronwall para provar que 0.
A.7. Resolva pelo metodo de equa c oes adjuntas o problema de valor
de contorno
z
tt
= z +t, z(0) = 0, z(1) = .
A.8. Prove que a equa c ao diferencial
x
tt
+x +b(t) = 0,
com b(t + 2) = b(t), t R, possui uma solu c ao periodica com perodo
2, se e somente se
_
2
0
b(T) cos(t)dt =
_
2
0
b(T) cos(t)dt = 0.
steuer
2008/3/11
page 355
i
i
i
i
i
i
i
i
EXERC
ICIOS 355
A.9. Considere o sistema n ao linear z
t
= f(z), onde z = (z
1
, z
2
, z
3
),
f(z) :=
_
_
1 z
1
z
1
z
2
(a
1
+z
1
)
1
a
2
(1 z
1
3
)z
2
z
2
a
3
z
1
(a
1
+z
1
)
1
a
2
(z
3
1)
_
_
e a
1
, a
2
, a
3
s ao constantes positivas.
a) Prove que o conjunto aberto M := z R
3
[ z
i
> 0, i = 1, 2, 3
e positivo invariante, i.e. uma trajetoria com condi c ao inicial em M,
permanece neste conjunto durante todo seu intervalo de existencia.
b) Qual equa c ao diferencial e satisfeita pela fun c ao v := z
1
+a
1
3
z
2
z
3
?
c) Calcule para a
2
a
3
a
2
a
3
a
1
a
2
> 0 os pontos de equilbrio do
sistema e discuta sua estabilidade.
A.10. Considere o sistema z
t
= Az b, z(0) = z
0
, onde A R
n,n
e
uma matriz estavel, b, z
0
R
n
.
a) Mostre que uma solu c ao z do sistema existe para todo t 0.
b) Prove que x := lim
t
z(t) existe e ainda que satisfaz Ax = b.
A.11. Seja A R
n,n
e p
A
o polin omio caracterstico correspondente,
i.e.
p
A
(z) := det(zI A) = z
n
+c
n1
z
n1
+ +c
1
z +c
0
.
Verique que a exponencial (t) := e
At
, t R e solu c ao de
(n)
+c
n1
(n1)
+ +c
1
t
+c
0
= 0.
(0) = I,
t
(0) = A, . . . ,
(n1)
(0) = A
n1
.
steuer
2008/3/11
page 356
i
i
i
i
i
i
i
i
Apendice B
Demonstracao do Princpio
do Maximo
Neste apendice apresentamos uma demonstra c ao do princpio de
Pontryagin para problemas com horizonte nito (tempo nal livre), a
qual se baseia nas notas de aula de M. Brokate (veja [Br]). A demons-
tra c ao se divide em tres partes principais:
Na Sec c ao B.1 obtemos um conjunto de condi c oes necessarias para
otimalidade de solu c oes de um problema abstrato de otimiza c ao
em espa cos de dimens ao innita;
Na Sec c ao B.2 aplicamos o resultado do item anterior a um pro-
blema auxiliar, construido a partir do problema de controle otimo
atraves de uma reparametriza c ao da variavel de tempo;
Na Sec c ao B.3 invertemos a parametriza c ao do item anterior, a
m de reescrever as condi c oes necessarias para o problema auxi-
liar e obter as desejadas condi c oes necessarias para o problema de
controle otimo.
Outras demonstra c oes do princpio do maximo para os problemas
aqui tratados (horizonte nito) podem ser encontradas em [LiYo] e [Tr].
B.1 Otimizacao Innita
Investigamos nesta sec c ao condi c oes necessarias para otimalidade de
problemas de minimiza c ao em espa cos de dimens ao innita envolvendo
steuer
2008/3/11
page 357
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 357
fun c oes continuamente diferenciaveis.
B.1.1 Um Problema Abstrato de Otimizacao
A ttulo de motiva c ao, suponha que J : R
n
R e uma aplica c ao
diferenciavel. Se x R
n
e tal que
J( x) = min
xR
n
J(x),
ent ao o gradiente de J se anula em x, i.e. J( x) = 0. A recproca e
verdadeira se J for convexo.
Considere agora o problema de otimiza c ao restrito:
_
_
Minimizar J(x)
sujeto a
g
i
(x) 0 , 1 i m,
h
i
(x) = 0, 1 i l
onde J : U R, G = (g
1
, . . . , g
m
) : U R
m
, H = (h
1
, . . . , h
l
) : U
R
l
s ao aplica c oes diferenciaveis no aberto U R
n
. Representamos as
restri c oes de forma simplicada por G(x) 0, H(x) = 0.
As condi c oes necessarias para otimalidade deste problema s ao forneci-
das pelo teorema dos multiplicadores de Lagrange.
Teorema 269. Sejam J, G, H fun c oes satisfazendo as condi c oes acima.
Se a fun c ao J sujeita ` as restri c oes G(x) 0, H(x) = 0 possui um
extremo local (max/min) em x, ent ao existem R, = (
1
, . . . ,
m
)
R
m
, = (
1
, . . . ,
l
) R
l
tais que:
(i) J( x) +
m
i=1
i
g
i
( x) +
m
j=1
j
h
j
( x) = 0;
(ii)
i
0,
i
g
i
( x) = 0, 1 i m;
(iii) 0, [[ +[[ +[[ ,= 0.
Nesta sec c ao obtemos, em espa cos de Banach, um resultado analogo
ao Teorema 269 (de preferencia com ,= 0). Tal resultado e usado mais
adiante para demonstrar o princpio do maximo (ver Sec c ao B.2).
steuer
2008/3/11
page 358
i
i
i
i
i
i
i
i
358 [AP
ENDICE B: DEMONSTRAC
AO DO PRINC
IPIO DO M
AXIMO
Antes de prosseguir com a formula c ao do problema de otimiza c ao
em espa cos de Banach, necessitamos de alguns conceitos topologicos
basicos. Sejam X, Y espa cos normados, M X, z X. Adotamos
a seguinte nota c ao: B
r
(z) := x [ [[x z[[ r, B
r
:= B
r
(0), r > 0.
int(M) := x X [ r > 0 com B
r
(x) M, cl(M) := Xint(XM).
B(X, Y ) := T [ T : X Y linear, contnua, X
:= B(X, R).
Note que B(X, Y ) e tambem um espa co normado e sera completo
quando Y for completo. O espa co X
e denominado dual topologico de

X. O ultimo conceito de que necessitamos diz respeito à diferenciabili-
dade de aplica c oes denidas em espa cos de Banach.
Deni cao 270. Sejam X, Y Espa cos de Banach e O X aberto.
i) F : O Y e (Frechet-)diferenci avel em x O, quando existe
T B(X, Y ) satisfazendo
lim
h0
|F(x +h) F(x) Th|
|h|
= 0.
dF(x) := T e denominada derivada de F em x. (
E unicamente
determinada!)
ii) F : O Y e continuamente (Frechet-)diferenci avel em O, quando
F e diferenciavel em todo x O e a aplica c ao dF : O B(X, Y )
e contnua.
2
Podemos enm formular o problema abstrato de otimiza c ao men-
cionado no incio da sec c ao.
(P)
_
Minimizar J(x)
sujeito a x C, F(x) K
onde X, Y s ao espa cos de Banach; O X aberto; C X, K Y
s ao fechados e convexos; J : O R, F : O Y s ao continuamente
diferenciaveis.
Na teoria de controle otimo a condi c ao x C esta associada a uma
limita c ao no controle (e.g. u(t) q.s.) e a restri c ao F(x) K re-
presenta a equa c ao diferencial (ou integral) assim como outras equa c oes
envolvendo a variavel de estado (e.g. (t
1
, z(t
1
)) = 0).
A forma desejada do teorema de multiplicadores que procuramos e:
steuer
2008/3/11
page 359
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 359
C(x)
C
x
(C x)
T(C, x)
C
x
(C x)
Figura B.1: Cones tangenciais C(x) e T(C, x).
Conjectura: [Lagrange generalizado] Se x e mnimo local do pro-
blema (P), ent ao existem R, X
, Y
tais que
i) dJ( x) dF( x) = ;
ii) 0, +|| +|| ,= 0.
onde e satisfazem ainda outras restri c oes com respeito a C e K (e
preferencialmente ,= 0).
Veremos a seguir que o resultado desejado e obtido aproximando-se
localmente o conjunto dos pontos admissveis X
ad
:= C F
1
(K) O
para (P) por conjuntos convexos apropriados e utilizando um teorema
de separa c ao para conjuntos convexos em espa cos de Banach.
B.1.2 Linearizacao do Problema de Otimizacao
Deni cao 271. Seja X um espa co de Banach, C X convexo, x C.
O conjunto
C(x) := a(c x) [ a 0, c C
e denominado cone tangencial em x por C (veja Figura B.1). 2
Deni cao 272. Seja X um espa co de Banach, M X, x M. O
conjunto
T(M, x) := h X [ t
0
> 0 e r : [0, t
0
] X tal que
x +th +r(t) M para t [0, t
0
], lim
t0
r(t)/t = 0
steuer
2008/3/11
page 360
i
i
i
i
i
i
i
i
360 [AP
AO DO PRINC
IPIO DO M
AXIMO
e denominado cone tangencial a M por x (veja Figura B.1). 2
Lema 273. Seja X um espa co de Banach, C X fechado e convexo,
x C. S ao verdadeiras as arma c oes:
(i) C x, (C x)
1
, C(x) s ao convexos;
(ii) C x, (C x)
1
s ao fechados;
(iii) C(x) T(C, x);
onde (M)
1
:= M B
1
, para todo subconjunto M de um espa co norma-
do Z.
Demonstra c ao: Segue imediatamente das Deni c oes 271 e 272.
Teorema 274. Se x X
ad
= C F
1
(K) O e um mnimo local de
(P), temos ent ao para todo h T(X
ad
, x) que
dJ( x) h 0.
Demonstra c ao: Sejam t
0
R e r : [0, t
0
] X escolhidos como na
Deni c ao 272 para o cone tangencial T(X
ad
, x). Logo, para todo t
(0, t
0
], temos
0 t
1
(J( x +th +r(t)) J( x))
t
1
(J( x +th) J( x)) + t
1
(J( x +th +r(t)) J( x +th))
t
1
(J( x +th) J( x)) + t
1
|dJ(
t
)| |r(t)|,
onde a existencia de
t
X e garantida pelo teorema do valor medio. O
teorema segue agora tomando o limite t 0 (observe que lim
t0
r(t)t
1
= 0
e lim
t0
t
= x).
Deni cao 275. Dizemos que x O e um ponto regular para (P) quando
0 int[dF(x)(C x) (K F(x))].
Caso x O seja tal que
int[dF(X)(C x) (K F(x))] ,= 0,
x e denominado ponto fracamente regular para (P). 2
steuer
2008/3/11
page 361
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 361
O teorema a seguir representa um passo fundamental para a demons-
tra c ao de nosso teorema de condi c oes necessarias e pode tambem ser
interpretado como uma generaliza c ao do teorema da aplica c ao aberta.
Para detalhes veja [ZoKu].
Teorema 276. Sejam X, Y espa cos de Banach, T B(X, Y ) e C X,
K Y fechados e convexos. Para x C, y K s ao equivalentes as
arma c oes:
a) Y = T(C(x)) K(y);
b) Existe r > 0, tal que B
r
T((C x)
1
) (K y)
1
.
Demonstra c ao: (a) (b)
(1) Provamos o seguinte, C(x) =

nN
n(C x)
1
. A inclus ao C(x)
nN
n(C x)
1
segue diretamente da deni c ao de C(x). Seja agora
z = a(c x) C(x). Escolha b (0, 1) tal que b(c x) B
1
. Como B
1
e C x s ao conjuntos convexos, temos que
r(c x) (C x)
1
, para todo r [0, b].
Logo, z = a(c x) =
na
n
(c x) n(C x)
1
para n sucientemente
grande. Como z C(x) e arbitrario, temos C(x)

nN
n(C x)
1
.
(2) Analogamente prova-se que K(y) =

nN
n(K y)
1
.
(3) Dena A
s
:= s[T((C x)
1
) (K y)
1
], s R. Provamos que
Y =
nN
A
n
. Basta observar que
Y = T(C(x)) K(y) = T
_
_
nN
n(C x)
1
_

_
mN
m(K y)
1
=
_
m,nN
[nT((C x)
1
) m(K y)
1
]
=
_
nN
n[T((C x)
1
) (K y)
1
].
(Na ultima igualdade usamos a inclus ao m(K y)
1
n(K y)
1
, para
m n, a qual se deve a 0 (K y)
1
e a convexidade de (K y)
1
.)
(4) Do teorema de Baire segue que existe pelo menos um m N com
int(cl(A
m
)) ,= .
(Teorema de Baire: Se um espa co metrico completo e escrito como uni ao
enumeravel de subconjuntos, ent ao pelo menos um destes contem um
aberto; veja [Kre], [Ru1].)
steuer
2008/3/11
page 362
i
i
i
i
i
i
i
i
362 [AP
AO DO PRINC
IPIO DO M
AXIMO
(5) Provamos que 0 int(cl(A
1
)). De fato, (4) implica que a
int(cl(A
m
)) e de (3) temos que k N com a cl(A
k
). Logo, pela
deni c ao de A
s
, temos que mk
1
a cl(A
m
). Como a int(cl(A
m
)),
ent ao > 0 com B
(a) int(cl(A
m
)). Mas mk
1
a cl(A
m
) e
cl(A
m
) e convexo, ent ao > 0 tal que 0 B
cl(A
m
). Portanto,
B
m
1 cl(A
1
).
(6) Seja r > 0 com B
2r
cl(A
1
). Provamos que B
r
A
1
, provando
assim (b). Note que
B
r
cl(A
1/2
) y Y [ dist( y, A
1/2
)
r
2
= A
2
1 +B
2
1
r
.
Reduzindo o di ametro dos conjuntos pelo fator 2
i
temos
B
2
i
r
A
2
(i+1) +B
2
(i+1)
r
, i N.
Dado y B
r
, denimos as seq uencias x
i
iN
X e y
i
iN
,
r
i
iN
Y indutivamente
i = 1 : y = T(2
1
x
1
) 2
1
y
1
+ r
1
com x
1
(C x)
1
, y
1
(K y)
1
, |r
1
| 2
1
r;
i > 1 : r
i
= T(2
(i+1)
x
i+1
) 2
(i+1)
y
i+1
+ r
1+1
com x
i+1
(C x)
1
, y
i+1
(K y)
1
, |r
i+1
| 2
(i+1)
r.
Denindo agora u
n
:=
n
i=1
2
i
x
i
e v
n
:=
n
i=1
2
i
y
i
, temos
(B.1) y = Tu
n
v
n
+ r
n
, n N.
Note que limr
n
= 0 e ainda que u
n
e de Cauchy em X, pois |x
i
|
1, i N e
|u
n+m
u
n
| |
n+m
i=n+1
2
i
x
i
| 2
n
.
Como X e de Banach, ent ao u X com limu
n
= u e como T e
contnua, ent ao Tu = limTu
n
. Logo, (B.1) garante que v
n
converge para
algum v Y e temos y = Tu v. Vericamos por m que u (C x)
1
e v (k y)
1
.
Note que u
n
=
n
i=1
2
i
x
i
+ 2
n
0, n N. Logo, u
n
e combina c ao linear
convexa dos elementos x
1
, x
2
, , x
n
, 0 de (C x)
1
. Como (C x)
1
e
steuer
2008/3/11
page 363
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 363
convexo, temos u (C x)
1
. A inclus ao v (k y)
1
e demonstrada de
forma analoga.
(b) (a) Obviamente 0 T(C(x)) K(y). Se y Y , y ,= 0, ent ao
r| y|
1
y B
r
. Logo,
r| y|
1
y = T(a(c x)) b(k y),
para a, b 0, c C e k K apropriados. Isto prova que
y = T(r
1
| y|a(c x)) (r
1
| y|b(k y)) T(C(x)) K(y),
Corolario 277. Seja x admissvel para (P), i.e. x X
ad
= C
F
1
(K) O. S ao equivalentes as armativas:
a) x e um ponto regular para (P);
b) Y = dF(x)C(x) K(F(x)).
Demonstra c ao: (b) (a)
Segue da aplica c ao do Teorema 276 com T = dF(x), y = F(x).
(a) (b) Seja y Y . Como x e regular, existem > 0 e > 0 tais que
y B
dF(x)(C x) (K F(x)).
Portanto, temos
y dF(x)
1
(C x)
1
(K F(x)) dF(x)C(x) (K(F(x)),
Observa cao 278. Para C = X, K = 0, obtemos como corolario do
Teorema 276 o seguinte resultado:
Se T B(X, Y ) e sobrejetiva, ent ao existe r > 0 tq B
r
T(B
1
).
Na analise funcional este resultado e conhecido como teorema da aplica-
c ao aberta (veja, e.g., [Kre, Sec c ao 4.12]). 2
Deni cao 279. Seja x X
ad
= C F
1
(K) O. O conjunto
L(X
ad
, x) := h X [ h C(x), dF(x)h K(F(x))
e denominado cone linearizado em x para (P). 2
steuer
2008/3/11
page 364
i
i
i
i
i
i
i
i
364 [AP
AO DO PRINC
IPIO DO M
AXIMO
O teorema a seguir permite-nos acoplar a desigualdade dJ(x
0
)h 0,
h T(X
ad
, x
), obtida no Teorema 274, com a derivada de F. Este

resultado e exatamente o que nos fornece as condi c oes necessarias de
otimalidade para o problema (P) (veja Teoremas 283 e 284).
Teorema 280. Se x e um ponto regular para (P), ent ao
L(X
ad
, x) T(X
ad
, x).
Demonstra c ao:
1
Seja h C(x) com h = a(cx), dF(x)h = b(kF(x)),
onde a, b 0, c C e k K. Temos que provar que t
0
> 0 e
r : [0, t
0
] X satisfazendo para todo t [0, t
0
]:
x + th + r(t) C, F(x +th +r(t)) K
e ainda que lim
t0
r(t)/t = 0.
Como x e ponto regular, ent ao x + 2th C e F(x) + 2t dF(x)h K
para t sucientemente pequeno. Como C e K s ao ambos convexos, basta
provar que t
0
> 0 e r : [0, t
0
] X satisfazendo
(B.2) x + 2r(t) C, F(x) + 2z(t) K, t [0, t
0
] e lim
t0
r(t)/t = 0,
onde z : [0, t
0
] Y e denida por z(t) := F(x + th + r(t)) F(x)
t dF(x)h.
Para cada t [0, t
0
] construmos os vetores r(t) X e z(t) Y tomando
limites de seq uencias que s ao obtidas por uma variante do metodo de
Newton. Vamos à constru c ao:
Se h = 0 tome simplesmente r(t) 0. Seja ent ao h X 0 com
h = a(c x), dF(x)h = b(k F(x)), onde a, b 0, c C e k K. O
Teorema 276 e o Corolario 277 garantem a existencia de s > 0 tal que
(B.3) B
s
dF(x)(C x)
1
(K F(x))
1
.
Escolha [0,
1
4
] com B
4
O e |dF() dF(x)| s/2, para todo
B
4
. Dena agora t
0
:= 2|h|
1
e tome t [0, t
0
] qualquer. Nos passos
a seguir denimos os valores de r(t) e z(t) e provamos que satisfazem
(B.2).
(1) Provamos inicialmente que |F( x)F( x)dF(x)( x x)|
s
2
| x x|,
para todo x, x B
4
.
1
Conforme [Al].
steuer
2008/3/11
page 365
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 365
De fato, denindo g() := F( x+(1) x)dF(x)( x x) para [0, 1],
temos
|g(1) g(0)| sup
[0,1]
|g
t
()|
= sup |(dF() dF(x))( x x)| [ entre x e x
s
2
| x x|
(2) Denimos indutivamente sete seq uencias que nos permitir ao cons-
truir r(t) e z(t). Para que a constru c ao fa ca sentido, denimos r
1
=
z
1
= x
1
= y
1
= 0. Para k N 0 tome
r
k
:= r
k1
+x
k1
,
z
k
:= z
k1
+y
k1
,
d
k
:= z
k
F(x +th +r
k
) +F(x) +t dF(x)h,
u
k
, v
k
:
_
_
_
se d
k
= 0, u
k
= v
k
= 0,
se d
k
,= 0, u
k
(C x)
1
, v
k
(K F(x))
1
com
dF(x)u
k
v
k
= s|d
k
|
1
d
k
,
x
k
:= s
1
|d
k
|u
k
,
y
k
:= s
1
|d
k
|v
k
.
(3) Provamos usando argumento indutivo que as seq uencias em (2) est ao
bem denidas e que, para todo k N, vale
r
k
2s
1
|d
0
|(C x)
1
, z
k
2s
1
|d
0
|(K F(x))
1
,
|d
k
| 2
k
|d
0
| 2
k
s.
Para k = 0, temos r
0
= z
0
= 0 e |x+th+r
0
x| t|h| 2. Logo,
de (1) segue
|d
0
| = |F(x +th) F(x) dF(x)th|
s
2
t|h| s.
Note ainda que u
0
e v
0
est ao bem denidos por (B.3).
Para k 1, temos:
r
k
=
k1
i=0
x
i
=
k1
i=0
s
1
|d
i
|u
i
= 2s
1
|d
0
|
k1
i=0
|d
i
|
2|d
0
|
u
i
,
steuer
2008/3/11
page 366
i
i
i
i
i
i
i
i
366 [AP
AO DO PRINC
IPIO DO M
AXIMO
com u
i
(C x)
1
. Note que
0 |d
i
|(2|d
0
|)
1
1, 0 i k 1 e
k1
i=0
|d
i
|(2|d
0
|)
1
1.
Logo, s(2|d
0
|)
1
r
k
e combina c ao linear convexa de u
0
, , u
k1
, 0
(C x)
1
, i.e. r
k
2s
1
|d
0
|(C x)
1
. A estimativa para |z
k
| e obtida
de forma analoga.
Como |d
0
| s, temos
|x +th +r
k
x| t|h| + |r
k
| 4, |x +th +r
k1
x| 4
e
d
k
= F(x +th +r
k
) F(x) t dF(x)h z
k
= F(x +th +r
k
) F(x) t dF(x)h z
k1
y
k1
= F(x +th +r
k
) F(x) t dF(x)h z
k1
+ d
k1
dF(x)x
k1
= F(x +th +r
k
) F(x +th +r
k1
) dF(x)x
k1
.
De (1) obtemos agora
|d
k
|
s
2
|x
k1
|
1
2
|d
k1
||u
k1
|
1
2
|d
k1
| 2
k
|d
0
|,
completando assim a prova por indu c ao.
(4) Sobre a convergencia das seq uencias r
k
e z
k
:
r
k
kN
e de Cauchy, pois

k=0
|x
k
| 2 < . Denindo r(t) :=
lim
k
r
k
, temos que r(t) 2s
1
|d
0
|(C x)
1
, pois (C x)
1
e fechado.
z
k
kN
e de Cauchy, pois

k=0
|y
k
| 2 < . Denindo z(t) :=
lim
k
z
k
, temos que z(t) 2s
1
|d
0
|(K F(x))
1
, pois (K F(x))
1
e
fechado.
Como t [0, t
0
] e arbitrario, r e z est ao bem denidas no intervalo [0, t
0
].
(5) Verica c ao de (B.2).
Em (3) vimos que s
1
|d
0
|
1
4
. Logo, r(t)
1
2
(C x)
1
e z(t)
1
2
(K y)
1
, i.e.
x + 2r(t) C, F(x) + 2z(t) K, t [0, t
0
].
Para completar a demonstra c ao, note que
0 t
1
|r(t)| t
1
2s
1
|d
0
| 2s
1
t
1
|F(x+th)F(x)t dF(x)(h)|,
provando assim que lim
t0
r(t)t
1
= 0.
steuer
2008/3/11
page 367
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 367
B.1.3 Condic oes Necessarias para o Problema Abstrato
Nesta sec c ao e obtida uma vers ao do teorema de multiplicadores de
Lagrange, que nos permite derivar condi c oes necessarias para a otimal-
idade de uma solu c ao do problema (P).
Deni cao 281. Seja X um espa co de Banach e M X. O conjunto
M
:= X
[ , m) 0 m M
e denominado cone dual a M em X
.
2
2
Observa cao 282. Um subconjunto M de um espa co vetorial e denomi-
nado cone, quando x M implica em ax X, para todo a (0, ).

E
facil ver que o conjunto M
na Deni c ao 281 satisfaz essa propriedade.

Outra propriedade de simples verica c ao relacionada ao cone dual e que
(M x)
= M(x)
,
para todo x M X. 2
Teorema 283. Seja x
um mnimo local de (P). Se x
e um ponto
regular para (P), ent ao existem C(x
, K(F(x
))
tais que
(B.4) dJ(x
) dF(x
) = .
Demonstra c ao: Dos Teoremas 274 e 280 temos dJ(x
)h 0, para todo
h L(X
ad
, x
), isto e
dJ(x
)h 0, h C(x
) com dF(x
)h K(F(x
)).
Fazemos agora uma constru c ao que permite-nos utilizar um teorema de
separa c ao para conjuntos convexos a m de provar o teorema.
(1) Denimos o conjunto A Y R por
A := (ydF(x
)x, dJ(x
)x+a) [ x C(x
), y K(F(x
)), a 0 .
A e obviamente convexo e ainda (0, 0) A (tome x = 0, y = 0, a = 0).
Note ainda que (0, 0) / int(A), pois (0, b) / A para b < 0.
2
A aplica c ao de um funcional X
ao elemento x X e aqui representada por

, x).
steuer
2008/3/11
page 368
i
i
i
i
i
i
i
i
368 [AP
AO DO PRINC
IPIO DO M
AXIMO
(2) Provamos que int(A) ,= .
Como x
e um ponto regular para (P), o Corolario 277 e o Teorema 276

garantem que existe r > 0 tal que
B
r
dF(x
)(C x
)
1
+ (K F(x
))
1
.
Dena := supdJ(x
)x[ x (Cx
)
1
. Basta provarmos que B
r
b
R [ b A.
Sejam y B
r
e b , ent ao existem x (C x
)
1
C(x
), y (K
F(x
))
1
K(F(x
)) com y = y dF(x
)x. Tomando a := b dJ(x
)x,
temos a b 0 e b = dJ(x
)x +a. Logo, ( y, b) A.
(3) Provamos que
, ydF(x
)x)+(dJ(x
)x +a)0, x C(x
), y K(F(x
)), a0.
De (1) e (2) podemos aplicar um teorema de separa c ao a (0, 0) A
(veja [We]), o qual neste caso particular nos garante a existencia de
(Y R)
, ,= 0 satisfazendo
, z) , (0, 0)), z A.
Podemos decompor em = (, ) Y

R, onde ||+[[ ,= 0. Temos
ent ao para z = ( y, b) A
0 , ( y, b)) = , y) + b.
A desigualdade desejada segue agora da deni c ao de A.
(4) Provamos que > 0.
Tomando x = y = 0 em (3), obtemos a 0, para todo a 0; logo
0. Se = 0, ent ao
, dF(x
)x y) 0, x C(x
), y K(F(x
)).
Entretanto, do Corolario 277 temos dF(x
)C(x
) K(F(x
)) = Y , o
que implica em
, y) 0, y Y.
De onde conclumos que = 0, o que contradiz o fato de || +[[ ,= 0.
(5) Constru c ao de C(x
, K(F(x
))
.
Podemos supor sem perda de generalidade que = 1. Tomando x = 0,
a = 0 em (3), temos
, y) 0, y K(F(x
)),
steuer
2008/3/11
page 369
i
i
i
i
i
i
i
i
[SEC. B.1: OTIMIZAC
AO INFINITA 369
provando que K(F(x
))
. Tomando agora y = 0, a = 0 em (3),

obtemos
dJ(x
)x , dF(x
)x) 0, x C(x
),
provando que dJ(x
) dF(x
) C(x
.
A equa c ao (B.4) segue agora tomando := dJ(x
)dF(x
) e := .
A equa c ao (B.4) e denominada condi c ao de KuhnTucker.
Teorema 284. Seja x
um mnimo local de (P). Se x
e um ponto
regular fraco para (P), ent ao existem R, C(x
, K(F(x
))
tais que
(B.5) dJ(x
) dF(x
) = ,
onde [[ +|| +|| ,= 0.
Demonstra c ao: Se x
for ponto regular para (P), basta aplicar o Teo-

rema 283 e obtemos (B.5) com = 1.
Suponha agora que x
e ponto fracamente regular para (P), mas n ao e

regular. Denindo o conjunto A := dF(x
)(Cx) (KF(x
)), temos
que int(A) ,= , A e convexo, 0 / int(A). Portanto, o mesmo teorema
de separa c ao usado na demonstra c ao do Teorema 283 (veja [We]) nos
garante a existencia de Y

, ,= 0 satisfazendo
, a) 0 a A.
Da deni c ao de A segue
, dF(x
)x y) 0, x (C x
), y (K F(x
)).
Tomando x = 0, temos (K F(x
))
e tomando y = 0, temos
dF(x
) (C x
. Denindo := dF(x
), temos da
Observa c ao 282 que C(x
, K(F(x
))
. A equa c ao (B.5)
segue agora com = 0.
A equa c ao (B.5) e denominada condi c ao de FritzJohn.
Observa cao 285. Para problemas de otimiza c ao da forma especial
_
_
Minimizar J(x)
s.a. x R
n
g
i
(x) 0, i = 1, , m
h
j
(x) = 0, j = 1, , l
steuer
2008/3/11
page 370
i
i
i
i
i
i
i
i
370 [AP
AO DO PRINC
IPIO DO M
AXIMO
e possvel obter uma condi c ao suciente (condi c ao de Slater) para que
um mnimo local seja sempre regular (veja [We]). Neste caso, obte-
mos um teorema de multiplicadores com ,= 0 (veja a Conjectura na
pagina 359). 2
B.2 Um Problema Auxiliar
Consideramos novamente o problema P(0, z
0
) (ver Sec c ao 10.1) e, a
m de simplicar a nota c ao, substituimos o tempo nal (livre) t
1
por T.
As fun c oes L, f, L
1
, e H s ao denidas como na Sec c ao 10.1. No texto
a seguir representamos por ( z, u,

T) uma solu c ao do problema P(0, z
0
).
Atraves de uma mudan ca de variaveis (transforma c ao no tempo) e
criado um problema auxiliar que nos permite investigar P(0, z
0
) à luz
do princpio do maximo. Seja
V
+
:= w L
(0, 1) [ w() 0 q.s..

Dada v V
+
, podemos denir t C[0, 1] e T 0 atraves de
(B.6) t() :=
_

0
v(s) ds, [0, 1], T := t(1).
A cada estado z C([0, T]; R
n
) corresponde uma fun c ao x C([0, 1]; R
n
)
denida pela correspondencia
(B.7) x() := z(t()), [0, 1].
Fixada a fun c ao w L
loc
([0, ); R
m
) com w(t) q.s., corresponde
para cada controle u L
([0, T]; R
m
) o controle w L
([0, 1]; R
m
) da
forma
(B.8) w() :=
_
u(t()) , se s [0, 1] [ v(s) > 0
w(t()) , se s [0, 1] [ v(s) = 0
.
Formulamos agora o problema de otimiza c ao auxiliar nas variaveis ,
v, x. A forma exata do controle otimo u e de seu correspondente w
e
esclarecida oportunamente no decorrer do texto.
steuer
2008/3/11
page 371
i
i
i
i
i
i
i
i
[SEC. B.2: UM PROBLEMA AUXILIAR 371
PA(w
)
_
_
Minimizar I(t, x, v) := L
1
(t(1), x(1))
+
_
1
0
v() L(t(), x(), w
()) d
sujeito a
xC([0, 1]; R
n
), tC([0, 1]; R), vV
+
, (t(1), x(1)) = 0,
x() = z
0
+
_

0
v(s) f(t(s), x(s), w
(s)) ds, [0, 1],

t() =
_

0
v(s) ds, [0, 1].
Vericamos inicialmente que toda solu c ao ( z, u,

T) do problema P(0, z
0
)
induz uma solu c ao (t
, x
, v
) do problema PA(w
).
Lema 286. Seja ( z, u,

T) uma solu c ao de P(0, z
0
). Sejam ainda v

V
+
, t
, x
satisfazendo (B.6), (B.7) e a fun c ao w
, correspendente a u,
satisfazendo (B.8). Ent ao (t
, x
, v
) e mnimo local de PA(w
).
Demonstra c ao: Vericamos inicialmente que t
, x
, v
satisfazem as
restri c oes de PA(w
) e ainda que I(t
, x
, v
) = J( z, u,

T).
x
() = z(t()) = z
0
+
_
t
()
0
f(s, z(s), u(s)) ds
= z
0
+
_

0
f(t
(r), z(t
(r)), u(t
(r))) v
(r) dr
= z
0
+
_

0
v
(r) f(t
(r), x
(r), w
(r)) dr
(t
(1), x
(1)) = (

T, z(
T))
I(t
, x
, v
) = L
1
(t
(1), x
(1))+
_
1
0
v
() L(t
(), x
(), w
()) d
= L
1
(
T, z(
T)) +
_

T
0
L(s, z(s), u(s)) ds
= J( z, u,

T)
Dena a vizinhan ca O de (t
, x
) por
O := (t, x) C([0, 1]; R)C([0, 1]; R
n
) [ |tt
< 1, |xx
< 1.
Seja (t, x) O satisfazendo as restri c oes de PA(w
). Dena o seguinte
steuer
2008/3/11
page 372
i
i
i
i
i
i
i
i
372 [AP
AO DO PRINC
IPIO DO M
AXIMO
z L
([0, t(1)]; R
n
) e u L
([0, t(1)]; R
m
) por
z(s) := x((s)), u(s) := w
((s)),
onde (s) := inf [0, 1] [ t() = s.
3
Logo,
z(t()) = x(), [0, 1], u(t()) = w
(), com v() > 0.

Com uma simples mudan ca de variaveis nas integrais que surgem em
(B.6) (B.8), vericamos que (z, u, t(1)) satisfaz as restri c oes do pro-
blema P(0, z
0
). Da obtemos a continuidade de z, que por sua vez implica
em
J(z, u, t(1)) = I(t, x, v).
A otimalidade de ( z, u,

T) implica agora em
I(t, x, v) = J(z, u, t(1)) J( z, u,

T) = I(t
, x
, v
)
e o lema ca provado. (Usamos tacitamente na demonstra c ao o fato de
que, caso seja ilimitado, ent ao L e f satisfazem
sup [L(t, x, w
())[; t [0, t
+ 1], x R
n
m(),
sup [f(t, x, w
())[; t [0, t
+ 1], x R
n
m(),
para algum m L
1
[0, 1].)
Vericamos a seguir que a equa c ao integral para x em PA(w
) dene
um operador continuamente diferenciavel. Isto e feito no lema a seguir,
onde abrimos m ao da forma especial do operador integral.
Lema 287. Seja g : [0, 1] R
l
R
l
mensur avel no primeiro argumento
e duas vezes continuamente diferenci avel no segundo. Seja ainda x
C([0, 1]; R
l
). Suponha que existe m L
1
[0, 1] tal que, para todo [0, 1]
e y R
n
com [y[ [[ x[[
+ 1, tenhamos
max [g(, y)[, [D
x
g(, y)[, [D
xx
g(, y)[ m().
Ent ao a aplica c ao G : O L
([0, 1]; R
l
) C([0, 1]; R
l
), onde O e uma
vizinhan ca aberta de x, denida por
(B.9) (Gx)() :=
_

0
g(s, x(s)) ds
3
O conjunto | [0, 1] [ t() = s e um intervalo fechado para todo s [0, 1].
steuer
2008/3/11
page 373
i
i
i
i
i
i
i
i
e continuamente diferenci avel em O e sua derivada (de Frechet) em
x O e dada por
(B.10) (DG(x)(h))() =
_

0
D
x
g(s, x(s))h(s) ds, [0, 1].
Demonstra c ao: As hipoteses do lema garantem que o operador
G denido em (B.9) esta bem denido em uma vizinhan ca
O L
([0, 1]; R
l
) de x. Temos ainda que o operador em (B.10):
L
([0, 1]; R
l
) h
_

0
D
x
g(s, x(s))h(s) ds C([0, 1]; R
l
)
e linear e contnuo se x O. Portanto, para provar o lema basta vericar
(B.10) em um unico ponto x O, por exemplo em x = x.
Seja h L
([0, 1]; R
l
) com |h|
< 1. Ent ao, para todo [0, 1],

temos
[G( x +h)() G( x)()
_

0
D
x
g(s, x(s))h(s) ds[
_
1
0
[g(s, x(s) +h(s))g(s, x(s))D
x
g(s, x(s))h(s)[ ds
_
1
0
[h(s)[
2
sup[D
xx
g(s, )[; [ x(s)[ [h(s)[ ds
|h|
2
|m|
1
.
Portanto,
lim
|h|
0
_
|G( x +h) G( x)
_
0
D
x
g(s, x(s))h(s) ds|
|h|
_
= 0,
provando assim que (DG( x)(h))() =
_
0
D
x
g(s, x(s))h(s) ds.
Na seq uencia aplicamos o teorema de multiplicadores 283 ao pro-
blema PA(w
), denido no incio desta sec c ao.

Lema 288. Suponha que, para t [0,

T + 1] e x R
n
com [x[
|x
+ 1, tenhamos
(B.11)
[L(t, x, w
())[, [D
t
L(t, x, w
())[, [D
x
L(t, x, w
())[ m(),
[D
tt
L(t, x, w
())[, [D
tx
L(t, x, w
())[, [D
xx
L(t, x, w
())[ m(),
[f(t, x, w
())[, [D
t
f(t, x, w
())[, [D
x
f(t, x, w
())[ m(),
[D
tt
f(t, x, w
())[, [D
tx
f(t, x, w
())[, [D
xx
f(t, x, w
())[ m(),
steuer
2008/3/11
page 374
i
i
i
i
i
i
i
i
374 [AP
AO DO PRINC
IPIO DO M
AXIMO
onde m L
1
[0, 1]. Ent ao existem 0, R
p
e fun c oes absoluta-
mente contnuas q : [0, 1] R
n
, r : [0, 1] R, tais que (, , r, q) ,= 0,
(B.12)
_
_
dr
d
() = v
()[D
t
f(t
(), x
(), w
())
q()
+D
t
L(t
(), x
(), w
())],
dq
d
() = v
()[D
x
f(t
(), x
(), w
())
q()
+D
x
L(t
(), x
(), w
())],
para todo [0, 1],
(B.13)
_
r(1) = D
t
L
1
(t
(1), x
(1)) D
t
(t
(1), x
(1))
,
q(1) = D
x
L
1
(t
(1), x
(1)) D
x
(t
(1), x
(1))
,
e ainda
(B.14)
1
_
0
[r() +f(t
(), x
(), w
())
q()
+L(t
(), x
(), w
())](v() v
())d 0,
para todo v V
+
.
Demonstra c ao: A m de escrever o problema PA(w
) na forma do
problema abstrato de otimiza c ao (P) na Sec c ao B.1, denimos
X := C([0, 1]; R) C([0, 1]; R
n
) L
[0, 1], J := I,
Y := C([0, 1]; R) C([0, 1]; R
n
) R
p
, K := (0, 0) Y,
C := (t, x, v) X[ v(t) 0 q.s.,
O := (t, x, v) X[ |t t
< 1, |x x
< 1.
A aplica c ao F : O Y e denida por
F(t, x, v) :=
_
_
_
_
_
_
t()
_

0
v(s) ds
x() z
0

_

0
v(s)f(t(s), x(s), w
(s)) ds
(t(1), x(1))
_
_
_
_
_
_
.
A hipotese sobre garante que a aplica c ao (t, x) (t(1), x(1)) e con-
tinuamente diferenciavel. Do Lema 287 temos que F e continuamente
steuer
2008/3/11
page 375
i
i
i
i
i
i
i
i
(Frechet-)diferenciavel com derivada
4
dF(t
, x
, v
)(t, x, v) =
=
_
_
_
_
_
_
_
t()
_

0
v(s) ds
x()
_

0
(v
(s)[D
t
f(s)t(s) +D
x
f(s)x(s)] +v(s)f(s)) ds
D
t
(t
(1), x
(1))t(1) +D
x
(t
(1), x
(1))x(1)
_
_
_
_
_
_
_
.
A aplica c ao J : O R tambem e continuamente diferenciavel (pelo
mesmo argumento) e sua derivada e dada por
5
dJ(t
, x
, v
)(t, x, v) =
_
1
0
(v
(s)[D
t
L(s)t(s)
+D
x
L(s)
x(s)] +v(s)L(s)) ds
+ D
x
L
1
(1)t(1) +D
x
L
1
(1)
x(1).
(1) Provamos inicialmente o lema no caso em que dF(t
, x
, v
) : X Y
n ao e sobrejetiva. Temos que provar que
(B.15) (, q, r) ,= 0 com r() +f()
q() = 0 q.s.
e que a equa c ao adjunta (B.12) vale com = 0.
Considere o problema de valor inicial
(B.16)
dy
d
= A()y + b()v, y(0) = 0, y
1
= Cy(1),
onde
y =
_
t
x
_
, A() =
_
0
v
D
t
f
0
v
D
x
f
_
, b() =
_
1
f
_
, C = (D
t
D
x
).
Note que, se todo y
1
R
p
pode ser alcan cado como valor nal em
(B.16) por uma escolha conveniente de v L
[0, 1], ent ao dF(t
, x
, v
)
e sobrejetiva. De fato, seja (, ) a matriz de transi c ao de (B.16), i.e.
as colunas de (, ) geram solu c oes linearmente independentes de
dy
d
=
A()y. Seja ( y, y
1
) Y qualquer. Logo, existe y = (
t, x) tal que
y()
_

0
A(s) y(s) ds = y(), [0, 1].
4
Nota c ao simplicada: f(s) := f(t
(s), x
(s), w
(s)).
5
Nota c ao simplicada: L(s) := L(t
(s), x
(s), w
(s)) e L
1
(1) := L
1
(1, x
(1)).
steuer
2008/3/11
page 376
i
i
i
i
i
i
i
i
376 [AP
AO DO PRINC
IPIO DO M
AXIMO
(Aplica c ao do teorema de ponto xo de Banach para operadores integrais
de Volterra; veja, e.g., [Kre, Sec c ao 5.4].)
Escolha v de modo que (B.16) possua solu c ao y = (t, x) com y(1) =
y
1
C y(1).

E facil ver que ( y +y, v) = (
t +t, x +x, v) X satisfaz

dF(t
, x
, v
)( y +y, v) = ( y, y
1
),
cando assim vericada a sobrejetividade de dF(t
, x
, v
).
Como supomos dF(t
, x
, v
) n ao sobrejetiva, existe necessariamente

(ao menos um) R
p
0 ortogonal ao subespa co
y
1
R
p
[ y
1
e atingvel por algum v L
[0, 1].
Logo,
0 =
Cy(1) =
_
1
0
C(1, )b()v() d, v L
[0, 1].
Portanto,
C(1, )b() = 0 q.s. em [0, 1]. Dena q = (r, q)

C([0, 1]; R
n+1
) por q() := (1, )
. Logo,
_
d q
d
() = A()
q(), [0, 1] (provando (B.12) com = 0)

q(1) = C
(provando (B.13))
e ainda
0 = b()
q() = r() + f()
q(), q.s. em [0, 1],

provando assim (B.15) e, por conseguinte, (B.14).
(2) Consideramos agora o caso em que dF(t
, x
, v
) : X Y e sobreje-
tiva. Neste caso, (t
, x
, v
) e um ponto fracamente regular para PA(w
).
De fato, como int(C) ,= , temos que o cone tangencial C(t
, x
, v
)
tambem possui interior n ao vazio. O teorema da aplica c ao aberta (Teo-
rema 276 e Observa c ao 278) garante que
intdF(t
, x
, v
) C(t
, x
, v
) ,= .
O Teorema 284 (veja tambem Observa c ao 285) garante a existencia de
0, C(t
, x
e y Y
com +|| +|y| ,= 0 satisfazendo

(B.17) (t, x, v) = dJ(t
, x
, v
)(t, x, v) y(dF(t
, x
, v
)(t, x, v)),
steuer
2008/3/11
page 377
i
i
i
i
i
i
i
i
para todo (t, x, v) X. Note que (t, x, 0) 0 para todo par t, x. De
fato, isto segue da identidade (t, x, 0) =
_
(t+t
, x+x
, v
)(t
, x
, v
)
_
e do fato (t + t
, x + x
, v
) C(t
, x
, v
. Logo, como e linear

em todos seus argumentos, temos que (t, x, 0) = 0 para todo par t, x.
Da conclumos que (t, x, v) = (v). Segue agora da deni c ao do cone
tangencial C(t
, x
, v
que
(B.18) (v v
) 0, v V
+
.
Escrevendo y = (, , ), temos para todo par t, x
(v) =
_
1
0
[v
(s)(D
t
L(s)t(s) +D
x
L(s)
x(s)) +v(s)L(s)] ds
+[D
t
L
1
(1)t(1) +D
x
L
1
(1)
x(1)]
_
t()
_

0
v(s) ds
_
_
x()
_

0
v
(s)[D
t
f(s)t(s)+D
x
f(s)x(s)]+v(s)f(s) ds
_

(D
t
(1)t(1) +D
x
(1)x(1)), (B.19)
onde (, , , ) ,= 0.
Dena r e q como solu c ao do problema de valor inicial (retrocedendo
no tempo) denido em (B.12), (B.13). A m de obter (B.14), escolha
_
t
x
_
= y como solu c ao de (B.16). Substituindo em (B.19) os termos
( ) e ( ) desaparecem. Para o termo em obtemos atraves de
integra c ao por partes:
_
1
0
v
(s)D
x
L(s)
x(s) ds
=
_
1
0
(
dq
d
(s) v
(s)D
x
f(s)
q(s))
x(s) ds
=
_
1
0
q(s)
dx
d
(s) ds [q(s)
x(s)]
1
0

_
1
0
(v
(s)D
x
f(s)
q(s))
x(s) ds
=
_
1
0
q(s)
[v
(s)D
t
f(s)t(s) +v
(s)D
x
f(s)x(s) +v(s)f(s)] ds
q(1)
x(1)
_
1
0
v
(s)q(s)
D
x
f(s)x(s) ds
=
_
1
0
q(s)
[v
(s)D
t
f(s)t(s) +v(s)f(s)] ds q(1)
x(1)
steuer
2008/3/11
page 378
i
i
i
i
i
i
i
i
378 [AP
AO DO PRINC
IPIO DO M
AXIMO
e ainda
_
1
0
v
(s)D
t
L(s)t(s) ds =
_
1
0
_
dr
d
(s) v
(s)q(s)
D
t
f(s)
_
t(s) ds
=
_
1
0
r(s)v(s) ds r(1)t(1)
_
1
0
v
(s)q(s)
D
t
f(s)t(s) ds.
Substituindo as duas ultimas express oes em (B.19) e observando que
_
r(1)t(1)
q(1)
x(1)
_
=
_
[D
t
L
1
(1) D
t
(1)
] t(1)
[D
x
L
1
(1) D
x
(1)
] x(1)
_
,
obtemos
(v) =
_
1
0
v(s)L(s) ds +
_
1
0
v
(s)q(s)
f(s) ds
+
_
1
0
q(s)
(s)D
t
f(s)t(s) ds
q(1)
x(1) +
_
1
0
v(s)r(s) ds
_
1
0
q(s)
(s)D
t
f(s)t(s) ds r(1)t(1)
+[D
t
L
1
(1)t(1) +D
x
L
1
(1)
x(1)]
(D
t
(1)t(1) +D
x
(1)x(1))
=
_
1
0
v(s)[r(s) +f(s)
q(s) +L(s)] ds.

De (B.18) obtemos agora
_
1
0
[r(s)+f(s)
q(s)+L(s)] (v(s)v
(s))ds = (v v
) 0, v V
+
,
provando (B.14). Se (, , r, q) = 0, teramos = 0. Logo, como con-
seq uencia de (B.17), y = 0 (supomos dF(t
, x
, v
) sobrejetora). Mas
isso contradiz a desigualdade + || + |y| ,= 0, garantida pelo Teo-
rema 284. Fica assim provado o lema.
steuer
2008/3/11
page 379
i
i
i
i
i
i
i
i
[SEC. B.3: CONDIC

OES NECESS
ARIAS PARA OTIMALIDADE 379

B.3 Condic oes Necessarias para Otimalidade
Para demonstrar o princpio do maximo, basicamente transformamos
as equa c oes e inequa c oes do Lema 288 ao intervalo [0,

T]. Atraves da
escolha adequada de v
e w
e por m obtida a condi c ao de maximo. A

demonstra c ao esta dividida em seis passos:
(1) Dedu c ao da equa c ao adjunta.
Usando a nota c ao do Lema 288, denimos
(s) := inf [ t() = s, o(s) := r((s)), p(s) := q((s)).
Logo, o(t()) = r(), p(t()) = q(). Temos ent ao de (B.12) que
dp
dt
dt
d
() = v
()[D
x
f(t)
q() D
x
L(t)]
e, como
dt
d
() = v
(), a equa c ao adjunta

6
dp
dt
(t) = D
x
f(t)
p(t) D
x
L(t) = D
x
H(t)
com a condi c ao de contorno:
p(
T) = q(1) = D
x
L
1
(
T) D
x
(
T)
.
Analogamente, obtemos
do
dt
(t) = D
t
H(t),
o(T
) = D
t
L
1
(
T) D
t
(
T)
.
(2) Escolha de v
V
+
.
Denimos a seguir v
: [0, 1] R de modo que [0, 1] [ v
() = 0
seja uma uni ao enumeravel de intervalos disjuntos B
k
e que t
(B
k
) [ k
N seja um subconjunto denso de [0,

T]. Para tanto, tome t
k
kN
um
subconjunto denso de [0,

T] e
k
> 0 com
k=1
k
=
1
2
. Dena agora
k
:=
t
k
2
T
+
t
i
<t
k
i
, B
k
:= [
k
,
k
+
k
], B :=
_
kN
B
k
.
6
Nota c ao: f(t) = f(t, z(t), u(t)), L(t) = L(t, z(t), u(t)), (t) = (t, z(t)).
steuer
2008/3/11
page 380
i
i
i
i
i
i
i
i
380 [AP
AO DO PRINC
IPIO DO M
AXIMO
Dena nalmente a fun c ao v
por
v
() :=
_
0 , B
2
T, sen ao.
Logo, t
(1)=
_
1
0
v
()d=
T, pois ([0, 1] B)=

1
2
. Para B
k
, temos
t
()=
_

0
v
() d=2
T([0,
k
]
_
t
i
<t
k
B
i
)=2
T(
k

t
i
<t
k
i
) = t
k
.
Portanto t
() = t
k
, B
k
.
(3) Provamos que
o(t) + H(t, z(t), u(t), p(t), ) = 0, q.s. em [0,

T].
Suponha por contradi c ao que o(t) + f(t, z(t), u(t))
p(t) + L(t, z(t),

u(t)) > 0 em algum subconjunto com medida positiva de [0,

T]. Como t
e absolutamente contnua, a mudan ca de variaveis t = t
() nos permite
conluir que
r() + f(t
(), x
(), w
())
q() + L(t
(), x
(), w
()) > 0
em um subconjunto A de [ v
() > 0 com (A) > 0. Denindo

agora
v() :=
_
v
(), , A
0 , A
,
obtemos
_
1
0
[r() +f()
q() +L()] (v() v
()) d < 0,
contradizendo (B.14).
(4) Dedu c ao da equa c ao de evolu c ao da fun c ao de Hamilton.
Note que de (1) e (3) segue
H(t, z(t), u(t), p(t), ) = o(t) =
_

T
t
D
t
H(s) dsD
t
L
1
(
T)+D
t
(
T)
.
(5) Escolha de w
no conjunto [0, 1] [ v
() = 0.
Sejam c
j
R para j N, tais que para todo [t[

T +1, [x[ |x
+1,
[u[ < j, tenhamos
[L(t, x, u)[, [f(t, x, u)[, [D
x
L(t, x, u)[, [D
x
f(t, x, u)[,
steuer
2008/3/11
page 381
i
i
i
i
i
i
i
i
[SEC. B.3: CONDIC

OES NECESS
ARIAS PARA OTIMALIDADE 381

[D
t
L(t, x, u)[, [D
t
f(t, x, u)[ c
j
,
[D
xx
L(t, x, u)[, [D
xx
f(t, x, u)[, [D
xt
L(t, x, u)[, [D
xt
f(t, x, u)[ c
j
,
[D
tt
L(t, x, u)[, [D
tt
f(t, x, u)[, [D
tx
L(t, x, u)[, [D
tx
f(t, x, u)[ c
j
.
Escreva agora B
k
=

jN
B
k,j
, k N, onde (B
k,j
) c
0
/(2
k
c
j
) para
alguma constante c
0
. (Este passo e desnecessario quando e limitado.)
Para cada j N, seja u
j
i
iN
um subconjunto denso de u
R
m
[ j 1 [u[ < j. Escreva B
k,j
=

iN
B
k,j,i
, onde B
k,j,i
s ao
intervalos disjuntos. Dena agora
w
() := u
j
i
, se B
k,j,i
.
Note que a condi c ao (B.11) do Lema 288 e satisfeita para essa escolha
de w
. De fato, para todo [t[

T + 1, [x[ |x
+ 1, temos
_
1
0
[L(t, x, w
())[ d =
_
[0,1]\B
[L(t, x, u(t
()))[ d
+
_
B
[L(t, x, u(t
()))[ d
M +
_
B
k,j,i
[L(t, x, u
j
i
)[ d
M +
k,j
(B
k,j
)c
j
M +
k,j
c
0
2
k
c
j
c
j
.
Provando assim que L, f e suas derivadas parciais de ordem 2 s ao
majoradas por uma fun c ao L
1
.
(6) Dedu c ao da condi c ao de maximo.
Tomando v V
+
, v = v
q.s. fora de B
k,j,i
, obtemos de (B.14)
_
B
k,j,i
[r() +f(t
k
, z(t
k
), u
j
i
)
q() +L(t
k
, z(t
k
), u
j
i
)]v() d 0.
Como t
() = t
k
para B
k,j,i
, temos r() = p
t
(t
k
), q() = p(t
k
) em
B
k,j,i
. Da segue
o(t
k
) + f(t
k
, z(t
k
), u
j
i
)
p(t
k
) + L(t
k
, z(t
k
), u
j
i
) 0,
steuer
2008/3/11
page 382
i
i
i
i
i
i
i
i
382 [AP
AO DO PRINC
IPIO DO M
AXIMO
isto e
o(t
k
) + H(t
k
, z(t
k
), u
j
i
, p(t
k
), ) 0.
Como t
k
kN
e denso em [0,

T], obtemos da continuidade de o e H
o(t) + H(t, z(t), u
j
i
, p(t), ) 0, t [0,

T].
A densidade de u
j
i
i,j
em nos permite concluir por argumento seme-
lhante que
o(t) + H(t, z(t), u, p(t), ) 0, u ,
que juntamente com (3) nos fornece para todo u
H(t, z(t), u, p(t), ) H(t, z(t), u(t), p(t), ), q.s. em [0,

T].
steuer
2008/3/11
page 383
i
i
i
i
i
i
i
i
Lista de Smbolos
Smbolo Descricao
x
transposto do vetor x
x, y) produto interno dos vetores x e y
|x| norma do vetor x
A
transposta da matriz A
det(A) determinante da matriz A
diag(J
1
, . . . , J
p
) matriz diagonal com blocos J
1
, . . . , J
p
I matriz identidade
X
dual topologico do espa co normado X

B
r
(z) bola fechada de raio r e centro em z
int(M) interior do cionjunto M
cl(M) fecho do conjunto M
co(M) envoltorio convexo do conjunto M
co(M) fecho do envoltorio convexo do conjunto M
B(X, Y ) operadores lineares contnuos entre os espa cos
normados X e Y
e
A
, exp(A) exponencial da matriz A
p
A
polin omio caracterstico da matriz A
A
(t, t
0
) matriz de transi c ao do sistema x
t
=Ax (ou x
t
=A(t)x)
C(a, b) fun c oes contnuas em (a, b)
C([a, b]; R
n
) fun c oes contnuas em (a, b) tomando valores em R
n
C
k
(a, b) fun c oes k vezes continuamente diferenciaveis em (a, b)
C
(a, b) fun c oes innitas vezes continuamente diferenciaveis

em (a, b)
steuer
2008/3/11
page 384
i
i
i
i
i
i
i
i
384 LISTA DE S
IMBOLOS
L
p
(a, b) fun c oes p-integraveis em (a, b)
L
p
([a, b]; R
n
) fun c oes p-integraveis em (a, b) tomando valores
em R
n
| |
p
norma do espa co L
p
(f g) convolu c ao das fun c oes f e g
x, x
t
derivada da fun c ao x
J gradiente da fun c ao J
D
x
f,
x
f,

x
f derivada parcial da fun c ao f em rela c ao
à variavel x
dF derivada de Frechet da aplica c ao F
+
F superdiferencial da fun c ao F
F subdiferencial da fun c ao F
C(x) cone tangencial em x pelo conjunto (convexo) C
T(M, x) cone tangencial ao conjunto M por x
L(X
ad
, x) cone linearizado em x para o problema abstrato
de otimiza c ao
M
cone dual ao conjunto M

steuer
2008/3/11
page 385
i
i
i
i
i
i
i
i
Bibliograa
[Al] Alt, W., Stabilit at mengenwertiger Abbildungen mit An-
wendungen auf nichtlineare Optimierungsprobleme, Bayreuther
Mathematische Schriften, 3, 1979
[An] Anand, D.K., Introduction to Control Systems. 2nd ed., Perg-
amon Press, Oxford, 1984
[AtFa] Athans, M. e Falb, P.L., Optimal Control, McGraw-Hill
Book Company, New York, 1966
[BaNe] Balakrishnan, A.V. e Neustadt, L.W., eds., Computing
Methods in Optimization Problems, Proceedings of a conference
held at University of California, Los Angeles, January 1964,
Academic Press, London, 1964
[BaCa] Bardi, M. e CapuzzoDolcetta, I., Optimal Control
and Viscosity Solutions of HamiltonJacobiBellman Equations,
Birkhauser, Boston, 1997
[Bar] Barnett, S., Matrices in Control Theory with Applications to
Linear Programming, Van Nostrand Reinhold Company, Lon-
don, 1971
[BaLe] Baumeister, J. e Leit ao, A., Optimal exploitation of re-
newable resource stocks: Necessary conditions, Optimal Control
Appl. Meth. 25 (2004), 19 50
[BLS1] Baumeister, J., Leit ao, A. e Silva, G.N., Optimal control
problems with innite horizon whose control laws contain mea-
sures, Nonlinear dynamics, chaos, control, and their applications
to engineering sciences 4 (2002), 228 250
steuer
2008/3/11
page 386
i
i
i
i
i
i
i
i
386 BIBLIOGRAFIA
[BLS2] Baumeister, J., Leit ao, A. e Silva, G.N., On the value
function for nonautonomous optimal control problems with in-
nite horizon, Systems and Control Letters 56 (2007), 188-196
[Be] Bellman, R.E., Introduction to the Mathematical Theory of
Control Process, Vol I: Linear equations and quadratic criteria,
Academic Press, New York, 1967
[BeDr] Bellman, R.E. e Dreyfus, S.E., Applied Dynamic Program-
ming, Princeton University Press, Princeton, 1962
[Ber] Berkovitz, L.D., Optimal Control Theory, Springer Verlag,
New York, 1974
[Bo] Boltyanski, W.G., Mathematische Methoden der optimalen
Steuerung, Carl Hanser Verlag, M unchen, 1972
[Br] Brokate, M., Kontrolltheorie, Vorlesungskript, Universitat
Hamburg, 1984
[BMS] Bulirsch, R., Miele, A., Stoer, J. e Well, K.H., eds.,
Optimal control: Calculus of Variations, Optimal Control The-
ory and Numerical Methods, International Series of Numerical
Mathematics, 111, Birkhauser, Basel, 1993
[CaHa] Carlson, D.A. e Haurie, A.B., Innite Horizon Optimal
Control: Theory and Applications, Springer Verlag, Heidelberg,
1987
[Cl] Clark, C.W., Mathematical Bioeconomics: The Optimal Man-
agement of Renewable Resources. 2nd ed., John Wiley and Sons,
New York, 1990
[CCM] Clark, C.W., Clarke, F.H. e Munro, G.R. The opti-
mal exploitation of renewable resource stocks: Problems of ir-
reversible investment, Econometrica 47 (1979), 25 47
[CLSW] Clarke, F.H., Ledyaev, Yu.S., Stern, R.J. e Wolen-
ski, P.R., Nonsmooth Analysis and Control Theory, Springer
Verlag, Berlin, 1998
steuer
2008/3/11
page 387
i
i
i
i
i
i
i
i
BIBLIOGRAFIA 387
[CrLi] Crandall, M.G. e Lions, P.L., Viscosity solutions of
HamiltonJakobi Equations, Trans. of the American Mathemat-
ical Society 277 (1983), 1 42
[FlRi] Fleming, W.H. e Rishel, R.W., Deterministic and Stochas-
tic Optimal Control, Springer Verlag, Berlin, 1975
[FlSo] Fleming, W.H. e Soner, H.M., Controlled Markov Processes
and Viscosity Solutions, Springer Verlag, New York, 1993
[Fo1] F ollinger, O., Nichtlineare Regelungen I: Grundlagen und
harmonische Balance, Oldenbourg Verlag, M unchen, 1969
[Fo2] F ollinger, O., Nichtlineare Regelungen II: Anwendung der
Zustandsebene, Oldenbourg Verlag, M unchen, 1970
[Fo3] F ollinger, O., Nichtlineare Regelungen III: Ljapunow-
Theorie und Popow-Kriterium, Oldenbourg Verlag, M unchen,
1970
[Gan] Gantmacher, F.R, Applications of the Theory of Matrices,
Intersciences Publishers, New York, 1959
[GaKu] Gauthier, J.-P. e Kupka, I. Deterministic Observation The-
ory and Applications, Cambridge University Press, Cambridge,
2001
[GaKu1] Gauthier, J.-P. e Kupka, I. Observability for systems with
more outputs than inputs and asymptotic observers, Mathema-
tische Zeitschrift 223 (1996), 47 78
[GaKu2] Gauthier, J.-P. e Kupka, I. Observability and observers
for nonlinear systems, SIAM J. Control Optim. 32 (1994), 975
994
[Gol] Goldenstine, H., A History of the Calculus of Variations,
from 17th through the 19th Century, Springer Verlag, New York,
1980
[Gon] Goncalves, A., Introdu c ao ` a

Algebra, Projeto Euclides, 7, In-
stituto de Matematica Pura e Aplicada, Rio de Janeiro, 1979
steuer
2008/3/11
page 388
i
i
i
i
i
i
i
i
388 BIBLIOGRAFIA
[Gr] Groetsch, C.W., Generalized Inverses of Linear Operators,
Dekkeric, New York, 1977
[Ha] Halkin, H., Necessary conditions for optimal control problems
with innite horizons, Econometrica 42 (1974), 267 272
[Hes] Hestenes, M.R., Calculus of Variations and Optimal Control
Theory, John Wiley and Sons, London, 1966
[Heu] Heuser, H., Funktionalanalysis. 3. Au., B.G. Teubner,
Stuttgart, 1992
[HeLa] Hermes, H.R. e LaSalle, J.P., Functional Analysis and
Time-Optimal Control, Academic Press, New York, 1969
[Ho] Hocking, L.M., Optimal Control: An Introduction to the The-
ory with Applications, Clarendon Press, Oxford, 1991
[Is] Isidori, A., Nonlinear Control Systems: An Introduction. 2nd
ed., Springer Verlag, Berlin, 1989
[Je] Jetschke, G., Mathematik der Selbstorganisation: Qualitative
Theorie nichtlinearer dynamischer Systeme und gleichgewichts-
ferner Strukturen in Physik, Chemie und Biologie, Vieweg Ver-
lag, Braunschweig, 1989
[JoGa] Jouan, P. e Gauthier, J.-P., Finite singularities of nonlin-
ear systems. Output stabilization, observability,and observers, J.
Dynam. Control Systems 2 (1996), 255 288
[KIF] Knobloch, H.W., Isidori, A. e Flockerzi, D., Topics in
Control Theory, DMV Seminar, 22, Birkhauser, Basel, 1993
[KnKw] Knobloch, H.W. e Kwakernaak, H., Lineare Kontrollthe-
orie, Springer Verlag, Berlin, 1985
[Know] Knowles, G., An Introduction to Applied Optimal Control,
Academic Press, San Francisco, 1981
[Kra] Krabs, W., Einf uhrung in die Kontrolltheorie, Wis-
senschaftliche Buchgesellschaft, Darmstadt, 1978
[Kre] Kreyzig, R., Introductory Functional Analysis with Applica-
tions, John Wiley and Sons, New York, 1978
steuer
2008/3/11
page 389
i
i
i
i
i
i
i
i
BIBLIOGRAFIA 389
[LeMa] Lee, E.B. e Markus, L., Foundations of Optimal Control
Theory, John Wiley and Sons, London, 1967
[Leig] Leigh, J.R., Functional Analysis and Linear Control Theory,
Academic Press, London, 1980
[Leit] Leit ao, A., On optimal control problems with innite horizon,
Nonlinear dynamics, chaos, control, and their applications to
engineering sciences 4 (2002), 251 263
[Lei] Leitmann, G., The Calculus of Variations and Optimal Con-
trol: An Introduction, Plenum Press, London, 1981
[Li] Lions, J.L., Optimal Control of Systems Governed by Partial
Dierential Equations, Springer Verlag, Heidelberg 1971
[LiYo] Li, X. e Yong, J., Optimal control theory for innite dimen-
sional systems, Birkhauser, Basel, 1994
[MaSt] Macki, J. e Strauss, A., Introduction to Optimal Control
Theory, Springer Verlag, Heidelberg, 1981
[Mo] Morgan, F., Geometric Measure Theory: A Beginners guide,
Academic Press, Boston, 1988
[Mu] Murray, J.M., Existence theorems for optimal control and
calculus of variations problems where the state can jump, SIAM
J. Control and Optimization 24 (1986), 412 438
[Pi] Piehler, J., Einf uhrung in die dynamische Optimierung, B.G.
Teubner, Leipzig, 1966
[PBG] Pontryagin, L.S., Boltyanskij, V.G., Gamkrelidze,
R.V. e Mishchenko, E.F., The Mathematical Theory of Opti-
mal Processes, Interscience Publishers, New York, 1962 (edi c ao
original em russo, 1961)
[Ra] Ramsey, F.P., A mathematical theory of saving, Economic
Journal 38 (1928), 543 549
[Ri] Rishel, R.W., An extended Pontryagin principle for control
systems whose control laws contain measures, SIAM J. Control
3 (1965), 191 205
steuer
2008/3/11
page 390
i
i
i
i
i
i
i
i
390 BIBLIOGRAFIA
[Ru1] Rudin, W., Functional Analysis, McGrawHill, New York,
1973
[Ru2] Rudin, W., Real and Complex Analysis, McGrawHill, New
York, 1966
[Sc] Scheck, F., Mechanics: From Newtons Laws to Deterministic
Chaos. 3rd ed., Springer Verlag, Berlin, 1999
[SeSy] Seierstad, A. e Sydster, K., Optimal Control Theory with
Economic Applications, North-Holland, Amsterdam, 1987
[SeZh] Sethi, S.P. e Thompson, G.L., Optimal Control Theory: Ap-
plications to Management Science, Martinus Nijho Publishing,
Boston, 1981
[SHB] Schmidt, W.H., Heier, K., Bittner, L. e Bulirsch, R.,
eds., Variational Calculus, Optimal Control and Applications,
Proceedings of the 12th International Conference in Honour of
L. Bittner and R. Kloetzler, Trassenheide, Germany, Septem-
ber, 1996, International Series of Numerical Mathematics, 124,
Birkhauser, Basel, 1998
[SFG] Skowronski, J.M., Flashner, H. e Guttalu, R.S., eds.,
Mechanics and control, Proceedings of the 3rd Workshop on
Control Mechanics, in Honor of the 65th Birthday of George
Leitmann, January, 1990, Lecture Notes in Control and Infor-
mation Sciences, 151, Springer Verlag, Berlin, 1991
[SiVi] Silva, G.N. e Vinter, R.B., Necessary conditions for optimal
impulsive control problems, SIAM J. Control Optimization 35
(1997), 1829 1846
[So] Sontag, E.D., Mathematical Control Theory: Deterministic
Finite Dimensional Systems. 2nd ed., Springer Verlag, New
York, 1998
[Sot] Sotomayor, J., Li c oes de Equa c oes Diferenciais Ordin arias,
Projeto Euclides, 11, Instituto de Matematica Pura e Aplicada,
Rio de Janeiro, 1979
[Sn] Sniedovich, M., Dynamic Programming, Marcel Dekker, New
York, 1992
steuer
2008/3/11
page 391
i
i
i
i
i
i
i
i
BIBLIOGRAFIA 391
[Tr] Troutman, J.L., Variational Calculus and Optimal Control:
Optimization with Elementary Convexity. 2nd ed., Springer Ver-
lag, New York, 1996
[ViPe] Vinter, R.B. e Pereira, F.M.F.L., A maximum principle
for optimal processes with discontinuous trajectories, SIAM J.
Control and Optimization 26 (1988), 205 229
[Wa1] Walter, W., Analysis II. 2. Au., Springer Verlag, Berlin,
1991
[Wa2] Walter, W., Gew ohnliche Dierentialgleichungen. 6. Au.,
Springer Verlag, Berlin, 1996
[We] Werner, J., Optimization: Theory and Applications, Vieweg
Verlag, Wiesbaden, 1984
[Za] Zabczyk, J., Mathematical Control Theory: An Introduction,
Birkhauser, Boston, 1992
[ZoKu] Zowe, J. e Kurcyusz, S., Regularity and stability for the
mathematical programming problem in Banach spaces, Appl.
Math. Optimization 5 (1979), 49 62
steuer
2008/3/11
page 392
i
i
i
i
i
i
i
i
steuer
2008/3/11
page 393
i
i
i
i
i
i
i
i
Indice Remissivo
a c ao, 180
acelera c ao, 170
Bellman, Richard, 281
Bernoulli, Jakob, 18
Bernoulli, Johann, 18, 20
calculo variacional, 139
condi c ao (de contorno) na-
tural, 149
condi c ao necessaria, 148, 162
condi c ao suciente, 145, 148
problemas de fronteira livre,
149, 196
problemas de horizonte livre,
197
campo
central, 172
conservativo, 172
gradiente, 173
centro de massa, 173, 177
cicloide, 19
co-estado, 22
coercividade, 309
colchete de Poisson, 186
coloca c ao de polos, 105
condi c ao
de contorno natural, 149
de contorno natural, 195, 196,
206, 210, 219
de contorno transversal, 194
de crescimento linear, 272
de FritzJohn, 370
de KuhnTucker, 8, 370
de mnimo, 23, 211, 219, 318
de n ao acoplamento, 218, 225
de otimalidade, 9, 23, 211,
218, 224, 318
de posto, 66
de Slater, 370, 371
de transversalidade, 196, 210
de WeierstraErdmann, 163
cone, 368
dual, 368
linearizado, 364
tangencial
a um conjunto por um ponto,
360
em um ponto por um con-
junto, 360
congelamento do tempo, 339
conjunto atingvel, 54
conjunto de nvel, 198
contra c ao, 338
controlabilidade, 40
estrategia otima, 51
sistema discreto, 65
controlabilidade ao zero, 41
com respeito a R
m
, 57
controle
otimo, 24, 270
steuer
2008/3/11
page 394
i
i
i
i
i
i
i
i
394

INDICE REMISSIVO
condi c ao de mnimo, 23,
218, 224, 318
condi c ao necessaria, 24, 218,
224
discreto, 66
horizonte nito, 21
tempo nal variavel, 63
tempo mnimo, 63
admissvel, 54, 207
automatico, 120
BangBang, 4, 11, 60
BangSingularBang, 13, 206
com restri c oes, 54, 60
de malha aberta, 3
de malha fechada, 3, 102
de realimenta c ao, 3, 14, 15,
102, 105, 282
singular, 220
variavel de, 2
convergencia fraca, 55
coordenada generalizada, 179
criterio de erro, 121
criterio de Kalman, 44
criterio de Lyapunov, 91
criterio de RouthHurwitz, 78,
81
dAlembert, Jean, 178
derivada de Frechet, 359
detectabilidade, 34, 111
din amica, 179
du BoisReymond, Paul, 145
energia, 172, 177
cinetica, 174
potencial, 174
total, 174
equa c ao
adjunta, 9, 23, 218, 224, 283
can onica de movimento, 184
de diferen cas, 7
de estado, 22, 218, 224
de EulerLagrange, 6, 20, 145,
148, 163, 221, 285
primeira integral, 151
de evolu c ao, 9, 21
de HamiltonJacobi, 189
de HamiltonJakobiBellman,
279, 281
de observa c ao, 40
de otimalidade, 250, 252, 254,
257, 259261
de Riccati, 292
matricial de Lyapunov, 95
discreta, 98
espa co
C[a, b], 139, 140
C
1
[a, b], 139, 140
C
1
0
[a, b], 146
C[a, b], 156
C
1
[a, b], 156
de Banach, 331
de fun c oes teste, 146, 302
euclidiano, 331
homogeneo, 169
isotropico, 169
estabilidade exponencial, 77
Euler, Leonhard, 145
exemplo
alunissagem, 231
aquecimento de um quarto,
3, 5
atrator de Lorenz, 73, 83
Braquistocrona, 18, 154
caixeiro viajante, 253
caminho simples, 246
circuito RLC, 80, 91
steuer
2008/3/11
page 395
i
i
i
i
i
i
i
i
INDICE REMISSIVO 395

concentra c ao de chumbo, 16
consumo investimento, 239
controle otimo, 21
controle discreto, 7
controle singular, 238
decis oes consecutivas, 260
deslocamento de um corpo,
1
equilbrio de um bast ao, 13,
104
geodesicas na esfera, 153
geodesicas no plano, 152
investimento de capital, 261
lan camento de um foguete,
12
oscilador harm onico, 44, 77
oscilador n ao linear amorte-
cido, 83
pendulo n ao linear, 73
piloto automatico, 69
reservatorio dagua, 4
satelite (controlabilidade), 45
satelite (observabilidade), 31
sistema linear-quadratico
contnuo, 286
discreto, 256
substitui c ao de equipamento,
251
tempo mnimo, 11, 226, 228
exponencial de matriz, 331
extremal, 8, 151
singular, 203
formula de HopfLax, 308
for ca
de Coulomb, 171
gravitacional, 171
forma can onica de Jordan, 334
forma normal de Kalman, 47, 108
fun c ao
adjunta, 283
admissvel, 140
de a c ao, 189
de Hamilton, 8, 23, 184, 208,
217, 283, 293, 313
de identica c ao, 204
de Lyapunov, 89
estrita, 89
quadratica, 97
de transferencia, 4
estacionaria, 151
Lagrangeana, 179
objetivo, 6, 7
teste, 146, 302
valor otimo, 249, 252, 254,
257, 259261, 270, 313
funcional
convexo, 142
estendido, 22
estritamente convexo, 142
objetivo, 21
Galilee, Galileo, 18
grau de liberdade, 179, 221
grupo ortocrono, 178
Hamilton, William, 281
impulso, 171, 177
integral de a c ao, 180
inversa de MoorePenrose, 66
Jakobi, Carl, 281
Lagrange, Joseph Louis, 145
Legendre, Adrien-Marie, 178
Leibniz, Gottfried Wilhelm, 18
lema
du BoisReymond, 145, 146
steuer
2008/3/11
page 396
i
i
i
i
i
i
i
i
396

INDICE REMISSIVO
Gronwall, 347, 348
Lagrange, 146
Lipschitzcontinuidade, 343
Luenberger, David G., 111
metodo
da viscosidade esvanescente,
308
de aproxima c oes sucessivas,
344, 345
de equa c oes adjuntas, 352
de identica c ao iterativo, 128
gradiente, 128
gradiente linearizado, 128
resduo, 128
de NewtonRaphson, 353
de shooting, 351
algoritmo, 353
descri c ao, 352
problema linear-quadratico,
295
mnimo
global, 140
local, 22
forte, 140
fraco, 140, 160
massa reduzida, 173
matriz
de ganho, 105
de observa c ao, 29
de realimenta c ao, 102
de transi c ao, 334, 341
estavel, 78
fundamental, 341
negativa denida, 92
positiva denida, 92
positiva semi-denida, 92
simpletica, 188
Maupertuis, Pierre Louis, 178
mec anica
a c ao, 180
acelera c ao, 170
campo
central, 172
conservativo, 172
gradiente, 173
centro de massa, 173, 177
colchete de Poisson, 186
coordenada generalizada, 179
din amica, 179
energia, 172, 177
cinetica, 174
potencial, 174
total, 174
equa c ao
can onica de movimento, 184
de HamiltonJacobi, 189
espa co
homogeneo, 169
isotropico, 169
for ca
de Coulomb, 171
gravitacional, 171
fun c ao
de a c ao, 189
de Hamilton, 184
Lagrangeana, 179
grau de liberdade, 179
grupo ortocrono, 178
impulso, 171, 177
integral de a c ao, 180
massa reduzida, 173
matriz simpletica, 188
momento angular, 174, 177
momento conjugado, 183
potencial do campo, 173
steuer
2008/3/11
page 397
i
i
i
i
i
i
i
i

princpio
da a c ao mnima, 179
Hamiltoniano, 179
sistema
fechado, 177
referencial inercial, 170
trabalho, 172
trajetoria, 170
transforma c ao de Galilei, 178
transformada de Legendre, 187
velocidade, 170
velocidade generalizada, 179
modelo de compartimentos, 16,
38
momento angular, 174, 177
momento conjugado, 183
n ucleo de reconstru c ao, 36
Newton, Isaac, 18
lei de, 2, 14, 168
norma
equivalente, 331
norma-p, 331
observabilidade, 27
observador din amico, 111, 114,
117
operador de reconstru c ao, 36
operador linear, 331
contrativo, 96
n ao expansivo, 97
par ametro de Markov, 126
Pareto otimalidade, 165
ponto de equilbrio, 72
assintoticamente estavel, 73
atrativo, 73, 96
estavel, 73, 96
ponto de opera c ao, 116
ponto fracamente regular, 361
ponto regular, 361
potencial do campo, 173
princpio
da a c ao mnima, 179
de Bellman, 245, 277, 314
de Fermat, 20
de Pontryagin, 24
do BangBang, 61
do maximo, 24
hamiltoniana convexa, 212
horizonte nito, 218
horizonte innito, 224
problema linear-quadratico,
293
solu c oes viscosas, 318
Hamiltoniano, 179
problema
de Cauchy, 344
de valor inicial, 331
homogeneo, 333, 337
n ao homogeneo, 337, 342
processo
otimo, 270
admissvel, 207
estacionario, 261
programa c ao din amica, 245
pseudo inversa, 66
realimenta c ao
de estado, 102, 109
de sada, 102, 110
reconstru c ao de estado, 111
reconstru c ao de par ametros, 16
regulagem, 3
resson ancia, 78
restri c ao
isoperimetrica, 139, 197
steuer
2008/3/11
page 398
i
i
i
i
i
i
i
i
398

INDICE REMISSIVO
lagrangeana, 139, 198
sada, 26, 39
sistema
adjunto, 343
BIBOestavel, 77
Bounded-Input Bounded-Output,
77
completamente controlavel, 44
controlavel, 5, 40
de referencia, 121
adaptativo, 127
detectavel, 34
discreto, 65
completamente controlavel,
65
entrada, 2
estavel, 75
estabilizavel, 102
fechado, 177
fundamental, 341
Hamiltoniano, 23, 223, 283,
285, 318
identicavel, 122
atraves de um experimento,
122
linear, 2, 26
aut onomo, 27, 44, 332
discreto, 96
n ao aut onomo, 27, 337
modelo de referencia adap-
tativa, 121
MRAS, 121
n ao linear, 343
observavel, 5, 27
referencial inercial, 170
sada, 2
Single-Input Single-Output,
4
solu c ao viscosa, 302
orgem do termo, 308
sub-solu c ao, 302
super-solu c ao, 302
subdiferential, 304
parcial, 305
subespa co n ao observavel, 33
superdiferential, 304
parcial, 305
teorema
BanachAlaoglu, 55
CaleyHamilton, 30
da aplica c ao aberta, 364
de verica c ao, 280
decomposi c ao espectral, 335
fundamental da algebra, 79
fundamental do calculo, 157
Heine-Borel, 56
KreinMilman, 62
Lyapunov, 91
multiplicadores de Lagrange,
8, 197, 358
PicardLindelo, 72
ponto xo de Banach, 338,
345
Rademacher, 275
RouthHurwitz, 81
topologia fraca
, 61
tour mais curto, 254
trabalho, 172
trajetoria
otima, 270
admissvel, 207
mec anica, 170
transforma c ao de Galilei, 178
transforma c ao de semelhan ca, 334
transformada
de Legendre, 187
steuer
2008/3/11
page 399
i
i
i
i
i
i
i
i

variavel
adjunta, 22, 318
de controle, 2, 26, 39
de estado, 1, 26, 39
varia c ao de G ateaux, 141
velocidade, 170
velocidade generalizada, 179
Weierstra, Karl, 145

Introdução À Teoria de Controle e Programação Dinâmica

Hochgeladen von

Dokumentinformationen

Originalbeschreibung:

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Introdução À Teoria de Controle e Programação Dinâmica

Hochgeladen von

Copyright:

Verfügbare Formate

steuer

Indice Remissivo 393

; controles impulsivos) foi sacricada em

AO DOS SISTEMAS DE CONTROLE 3

([0, T]), . . . ) e con-

g. Da obtemos a matriz fundamental Z do sistema

g +k. De onde conclumos que,

) e um mnimo (local) de I. Sejam ainda

) R, para [[ pequeno. Logo I() possui um

) e chamada matriz de observa c ao do

. Este fato ca claro no teorema a seguir.

s ao escolhidos de forma a possuir razes

(A) denidos como em (2.7).

, a m de denir um novo conceito de observabilidade atraves da

w respectivamente, e dada por

(onde d1 + d2 + d3 + d4 = n). Dena agora a matriz P atraves da

(0), temos que [u(s)[ m = R, t [0, T], z

s, s R. Como (s) > 0 para s > (

IPIO DO BANGBANG E PROBLEMAS DE TEMPO M

ser metriz avel em subconjuntos limitados

(F; R)] = . Logo,

(F; R) com v Ke(I

IPIO DO BANGBANG E PROBLEMAS DE TEMPO M

e n ao vazio. O candidato natural `a solu c ao de (P

t). Como R(; t

t), o que implica

e n ao singular por hipotese e

Figura 3.1: Piloto automatico para controle de altitude

com suporte compacto em [t

E de simples verica c ao o fato dos pontos

E possvel assim, vericar de forma clara a natureza instavel do sistema.

) a > 0, b > 0, c > 0 e ab > c

) a > 0, b > 0, c > 0, d > 0 e abc > c

E facil vericar que os autovalores da matriz A s ao:

) V (x), f(x)) < 0 para todo x U0.

. Seja z : [0, ) U uma solu c ao de

P +PA ser negativa denida. 2

C e positiva semi-denida, ent ao W tambem o e. Logo,

C)z(t)) = Cz(t), Cz(t)), t 0.

PAP e negativa denida. (Na verdade

PAP = I e denominada equa c ao matricial discreta

basta vericar que:

b) satisfazendo as hipoteses do item

, (2, 4, 16, 0, 36)

E facil vericar que os sistemas (A, B) e (A, , C) s ao respectivamente

) < 0 ao mesmo tempo. Portanto, o sistema n ao e estabili-

) e controlavel. O item c) segue agora do Teorema 89.

)(D) e estavel. Logo, A+LC e estavel com a escolha L := D

E facil ver que (A, B) e controlavel e (A, , C) observavel, e portanto

E possvel utilizar sistemas auxiliares observadores tambem para sis-

AO ADAPTATIVA: ESTABILIDADE 131

, juntamente com (6.14). A armativa e) e

AO ADAPTATIVA: ESTABILIDADE 133

AO ADAPTATIVA: ESTABILIDADE 135

e o elemento de norma mnima no subespa co am / :=

obtemos, argumentando como na demonstra c ao do Teorema 115, que

E comum considerar o problema de minimizar (7.1) sujeito a dife-

< temos I(y) I( y).

I(y +v) I(y).

e necessario que y seja solu c ao do problema de valor de contorno

(t)) e preciso usar a regra de cadeia e a fun c ao y, envolvida na

existe uma solu c ao C