Sie sind auf Seite 1von 94

Captulo 4

Estimao de Parmetros

Antes de comearmos a discutir o problema e o procedimento de estimao de


parmetros, conveniente retornar Seo 1.1 e Figura 1.1, para relembrar o processo
clssico de construo do conhecimento cientfico. As observaes experimentais,
quando inseridas no contexto cientfico, tm como objetivo fundamental permitir que se
compreendam os vnculos que existem (e se de fato existem) entre as diversas variveis
que compem um problema. O puro exerccio de observao e armazenamento de dados
experimentais no constitui um processo cientfico. Para que o processo cientfico se
ponha em marcha, necessrio estabelecer relaes, propor explicaes, construir e
testar teorias. Como j discutido na Seo 1.1, muito comum ainda hoje ouvir
discusses sobre a natureza do trabalho cientfico, classificando os pesquisadores ora
como experimentalistas, ora como tericos. Essa discusso vazia e ftil! No aceite
ser classificado dessa forma! Todo bom pesquisador exercita o lado experimental (que
fornece a matria-prima bsica para interpretao da realidade e validao de teorias e
modelos) e o lado terico (que permite estabelecer as relaes entre as diversas
variveis do problema, tornando assim possvel a compreenso dos eventos passados e a
previso dos eventos futuros). bvio que certas pessoas tm mais afinidade com o
computador que com a chave de fendas, e vice-versa. por isso que o trabalho conjunto
e em equipe to importante para o bom desenvolvimento da pesquisa cientfica!
Nesse contexto, as tcnicas de estimao de parmetros constituem as
ferramentas bsicas para estabelecimento e interpretao dos vnculos existentes entre
as diversas variveis de um problema. Como discutido nos captulos seguintes, os
procedimentos de estimao de parmetros so as ferramentas que tornam possvel a
interpretao qualitativa e quantitativa dos dados experimentais, tornando tambm
possvel a discriminao das variveis relevantes de um problema, a construo de
modelos preditivos, a simulao e projeto de processos, etc. Dessa forma, os
procedimentos de estimao de parmetros constituem a ponte que conecta as
observaes experimentais interpretao terica e quantitativa do problema. Ser
surpreendente para muitos descobrir ao longo dos prximos captulos que toda a
atividade experimental cientfica desemboca em procedimentos de estimao de
parmetros, mesmo quando essa atividade no est sendo aparentemente realizada. Mais
surpreendentemente ainda ser descobrir que toda metodologia de planejamento
experimental encontra-se intimamente ligada aos procedimentos de estimao de
parmetros. Afinal, para isso mesmo que os experimentos so feitos! Por isso, preste
muita ateno nas discusses que se seguem!

Captulo 4: Estimao de Parmetros

163

4.1. Modelos, Modelagem e Simulao


Mas, afinal, o que um modelo? Podemos definir um modelo como uma
estrutura que tenta descrever de forma aproximada a realidade, baseado em um conjunto
de observaes experimentais. Um modelo , portanto, uma estrutura que estabelece
vnculo entre variveis distintas e permite explicar os eventos passados e prever de
alguma forma o comportamento do sistema em condies experimentais ainda no
realizadas. Se, dadas certas condies experimentais, um observador capaz de fazer
algum tipo de previso sobre o resultado futuro a ser ainda observado, ento o
observador dispe de um modelo.
Como j discutido na Seo 1.1, importante lembrar que o modelo no deve
ser jamais confundido com a realidade. O modelo apenas uma tentativa de explicar
a realidade, baseado nas observaes disponveis e em um conjunto de hipteses
admitidas pelo pesquisador. Nenhum modelo capaz de descrever a realidade
completamente porque todo dado experimental corrompido por erros de medida e
porque nem todas as variveis podem ser controladas e/ou medidas precisamente
durante os testes experimentais, como j discutido nos captulos anteriores. Por isso, o
bom pesquisador no tem apego a qualquer modelo e est pronto a modific-lo sempre
que uma nova observao experimental confivel (ou seja, que pode ser reproduzida,
respeitados os limites impostos pela incerteza experimental) no pode ser explicada pela
estrutura original. Darwin e Einstein so gnios da humanidade exatamente porque
tiveram a coragem de reinterpretar a realidade sugerida por um novo conjunto de dados
experimentais. E o modelo evolucionrio e da relatividade so ainda considerados bons
modelos porque as novas observaes experimentais puderam ser previstas e explicadas
de forma adequada com essas estruturas tericas. Mas quem sabe o que nos reserva o
futuro? claro que no fcil propor mudanas em um modelo muito testado e
amplamente aceito pela comunidade cientfica. Por isso, h que se ter cuidado com a
interpretao dos dados experimentais. Mas h tambm que se ter a coragem de propor
novas interpretaes da realidade. No pode haver oportunidade maior para um
pesquisador que um dado experimental que no pode ser explicado pelo modelo!
O modelo pode ser apresentado de vrias formas, a depender dos propsitos do
pesquisador, das limitaes das observaes experimentais e da complexidade do
fenmeno investigado. Algumas dessas formas so apresentadas a seguir.
4.1.1. O Modelo Matemtico
O modelo matemtico aquele que prope que as relaes entre as diversas
variveis de um problema podem ser descritas de forma matemtica precisa. Por
exemplo:
y = 5x + 4 z 2 + 1
d2y
1 dy
dy
+
= Da y 2 , y ( 0 ) = 0 ,
2
dx
Pe dx
dx

=0
x=L

No primeiro caso, a relao explcita: dados os valores das variveis x e z, possvel


calcular diretamente o valor da varivel y. No segundo caso, a relao implcita: dados

Captulo 4: Estimao de Parmetros

164

os valores de Pe, Da, L e um certo valor de x, necessrio primeiramente resolver a


equao para achar o valor de y. (Muitas vezes, a resoluo do modelo s pode ser feita
com o auxlio de mtodos numricos sofisticados.) De qualquer forma, em ambos os
casos as relaes matemticas so bem estabelecidas.
A grande vantagem dos modelos matemticos que eles podem ser usados para
fazer previses quantitativas sobre o comportamento futuro do sistema estudado.
Modelos matemticos so, portanto, ferramentas fundamentais das cincias exatas, j
que so eles que permitem o projeto de novos processos e equipamentos.

Exemplo 4.1 - Suponha que um vaso de reao tem que ser projetado para conduzir a
reao
K
A
B

onde K a constante de velocidade da reao. Suponha que o reagente A fornecido em


concentrao conhecida CA0 por uma empresa j estabelecida no mercado e ser
transformado no produto B dentro do vaso de volume desconhecido V. O tempo total da
batelada tB, sendo que necessrio, alm de promover a reao, tambm descarregar,
limpar e carregar o vaso entre bateladas sucessivas. Esses tempos so representados
respectivamente por tR, tD, tL e tC. Assim, para fazer o projeto da unidade, necessrio
descrever primeiramente o lucro da empreitada. A funo lucro L pode ser escrita como
L (V , t R ) =N BV ( C A0 C Af ( t R ) ) $ B N BVC A0 $ A N B (VC Af ( t R ) ) $O V n $ I
m

onde NB o nmero total de bateladas realizadas ao longo da vida til do equipamento


t, dado por

NB =

t
( tR + t D + tL + tC )

e $B, $A, $O e $I so respectivamente os preos de mercado para o produto, o reagente, a


operao (que aumenta com o teor de reagente no final da batelada, por causa da
necessria purificao do produto) e o investimento (que aumenta com o aumento das
dimenses do equipamento). CAf (tR) o teor residual de A no produto final.
O primeiro termo da equao do lucro representa os ganhos obtidos com a venda
do produto B; o segundo termo, os custos devidos compra do reagente A; o terceiro,
os custos operacionais do processo; e o quarto, os custos do investimento. Quanto maior
o tempo de reao, menor o teor residual final de A, maior a quantidade de produto B e
menores os custos operacionais. No entanto, quanto maior tR, menor o nmero de
bateladas produzidas ao longo da vida til do equipamento. (Admite-se que tD, tL e tC
so constantes.) Quanto maior o volume V do reator, maiores so as quantidades
produzidas do produto B, mas tambm maiores so os custos operacionais e de
investimento. Por isso, deve haver um ponto timo, ou de mximo lucro. O projeto
consiste em achar esse ponto de mximo lucro.

Captulo 4: Estimao de Parmetros

165

O ponto de mximo pode ser encontrado fazendo-se

L
= f1 (V , t R ) = 0
V
m
mN B
N B ( C A0 C Af ( t R ) ) $ B N B C A0 $ A
VC Af ( t R ) ) $O nV n 1 $ I = 0
(
V
e

L
= f 2 (V , t R ) = 0
t R
N B
t R

V ( C C ( t ) ) $ V C $ (V C ( t ) )m $
A0
Af
R
B
A0 A
Af
R
O

NB V

C Af
t R

$B

m
m NB
V C Af ( t R ) ) $O = 0
(
C Af ( t R )

Repare que as duas equaes acima dependem de duas variveis (V e tR) e,


portanto, podem ser resolvidas usando-se a tcnica matemtica adequada para resoluo
de equaes algbricas, como a tcnica de Newton-Raphson. Contudo, preciso nesse
caso definir quem a funo CAf (tR); ou em outras palavras, como a concentrao de A
no reator depende to tempo de reao. Ou ainda, necessrio definir o modelo
matemtico que descreve de forma apropriada a evoluo da reao no tempo.
Admitindo-se que a reao de primeira ordem, ento:

dC A
= K C A , C A ( 0 ) = C A0
dt
de forma que

C Af ( t R ) = C A0 exp ( K t R )
Como saber se a reao de primeira ordem ou que a relao acima vlida? A
resposta correta : fazendo experimentos e construindo o modelo. Como saber o valor
de K? A resposta correta : estimando parmetros. O engenheiro que usa a informao
acima para fazer o projeto do reator nem sempre percebe que usurio dos
procedimentos de modelagem e estimao de parmetros j executados por um outro
observador. Sem o modelo e sem o parmetro, o projeto bem embasado impossvel.

4.1.2. O Modelo Conceitual

O modelo conceitual aquele que estabelece vnculos qualitativos entre as vrias


variveis de um problema, sem que se estabeleam necessariamente vnculos
matemticos quantitativos precisos. Esses modelos so muito utilizados em campos da
cincia onde a mensurao das variveis complexa ou impossvel, como na rea de
Cincias Humanas, e como prottipo de modelos matemticos precisos, a serem
desenvolvidos a posteriori.

Captulo 4: Estimao de Parmetros

166

Um exemplo clssico de modelo conceitual o bem conhecido Complexo de


dipo, usado para explicar as relaes que se estabelecem entre pais e filhos na
Psicologia. Admite-se que os filhos homens disputam a ateno da me com o pai e que
a maneira com que se desenrola essa disputa pode resultar na formao de pessoas
adultas saudveis ou no desenvolvimento de srios desvios de comportamento. Repare
que a mensurao das grandezas envolvidas virtualmente impossvel nesse caso,
impedindo a construo de um modelo matemtico preciso do fenmeno. Isso no
diminui, no entanto, a importncia do modelo nem impede o seu uso para a soluo de
problemas reais da Psicologia.
Um modelo conceitual extremamente importante na Engenharia a idia de que
a massa, a energia e a quantidade de movimento do universo se conservam. (O primeiro
modelo chamado de Princpio de Lavoisier; o segundo modelo chamado de Primeira
Lei da Termodinmica; o terceiro modelo constitudo pelas Leis Fundamentais de
Newton para o Movimento.) Esse o ponto de partida para a quase totalidade dos
modelos matemticos fenomenolgicos que se estabelecem nos vrios ramos da
Engenharia. Assim, partindo-se do pressuposto de que massa, energia e quantidade de
movimento se conservam, possvel estabelecer vnculos matemticos quantitativos
precisos entre vrias variveis envolvidas em um fenmeno fsico particular.
Exemplo 4.2 - Suponha que uma massa M0 de gua colocada em uma caixa d'gua,
com comprimento L, altura H e largura W. Suponha que um medidor de nvel (bia)
fornece a altura h de gua no interior da caixa d'gua em qualquer instante de tempo.
possvel com essas informaes acompanhar a quantidade de gua consumida?
3

Sabendo-se que a densidade da gua = 1000 kg/m , a massa de gua contida


no interior da caixa d'gua pode ser obtida em qualquer instante de tempo como
M = LW h

Admitindo-se que a massa total do universo (nesse caso, a caixa d'gua) permanece
constante, possvel escrever
M0 = M + MC

onde MC a massa total de gua consumida, j que a gua no poderia desaparecer


como num golpe de mgica. Portanto
MC = M0 L W h

Repare que a equao acima s pode ser escrita depois de se admitir que a massa
total do universo tem que permanecer constante. O modelo conceitual precede, portanto,
o modelo matemtico preciso.

Observe que j se sabe h muitos anos que o Princpio de Lavoisier no vlido


quando os objetos se movem com grande contedo de energia. Nesse caso, necessrio
utilizar a Teoria da Relatividade para acompanhar com maior preciso as variaes de

Captulo 4: Estimao de Parmetros

167

massa do universo. A Teoria da Relatividade admite, entre outras coisas, que existe uma
relao direta entre massa e energia, que assim seriam manifestaes distintas de uma
mesma grandeza mais fundamental. O Princpio de Lavoisier, no entanto, descreve
bastante bem o comportamento de sistemas de baixa energia, constituindo por isso a
base de toda a Engenharia Qumica. Isso mostra que um modelo no precisa ser
completo nem descrever todos os detalhes da realidade para que seja til e possa ser
usado na prtica. Na realidade, um modelo til quando fornece as respostas desejadas,
com preciso compatvel com a preciso experimental, com o maior grau de
simplicidade possvel. Utilidade e complexidade no so sinnimos!
4.1.3. O Modelo Fsico - A Planta Piloto

Em muitos problemas inconveniente ou impossvel realizar experimentos


diretamente no sistema estudado. Por exemplo, em uma fbrica no h muito espao
para experimentao, uma vez que experimentos mal sucedidos podem resultar em
acidentes ou em desvios das metas de produo. Em ambientes naturais, experimentos
mal sucedidos podem comprometer a sade do ecossistema e resultar em catstrofes
ambientais. Nesses casos, comum construir modelos fsicos reais do sistema estudado,
as chamadas plantas pilotos. As plantas pilotos so modelos fsicos reais, quase sempre
de escala muito inferior escala dos sistemas realmente estudados, utilizados para fazer
experimentaes e estudos que podem ser vinculados ao comportamento dos sistemas
reais de interesse. Por exemplo, uma planta piloto que produz 10 kg de plstico por hora
pode ser usada como modelo de uma fbrica que produz 30 toneladas de plstico por
hora. Assim, testes de produo s so efetuados na planta industrial depois de terem
sido aprovados na planta piloto, onde os custos e riscos so muito menores. Tambm
nesse caso o modelo no deve ser confundido com a realidade, j que a planta industrial
provavelmente muito mais complexa que a planta piloto usada para represent-la, em
funo do maior volume de peas e equipamentos.
Pode-se de certa forma dizer que um modelo resulta sempre de um trabalho de
investigao em qualquer rea do conhecimento, j que o objetivo central da cincia
correlacionar dados e fatos. Para o engenheiro, pela prpria natureza prtica e exata da
Engenharia, a tarefa de construir modelos para um sistema atinge o seu clmax quando
resulta num conjunto consistente de relaes matemticas que permita a descrio
quantitativa do sistema. Essa atividade designada genericamente de modelagem. Para
os fins desse livro, define-se especificamente como modelagem quelas atividades
relacionadas ao desenvolvimento de relaes matemticas precisas entre as vrias
variveis de um problema.

Captulo 4: Estimao de Parmetros

168

Figura 4.1 - O Conceito de Modelagem.

O conceito de modelagem pode ser representado como na Figura 4.1. Portanto, a


representao similar utilizada para representar o ciclo clssico do mtodo cientfico
na Figura 1.1, pois o modelo resulta naturalmente da compreenso do problema
analisado. importante observar na Figura 4.1 que o modelo est necessariamente
vinculado ao conjunto de hipteses efetuadas pelo observador e aos dados
experimentais obtidos. Logo, para que descreva adequadamente dados reais, a
modelagem no dispensa os dados experimentais. MUITO PELO CONTRRIO!
Apenas os dados experimentais podem permitir a validao e/ou negao do modelo
criado. No possvel, portanto, fazer modelagem sem experimentao. Modelagem
sem experimentao especulao!
As atividades de modelagem so muito importantes nas diversas reas da cincia
porque so muitas as utilidades de um bom modelo matemtico. Primeiramente, o
modelo matemtico permite armazenar uma quantidade enorme de informao
experimental. Por exemplo, a Teoria Clssica da Gravitao diz que a fora de atrao
exercida mutuamente por dois corpos de massas M1 e M2, separados por uma distncia r
igual a
F =G

M1 M 2
r2

Repare que a equao acima substitui os infinitos registros experimentais


possveis para as foras de atrao entre corpos de massas distintas, separados por
distncias distintas. 10 smbolos (contando os sinais e ndices) substituindo infinitos
registros experimentais. Que bela conciso! Somemos a essa equao a Segunda Lei de
Newton
M

dv
=F
dt

e j somos capazes de descrever o comportamento de uma infinidade de sistemas fsicos


reais e de interesse tecnolgico. Que enxuto! Que beleza!
Em segundo lugar, como j discutido, os modelos podem ser usados para prever
o comportamento de sistemas de interesse. a atividade usualmente denominada de

Captulo 4: Estimao de Parmetros

169

simulao. Modelos so utilizados para simular o comportamento de sistemas fsicos


reais. Pode-se definir como simulao ao uso do modelo que representa o sistema real
para estudar o comportamento do sistema fsico real. Podem ser consideradas atividades
de simulao as atividades de projeto, de otimizao, de anlise de estratgias, de
treinamento, etc., sempre que o modelo for usado como representao adequada do
sistema real. A atividade de simulao extremamente importante do ponto de vista
prtico, j que resolver equaes em geral mais barato e mais rpido, alm de muito
mais seguro, que promover testes experimentais no sistema fsico real. Assim, um teste
experimental que a simulao indique que resultar em resposta inadequada no deve
ser realizado. Por outro lado, a realizao de um experimento que a simulao indique
que resultar em uma resposta mais adequada do processo deve ser incentivada. Se a
melhoria no for de fato obtida, no se deve desprezar o modelo ou renegar a atividade
de modelagem. Ao invs disso, deve-se modificar e aperfeioar o modelo. Se a resposta
obtida for satisfatria, o modelo validado e a confiana no modelo e na qualidade da
interpretao do fenmeno fsico aumenta.

4.2. Classificao de Modelos


Muitas vezes conveniente classificar os modelos em grupos distintos, em
funo dos diferentes conjuntos de ferramentas e tcnicas matemticas disponveis para
anlise.

4.2.1. Modelos Tericos e Empricos


Diz-se que um modelo terico quando as equaes que relacionam as diversas
variveis do problema so derivadas a partir de pressupostos tericos fundamentais,
como as leis de conservao de massa, energia e quantidade de movimento. Pode-se
dizer que os modelos tericos derivam de modelos conceituais que procuram interpretar
o fenmeno fsico estudado. Diz-se que o modelo emprico quando as equaes
utilizadas para descrever as relaes observadas entre as diversas variveis do problema
so postuladas, no havendo qualquer pressuposto terico que justifique a princpio a
relao utilizada. Muito freqentemente, os modelos tericos podem ser propostos a
priori, antes mesmo da observao experimental (o que no significa que modelos
tericos prescindam das observaes experimentais, uma vez que alguns pressupostos
tericos podem no ser verdadeiros para o problema particular analisado). Por sua vez,
o desenvolvimento de modelos empricos depende completamente da obteno de dados
experimentais confiveis e da criatividade do analista.

Exemplo 4.3 - Considere o problema de mistura num vaso de processo, como


apresentado abaixo:

Captulo 4: Estimao de Parmetros

170

Figura 4.2 - Mistura contnua em um vaso de processo.


Admitindo-se que a massa se conserva, possvel escrever a seguinte relao
matemtica
m& 3 = m& 1 + m& 2
que um modelo terico simples, que relaciona as variveis do problema.
Admita que um conjunto de medidas experimentais obtido em campo, na
forma
m& 1 (kg/h)
m& 2 (kg/h)
m& 3 (kg/h)

1.0

2.0

2.0

2.0

2.0

1.0

3.1

3.9

2.9

Observe que a relao terica no obedecida exatamente. No primeiro caso


parece sair mais massa do que entra, enquanto no segundo e terceiro casos parece
acontecer o contrrio. Isso significa que o modelo terico est errado? No
necessariamente. Lembre que os instrumentos esto sujeitos a pequenos erros de medida
e que no h preciso absoluta em nenhum processo de medio. H que se avaliar de
forma mais precisa como os desvios observados se comparam aos erros de predio.
Alm disto, quem garante que no pode haver um pequeno vazamento nas linhas? Nesse
caso, o problema no seria do pressuposto terico, mas do inadequado controle
experimental. (Alis, algum saberia dizer por que a massa se conserva
obrigatoriamente?)
Suponha agora que um modelo emprico ser construdo a partir dos dados
disponveis. Nesse caso, prope-se a priori que
m& 3 = m& 1 + m& 2
onde e so constantes a serem determinadas a partir das medidas experimentais.
Para isso, utiliza-se aqui um procedimento chamado de mnimos quadrados, que
consiste em reduzir ao mnimo as diferenas do quadrado dos desvios observados entre
as medidas experimentais e calculadas. Nesse caso,

Captulo 4: Estimao de Parmetros


3

F = m& 3ei m& 3mi


i =1

171
3

) = ( m&
2

e
3i

m& 1ei m& 2ei

i =1

deve ser mnimo. O superescrito e indica o dado experimental, enquanto o superescrito


m designa o dado obtido a partir do modelo. Para obter o valor mnimo,
3
F
= 2 m& 3ei m& 1ei m& 2ei
i =1

)( m& ) = 0

3
F
= 2 m& 3ei m& 1ei m& 2ei
i =1

)( m& ) = 0

e
1i

e
2i

resultando em
16.7 = 9 + 8

16.9 = 8 + 9

= 0.8882

= 1.0882

e no modelo emprico
m& 3 = 0.8882m& 1 + 1.0882m& 2
Repare que nenhum argumento terico sustenta a relao apresentada acima,
mas somente o fato de descrever de forma adequada os dados experimentais obtidos.
Abaixo so mostrados os resultados experimentais e as previses obtidas com os
modelos terico e emprico. Entre parnteses so mostrados os desvios observados entre
a previso do modelo e o dado experimental.
m& 3 (kg/h)
m& 3 (kg/h)
m& 3 (kg/h)

3.1

3.9

2.9

(dado experimental)

3.0 (-0.1)

4.0 (+0.1)

3.0 (+0.1)

(modelo terico)

3.06 (-0.04)

3.95 (+0.05) 2.86 (-0.04)

(modelo emprico)

importante enfatizar que nesse texto no se faz qualquer diferenciao ou


discriminao dos modelos somente pela forma com que foram gerados. Em outras
palavras, no se considera aqui que modelos tericos so necessariamente melhores que
os modelos empricos somente porque esto baseados em pressupostos tericos. Deixase essa questo para o analista e seu problema particular. De qualquer forma,
importante dizer que modelos tericos usualmente permitem extrapolaes muito mais
confiveis que aquelas obtidas com modelos empricos. Isso ocorre porque em geral
muito mais razovel admitir que os pressupostos tericos se mantenham vlidos em
ampla faixa de experimentao (Figura 4.3) do que admitir que a estrutura matemtica
proposta se mantenha constante ao longo de todas as possveis condies experimentais
(Figura 4.4). Por isso, pode-se dizer sem muito rigor que modelos empricos revelam a
estrutura local das relaes existentes entre as diversas variveis, enquanto modelos
tericos permitem desvendar uma estrutura muito mais geral a partir de umas poucas
observaes experimentais. Por outro lado, modelos empricos so em geral mais
simples e fceis de derivar, permitindo construo mais rpida e barata, quando

Captulo 4: Estimao de Parmetros

172

comparada construo de modelos tericos mais detalhados do processo. Portanto, no


parece surpreendente o fato de modelos empricos serem preferidos para realizar
interpolaes e desenvolver aplicaes em linha, como em algoritmos de controle de
processos. Por essa razo, esse texto d igual importncia aos modelos tericos e
empricos, entendendo que cada grupo particular de modelos encontra tambm seu
nicho particular de aplicaes.

Figura 4.3 - O Desenvolvimento de um Modelo Terico.

Figura 4.4 - O Desenvolvimento de um Modelo Emprico.


4.2.2. Modelos Lineares e No Lineares

Diz-se que o modelo linear quando ele satisfaz uma das seguintes
propriedades:
Propriedade 4.1 - Sejam y T = [ y1

y2 ... y NY ] um conjunto de variveis, chamadas

de variveis de sada ou de variveis dependentes, e xT = [ x1 x2 ... xNX ] um


segundo conjunto de variveis, chamadas de variveis de entrada ou de variveis
independentes. Seja ainda um modelo matemtico explcito na forma

y1 f1 ( x1 x2 ... xNX )

y f x x ... x
2
2( 1
2
NX )

y=
=
= f (x)

...
...


y NY f NY ( x1 x2 ... xNX )

(4.1)

O modelo matemtico explcito da Equao (4.1) linear se

y = f ( x + w ) = f ( x ) + f ( w )
onde e so escalares quaisquer.

(4.2)

Captulo 4: Estimao de Parmetros

173

O modelo descrito pela Equao (4.1) dito explcito porque permite a obteno
direta dos valores das variveis dependentes a partir dos valores das variveis
independentes. A definio de modelo linear extremamente importante porque os
modelos lineares via de regra permitem a obteno de solues analticas para os
problemas de simulao, otimizao e estimao de parmetros, como ser visto
adiante.
Propriedade 4.2 - Sejam y T = [ y1

y2 ... y NY ] um conjunto de variveis, chamadas

de variveis de sada ou de variveis dependentes, e x T = [ x1 x2 ... xNX ] um


segundo conjunto de variveis, chamadas de variveis de entrada ou de variveis
independentes. Seja ainda um modelo matemtico implcito na forma
g1 ( x1 x2 ... xNX ; y1 y2 ... y NY )

g 2 ( x1 x2 ... xNX ; y1 y2 ... y NY ) = g ( z )

...

g NY ( x1 x2 ... xNX ; y1 y2 ... y NY )


onde z T = [ x1 x2 ... xNX
Equao (4.3) linear se

y1

(4.3)

y2 ... y NY ] . O modelo matemtico implcito da

g ( z + w ) = g ( z ) + g ( w )

(4.4)

onde e so escalares quaisquer.


O modelo descrito pela Equao (4.3) dito implcito porque no permite a
obteno direta dos valores das variveis dependentes a partir dos valores das variveis
independentes. Nesse caso, diz-se que o modelo tem que ser resolvido. Uma vez
resolvido, a Equao (4.3) ganha a forma da Equao (4.1). Repare que o significado de
"resolvido" aqui muito tnue. Por exemplo, a aplicao de uma tcnica numrica
permite resolver o sistema sem que seja necessrio encontrar uma soluo analtica
fechada para o problema. Por isso, na grande maioria das vezes ser admitido nesse
livro que o modelo matemtico tem a forma da Equao (4.1), mesmo que uma soluo
analtica fechada no seja disponvel para o problema. Nesse caso, estar sendo
admitido implicitamente que uma tcnica numrica pode ser usada para resolver o
sistema.
Exemplo 4.4 - Seja o modelo matemtico implcito abaixo, que relaciona o conjunto de
variveis dependentes y com o conjunto de variveis independentes x
x
g ( z ) = C z = [ A B] = A x + B y
y
onde C uma matriz de dimenso NYx(NX+NY), A uma matriz de dimenso NYxNX e
B uma matriz de dimenso NYxNY. Nesse caso,

Captulo 4: Estimao de Parmetros

174

g ( w + u ) = C ( w + u ) = C w + C u = g ( w ) + g ( u )
Logo, o modelo matricial proposto linear. Repare que a equao implcita
x
g ( z ) = C z = [ A B] = A x + B y = 0
y
pode ser resolvida como

y = B 1 A x = f ( x )
passando a ter a forma explcita, desde que a matriz B possa ser invertida. Nesse caso,

f ( w + u ) = B 1 A ( w + u ) = B 1 A w B 1 A u = f ( w ) + f ( u )
confirmando a linearidade.
Modelos lineares matriciais como aqui descritos aparecem naturalmente durante
a formulao de balanos de massa, com ou sem reao. Por exemplo, sejam as
seguintes reaes qumicas:
(1) A + B C + D
(2) A + C E + F
Ento, as seguintes equaes de balano podem ser escritas para um tanque
fechado onde ocorrem as reaes:

M A0 M A 1 2 = 0
M B 0 M B 1 = 0
M C 0 M C + 1 2 = 0
M D 0 M D + 1 = 0
M E 0 M E + 2 = 0
M F 0 M F + 2 = 0
onde 1 e 2 so os graus de avano das reaes 1 e 2 respectivamente. As equaes
acima podem ser tambm escritas como:

1
0

0
0

0 0 0 0 0 M A0 M A 1
1 0 0 0 0 M B 0 M B 1
0 1 0 0 0 M C 0 M C +1
+

0 0 1 0 0 M D 0 M D +1
0 0 0 1 0 M E 0 M E 0

0 0 0 0 1 M F 0 M F 0

1
0
1 1
=0

0 2
+1

+1

Captulo 4: Estimao de Parmetros

175

Exemplo 4.5 - Seja o modelo parablico apresentado a seguir.


y = x2
ento

w + z ) = 2 w2 + 2 w z + 2 z 2 w2 + z 2
2

Logo, o modelo no linear.

Exemplo 4.6 - O conceito de linearidade no absoluto para uma equao e depende


das variveis consideradas no problema. Por exemplo, seja o modelo na forma

y = 1 x12 + 2 x22
O modelo linear nas variveis T = [1 2 ] e no linear nas variveis x T = [ x1 x2 ] .
Portanto, necessrio definir as variveis consideradas para que o conceito de
linearidade faa sentido.
Da mesma forma, seja o modelo matemtico implcito abaixo, que relaciona a
varivel dependente y com a varivel independente x

g ( y, x ) =

dy
+ 4 y , y ( 0 ) = y0
dx

Fazendo-se

w
u w1 + u1
y
z = = w + u = 1+ 1 =

x
w2
u2 w2 + u2
ento

y = w1 + u1
x = w2 + u2

dw
du
dy
= 1 + 1
dx
dx
dx

d
d
d
d

=
=
dw2
dx
du2
dx

y = w1 + u1 y0 = w10 + u10
Combinando as duas equaes acima nos termos da equao original

dw
du
dw du
dy
= 1 + 1 = 1 + 1
dx
dx
dx dw2 du2
4 y = 4 w1 + 4 u1

Captulo 4: Estimao de Parmetros

176

dw1
du

+ 4 w1 + 1 + 4 u1 g ( w1 , w2 ) + g ( u1 , u2 )

dw2
du2

de maneira que o modelo no linear. No entanto, admitindo-se que x no uma


varivel relevante do problema e que no pode ser manipulada, ento

g ( y) =

dy
+ 4 y , y ( 0 ) = y0
dx

Fazendo-se

y = w1 + u1

dw
du
dy
= 1 + 1
dx
dx
dx

que combinada com a equao original


dw1

du

+ 4 w1 + 1 + 4u1 = g ( w1 , x ) + g ( u1 , x )
dx

dx

resultando em um modelo linear. Portanto, sempre que a hiptese de linearidade for


levantada, necessrio definir o conjunto de variveis que esto sendo consideradas no
problema.

4.2.3. Modelos Determinsticos e Estocsticos


Como j discutido na Seo 1.3, modelos determinsticos so aqueles que
associam a cada experimento um resultado experimental bem definido, enquanto
modelos estocsticos associam a cada condio experimental um conjunto de possveis
resultados, cada qual com uma certa probabilidade de ocorrer. De maneira pragmtica,
um modelo determinstico associa a cada pergunta sempre uma mesma resposta,
enquanto modelos estocsticos associam a cada pergunta um conjunto de respostas
possveis, com diferentes probabilidades. Um modelo estocstico admite, portanto, que
um mesmo experimento pode resultar em diferentes respostas, algumas das quais so
muito provveis, enquanto outras so pouco provveis.

Exemplo 4.7 - Seja o modelo dado na forma

dy
= y , y ( 0 ) = y0 y ( t ) = y0 e t
dt
Dada uma certa condio inicial, a trajetria dinmica obtida sempre a mesma.
O modelo , portanto, determinstico.

Captulo 4: Estimao de Parmetros

177

Exemplo 4.8 - Para simular a difuso do composto A num segundo composto B, montase uma rede (ou grid) e trocam-se as posies de A com um de seus vizinhos B, de
forma aleatria, at que A atinja o outro lado da rede. O tempo (ou nmero de iteraes)
que A demora para atingir o outro lado da rede caracteriza a velocidade de difuso de A
no meio.

Figura 4.5 - Rede para Simulao da Difuso.


A simulao conduzida com a gerao de nmeros pseudo-aleatrios com a
equao abaixo

X k +1 = 11X k Trunc (11X k )


usando como semente inicial o nmero X0=0.35312356. O processo difusivo simulado
com as seguintes regras:
a) Se 0.00 < Xk+1 < 0.25; ik+1 = ik1; jk+1 = jk; ou seja, a molcula anda para trs;
b) Se 0.25 < Xk+1 < 0.50; ik+1 = ik; jk+1 = jk1; ou seja, a molcula anda para baixo;
c) Se 0.50 < Xk+1 < 0.75; ik+1 = ik+1; jk+1 = jk; ou seja, a molcula anda para frente;
d) Se 0.75 < Xk+1 < 1.00; ik+1 = ik; jk+1 = jk+1; ou seja, a molcula anda para cima.
A simulao interrompida quando ik+1 = 7; ou seja, quando a molcula atinge a
outra extremidade da Figura 4.5. A simulao realizada 1000 vezes, usando como
semente para o algoritmo de gerao de nmeros pseudo-aleatrios o ltimo nmero
gerado na etapa anterior. A Figura 4.6 mostra o caminho trilhado pela molcula na rede
de difuso durante a primeira simulao. A Figura 4.7 mostra o nmero de iteraes
obtidas ao longo das 1000 simulaes e a qualidade do ajuste exponencial. Pode-se
dizer que o tempo caracterstico de difuso segue a distribuio exponencial. ( curioso
observar que os balanos determinsticos resultam na mesma relao exponencial com o
tempo, mostrando que nem sempre possvel distinguir com exatido um modelo
determinstico de um modelo estocstico.) O nmero mdio de iteraes necessrias
para atingir o lado oposto da rede igual a 78, com varincia igual a 4442.

Captulo 4: Estimao de Parmetros

178

Figura 4.6- Caminho difusivo percorrido pela molcula A durante a primeira


simulao.

Figura 4.7- Distribuio do tempo necessrio para percorrer a rede de difuso e


comparao com o ajuste exponencial ((i)=Expon(i-6; 59)).
Modelos e simulaes deste tipo so usualmente chamados de Modelos e
Simulaes de Monte Carlo.

4.2.4. Modelos a Parmetros Concentrados e a Parmetros Distribudos

Captulo 4: Estimao de Parmetros

179

Na engenharia muito adequado tambm classificar os modelos quanto forma


com que so descritas as variaes espaciais das variveis de interesse. Diz-se que o
modelo a parmetros concentrados quando as variaes espaciais so desprezveis e as
propriedades no mudam com a posio. O exemplo clssico o modelo do tanque de
mistura. Nesse caso, admitindo-se a validade de hiptese de mistura perfeita, as
propriedades so as mesmas em qualquer ponto do espao. Por outro lado, diz-se que o
modelo a parmetros distribudos quando as variaes espaciais so importantes e no
podem ser desprezadas. Nesse caso h, portanto, heterogeneidade espacial. O exemplo
clssico o modelo do reator tubular. Veja a Figura 4.8 apresentada a seguir.

Figura 4.8 - Exemplo de sistemas a parmetros concentrados (a) e a parmetros


distribudos (b).
Essa classificao til porque os modelos matemticos que descrevem sistemas
a parmetros distribudos ganham em geral a forma de equaes diferenciais parciais,
cuja resoluo requer o uso de procedimentos numricos bastante especficos. Os
modelos a parmetros concentrados, por sua vez, quase sempre so constitudos por
equaes algbricas ou equaes diferenciais ordinrias de primeira ordem, cuja soluo
numrica muito mais simples.

2.2.5. Modelos Estacionrios e Dinmicos


Finalmente, bastante til classificar os modelos quanto dependncia temporal
das propriedades e/ou variveis que ele descreve. O modelo dito dinmico quando
uma ou mais variveis do modelo mudam no tempo. Aplicaes em controle de
processos, por exemplo, requerem estruturas dinmicas para anlise, uma vez que se
procura detectar e corrigir problemas que possam ocorrer com o processo ao longo do
tempo. O modelo chamado de estacionrio quando as variveis no mudam no tempo.
O desenvolvimento de projetos de mquinas e equipamentos em geral parte do
pressuposto do comportamento estacionrio, para que seja possvel determinar as
dimenses timas do equipamento e a condio tima de operao.
Essa classificao til porque os modelos matemticos que descrevem sistemas
dinmicos quase sempre requerem a implementao de rotinas numricas de integrao,
como os algoritmos clssicos de Euler e Runge-Kutta. Os modelos estacionrios, por
sua vez, quer sejam a parmetros concentrados ou a parmetros distribudos (depois de
implementados os procedimentos de discretizao), quase sempre resultam em sistemas
de equaes algbricas, a serem resolvidos com tcnicas numricas clssicas, como de
Newton-Raphson, desenvolvidas para resoluo de sistemas de equaes algbricas.

Captulo 4: Estimao de Parmetros

180

Exemplo 4.9 - Seja o modelo abaixo

C
2C
C
= D 2 v
K C
t
x
x
C ( 0, x ) = 0
C ( t , 0 ) = C0
C
x

=0
x= L

que descreve as variaes de concentrao (C) de um certo reagente A ao longo da


posio axial (x) de um reator tubular de comprimento L, ao longo do tempo (t). D o
chamado coeficiente de disperso do reagente A no tubo; v a velocidade mdia do
escoamento ao longo do tubo; e K a constante de velocidade da reao. A primeira
condio de contorno diz que o reator est inicialmente vazio do composto A (s
contm solvente, por exemplo); a segunda condio de contorno diz que a concentrao
da corrente de alimentao constante e igual a C0; e a terceira condio de contorno
diz que nada muda a partir da sada do reator.
O modelo acima um modelo dinmico a parmetros distribudos. A verso
estacionria desse modelo, usada freqentemente para o projeto de reatores qumicos e
obtida quando as variaes temporais desaparecem, tem a forma
0=D

d 2C
dC
v
K C
2
dx
dx
C ( 0 ) = C0

dC
dx

=0
x= L

Repare que a complexidade do modelo bastante menor.


Para resolver o modelo, bastante comum adotar esquemas de discretizao.
Embora isso no seja necessrio nos dois modelos acima, pois solues analticas
fechadas podem ser desenvolvidas para ambos os casos, admita que o reator tubular
dividido em N "fatias" de comprimento L = L/N ao longo do comprimento L, como
representado na Figura 4.9. Nesse caso, em um ponto i qualquer no interior do reator,
possvel escrever

dC
dx

d C
dx 2

x = xi

dC
dx

x = x i + L

dC
dx

x = xi

x = x i L

Ci +1 Ci 1
2 L

Ci +1 Ci Ci Ci 1

L = Ci +1 2Ci + Ci 1
L
L
L2

Captulo 4: Estimao de Parmetros

181

de maneira que o modelo estacionrio fica na forma de um conjunto de N equaes


algbricas

0=

D
v
C 2Ci + Ci 1 )
( Ci +1 Ci 1 ) K Ci , i = 1...N
2 ( i +1
L
2 L

com
C0 conhecido (primeira condio de contorno)
CN+1 = CN (segunda condio de contorno)

que pode ser resolvido com a preciso desejada e imposta pela discretizao (nmero de
"fatias" N).

Figura 4.9 - Esquema de discretizao de diferenas finitas.


Para o caso muito especial em que N igual a 1 (a discretizao mais simples
possvel)

0=

D
v
C 2C1 + C0 )
( C2 C0 ) K C1
2 ( 2
L
2 L

com
C0 conhecido (primeira condio de contorno)
C2 = C1 (segunda condio de contorno)

0=

D
v
C 2 C1 + C0 )
( C1 C0 ) K C1
2 ( 1
L
2 L
v
D
2+

L 2 L
C1 = C2 =
C0
v
D

+K
2+
L 2 L

De maneira similar, o modelo dinmico fica na forma

Captulo 4: Estimao de Parmetros

182

dCi
D
v
= 2 ( Ci +1 2 Ci + Ci 1 )
( Ci +1 Ci 1 ) K Ci , i = 1...N
dt
L
2 L

com
Ci(0) =0 (primeira condio de contorno)
C0(t) conhecido (segunda condio de contorno)
CN+1(t) = CN(t) (terceira condio de contorno)

Assim, para N igual a 1


dC1 D
v
v

D
+ 2 +
+ K C1 = 2 +
C0
dt L 2 L

L 2 L

com

C1 ( 0 ) = 0
Repare como o esquema de discretizao reduz a complexidade matemtica do
modelo, ao mesmo tempo em que aumenta o nmero de equaes a serem resolvidas.
Repare ainda que o procedimento de discretizao reduziu o modelo estacionrio
diferencial original a um conjunto de equaes algbricas, reduzindo o modelo
dinmico diferencial original a um conjunto de equaes diferenciais ordinrias.

importante salientar que, uma vez desenvolvido um modelo matemtico,


fundamental que possamos RESOLV-LO. Um modelo matemtico que no pode ser
resolvido no tem qualquer utilidade. Alm disso, um modelo matemtico mal resolvido
ineficiente. Por isso, de maneira pouco precisa, pode-se dizer que fazer simulaes
resolver o modelo muitas vezes, para diferentes condies. Pode-se inclusive dizer que
um modelo o pacote constitudo pelas equaes que representam o sistema e as
tcnicas numricas que permitem resolver as equaes. Portanto, as tcnicas numricas
utilizadas constituem uma parte importante do modelo utilizado para descrever o
processo. Normalmente no atentamos para esse fato porque nos acostumamos a pensar
em modelos explcitos, em que dado x possvel obter y diretamente, como na Equao
(4.1). Isso nem sempre verdade, como mostram os Exemplos 4.8 e 4.9. s vezes
necessrio um pouco mais de trabalho e criatividade. Da a enorme importncia da
Matemtica e da Computao, em particular das ferramentas numricas, na rea de
Modelagem e Simulao de Processos, e mais especificamente para a disciplina de
Estimao de Parmetros. importante salientar, no entanto, que para os fins desse
livro admite-se que o modelo sempre pode ser resolvido de forma eficiente pelo
analista. problema do analista, portanto, resolver o modelo por ele desenvolvido.

4.3. Definio do Problema de Estimao de Parmetros


Como j discutido exaustivamente ao longo desse captulo, um problema
fundamental em qualquer trabalho cientfico o de correlacionar dados (construir
modelos). No entanto, a construo do modelo envolve a definio de ao menos duas
entidades bsicas distintas:
a) A estrutura do modelo

Captulo 4: Estimao de Parmetros


y = x2
y = e

183

(relao quadrtica entre x e y)


(relao exponencial entre x e y)

b) Os parmetros do modelo

e nas relaes acima


A estrutura do modelo a forma funcional atravs da qual as diversas variveis
do problema esto relacionadas. Os parmetros do modelo so os nmeros que tornam
possvel a previso quantitativa das relaes existentes entre as vrias variveis do
problema, atravs da estrutura do modelo. Por exemplo, quando se diz que duas
variveis x e y esto relacionadas linearmente, apenas se estabelece o tipo de relao
funcional que existe entre as duas variveis analisadas como
y= x+

No entanto, para que o modelo seja til e possa ser utilizado para fazer previses ou
simulaes, necessrio definir adicionalmente quem so os coeficientes angular () e
o coeficiente linear () da reta. Caso contrrio, de pouco serve o modelo. Repare que a
estrutura do modelo pode ser gerada de diversas maneiras, de forma emprica ou
fundamentada em preceitos tericos. De qualquer forma, sem os parmetros a estrutura
pura do modelo quase nunca faz sentido.

Exemplo 4.10 - A Lei de Fourier da transferncia de calor, gerada a partir da


observao experimental, diz que a taxa de transferncia de calor que se estabelece entre
os dois planos opostos de uma parede proporcional diferena de temperaturas
existente entre os dois planos, proporcional rea de contato entre os dois planos, e
inversamente proporcional distncia entre os dois planos (espessura da parede).
Levada ao limite infinitesimal de espessura da parede, a Lei de Fourier ganha a forma

q& = k A

dT
dx

onde q& a taxa de transferncia de calor (energia / tempo), A a rea de contato entre
os planos, T a temperatura e x o comprimento medido ao longo da espessura da
parede. k a chamada condutividade trmica do material ((energia
comprimento)/(tempo temperatura)). O sinal de menos indica que o calor flui sempre do
lado mais quente para o lado mais frio; ou seja, flui na direo contrria do gradiente de
temperaturas. Se a condutividade trmica do material constante (ou se a parede
suficientemente fina), ento

q& = k A

(T2 T1 )
L

A equao acima uma equao fundamental para o projeto de isolamentos.


Dadas as caractersticas do material isolante (k), do sistema avaliado (A, T2, T1) e a
mxima perda de calor admissvel ( q& ), obtm-se a quantidade necessria de isolante
(L). No entanto, para que a equao seja de fato til, necessrio conhecer o parmetro

Captulo 4: Estimao de Parmetros

184

k. A medio e estudo da condutividade trmica de materiais um problema


fundamental da rea de sistemas trmicos.

De outra forma, a aplicao de princpios tericos rigorosos (e elegantes)


permitem afirmar que as taxas de reao qumica observadas em sistemas gasosos
diludos, formado por molculas esfricas rgidas, so proporcionais s concentraes
dos reagentes. Essa dependncia funcional conhecida como Lei de Ao das Massas e
pode ser escrita na forma
R1 + ... + RNR

P1 + ... + PNP

R& = K

NR

i =1

onde Ri designa o reagente i, Pi designa o produto i, R& designa a velocidade da reao


(moles / (tempo volume) ), Ci a concentrao da espcie i (moles / volume) e K a
constante de velocidade da reao, que depende da temperatura de acordo com a
equao
E
K = K 0 exp

RT
que a conhecida Lei de Arrhenius. K0 o fator de freqncia da reao, E a energia
de ativao da reao (energia / mol ), R a constante universal dos gases (1.9876 cal /
(mol K) ) e T a temperatura absoluta. A Lei de Ao das Massas e a Lei de Arrhenius
so fundamentais para o projeto de reatores qumicos e so objetos de estudo da
disciplina de Cintica das Reaes Qumicas. No entanto, so de pouco valor se os
valores do fator de freqncia (K0) e da energia de ativao (E), caractersticos da
reao qumica investigada, no so conhecidos.

Um problema fundamental para todos aqueles envolvidos com atividades


cientficas, em particular aqueles envolvidos com a compreenso quantitativa de como
uma varivel do problema influencia as demais, determinar os parmetros do modelo.
Por exemplo, como determinar q& , k, A, L, T, R& , C, K0 e E nos problemas do Exemplo
4.10 A resposta pode ser obtida usualmente das seguintes formas:
a) Fixando alguns valores tpicos de projeto para algumas variveis independentes. Por
exemplo, no caso da troca de calor, os valores do q& mximo admissvel e de ao
menos uma das temperaturas so normalmente estabelecidos a priori pelas
caractersticas do projeto;
b) Calculando as variveis dependentes atravs do modelo. Por exemplo, no problema
de troca de calor, a espessura de isolante L obtida como funo das demais
variveis do problema;
c) Medindo variveis e parmetros com instrumentao adequada. Por exemplo, no
problema de troca de calor, a rea de contato pode ser obtida medindo-se as
dimenses caractersticas do meio que est sendo isolado;

Captulo 4: Estimao de Parmetros

185

d) Consultando a literatura especializada. Por exemplo, no caso da troca de calor, um


manual pode ser consultado para se observar se a condutividade trmica do isolante
considerado j foi avaliada e reportada por outros pesquisadores.
Embora o pargrafo anterior induza o leitor a pensar que o problema de
avaliao dos parmetros simples, isso no verdade absolutamente. Vejamos alguns
pontos curiosos.
a) A literatura especializada no fornece todos os dados necessrios para a realizao
de qualquer projeto. Muito pelo contrrio! Quanto mais importante e relevante o
problema do ponto de vista tecnolgico e econmico, menos provvel que se
encontrem informaes relevantes do problema na literatura pblica. Todo
engenheiro j passou pela experincia de procurar dados na literatura sem sucesso.
Alm disso, essa estratgia apenas transfere de mos o problema fundamental da
avaliao dos parmetros, no o solucionando. Alis, grande parte das correlaes
propostas na literatura resulta de extenso trabalho de modelagem e estimao de
parmetros realizados por terceiros;
b) A medio de certos parmetros virtualmente impossvel, seja porque no existe
tcnica experimental disponvel para esse fim (por exemplo, para medir os valores
de K0 e E que caracterizam uma reao qumica), seja porque o parmetro no tem
qualquer significado fsico real (como os coeficientes e da correlao emprica
linear ou quaisquer outros coeficientes de natureza emprica), seja porque o
parmetro na realidade definido pela relao estabelecida entre as variveis
fundamentais do problema (como a condutividade trmica na Lei de Fourier), ou
seja, porque nem mesmo a relao existente entre as variveis de fato conhecida.
Por todas as razes apresentadas acima, independentemente da estrutura ou
origem do modelo matemtico utilizado, quase sempre h certos nmeros ou parmetros
que no podem ser medidos nem avaliados a priori pelo analista, mas sem os quais no
possvel nem usar o modelo nem estabelecer vnculos entre as variveis. Como
proceder ento nesses casos? A resposta para esse problema constitui o conjunto de
ferramentas conhecidas como tcnicas de estimao de parmetros. Estimar
parmetros consiste fundamentalmente em inferir os valores dos parmetros que no
podem ser medidos nem avaliados a priori, a partir de uma comparao estabelecida
entre dados experimentais e um modelo disponvel para o processo, cujo desempenho
afetado pelo parmetro de interesse. Estimar parmetros consiste, portanto, em obter
dados experimentais e comparar esses dados com estruturas que pretendem explic-los.
Estimar parmetros consiste em exercitar, portanto, as componentes experimental e
terica de uma investigao cientfica.

Exemplo 4.11 - Para o problema da transferncia de calor do Exemplo 4.10, no


possvel de fato medir o valor de k. No existe um instrumento (condutivmetro
trmico? ) que possa ser conectado ao material para fornecer diretamente o valor de
k. Mas a Lei de Fourier diz que
q& = k A

(T2 T1 )
L

Captulo 4: Estimao de Parmetros

186

em que todas as demais grandezas fsicas, com exceo de k, podem ser medidas
durante um experimento de troca de calor. Suponha que um pedao do isolante
considerado prensado entre duas paredes de dimenses bem definidas (a espessura L e
a rea A medidos), mantidas a temperaturas constantes (T1 e T2 medidos) atravs da
manipulao da quantidade de calor dissipada por uma resistncia eltrica ( q& medido).
Nesse caso, suponha que vrias medidas (experimentos) so feitas. Segundo a Lei de
Fourier, a condutividade trmica k o fator de proporcionalidade (coeficiente angular)
(T T )
existente entre a medida q& e o grupo de medidas A 2 1 . Se essas medidas so
L
lanadas em um grfico, na forma abaixo, possvel inferir de alguma maneira o valor
de k. Portanto, no exagero dizer que o problema de estimao de parmetros
equivalente construo de um sensor virtual (softsensor) para medio das variveis
que no podem ser medidas diretamente com instrumentos fsicos. Portanto, o
condutivmetro trmico o procedimento de estimao de parmetros.

Figura 4.10 - Inferncia da condutividade trmica do isolante a partir de outras medidas


experimentais.

4.4. Caractersticas Fundamentais do Problema de Estimao de


Parmetros
Embora o procedimento de estimao de parmetros esteja filosoficamente
ilustrado na Figura 4.12, preciso definir o problema de forma mais rigorosa e precisa,
para que sejam eliminadas quaisquer ambigidades de conduo do processo e a
possibilidade da interveno deletria e desavisada do analista. Por isso, conveniente
tentar colocar primeiramente em palavras em que consiste o procedimento de estimao
de parmetros. Uma possvel definio do problema pode ser apresentada na forma:
"Estimar parmetros usar um modelo como referncia e variar os parmetros at que
as predies do modelo passem o mais prximo possvel dos dados experimentais,
respeitadas as incertezas caractersticas da medio."
A definio introduzida acima bastante interessante porque composta por um
conjunto de palavras-chaves que antecipam a formulao do problema matemtico que

Captulo 4: Estimao de Parmetros

187

caracteriza o procedimento de estimao de parmetros. Vejamos como alguns desses


elementos fundamentais caracterizam o problema de estimao ou inferncia:
a) H um modelo de referncia. Essa uma caracterstica fundamental do processo de
estimao de parmetros. O modelo de referncia serve de molde, em torno do qual
os dados experimentais devem ser encaixados. Portanto, o procedimento de
estimao de parmetros pressupe uma tentativa de compreender a realidade
experimental e no pode ser conduzido se o analista no quer ou no tem coragem
de propor uma explicao, seja ela emprica ou terica, para as suas observaes
experimentais. Logo, para o problema de estimao de parmetros o modelo um
dado conhecido, cabendo ao analista prover esse dado.
b) Os parmetros so variados. Dessa forma, durante o procedimento de estimao
de parmetros os parmetros do modelo so as verdadeiras variveis
consideradas. Genericamente, durante uma simulao com o modelo y = f (x; ) ,
admite-se que os parmetros so conhecidos e so feitos estudos sobre como as
variveis independentes x influenciam as variveis dependentes y. O problema de
estimao de parmetros consiste, ao contrrio, em observar quo longe ou perto dos
dados experimentais x e y conhecidos o modelo passa, quando os parmetros so
modificados. (Por isso, no surpreende que em muitas reas da engenharia o
problema de estimao de parmetros seja chamado de problema inverso.) Durante
a estimao dos parmetros podem ser feitas, portanto, muitas simulaes das
condies experimentais, para diferentes conjuntos de valores de parmetros.
c) O modelo deve passar o mais prximo possvel dos dados experimentais. Logo, o
procedimento de estimao de parmetros pressupe a existncia de uma mtrica;
ou seja, de uma funo que mede a distncia existente entre os dados experimentais
e os dados previstos pelo modelo. Todo o procedimento de estimao de parmetros
depende da definio dessa mtrica, que em ltima anlise diz se as previses feitas
com o modelo so boas ou ruins. Mais ainda, o procedimento de estimao de
parmetros pressupe a implementao de algum tipo de rotina de otimizao, dado
que as previses feitas com o modelo no devem estar apenas prximas dos dados
experimentais, mas sim o mais prximo possvel. Portanto, a similaridade entre os
dois conjuntos, experimentos e previses, deve ser mxima.
d) Devem ser respeitadas as incertezas caractersticas da medio. Logo, no deve ser
esquecido que as medidas experimentais contm erros e que os erros influenciam o
processo de inferncia dos parmetros. Essa questo ilustrada na Figura 4.11
apresentada abaixo. Suponha que dois pares de dados experimentais esto
disponveis para que se estimem os parmetros caractersticos da reta. Como os
dados experimentais contm erros, os valores verdadeiros dos dados no so
conhecidos, mas possvel avaliar uma regio de confiana, com grau de preciso
escolhido pelo analista, onde se espera encontrar os valores verdadeiros. Observe,
no entanto, que a incerteza no dado experimental provoca como conseqncia uma
incerteza na reta que une os dois pares de dados experimentais. Portanto,
fundamental reconhecer que o procedimento de estimao de parmetros, por estar
baseado na anlise de dados experimentais que contm um certo grau de incerteza,
resulta em valores que tambm contm um certo grau de incerteza. Portanto, o
procedimento de estimao de parmetros deve ser interpretado luz dos
conhecimentos bsicos da Estatstica.

Captulo 4: Estimao de Parmetros

188

Figura 4.11 - Os pontos ilustram as medidas experimentais. As regies ovais indicam


as incertezas experimentais. A regio hachurada indica onde esto as possveis retas que
descrevem os dados experimentais.
Baseado na discusso anterior e por convenincia de apresentao, o problema
de estimao de parmetros segmentado aqui em trs subproblemas. O primeiro
subproblema consiste em definir uma mtrica (tambm chamada de funo objetivo)
adequada para o problema. A definio de uma mtrica apropriada de fundamental
importncia, pois baseado nessa mtrica que se desenvolve o processo de inferncia
paramtrica. O segundo subproblema consiste em achar o ponto de timo da mtrica
formulada (mnimo ou mximo, a depender da lgica subjacente mtrica utilizada).
Quase sempre, a definio do ponto de timo s possvel com o auxlio de tcnicas
numricas. Algumas dessas tcnicas numricas so apresentadas e discutidas ao longo
do Captulo 5. No entanto, para alguns poucos problemas especficos descritos por
modelos lineares nos parmetros, possvel encontrar o ponto de timo analiticamente.
O terceiro subproblema consiste finalmente em formular uma interpretao estatstica
precisa dos parmetros obtidos e da qualidade da previso efetuada com o auxlio do
modelo. Cada um desses trs subproblemas fundamentais discutido nas sees que
seguem.

Exemplo 4.12 - Em conformidade com o Exemplo 4.11, suponha que o seguinte


conjunto de dados experimentais est disponvel
q& (cal / h)
(T T )
A 2 1 (m K)
L

1050 2000 2950 4000


10

20

30

40

a partir dos quais pretende-se estimar o valor da condutividade trmica k. Para


simplificar a apresentao e ajudar a fixao da nomenclatura proposta, o problema
descrito na forma
y = x

Captulo 4: Estimao de Parmetros

189

(T T )
onde x a varivel independente x = A 2 1 , y a varivel dependente ( q& ) e
L

o parmetro estimado (k). Suponha ainda que a seguinte mtrica proposta para
descrever a distncia entre os dados experimentais e os dados previstos pelo modelo:
NE

i =1

NE

) = ( y

F = yie yim

e
i

xie

i =1

onde NE representa o nmero total de experimentos analisados (4, nesse caso) e os


superescritos e e c designam respectivamente os dados medidos experimentalmente e os
dados previstos com o modelo. Repare que, de fato, medida que a diferena entre os
dados experimentais e os dados do modelo aumenta, F tambm aumenta. Desta forma,
quanto maior o valor de F, mais distante as previses feitas com o modelo esto dos
dados experimentais disponveis. Para minimizar a distncia do modelo aos dados
experimentais, deve-se manipular os parmetros de forma adequada. Nesse caso, o
ponto de mnimo encontrado quando
F NE
= 2 yie xie
i =1

)( x ) = 0
e
i

Resolvendo a equao acima em termos de , possvel obter


NE

( y x )
e e
i i

i =1
NE

(x )
e
i

i =1

Para o caso particular analisado,

(10 1050 + 20 2000 + 30 2950 + 40 4000 ) = 299000 = 99.67

(10

+ 202 + 30 2 + 402

3000

Admitindo que os dados experimentais xi tm erros desprezveis, estando os


erros de medio concentrados em yi, e que as medidas experimentais so
independentes, ento possvel utilizar as Equaes (1.37) e (1.44) para escrever

( Var { y } x
NE

Var { } =

e
i

e
i

i =1

NE e 2
xi
i =1

( )

NE

=
2

(x )
e
i

y2

i =1

NE e 2
xi
i =1

( )

que relaciona os erros de medida experimental com os erros paramtricos. Se os erros


de medio so iguais em todas as condies de experimentao

Captulo 4: Estimao de Parmetros


NE

=
2

190

(x )

e 2
i

i =1

NE e 2
xi
i =1

( )

=
2
y

y2
NE

( )
xie

y2
3000

i =1

Observe que a equao acima indica claramente que as incertezas experimentais


viram incertezas paramtricas durante o processo de estimao de parmetros. Observe
ainda que a natureza das incertezas paramtricas est intimamente relacionada
natureza dos erros experimentais (se as hipteses feitas em relao aos erros
experimentais fossem diferentes, a frmula acima no poderia ser escrita - h que se
caracterizar de forma apropriada os erros experimentais!), natureza do modelo (a
equao acima s pode ser escrita para o modelo proposto - cada modelo d origem a
um problema novo!), natureza da mtrica (a equao acima s pode ser escrita para a
funo objetivo utilizada - cada mtrica d origem a um problema novo!) e aos valores
experimentais medidos (se as medidas xi mudarem, mudam os erros paramtricos;
assim, possvel interferir no desempenho do modelo escolhendo bem as condies
experimentais!).
Para o caso particular analisado, se y2 =3000 (cal/h)2, ento

2 =

3000
= 1 = 99.67 2 = 99.67 2
3000

onde foi admitido comportamento normal com aproximadamente 95% de confiana. (O


bom procedimento cientfico talvez nos obrigasse a escrever = 100 2, dado que no
se deve usar mais casas decimais que as permitidas pela preciso experimental. Esse
rigor ser muitas vezes ignorado ao longo desse texto.) A hiptese de normalidade ser
discutida bastante ao longo dessa e das prximas sees.
O desempenho do modelo pode ser comparado s medidas experimentais na
forma
e

q& (cal / h)
m
q& (cal / h)
= q& e q& m

1050

2000

2950

4000

996.7

1993.4

2990.1

3986.8

53.3

6.6

-40.1

13.2

de maneira que a varincia em torno do zero pode ser calculada como

2 =

53.32 + 6.62 + 40.12 + 13.22


= 1555.6
3

com trs graus de liberdade. (O nmero de graus de liberdade perdidos durante o


procedimento de estimao de parmetros igual ao nmero de parmetros estimados.
Essa questo ser discutida com detalhes ao longo dessa seo.) Comparando-se a
varincia experimental da medida com a varincia dos desvios observados, utilizando-se
para isso o teste F com trs graus de liberdade no numerador (desvios de predio
observados), infinitos graus de liberdade no denominador (admite-se que a varincia

Captulo 4: Estimao de Parmetros

191

experimental da medida o valor verdadeiro, disponibilizado por estudo anterior), e


95% de confiana, verifica-se que

2 1555.6
1
1
=
< 2 =
= 0.518 < F ( 3, ;0.975 ) = 3.1161
F ( ,3; 0.975 ) 13.902 y
3000
satisfeita. Logo, a varincias experimental caracterstica das medidas de y e a
varincia dos desvios de predio no podem ser consideradas diferentes. Portanto, o
modelo pode ser considerado bom, com incertezas de predio comparveis s
incertezas experimentais.
Mais ainda, admitindo-se a normalidade dos erros de medio, com
aproximadamente 95% de confiana os erros de medida so da ordem de
2 y = 2 3000 110 . Como nenhum dos desvios observados maior que isso,
no h pontos suspeitos ou "outliers". Assim, tudo indica que o procedimento de
estimao foi bem executado.
Finalmente, como o modelo pode ser usado para fazer previses de y a
posteriori, conveniente calcular os erros de previso com o modelo. Nesse caso,
usando novamente as Equaes (1.37) e (1.44), chega-se a

Var { y } = Var { x} y2 = x 2 2 = x 2
que a varincia de predio inerente ao modelo, uma vez que foram desprezados os
possveis erros experimentais de x e y. Toda essa informao est contida na Figura 4.12
abaixo. Observe como os erros de predio mudam com x e nesse caso particular
crescem, medida que nos afastamos do zero.

Captulo 4: Estimao de Parmetros

192

Figura 4.12 - Resultados do procedimento de estimao do Exemplo 4.12. Barras


verticais denotam os erros experimentais, a linha cheia o modelo e as linhas tracejadas
indicam o intervalo de confiana das previses feitas com o modelo.

4.5. A Definio da Funo Objetivo


Para que seja possvel introduzir a noo de proximidade ou distncia,
necessrio primeiramente definir uma mtrica. Para que se note a importncia de
introduzir uma definio precisa de uma mtrica, a Figura 4.13 ilustra como pode ser
difcil decidir que funo est mais prxima dos dados experimentais quando uma
transformao matemtica precisa no est disponvel.

Figura 4.13 - Ilustrao sobre a necessidade de definir uma mtrica.


Qual a funo mais prxima dos dados experimentais?
Do ponto de vista estritamente matemtico, define-se como uma funo
distncia entre dois elementos quaisquer x e y de um conjunto, representada usualmente
por d(x,y), uma funo que satisfaz os seguintes axiomas:
a) d(x,y) um nmero real estritamente positivo; ou seja,

d ( x, y ) ; d ( x, y ) 0

(4.5)

b) d(x,y) igual a zero se e somente se x=y; ou seja,

d ( x, y ) = 0

x=y

(4.6)

c) d(x,y) uma transformao comutativa; ou seja,

d ( x, y ) = d ( y,x )

(4.7)

d) d(x,y) satisfaz a desigualdade do tringulo; ou seja,

d ( x, y ) d ( x,z ) + d ( z, y )

(4.8)

Captulo 4: Estimao de Parmetros

193

importante enfatizar que a necessidade de satisfazer os axiomas apresentados


acima guarda estreito vnculo com a nossa idia de distncia fsica existente no mundo
real. O primeiro axioma exige que a distncia seja um nmero real positivo mensurvel,
como usual na nossa escala de valores. Por exemplo, algum consegue imaginar o
significado de se associar um nmero complexo ou um nmero negativo distncia
entre duas cidades em um mapa geogrfico? O segundo axioma generaliza a idia de
que se dois pontos so diferentes, ento a distncia entre eles no pode ser igual a zero.
Da mesma forma, no parece fazer sentido associar um valor diferente de zero para a
distncia de um ponto a ele mesmo. O terceiro axioma generaliza a idia de que a
distncia entre dois pontos quaisquer deve ser independente da escolha de qual deles
considerado como origem ou referncia para a trajetria. Finalmente, o quarto axioma
generaliza a idia de que a trajetria mais curta possvel entre dois pontos aquela que
liga diretamente esses dois pontos. Portanto, as Equaes (4.5-8) introduzem
formalmente conceitos com que j estamos bem acostumados de lidar no mundo real.

Exemplo 4.13 - Seja o conjunto dos nmeros reais. Sejam x e y dois nmeros reais
quaisquer. Ento

d ( x, y ) = x y
define uma mtrica em . Veja que o primeiro axioma satisfeito naturalmente pela
funo mdulo. O segundo axioma tambm naturalmente satisfeito, porque o nico
nmero real que tem mdulo igual a zero o prprio zero. O terceiro axioma tambm
naturalmente satisfeito, uma vez que os mdulos de nmeros opostos (ou seja, de sinais
distintos) so iguais. Finalmente, para mostrar a desigualdade do tringulo, suponha sem
perda de generalidade que x < y. Ento,

< x z + z y ,
z<x

d ( x, y ) = x y = x z + z y = x z + z y , x < z < y
< x z + z y ,
z>y

Por exemplo, se x = 1 e y = 3
< 1 0 + 0 3 = 4

d (1,3) = 1 3 = 2 = 1 2 + 2 3 = 2
< 1 4 + 4 3 = 4

Portanto, o valor absoluto da diferena entre dois nmeros reais uma medida
da distncia entre esses dois nmeros.

Para o problema de estimao de parmetros, os pontos x e y so na verdade os


conjuntos de valores (vetores) que contm os dados experimentais e os dados calculados
com o modelo. Suponha que NE dados experimentais esto disponveis e organizados
e
em um vetor de dados experimentais (y ) e esto sendo comparados a igual nmero de
dados calculados com um modelo e organizados para representar condies

Captulo 4: Estimao de Parmetros

194

experimentais semelhantes (y ). Nesse caso, pode-se considerar que y e y so


elementos do NE; ou seja, vetores de nmeros reais com dimenso NE. Nesse caso,
qualquer mtrica utilizada para descrever uma distncia em NE pode ser tambm usada
para descrever a distncia entre os dados experimentais e os dados calculados pelo
modelo.

Exemplo 4.14 - Sejam os conjuntos de dados experimentais e calculados, representados


e
m
por y e y , constitudos por nmeros reais. Ento

d y ,y

1/ 2

2
NE
= yie yim
i =1

define uma mtrica para o problema de estimao de parmetros. Veja que o primeiro
axioma satisfeito naturalmente pela funo quadrtica, que resulta sempre num
nmero real positivo. O segundo axioma tambm naturalmente satisfeito, uma vez que
o nico nmero real cujo quadrado igual a zero o prprio zero. O terceiro axioma
tambm naturalmente satisfeito, uma vez que os quadrados de nmeros opostos (ou
seja, de sinais distintos) so iguais. Finalmente, para mostrar a desigualdade do
tringulo, conveniente lembrar apenas que

(y

e
i

yim ) = yie yim


2

(y

yim

e
i

= yie yim

de maneira que o resultado do Exemplo 4.13 tambm pode ser usado aqui para garantir
a desigualdade do tringulo.
Portanto, a soma dos quadrados das diferenas entre as componentes de dois
vetores reais uma medida da distncia entre esses dois vetores.

Os axiomas definidos pelas Equaes (4.5-8) permitem definir um conjunto


virtualmente infinito de mtricas para o NE. Por exemplo, pode-se mostrar que as
seguintes mtricas satisfazem os axiomas propostos:

d1 y , y

NE
d 2 y e , y m = yie yim
i =1

NE
d 3 y e , y m = wi yie yim
i =1

(4.9a)

1/ N

, N par

(4.9b)

1/ N

, wi positivo, N par

NE

d 4 y e , y m = yie yim
i =1

1/ 2

2
NE
= yie yim
i =1

(4.9c)

(4.9d)

Captulo 4: Estimao de Parmetros

195

2
NE
d 5 y e , y m = exp yie yim 1
i =1

(4.9e)

Surge, portanto, intuitivamente a necessidade de perguntar qual deve ser a


melhor mtrica para descrever o problema de estimao de parmetros. Do ponto de
vista estritamente matemtico, essa questo no faz qualquer sentido e todas as
expresses acima (e infinitas outras) podem ser igualmente utilizadas para descrever a
distncia entre os pontos experimentais e os pontos obtidos com o auxlio do modelo.
Contudo, um axioma adicional imposto ao problema de estimao de parmetros na
forma:
e) d(x,y) deve conter significao estatstica.
Por exemplo, um exerccio de derivao de uma mtrica com significao
estatstica apresentado a seguir. Suponha para isso que a estrutura do modelo est
correta; ou seja, que o modelo perfeito, embora os parmetros do modelo sejam
eventualmente desconhecidos. Essa hiptese, chamada de Hiptese do Modelo
Perfeito ser usada muitas vezes ao longo do texto e apresentada a seguir.

Hiptese Fundamental 4.1 - A Hiptese do Modelo Perfeito


Admita que um modelo y = f ( x; ) usado para descrever um problema fsico. O
modelo perfeito se capaz de descrever exatamente as relaes existentes entre as
variveis do problema. Nesse caso, as medidas experimentais no obedecem exatamente
as relaes impostas pelo modelo nica e exclusivamente por causa dos inevitveis
desvios experimentais. Nesse caso, y e = f ( x e + x ; + ) + y .

A Hiptese do Modelo Perfeito obviamente uma idealizao sobre a


compreenso do problema fsico e impossvel de ser atendida completamente, pois j foi
extensamente discutido que nenhum modelo descreve todos os detalhes da realidade.
Dessa forma, nenhum modelo pode ser de fato perfeito. A despeito disso, admitimos
que a estrutura do modelo matemtico utilizado para representar os dados experimentais
muito boa. Portanto, qualquer desvio eventualmente observado entre o dado
experimental e o dado calculado com o modelo devido nica e exclusivamente s
incertezas experimentais. Admita, portanto, que
ye = ym +

onde ye o valor observado experimentalmente, ym o valor calculado pelo modelo e


o desvio entre estes dois valores devido ao erro experimental. Na realidade, deve
conter tambm os erros de modelagem, desprezados quando se utiliza a hiptese do
modelo perfeito. No entanto, muito difcil usar uma outra hiptese para o trabalho de
estimao de parmetros a priori, pois se os erros de modelagem fossem conhecidos, o
modelo poderia ser melhorado e no haveria razo a princpio para se utilizar o modelo
errado.

Captulo 4: Estimao de Parmetros

196

Se os erros so aleatrios e simtricos, espelhando um bom procedimento


experimental, espera-se que eles tenham mdia igual a zero. Essa uma das hipteses
fundamentais associadas natureza dos dados experimentais, chamada de Hiptese do
Experimento Bem Feito. Admite-se que, se o experimento bem feito e o modelo
perfeito, o erro experimental no deve apresentar qualquer tipo de tendncia ou
polarizao, flutuando em torno do valor zero. Dessa maneira, o valor mdio esperado
para o experimento o prprio valor calculado com o modelo, pois
E { y e } = E { y m + } = E { y m } + E { } = E { y m } = y m

(4.10)

Se o experimento bem feito, no h por que acreditar que o erro experimental


maior que o erro mnimo inevitvel, devido s incertezas experimentais. Em funo da
hiptese do experimento bem feito, uma avaliao da varincia dos erros experimentais
pode ser feita na forma
NE

y2 =

( y

e
i

yim

i =1

(4.11)

onde o nmero de graus de liberdade. A Equao (4.11), segundo o Exemplo 4.14,


constitui uma mtrica para o problema de estimao de parmetros. Portanto, deseja-se
minimizar a funo
NE

FObj = yie yim


i =1

(4.12)

que uma mtrica com interpretao estatstica precisa.


Hiptese Fundamental 4.2 - A Hiptese do Experimento Bem Feito

Diz-se que o experimento bem feito se os erros de medio cometidos durante a


conduo dos procedimentos experimentais so to pequenos que possvel admitir que
a probabilidade de encontrar os dados experimentais mxima. Alternativamente, dizse que o experimento bem feito se os erros de medio cometidos durante a conduo
dos erros experimentais so equivalentes ao contedo mnimo de erro admissvel para o
processo de medio.

A Hiptese do Experimento Bem Feito permeia toda a anlise estatstica e


numrica do problema de estimao de parmetros. Do ponto de vista prtico, difcil
no considerar essa hiptese durante a formulao do problema, j que a negao dessa
hiptese condena de certa forma o conjunto experimental que est sendo analisado. Se
os experimentos no so bem feitos, ou se os erros experimentais so muito grandes,
parece razovel sugerir ao analista que os dados experimentais sejam medidos
novamente; ou seja, recomenda-se a repetio dos experimentos.
A funo objetivo definida na Equao (4.12) uma medida do erro
experimental, se as hipteses do experimento bem feito e do modelo perfeito so

Captulo 4: Estimao de Parmetros

197

adequadas. Portanto, minimizar essa funo objetivo o mesmo que dizer que o erro
experimental no deve ser superior ao menor valor possvel, em consonncia com a
hiptese do experimento bem feito. A Equao (4.12) define a funo objetivo de
mnimos quadrados. Deve ficar claro que apenas a interpretao estatstica torna essa
mtrica melhor que as demais mtricas definidas pelas Equaes (4.9a-e).
Exemplo 4.15 - Um exemplo de aplicao da tcnica de mnimos quadrados o caso
clssico da reta. Suponha que

ym = x +

A funo de mnimos quadrados fica na forma


NE

FObj = yie xie


i =1

Os valores de e so ento obtidos minimizando-se o valor da funo objetivo

FObj NE
e
e
= 2 ( yi xi )( xie ) = 0

i =1
FObj NE
e
e
= 2 ( yi xi ) ( 1) = 0

i =1
H, portanto, duas equaes a resolver e duas incgnitas a determinar, uma vez
que os dados experimentais so conhecidos. Portanto:

( )

NE e e
e
e 2
2 yi xi xi xi = 0
i =1
NE
e
e
2
yi xi = 0

i =1
NE
NE
NE e 2
e
e e
xi + xi = yi xi
i =1
i =1
i =1
NE
NE

xie + NE = yie

i =1
i =1

( )

( )

( )

( )

resultando em
NE
NE yie xie
i =1
=
NE
NE
i =1

) ( y ) ( x )

NE

NE

e
i

e
i

i =1

i =1
2

( x ) ( x )
e
i

NE

i =1

e
i

Captulo 4: Estimao de Parmetros

198

NE

NE

( y )
e
i

(x )
e
i

i =1

NE

i =1

NE

Exemplo 4.16 - Um outro exemplo de aplicao da tcnica de mnimos quadrados o


caso clssico da parbola. Suponha que

y m = x2 + x +

A funo de mnimos quadrados fica na forma


NE

( )

FObj = yie xie


i =1

xie

Os valores de , e so obtidos minimizando-se o valor da funo objetivo

FObj

i =1

FObj

NE

( )

= 2 yi xie

i =1

FObj

NE

= 2 yi ( xie ) xi

NE

)( ( x ) ) = 0
e
i

xi

) (x ) = 0

= 2 yi ( xie ) xi
i =1

e
i

) ( 1) = 0

H, portanto, trs equaes a resolver e trs incgnitas a determinar, uma vez


que os dados experimentais so conhecidos. A soluo analtica para esse problema
pode ser facilmente derivada. Isto ocorre sempre que o modelo linear nos parmetros.

Exemplo 4.17 - Um outro exemplo de aplicao da tcnica de mnimos quadrados o


caso clssico da funo exponencial. Suponha que

y = e x

A funo de mnimos quadrados fica na forma


NE

FObj = yie e
i =1

xie

Os valores de e so obtidos minimizando-se o valor da funo objetivo


FObj

NE

xe
xe
e
= 2 yi e i
e i = 0

i =1

Captulo 4: Estimao de Parmetros

FObj

199

NE

e
xe
xe
= 2 yi e i xie e i = 0

i =1

H, portanto, duas equaes a resolver e duas incgnitas a determinar, uma vez


que os dados experimentais so conhecidos. Uma soluo analtica para esse problema
no pode ser derivada. Isto ocorre por causa da natureza no linear do modelo. A
soluo do problema requer, portanto, o uso de tcnicas numricas como as discutidas
no Captulo 5. A necessidade de usar tcnicas numricas para resolver um problema
supostamente to simples mostra que no possvel, de maneira geral, conduzir estudos
de estimao de parmetros longe do computador. O usurio de procedimentos de
estimao de parmetros deve estar, portanto, habilitado a utilizar procedimentos
numricos de estimao.
Uma maneira comum de propor uma soluo analtica para o problema
escrever o modelo na forma

( )

z m = ln y m = ln ( ) + x = + x

e a funo objetivo na forma


NE

FObj = zie xie


i =1

de maneira a poder usar a soluo apresentada no Exemplo 4.15. Deve-se prestar a


ateno para o fato, no entanto, de que toda a significao estatstica da funo objetivo
pode ter sido jogada fora nesse caso, j que a varivel medida efetivamente foi y e no
z=ln(y). (Essa questo ser discutida com um pouco mais de detalhes na Seo 5.8 do
Captulo 5.) Alm disso, minimizar a funo
NE

FObj = yie yim


i =1

no equivalente a minimizar a funo


NE

( ( ) ( ))

FObj = ln yie ln yim


i =1

e valores diferentes dos parmetros estimados provavelmente sero encontrados. Por


isso, o usurio deve resistir o mximo possvel tentao de introduzir transformaes
dos dados experimentais Voltaremos a esse ponto adiante.

Os Exemplos 4.15 e 4.16 mostram que, para modelos lineares nos parmetros, a
aplicao da tcnica de mnimos quadrados admite soluo analtica. J para o modelo
exponencial do Exemplo 4.17 necessrio algum mtodo numrico para que a soluo

Captulo 4: Estimao de Parmetros

200

seja encontrada. Assim, de forma generalizada pode-se definir um modelo linear nos
parmetros como:
NP

y m ( x, ) = j f j ( x )

(4.13)

j =1

O modelo proposto tem NP parmetros, T = [1 2 ... NP ] , associados a


NP

funes

f j (x) ,

que

transformam

as

NX

variveis

independentes,

x T = [ x1 x2 ... xNX ] , na varivel dependente y. Cada uma das variveis medida em


cada uma das NE condies experimentais. A funo de mnimos quadrados fica ento
na forma
NP

= yie j f j xie
i =1
j =1

NE

FObj

( )

(4.14)

Os valores de so obtidos minimizando-se o valor da funo objetivo em


relao a cada um de seus componentes, na forma
FObj

NE
NP

= 2 yie j f j xie f k xie


i =1
j =1

( )(

( ) ) = 0 , k = 1..NP

(4.15)

que resulta no seguinte sistema de equaes


NE

NP

NE

f ( x ) f ( x ) = y f ( x ) , k = 1..NP
j

j =1

e
i

e
i

i =1

e
i k

e
i

(4.16)

i =1

H, portanto, NP equaes a resolver e NP incgnitas a determinar, uma vez que


os dados experimentais so conhecidos. A soluo analtica para esse problema pode ser
facilmente derivada se a notao matricial utilizada. Sejam

NE
f1
i =1
NE
f
M = i =1 2

NE
f
NP

i =1

NE

( ) ( ) ( ) ( )
xie f1 xei

f1 xie f 2 xie

i =1

e
i

e
i

e
i

e
i

e
i

NP

i =1

e
i

e
i

NP

e
i

NP

M
NE

e
i

e
xi

f (x ) f ( )

(x ) f (x ) f (x ) f (x )

e
i

i =1

NE

e
i

NE

i =1

f (x ) f (x )
i =1

NE

(x ) f (x ) f (x ) f (x )

NE

e
i

f (x ) f ( )
NP

i =1

e
i

NP

(4.17)

Captulo 4: Estimao de Parmetros

201

NE e
e
yi f1 xi
i =1
NE e
y f xe
Yf = i =1 i 2 i

...
NE
y e f xe
i NP
i

i =1

( )
( )
( )

(4.18)

ento
M = Yf = M 1 Yf

(4.19)

que uma soluo de enorme importncia prtica para a teoria de estimao de


parmetros e planejamento de experimentos. muito conveniente ainda definir a matriz

( )
( )

f1 x1e

f 2 x1e
GY =
...

e
f NP x1

( )

( )
(x )

f1 xe2

...

e
2

...

f2

...

...

( )

...

f NP xe2

( )
( )

f1 xeNE

e
f 2 x NE

...

f NP xeNE

(4.20)

pois assim possvel escrever a soluo diretamente em termos das variveis medidas
na forma

= M 1

y1e
e
y
e
e
GY Y , Y = 2
M
e
y NE

(4.21)

que indica que existe uma relao linear direta entre a medida experimental da varivel
dependente e o valor estimado para o parmetro.
Exemplo 4.18 - Suponha que o seguinte modelo est sendo usado para interpretar um
problema fsico

y m = 1 x1 + 2 x2 + 3 x1 x2 + 4
onde y representa uma varivel dependente que depende de duas outras variveis
independentes x1 e x2. No problema proposto,
f1 ( xe ) = x1e , f 2 ( x e ) = x2e , f 3 ( x e ) = x1e x2e , f 4 ( x e ) = 1
Dessa forma,

Captulo 4: Estimao de Parmetros


e
x1,1
e
x
G Y = e 2,1e
x1,1 x2,1

NE e 2
x1,k
k =1
NE e e
x1, k x2,k
k =1
M = NE
2

e
e
x1,k x2,k
k =1
NE

e
x1,k
k =1

( )

( )

202

e
x1,2
e
x2,2
e
e
x1,2
x2,2
1

L
x1,e NE

x2,e NE
L
L x1,e NE x2,e NE

L
1

e
x1,3
e
x2,3
e
e
x1,3
x2,3
1

NE

NE

e
1, k

(x )

x2,e k

k =1

2
e
1, k

(x )
e
2, k

NE

x (x )

e
1, k

k =1

NE

e
2, k

k =1

NE

x (x ) (x ) (x )
e
1, k

e
2, k

k =1

e
1, k

e
2, k

k =1

NE

e
2, k

k =1

e
1, k

k =1

NE

NE

e
1, k

k =1

k =1

NE

x2,e k

k =1

NE
e
e
x1,k x2,k

k =1

NE

1 = NE

i =1

NE

x2,e k

x2,e k

onde xie,k representa a medida da varivel independente xi no experimento k. Portanto,


de acordo com a Equao (4.21), existe uma soluo analtica explcita para o problema
de estimao de parmetros, uma vez conhecidos os dados experimentais. Modelos
como esse so muito teis para interpretao quantitativa de dados experimentais, como
discutido no Volume II dessa srie de publicaes.

Suponha que as variveis independentes no contm erros e que toda a flutuao


e
experimental devida aos erros de medio das variveis dependentes Y . Suponha
ainda que dois conjuntos de dados obtidos em condies anlogas so comparados entre
si. Nesse caso,

= 1 2 = M 1 G Y Y1e M 1 G Y Y2e = M 1 G Y Y e

(4.22)

Portanto, os valores dos parmetros flutuam, medida que flutuam os valores


experimentais obtidos. Se a nica fonte de flutuao o erro experimental

= M 1 G Y

(4.23)

que relaciona os erros paramtricos com os erros experimentais. Portanto, se os erros


flutuam em torno dos valores verdadeiros com mdia igual a zero,
{} = E {M 1 G Y } = M 1 G Y E {} = 0

(4.24)

os parmetros tambm flutuam em torno dos valores verdadeiros, o que mostra que o
procedimento proposto para estimao de parmetros consistente. Mais importante
ainda perceber que a matriz de covarincias dos parmetros pode ser calculada como

Captulo 4: Estimao de Parmetros

V = T

203

( )2
1

2 1
=
M

NP 1

E M 1 G Y T G TY M 1

L 1 NP

L 2 NP
=
O
M

2
L ( NP )

1 2

( 2 )

M
NP 2

) }=M
T

{ }

G Y E T G TY M 1

V = M 1 G Y Vy G TY M 1

(4.25)

Observe que a matriz M simtrica, de maneira que ela igual a sua transposta

( M = M T , M 1 = M 1
NE
f1
i =1
NE
f
G Y G TY = i =1 2

NE
f
NP

i =1

). Observe ainda que


NE

(x ) f (x ) f (x ) f (x )
e
i

e
i

e
i

e
i

NE

i =1

(x ) f (x ) f (x ) f (x )
e
i

e
i

e
i

e
i

e
i

e
i

NP

e
i

i =1

e
i

NP

M
NE

e
i

xie
(4.26)
=M

xie

f (x ) f ( )

e
i

NP

i =1

NE

(x ) f (x ) f (x ) f (x )

e
i

NE

i =1

i =1

NE

f (x ) f (x )

f (x ) f ( )
NP

i =1

e
i

NP

Dessa forma, se as medidas experimentais so independentes e os erros de


medio so constantes e iguais em todas as condies experimentais, ento a matriz de
erros experimentais pode ser escrita como
y2 0

0 y2

Vy =
M
M

0
0

L 0
= y2 I

O M

L y2
L

(4.27)

onde I a matriz identidade. Nesse caso, a matriz de covarincias dos parmetros ganha
a forma bastante simples

V = y2 M 1 G Y G TY M 1

= y2 M 1 M M 1 = y2 M 1

(4.28)

que utilizada para a interpretao e soluo de um grande nmero de problemas


prticos. A Equao (4.28) mostra que a incerteza dos parmetros depende dos erros
experimentais e das condies de experimentao; portanto, possvel alterar os erros
paramtricos atravs de manipulao apropriadas das condies de experimentao. A
Equao (4.28) constitui a base fundamental sobre a qual foi erigida boa parte dos
procedimentos de planejamento estatstico de experimentos. importante observar, no
entanto, que a Equao (4.28) rigorosamente vlida apenas quando uma longa srie de
condies satisfeita: o modelo perfeito, os experimentos so bem feitos, a funo
objetivo dada pela funo de mnimos quadrados, o modelo linear nos parmetros,

Captulo 4: Estimao de Parmetros

204

os experimentos so independentes e os erros experimentais so constantes na regio de


experimentao.
Finalmente, os parmetros so usados para fazer previses com o modelo em
qualquer condio x. Usando a notao matricial, o modelo pode ser escrito na forma
y m ( x, ) = B ( x )

(4.29)

f1 ( x )

f2 ( x )

B ( x) =
M

f NP ( x )

(4.30)

onde

que tambm estabelece uma relao linear direta entre o valor dos parmetros e a
previso da varivel dependente em um ponto qualquer x da regio experimental. A
matriz B chamada de matriz de sensibilidades do modelo em relao aos parmetros.
De forma anloga realizada anteriormente,

y2 = ( y c ) = {B T T B}
2

y2 = B T { T } B = B T V B = y2 B T M 1 B

(4.31)

que estabelece o vnculo entre os erros de predio, a qualidade dos dados


experimentais e o procedimento de estimao de parmetros. Todas essas expresses
so fundamentais para a perfeita compreenso dos procedimentos clssicos de
planejamento experimental, como discutido no Volume II dessa srie de publicaes.

Exemplo 4.19 No problema tratado no Exemplo 4.18, a matriz de sensibilidades do


modelo em ralao aos parmetros dada por
x1
x
B ( x) = 2
x1 x2

1
Repare que a matriz B depende da condio de experimentao considerada
durante os clculos.

A Equao (4.31) muito importante para consideraes filosficas a respeito


da propagao de erros e da caracterizao da natureza dos erros cometidos em
trabalhos de engenharia. Observe que a Equao (4.31) vincula os erros dos parmetros,
resultantes do procedimento de estimao de parmetros e dos erros experimentais

Captulo 4: Estimao de Parmetros

205

cometidos no passado, com os erros de predio ou de simulao, que dizem respeito a


experimentos ainda no realizados (ou a serem realizados no futuro). Portanto, os erros
experimentais cometidos nas medies experimentais passadas se propagam para o
futuro indefinidamente, uma vez que os parmetros so usados para o projeto de novas
unidades e simulaes (extrapolaes) de novas condies experimentais. Portanto,
parece muito claro que a correta caracterizao dos erros experimentais fundamental
para a interpretao do desempenho dos modelos de simulao e das rotinas de projeto,
que usaro os parmetros estimados a partir desses mesmos dados experimentais em
outras situaes.

Exemplo 4.20 - Os problemas tratados nos Exemplos 4.15 e 4.16 podem ser analisados
no contexto desenvolvido de forma generalizada para modelos lineares nos parmetros.
Por exemplo, a reta pode ser escrita como

y m = 1 f1 ( x ) + 2 f 2 ( x )
com f1 ( x ) = x e f 2 ( x ) = 1 . Nesse caso, conforme a Equao (4.17), a matriz M pode
ser escrita como:
NE e
xi
i =1
M = NE

e
xi
i =1

( ) ( x )
NE

e
i

NE

i =1

( )

e a sua inversa

M =

2
NE
NE
NE xie
i =1
i =1

( )

NE

2
NE

e
xie xi
i =1

( )

NE

xie
i =1

NE
2

xie

i =1

( )

( )

( )

Logo, a varincia do parmetro 1 dada por

112 = y2

NE
2

NE

NE xie xie
i =1
i =1

NE

( )

( )

enquanto a varincia do parmetro 2 dada por

222

NE e 2
xi
i =1

2
=y
2
NE

NE e
e 2
NE xi xi
i =1
i =1

( )

( )

( )

Captulo 4: Estimao de Parmetros

206

muito curioso observar que os parmetros 1 e 2 no so necessariamente


independentes, apresentando uma covarincia igual a

NE

xie
i =1

122 = y2
2
NE
NE

e 2
e
NE xi xi
i =1
i =1

( )

( )

( )

e um coeficiente de correlao igual a

12 =

NE

xie
i =1

NE
2

NE xie
i =1

( )

( )

Isso quer dizer que um parmetro influencia o outro; ou seja, se um dos


parmetros mudar um pouco, o outro tambm muda. Isso em geral ruim, pois mistura
a importncia dos diferentes efeitos considerados por cada um dos parmetros do
modelo. O ideal seria obter parmetros independentes, embora isso raramente seja
possvel. A necessidade de obter parmetros independentes durante a anlise de
modelos de simulao um ponto central dos procedimentos de planejamento
experimental discutidos no Volume II dessa srie de publicaes.
Com relao ao erro de predio, definido pela Equao (4.31), pode-se
escrever:
2 122 x
2
y2 ( x ) = y2 B T M 1 B = y2 [ x 1] 112
= y2 ( 112 x 2 + 2 122 x + 22
)
2
1

12
22
NE
NE
x 2 NE 2 x xie +
i =1
i =1
y2 ( x ) = y2
NE
2

NE
NE xie xie
i =1
i =1

( )

( )

( x )
e
i

( )

onde pode ser observado que mesmo para um modelo linear, o erro de predio uma
funo quadrtica com relao condio experimental x.
interessante observar nas expresses dos erros apresentadas acima que os erros
paramtricos aumentam sempre com o aumento dos erros experimentais, o que poderia
j ser esperado, e diminuem sempre com o aumento do nmero de experimentos.
Portanto, medida que o nmero de experimentos aumenta indefinidamente, os erros
paramtricos se aproximam continuamente de zero.

Captulo 4: Estimao de Parmetros

207

Exemplo 4.21 Suponha que um conjunto de dados experimentais


e
est disponvel e que se deseja representar o sistema pelo
y = y1e y2e L yNE
modelo constante y m = . Nesse caso, segundo a Equao (4.17), M = [ NE ] . Segundo
a Equao (4.20), G Y = [1 1 L 1] . Portanto, segundo a Equao (4.21)
NE

e
k

k =1

NE

Logo, a mdia amostral pode ser interpretada como a melhor inferncia de um modelo
constante para um conjunto de dados, quando se supe que o modelo constante
perfeito, os experimentos so bem feitos, a funo objetivo dada pela funo de
mnimos quadrados, os experimentos so independentes e os erros experimentais so
constantes na regio de experimentao. V-se, portanto, que o contexto de validade da
mdia amostral proposta no Captulo 3 pode ser bastante questionado, em bases tcnicas
absolutamente legtimas.

Exemplo 4.22 Uma pergunta pertinente diz respeito varincia das diferenas entre
os dados experimentais e as predies feitas com o modelo. Suponha um modelo linear
na forma
y = B (x)
T

como discutido nessa seo. Nesse caso, as respostas do modelo so obtidas na forma
y m = B ( x ) M -1 G Y Y e
T

Em particular, a diferena entre os dados experimentais e calculados no ponto


experimental k pode ser dada na forma:
yke ykm = yke BkT M -1 G Y Y e
Supondo que o modelo perfeito e que os experimentos so bem feitos,
possvel escrever
yke ykm = yke BkT M -1 G Y ( Y + ) = ( yke k ) BkT M -1 G Y
onde Y representa os valores verdadeiros e desconhecidos das medidas experimentais,
por causa do erro experimental . Portanto, k representa o valor verdadeiro e
desconhecido da medida experimental yke . Portanto, a varincia entre a medida
experimental e a previso do modelo no ponto experimental k pode ser dada por

Captulo 4: Estimao de Parmetros

208

Var { yke ykm } = E ( yke k ) BkT M -1 G Y


E

{( y ) 2B
2

e
k

T
k

}=

M -1 G Y ( yke k ) + BkT M -1 G Y T G TY ( M -1 ) Bk
T

Se as medidas experimentais so independentes e os erros a que as medidas


esto sujeitas so os mesmos,

{( y ) } 2B
e
k

Var { yke ykm } =


T
k

M -1 G Y E ( yke k ) + BkT M -1 G Y E { T } G TY ( M -1 ) Bk =
T

2 2 BkT M -1 Bk = 2 1 BkT M -1 Bk < 2 = E ( yke k )

onde 2 a varincia dos erros experimentais. Conclui-se, portanto, que a varincia das
diferenas entre os dados experimentais e as predies feitas com o modelo menor que
a varincia dos erros experimentais. Assim, se a varincia dos erros experimentais for
inferida pela diferena existente entre os dados experimentais e as predies do modelo,
necessrio levar esse fato em considerao, para que no se subestime a varincia
experimental (ver Equaes 3.7-3.9).
De forma semelhante
NE
2
NE
E ( yke ykm ) = E
k =1
k =1

( yke ykm )

NE

k =1

NE

= Var { yke ykm } =


k =1

2 NE BkT M -1 Bk = 2 [ NE NP ]
Portanto, uma inferncia consistente da varincia experimental pode ser dada
pela equao
NE

s2 =

( y
k =1

e
k

ykm )

NE NP

de maneira que se diz que o sistema perde NP graus de liberdade quando se estimam NP
parmetros de um modelo. No caso particular do modelo do Exemplo 4.21, obtm-se a
mesma expresso definida na Equao (3.7) para a varincia amostral, mostrando a
consistncia interna da anlise efetuada.

4.6. O Mtodo da Mxima Verossimilhana


Apesar de ser bastante til e permitir a soluo de uma srie de problemas
prticos, como nos Exemplos 4.15 a 4.22, a funo de mnimos quadrados definida pela
Equao (4.12) bastante limitada porque admite implicitamente que todas as variveis

Captulo 4: Estimao de Parmetros

209

analisadas pertencem a um mesmo conjunto amostral; ou seja, so medidas de uma


mesma varivel, obtidas com a mesma preciso em qualquer condio experimental.
Nem uma coisa nem outra so necessariamente verdadeiras. Por exemplo, durante a
anlise de dados de reao, podem ser medidas temperaturas e presses como variveis
dependentes. Obviamente, no faz qualquer sentido misturar os dados de temperatura e
presso, como definido pelas Equaes (4.11) e (4.12). Alm disso, os erros de medio
de cada uma das variveis podem mudar de ponto para ponto, em virtude de mudanas
de desempenho dos instrumentos de medida e das tcnicas experimentais. importante
observar que nem todo instrumento tem o desempenho de uma rgua, que fornece um
erro de medida aproximadamente constante em toda a faixa de utilizao. Por exemplo,
a incerteza de medio de termopares usados para medir temperaturas costuma
aumentar com o aumento da temperatura. Dessa forma, tambm no faz sentido juntar
as medidas de temperatura obtidas em condies distintas nas Equaes (4.11) e (4.12).
Finalmente, as medidas experimentais no so necessariamente independentes. Uma
medida pode influenciar a outra de maneira direta (por exemplo, flutuaes de
temperatura influenciam o desempenho do medidor de presso) ou de maneira indireta
(flutuaes dos nveis de impureza resultantes de certas corridas experimentais podem
afetar os resultados obtidos nas corridas seguintes). Portanto, necessria uma maneira
alternativa de formular a funo objetivo, que contemple a possibilidade de levar todos
esses fatos em considerao.
Uma maneira bastante comum de se efetuar a estimao de parmetros fazer
uso do mtodo da mxima verossimilhana. O mtodo da mxima verossimilhana est
baseado em pressupostos relativamente simples e permite a anlise de virtualmente
qualquer problema experimental de forma rigorosa, desde que se conhea de forma
apropriada como se comportam os erros de medio na regio experimental. Os
pressupostos para construo do mtodo da mxima verossimilhana so apresentados a
seguir.
Pressuposto 1 Admite-se que as distribuies dos erros experimentais na regio de
experimentao so conhecidas.
Nesse caso, suponha que a curva de densidade de probabilidades (ze; z, VZ)
e
descreve as probabilidades de se encontrarem as medidas experimentais z , dado os
valores reais (e desconhecidos) z e uma medida da varincia dos erros experimentais
VZ. O vetor z contm as variveis independentes e as dependentes; ou seja, zT = [xT yT].
Obviamente, os desvios z = (ze z) so os erros experimentais. Por exemplo, no caso
dos desvios experimentais apresentarem uma distribuio de probabilidades normal,
tem-se, de acordo com a Equao (2.72), a seguinte curva de densidade de
probabilidade:

z e ; z, VZ =

1
exp z e z
2
2 det ( VZ )
1

VZ1 z e z

(4.32a)

Deve ficar claro que diferentes experimentos podem apresentar diferentes


distribuies de erros experimentais, de maneira que a Equao (4.32a) apenas ilustra
um caso, em que as flutuaes ocorrem de acordo com o que prev a curva de
distribuio normal. Por exemplo, se a distribuio de erros experimentais puder ser

Captulo 4: Estimao de Parmetros

210

descrita por uma distribuio exponencial, a curva de densidade de probabilidade dos


desvios experimentais poderia ser descrita na forma:

z ; z, VZ
e

ze z
1

=
exp
2 ( VZ )
( VZ )

(4.32b)

onde z e - z representa uma norma apropriada dos desvios experimentais e ( Vz )


representa um escalar que pondera a magnitude dos desvios experimentais.
No possvel escolher qual das duas equaes (Equao 4.32a-b) melhor para
representar os erros experimentais sem que se faa uma correta caracterizao dos erros
de medio no laboratrio, como discutido no Captulo 3 (e no Volume II dessa srie de
publicaes). Na verdade, outras funes de distribuio, como aquelas apresentadas no
Captulo 2, podem tambm ser usadas para descrever de forma apropriada os erros
experimentais. Assim, as Equaes (4.32a-b) so apenas dois exemplos possveis de
comportamento em um universo virtualmente infinito de possibilidades.
Freqentemente os experimentos so realizados de forma independente. Nesse
caso, a curva de densidade de probabilidades que descreve o conjunto de observaes
experimentais pode ser descrita na forma

NE

z e ; z, VZ = i z ie ; z i , VZi
i =1

(4.33a)

que explicita o fato de que a probabilidade conjunta das observaes resultado da


composio das diferentes probabilidades de cada um dos resultados obtidos. Dessa
maneira, as Equaes (4.32a-b) podem ser rescritas na forma:
NE
1

1
z e ; z, VZ =
exp z ei z i
2
i =1 2 det ( VZi )


VZi1 z ie z i

NE
z ei z i
1

z e ; z, VZ =
exp
i ( VZi )

i =1 2 i ( VZi )

(4.33b)

(4.33c)

Muito freqentemente, o experimentador consegue controlar com bastante


eficincia a preciso das medidas experimentais independentes xe. Alm disso, tcnicas
de planejamento experimental (ver Volume II dessa srie de publicaes) podem ser
utilizadas para minimizar o efeito dos erros experimentais das variveis independentes
xe sobre as medidas das variveis dependentes ye. Por isso, pode ser conveniente tratar
as variveis dependentes e independentes de forma distinta. Admitindo-se que as
medies das variveis independentes no esto correlacionadas com as medies das
variveis dependentes, chega-se a uma nova expresso para a curva de densidade de
probabilidades:

Captulo 4: Estimao de Parmetros

NE

211

z e ; z, VZ = xi xie ; xi , VXi yi y ie ; y i , VYi


i=1
NE
1

1
z e ; z, VZ =
exp xei xi
2
i =1 2 det ( VXi )

z ; z, VZ

VXi1 xei xi

1
exp y ie y i
2
2 det ( VYi )
1

(4.34a)

VYi1


y ei y i

(4.34b)

xie xi
y ie y i
1
1

(4.34c)
=
exp
exp
xi ( VXi ) 2 yi ( VYi )
yi ( VYi )

i =1 2 xi ( VXi )

NE

Em experimentos realizados sob condies controladas, como geralmente


acontece em laboratrios de pesquisa, os valores das variveis independentes so
conhecidos com grande preciso. Nesse caso, parece razovel considerar que
( xe x ) 0 . Admitindo-se como vlida essa hiptese, possvel reescrever as
Equaes (4.34a-c) na forma:

NE

z e ; z, VZ = yi y ie ; y i , VYi
i=1
NE
1

1
exp y ei y i
z e ; z, VZ =
2
i =1 2 det ( VYi )

z ; z, VZ
e

(4.35a)

VYi1 y ei y i

y ie y i
1

=
exp
yi ( VYi )

i =1 2 yi ( VYi )

(4.35b)

NE

(4.35c)

Deve ficar claro que em muitos problemas o controle sobre as variveis


independentes no to rgido, de maneira que nem sempre razovel representar os
erros experimentais na forma proposta pelas Equaes (4.35a-c). Em experimentos
realizados em unidades pilotos e unidades industriais, os desvios experimentais nas
variveis independentes no podem ser geralmente descartados, como discutido nas
prximas sees desse captulo.
Por fim, admitindo-se que todas as medies experimentais podem ser realizadas
de forma independente, a curva de densidade de probabilidades pode ser expressa na
forma:
NE NX

2
z e ; z, VZ = xij xije ; xij , xij
i =1
j =1

) ( y ; y , )
NY

yij

j =1

e
ij

ij

2
yij

(4.36a)

Captulo 4: Estimao de Parmetros

z e ; z, VZ

z ; z, VZ
e

212

1
1 xij xij

=
exp
2
2
2 xij
i =1 j =1 2 xij

NE NX

NX
xije xij
1

=
exp
2
2
xij xij
i =1 j =1 2 xij xij

NE

( )

( )

yije yij
1
1

exp

2
2

2
j =1 2 yij
yij

(4.36b)
e
NY
yij yij
1

exp

2
2
yij yij
j =1 2 yij yij

(4.36c)

NY

( )

( )

ou ainda
NE NY

2
z e ; z, VZ = yij yije ; yij , yij

j =1

i =1

z ; z, VZ

z ; z, VZ
e

1
1 yij yij

exp
=
2
2
2
yij
i =1 j =1 2 yij

NE NY

NY
yije yij
1

=
exp
2
2
yij yij
i =1 j =1 2 yij yij

(4.36d)

NE

( )

(4.36e)

(4.36f)

( )

se as medidas das variveis independentes no esto sujeitas a erros experimentais. Nas


2
2
Equaes (4.36a-f), xij
e yij
correspondem s varincias de cada medio xije e yije .
importante observar que as diferentes simplificaes introduzidas permitem
que a densidade de probabilidades das flutuaes experimentais seja reescrita de formas
distintas, como mostrado nas Equaes (4.32-4.36), a depender da natureza dos erros
experimentais. A escolha de uma das muitas formas propostas para a distribuio dos
erros experimentais s possvel depois da caracterizao apropriada desses erros.
Como visto a seguir, essa caracterizao dos erros fundamental para a proposio da
tcnica de mxima verossimilhana para estimao de parmetros.
Pressuposto 2 Admite-se como vlida a hiptese do modelo perfeito.
Considerando que a natureza das flutuaes experimentais conhecida e que
existe um modelo eficiente para descrever as relaes existentes entre as diferentes
variveis do problema, pode-se admitir que os valores reais e desconhecidos de x e y (z)
nas Equaes (4.32-4.36) so aqueles previstos pelo modelo. Em outras palavras, se o
modelo capaz de representar os dados medidos, parece razovel admitir que x = x m e
y = y m ( z = z m ), onde m denota que o valor calculado a partir de um modelo. Fica
implcito, assim, que as medidas experimentais flutuam em torno dos valores previstos
pelo modelo, j que se admite que o modelo perfeitamente capaz de descrever as
relaes existentes entre as diversas variveis do problema. Essa certamente uma
hiptese bastante forte, j que nenhum modelo consegue de fato capturar todos os
detalhes de um problema real. Sob outro ponto de vista, no entanto, parece pouco

Captulo 4: Estimao de Parmetros

213

producente admitir que um usurio queira utilizar um modelo sabidamente ruim para
representar um problema experimental qualquer.
O modelo pode ser definido genericamente na forma:

y m = f xm ,

(4.37)

onde f indica as equaes do modelo e o vetor dos parmetros do modelo. Como j


discutido, admite-se que os valores das variveis dependentes ym podem ser calculados
(de forma explicita ou numrica) a partir dos valores das variveis independentes xm e
dos parmetros . Portanto, o vetor z que contm as variveis independentes e
dependentes
do
problema
pode
ser
dado
na
forma
mT
mT
mT
mT
T
m
z = x
y = x
f ( x ; ) . Logo, a distribuio dos erros experimentais
pode ser redefinida na forma ( z e ; z m , VZ ) , onde os valores reais desconhecidos da
varivel z foram substitudos pelos valores zm calculados com o auxlio do modelo
perfeito. Dessa maneira, a curva de densidade de probabilidades pode ser escrita de
forma explicitar o fato de que existe um modelo que descreve como as variveis
dependentes respondem a mudanas das condies experimentais e dos parmetros. Por
exemplo, no problema particular definido pela Equao (4.36e):
2

yije yijm ( xi , ) )
(
1
1

( z ; z , VZ ) =
exp
2
2
2

yij
i =1 j =1 2 yij

NE

NY

(4.38)

Portanto, a hiptese do modelo perfeito permite introduzir os parmetros


desconhecidos do modelo na funo probabilstica que descreve as flutuaes
experimentais.
Pressuposto 3 Admite-se como vlida a hiptese do experimento bem feito.

Quando os experimentos so conduzidos de forma apropriada, parece razovel


admitir que os valores experimentais obtidos representam adequadamente a realidade
experimental estudada, a despeito das pequenas e inevitveis flutuaes experimentais.
Portanto, parece tambm razovel admitir que os dados experimentais obtidos so
altamente provveis, uma vez que no so obtidos de forma aleatria, mas como
resultado de um processo experimental cuidadoso e reprodutvel. Sendo assim, parece
tambm razovel admitir que a repetio das medidas experimentais conduziria a
resultados experimentais semelhantes, tendo em vista a pertinncia e esmero das
observaes realizadas. Levada ao extremo, essa argumentao permite considerar
como vlida a hiptese de que os dados experimentais obtidos no apresentam apenas
alta probabilidade de ocorrncia so aqueles que apresentam mxima probabilidade
de ocorrncia. Portanto, parece razovel admitir que os pontos experimentais obtidos
devem estar situados na regio de mxima probabilidade de ( z e ; z m , VZ ) .
A argumentao proposta deposita enorme confiana nas observaes
experimentais realizadas. Isso pode ser certamente questionado, j que medidas

Captulo 4: Estimao de Parmetros

214

experimentais so freqentemente corrompidas por erros grosseiros e sistemticos que


no se enquadram na argumentao desenvolvida no pargrafo anterior. Sob outro ponto
de vista, parece tambm ser contra-producente acreditar que um experimentador use
medidas experimentais sabidamente corrompidas para compreender um problema real.
Se o experimento de fato bem feito, no parece haver razo para acreditar que as
observaes experimentais sejam pouco provveis e no representem satisfatoriamente
a realidade experimental.
A conseqncia fundamental da hiptese do experimento bem feito a definio
do problema de estimao de parmetros como o problema de maximizao da funo
( z e ; z m , VZ ) ; ou seja, de maximizao da probabilidade de encontrar os dados
experimentais obtidos, que flutuam de forma aleatria ao redor das previses do
modelo, segundo a distribuio conhecida dos erros experimentais. Para que essa tarefa
seja possvel, manipulam-se os valores desconhecidos xm e (quase sempre atravs de
procedimentos numricos, discutidos no Captulo 5), que constituem os parmetros do
problema. Esse problema de estimao de parmetros conhecido como problema de
estimao de parmetros por mxima verossimilhana.
No caso da distribuio normal definida na Equao (4.38), as variveis
independentes xe no esto sujeitas a erro, de maneira que o vetor xm = xe conhecido.
Para maximizar a Equao (4.38), conveniente perceber que o ponto de mximo da
distribuio tambm coincide com o ponto de mximo do logaritmo dessa funo, dado
que o ln() uma funo monotnica crescente de . Por isso, conveniente escrever

1
ln z ; z , VZ = ln
2
2 yij
i =1 j =1

NE NY

1 NE NY y e y m ( x , )
ij
i
ij
2
yij
2 i =1 j =1

(4.39)

Repare que o primeiro termo do somatrio do lado direito da equao


constante e no depende do valor dos parmetros. Logo, procurar o ponto de mximo da
funo acima o mesmo que procurar o ponto de mximo da funo

e
m
1 NE NY yij yij ( xi , )
F =
2
2 i =1 j =1
yij

(4.40)

que equivale a procurar o ponto de mnimo da funo


NE NY

FObj =
i =1 j =1

(y

e
ij

yijm ( xi , )
2
yij

(4.41)

que uma mtrica para o problema de estimao de parmetros. A funo acima


usualmente chamada de funo de mnimos quadrados ponderados. Repare que a
Equao (4.41) tem um significado estatstico preciso e profundo, sendo a mtrica
natural quando os erros experimentais so distribudos normalmente, no esto
correlacionados e quando as variveis independentes no esto sujeitas a erro, desde que
as hipteses de experimentos bem feitos e modelo perfeito sejam aceitveis. Observe
que o fator de ponderao o inverso da varincia do erro de medida nesse caso; logo,

Captulo 4: Estimao de Parmetros

215

quanto maiores os erros experimentais, maiores tambm so os desvios aceitos entre as


medidas experimentais e os valores calculados com o modelo. Alm disso, a funo
objetivo da Equao (4.41) permite misturar diferentes conjuntos de dados, desde que os
erros de medida sejam conhecidos. curioso observar que a varincia do erro
experimental o fator de normalizao natural das variveis do problema. Observe
ainda que a Equao (4.41) converge naturalmente para a Equao (4.12), quando os
erros de medio so iguais e constantes em toda a regio experimental. Portanto, a
funo de mnimos quadrados tambm uma funo de mxima verossimilhana,
quando os erros so normalmente distribudos, no esto relacionados, so constantes e
quando as variveis independentes no esto sujeitas a erro, desde que as hipteses de
experimentos bem feitos e modelo perfeito sejam aceitveis.
Um dos grandes mritos do mtodo da mxima verossimilhana permitir a
extenso natural da funo objetivo para distintas condies de experimentao, de
acordo com a estrutura da matriz de covarincia. Por exemplo, admitindo agora que os
erros so normalmente distribudos e independentes, mas que as variveis
independentes tambm esto sujeitas a erro, a funo objetivo toma a seguinte forma:

z ; z, VZ
e

NX
xe x
1
ij
ij

exp
=
2
2

2 xij
i =1 j =1
2 xij

NE

NY
y e y 2
1
ij
ij


exp
2
2

2 yik
j =1
2 yij


(4.42)

que corresponde Equao (4.34) aps ser introduzida a hiptese de que todas as
medies so feitas de forma independente, de maneira que as matrizes de covarincias
dos erros experimentais so diagonais. O ponto de mximo da Equao (4.42)
corresponde ao ponto de mnimo da seguinte expresso (similar Equao (4.41)):

FObj

NY y e y m x m ;
ij
ij
i
=
2

yij
i =1
j =1

NE

))

2
NX

(x

j =1

e
ij

xijm
2
xij

(4.43)

que a mtrica natural para o problema com erro tambm na varivel independente,
quando as distribuies de erro so normais e os experimentos no esto
correlacionados. Observe que na Equao (4.43) s possvel calcular o valor
m
verdadeiro de x se esses valores so includos no conjunto de parmetros a serem
estimados pelo problema. Esse o problema normalmente designado de reconciliao
de dados, ilustrado no Exemplo 4.23 e apresentado com mais detalhes no Volume III
dessa srie de publicaes.
Exemplo 4.23 - No problema linear do Exemplo 4.20, admite-se que as variveis
independentes tambm esto sujeitas a erros de medio. Nesse caso,
ym = xm +
A funo de mxima verossimilhana fica na forma

Captulo 4: Estimao de Parmetros

) + (x

ye xm
i
i
=
2
yi
i =1

NE

FObj

216
2

e
i

xim

xi2

Os valores de e e os valores desconhecidos de xim so ento obtidos


minimizando-se o valor da funo objetivo
FObj

NE

NE

m
i

(y x
2

m
k

yk2

( x ) = 0
m
i

m
i

yi2

i =1

(y x
=2

2
yi

xkm

i =1

FObj

FObj

(y x
2

( 1) = 0

) ( ) + 2 ( x x ) ( 1) = 0 , k = 1...NE

e
k

m
k

2
xk

Dessa ltima equao, possvel concluir que

( yk )
e

xk

yk2
xk2
= xkm , k = 1...NE
2
1
+
yk2 xk2
que pode ser substitudo nas duas equaes anteriores, permitindo a soluo do
problema. No entanto, apenas uma soluo numrica possvel, j que no se consegue
derivar uma soluo analtica para o problema. Dessa forma, o problema de
reconciliao de dados, mesmo para o caso mais trivial da reta, requer o uso de rotinas
computacionais para resoluo adequada do problema. conveniente observar na
expresso acima que, se os erros de medida da varivel independente vo a zero,

( yk )
e

xkm =

xk

xk

yk2
xk2
xk2
e

= xk , k = 1...NE
2
1

1
+ 2
2
xk2
yk xk

de maneira que o valor calculado coincide com o valor experimental, como admitido
anteriormente.

Como discutido na Seo 4.2.2, modelos matemticos podem ser classificados


como lineares ou no-lineares, dependendo do conjunto de variveis consideradas.
Mesmo para um modelo simples, como no caso de uma reta, importante avaliar a
questo da linearidade. Durante a estimao de parmetros, quando as variveis

Captulo 4: Estimao de Parmetros

217

independentes no esto sujeitas a erros, o modelo linear nos parmetros e a soluo


do problema pode ser facilmente obtida. Contudo, durante a reconciliao dos dados,
quando se consideram os erros inerentes s medidas das variveis independentes,
mesmo uma reta deixa de ser um modelo linear. Nesse caso, como as variveis
independentes devem ser estimadas em conjunto com os demais parmetros do modelo,
o problema de estimao ganha maior complexidade e a soluo do problema passa a
requerer ferramentas numricas mais sofisticadas, como observado no Exemplo 4.23.
Para tornar o problema ainda mais envolvente, a maioria absoluta dos modelos
fenomenolgicos que representam processos reais constituda por modelos no
lineares nos parmetros. Dessa forma, independentemente da natureza das medidas
efetuadas nas variveis independentes, a soluo do problema s pode ser obtida com o
auxlio de ferramentas numricas, como as que sero discutidos no Captulo 5.
A seguir (Seo 4.6.1) ser discutida a aplicao do mtodo da Mxima
Verossimilhana para a soluo de problemas que usam modelos lineares nos
parmetros e admitem a distribuio normal dos erros experimentais. Nesses casos,
algumas solues analticas podem ser derivadas para o problema, de maneira que a
anlise estatstica dos resultados pode ser conduzida mais facilmente. Na seo seguinte
(Seo 4.6.2) sero considerados alguns modelos no-lineares nos parmetros,
mostrando-se as dificuldades numricas existentes para a soluo do problema de
estimao, assim como as aproximaes usualmente realizadas para permitir a anlise
estatstica dos resultados finais.
4.6.1 O Mtodo da Mxima Verossimilhana Aplicado a Modelos Lineares

O procedimento clssico de mnimos quadrados usado para estimao de


parmetros de modelos lineares (Equaes 4.13-31) reavaliado agora com o auxlio do
procedimento mais geral de mxima verossimilhana, proposto na seo anterior.
Suponha que o modelo, contendo NY respostas, seja definido pelo seguinte conjunto de
equaes:
NP

y1m ( x, ) = p f1, p ( x )
p =1

NP

y2m ( x, ) = p f 2, p ( x )
p =1

(4.44)

M
NP

m
y NY
( x, ) = p f NY , p ( x )
p =1

O modelo proposto tem NP parmetros, T = [1 2 ... NP], associados a NP.NY


funes fi,j(x) que transformam as NX variveis independentes, xT = [x1 x2 ... xNX], nas
NY variveis dependentes yT = [y1 y2 ... yNY]. Cada uma das variveis independentes e
dependentes medida em cada uma das NE condies experimentais. A funo de
mxima verossimilhana, admitindo-se flutuao normal, medidas independentes de
cada varivel e ausncia de erro significativo nas variveis independentes, fica ento na
forma da Equao (4.41). A incluso das equaes do modelo na funo objetivo
definida na Equao (4.41) leva a:

Captulo 4: Estimao de Parmetros

NE NY

218

FObj =

e NP

e
yij p f j , p xi
p =1

( )

(4.45)

ij2

i =1 j =1

Os valores de so obtidos minimizando-se o valor da funo objetivo em


relao a cada um de seus componentes, na forma

FObj
k

NE NY

e NP
e
yij p f j , p xi
p =1

( )

i =1 j =1

2
ij

( f ( x ) )=0 , k = 1...NP
e
i

j ,k

(4.46)

que resulta no seguinte sistema de equaes

( )

( )

( )) ,

NE NY f j , p xie f j ,k xie NE NY yije f k xie


=
p

ij2
ij2
i =1 j =1
i =1 j =1
p =1
NP

k = 1..NP

(4.47)

H, portanto, NP equaes a resolver e NP incgnitas a determinar, uma vez que


os dados experimentais so conhecidos. A soluo analtica para esse problema pode ser
facilmente derivada se a notao matricial utilizada. Sejam

NE NY f j ,1 ( xie ) f j ,1 ( xie )

ij2
i =1 j =1

e
e
NE NY f j ,2 ( xi ) f j ,1 ( xi )
M =
ij2
i =1 j =1

NE NY f j , NP ( xei ) f j ,1 ( xie )

ij2
i =1 j =1
e

NE NY

f j ,1 ( xie ) f j ,2 ( xie )

NE NY

ij2

i =1 j =1

f j ,2 ( xie ) f j ,2 ( xie )

ij2

i =1 j =1

M
NE NY

f j , NP ( xie ) f j ,2 ( xei )

ij2

i =1 j =1

( ) )

NE NY yije f j ,1 xie

i =1 j =1
ij2

NE NY yije f j ,2 xie

Yf =
ij2
i =1 j =1

NE NY y e f
e
ij j , NP x i


ij2
i =1 j =1

f j ,1 ( xie ) f j , NP ( xie )

ij2

i =1 j =1

e
e
NE NY f
j ,2 ( x i ) f j , NP ( x i )

ij2
i =1 j =1

e
e
NE NY f

x
f
x
(
)
(
)
j , NP
i
j , NP
i

2
ij
i =1 j =1

(4.48)
NE NY

( ))
( ))

ento, reescrevendo a Equao (4.47) com a notao matricial, chega-se a

(4.49)

Captulo 4: Estimao de Parmetros

219

M = Yf = M 1Yf

(4.50)

que uma soluo de enorme importncia prtica para a teoria de estimao de


parmetros e planejamento de experimentos, muito similar soluo obtida
anteriormente com a tcnica de mnimos quadrados. Como feito antes, muito
conveniente ainda definir as matrizes

( )

f1,1 x1e

e
f NY ,1 x1

e
f1,1 x 2

M
=
f
xe
NY ,1 2

f1,1 x eNE

e
f NY ,1 x NE

f1, NP x1e

f NY , NP x1e

f1, NP

f NY , NP xe2

f1, NP x eNE

( )

f NY , NP x eNE

2
2, NY

( )
( )

( )

G TY x e

( )

( )

2
1,1
0
0

0
0 O
0
0 1,2 NY

0
0
0
0
0
0
Vy =
0
0
0
0
0
0

0
0
0

0
0
0
0
0
0

( )

2
2,1

( )
(x )
e
2

( )

( )
( )

2
NE
,1

(4.45)

0
0
0
0

0
0
0
0

0
0
0
0

0
0

O
0
2

0 NE
, NY
0

(4.46)

pois assim possvel escrever a soluo diretamente em termos das variveis medidas
na forma

= M 1G TY Vy1Y e

(4.47)

que indica que existe uma relao linear direta entre a medida experimental da varivel
dependente e o valor estimado para o parmetro (ver Exemplo 4.22).
Como j dito, suponha que as variveis independentes no contm erros e que
toda a flutuao experimental devida aos erros de medio das variveis dependentes
e
Y . Suponha ainda que dois conjuntos de dados obtidos em condies anlogas so
comparados entre si. Nesse caso,

Captulo 4: Estimao de Parmetros

220

= 1 2 = M 1G TY Vy1Y1e M 1G TY Vy1Y2e = M 1G TY Vy1Y e

(4.48)

Portanto, os valores dos parmetros flutuam, medida que flutuam os valores


experimentais obtidos. Se a nica fonte de flutuao o erro experimental

= M 1G TY Vy1

(4.49)

que relaciona os erros paramtricos com os erros experimentais. Portanto, se os erros


flutuam em torno dos valores verdadeiros com mdia igual a zero,
{} = E {M 1G TY Vy1} = M 1G TY Vy1 E {} = 0

(4.50)

os parmetros tambm flutuam em torno dos valores verdadeiros, o que mostra que o
procedimento de estimao de parmetros consistente. Isso muito bom e confere um
certo grau de robustez ao procedimento de estimao de parmetros proposto. Alm
disso, a matriz de covarincias dos parmetros pode ser calculada como

V = { T } = E M 1G TY Vy1 T ( Vy1 ) G Y ( M 1 )
T

V = M 1G TY Vy1E { T }( Vy1 ) G Y ( M 1 )
T

V = M G V Vy ( V
1

T
Y

1
y

1
y

GY (M

V = M 1G TY ( Vy1 ) G Y ( M 1 )
T

(4.51)

Observe que as matrizes M e Vy so simtricas, de maneira que elas so iguais a


suas transpostas. Observe ainda que

M = G TY Vy1G Y

(4.52)

Nesse caso, a matriz de covarincias dos parmetros ganha a forma bastante


simples

V = M 1G YT Vy1G Y M 1

= M 1

(4.53)

que utilizada para a interpretao e soluo de um grande nmero de problemas


prticos. Como na Equao (4.28), observe que os erros paramtricos dependem tanto
da estrutura do modelo quanto dos dados experimentais disponveis, j que tanto o
modelo quanto os dados experimentais precisam ser definidos para que seja possvel
calcular a matriz M. Portanto, cada modelo e cada conjunto de dados experimentais
resulta em um conjunto distinto de incertezas paramtricas, no sendo possvel avaliar a
estrutura das incertezas paramtricas de forma arbitrria e isolada do contexto de
estimao considerado.
Finalmente, os parmetros so usados para fazer previses com o modelo em
qualquer condio x. Usando a notao matricial, o modelo pode ser escrito na forma

Captulo 4: Estimao de Parmetros

221

y m ( x, ) = B ( x )

(4.54)

onde
f1,1 ( x )

f (x)
B ( x ) = 2,1
M

f NY ,1 ( x )

f1,1 ( x )

f 2,2 ( x )
M

L
L
O

f NY ,2 ( x ) L

f1, NP ( x )

f 2, NP ( x )

f NY , NP ( x )

(4.55)

que tambm estabelece uma relao linear direta entre o valor dos parmetros e a
previso da varivel dependente em um ponto qualquer x da regio experimental. De
forma anloga realizada anteriormente,

= yy T = B T B T
V
y

= B T B T = BV B T = BM 1B T
V
y

(4.56)

e a matriz de covarincia dos erros de predio, que estabelece o vnculo entre


onde V
y
os erros de predio, a qualidade dos dados experimentais e o procedimento de
estimao de parmetros. Observe que a Equao (4.56) leva em considerao somente
o erro relacionado ao modelo, sendo necessrio somar esta equao a matriz de
covarincia experimental. Como acima, todas essas expresses so fundamentais para a
perfeita compreenso dos procedimentos clssicos de planejamento experimental, como
discutido no Volume II dessa srie de publicaes.
4.6.2 O Mtodo da Mxima Verossimilhana Aplicado a Modelos No-Lineares

Considerando um problema mais geral, suponha que o modelo no linear


contendo NY respostas, seja definido pelo seguinte conjunto de equaes:

y1m ( x, ) = f1 ( x, )
y2m ( x, ) = f 2 ( x, )
M

(4.57)

m
y NY
( x, ) = f NY ( x, )

Este modelo tem NP parmetros, T = [1 2 ... NP], associados a NY funes


no lineares fj(x) que transformam as NX variveis independentes, xT = [x1 x2 ... xNX],
nas NY variveis dependentes yT = [y1 y2 ... yNY]. Cada uma das variveis independentes
e dependentes medida em cada uma das NE condies experimentais. A princpio,
qualquer forma da funo de mxima verossimilhana pode ser usada para a anlise
proposta nas sees subseqentes, seja como uma maximizao da funo
z e ; z m , VZ ou como uma minimizao da funo FObj.

Admitindo-se flutuao normal, medidas independentes de cada varivel e


ausncia de erro significativo nas variveis independentes, a funo de mxima

Captulo 4: Estimao de Parmetros

222

verossimilhana fica ento na forma da Equao (4.41) (embora pudesse ser qualquer
outra). A incluso das equaes do modelo na funo objetivo da Equao (4.41) leva a:
NE NY

FObj =

(y

e
ij

f j xei ,

))

(4.58)

ij2

i =1 j =1

Quando os erros nas variveis independentes no podem ser desprezados, a


funo objetivo deve levar em considerao estes desvios, podendo ser esto escrita na
forma da Equao (4.43), como mostrado abaixo:
NE NY

FObj =

(y

e
ij

f j xim ,

ij2

i =1 j =1

))

2
NE NX

(x

e
ik

xikm

ik2

i =1 k =1

(4.59)

Observe que na Equao (4.58) as funes fj so funes dos valores


experimentais das variveis independentes xe e dos parmetros que esto sendo
estimados. Uma vez medidos, os dados experimentais so fixos e, assim, a funo
objetivo (Equao 4.58) depende somente dos parmetros que esto sendo estimados.
Como o nmero de variveis experimentais que esto sendo previstas pelo modelo
igual a NE.NY e o nmero de variveis que esto sendo calculadas para a minimizao
da funo objetivo igual a NP (lembre que as variveis independentes esto fixas nos
valores experimentais), o nmero de graus de liberdade definido como:
GL = NE.NY NP

(4.60)

J na Equao (4.59) as funes fj so funes dos valores estimados das


variveis independentes xm e dos parmetros , que tambm esto sendo estimados.
Neste caso, a funo objetivo (Equao 4.59) depende das variveis independentes e dos
parmetros que esto sendo estimados. Com relao ao nmero de graus de liberdade, o
nmero de variveis experimentais que esto sendo previstas pelo modelo igual a
NE.NY + NE.NX e o nmero de variveis que esto sendo calculadas para a
minimizao da funo objetivo igual a NE.NX + NP, de forma que o nmero de graus
de liberdade :
GL = NE.NY + NE.NX NE.NX NP

(4.61)

GL = NE.NY NP

Assim, o nmero de graus de liberdade o mesmo para os dois casos (estimao


e reconciliao), apesar do nmero de variveis estimadas ser maior no caso da
reconciliao.
Considere a funo objetivo definida na Equao (4.58). A minimizao da
funo objetivo, nesse caso, deve satisfazer as seguintes equaes:

FObj
p

NE NY

= 2
i =1 j =1

(y

e
ij

))

f j xei , f j xie ,

ij2
p

) = 0 ,

p = 1..NP

(4.62a)

Captulo 4: Estimao de Parmetros

FObj

223

FObj

1 0
FObj

0
= 2 = = 0

M M

0
FObj

NP

(4.62b)

ou seja, o vetor gradiente da funo objetivo em relao aos parmetros do modelo


deve ser nulo.
Quando as variveis independentes esto tambm sujeitas a erros, a funo
objetivo considerada aquela definida na Equao (4.59). Nesse caso, como as
variveis independentes devem ser estimadas simultaneamente com os demais
parmetros do modelo, o vetor gradiente da funo objetivo em relao s variveis
independentes tambm deve ser nulo, isto :
FObj
x

m
i ,k

NY

= 2
j =1

(y

e
i, j

))

f j xim , f j xim ,

i2, j
xim,k

x FObj

FObj

x11
FObj

= x12
M

FObj
x
NE , NX

) 2 ( x

e
i ,k

xim,k

2
i ,k

) = 0 , i = 1..NE

k = 1..NX

0

0
= = 0
M
0

(4.63a)

(4.63b)

Deve ser observado que o segundo termo do lado direito da Equao (4.59) no
depende dos parmetros , de forma que os vetores gradientes em relao aos
parmetros das funes objetivos definidas nas Equaes (4.58) e (4.59) so
semelhantes. Apenas deve-se usar os valores de xm ao invs de xe para o clculo das
funes fj, no caso em que as variveis independentes esto sujeitas a erros
experimentais que no podem ser desprezados.
Exemplo 4.24 - Considere o modelo no linear definido pelas equaes:

y1 = 1 x12 + x2 2
y2 = 1 2 x1 x2
Utilizando-se a funo de mnimos quadrados ponderados para anlise do
problema, na forma definida pela Equao (4.41) para o caso de estimao e pela

Captulo 4: Estimao de Parmetros

224

Equao (4.43) para o caso de reconciliao, o gradiente da funo objetivo com relao
aos parmetros 1 e 1 pode definido pelas seguintes equaes:

NE

yie,1 1 xi2,1 xi,22


= 2
i2,1
2
i =1

FObj

NE

yie,2 1 2 xi ,1 xi ,2

x +

x
x
( 2 i,1 i,2 ) = 0
i2,2

yie,2 1 2 xi ,1 xi ,2

2
=0

xi ,2 ln ( xi ,2 ) +

x
x
(
)
1 i ,1 i ,2
i2,2

yie,1 1 xi2,1 xi,22


= 2
i2,1
1
i =1

FObj

2
i ,1

Observe que no possvel obter uma soluo analtica para os valores dos
parmetros a partir das duas equaes acima, sendo necessria a utilizao de um
mtodo numrico especfico para esse fim. Quando so consideradas as variveis
independentes, as seguintes equaes devem ser adicionadas ao problema:

FObj
xi ,1
FObj
xi ,2

yie,1 1 xi2,1 xi,22


= 2
i2,1

yie,1 1 xi2,1 xi,22


= 2
i2,1

)
)

( 21 xi,1 ) +

( x )
2 1

1 i ,2

(y

e
i ,2

1 2 xi ,1 xi ,2

(y
+

e
i ,2

2
i ,2

1 2 xi ,1 xi ,2

2
i ,2

(x

xi ,1
=0
i2,1

e
x x
( 1 2 xi,1 ) i,2 2 i ,2 = 0
i ,2

( 1 2 xi ,2 )

e
i ,1

onde i = 1..NE.
Quando somente a estimao dos parmetros considerada, a soluo do
problema equivalente soluo de um sistema de duas equaes algbricas com duas
incgnitas. Quando o problema de reconciliao considerado, o sistema de equaes
algbricas passa a ser constitudo por 2.NE + 2 equaes e 2.NE + 2 incgnitas (2.NE
variveis independentes e 2 parmetros). Assim, a dimenso do problema numrico que
precisa ser resolvido aumenta consideravelmente no problema de reconciliao. A
depender do problema de estimao proposto, a dimenso do sistema de equaes que
deve ser resolvido pode ser bastante elevada.

Alm da maior dificuldade computacional associada obteno de uma soluo


para o problema no linear de estimao de parmetros, uma outra questo relevante
que se coloca diz respeito obteno das matrizes de covarincia dos parmetros e dos
erros de predio; ou seja, a como caracterizar estatisticamente a qualidade da soluo
encontrada. No caso de modelos no lineares, no possvel derivar uma soluo
analtica similar Equao (4.47), usada para interpretar as incertezas paramtricas de
modelos lineares.
Para que se compreendam as solues apresentadas a seguir, necessrio
lembrar que a matriz de covarincias pode ser definida na forma:

Captulo 4: Estimao de Parmetros

V = E xxT

225

x1x1

x x
= E 2 1
M
xN x1

x1xN

L x2 xN

O
M

L xN xN

x1x2

x2 x2
M
xN x2

(4.64)

Considerando que os desvios experimentais e paramtricos no so muito


grandes (o que pode no ser uma hiptese muito boa em alguns problemas !), a matriz
de covarincia pode ser aproximada com auxlio da seguinte forma diferencial da
equao (4.64):
V = E {x xT } E {dx dxT }

(4.65)

Considerando que o modelo perfeito, como j discutido nas sees anteriores,


o nico motivo de no serem observados experimentalmente os valores preditos pelo
modelo o erro experimental. Assim, dependendo da existncia ou no de desvios
experimentais significativos nas variveis independentes, podem-se escrever as
seguintes equaes:
y e = y m ( xe , ) + Y = f ( x e , ) + Y

(4.66a)

y e = y m ( x m + X , ) + Y = f ( xm + X , ) + Y

(4.66b)

onde representa os desvios observados entre os valores experimentais e os valores


preditos pelo modelo, confundidos com os prprios erros experimentais (uma vez que o
modelo perfeito). Considerando que as variveis independentes no esto sujeitas a
erros, a aproximao linear das equaes do modelo, vlida quando os desvios
experimentais e paramtricos so pequenos, leva a:

y = f x , 0 +
e

f x e , 0

) +

(4.67a)

sendo possvel escrever:

y =

f x e , 0

) +

(4.68a)

De forma similar, se as variveis independentes esto sujeitas a erros


experimentais

y = f x , 0 +
e

sendo possvel escrever:

f x m , 0

) + f ( x

, 0

+ Y

(4.67b)

Captulo 4: Estimao de Parmetros


y =

f x m , 0

226

) + f ( x

, 0

+ Y

(4.68b)

A Equao (4.68) mostra, de forma aproximada, como os desvios entre os dados


experimentais e os preditos pelo modelo variam em funo dos desvios paramtricos e
dos erros experimentais.
Por outro lado, o vetor gradiente da funo objetivo em relao aos parmetros
do modelo nulo quando a funo objetivo est no ponto mnimo, como imposto pelo
procedimento de minimizao executado durante a estimao de parmetros. Logo,

FObj y e , x e , = 0

(4.69)

Considerando que as variveis independentes no esto sujeitas a desvios


experimentais significativos, a aproximao linear do vetor gradiente apresentado na
Equao (4.69) pode ser escrita na forma:

FObj y + Y , x , + FObj
e

FObj y e , x e ,
y , x , +
Y +
y e
e

FObj y e , x e ,
+
= 0

(4.70a)

que descreve como as incertezas experimentais e paramtricas afetam o clculo do vetor


gradiente da funo objetivo nas proximidades dos valores estimados para os
parmetros do modelo. De forma similar, se as variveis independentes esto sujeitas a
erros:

FObj y + Y , x + X , + FObj
e

FObj y e , x e ,
y , x , +
Y +
y e
e

FObj y e , x e ,
FObj y e , xe ,
X +
= 0
x e

(4.70b)

O zero do lado direito da Equao (4.70a-b) imposto pelo procedimento de estimao


de parmetros; ou seja, independentemente de como os dados experimentais mudem, os
novos parmetros estimados ( + ) sempre fazem com que o vetor gradiente da
funo objetivo seja igual a zero. A Equao (4.70a-b) indica, portanto, como as
incertezas experimentais ( X , Y ) provocam mudanas nos valores dos parmetros
( ). O primeiro termo do lado direito da Equao (4.70a-b) o prprio vetor
gradiente da funo objetivo em relao aos parmetros no ponto considerado. Por
definio, esse gradiente tambm nulo, j que os parmetros so sempre estimados
atravs da minimizao da funo objetivo.
A Equao (4.70a-b) sugere a definio das seguintes matrizes:

Captulo 4: Estimao de Parmetros


2 FObj

e
1y1,1
2 F
Obj
FObj y e , xe ,
e

GY =
=

2 y1,1
y e

2 F
Obj

e
NP y1,1

2 FObj

e
1x1,1
2 F
Obj
FObj y e , xe ,
e
GX =
= 2x1,1
x e

2 F
Obj

e
NP x1,1

2 FObj

11
2 F
Obj
FObj y e , x e ,
H =
= 2 1

2 F
Obj

NP 1

227
2 FObj
e
1y1,2

2 FObj
e
2y1,2

M
FObj

NP y
2 FObj
1x

e
1,2

FObj

2 FObj
e
2 y NE
, NY

FObj
2

e
2 x1,2

e
1y NE
, NY

e
1,2

2 FObj

e
NP y NE
, NY

2 FObj
1x

e
NE , NX

2 FObj
e
2 xNE
, NX

2 FObj

2 FObj

e
NP x1,2

2 FObj
1 2
2 FObj
2 2
M
FObj
2

NP 2

e
NP xNE
, NX

(4.71a)

(4.71b)

1 NP
2 FObj

L
2 NP (4.71c)

O
M

2 FObj

L
NP NP
L

2 FObj

de maneira que a Equao (4.70) pode ser escrita na forma


G Y Y + H = 0

(4.72a)

G Y Y + G X X + H = 0

(4.72b)

a depender da existncia ou no de erros de medida nas variveis independentes.


Observe que a matriz H, chamada de matriz Hessiana ou matriz de derivadas
segundas, simtrica (H = HT). Assim, a partir da Equao (4.72) possvel obter
uma expresso que mostra como os desvios experimentais se propagam at os
parmetros, na forma:

= H 1 G Y Y

(4.73a)

= H 1 [G Y Y + G X X ]

(4.73b)

Captulo 4: Estimao de Parmetros

228

Inserindo a Equao (4.73) na Equao (4.65), chega-se finalmente a:

{(

)( H G ) }
G E{ } G H

V = E T = E H 1 G Y Y

V = E H 1 G Y Y TY G TY H 1 = H 1

T
Y

T
Y

(4.74a)

V = H 1 G Y VY G TY H 1
ou, de forma anloga

{(

)(

V = E T = E H 1 [G Y Y + G X X ] H 1 [G Y Y + G X X ]
V = H 1 G Y VY G TY + 2 G X VXY G TY + G X VX G TX H 1

)}
T

(4.74b)

V = H 1 G Z VZ G TZ H 1
onde VX, VY e VXY so as matrizes de covarincias dos desvios experimentais nas
variveis independentes, dependentes e das covarincias entre elas. Se as medidas
experimentais das variveis independentes e dependentes no esto correlacionadas
entre si, a Equao (4.74b) ganha a forma particular
V = H 1 G Y VY G TY + G X VX G TX H 1

(4.74c)

As Equaes (4.74a-c) mostram de forma explcita como a incerteza


experimental se transforma em incerteza nos parmetros, atravs da funo objetivo e
do modelo utilizados (cujas derivadas esto em H, GY e GX), durante o procedimento
de estimao de parmetros. A validade das Equaes (4.70-74) pressupe que os erros
experimentais e paramtricos so pequenos.
Exemplo 4.25 - No problema linear do Exemplo 4.23, admite-se que as variveis
independentes esto sujeitas a erros de medio e que as medidas so obtidas de forma
independente. Nesse caso,
ym = xm +

A funo de mxima verossimilhana fica na forma

FObj

ye xm
i
i
=
2
yi
i =1

NE

) + (x
2

e
i

xim

xi2

O vetor gradiente da funo objetivo fica ento na forma

Captulo 4: Estimao de Parmetros

229

)(

FObj

e
m

NE y x
xim
i
i

FObj
2

i =1
yi

e
m

NE

yi xi ( 1)
FObj

i
=
1
yi

= FObj =
e
m
e
m
y1 x1 ( )
x1 x1 ( 1)
m

x
2
+
2
1
2
2

y
x
1
1
M

F
Obj
e
m
e
m

m
x
yNE xNE ( )
xNE xNE ( 1)

NE

2
+2
2
2

xNE
yNE

As matrizes H, GX e GY podem ento ser calculadas como


2 FObj

2

2 F
Obj


2 FObj 2 F
Obj
H =
=
i j x1m

2
FObj

m
xNE

m 2

NE x
i

2
2

i =1 yi

m
NE x

2 2

i =1 yi

H =
e
m

+ x1m
1
1

y21

e
m
m
y NE xNE + xNE
2
2
yNE

( )

( )

( )

m
NE x
i
2 2
i =1 yi

2 FObj

2 FObj

x1m

2 FObj

2 FObj

x1m

2 FObj

2 FObj

x1m

x1m

FObj

FObj

M
2

m
x1m xNE

m
NE

y1e x1m + x1m

NE
1
2 2
i =1
yi

2
y1

L 2

y21

2
1
+2 2
y21
x1

2
yNE

( )

y21

2 FObj
m
xNE

2 FObj

m
xNE

2
FObj
m
x1m xNE

2 FObj

m 2

xNE

( )

e
m
m
y NE
xNE
+ xNE

yNE

2 2

yNE

2 2 +2 2

yNE
xNE

Captulo 4: Estimao de Parmetros

230

2 FObj

e
x1
2 F
Obj

x1e
2 FObj
= 2 FObj
GX =
e

i j m e
x x1
1
M

2
FObj
m
xNE
x1e

2 FObj
x2e
2 FObj
2 FObj

FObj

m
xNE
x2e

0 L
0 L
M O
0 L

2 FObj
y

e
2

2 FObj

y2e
2 FObj

x1m y2e
M

FObj

m
xNE
y2e

( x )
m
2

y22

L 2

( 1)
2

y22

e
xNE

2 FObj

xNE

2
FObj
e

x1m xNE

2
FObj
m
e
xNE
xNE

2
2
xNE

0 L

x1m x2e

2 FObj

e
y1
2 F
Obj

y1e
2 FObj
GY =
= 2 FObj
e
i y j m e
x y1
1
M

2
FObj
m
xNE
y1e

x2e

0
0

G X = x21
M

x1m
2
2
y1

2 ( 1)
2
y1

GY = ( )
2 2
y1

2 FObj

y
2 FObj

y NE

2 FObj
e

x1m y NE

2
FObj
m
e
xNE
y NE

2 FObj

e
NE

( x )
m
NE

2
yNE

2
yNE

)
(
2 2

yNE

( 1)
2

Captulo 4: Estimao de Parmetros

231

Considerando que no h erro nas variveis independentes x, a funo objetivo


fica na forma:
ye xe 2
(i
)
i
=
2

yi
i =1

NE

FObj

O vetor gradiente da funo objetivo fica ento na forma

FObj

)(

NE yie xie xie

F
Obj 2

yi2

i =1

=
=
FObj NE y e x e ( 1)
i
i


2
2


yi
i =1

de maneira que as matrizes H e GY podem ser calculadas como


2 FObj

2 FObj 2
H =
= 2
i j FObj

2 FObj


2 FObj

NE x e 2
NE x e
2 i 2 i

2
2

i =1 yi
i =1 yi

H =
NE

NE
xie
1

2 2 2 2

i =1
yi
i =1 yi

( )

( )

( )

2 FObj

2 FObj y1e
GY =
=
e
2
i y j FObj
e
y1

x1e
2 2
y1
GY =
2 ( 1)
2
y1

2 FObj
y2e
2 FObj
y2e

( x )
2
e
2

y22

( 1)
2
y22

2 FObj
L
e
yNE

2 FObj

L
e
yNE

( x )
2

( 1)
2

e
NE

2
yNE

2
yNE

Nesse caso, de acordo com a Equao (4.74), possvel escrever

Captulo 4: Estimao de Parmetros

232

NE xi2
4 2
T
=1 i
G Y VY G Y = iNE
xi

4 2
i =1 i

xi
2
i =1 i
= 2 H
NE
1
4 2
i =1 i
NE

V = H 1 G Y VY G TY H 1 = 2 H 1 =
NE 1
2
1
1
i
i =NE
2
x
NE x 2 NE 1 NE x
i
i2 2 i2 2
i =1 i i =1 i i =1 i i =1 i

xi
2
i =1 i

NE
xi2

2
i =1 i
NE

No caso particular em que os erros experimentais so constantes, a expresso


pode ser reduzida a

NE
1
NE
V =
2
NE 2
NE xi
xi ( NE ) xi i =1
i =1
i =1

NE

xi
i =1

NE
2
xi

i =1

j apresentada anteriormente no Exemplo 4.20 e obtida atravs de outro tipo de


argumentao. Isso mostra claramente a consistncia da discusso e das equaes
apresentadas.

Uma aproximao muito usada para a estimao de parmetros de modelos no


lineares a aproximao de Gauss. Quando a funo objetivo definida na seguinte
forma:
FObj = ( y e y m ) Vy1 ( y e y m )
T

(4.75)

os elementos [hr , s ] da matriz Hessiana (definida na Equao (4.72)) podem ser escritos
como:

hr , s

2 FObj

y m 1 y m
=
= 2
Vy
r s
r
s

2 y m 1 e
m
2
Vy y y

r s

(4.76)

Admitindo-se que a diferena entre os valores experimentais e os calculados


pelo modelo so pequenos e flutuam aleatoriamente ao redor do valor zero, conforme as
hipteses do modelo perfeito e do experimento bem feito, o segundo termo do lado
direito da Equao (4.76) pode ser desprezado. Nesse caso, a matriz Hessiana pode ser
aproximada por:

Captulo 4: Estimao de Parmetros


H =

233

2 FObj

2 B T Vy1 B

(4.77)

onde B a matriz de sensitividades, definida como:

y1m

m1
y m y 2
B=
=
M 1
m
y NY

1

y1m

NP
y 2m
L
NP

O
M
m
y NY
L
NP

y1m
2
y 2m
2
M
m
y NY
2

(4.78)

De acordo com a Equao (4.71), GY pode ser calculado como:

GY =

2 FObj
y e

= 2B T Vy1

(4.79)

de maneira que o termo G Y Vy G TY que aparece na Equao (4.74) fica reduzido a:

G Y Vy G TY = 4B T Vy1Vy Vy1B = 4B T Vy1B = 2H

(4.80)

Assim, a matriz de covarincias dos parmetros pode ser reescrita como


V = H 1 ( G Y Vy G TY ) H 1 = H 1 ( 2H ) H 1 = 2H 1

(4.81)

A Equao (4.81) freqentemente usada para interpretar as incertezas


paramtricas, embora s seja rigorosamente vlida quando a funo objetivo tem a
forma da Equao (4.75). Usando finalmente a Equao (4.77), que define a matriz
Hessiana aps a aproximao de Gauss, a matriz de covarincias dos parmetros fica na
forma

V = B T Vy1B

(4.82)

A Equao (4.82) usada com muita freqncia para a interpretao de


incertezas paramtricas, mas deve ficar claro que ela representa um conjunto muito
restrito de condies. Por outro lado, esta forma da matriz de covarincias dos
parmetros muito til, j que para seu clculo so necessrias somente as derivadas
primeiras das respostas do modelo com relao aos parmetros. Alm disso,deve ser
observado que, para modelos lineares nos parmetros, o termo desprezado da Equao
(4.76) nulo, de modo que a Equao (4.82) se torna exata.
Exemplo 4.26 Considerando o modelo definido como:
y m = e x

Captulo 4: Estimao de Parmetros

234

e considerando que no h erros nas variveis independentes x, a funo de mxima


verossimilhana pode ser definida na forma
NE

FObj =

(y

e
i

e xi

yi2

i =1

O gradiente da funo objetivo fica ento na forma


FObj

NE

2 e xie
y e
2
i
i =1 yi

)(x ) e

xie

e
i

A matriz Hessiana H (que neste caso especifico tem dimenso 1x1) pode ento
ser calculada como

NE

2 e xie
xi e
2
i =1 yi

H =

) +(y
2

e
i

e xi

)( x ) e
e
i

xie

A matriz de covarincias dos parmetros definida na Equao (4.81):

V = 2H 1 =

1
NE

1 e xie
xi e
2
yi

i =1

) +(y
2

e
i

e xi

)( x ) e
2

e
i

xie

Utilizando agora a aproximao de Gauss, a matriz de covarincias dos


parmetros pode ser representada como mostrado na Equao (4.82):

1
y
T 1
V = B Vy B = 1

x
V = x1e( 1 )

x2e(

x2 )

y2

y21 0

2
y NE 0 y 2
L
M
M

0
0

y21 0

y22
( xNE ) 0
L xNE e
M
M

0
0

NE x e( xi )
i
V =
i =1
yi2

L
L
O
L

1
NE

i =1

2
yi

x1e( x1 )

( x )
x2 e 2

x e( xNE )
NE

0
L
O
M
2
L yNE
L

y1

1
0

y
0 2

M

M
2
yNE
yNE

( x e( ) )
xi

Captulo 4: Estimao de Parmetros

235

Pode ser observado que a diferena entre as matrizes de covarincias das


incertezas paramtricas obtidas com as Equaes (4.81) e (4.82) justamente o termo

que contm a soma dos resduos yie e xi . Segundo a aproximao de Gauss, baseada
e

nas hipteses do experimento bem feito e do modelo perfeito, esse termo tende a zero e
pode, assim, ser desprezado.

interessante observar como os desvios paramtricos esto correlacionados com


os desvios experimentais, na forma:

{(

)( )}

Covar ( , Y ) = E TY = E H 1 [G Y Y + G X X ] TY

Covar ( , Y ) = E H 1 G Y Y TY + G X X TY

Covar ( , Y ) = H 1 G Y E Y TY + G X E X TY
Covar ( , Y ) = H 1G Y Vy H 1G X Vxy

{(

(4.83a)

)( )}

Covar ( , X ) = E TX = E H 1 [G Y Y + G X X ] TX

Covar ( , Y ) = E H 1 G Y Y TX + G X X TX

Covar ( , Y ) = H G Y E Y TX + G X E X TX
Covar ( , Y ) = H 1G Y Vyx H 1G X Vx
1

(4.83b)

Quando os erros nas variveis independentes so pequenos e podem ser


desprezados, a Equao (4.83a) fica:

{(

)( )}

Covar ( , Y ) = E TY = E H 1G Y Y TY

Covar ( , Y ) = E H 1G Y Y TY

Covar ( , Y ) = H G Y E
1

T
Y Y

}
}

(4.83c)

Covar ( , Y ) = H 1G Y Vy
De forma semelhante, possvel mostrar que:
Covar ( Y , ) = Covar ( , Y ) = ( H 1GVy ) = Vy G T H 1
T

(4.84)

Estes resultados, mostram que os erros paramtricos e os erros experimentais


no so independentes. Essa noo de dependncia fundamental para correta
compreenso dos procedimentos de planejamento experimental e interpretao de
resultados. As distribuies de erros paramtricos dependem de forma complexa das
distribuies dos erros experimentais, de maneira que diferentes incertezas paramtricas
so obtidas para cada conjunto caracterstico de dados experimentais.

Captulo 4: Estimao de Parmetros

236

Exemplo 4.27 Na segunda parte do Exemplo 4.25 foram calculadas as matrizes H e


GY, admitindo-se que as variveis independentes no esto sujeitas a erros de medio.
Nesse caso, a covarincia entre os erros paramtricos e os erros experimentais podes ser
calculada como:

Covar(, Y ) = H 1 G Y Vy
As matrizes H e GY foram calculadas como

NE x e 2
NE x e
2 i 2 i

2
2

i =1 yi
i =1 yi

H =
NE

NE
xie
1

2 2 2 2

i =1
yi
i =1 yi

( )

( )

( )

x1e
2 2
y1
GY =
2 ( 1)
2
y1

( x )
2
e
2

y22

( 1)
2
y22

( x )
2

( 1)
2

e
NE

2
yNE

2
yNE

de maneira que a inversa da matriz Hessiana tem a forma:

H 1

NE 1
2
1
1
i
i =NE
=
xi
NE x 2 NE 1 NE x 2
2 i2 2 i2
2
i =1 i i =1 i i =1 i i =1 i

xi
2
i =1 i

NE
xi2

2
i =1 i

A matriz das covarincias experimentais foi definida como:


y21 0

0 y22
Vy =
M
M

0
0
Fazendo inicialmente o produto GYVY:

L
0
O
M

2
L yNE
L

NE

Captulo 4: Estimao de Parmetros

x1e
2 2
y1
G Y Vy =
2 ( 1)
2
y1

237

(x )
2

( 1)

e
2

2
y2

2
y2

( x )
2
e
NE

1) M
(

2 2
yNE 0
e
2

2 ( 1)

2
y2

M
0

0
L
O
M
2
L yNE

2
yNE

) 2(x )

2 x1e
G Y Vy =
2 ( 1)

2
y1

L 2 xNE

L 2 ( 1)

Covar(, Y ) =
NE
xi
e NE 1
x

2
2
1
i =1 i
i =1 i

NE
xi2
NE x 2 NE 1 NE x 2 e NE xi
x

+
i
i
2 2 2 1 2 2
i =1
i =1
i
i
i =1 i i =1 i i =1 i

xi
2
i =1
i =1 i

NE
NE
xi
xi2
e
L x NE 2 + 2
i =1 i
i =1 i
NE

e
x NE

2
i

NE

Resta ainda definir a matriz de covarincias das incertezas da predio do


modelo. Substituindo a matriz de sensitividades na Equao (4.68), a matriz de
covarincias das incertezas da predio pode ser definida como:

{
}
= E {B B

= E yy T = E ( B + )( B + )T
V
y
Y
Y

V
y

+ B TY + Y B T T + Y TY

(4.85)

= BV BT +BCovar ( , ) +Covar ( , ) B T +V
V
y

Y
Y
y
(Deve ser observado que, no caso da estimao simultnea das variveis independentes
xm, como no problema de reconciliao de dados, esses valores devem ser interpretados
como os demais parmetros estimados do problema e includos no vetor .)
Repare que a Equao (4.85) gera dois cenrios: interpretao das incertezas de
predio dos pontos experimentais usados para a estimao de parmetros e a
interpretao de incertezas de predio associadas a um novo ponto experimental. No
primeiro caso, a matriz de covarincias das incertezas da predio a Equao (4.85).
J no segundo caso, os desvios Y correspondem a desvios de condies que no foram
usadas para a estimao dos parmetros. Nesse caso, a correlao entre
e Y nula,
de forma que a matriz de covarincias dos erros de predio fica na forma mais simples:

= BV B T +V
V
y

(4.86)

A Equao (4.86) mostra que o erro de predio tem dois componentes. O


primeiro um componente relativo aos erros cometidos no passado (na forma dos erros
dos parmetros V, lembrando que a matriz de sensitividades na Equao (4.82) deve
ser calculada nas condies experimentais onde os experimentos j foram realizados). O
segundo um componente relativo aos erros futuros (na forma do erro de
experimentao Vy e na matriz de sensitividade B calculada, agora, nos pontos onde se

Captulo 4: Estimao de Parmetros

238

deseja calcular o erro de predio, onde ainda no foram necessariamente feitas


observaes experimentais). Essa equao mostra que nunca conseguimos nos livrar dos
erros cometidos no passado, j que eles se propagam indefinidamente para o futuro na
matriz V. Portanto, h que se ter sempre muito cuidado com os erros cometidos no
laboratrio para estimar parmetros, pois eles se propagaro indefinidamente para o
futuro, sempre que o modelo for usado para simulao, projeto, otimizao, etc. Esse
um aspecto operacional que no tem sido explorado suficientemente no ambiente da
pesquisa.
As expresses desenvolvidas acima para a definio das incertezas paramtricas
e de predio so fundamentais para a correta interpretao estatstica dos resultados,
como ser discutido na prxima seo. Alm disso, essas expresses so de fundamental
importncia para a perfeita compreenso dos procedimentos clssicos de planejamento
experimental, como discutido no Volume II dessa srie de publicaes.

4.7. Interpretao Estatstica dos Dados Estimados


Admite-se freqentemente que o procedimento de estimao de parmetros
termina aps a minimizao da funo objetivo. Como discutido nas sees anteriores,
essa presuno est equivocada. Terminado o procedimento de minimizao da funo
objetivo e de obteno dos parmetros do modelo, imperioso analisar a qualidade dos
resultados obtidos com as ferramentas estatsticas apropriadas. Algumas informaes
relevantes devem ser obtidas em relao qualidade do modelo e dos parmetros
estimados, para que seja possvel reavaliar a necessidade de modificar o modelo ou de
continuar o processo de experimentao e coleta dos dados experimentais.
4.7.1. A Qualidade do Ajuste Obtido
Uma das hipteses fundamentais usadas para formulao do procedimento de
estimao de parmetros a hiptese do modelo perfeito. A adequao dessa hiptese
pode ser checada atravs da comparao dos erros de modelagem obtidos com os
desvios experimentais admissveis. Se esses erros forem compatveis, no h como
rejeitar a hiptese do modelo perfeito; caso contrrio, h argumento suficiente para o
usurio continuar investindo no aperfeioamento da modelagem do sistema.
No caso da estimao de mnimos quadrados, as Equaes (4.11) e (4.12)
mostram que a varincia final dos desvios de predio dada por

y2 =

FObj
NE NP

(4.87)

onde NE-NP o nmero de graus de liberdade . Portanto, a varincia de predio do


modelo ( y2 ) pode ser comparada aos erros experimentais ( y2 ) com o teste F, descrito
na Seo 3.3. Se as duas varincias so semelhantes estatisticamente, o modelo deve ser
considerado satisfatrio e no h motivos aparentes para descartar o modelo (nem a
hiptese do modelo perfeito). Caso contrrio, dois cenrios so possveis:

Captulo 4: Estimao de Parmetros

239

a) y2 > y2 : o modelo no capaz de explicar os erros experimentais a contento, pois


os erros de predio so significativamente maiores que os erros experimentais.
Logo, esforos devem ser feitos para aperfeioar o modelo. No deve tambm ser
descartada a possibilidade dos erros experimentais estarem subestimados. Nesse
caso, tambm conveniente que o experimentador reavalie a preciso das medidas
feitas e das informaes usadas para fins de estimao de parmetros.
b) y2 < y2 : o modelo reproduz os dados experimentais muito melhor do que esperado.
Esse cenrio, ao contrrio do que muitos acreditam, TAMBM indica que h algo
errado, pois um modelo no pode levar a previses melhores do que os dados usados
para ger-lo. Portanto, bastante provvel que o modelo esteja super parametrizado,
indicando que o modelo talvez possa ser simplificado. (O uso de modelos super
parametrizados pode resultar em risco muito grande para o usurio, como ilustrado
na Figura 4.14 mostrada abaixo.) No deve tambm ser descartada a possibilidade
dos erros experimentais estarem superestimados. Como comentado anteriormente,
tambm conveniente que o experimentador reavalie a preciso das medidas feitas e
das informaes usadas para fins de estimao de parmetros.
A Figura 4.14 apresentada abaixo mostra dois resultados advindos da estimao
de parmetros. Os pontos e respectivas barras verticais representam os valores medidos
de uma certa varivel (y) e as respectivas incertezas, medida que uma outra varivel
(x) varia. A reta horizontal representa o resultado obtido com um modelo constante (a
hiptese de que y no depende de x), perfeitamente compatvel com os erros
experimentais. A curva que passa pelos pontos resultante de um modelo cbico de
interpolao. O leitor atento deve reparar que o modelo cbico NO deve ser
considerado melhor do que o modelo constante, porque no consegue explicar os erros
experimentais. Na verdade, as extrapolaes feitas com o modelo cbico podem ser
muito piores do que as extrapolaes feitas com o modelo constante, a despeito de o
modelo cbico passar por cima dos pontos. Diz-se que o modelo cbico est super
parametrizado e que est ajustando o rudo ou o erro experimental.
1,5

0,5
0

x
Figura 4.14 Esquema ilustrativo dos problemas da super parametrizao.
No caso das funes de mxima verossimilhana desenvolvidas a partir da
hiptese de normalidade dos erros experimentais, as funes objetivos resultantes, como
2
nas Equaes (4.41) e (4.43), tm interpretao de (ver Seo 3.2.2) com = NE.NY-

Captulo 4: Estimao de Parmetros

240

NP graus de liberdade. Nesse caso, se o modelo consegue representar a contento os


dados experimentais,
2
2
min
< FObj < max

(4.88)

Caso contrrio, como no pargrafo anterior, dois cenrios so possveis:


2
a) FObj > max
: o modelo no capaz de explicar os erros experimentais a contento,
pois os erros de predio so significativamente maiores que os erros experimentais.
Logo, esforos devem ser feitos para aperfeioar o modelo. No deve tambm ser
descartada a possibilidade dos erros experimentais estarem subestimados. Nesse
caso, tambm conveniente que o experimentador reavalie a preciso das medidas
feitas e das informaes usadas para fins de estimao de parmetros.
2
b) FObj < min
: o modelo reproduz os dados experimentais muito melhor do que
esperado. Esse cenrio, como j explicado, indica que h algo errado, pois um
modelo no pode levar a previses melhores do que os dados usados para ger-lo.
Portanto, bastante provvel que o modelo esteja super parametrizado, indicando
que o modelo talvez possa ser simplificado. No deve tambm ser descartada a
possibilidade dos erros experimentais estarem superestimados. Como j comentado,
conveniente que o experimentador reavalie a preciso das medidas feitas e das
informaes usadas para fins de estimao de parmetros.

Em ambos os casos discutidos, o leitor deve perceber a necessidade de avaliar os


erros experimentais de forma independente, para que seja possvel estabelecer uma
opinio sobre a qualidade do ajuste. Se os erros experimentais no so conhecidos,
comum admitir que y2 = y2 , o que carece de qualquer rigor estatstico formal, embora
muitos pacotes de simulao admitam como vlida essa hiptese. O usurio deve estar
atento para o uso dessa hiptese simplificadora e descartar o seu uso, sempre que
possvel. Deve-se inclusive ressaltar que esta definio do erro experimental no pode
ser feita para modelos com mltiplas respostas. Por isso, o experimentador deve estar
sempre preocupado com a caracterizao precisa dos erros experimentais caractersticos
do sistema em estudo, ao invs de deixar questo to importante como essa sem uma
avaliao formal.
Costuma-se ainda definir um coeficiente de correlao entre os valores
experimentais e calculados na forma
NE

=
m

( y

e
i

yie

i =1

)( y

m
i

yim

2 NE
2
NE e
e
m
m
y

y
i
i
yi yi
i =1
i =1

(4.89)

que indica quo proximamente os dados calculados acompanham os dados


experimentais. Usualmente, se o coeficiente de correlao superior a 0.9, o modelo
considerado satisfatrio, indicando que os valores preditos pelo modelo variam de
forma aproximadamente linear e proporcional com as medidas experimentais. Contudo,

Captulo 4: Estimao de Parmetros

241

importante que o usurio perceba que valores inferiores a 0.9 podem indicar tanto
desajuste do modelo (recomendando aperfeioamento da estrutura matemtica usada
para descrever os dados experimentais), quanto a existncia de erros experimentais
excessivos (recomendando o aperfeioamento das tcnicas experimentais).
(Recomenda-se que o leitor consulte a Seo 1.6 para observar que o coeficiente de
correlao no pode ser tomado como uma medida absoluta da qualidade do ajuste do
modelo.) A identificao do foco do problema pode ser feita com auxlio da funo
objetivo. Por exemplo, se a funo objetivo recomenda o uso do modelo
2
2
( min
< FObj < max
) e o coeficiente de correlao baixo (m < 0.9), o problema central
parece ser o excesso de erro de experimentao. Por outro lado, se a funo objetivo no
2
recomenda o uso do modelo ( FObj > max
) e o coeficiente de correlao baixo (m <
0.9), o problema central parece ser a m qualidade do modelo. Idealmente, um bom
2
2
modelo e um bom plano experimental vo levar simultaneamente a min
< FObj < max
e

m > 0.9.
importante que se perceba ainda que, uma vez obtidos os parmetros do
modelo, possvel montar uma tabela na forma da Tabela 4.1, onde so apresentados os
dados obtidos, que pode ser transformada na Tabela 4.2, onde so explicitados os
desvios experimentais.

...

...

...
...

e
1,1

e
1, NE

x1,1 = x x
e
1,1

x1, NE

m
1,1

...
= x1e, NE x1m, NE

Tabela 4.1 Dados experimentais e calculados com o modelo.


e
e
m
...
...
...
x NX
y1e,1
y NY
x1m,1
x NX
y1m,1
,1
,1
,1

...
...
...

e
NX , NE

...
y1e, NE

...
...

...

e
NY , NE

m
1, NE

...
...

m
NX , NE

Tabela 4.2 Desvios de modelagem.


e
m
x NX ,1 = x NX
y1,1 = y1e,1 y1m,1
,1 x NX ,1

...

x NX , NE = x

e
NX , NE

m
NX , NE

y1, NE

...
= y1e, NE y1m, NE

...
y1m, NE

...
...

m
y NY
,1

m
y NY
, NE

...

e
m
y NY ,1 = y NY
,1 y NY ,1

...
...

...
e
m
y NY , NE = y NY
, NE y NY , NE

Ora, se as hipteses do experimento bem feito e do modelo perfeito so boas, a Tabela


4.2 contm amostras dos erros experimentais para cada uma das variveis do problema.
Portanto, as tcnicas desenvolvidas no Captulo 3 podem ser usadas agora para
comparar essas amostras dos erros experimentais com os resultados independentes
obtidos no laboratrio a partir de rplicas, durante a fase de caracterizao dos erros
experimentais. Por exemplo, se os erros experimentais so normalmente distribudos,
cada uma das colunas da Tabela 4.2 deve ter mdia zero (pode ser usado o teste t para
verificar a significncia dessa hiptese, como ilustrado no Exemplo 3.18) e varincia
compatvel com as varincias experimentais (pode ser usado o teste F para verificar a
significncia dessa hiptese, como ilustrado no Exemplo 3.18). Se as medidas forem
independentes, espera-se que as correlaes existentes entre as medidas das vrias
colunas sejam fracas e pouco significativas (pode ser usada a ferramenta estatstica
mostrada na Seo 3.4.4, para caracterizao da independncia das medidas).
Finalmente, espera-se ainda que os desvios sigam de forma aproximada a distribuio
de probabilidades postulada para os erros experimentais (podem ser usadas as
ferramentas estatsticas mostradas na Seo 3.4.3 e no Exemplo 3.20, para testes de
aleatoriedade). Portanto, a organizao dos dados na forma sugerida pelas Tabelas 4.1 e

Captulo 4: Estimao de Parmetros

242

4.2 permite a utilizao de um grande arsenal de tcnicas estatsticas para validao (ou
no) das hipteses utilizadas durante a construo do modelo e a aplicao do
procedimento de estimao de parmetros.

Probabilidade acumulada
observada

conveniente comparar graficamente as distribuies esperadas para os desvios


experimentais e as obtidas depois do procedimento de estimao de parmetros, como
discutido no Exemplo 3.20. Alguns padres tpicos so apresentados nas Figuras 4.15 a
4.17.
1
0,8
0,6
0,4
0,2
0
0

0,2

0,4

0,6

0,8

Probabilidade acumulada esperada

Probabilidade acumulada
observada

Figura 4.15 Padro de acmulo de erros esperado para um bom modelo e boa
caracterizao de erros experimentais.
1
0,8
0,6
0,4
0,2
0
0

0,2

0,4

0,6

0,8

Probabilidade acumulada esperada

Figura 4.16 Padro de acmulo de erros esperado quando existem outliers.

Probabilidade acumulada
observada

Captulo 4: Estimao de Parmetros

243

1
0,8
0,6
0,4
0,2
0
0

0,2

0,4

0,6

0,8

Probabilidade acumulada esperada

Figura 4.17 Padro de acmulo de erros esperado quando o modelo ruim ou existe
m compreenso sobre a distribuio e natureza dos erros experimentais.
4.7.2. A Qualidade dos Parmetros Obtidos
Para que a qualidade dos parmetros obtidos possa ser avaliada, fundamental
calcular a matriz de covarincias dos parmetros V, como nas Equaes (4.28),
(4.53), (4.74) e (4.82). Deve ser observado que solues analticas podem ser obtidas
somente para modelos lineares. Na grande maioria das vezes os modelos so no
lineares nos parmetros e a matriz de incertezas paramtricas tem que ser construda
numericamente, atravs de aproximaes (por exemplo, a aproximao de Gauss), como
mostrado na seo anterior.
Com a matriz de covarincias dos parmetros possvel obter vrias
informaes relevantes sobre o problema analisado:
a) Definio dos intervalos de confiana dos parmetros
Admitindo-se a distribuio normal e conhecendo-se as incertezas paramtricas,
possvel construir os intervalos de confiana dos parmetros como no Exemplo 3.2 do
Captulo 3. Nesse caso,

i u i < i < i + u i

(4.90a)

onde o valor de u depende do nvel de confiana requerido, i o valor estimado para o


parmetro e i o desvio padro associado estimativa do parmetro. No entanto, a
definio dos intervalos de confiana para os parmetros do modelo um tema
polmico. Alguns textos sugerem o uso da distribuio t de Student para a definio do
intervalo de confiana na forma:

i t i < i < i + t i

(4.90b)

onde t obtido com o nmero de graus de liberdade da estimao e com o grau de


confiana arbitrado pelo usurio. Quando o nmero de graus de liberdade elevado
(digamos, superior a 20), a Equao (4.90b) essencialmente igual Equao (4.90a).
Para nmeros de graus de liberdade inferiores a 20, a Equao (4.90b) leva a resultados

Captulo 4: Estimao de Parmetros

244

mais conservativos (intervalos de confiana mais largos). Para modelos lineares e sem
erro na varivel independente x, possvel associar a estimao de parmetros feita por
mnimos quadrados com uma operao de mdia amostral, que pode justificar o uso da
distribuio t de Student na Equao (4.90b). Mas esse universo de condies
extremamente restritivo, de maneira que o intervalo de confiana dos parmetros
deveria ser construdo com ferramentas numricas mais poderosas, como as
apresentadas no Captulo 5. Por isso, alguns textos sugerem simplesmente que o
intervalo de confiana do parmetro seja construdo na forma:

i c i < i < i + c i

(4.90c)

onde c um nmero real positivo maior do que o valor sugerido pela curva normal para
um determinado nvel de confiana. Pelas razes apontadas, sugere-se que o usurio
sempre defina de forma clara a forma com que se est calculando o intervalo de
confiana dos parmetros.
b) Grau de significncia do parmetro
O grau de significncia normalmente calculado em relao referncia zero,
em que o efeito paramtrico do modelo desaparece. De forma simples, o grau de
significncia pode ser obtido a partir da Equao (4.90a-c), variando-se o grau de
confiana at que o intervalo de confiana do parmetro inclua o zero. Se o grau de
confiana necessrio para incluir o zero inferior ao grau de confiana estabelecido
pelo usurio, diz-se que o parmetro no significativo. Nesse caso, h argumentos
estatsticos suficientes para remover o parmetro (e o respectivo efeito) do modelo
matemtico. Caso contrrio, diz-se que o parmetro significativo h razes
estatsticas para manter o parmetro (e o respectivo efeito) no modelo.
c) Correlao paramtrica
De forma anloga da Equao (1.50) da Seo 1.6, define-se o coeficiente de
correlao paramtrica na forma:

ij =

ij2
i j

(4.91)

Quanto mais prximos de zero estiverem os coeficientes de correlao


paramtrica, mais eficientes sero os procedimentos de estimao dos parmetros e mais
precisa ser a identificao dos diferentes efeitos no modelo. Quando a correlao
paramtrica supera em mdulo o valor de 0.9, conveniente que o usurio reflita sobre
a verdadeira necessidade de introduzir esses parmetros no modelo, dado que pequenas
mudanas no valor de um dos parmetros podem ser compensadas com mudanas de
um segundo parmetro que est a ele relacionado. Dessa maneira, a correlao
paramtrica indica que flutuaes de alguns parmetros podem ser acomodadas por
variaes de outros parmetros, de forma que talvez seja possvel reduzir o nmero de
parmetros do modelo. Por exemplo, o modelo apresentado na Equao (4.92a), muito
utilizado para a descrio de modelos cinticos, sugere a existncia de 3 parmetros: K1,
K2 e K3. No entanto, a Equao (4.92b) mostra que h apenas dois parmetros no
modelo: (K1 / K2) e (K3 / K2). Portanto, a forma da Equao (4.92a) est errada, sob o

Captulo 4: Estimao de Parmetros

245

ponto de vista de estimao de parmetros, dado que no possvel separar os efeitos


paramtricos uns dos outros. Repare ainda que a definio dos parmetros no nica,
dado que qualquer um dos parmetros poderia ser utilizado no denominador. Esse o
clssico exemplo de correlao paramtrica induzida pela formulao matemtica do
modelo.

y=

K1 x
K2 + K3 x

(4.92a)

K1

K x
A1 x
2
y=
=
x 1 + A2 x
1 + K 3

K
2

(4.92b)

Correlaes paramtricas elevadas s vezes so tambm geradas por


planejamento experimental ineficiente, como ilustrado a seguir e discutido no Volume II
dessa srie de publicaes. Por exemplo, suponha que um modelo pode ser escrito na
forma

y = 1 x1 + 2 x 2 + 3

(4.93a)

No h nada de errado com a formulao do modelo apresentado na Equao (4.93). No


entanto, suponha ainda que os dados experimentais so tais que x1e = x 2e . Nesse caso,
quando o modelo aplicado malha experimental, conclui-se que

y = 1 x 1e + 2 x e2 + 3 = ( 1 + 2 ) x1e + 3 = A1 x1e + 3

(4.93b)

Portanto, apesar do modelo estar definido corretamente, parece claro que no possvel
separa os efeitos de x1 e x 2 na malha experimental proposta (ou seja, no possvel
estimar 1 e 2 independentemente).
Para piorar, mesmo que no haja problemas nem com a formulao do modelo
nem com a proposio da malha experimental, possvel que efeitos numricos causem
o aparecimento de correlaes paramtricas e de problemas para a estimao
independente dos parmetros. Por exemplo, considere a Equao (4.92b). Suponha que
A2 muito grande. Nesse caso, a Equao (4.92b) ganha a forma:

y=

A K
A1 x
1 = 1
1 + A2 x A2 K 3

(4.92c)

de maneira que apenas um parmetro est efetivamente presente no modelo. Suponha


agora que A2 muito pequeno. Nesse caso,

y=

K
A1 x
A1 x = 1
1 + A2 x
K2

(4.92d)

Captulo 4: Estimao de Parmetros

246

e, uma vez mais, apenas um parmetro est efetivamente presente no modelo. Esse tipo
de correlao paramtrica muito difcil de avaliar a priori, porque depende da
magnitude relativa dos parmetros. Na grande maioria das vezes, e em particular
quando o modelo no linear e contm muitos parmetros, o usurio no conhece a
magnitude relativa dos efeitos, de forma que no possvel eliminar esses efeitos antes
de realizar a estimao. Isso torna o cmputo das correlaes paramtricas fundamental
para a correta avaliao da qualidade final dos resultados obtidos.
importante ressaltar que correlaes paramtricas elevadas s vezes no tm
como ser evitadas, por resultarem da estrutura intrnseca do modelo matemtico, o que
comum em modelos no lineares, como o modelo de Arrhenius (veja o Exemplo 4.10).
Contudo, correlaes elevadas sempre indicam problemas de estimao, que devem ser
evitados e compreendidos. Uma das conseqncias prticas da existncia de correlaes
paramtricas o mau condicionamento da matriz H; ou seja, em outras palavras, a
matriz Hessiana usada amplamente nas sees anteriores pode ser no inversvel (ou
difcil de inverter numericamente). Obviamente, isso pode prejudicar toda a anlise
numrica proposta nas sees anteriores, j que a inversa de H usada em vrios
procedimentos. (Isso indica que a invertibilidade da matriz Hessiana pode ser usada
como ferramenta para identificao da existncia de correlaes paramtricas
inaceitveis no modelo.) Uma forma possvel de minimizar os efeitos associados a
correlaes paramtricas a reparametrizao do modelo, como ser discutido no
Captulo 5.
Exemplo 4.28 - Considere o modelo linear

y = 1 x1 +

x2 +

e a funo de mnimos quadrados


NE

FObj = y ie 1 x1e 2 x 2e 3

i =1

Nesse caso, a matriz Hessiana pode ser dada na forma da Equao (4.17) como:

NE e 2
2 x1,i
NEi =1
H = 2 x1e,i x 2e,i
i =1
NE

2 x1e,i
i =1

( )

NE

2 x1e,i x 2e,i
i =1
NE

( )

2 x 2e,i
i =1
NE

2 x 2e,i
i =1

NE

2 x1e,i
i =1

NE
2 x 2e,i

i =1

2 NE

Se ao longo dos experimentos os valores das variveis x1e,i e x 2e,i so iguais, ento as
linhas 1 e 2 da matriz Hessiana so iguais. Por conseguinte, a matriz Hessiana no
inversvel.

4.7.3. A Qualidade das Previses do Modelo

Captulo 4: Estimao de Parmetros

247

Para que a qualidade das previses feitas com o modelo seja avaliada,
necessrio calcular como os erros paramtricos se propagam atravs do modelo e viram
erros de predio. Para alguns casos simples, onde o modelo linear nos parmetros,
uma derivao terica pode ser obtida, como pode ser observado nas Equaes (4.31) e
(4.56). Contudo, como no caso das incertezas paramtricas, os erros de predio de
modelos no lineares tm que ser calculados com a ajuda de aproximaes, como a
obtida na Equao (4.86), ou de ferramentas numricas.
Por exemplo, considere o caso apresentado no Exemplo 4.19, que trata de uma
reta. Nesse caso, a varincia de predio pode ser escrita como

2 122 x
2
y2 = B T V B = [ x 1] 112
= 112 x 2 + 2 122 x + 22
2
1
12 22

(4.94)

que mostra que os erros de predio crescem na forma de uma parbola, medida que x
cresce em valor absoluto. A Equao (4.94) usada freqentemente para justificar a
frase de que a extrapolao menos precisa que a interpolao. Contudo, importante
enfatizar que a Equao (4.94) vlida unicamente para a reta e no deve ser usada
como argumento para outros modelos. Por exemplo, no caso do modelo na forma:
y = 1 e x

(4.95)

y2 = B T V B = [x e x ][ 2 ][x e x ] = 2 x 2 e 2 x

(4.96)

possvel escrever

que tende a zero quando x cresce indefinidamente; ou seja, as incertezas das


extrapolaes diminuem. Portanto, no possvel garantir que as incertezas de predio
crescem, quando nos afastamos da regio experimental, sem que se diga claramente o
modelo usado para fazer a extrapolao. O modelo da Equao (4.95) apresenta
comportamento inverso.
Expresses como a apresentada na Equao (4.85-86) permitem tambm definir
os intervalos de confiana de predio do modelo, de forma similar utilizada para
definio dos intervalos de confiana dos parmetros

yim u yi < yi < yim + u yi

(4.97)

Esses intervalos de confiana podem ser usados para detectar pontos


experimentais suspeitos, que no podem ser explicados pelo modelo. Como discutido na
Seo 3.3.4, o procedimento de deteco de outliers bastante controverso. Um ponto
experimental no deve ser descartado, a no ser que a repetio do experimento
confirme a existncia de um erro grosseiro ou que haja razes muito especficas para
condenar a observao experimental. Como j discutido, um ponto experimental que
no se adequa ao modelo pode ser uma grande oportunidade cientfica.

Captulo 4: Estimao de Parmetros

248

Os erros de predio podem ser tambm usados para definir a regio


experimental onde modelo e medida experimental so equivalentes do ponto de vista
estatstico, definindo assim a regio de utilidade do modelo. Isso pode ser feito
comparando-se o erro de predio, que uma funo do ponto experimental
considerado, com o erro experimental atravs do teste F. Sempre que os dois erros
puderem ser considerados equivalentes, o modelo pode ser considerado vlido e til
naquela regio.
Como feito anteriormente com os desvios observados entre as predies do
modelo e os dados experimentais, e ilustrado nas Figuras 4.15 a 4.17, tambm
conveniente comparar graficamente o desempenho dos modelos. Isso pode ser feito de
forma muito simples com o auxlio de grficos, como os ilustrados nas Figuras 4.18 a
4.21. Nesses grficos, os valores previstos pelo modelo e observados
experimentalmente so comparados visualmente, permitindo a obteno de informaes
valiosas a respeito da qualidade da estimao realizada. Nos grficos das Figuras 4.18 a
4.21, as barras verticais caracterizam os erros de predio do modelo, enquanto as
barras horizontais caracterizam os erros das medidas experimentais.

Valores Calculados

1
0,8
0,6
0,4
0,2
0
0

0,2

0,4

0,6

0,8

Valores Observados

Figura 4.18 Padro tpico de comparao entre os dados calculados pelo modelo e os
dados observados experimentalmente, quando o modelo bom e os experimentos so
bem feitos.

Valores Calculados

Captulo 4: Estimao de Parmetros

249

1
0,8
0,6
0,4
0,2
0
0

0,2

0,4

0,6

0,8

Valores Observados

Valores Calculados

Figura 4.19 Padro tpico de comparao entre os dados calculados pelo modelo e os
dados observados experimentalmente, quando h candidatos a outliers (o ponto isolado
que no pode ser explicado pelos erros de medida).

1
0,8
0,6
0,4
0,2
0
0

0,2

0,4

0,6

0,8

Valores Observados

Figura 4.20 Padro tpico de comparao entre os dados calculados pelo modelo e os
dados observados experimentalmente, quando o modelo ruim ou quando os desvios
experimentais esto subestimados.

Captulo 4: Estimao de Parmetros

250

Valores Calculados

1
0,8
0,6
0,4
0,2
0
0

0,2

0,4

0,6

0,8

Valores Observados

Figura 4.21 Padro tpico de comparao entre os dados calculados pelo modelo e os
dados observados experimentalmente, quando o modelo no apresenta desempenho
uniforme na regio de experimentao (erra mais para um lado do que para outro).
Exemplo 4.29 - Considere o seguinte conjunto de NE = 6 dados experimentais
xie

yie

(x )
e
i

0.1
2

yie xie

0
0

0.9

2.2

0.9

4.4

3.1
9

3.9
16

9.3

15.6

5
4.8
25
24

= 15

e
i

i =1
6

= 15

e
i

i =1
6

(x )

= 55

( y

e 2
i

i =1
6

e
i

i =1

xie = 54.2

aos quais se pretende ajustar uma reta atravs de procedimento padro de mnimos
quadrados. Nesse caso,
ym = x +
e o nmero de graus de liberdade = 4. Logo, de acordo com o Exemplo 4.20,

6 54.2 15 15
= 0.9542857413
6 55 15 15

15 0.9542857143 15
= 0.114285715
6

resultando no seguinte conjunto de predies feitas com o modelo

yim : 0.1142857; 1.0685714; 2.0228571; 2.9771429; 3.9314287; 4.8857143

Captulo 4: Estimao de Parmetros

251

Portanto, o erro mdio global de predio oriundo da estimao fica na forma


NE

y2 =

( y

e
i

yim

i =1

= 0.02085714281

y = y2 = 0.1444200222
enquanto o coeficiente de correlao do modelo fica na forma

m = 0.9974
que indica fortssima correlao entre os valores experimentais e calculados atravs do
modelo, indicativo tambm de excelente grau de ajuste.
Admitindo-se que o erro experimental y2 igual ao erro oriundo do processo de
estimao de parmetros y2

2 = 0.020855714281

6
= 0.00191836732
6 55 15 15

= 2 = 0.03452298846
2 = 0.020855714281

55
= 0.001546598622
6 55 15 15

= 2 = 0.1243623183
de maneira que com 95% de confiana, u = 1.96, resultando em

= 0.95 0.07

= 0.11 0.25
Portanto, o parmetro significativo, enquanto o parmetro no significativo.
Assim, h justificativas para que se tente uma modelagem do tipo y m = x .
A covarincia entre os parmetros e igual a
2

= 0.020855714281

( 15)
6 55 15 15

= 0.00297959183

resultando em um coeficiente de correlao paramtrica igual a

Captulo 4: Estimao de Parmetros

252

2

=
= 0.6940

indicando moderado grau de correlao entre os dois parmetros. O sinal negativo


indica que perturbaes positivas em um dos parmetros provocam perturbaes
negativas no outro e vice-versa.
O erro de predio exclusivo do modelo pode ser dado por

y2 = 0.00191836732 x 2 2 0.00297959183 + 0.01546598622


que se for somado ao erro experimental, tem a forma

y2 = 0.00191836732 x 2 2 0.00297959183 + 0.01546598622 + 0.02085714281


Aplicando-se o teste F para 4 graus de liberdade e grau de confiana de 95%,
chega-se a

F = 9.6045 >

y2
= 0.092 x 2 0.2857 x + 1.742
y2

de maneira que
0.092 x 2 0.2857 x 7.863 < 0
7.82 < x < 10.92
a regio de validade do modelo. Admitamos, por exemplo, que a realidade fosse y = x,
plausvel a partir da anlise dos dados experimentais. Neste caso, para x = 10, y = 10 e
y m = 9.654 , cujo desvio j de cerca de 2.5 vezes o valor de y .
A Figura 4.22 ilustra a qualidade do processo de estimao realizado

Captulo 4: Estimao de Parmetros

253

Figura 4.22 - Resultado do procedimento de estimao de parmetros do Exemplo 4.29.

4.8. Concluses
Foi definido nesse captulo o problema de estimao de parmetros. Um
procedimento foi construdo para inferir os valores de certas variveis (os parmetros)
que no podem ser medidas, mas sem as quais os modelos matemticos no tm
utilidade. O problema constitudo por trs etapas: uma etapa de formulao de uma
funo objetivo, uma etapa de minimizao da funo objetivo e uma etapa de
interpretao dos resultados finais. Para formulao da funo objetivo a ser
minimizada durante a segunda etapa do procedimento proposto, foi criada uma
metodologia de mxima verossimilhana. A metodologia prope que os erros de
modelagem sejam usados como amostras dos erros experimentais, o que est em
consonncia com as hipteses de existncia de um bom modelo e de bons dados
experimentais. Essas hipteses podem ser validadas (ou rejeitadas) a posteriori, depois
de obtidos os resultados da estimao.
Mostrou-se atravs de exemplos que o usurio no deve ter a expectativa de
gerar solues analticas para o problema de estimao de parmetros para problemas
genricos, o que justifica o desenvolvimento dos mtodos numricos a serem
apresentados no prximo captulo. Apesar disso, vrias expresses matemticas teis
foram derivadas, para permitir a interpretao matemtica (estatstica) dos resultados
obtidos, quando os erros experimentais no so muito grandes.

4.9. Leitura Adicional


A literatura dedicada apresentao do problema de estimao de parmetros
muito vasta. No cabe aqui, portanto, uma reviso dessa rea. O leitor interessado

Captulo 4: Estimao de Parmetros

254

encontrar centenas de livros que abordam esse tema em qualquer biblioteca dedicada
Matemtica e Engenharia. Alguns textos clssicos que tratam do assunto so
apresentados a seguir, para eventuais consultas e aprofundamento dos estudos.
Nonlinear Parameter Estimation, Y. Bard, Academic Press Inc, San Diego, 1974.
Nonlinear Regression Analysis and Its Applications, D. M. Bates e D. G. Watts, John
Wiley & Sons, New York, 1988.
Applied Nonlinear Regression, N. R. Draper e H. Smith, John Wiley & Sons, New
York, 1998.
Applied Parameter Estimation for Chemical Engineers, P. Englezos e N.
Kalogerakis, Marcel Dekker Inc, New York, 2001.

4.10. Exerccios Sugeridos


1- Os seguintes dados esto disponveis:
NE
1
2
3
4
5
6
7
8
9
10

x
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
1.00

y
0.38
0.91
1.69
2.13
2.66
2.61
3.65
3.94
4.28
5.24

Admitindo-se que o modelo y = a x vlido, onde a o parmetro a ser determinado,


estime o melhor valor de a e a respectiva incerteza paramtrica nos trs casos abaixo:
10

a) Fa = ( yie yic ) ;
2

i =1
10

b) Fb = ( yie yic ) ;
8

i =1

ye yc
c) Fc = i e i ;
yi
i = 1
d) Compare os valores obtidos.
10

2- Supondo que os erros de uma certa medida so independentes e sigam a


distribuio exponencial, definida como:

Captulo 4: Estimao de Parmetros

P ( i ) =

255


1
exp i
2 i
i

< i <

onde i so os desvios ou erros experimentais e i o desvio padro, defina a


funo objetivo a ser usada em um procedimento de estimao de parmetros que
utiliza estes dados.
3- Determine as expresses para os parmetros A e B do modelo linear:
y = Ax + B
para as seguintes funes objetivos.
NE

a) F = ( yie yim )

i =1

NE

b) F =

(y

e
i

i =1

yim )

i2

NE NE

c) F = ( yie yim )( y ej y mj ) vij , onde vij


1

o elemento ij da inversa da

i =1 j =1

matriz Vy de erros experimentais.


d) Em seguida, usando os dados abaixo, calcule os valores dos parmetros, a matriz
de covarincia dos parmetros e o erro de predio para cada funo objetivo.
i
1
2
3

xie
1
2
3
1.0 0.5 0.1
V = 0.5 1.0 0.5
0.1 0.5 10.0

yie
2
3
7

Das könnte Ihnen auch gefallen