Sie sind auf Seite 1von 27

Verossimilhana e

Mxima Verossimilhana
1
JOO LUS F. BATISTA
2
Maio - 2009
1 Introduo
Tradicionalmente a inferncia estatstica sobre a mdia de uma populao se apoia
no Teorema Central do Limite para construir Intervalos de Conana ou testar hi-
pteses sobre o valor do parmetro. Esta abordagemda estatstica tradicional pode
ser extendida para inferncias a respeito de qualquer parmetro, no s a mdia.
Da mesma forma que no caso da mdia populacional se usa a distribuio t de
Student ou a distribuio Normal Padronizada, no caso de outros parmetros se
utiliza outras distribuies amostrais. Essas distribuies so chamadas amos-
trais porque representam o comportamento das estimativas baseado na repetio
incontvel do processo de amostragem.
Na prtica cientca, no entanto, sempre se realiza uma nica amostragem, o
que resulta em uma nica amostra. Assim, o conceito de distribuio amostral
at certo ponto articial, pois em pesquisa cientca no raciocinamos em ter-
mos de repeties incontveis de experimentos ou processos de observao. O
resultado disto que o conceito de teste estatstico de hiptese e de intervalo de
1
Material de estudo que acompanha aula sobre o tema
2
Centro de Mtodos Quantitativos (http://cmq.esalq.usp.br/), Departamento de Cincias Flo-
restais, Escola Superior de Agricultura Luiz de Queiroz, Universidade de So Paulo, Campus
Piracicaba.
Verossimilhana e
Mxima Verossimilhana
conana so frequentemente mal compreendidos.
O desenvolvimento da inferncia estatstica a partir do conceito de verossimi-
lhana tem sido utilizado como uma alternativa abordagem estatstica frequen-
tista e, segundo alguns autores (como por exemplo Royall, 1997), mais coerente
com a prtica cientca.
2 Lei da Verossimilhana
Considere uma varivel aleatria X, cujo comportamento pode ser explicado por
duas hipteses (hipteses A e B) que se deseja comparar. Foi realizado um estudo
e se obteve uma observao de X, cujo valor foi x.
O que as hiptese dizem a respeito dessa observao?
A hiptese A implica que X = x seria observado com probabilidade p
A
(x),
enquanto
A hiptese B implica que X = x seria observado com probabilidade p
B
(x).
No processo de investigao cientca, no entanto, o que interessa a per-
gunta: O que a observao de X = x diz a respeito das hipteses A e B? A
Lei da Verossimilhana arma que a observao X = x uma evidncia que
favorece a hiptese A sobre a hiptese B se e somente se
p
A
(x) > p
B
(x).
Mais ainda, a Lei da Verossimilhana implica que a Razo de Verossimilhana
p
A
(x)
p
B
(x)
mede a fora de evidncia em favor da hiptese A sobre a hiptese B.
2.1 Exemplo de Regenerao Natural
Deseja-se saber o nmero mdio de plntulas numa parcela de regenerao em
oresta nativa. Para isso se utilizou uma parcela circular de 3 mde raio (28.3 m
2
).
H duas hipteses competindo:
Hiptese A: o nmero mdio de plntulas na parcela 16 (5700 ind/ha);
Joo Lus F. Batista 2
Verossimilhana e
Mxima Verossimilhana
Hiptese B: o nmero mdio de plntulas na parcela 35 (12500 ind/ha);
Foi medida uma parcela de regenerao e observou-se 24 plntulas (8470 ind/ha).
Neste exemplo, a varivel aleatria X o nmero de plntulas por parcela e
a observao tomada foi de X = 24. Faz-se necessrio um modelo (distribuio
estatstica) para se calcular as probabilidades de se observar X = 24 sob as duas
hipteses. Como se trata de dados de contagem, a distribuio Poisson uma can-
didata natural. Se a varivel aleatria X tem distribuio Poisson, sua funo
de densidade
P(X = x) =
e

x
x!
onde (o parmetro) o nmero mdio de plntulas.
Portanto as probabilidades de acordo com as hipteses so:
Hiptese A: = 16
p
A
(24) =
e
16
16
24
24!
= 0.01437018
Hiptese B: = 35
p
B
(24) =
e
35
35
24
24!
= 0.01160434
Logo, a observao X = 24 favorece a hiptese A ( = 16) sobre a hiptese B
( = 35). A fora de evidncia em favor de A sobre B :
p
A
(24)
p
B
(24)
=
0.01437018
0.01160434
= 1.238345.
Ou seja, pode se dizer que a observao X = 24 evidncia que a hiptese A
aproximadamente 1.3 vzes mais verossmil que a hiptese B.
2.2 Funo de Verossimilhana
Existe uma diferena sutil entre probabilidade e verossimilhana. Note que para
se comparar as hipteses no exemplo acima utilizou-se a funo de densidade da
distribuio Poisson:
P(X = x) =
e

x
x!
Joo Lus F. Batista 3
Verossimilhana e
Mxima Verossimilhana
onde x o valor de uma observao da varivel aleatria Poisson X e o seu
parmetro. Ao se utilizar essa funo a observao X = x (X = 24) foi dada e,
portanto, o valor de x conhecido e xo. A funo portanto caria:
P(X = 24) =
e

24
24!
Note que essa expresso no mais uma funo do valor da observao x, mas
uma funo do valor do parmetro , que varia da hiptese A para hiptese B.
Quando numa funo de densidade, a observao xa e o parmetro varivel
no se tem mais uma funo de densidade e sim uma funo de verossimilhana.
A funo de verossimilhana indica a verossimilhana de uma dada hiptese, por
exemplo hiptese A ( = 16), dado que se obteve uma observao X = x (X =
24). Para tornar mais claro este conceito se utiliza uma notao diferente para a
funo de verossimilhana:
L{ hiptese | dados } ou L{A|X = x} ou (ainda mais curto) L{|X}
No exemplo acima, a expresso matemtica est condicionada observao
X = 24 sendo, portanto, a prpria funo de verossimilhana:
L{|X = 24} =
e

24
24!
.
A gura 1 apresenta o grco dessa funo para valores de entre 10 e 50.
importante notar que o valor da observao obtida inuencia fortemente
o comportamento da funo de verossimilhana, o que pode ser observado na
gura 2.
2.3 Mltiplas Observaes
Nos exemplos apresentados at agora, tinha-se uma nica observao (X = x),
o que uma situao bastante peculiar pois quando fazemos um estudo tomamos
uma srie de observaes para compor uma amostra.
Em geral, a amostra composta de observaes independentes. Assumindo-se
como verdadeira uma certa hiptese A, a probabilidade de se opter uma amostra
X
n
(X
n
= {x
1
, x
2
, . . . , x
n
}), composta de n observaes independentes de X
(x
1
, x
2
, . . . , x
n
), :
P(X
n
|A) = P(X = x
1
|A) P(X = x
2
|A) . . . P(X = x
n
|A)
Joo Lus F. Batista 4
Verossimilhana e
Mxima Verossimilhana
10 20 30 40 50
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a
Figura 1: Funo de verossimilhana da distribuio Poisson, quando se obtem
uma observao X = 24.
0 20 40 60 80 100
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
0
.
1
2

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a
X=10
X=24
X=40
X=60
Figura 2: Funes de verossimilhana da distribuio Poisson para diferentes va-
lores observados de X.
Joo Lus F. Batista 5
Verossimilhana e
Mxima Verossimilhana
Ou seja, a probabilidade de se obter a amostra, dado a hiptese A, igual ao
produto das probabilidades das observaes individuais, dado a hiptese A.
Este mesmo princpio se aplica verossimilhana. A funo de verossimi-
lhana de uma amostra composta de observaes independentes ser o produto
das funes de verossimilhana das observaes individuais:
L{A|X
n
} = L{A|X = x
1
} L{A|X = x
2
} . . . L{A|X = x
n
}
L{A|X
n
} =
n

i=1
L{A|X = x
i
}
2.3.1 Exemplo da Regenerao Natural Revisitado
Considere um exemplo mais realista de um levantamento de regenerao natural
onde a amostrada foi composta de 10 parcelas, onde se realizou a contagem do
nmero de plntulas. Os resultados so apresentados na tabela 1.
Note que a amostra com 10 parcelas continua a indicar a hiptese A ( = 16)
como mais verossmil, mas com uma margem bem menor. Outro fato que chama
ateno que a verossimilhana da amostra umnmero muito pequeno da ordem
Tabela 1: Nmeros de plntulas observados em 10 parcelas de regenerao natu-
ral, seguidos dos valores de verossimilhana calculados segundo a distribuio de
Poisson.
PARCELA NO. DE PLNTULAS VEROSSIMILHANA
(i) (X = x
i
) ( = 16) ( = 35)
1 24 0.0144 0.0116
2 27 0.0034 0.0283
3 23 0.0216 0.0080
4 28 0.0019 0.0354
5 26 0.0057 0.0219
6 24 0.0144 0.0116
7 17 0.0934 0.0003
8 23 0.0216 0.0080
9 24 0.0144 0.0116
10 27 0.0034 0.0283

10
i=1
2.2574 10
22
2.2500 10
22
Joo Lus F. Batista 6
Verossimilhana e
Mxima Verossimilhana
de 10
22
. Como a verossimilhana da amostra o produto da verossimilhana das
observaes, ela rapidamente se aproxima do zero quando o tamanho da amostra
cresce.
2.4 Log-Verossimilhana Negativa
Para tornar mais fcil a manipulao matemtica da verossimilhana se utiliza
a funo de log-verossimilhana negativa, que consistem aplicar a funo loga-
ritmo, geralmente logaritmo natural ou neperiano, e transformar o sinal:
L{|X} = log [ L{|X} ] .
Como o valor numrico da verossimilhana geralmente (mas no necessaria-
mente) menor que um, o logaritmo desse valor negativo. Assim a transformao
do sinal realizada para que a log-verossimilhana negativa seja um valor posi-
tivo, o que geralmente (mas no necessariamente) ocorre. Assim, se o valor da
verossimilhana de uma amostra com muitas observaes um nmero positivo
muito pequeno, o valor da log-verossimilhana negativa ser um nmero positivo
numa escala mais fcil de trabalhar.
Por outro lado, o fato da transformao incluir uma mudana de sinal im-
plica que o comportamento da funo de log-verossimilhana negativa oposto
ao comportamento da funo de verossimilhana. Isso signica que a hiptese
com maior verossimilhana ter menor log-verossimilhana negativa.
A transformao logartmica tambm auxilia muito a tratabilidade matem-
tica da funo de verossimilhana, pois ela faz com que a log-verossimilhana
negativa de uma amostra seja o somatrio das log-verossimilhanas negativas das
observaes independentes individuais:
L{|X
n
} = log [ L{|X
n
} ]
= log
_
n

i=1
L{|X = x
i
}
_
=
n

i=1
log [ L{|X = x
i
} ]
L{|X
n
} =
n

i=1
L{|X
i
}
Joo Lus F. Batista 7
Verossimilhana e
Mxima Verossimilhana
2.4.1 Exemplo da Regenerao Natural Revisitado Novamente
A aplicao da log-verossimilhana negativa no exemplo regenerao natural
apresentada na tabela 2. Os valores de log-verossimilhana negativa para amostra
esto agora numa escala bem mais fcil de trabalhar. Por outro lado, a hiptese
mais provvel ( = 16) apresenta agora a menor log-verossimilhana negativa.
Para clculo da verossimilhana de uma amostra no necessrio calcular
a verossimilhana para cada observao para depois obter o valor para amostra.
Com um pouco de tratamento algbrico pode se obter a expresso da funo de ve-
rossimilhana para a amostra, mas a expresso da funo de log-verossimilhana
negativa sempre mais conveniente.
No caso da distribuio Poisson, a expresso da verossimilhana da amostra
de tamanho n :
L{|X
n
} =
n

i=1
e

x
i
x
i
!
. = e

i=1

x
i
x
i
!
.
Nessa expresso, o clculo da verossimilhana para cada valor do parmetro ()
envolver necessariamente clculos com cada observao individual (x
i
).
Tabela 2: Nmeros de plntulas observados em 10 parcelas de regenerao natu-
ral, seguidos dos valores de log-verossimilhana negativa calculados segundo a
distribuio de Poisson.
PARCELA NO. DE PLNTULAS LOG-VEROSSIMILHANA NEG.
(i) (X = x
i
) ( = 16) ( = 35)
1 24 4.2426 4.4564
2 27 5.6976 3.5631
3 23 3.8371 4.8337
4 28 6.2573 3.3400
5 26 5.1744 3.8227
6 24 4.2426 4.4564
7 17 2.3711 8.0642
8 23 3.8371 4.8337
9 24 4.2426 4.4564
10 27 5.6976 3.5631

10
i=1
49.8427 49.8459
Joo Lus F. Batista 8
Verossimilhana e
Mxima Verossimilhana
Atransformao gera a seguinte funo log-verossimilhana negativa para dis-
tribuio Poisson:
L{|X
n
} = n log()
n

i=1
x
i
+
n

i=1
log(x
i
!)
Nessa expresso os dois somatrios envolvem exclusivamente os valores das ob-
servaes, sendo, portanto, constantes para uma determinada amostra. Assim, o
clculo da log-verossimilhana se torna bem mais simples na seguinte forma:
L{|X
n
} = n log() k
1
+ k
2
onde k
1
=

n
i=1
x
i
e k
2
=

n
i=1
log(x
i
!).
A gura 3 ilustra o comportamento da funo de verossimilhana e da funo
de log-verossimilhana negativa do modelo Poisson com os dados de regenerao
natural.
3 Mtodo da Mxima Verossimilhana
O mtodo da Mxima Verossimilhana consiste em estimar os parmetros de
um modelo utilizando as estimativas que tornam mximo o valor da funo de
verossimilhana. Isso equivalente a encontrar o valor para o parmetro que torna
mnima a funo de log-verossimilhana negativa. Olhando o grco da funo
da verossimilhana ou da log-verossimilhana negativa (gura 4) ca claro onde
esse ponto se encontra.
Utilizando o clculo diferencial, podemos encontrar o ponto de mnimo de
uma funo igualando a zero a primeira derivada da funo e solucionando a ex-
presso. No caso da distribuio Poisson, a funo log-verossimilhana negativa
:
L{|X
n
} = n log()
n

i=1
x
i
+
n

i=1
log(x
i
!).
Encontrando a primeira derivada de L{|X
n
} e igualando a zero temos:
dL{|X
n
}
d
= n

n
i=1
x
i

= 0 =

n
i=1
x
i
n
Joo Lus F. Batista 9
Verossimilhana e
Mxima Verossimilhana
15 20 25 30 35 40
0
.
0
e
+
0
0
5
.
0
e

1
4
1
.
0
e

1
3
1
.
5
e

1
3

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a
15 20 25 30 35 40
3
0
4
0
5
0
6
0
7
0

L
o
g

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

N
e
g
a
t
i
v
a
Figura 3: Funo de verossimilhana e de log-verossimilhana nega-
tiva da distribuio Poisson para uma amostra de tamanho 10: X =
{24, 27, 23, 28, 26, 24, 17, 23, 24, 27}.
Joo Lus F. Batista 10
Verossimilhana e
Mxima Verossimilhana
15 20 25 30 35 40
0
.
0
e
+
0
0
5
.
0
e

1
4
1
.
0
e

1
3
1
.
5
e

1
3

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

^
15 20 25 30 35 40
3
0
4
0
5
0
6
0
7
0

L
o
g

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

N
e
g
a
t
i
v
a

^
Figura 4: Funo de verossimilhana e log-verossimilhana negativa
da distribuio Poisson para uma amostra de tamanho 10: X =
{24, 27, 23, 28, 26, 24, 17, 23, 24, 27}. A linha vertical indica a possio da es-
timativa de mxima verossimilhana.
Joo Lus F. Batista 11
Verossimilhana e
Mxima Verossimilhana
Portanto, a estimativa de mxima verossimilhana do parmetro da distri-
buio de Poisson nada mais que a mdia amostral. Assim no exemplo de rege-
nerao de plntulas temos como estimativa de mxima verossimilhana:
=
24 + 27 + 23 + 28 + 26 + 24 + 17 + 23 + 24 + 27
10
= 24.3
3.1 Propriedades das Estimativas de Mxima Verossimilhana
O mtodo da mxima verossimilhana um mtodo estabelecido de estimao
de parmetros de modelos estatstico, sendo utilizado por estatsticos tericos e
prticos de todas as tribos. O uso generalizado do mtodo se deve s propriedades
probabilsticas das estimativas produzidas por ele.
As estimativas de mxima verossimilhana so chamadas em ingls de maxi-
mumlikelihood estimates, sendo portanto designadas pela sigla MLE. Assumindo-
se que a funo de verossimilhana satisfaz algumas propriedades matemticas
bsicas, que so frequentemente alcanadas pelos modelos utilizados em Ecolo-
gia, as MLE tem as seguintes propriedades:
Consistncia: as MLE so consistentes, i.e., elas convergem em probabilidade
para o valor do parmetro. Ou seja, para grandes amostras (n ) as
MLE, para efeitos prticos, so no-viciadas (no enviesadas).
Ecincia Assinttica: OTeorema do Limite Inferior de Cramer-Rao arma que,
para um dado parmetro qualquer, existe um limite inferior para a varin-
cia das estimativas no-viciadas. Para grandes amostras, as MLE atingem
esse limite e, portanto, tm a menor varincia possvel dentre as estimativas
no-viciadas.
Normalidade Assimpttica: As MLE convergem em distribuio para distribui-
o Gaussiana. Para grandes amostras, os MLE tem distribuia aproxima-
damente gaussiana.
Invarincia: as MLE so invariantes sob transformaes monotnicas. Por exem-
plo, seja uma MLE que pode ser transformada para:

1
= log( ),

2
=

3
= e

,
ento as estimativas

1
,

2
e

3
tambm so MLE.
Joo Lus F. Batista 12
Verossimilhana e
Mxima Verossimilhana
Uma aspecto muito importante que deve ser frisado que as trs primeiras
propriedades so vlidas para grandes amostras.
4 Intervalo de Verossimilhana
O intervalo de verossimilhana corresponde a um intervalo ao redor da MLE,
onde a razo das verossimilhanas dos valores dentro do intervalo para a verossi-
milhana da MLE no ultrapassa um certo limite. A gura 5 mostra um intervalo
de verossimilhana para o exemplo da regenerao natural onde o limite 8. Ou
seja, dentro deste intervalo, a razo de verossimilhana denida como:
L{ |X
10
}
L{|X
10
}
8 = L{|X
10
}
L{ |X
10
}
8
onde
X
10
se refe a amostra com 10 parcelas (unidades amostrais),
a MLE, e
o parmetro variando dentro do intervalo.
Como na prtica trabalhamos com a funo de log-verossimilhana negativa,
o intervalo de verossimilhana tambm pode ser construido na forma de um in-
tervalo de log-verossimilhana negativa, com interpretao anloga. Para isso
necessrio aplicar a transformao razo de verossimilhana:
log
_
L{ |X
10
}
L{|X
10
}
_
log(8) = L{ |X
10
} L{|X
10
} log(8)
= L{|X
10
} L{ |X
10
} + log(8)
Em termos de log-verossimilhana negativa a razo de 8, se torna uma diferena
de log(8).
Analisando a curva de verossimilhana ou log-verossimilhana negativa verica-
se que ela ligeiramente assimtrica em relao MLE, por isso, o intervalo de
verossimilhana tambm ligeiramente assimtrico. Portanto, o intervalo de ve-
rossimilhana determinado pela forma da curva de verossimilhana, ao contrrio
do intervalo de conana na estatstica frequentista que simtrico por denio.
Joo Lus F. Batista 13
Verossimilhana e
Mxima Verossimilhana
20 22 24 26 28 30
0
.
0
e
+
0
0
5
.
0
e

1
4
1
.
0
e

1
3
1
.
5
e

1
3

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

^
20 22 24 26 28 30
3
0
3
1
3
2
3
3
3
4
3
5
3
6
3
7

L
o
g

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

N
e
g
a
t
i
v
a

^
Figura 5: Funo de verossimilhana e log-verossimilhana negativa
da distribuio Poisson para uma amostra de tamanho 10: X =
{24, 27, 23, 28, 26, 24, 17, 23, 24, 27}. A linha vertical indica a possio da MLE.
A linha horizontal indica um intervalo de verossimilhana para uma razo de 8.
Joo Lus F. Batista 14
Verossimilhana e
Mxima Verossimilhana
O intervalo de verossimilhana tambm redene a forma de apressentao da
curva de verossimilhana. Como o valor da verossimilhana, ou da log-verossimi-
lhana negativa, no pode ser interpretado de forma direta e absoluta, faz sentido
apresentar as curvas sempre em termos relativos mxima verossimilhana.
A gura 6 apresenta os mesmos grcos da gura 5, mas com a escala relativa.
Na escala relativa, a forma da curva no se altera, mas a visualizao do intervalo
ca mais fcil. No grco da razo de verossimilhana, o intervalo de verossi-
milhana para a razo R = 8, ser sempre denido por uma linha horizontal na
altura 1/R = 1/8. No grco da diferena de log-verossimilhana negativa, o
intervalo de verossimilhana para a razo R = 8, ser sempre denido por uma
linha horizontal na altura log(R) = log(8) = 2, 0794.
4.1 Exemplo da Distribuio Binomial em Eventos Raros
Num levantamento orestal foram selecionadas aleatoriamente 100 rvores para
vericar a proporo de rvores doentes. Entretanto, nenhuma delas apresentou a
doena em questo.
Utilizando-se a abordagem tradicional a estimativa da probabilidade de ocor-
rncia e sua varincia so:
p =
0
100
= 0 s
2
p
=
p(1 p)
n
=
0(1 0)
100
= 0
Logo no possvel acessar a qualidade da estimativa p = 0.
Utilizando a curva de verossimilhana no h problema, pois esta curva dada
por
L{p} =
_
n
0
_
p
0
(1 p)
n
= (1 p)
n
A gura 7 apresenta esta curva para diferentes tamanhos de amostra. Nota-se que,
independentemente do valor estimado ( p = 0), o intervalo de verossimilhana
pode ser facilmente denido. A gura tambm deixa claro o forte efeito do tama-
nho da amostra sobre a amplitude do intervalo.
Como o tamanho da amostra efetivamente tomada em campo foi n = 100,
vericamos na gura 7 que o intervalo de verossimilhana para a razo de 8
[0.00, 0.02]. Os dados indicam que, se a doena procurada ocorre de fato na o-
resta, a proporo de rvores doentes no mximo 2%.
Joo Lus F. Batista 15
Verossimilhana e
Mxima Verossimilhana
20 22 24 26 28 30
0.0
0.2
0.4
0.6
0.8
1.0

R
a
z
a
o

d
e

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

^
20 22 24 26 28 30
0
1
2
3
4
5
6

D
i
f
e
r
e
n
c
a

L
o
g

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

N
e
g
a
t
i
v
a

^
Figura 6: Curva relativa da verossimilhana e da log-verossimilhana negativa da
distribuio Poisson para uma amostra de tamanho 10.
Joo Lus F. Batista 16
Verossimilhana e
Mxima Verossimilhana
0.00 0.02 0.04 0.06 0.08 0.10
0.0
0.2
0.4
0.6
0.8
1.0
p
V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

R
e
l
a
t
i
v
a
n=1000
n=100
n=50
Figura 7: Curva de verossimilhana para o modelo binomial, tomando 0 sucessos
observados numa amostra de tamanho n. A linha horizontal representa a frao
1/8.
5 Superfcies e Curvas de Verossimilhana
O exemplo que vem sendo apresentado utiliza a distribuio de Poisson, que pos-
sui apenas um parmetro (). No caso das distribuies estatsticas com dois ou
mais parmetros, a curva de verossimilhana se transforma numa superfcie de
verossimilhana.
A gura 8 ilustra como a superfcie de log-verosimilhana negativa relativa
para diversas amostras de uma distribuio Gaussiana (Normal). A distribuio
Gaussiana possui dois parmetros: mdia () e desvio padro (), de forma que
apresentao foi feita na forma de um grco de contorno, onde as linhas repre-
sentam isolinhas de log-verossimilhana negativa.
Tratando-se de dois parmetros, no se tem mais um intervalo de verossimi-
lhana, mas uma regio de verossimilhana. Na gura 8, esta regio delimitada
por uma linha mais espessa correspondente isolinha para log-verorssimilhana
negativa relativa igual a log(8). A gura tambm mostra o efeito do tamanho da
amostra sobre o tamanho da regio de verossimilhana: medida que o tama-
Joo Lus F. Batista 17
Verossimilhana e
Mxima Verossimilhana
nho da amostra aumenta o tamanho da regio diminui, indicando o aumento da
preciso das MLE.
8
9
10
11
12
n = 50

8
9
10
11
12
n = 100

8
9
10
11
12
n = 500

8
9
10
11
12
n = 1000

Figura 8: Grco de contorno com isolinhas da log-verossimilhana negativa rela-


tiva para amostras de diferentes tamanhos (n) da distribuio Gaussiana (Normal)
com = 25 e = 10. As linhas pontilhadas indicam os valores das MLE:
e . A isolinha mais espessa indica log-verossimilhana negativa relativa igual a
log(8).
Joo Lus F. Batista 18
Verossimilhana e
Mxima Verossimilhana
5.1 De Superfcie para Curvas
Frequentemente quando se trabalha com modelos de variveis aleatrias que pos-
suem vrios parmetros, apenas um ou alguns deles so de interesse, sendo que
os demais no so considerados na anlise, mas fazem parte do modelo. Por
exemplo, a distribuio Gaussiana frequentemente utilizada para se interpretar
o comportamento da mdia (), independentemente do comportamento do des-
vio padro (). Os parmetros necessrios ao modelo, mas sem interesse para
interpretao, so parmetros inconvenientes (nuisance parameters). Na sua pre-
sena, no conveniente se analisar as regies de verossimilhana, pois a falta
de interpretao para os parmetros inconvenientes s faz aumentar a complexi-
dade da interpretao da regio de verossimilhana. Assim, se faz necessrio uma
forma de analisar os parmetros de interesse sem a interferncia dos parmetros
inconvenientes.
Mesmo quando o nmero de parmetros de interesse maior do que dois,
a interpretao grca da regio de verossimilhana extremamente complexa.
Logo necessrio uma forma conveniente de se estudar o comportamento das
MLE dos parmetros em modelos com muitos parmetros.
A forma de realizar esse estudo substituir a anlise da supefcie de verossi-
milhana de um modelo pela anlise de uma srie de curvas de verossimilhana,
cada uma relativa a um parmetro de interesse no modelo.
5.2 Verossimilhana Estimada
A Verossimilhana Estimada uma tcnica se constroe uma curva de verossi-
milhana para cada parmetro de interesse, mantendo os demais parmetros (de
interesse ou inconvenientes) num valor constante. O melhor valor para manter
demais parmetros a a estimativa de mxima verossimilhana deles.
No exemplo da distribuio Gaussiana, a curva de verossimilhana estimada
para mdia obtida como
L
E
{} = L{, }
onde a MLE do desvio padro.
A gura 9 apresenta as curvas de verossimilhana estimada para o exemplo
da distribuio Gaussiana, utilizando os mesmos dados apresentados na gura 8.
Para facilitar a visualizao, a curva apresentada em funo da diferena ,
pois as amostras geraram estimativas ligeiramente distintas. O grco mostra
o efeito do tamanho da amostra aumentando a curvatura da superfcie de veros-
similhana e, consequentemente, reduzindo o tamanho do intervalo de verossimi-
Joo Lus F. Batista 19
Verossimilhana e
Mxima Verossimilhana
2 1 0 1 2
0.0
0.5
1.0
1.5
2.0
2.5
3.0

^
L
o
g

V
e
r
o
s
s
i
m
i
l
h
a
n
c
a

N
e
g
a
t
i
v
a

R
e
l
a
t
i
v
a
log(8)
n = 50
n = 100
n = 500
n = 1000
Figura 9: Log-verossimilhana negativa relativa estimada para amostras de dife-
rentes tamanhos (n) da distribuio Gaussiana com = 25 e = 10. As curvas
foram traadas para diferentes valores de , mantendo o valor do desvio padro
() xo no valor da sua MLE ( ).
lhana da MLE da mdia.
5.3 Verossimilhana Perlhada
Outra forma de construir curvas de verossimilhana a Verossimilhana Per-
lhada. Essa tcnica consiste em variar o parmetro de interesse e, para cada
valor dele, encontar as MLE dos demais parmetros do modelo substituindo-os
na funo de verossimilhana para calcular a verossimilhana ponto-a-ponto do
parmetro de interesse.
Tomando o exemplo da distribuio Gaussiana, a curva de log-verossimilhana
negativa perlhada para mdia construda tornando a MLE do desvio padro (ou
da varincia), para cada valor da mdia:
L
P
{} = L{,
2
=

2
} =
n
2
ln(2) +
n
2
ln(

2
) +
1
2

2
n

i=1
(y
i
)
2
Joo Lus F. Batista 20
Verossimilhana e
Mxima Verossimilhana
Mas a MLE da varincia uma funo da prpria mdia:

2
=
1
n
n

i=1
(y
i
)
2
Inserindo essa expresso na funo de log-verossimilhana negativa se obtem a
verossimilhana perlhada da mdia:
L
P
{} =
n
2
ln(2) +
n
2
ln
_
1
n
n

i=1
(y
i
)
2
_
+
n
2
.
A gura 10 apresenta uma comparao da verossimilhana perlhada e esti-
mada. Ambas tm o mesmo ponto de mnimo (ponto da MLE), e na vizinhana
desse ponto as curvas so coincidentes. Entretanto, medida que se afasta do
ponto de mnimo a curva da verossimilhana perlada mais aberta, o que indica
um maior grau de incerteza sobre a estimativa da mdia. A verossimilhana per-
lada mais coerente e realista, uma vez que para cada valor de no grco, ela
busca o MLE da varincia assumindo aquele valor de mdia.
6 O Critrio de Akaike na Comparao de Modelos
A utilizao da razo da verossimilhana no considera que dois modelos sendo
comparados podem diferir bastante no nmero de parmetros ajustados. Geral-
mente, espera-se que um modelo com mais parmetros tenda a apresentar um
ajuste melhor que um com menos parmetros, pois os parmetros so os elemen-
tos que nos permitem explicar o comportamento dos dados. Pelo Princpio da
Parsimnia, ou Princpio de Okham, entre dois modelos com igual poder expli-
cativo opta-se pelo modelo mais simples, o que geralmente entendido como o
modelo com o menor nmero de parmetros.
Um critrio baseado da log-verossimilhana negativa que considera o nmero
de parmetros o Critrio de Informao de Akaike (AIC), que penaliza a log-
verossimilhana negativa com duas vzes o nmero de parmetros:
AIC = 2 ln [L{}] + 2p = 2L{} + 2p (1)
No caso da distribuio Gaussiana o AIC pode ser detalhado como:
AIC = 2L{ , } + 2p
Joo Lus F. Batista 21
Verossimilhana e
Mxima Verossimilhana
20 22 24 26 28 30
2
0
0
2
5
0
3
0
0
3
5
0
4
0
0
4
5
0

L
o
g

V
e
r
o
s
s
i
m
i
l
h
a
n

a

N
e
g
a
t
i
v
a
Figura 10: Funo de log-verossimilhana negativa perlada (em azul) e log-
verossimilhana negativa estimada (em vermelho) para a mdia de uma distribui-
o Gaussiana, applicada a dados do DAP mdio por parcela em oresta nativa do
Maranho.
= 2
_
n
2
ln 2 + nln +
1
2
2
n

i=1
(x
i

)
2
_
+ 2p
= 2
_
_
n
2
ln 2 + nln
_
_

n
i=1
(x
i
)
2
n
_
_
+
1
2

n
i=1
(x
i
)
2
n

i=1
(x
i
)
2
_
_
+ 2p
Simplicando-se a expresso:
AIC = nln(2) + nln
_
n

i=1
(x
i
)
2
_
+ 2p
No modelo Gaussiano, o AIC obtido a partir da soma dos desvios quadrticos
das observaes em relao mdia estimada (soma de quadrados do resduo).
Joo Lus F. Batista 22
Verossimilhana e
Mxima Verossimilhana
Anexo
MLE para alguns Modelos
A sigla MLE pode designar estimativas ou estimadores. Entende-se por esti-
mativa o valor numrico atribuido a um parmetro na situao particular de um
certo conjunto de dados. Entende-se por estimador a expresso ou processo ma-
temtico que permite encontrar a estimativa nos casos particulares. A expresso
as MLE se refe s estimativas, a expresso os MLE se refere aos estimadores.
Nessa seco so apresentados os MLE para alguns modelos de distribuio
aleatria.
A Distribuio Gaussiana (Distribuio Normal)
Assumindo que um conjunto de variveis aleatrias X
1
, X
2
, . . . , X
n
so indepen-
dentes e identicamente distribuidas seguindo a distribuio Normal com mdia e
varincia
2
(X
i
N(,
2
), i = 1, . . . , n), a densidade conjunta destas vari-
veis igual ao produto das densidades marginais. A funo de verossimilhana,
para uma amostra observada X
i
= x
i
, se torna:
L{, } =
n

i=1
1

2
exp
_

1
2
_
x
i

_
2
_
L{, } = (2)
n/2

n
exp
_

1
2
2
n

i=1
(x
i
)
2
_
A funo de log-verossimilhana negativa de forma mais simples:
L{, } =
n
2
ln 2 + nln +
1
2
2
n

i=1
(x
i
)
2
Igualando as derivadas parciais a zero e solucionando para os parmetros de inte-
resse, obtem-se:
L{, }

=
1

2
n

i=1
(x
i
) = 0 = =

n
i=1
x
i
n
L{, }

=
n

3
n

i=1
(x
i
)
2
= 0 = =

_
1
n
n

i=1
(x
i
)
2
Joo Lus F. Batista 23
Verossimilhana e
Mxima Verossimilhana
O MLE para o desvio padro ligeiramente diferente do estimador convenci-
onal. O estimador convencional no-viciada, mas o MLE consistente, isto ,
no-viciado para grandes amostras.
B Distribuio Weibull - 2 Parmetros
Dado um conjunto de variveis aleatrias X
1
, X
2
, . . . , X
n
, independentes e iden-
ticamente distribuidas de acordo com a distribuio Weibull, com parmetro de
escala e parmetro de forma , (X
i
Weibull(, ), i = 1, . . . , n), a den-
sidade conjunta destas variveis igual a produto das densidades marginais. A
funo de verossimilhana, para uma amostra observada X
i
= x
i
, se torna:
L{, } =
n

i=1

x
1
i
exp
_

i
_
=
_

_
n
_
n

i=1
x
1
i
_
exp
_

i=1
x

i
_
A funo de log-verossimilhana negativa assume a forma:
L{, } = nln
_

_
n ln() + ( 1)
n

i=1
ln(x
i
)
1

i=1
x

i
A derivada parcial em relao ao parmetro de escala ca:
L{, }

_
n +
1

i=1
x

i
_
= 0

n
i=1
x

i
n
resultando num estimador de mxima verossimilhana que dependente do par-
metro de forma:

=
_

n
i=1
x

i
n
_
1/
A derivada parcial em relao ao parmetro de forma ca:
L{, }

=
n

nln() +
n

i=1
ln(x
i
)
1

i=1
x

i
ln() = 0
Joo Lus F. Batista 24
Verossimilhana e
Mxima Verossimilhana
Tomando o valor de

est expresso simplicada para:


n

+
n

i=1
ln(x
i
)

n
i=1
x

n
i=1
x

i
= 0
a qual no pode ser simplicada mais. Assim, a MLE para o parmetro da forma
( ) obtido solucionando a expresso acima por mtodos iterativos. Uma vez que
encontrado, a estimativa do parmetro de escala obtida diretamente.
C Distribuio Weibull - 3 Parmetros
Tomando-se novamente um conjunto de variveis aleatrias X
1
, X
2
, . . . , X
n
, in-
dependentes e identicamente distribuidas de acordo com a distribuio Weibull,
mas agora com trs parmetros: parmetro de locao , parmetro de escala
e parmetro de forma . (X
i
Weibull(, , ), i = 1, . . . , n). Novamente, a
densidade conjunta destas variveis igual a produto das densidades marginais,
logo a funo de verossimilhana, para uma amostra observada X
i
= x
i
, se torna:
L{, , } =
n

i=1

(x
i
)
1
exp
_

(x
i
)

_
=
_

_
n
_
n

i=1
(x
i
)
1
_
exp
_

i=1
(x
i
)

_
A funo de log-verossimilhana negativa assume a forma:
L{, } = nln
_

_
n ln() + ( 1)
n

i=1
ln(x
i
)
1

i=1
(x
i
)

A derivada parcial em relao ao parmetro de escala ca:


L{, , }

_
n +
1

i=1
(x
i
)

_
= 0

n
i=1
(x
i
)

n
resultando num estimador de mxima verossimilhana que dependente do par-
metro de forma:

=
_

n
i=1
(x
i
)

n
_
1/
(2)
Joo Lus F. Batista 25
Verossimilhana e
Mxima Verossimilhana
A derivada parcial em relao ao parmetro de forma ca:
L{, , }

=
n

nln() +
n

i=1
ln(x
i
)
1

i=1
(x
i
)

ln() = 0
Tomando o valor de

est expresso simplicada para:


n

+
n

i=1
ln(x
i
)

n
i=1
(x
i
)

n
i=1
(x
i
)

= 0 (3)
a qual no pode ser simplicada mais.
Em relao ao parmetro de locao, a derivada parcial ca:
L{, , }

= ( 1)
n

i=1
1
x
i

i=1
(x
i
)
1
= 0
Substituindo-se o valor de

em (2), obtemos:
n

n
i=1
(x
i
)
( 1)
n

i=1
1
x
i

= 0
( 1)
_
n

i=1
(x
i
)
_ _
n

i=1
1
x
i

_
+ n = 0
_
n

i=1
x
i
n
_ _
n

i=1
1
x
i

n
1
= 0
n(x )
n

i=1
1
x
i


n
1
= 0
(x )
n

i=1
1
x
i



1
= 0 (4)
onde x a mdia da amostra.
Todas as expresses so dependentes do parmetro de locao () e do par-
metro de forma (). Para se obter as MLE torna-se necessrio utilizar um processo
iterativo envolvendo essas expresses:
1. Inicia-se o processo com um valor arbitrrio de , (
0
) e encontra-se o
valor inicial para (
1
) fazendo a expresso (3) convergir por um processo
iterativo.
2. Utilizando-se
1
, obtem-se o valor incial de (
1
), fazendo a expresso (4)
convergir por um processo iterativo.
Joo Lus F. Batista 26
Verossimilhana e
Mxima Verossimilhana
3. Repete-se os passos 1 e 2 acima, at que os valores obtidos para e
deixem de sofrer alteraes marcantes. Os valores nais
n
e
n
so as
MLE ( , ).
4. Utilizando e , obtem-se

solucionando-se a expresso (2).
Joo Lus F. Batista 27

Das könnte Ihnen auch gefallen