Sie sind auf Seite 1von 50

CAPTULO 7 - TESTES DE HIPTESES

CAPTULO 7 TESTES DE HIPTESES


Alm dos mtodos de estimao de parmetros e de construo de intervalos de
confiana, os testes de hipteses so procedimentos usuais da inferncia estatstica,
teis na tomada de decises que concernem forma, ou ao valor de um certo
parmetro, de uma distribuio de probabilidades, da qual se conhece apenas
uma amostra de observaes. Tais testes envolvem a formulao de uma hiptese,
na forma de uma declarao conjectural sobre o comportamento probabilstico
da populao. Essa hiptese pode se materializar, por exemplo, em uma premissa,
formulada a priori, a respeito de um certo parmetro populacional de uma varivel
aleatria. No rejeitar ou rejeitar uma tal hiptese ir depender do confronto
entre a conjectura e a realidade fsica, essa concretizada pelas observaes que
compem a amostra. A rejeio da hiptese implica na necessidade de eventual
reviso da conjectura inicial, em decorrncia de seu desacordo com a realidade
imposta pelos dados amostrais. Por outro lado, a no rejeio da hiptese significa
que, com base nos dados amostrais, no h elementos suficientes para descartar
a plausibilidade da premissa inicial sobre o comportamento da varivel aleatria;
observe que no rejeitar no significa aceitar a hiptese.
Por tratar-se de uma inferncia a respeito de uma varivel aleatria, a deciso de
no rejeitar (ou de rejeitar) uma hiptese, tomada com base em uma certa
probabilidade ou nvel de significncia . Pode-se, por exemplo, no rejeitar a
hiptese de que houve um decrscimo significativo da vazo mdia dos ltimos
trinta anos, em uma certa seo fluvial. Contrariamente, a eventual variao da
vazo mdia do perodo, pode ser uma mera decorrncia das flutuaes amostrais,
sem conseqncias para a mdia populacional em questo; nesse caso, a variao
dita no significativa. A especificao prvia de um nvel de significncia ,
cumpre o papel de remover o grau de subjetividade associado tomada de
deciso intrnseca a um teste de hiptese. De fato, para um mesmo nvel de
significncia, dois analistas diferentes, ao realizarem o teste de uma certa hiptese,
sob condies idnticas, tomariam uma nica e igual deciso. O nvel de significncia
 de um teste de hiptese complementar probabilidade (1- ) com que um
certo intervalo de confiana [I, S] contm o valor populacional de um parmetro
. De fato, o intervalo [I, S] estabelece os limites de variao da chamada
estatstica de teste, dentro dos quais a hiptese sobre  no pode ser rejeitada.
Contrariamente, se os valores da estatstica de teste localizarem-se fora dos limites
impostos por [I, S], a hiptese sobre  deve ser rejeitada, a um nvel de significncia
. Portanto, segundo essa interpretao, a construo de intervalos de confiana
representa a operao inversa de testar uma certa hiptese sobre um parmetro
populacional .
HIDROLOGIA ESTATSTICA

245

CAPTULO 7 - TESTES DE HIPTESES

Em essncia, testar uma hiptese recolher evidncias nos dados amostrais, que
justifiquem a rejeio ou a no rejeio de uma certa afirmao (i) sobre um
parmetro populacional ou (ii) sobre a forma de um modelo distributivo, tendo-se
em conta as probabilidades de serem tomadas decises incorretas. Os testes de
hipteses podem ser classificados em paramtricos ou no paramtricos. Eles
so ditos paramtricos se os dados amostrais, por premissa, tiverem sido extrados
de uma populao Normal ou de qualquer outra populao, cujo modelo
distributivo conhecido ou previamente especificado. Ao contrrio, os testes no
paramtricos no necessitam da especificao prvia do modelo distributivo da
populao, da qual foram extrados os dados amostrais. De fato, em geral, os
testes no paramtricos no so formulados com base nas observaes amostrais,
propriamente ditas, e, sim, em algumas de suas caractersticas ou atributos, tais
como, ordens de classificao ou nmero de diferenas positivas ou negativas
entre dados. Do ponto de vista da hiptese a ser testada, os testes mais freqentes
so aqueles que se referem a afirmaes sobre um parmetro populacional. Quando
a hiptese, a ser testada, diz respeito forma do modelo distributivo da populao
de onde a amostra foi extrada, os testes so denominados de aderncia.
No presente captulo, abordaremos, nos itens iniciais, as linhas gerais, segundo as
quais os testes de hipteses so construdos. Em seguida, ilustraremos esses
procedimentos gerais, com a formulao dos testes de hipteses paramtricos
mais conhecidos, para populaes normais. Na seqncia, descreveremos a lgica
inerente aos testes no paramtricos, concentrando-nos naqueles de maior
aplicao s variveis hidrolgicas. Nos itens finais, abordaremos os testes de
aderncia, enfatizando os testes do Qui-Quadrado, de Kolmogorov-Smirnov, de
Anderson-Darling e de Filliben, bem como o teste de Grubbs e Beck, para a
deteco de pontos amostrais atpicos, os quais so de grande utilidade na anlise
de freqncia de variveis hidrolgicas.

7.1 Os Elementos de um Teste de Hiptese


Os procedimentos gerais para a realizao de um teste de hiptese so:
Formule a hiptese a ser testada, denotando-a por H0 e denominandoa hiptese nula. Essa pode ser, por exemplo, a declarao conjectural de que no
houve, nos ltimos trinta anos, uma alterao da vazo mdia anual 1, de uma
certa seo fluvial, quando comparada mdia 0, do perodo anterior. Se a
hiptese nula verdadeira, qualquer diferena entre as mdias populacionais 1 e
0 devida meramente a flutuaes das amostras extradas de uma nica
populao. A hiptese nula expressa por H0: 1- 0= 0.
246

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

Formule a hiptese alternativa e denote-a por H1. De acordo com o


exemplo da etapa anterior, a hiptese alternativa, e contrria a H0, expressa por
H1: 1- 0 $ 0.
Especifique uma estatstica de teste T, que esteja em acordo com as
hipteses nula e alternativa, anteriormente formuladas. No exemplo em foco, a
estatstica de teste deve ter como base a diferena T = X 1 X 0 , entre as mdias
observadas nos perodos correspondentes s mdias populacionais a serem
testadas.
Especifique a distribuio de amostragem da estatstica de teste, de acordo
com a hiptese nula, bem como com a distribuio de probabilidades da populao
de onde as observaes foram extradas. No exemplo em foco, caso as vazes
mdias anuais tenham sido extradas de uma populao Normal, sabe-se que
possvel deduzir a distribuio de amostragem da estatstica de teste T.
Especifique a regio de rejeio R, ou regio crtica R, para a estatstica
de teste. A especificao da regio crtica depende da definio prvia do nvel de
significncia , o qual, conforme meno anterior, cumpre o papel de remover o
grau de subjetividade associado tomada de deciso. No exemplo em foco, o
nvel de significncia 100 poderia ser arbitrado, por exemplo, em 5 %, o que
resultaria na fixao dos limites [T0,025, T0,975], respectivamente abaixo e acima
dos quais inicia-se a regio de rejeio R.
Verifique se a estatstica de teste T , estimada a partir das observaes
amostrais, est dentro ou fora dos limites estabelecidos para a regio de rejeio
R. No exemplo, se T < T0,025, ou se T > T0,975, a hiptese nula H0 deve ser
rejeitada; nesse caso, interpreta-se que a diferena 1-0 significativa, a um
nvel = 0,05. Caso contrrio, se T estiver dentro dos limites [T0,025, T0,975], a
deciso a de no rejeitar a hiptese H0, implicando que no h diferena
significativa entre as mdias populacionais 1 e 0.
Nos procedimentos gerais, anteriormente delineados, o exemplo citado refere-se
diferenas positivas ou negativas entre 1 e 0, o que implica que a regio crtica
R estende-se pelas duas caudas da distribuio de amostragem da estatstica de
teste T. Nesse caso, diz-se que o teste bilateral. Se a hiptese nula tivesse sido
formulada de modo diferente, tal como H0: 1 >0 ou H0: 1 <0, o teste seria
unilateral porque a regio crtica se estenderia por apenas uma das caudas da
distribuio de amostragem da estatstica de teste.
Depreende-se, dos procedimentos gerais, que h uma relao estreita entre os
testes de hipteses e a construo de intervalos de confiana. Para melhor
esclarecer esse fato, considere a hiptese nula H0: =0, a respeito da mdia de
uma populao Normal de varincia conhecida e igual a 2. Sob essas circunstncias,
sabe-se que, para uma amostra de tamanho N, a estatstica de teste
HIDROLOGIA ESTATSTICA

247

CAPTULO 7 - TESTES DE HIPTESES

T = ( X 0)

N e que a distribuio de probabilidades dessa estatstica de

teste a Normal padro. Nesse caso, se fixarmos o nvel de significncia em


= 0,05, o teste bilateral estaria definido para a regio crtica abaixo de
T 2 0 ,025 z 0 ,025 1,96 e acima de T1  2 0 ,975 z 0 ,975 1,96 . Se, a esse
nvel de significncia, H0 no foi rejeitada, verifica-se que tal deciso teve como
argumento os fatos que T >T0,025 ou T < T0,975, os quais so equivalentes a
X > 0 1,96 N
ou X   0  1,96  N . Manipulando essas
desigualdades,

possvel
coloc-las
sob
a
forma
X  1,96  N   0  X  1,96  N , a qual a expresso do intervalo a
100 (1-) = 95% de confiana para a mdia 0. Por meio desse exemplo, verificase a estreita ligao, no sentido matemtico, entre a construo de intervalos de
confiana e os testes de hipteses. A despeito dessa ligao, entretanto, as duas
tcnicas servem a propsitos diferentes: enquanto o intervalo de confiana
estabelece o quo acurado o conhecimento de , o teste de hiptese indica se
plausvel assumir o valor 0 para .
De acordo com o exposto, a rejeio da hiptese nula acontece quando a estimativa
da estatstica de teste encontrar-se dentro da regio crtica. A deciso de rejeitar a
hiptese nula o mesmo que declarar que a estatstica de teste estatisticamente
significativa. Em outros termos, no contexto de H0: =0 e de  = 0,05, se as
diferenas observadas ocorrem, de modo aleatrio, em menos de 5 de 100 testes
idnticos, ento, os resultados so considerados estatisticamente significativos e a
hiptese nula deve ser rejeitada. Por outro lado, a falta de evidncias empricas para
rejeitar a hiptese nula, no implica na imediata aceitao de H0 e, sim, em sua eventual
reformulao, seguida de verificaes suplementares.
Supondo que a hiptese nula , de fato, verdadeira, a probabilidade de que H0
seja rejeitada dada por
T % R H 0 verdadeira  T % R H 0  

(7.1)

evidente que se uma hiptese verdadeira rejeitada, tomou-se uma deciso


incorreta. O erro decorrente dessa deciso denominado erro do tipo I. Da
equao 7.1, resulta que a probabilidade de ocorrer o erro do tipo I expressa
por
Erro do Tipo I  T % R H 0  

(7.2)

Na ausncia de erro, ou seja, se uma hiptese verdadeira H0 no rejeitada, a


probabilidade dessa deciso complementar probabilidade do erro do tipo I.
Em termos formais,
248

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

T & R H 0  1  

(7.3)

Contrariamente, no rejeitar a hiptese nula quando ela , de fato, falsa, outra


possvel deciso incorreta. O erro decorrente dessa deciso denominado erro
do tipo II. A probabilidade de ocorrer o erro do tipo II expressa por

Erro do Tipo II  T & R H 1  

(7.4)

Na ausncia de erro, ou seja, se uma hiptese falsa H0 rejeitada, a probabilidade


dessa deciso complementar probabilidade do erro do tipo II. Em termos
formais,
T % R H 1  1  

(7.5)

A probabilidade complementar a , expressa pela equao 7.5, denominada


poder do teste e, como se ver mais adiante, um importante critrio de
comparao entre diferentes testes de hipteses.
Os erros dos tipos I e II esto fortemente relacionados. Para demonstrar essa
relao, considere que a Figura 7.1 ilustra um teste unilateral de uma hiptese nula
H0: =0 contra a hiptese alternativa H1: = 1, onde  representa a mdia de
uma populao Normal e 1 >0.

Figura 7.1 Ilustrao dos erros dos tipos I e II em um teste de hiptese unilateral

Se a estatstica de teste T superior ao valor Tcrtico, a hiptese nula rejeitada, a


um nvel de significncia . Nesse caso, supondo que H0 verdadeira, a deciso
de rejeit-la incorreta e a probabilidade de se cometer esse erro .
Contrariamente, se a estatstica de teste T inferior ao valor Tcrtico, a hiptese
HIDROLOGIA ESTATSTICA

249

CAPTULO 7 - TESTES DE HIPTESES

nula no rejeitada, a um nvel de significncia . Nesse outro caso e supondo


que, desta feita, H1 verdadeira, a deciso de no rejeitar a hiptese falsa H0
tambm incorreta e a probabilidade de se cometer esse erro . Pela ilustrao
da Figura 7.1, evidente que a diminuio de  ir levar o valor de Tcrtico mais
para a direita, causando um aumento de . Conclui-se, portanto, que diminuir a
probabilidade de se cometer um erro do tipo I provoca o aumento da probabilidade
de se cometer o erro do tipo II. A situao inversa igualmente verdadeira.
bvio que, ao realizar um teste de hiptese, no se quer tomar uma deciso
incorreta e que, portanto, a situao desejvel a de minimizar as probabilidades
de se cometer erros de ambos os tipos. Entretanto, em funo da dependncia
entre  e , ilustrada pela Figura 7.1, bem como das diferentes caractersticas
dos erros dos tipos I e II, forosa uma soluo de compromisso no planejamento
das regras de deciso de um teste de hipteses. Em geral, essa soluo de
compromisso passa pela prescrio prvia de um determinado nvel de significncia
, tal que ele seja suficientemente pequeno para que  encontre-se em uma faixa
aceitvel de variao. Essa estratgia de ao advm do fato que, em geral,
possvel prescrever antecipadamente o nvel  , enquanto tal possibilidade no
existe para a probabilidade . Essa afirmao justificada pela constatao de
que a hiptese alternativa mais genrica do que a hiptese nula; por exemplo, a
hiptese alternativa H1:1 -0 $ 0 compreende a unio de diversas outras hipteses
alternativas (e.g.: H1: 1 -0 < 0 ou H1: 1 -0 > 0), enquanto a hiptese nula
H0: 1 -0 = 0 completamente definida. Em outras palavras, enquanto  depende
apenas da hiptese nula,  ir depender de qual das hipteses alternativas de
fato verdadeira, o que, evidentemente, no se sabe a priori. Na prtica,
considerado razovel prescrever, antecipadamente, o nvel de significncia  em
0,05, o que implica em uma mdia de 5 rejeies incorretas de H0, em 100 decises
possveis. Se as conseqncias de um erro do tipo I forem muito graves, pode-se
escolher um nvel de significncia ainda menor, como = 0,01 ou  = 0,001.
Embora  dependa de qual hiptese alternativa H1 , de fato, verdadeira e,
portanto, no possa ser antecipadamente prescrito, til o estudo do
comportamento de , sob diferentes possibilidades para H1. Essa investigao
feita por meio da quantidade 1-, a qual, conforme meno anterior, denominada
poder do teste. Na Figura 7.1, o poder do teste, para a hiptese alternativa
especfica H1:  = 1, pode ser visualizado pela rea da funo densidade da
estatstica de teste, sob H1, direita da abscissa Tcrtico. Para outra hiptese
alternativa, por exemplo H1:  = 2, claro que o poder do teste teria outro valor.
As relaes entre , ou (1-), e uma seqncia contnua de hipteses alternativas
especficas, definem, respectivamente, a curva caracterstica operacional, ou a
funo poder de teste, as quais permitem distinguir e comparar testes diferentes.
250

HIDROLOGIA ESTATSTICA

T$

CAPTULO 7 - TESTES DE HIPTESES

Para exemplificar a construo da curva caracterstica operacional e da funo


poder do teste, considere o seguinte teste bilateral da mdia de uma populao
Normal de parmetros  e : H0:  = 0 contra o conjunto de hipteses alternativas
H 1 :   0 . Mais uma vez, a estatstica de teste, nesse caso,
T = ( X 0 ) N , a qual segue uma distribuio N(0,1). O numerador da
estatstica de teste pode ser alterado para expressar deslocamentos 0+ k, em
relao a 0, onde k denota uma constante positiva ou negativa. Desse modo,
com T k N  , o teste refere-se a H0:  = 0 contra um conjunto de
deslocamentos padronizados k N  , em relao a zero, ou, equivalentemente,
contra um conjunto de deslocamentos 0 + k, em relao a 0. O erro do tipo II
corresponde a no rejeitar H0, quando H1 verdadeira, o que ir acontecer quando
a estatstica de teste T satisfizer  z  2 T  z  2 , onde  z  2 e
z  2 representam os limites de definio da regio crtica. A probabilidade de se
cometer o erro do tipo II pode ser escrita como
 z  2  k N    z  2  k N  , onde (.) denota a FAP da
distribuio Normal padro. Portanto, percebe-se que  depende de , de N
e das diferentes hipteses alternativas dadas por k  . Essa dependncia pode
ser expressa graficamente por meio da curva caracterstica operacional, ilustrada
na Figura 7.2, para  = 0,10 (z0,05= 1,645), amostras de tamanho N varivel
entre 1 e 50, e k  = 0,25, 0,50, 0,75 e 1.

T$ X   0  

 

N
O exame da curva caracterstica operacional mostra que, para uma amostra de
tamanho N fixo, a probabilidade de se cometer o erro do tipo II decresce, quando

Tamanho da Amostra N

Figura 7.2 Exemplos da curva caracterstica operacional de um teste de hipteses

HIDROLOGIA ESTATSTICA

251

CAPTULO 7 - TESTES DE HIPTESES

k  aumenta. Isso equivale a dizer que pequenas diferenas na mdia so mais


difceis de detectar, o que conduz a maiores probabilidades de se tomar a deciso
incorreta de no rejeitar uma falsa hiptese nula. Observa-se tambm um
decrscimo de , com o aumento de N, demonstrando a menor probabilidade de
se cometer um erro do tipo II, quando o teste tem, como base, amostras de maior
tamanho.
A funo poder de teste dada pelo complemento de , em relao a 1, e
encontra-se ilustrada na Figura 7.3, para o exemplo em foco. O poder do teste,
conforme definio anterior, representa a probabilidade de se tomar a deciso
correta de rejeitar uma falsa hiptese nula, em favor de uma hiptese alternativa.
A Figura 7.3 mostra que, para amostras de mesmo tamanho, a probabilidade de
no se cometer o erro do tipo II cresce, quando k  aumenta. Do mesmo modo,
o poder do teste aumenta quando o tamanho da amostra cresce.

Tamanho da Amostra N

Figura 7.3 - Exemplos de funo poder de um teste de hipteses

As Figuras 7.2 e 7.3 mostram que se, por exemplo, desejarmos manter
simultaneamente as respectivas probabilidades de se cometer os erros dos tipos I
e II em 100 =10% e 100 = 20%, e se estivermos testando a hiptese nula H0:
 = 0, contra a hiptese alternativa H1:  = 0+0,5, necessitaramos de uma
amostra de tamanho pelo menos igual a 26. Para esse exemplo, se uma amostra
252

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

de tamanho 26 no estiver disponvel ou se a obteno de observaes adicionais


for excessivamente onerosa, o analista deve buscar alguma soluo de compromisso
entre a confiabilidade do teste, imposta pela especificao de  e , e a
disponibilidade e/ou nus de amostragem suplementar. No restante desse captulo,
nos restringiremos a testes de hipteses que tm como base uma amostra de
tamanho fixo, sob a especificao prvia de um nvel de significncia usual, digamos
100= 5% ou 10%, aceitando implicitamente os nveis de  decorrentes dessa
deciso.

7.2 Alguns Testes Paramtricos Usuais para Populaes Normais


Grande parte da construo matemtica em torno dos testes paramtricos de
hipteses refere-se a populaes normais. Essa constatao pode ser explicada,
primeiramente, pela possibilidade de deduo das distribuies de amostragem
de variveis normais, e, em segundo lugar, pela ampla extenso de aplicaes do
teorema do limite central. O que se apresenta a seguir uma descrio dos
principais testes paramtricos para populaes normais, incluindo as premissas e
as estatsticas de teste, sob as quais so construdos. Para que tais testes produzam
resultados rigorosos, as premissas devem ser rigorosamente observadas. Em alguns
casos prticos e como decorrncia do teorema do limite central, pode-se cogitar
a extenso desses testes paramtricos para populaes no-normais. Deve-se
ressalvar, entretanto, que os resultados dessa extenso sero apenas aproximados.
Em geral, o grau de aproximao, nesses casos, dado pela diferena entre o
verdadeiro nvel de significncia do teste, o qual, pode ser avaliado por meio de
simulaes de Monte Carlo, e o nvel previamente estabelecido.

7.2.1 Testes Paramtricos sobre a Mdia de uma nica Populao Normal


A premissa bsica dos testes, descritos a seguir, a de que as variveis aleatrias
independentes {X1, X2, ... , XN}, componentes de uma certa amostra aleatria
simples, foram todas extradas de uma nica populao normal, de mdia 
desconhecida. O conhecimento ou o desconhecimento da varincia populacional
2 determina a estatstica de teste a ser usada.
H0: =1 contra H1: =2. Atributo de 2: conhecida.
Estatstica de teste: Z

X  1


Distribuio de probabilidades da estatstica de teste: Normal N(0,1)


HIDROLOGIA ESTATSTICA

253

CAPTULO 7 - TESTES DE HIPTESES

Tipo de Teste: unilateral a um nvel de significncia 


Deciso:
Se 1 >2, rejeitar H0 se X  1   z1 
 N
Se 1 <2, rejeitar H0 se X  1
 z
1 
 N
H0:  = 1 contra H1: = 2. Atributo de 2: desconhecida e estimada
por s X2 .
Estatstica de teste: T

X  1
sX

Distribuio de probabilidades da estatstica de teste: t de Student com


= N-1 ou tN-1
Tipo de Teste: unilateral a um nvel de significncia 
Deciso:
Se 1 >2, rejeitar H0 se X  1  t1 , N 1
 N
Se 1 <2, rejeitar H0 se

X  1


t1 , N 1

H0: =0 contra H1:  $ 0. Atributo de 2: conhecida.


Estatstica de teste: Z =

X 0

Distribuio de probabilidades da estatstica de teste: Normal N(0,1)


Tipo de Teste: bilateral a um nvel de significncia 
Deciso:
Rejeitar H0 se

X  0

z1 2
 N
H0: = 0 contra H1:  $ 0. Atributo de 2: desconhecida e estimada
por s X2 .

Estatstica de teste: T

254

HIDROLOGIA ESTATSTICA

X  0
sX

CAPTULO 7 - TESTES DE HIPTESES

Distribuio de probabilidades da estatstica de teste: t de Student com


= N-1 ou tN-1
Tipo de Teste: bilateral a um nvel de significncia 
Deciso:
Rejeitar H0 se X   0
t1 2 , N 1
sX N
Exemplo 7.1 Considere as vazes mdias do ms de Julho do Rio
Paraopeba em Ponte Nova do Paraopeba, listadas no Anexo 1, para o
perodo de 1938 a 1999. Teste a hiptese de que a mdia populacional do
ms de Julho 47,65 m3/s, a um nvel de significncia 100= 5%.
Soluo: A premissa bsica a que as vazes mdias do ms de Julho, em
Ponte Nova do Paraopeba, seguem uma distribuio Normal. A amostra
de 62 observaes fornece X 44,526 e s X 12,406 m 3 /s , no
havendo nenhuma informao adicional sobre a varincia populacional.
Nesse caso, a hiptese nula H0:  = 47,65 contra a hiptese alternativa
H1:  $ 47,65. Trata-se, portanto, de um teste bilateral ao nvel
100  = 5%, com a estatstica de teste dada por T =

X 47 ,65
sX

, a qual

possui uma distribuio t de Student com 61 graus de liberdade. Substituindo


os valores amostrais, resulta que o valor absoluto da estimativa de T igual
a 1,9828. A tabela de t de Student, do Anexo 7, fornece t 0 ,975 , 61 1,9996 .
Como 1,9828 < 1,9996, a hiptese H0 no deve ser rejeitada, em favor de
H1. Em outras palavras, com base na amostra disponvel, no h evidncias
de que a mdia populacional difira significativamente de 47,65 m3/s, ou
seja, que a diferena existente entre a mdia amostral X 44,526 e a mdia
hipottica  = 47,65 deve-se unicamente a flutuaes aleatrias das
observaes.
Exemplo 7.2 Repita o exemplo 7.1, supondo que a varincia populacional 2
seja conhecida e igual a 153,9183 (m3/s)2.
Soluo: A premissa bsica continua sendo a de que as vazes mdias do ms
de Julho, em Ponte Nova do Paraopeba, seguem uma distribuio Normal. O
fato de que a varincia populacional conhecida altera a estatstica de teste.
Nesse caso, trata-se de um teste bilateral ao nvel 100 = 5%, com a estatstica
de teste dada por Z

X  47 ,65


, a qual possui uma distribuio N(0,1).

Substituindo os valores amostrais, resulta que o valor absoluto da estimativa


de Z igual a 1,9828. A tabela 5.1, do captulo 5, fornece z 0 ,975 1,96 .
HIDROLOGIA ESTATSTICA

255

CAPTULO 7 - TESTES DE HIPTESES

Como 1,9828 >1,96, a hiptese H0 deve ser rejeitada, em favor de H1.


Portanto, sob as condies estipuladas para esse caso, significativa a
diferena entre a mdia amostral X 44,526 e a mdia hipottica = 47,65.

7.2.2 Testes Paramtricos sobre as Mdias de Duas Populaes Normais


A premissa bsica dos testes, descritos a seguir, a de que as variveis aleatrias
independentes {X1, X2, ... , XN} e {Y1, Y2, ... , YM}, componentes de duas amostras
aleatrias simples de tamanhos iguais a N e M, foram extradas de duas populaes
normais, de respectivas mdias X e Y desconhecidas. O conhecimento ou o
desconhecimento das varincias populacionais  2X e  Y2 , assim como a condio
de igualdade entre elas, determinam a estatstica de teste a ser usada. Os testes
descritos a seguir so tomados como bilaterais, podendo ser transformados em
unilaterais pela modificao de H1 e de .
H0:  X   Y  contra H1:  X   Y $  .
Atributos de  2X e  Y2 : conhecidas
Estatstica de teste: Z

X  Y   

 2X  Y2

N
M
Distribuio de probabilidades da estatstica de teste: Normal N(0,1)
Tipo de Teste: bilateral a um nvel de significncia 
Deciso:
Rejeitar H0 se  X  Y   
z 
1
 2X  Y2
2

N
M
H0:  X   Y  contra H1:  X   Y $  .
Atributos de  2X e  Y2 : supostamente iguais, mas desconhecidas.
Estimadas por s X2 e sY2 .
Estatstica de teste: T

X  Y   
N  1s X2  M  1sY2

NM  N  M  2
N M

Distribuio de probabilidades da estatstica de teste: t de Student com


= N + M - 2

256

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

Tipo de Teste: bilateral a um nvel de significncia 


Deciso:
Rejeitar H0 se

X  Y   
N  1s

2
X

 M  1s

2
Y

NM  N  M  2 

t 
1 , N  M  2
N M
2

H0:  X   Y  contra H1:  X   Y $  .


2
2
Atributos de  X e  Y : supostas desiguais, mas desconhecidas.
Estimadas por s X2 e sY2 .
Estatstica de teste: T

X  Y   
s N   s M 
2
X

2
Y

Distribuio de probabilidades da estatstica de teste: segundo Casella e


Berger (1990), a distribuio de T pode ser aproximada por uma
distribuio t de Student com

s N   s

s N 
s


2
X

2
Y

2
X

N  1


M

M  1
2
Y

Tipo de Teste: bilateral a um nvel de significncia 


Deciso:
Rejeitar H0 se

X  Y   
t
s N   s M 
2
X

2
Y


1 ,
2

Exemplo 7.3 Considere as vazes mdias do ms de Julho do Rio


Paraopeba em Ponte Nova do Paraopeba, listadas no Anexo 1, separandoas em duas amostras iguais de mesmo tamanho: a amostra denotada por X,
para o perodo de 1938 a 1968, e a amostra Y, para o perodo de 1969 a
1999. Teste a hiptese de que, considerados os perodos de 1938-1968 e
de 1969-1999, as mdias populacionais do ms de Julho no sofreram
alteraes importantes, a um nvel de significncia 100 = 5%.
Soluo: A premissa bsica a que, considerados os perodos de 19381968 e de 1969-1999, as vazes mdias do ms de Julho, em Ponte Nova
do Paraopeba, seguem duas distribuies normais de mdias X e Y, com
varincias X e Y supostamente desiguais e desconhecidas. A amostra de
31 observaes, para o perodo de 1938 a 1968, fornece
X 45,08 e s X 11,505 m 3 /s , enquanto, para o perodo restante, esses
valores resultam ser Y 43,97 e s y 13,415 m 3 /s . Nesse caso, a

HIDROLOGIA ESTATSTICA

257

CAPTULO 7 - TESTES DE HIPTESES

hiptese nula H0:  X   Y  0 contra a hiptese alternativa H1:


 X   Y  $ 0 . Como as varincias so supostamente desiguais e devem
ser estimadas pelas varincias amostrais, a estatstica de teste
T

X  Y 
s

2
X

31  s Y2 31

, a distribuio de probabilidades da qual pode ser

aproximada por uma t de Student com 

s
s

2
X

2
X

31  s Y2 31

2
s 2 312
31
 Y

30
30

= 58 graus

de liberdade. Substituindo os valores amostrais, resulta que o valor absoluto


da estimativa de T igual a 0,3476. A tabela de t de Student, do Anexo 7,
fornece t 0 ,975, 58 2,00 . Como 0,3476 < 2,00, a hiptese H0 no deve ser
rejeitada, em favor de H1. Em outras palavras, com base nas amostras
disponveis, no h evidncias de que as mdias populacionais, dos perodos
considerados, difiram significativamente entre si, ao nvel de 100= 5%.

7.2.3 Testes Paramtricos sobre a Varincia de uma nica Populao Normal


A premissa bsica dos testes, descritos a seguir, a de que as variveis aleatrias
independentes {X1, X2, ... , XN}, componentes de uma certa amostra aleatria
simples, foram todas extradas de uma nica populao normal, de varincia 2
desconhecida. O conhecimento ou o desconhecimento da mdia populacional 
determina a estatstica de teste a ser usada. Os testes so tomados como bilaterais,
podendo ser transformados em unilaterais pela modificao de H1 e de 
H0:  2  02 contra H1:  2 $  02 .
Atributo de : conhecida.
N

Estatstica de teste: Q

X

 

i 1

 02

s x2
 02
2

Distribuio de probabilidades da estatstica de teste:  com


2
 N , ou N
Tipo de Teste: bilateral a um nvel de significncia 
Deciso:
Rejeitar H0 se N

258

HIDROLOGIA ESTATSTICA

s x2
s x2
2


ou
se

2 
N

2
2
1 ,N
,
N
0
0
2
2

CAPTULO 7 - TESTES DE HIPTESES

H0:  2  02 contra H1:  2 $  02 .


Atributo de : desconhecida, estimada por X .
N

Estatstica de teste: K

X

 X

i 1

 02

s x2
 N  1 2
0
2

Distribuio de probabilidades da estatstica de teste:  com  N -1,


2
ou N 1
Tipo de Teste: bilateral a um nvel de significncia
Deciso:
Rejeitar H0 se N  1

s x2
s x2
2
N


ou
se

1


2 

2
, N 1
1 , N 1
02

0
2
2

Exemplo 7.4 Considere novamente as vazes mdias do ms de Julho do


Rio Paraopeba em Ponte Nova do Paraopeba, listadas no Anexo 1, para o
perodo de 1938 a 1999. Teste a hiptese nula de que a varincia
2
populacional  0 , das vazes mdias do ms de Julho, de 150 (m3/s)2
contra a hiptese alternativa H1:  02
150 (m3/s)2, a um nvel de significncia
100= 5%.
Soluo: Novamente, a premissa bsica a que as vazes mdias do ms
de Julho, em Ponte Nova do Paraopeba, seguem uma distribuio Normal.
A amostra de 62 observaes fornece X 44 ,526 e s X 12 ,406 m 3 /s ,
no havendo nenhuma informao adicional sobre a mdia populacional.
Nesse caso, a hiptese nula H0:  02 150 contra a hiptese alternativa
H1:  02
150 . Trata-se, portanto, de um teste unilateral ao nvel
100 = 5%, com a estatstica de teste dada por K N  1

s x2
, a qual
 02

possui uma distribuio  com 61 graus de liberdade. Substituindo os


valores amostrais, resulta que o valor de K igual a 62,593. A tabela de
 2 , do Anexo 6, fornece  02 ,95 ,61 80 ,232 . Como 62,593 < 80,232, a
hiptese H0 no deve ser rejeitada, em favor de H1. Em outras palavras,
com base na amostra disponvel, no h evidncias de que a varincia
populacional supere significativamente o valor de 150 (m3/s)2, ou seja, que
a diferena existente entre a varincia amostral s x2 153,918 e a varincia
 02 150 deve-se unicamente a flutuaes aleatrias das observaes.

HIDROLOGIA ESTATSTICA

259

CAPTULO 7 - TESTES DE HIPTESES

7.2.4 Testes Paramtricos sobre as Varincias de Duas Populaes Normais


A premissa bsica dos testes, descritos a seguir, a de que as variveis aleatrias
independentes {X1, X2, ... , XN} e {Y1, Y2, ... , YM}, componentes de duas amostras
aleatrias simples de tamanhos iguais a N e M, foram extradas de duas populaes
normais, de respectivas varincias  2X e  Y2 desconhecidas. O conhecimento ou
o desconhecimento das mdias populacionais X e Y determina a estatstica de
teste a ser usada. Os testes so tomados como bilaterais, podendo ser
transformados em unilaterais pela modificao de H1 e de .
 2X
 2X

1
H0: 2
contra H1: 2 $ 1
Y
Y
Atributos de X e Y: conhecidas

Estatstica de teste: 

s X2  2X
sY2  Y2

Distribuio de probabilidades da estatstica de teste: F de Snedecor com


1 N e  2 M , ou FN,M
Tipo de Teste: bilateral a um nvel de significncia 
Deciso:
Rejeitar H0 se   FN,M,/2 ou se > FN,M,1-/2
2
H0: X = 1 contra H1:  X $ 1
 Y2
Y2
Atributos de X e Y: desconhecidas, estimadas por X e Y

2
2
Estatstica de teste: f s X  X
sY2  Y2
Distribuio de probabilidades da estatstica de teste: F de Snedecor com
 1 N  1 e  2 M  1 , ou FN-1,M-1
Tipo de Teste: bilateral a um nvel de significncia 
Deciso:
Rejeitar H0 se f  FN-1,M-1,/2 ou se f
FN-1,M-1,1-/2

Exemplo 7.5 Um certo constituinte de um efluente foi analisado 7 e 9


vezes por meio dos procedimentos X e Y, respectivamente. Os resultados
das anlises apresentaram os seguintes desvios-padro:
s X 1,9 e sY 0,8 mg/l. Teste a hiptese de que o procedimento Y mais
preciso do que o procedimento X, ao nvel de significncia 100= 5%.
(adap. de Kottegoda e Rosso, 1997)
260

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

Soluo: Supondo tratarem-se de duas populaes normais, a hiptese nula


2

a ser testada H0:  X2 1 contra a hiptese alternativa H1:


Y

 2X

1 ou  2X
 Y2 .
 Y2

Trata-se, portanto, de um teste unilateral com = 0,05. A estatstica de


2
2
teste f s X2  2X , a qual segue uma distribuio F de Snedecor com
sY Y

v = 7-1 = 6 e v2 = 9-1 = 8 graus de liberdade para o numerador e


denominador, respectivamente. Substituindo os valores amostrais, resulta
que f =5,64. Da tabela de F, do Anexo 8, l-se que F6,8,0,05 = 3,58. Como
5,64 > 3,58, a deciso de rejeitar a hiptese nula em favor da hiptese
alternativa, ao nvel de significncia = 0,05. Em outras palavras, concluise que a varincia dos resultados do procedimento Y menor do que a de
seu concorrente, tratando-se, portanto, de um mtodo de anlise mais
preciso.

7.3 Alguns Testes No-Paramtricos Usuais em Hidrologia


Os testes paramtricos de hipteses, anteriormente descritos, requerem que a
distribuio da varivel aleatria, ou das variveis aleatrias de origem, seja a
distribuio Normal. De fato, se a distribuio dos dados originais a Normal,
possvel deduzir as distribuies das estatsticas de testes, em razo, principalmente,
da propriedade reprodutiva das variveis Gaussianas e do teorema do limite central.
Entretanto, se a distribuio dos dados originais no Gaussiana, o uso das
distribuies das estatsticas de testes conhecidas ter como conseqncia, a
violao do nvel de significncia previamente estabelecido. Por exemplo, se T
denota a estatstica de teste T X   0  s X N para uma varivel aleatria
X, cujo comportamento se afasta da normalidade, a verdadeira probabilidade de
se cometer o erro do tipo I no ser necessariamente igual ao nvel nominal . Em
outros termos, nesse caso, pode-se escrever que
 t

!

f T t H 0 dt 

f t H dt $ 
T

t

(7.6)

onde fT(t) a funo densidade desconhecida de T X   0  s X


premissa que X no seja normalmente distribuda.

N , sob a

HIDROLOGIA ESTATSTICA

261

CAPTULO 7 - TESTES DE HIPTESES

A estatstica matemtica apresenta duas solues possveis para o problema


identificado pela equao 7.6. A primeira soluo diz respeito tentativa de
mostrar, via simulaes de Monte Carlo, que, mesmo que uma certa varivel
aleatria X no seja Gaussiana e que, portanto, a estatstica de teste T no tenha
uma distribuio de probabilidades conhecida, a verdadeira densidade f T t H 0 
ir se comportar, em muitos casos, de modo suficientemente similar distribuio
usual, caso X fosse, de fato, normal. Por exemplo, Larsen e Marx (1986) mostram
alguns exemplos nos quais, se a distribuio de X no exageradamente assimtrica
ou se o tamanho da amostra no excessivamente pequeno, a distribuio t de
Student pode aproximar satisfatoriamente a distribuio f T t H 0 , para testes de
hipteses relativas mdia populacional de X. Nesses casos, afirma-se que o
teste de t de Student robusto, em relao a desvios moderados da normalidade.
Dadas as caractersticas marcadamente assimtricas das distribuies de
probabilidades de grande parte das variveis hidrolgicas, essa primeira possvel
soluo, para o problema identificado pela equao 7.6, tem aplicaes muito
limitadas na hidrologia estatstica.
A segunda soluo possvel, para o problema posto pela equao 7.6, a de
substituir as estatsticas de teste convencionais por outras, cujas distribuies de
probabilidades permanecem invariveis, sob a veracidade da hiptese H0 e a
despeito das caractersticas distributivas populacionais da varivel aleatria de
origem X. Os procedimentos de inferncia estatstica e, particularmente, os testes
de hipteses, que possuem tais propriedades, so denominados noparamtricos. Os procedimentos gerais para a construo de testes paramtricos
de hipteses, alinhavados no item 7.1, permanecem os mesmos para os testes
no-paramtricos. A diferena fundamental entre eles que os testes noparamtricos so formulados com base em estatsticas invariveis com a
distribuio dos dados originais. De fato, as estatsticas de testes no-paramtricos,
em sua grande maioria, baseiam-se em caractersticas que podem ser deduzidas
dos dados amostrais, mas que no os incluem diretamente em seu clculo. So
exemplos dessas caractersticas: o nmero de diferenas positivas (ou negativas)
entre uma certa mediana hipottica e os valores amostrais, ou o coeficiente de
correlao entre as ordens de classificao dos elementos de duas amostras, ou,
ainda, o nmero de inflexes dos valores amostrais ao longo de uma seqncia de
ndices de tempo, entre outras.
A variedade e o nmero de testes no-paramtricos tm crescido enormemente
desde que foram introduzidos, no incio da dcada de 1940. No se tem aqui o
objetivo de abordar a formulao e a construo dos inmeros testes noparamtricos de hipteses; o leitor interessado nesses detalhes deve remeter-se a
textos especializados, tais como Siegel (1956), Gibbons (1971) e Hollander e
262

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

Wolfe (1973). O que se segue uma descrio, acompanhada de exemplos de


aplicao, dos principais testes no-paramtricos de hipteses empregados em
hidrologia. Os testes aqui descritos tm, como objeto principal, a verificao das
hipteses fundamentais da anlise de freqncia de uma varivel hidrolgica. De
fato, a premissa de base para a aplicao dos mtodos estatsticos a um conjunto
de observaes de uma varivel hidrolgica, que se trata de uma amostra aleatria
simples, extrada de uma populao nica, cuja funo de distribuio de
probabilidades no conhecida a priori. Nessa premissa de base esto implcitas
as hipteses de aleatoriedade, independncia, homogeneidade e
estacionariedade, as quais, pelas caractersticas distributivas das variveis
hidrolgicas e pelo tamanho tpico de suas amostras, podem ser testadas apenas
com o emprego dos testes no-paramtricos. Os testes, apresentados a seguir,
esto entre os procedimentos no-paramtricos de maior utilidade na hidrologia
estatstica.

7.3.1 Teste da Hiptese de Aleatoriedade


No contexto dos fenmenos do ciclo da gua, o termo aleatoriedade significa,
essencialmente, que as flutuaes de uma certa varivel hidrolgica decorrem de
causas naturais. Nesse sentido, as vazes de um curso dgua regularizadas pela
operao de um reservatrio, a montante, constituiriam um exemplo de uma srie
no-aleatria. A aleatoriedade de uma srie hidrolgica no pode ser demonstrada,
mas pode ser rejeitada pela presena de uma estrutura ou por alguma interveno
de natureza no-aleatria. NERC (1975) sugere que a rejeio/no-rejeio da
hiptese de aleatoriedade de uma srie hidrolgica possa ser decidida por meio
do teste no-paramtrico do nmero de inflexes. Particularizando para uma
srie de vazes mximas anuais Qt, ou seja, considerando um grfico entre Qt
versus o ano de ocorrncia t, uma inflexo poderia ser tanto um pico, quanto um
vale, nesse diagrama. Um nmero excessivamente pequeno, ou excessivamente
grande, de inflexes um indicador de no-aleatoriedade. Por outro lado, se uma
amostra de N observaes aleatria, pode-se mostrar que o valor esperado do
nmero de inflexes, denotado por p, dado por
E p

2 N  2 
3

(7.7)

com varincia que pode ser aproximada por


Var p 

16 N  29
90

(7.8)

HIDROLOGIA ESTATSTICA

263

CAPTULO 7 - TESTES DE HIPTESES

Para amostras de tamanho N >30, possvel provar que a varivel p segue


aproximadamente uma distribuio Normal. Portanto, se a hiptese nula H0: (a
amostra aleatria), a estatstica do teste no-paramtrico pode ser formulada
como
T

p  E p 
Var p 

(7.9)

onde p representa o nmero de picos, e/ou de vales, no grfico da varivel


aleatria, ao longo do tempo. Por tratar-se de um teste bilateral, a um nvel de
significncia , a deciso deve ser a de rejeitar a hiptese nula se T
z1 2 .

7.3.2 Teste da Hiptese de Independncia


O termo independncia significa, essencialmente, que nenhuma observao
presente na amostra pode influenciar a ocorrncia, ou a no ocorrncia, de qualquer
outra observao seguinte. Mesmo que uma srie seja considerada aleatria, as
observaes que a constituem podem no ser independentes. No contexto de
variveis hidrolgicas, os armazenamentos naturais de uma bacia hidrogrfica,
por exemplo, podem determinar a ocorrncia de vazes de maior porte, na
seqncia de vazes elevadas, ou, contrariamente, de vazes de menor porte, na
seqncia de vazes reduzidas. A dependncia, nesse caso, varia com o intervalo
de tempo que separa as observaes consecutivas da srie hidrolgica: forte,
para vazes mdias dirias, e fraca ou nenhuma, para vazes mdias (ou mximas,
ou mnimas) anuais. A rejeio ou no-rejeio da hiptese de independncia de
uma srie hidrolgica freqentemente decidida por meio do teste noparamtrico proposto por Wald e Wolfowitz (1943), o qual encontra-se descrito
a seguir.
Dada uma amostra {X1, X2, ... , XN}, de tamanho N, e as diferenas {X1, X2, ...
, XN}, entre as observaes Xi e a mdia amostral X , a estatstica do teste de
Wald-Wolfowitz dada por
N 1

R X i' X i' 1  X 1' X 'N

(7.10)

i 1

Sob a hiptese de que as observaes so independentes, pode-se demonstrar


que a estatstica R segue uma distribuio Normal de mdia igual a
E R 

s2
N 1

e varincia dada por


264

HIDROLOGIA ESTATSTICA

(7.11)

XV

CAPTULO 7 - TESTES DE HIPTESES

Var [ R ] =

s 22 s 4
s 22 2s 4
s 22
+

N 1 ( N 1) ( N 2 ) ( N 1) 2

(7.12)

onde r denota a ordem dos momentos amostrais em relao origem, s r Nm'r


N

 

e m'r X i'

N . Portanto, se a hiptese nula H0: (os elementos da amostra

i 1

so independentes), a estatstica do teste no-paramtrico de Wald-Wolfowitz


pode ser formulada como
T

R  E R 

(7.13)

VarR

a qual segue uma distribuio Normal padro. Por tratar-se de um teste bilateral,
a um nvel de significncia , a deciso deve ser a de rejeitar a hiptese nula se
T
z1 2 .

7.3.3 Teste da Hiptese de Homogeneidade


O termo homogeneidade implica que todos os elementos de uma certa amostra
2
nica e idntica
idntica populao. Em uma srie de vazes mximas
X N1 1 , X s ,...,
uma nica
 sX
s  2s 4 provms 2de
4 N
VarR 


2
valores
podem
decorrer
de enchentes
propor
exemplo,muitos
muitosdedeseus
seus
valores
podem
decorrer
de enchentes
N  1  N  1 N  2anuais,
 N por
1 exemplo,
vocadas
por
precipitaes
ordinrias
ou
comuns,
enquanto
outros
advm
provocadas por precipitaes ordinrias ou comuns, enquanto outros advm de
precipitaes extraordinariamente
elevadas,
resultantes
de condies
hidromeprecipitaes
extraordinariamente
elevadas,
resultantes
de condies
teorolgicas muito especiais,
como por exemplo,
fenmeno do
El
hidrometeorolgicas
muito especiais,
como pora ocorrncia
exemplo, adoocorrncia
Nio. NesseElexemplo,
temosexemplo,
duas populaes
de enchentes,
diferenciadas
pelo
fenmeno
Nio. Nesse
temos duas
populaes
de enchentes,
seu
mecanismo
de
formao,
e,
certamente,
a
srie
hidrolgica
deveria
ser
condiferenciadas pelo seu mecanismo de formao, e, certamente, a srie hidrolgica
sideradaser
heterognea.
Entretanto,
as amostras
hidrolgicas,
geralmente
de tadeveria
considerada
heterognea.
Entretanto,
as amostras
hidrolgicas,
manhos pequenos,
tornam
difcil a deteco
da heterogeneidade
eventualmente
geralmente
de tamanhos
pequenos,
tornam difcil
a deteco da heterogeneidade
presente na sriepresente
completa.
maisEm
fcilgeral,
identicar
eventualmente
na Em
sriegeral,
completa.
maisheterogeneidades
fcil identificar
em
sries
de
valores
mdios
ou
totais
anuais,
do
que
em
sries
de
heterogeneidades em sries de valores mdios ou totais anuais, do valores
que em extresries
mos,
tomados
em intervalos
maisdecurtos.
rejeio
ouAno-rejeio
de
valores
extremos,
tomadosde
emtempo
intervalos
tempoAmais
curtos.
rejeio ou
da hiptese deda
homogeneidade
uma srie hidrolgica
deci-
no-rejeio
hiptese de de
homogeneidade
de uma freqentemente
srie hidrolgica
dida por meio dodecidida
teste no-paramtrico
por Mannproposto
e Whitney
freqentemente
por meio do testeproposto
no-paramtrico
por(1947),
Mann
o
qual
encontra-se
descrito
a
seguir.
e Whitney (1947), o qual encontra-se descrito a seguir.

2
N1  2

2
2

Dada uma amostra {X1, X2, ... , XN}, de tamanho N, separe-a em duas sub-amostras
{X 1 , X 2 ,..., X N1 }, de tamanho N1, e {{X N +1 , X N + 2 ,..., X N }}, de tamanho N2, de
modo que N1+N2 = N e que N1 e N2 sejam aproximadamente iguais, com N1 N2.
Em seguida, classifique, em ordem crescente, a amostra completa de tamanho N,
indicando a ordem de classificao m de cada observao e se ela provem da

HIDROLOGIA ESTATSTICA

265

CAPTULO 7 - TESTES DE HIPTESES

primeira ou da segunda sub-amostra. A idia intuitiva do teste de Mann-Whitney


se as duas sub-amostras no forem homogneas, os elementos da primeira
apresentaro ordens de classificao consistentemente mais baixas (ou mais altas),
em relao s ordens de classificao correspondentes segunda sub-amostra. A
estatstica do teste V de Mann-Whitney dada pelo menor valor entre as quantidades
V1  N 1 N 2

N 1  N 1 1
R1
2

V2  N 1 N 2 V1

(7.14)
(7.15)

onde R1 denota a soma das ordens de classificao dos elementos da primeira


sub-amostra. Se N1, N2 > 20, e sob a hiptese de que se trata de uma amostra
homognea, demonstra-se que V segue uma distribuio Normal de mdia igual a
E ;V = 

N1 N 2
2

(7.16)

e varincia dada por


Var;V = 

N 1 N 2  N 1 N 2 1
12

(7.17)

Portanto, se a hiptese nula H0: (a amostra homognea), a estatstica do teste


no-paramtrico de Mann-Whitney pode ser formulada como

T

V E ;V =
Var;V =

(7.18)

a qual segue uma distribuio Normal padro. Por tratar-se de um teste bilateral,
a um nvel de significncia A, a deciso deve ser a de rejeitar a hiptese nula se
T  z1 A 2.

7.3.4 Teste da Hiptese de Estacionariedade


O termo estacionariedade refere-se ao fato que, excludas as flutuaes
aleatrias, as observaes amostrais so invariantes, com relao cronologia de
suas ocorrncias. Os tipos de no-estacionariedades incluem tendncias, saltos
e ciclos, ao longo do tempo. Em um contexto hidrolgico, os saltos esto
relacionados a alteraes bruscas em uma bacia ou trecho fluvial, tais como, por
exemplo, a construo de barragens. Os ciclos, por sua vez, podem estar
relacionados a flutuaes climticas de longo perodo, sendo de difcil deteco.
As tendncias temporais, em geral, esto associadas a alteraes graduais que se
processam na bacia, tais como, por exemplo, uma evoluo temporal lenta da
266

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

urbanizao de uma certa rea geogrfica. Uma tendncia temporal, eventualmente


presente em uma serie hidrolgica Xt, ao longo do tempo t, pode ser detectada
pela correlao entre a srie e o ndice de tempo. Essa a idia essencial do
teste no-paramtrico de Spearman, conforme descrito por NERC (1975),
cuja base o coeficiente de correlao entre as ordens de classificao mt, da
seqncia Xt, e os ndices de tempo Tt, esses iguais a 1, 2, ... , N.
A estatstica do teste de Spearman tem, como base, o seguinte coeficiente:
N

rS 1 

6 mt  Tt 
t 1

(7.19)

N N

Para N >10 e sob a hiptese nula de que no h correlao entre mt e Tt,


demonstra-se que a distribuio de rS pode ser aproximada por uma Normal de
mdia igual a
E rS  0

(7.20)

e varincia dada por

VarrS 

1
N 1

(7.21)

Portanto, se a hiptese nula H0: (a amostra no apresenta tendncia temporal),


a estatstica do teste no-paramtrico de Spearman pode ser formulada como

rS
VarrS 

(7.22)

a qual segue uma distribuio Normal padro. Por tratar-se de um teste bilateral,
a um nvel de significncia  a deciso deve ser a de rejeitar a hiptese nula se
T
z1 2 .
Exemplo 7.6 Considere a srie de vazes mdias anuais do Rio Paraopeba
em Ponte Nova do Paraopeba, listadas na Tabela 7.1, e teste as hipteses
de (a) aleatoriedade, (b) independncia, (c) homogeneidade e (d)
estacionariedade, a um nvel de significncia  = 0,05.
Soluo: (a) Teste da hiptese de aleatoriedade. A variao temporal da
vazes mostrada na Figura 7.4. Nessa figura, observa-se que o nmero
total de inflexes importantes p = 34. Para N = 62, as equaes 7.7 e 7.8
resultam em E[p] = 40 e Var[p] = 10,7. Com esses valores, a estatstica de
teste, da equao 7.9, T = -1,8340. Para o nvel de significncia
= 0,05, z0,975 = 1,96. Como T  z 0,975 , a deciso a de no rejeitar a
hiptese H0 de que as observaes so aleatrias.
HIDROLOGIA ESTATSTICA

267

CAPTULO 7 - TESTES DE HIPTESES

(b) Teste da hiptese de independncia. A sexta coluna da tabela 7.1


apresenta as diferenas entre as vazes mdias anuais e o valor mdio global
de 86,105 m3/s. So esses os valores necessrios para o clculo da estatstica
do teste de Wald-Wolfowitz, pela equao 7.10. O resultado desse clculo
R = 8253,759. As diferenas, listadas na tabela 7.1, tambm fornecem os
valores s2 = 38003,47 e s4 = 87362890,7, cuja substituio nas equaes
7.11 e 7.12 resultam em E[R] = -623,01 e Var[R] = 22203003,87. Com
esses valores, a estatstica de teste, da equao 7.13, T = 1,8839. Para o
nvel de significncia = 0,05, z0,975 = 1,96. Como T  z 0 ,975 , a deciso a
de no rejeitar a hiptese H0 de que as observaes so independentes.
(c) Teste da hiptese de homogeneidade. A quarta coluna da tabela 7.1
apresenta as ordens de classificao das vazes mdias anuais, denotadas
por mt. So esses os valores necessrios para o clculo da estatstica do
teste de Mann-Whitney, pelas equaes 7.14 e 7.15, lembrando que a soma
das ordens de classificao da primeira sub-amostra de 31 elementos,
tambm anotada na tabela 7.1, R1 = 1004. A estatstica de teste o menor
valor entre V1 e V2, ou seja V = 453. A substituio de R1 e V nas equaes
7.16 e 7.17 resulta em E[V] = 480,5 e Var[V] = 71,0299. Com esses
valores, a estatstica de teste, da equao 7.18, T = 0,3872. Para o nvel
de significncia = 0,05, z0,975 = 1,96. Como T  z 0 ,975 , a deciso a de
no rejeitar a hiptese H0 de que as observaes so homogneas.
(d) Teste da hiptese de estacionariedade. A quarta coluna da tabela 7.1
apresenta as ordens de classificao das vazes mdias anuais e a segunda
coluna lista o ndice de tempo cronolgico Tt. So esses os valores
necessrios para o clculo da estatstica do teste de Spearman, pela equao
7.19. A estatstica de teste calculada rS = -0,07618. As equaes 7.20 e
7.21 resultam em E[rS] = 0 e Var[rS] = 0,0164. Com esses valores, a
estatstica de teste, da equao 7.22, T = 0,5949. Para o nvel de
significncia = 0,05, z0,975 = 1,96. Como T  z 0 ,975 , a deciso a de no
rejeitar a hiptese H0 de que as observaes so estacionrias.

Tabela 7.1 Vazes mdias anuais do Rio Paraopeba em Ponte Nova do


Paraopeba (m3/s) e grandezas auxiliares para a realizao dos testes de
hipteses de Wald-Wolfowitz, Mann-Whitney e Spearman.

268

Ano
Civil

Tt

Xt

mt

1938
1939
1940
1941
1942
1943

1
2
3
4
5
6

104,3
97,9
89,2
92,7
98
141,7

51
45
38
40
46
60

HIDROLOGIA ESTATSTICA

SubAmostra
1
1
1
1
1
1

X i' X t  X

Xt
classificados

18,20
11,80
3,10
6,60
11,90
55,60

43,6
46,8
49,4
50,1
53,1
57

CAPTULO 7 - TESTES DE HIPTESES

Tabela 7.1 Continuao


Ano
Civil

Tt

1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968

7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

81,1
97,3
72
93,9
83,8
122,8
87,6
101
97,8
59,9
49,4
57
68,2
83,2
60,6
50,1
68,7
117,1
80,2
43,6
66,8
118,4
110,4
99,1
71,6

1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999

32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62

62,6
61,2
46,8
79
96,3
77,6
69,3
67,2
72,4
78
141,8
100,7
87,4
100,2
166,9
74,8
133,4
85,1
78,9
76,4
64,2
53,1
112,2
110,8
82,2
88,1
80,9
89,8
114,9
63,6
57,3

Xt

Xt
classificados

mt

SubAmostra

X i' X t  X

30
43
20
41
33
58
36
50
44
8
3
6
16
32
9
4
17
56
28
1
14
57
52
47
19
Soma=1004
11
10
2
27
42
24
18
15
21
25
61
49
35
48
62
22
59
34
26
23
13
5
54
53
31
37
29
39
55
12
7
Soma=949

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

-5,00
11,20
-14,10
7,80
-2,30
36,70
1,50
14,90
11,70
-26,20
-36,70
-29,10
-17,90
-2,90
-25,50
-36,00
-17,40
31,00
-5,90
-42,50
-19,30
32,30
24,30
13,00
-14,50

57,3
59,9
60,6
61,2
62,6
63,6
64,2
66,8
67,2
68,2
68,7
69,3
71,6
72
72,4
74,8
76,4
77,6
78
78,9
79
80,2
80,9
81,1
82,2

2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

-23,50
-24,90
-39,30
-7,10
10,20
-8,50
-16,80
-18,90
-13,70
-8,10
55,70
14,60
1,30
14,10
80,80
-11,30
47,30
-1,00
-7,10
-9,70
-21,90
-33,00
26,10
24,70
-3,90
2,00
-5,20
3,70
28,80
-22,50
-28,80

83,2
83,8
85,1
87,4
87,6
88,1
89,2
89,8
92,7
93,9
96,3
97,3
97,8
97,9
98
99,1
100,2
100,7
101
104,3
110,4
110,8
112,2
114,9
117,1
118,4
122,8
133,4
141,7
141,8
166,9

HIDROLOGIA ESTATSTICA

269

Vazes (m3/s)

CAPTULO 7 - TESTES DE HIPTESES

Ano
Figura 7.4 - Variao temporal das vazes mdias anuais do Rio Paraopeba em
Ponte Nova do Paraopeba

7.4 Alguns Testes de Aderncia Usuais em Hidrologia


Nos itens anteriores, foram descritos alguns testes de hipteses referentes aos
parmetros de uma certa populao ou referentes a atributos necessrios a uma
amostra aleatria simples. Outra classe importante de testes de hipteses referese verificao da forma de uma distribuio de probabilidades. Essa classe
constituda pelos chamados testes de aderncia, por meio dos quais, verifica-se
a eventual adequao entre as probabilidades ou freqncias, tal como calculadas
por um certo modelo distributivo hipottico, e as correspondentes freqncias
com que, determinados valores amostrais so observados. Os testes de aderncia
permitem, por exemplo, verificar se uma varivel aleatria discreta segue uma
distribuio de Poisson ou se uma varivel aleatria contnua distribuda segundo
um modelo de Gumbel.
No contexto das variveis aleatrias hidrolgicas, muito freqente a situao
em que no se conhece a priori a distribuio de probabilidades que descreve a
populao da qual se extraiu um certo conjunto de observaes. Nessas
circunstncias, a seleo das distribuies de probabilidades aptas modelao
de uma determinada varivel hidrolgica realizada com base (i) nas caractersticas
fsicas do fenmeno em foco; (ii) em possveis dedues tericas quanto s
propriedades distributivas da varivel em questo; e (iii) na aderncia da distribuio

270

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

proposta distribuio emprica dos valores amostrais. No que concerne ao item


(i), a dinmica do mecanismo de formao de cheias, por exemplo, um fator
que indica que as distribuies positivamente assimtricas sejam mais aptas
modelao de vazes mximas anuais, enquanto que a capacidade mxima de
dissoluo de um gs, em um meio lquido, outro fato que determina que as
distribuies limitadas, esquerda e direita, sejam mais adequadas descrio
do comportamento probabilstico das concentraes de oxignio dissolvido, em
um trecho fluvial.
No que se refere ao item (ii), possvel conceber algumas poucas variveis
hidrolgicas, tais como as alturas anuais de precipitao em locais de sazonalidade
pouco marcada, como decorrentes da aplicao do teorema do limite central s
alturas pluviomtricas dirias. Entretanto, para a grande maioria das variveis
aleatrias hidrolgicas, patente a inexistncia de leis dedutivas tericas que
amparem a escolha do modelo que descreve o seu comportamento probabilstico.
Em relao ao item (iii), embora no se prestem seleo de uma dentre vrias
distribuies, os testes de aderncia so instrumentos da estatstica matemtica
que auxiliam a tomada de deciso quanto adequao, ou inadequao, de um
certo modelo distributivo a uma dada amostra. Os principais testes de aderncia,
empregados na hidrologia estatstica, so o do Qui-Quadrado, o de KolmogorovSmirnov, o de Anderson-Darling e o de Filliben. A descrio e aplicao de tais
testes so objetos dos itens que se seguem.

7.4.1 O Teste de Aderncia do Qui-Quadrado (2)


Considere que A1, A2, ... , Ar representem um conjunto de eventos mtua e
coletivamente disjuntos, de modo que o espao amostral seja definido pela unio
desses eventos. Considere tambm a hiptese nula H0: P(Ai) = pi, para i = 1, 2,
r

..., r, tal que p i 1 . Sob tais condies, suponha que, de um certo nmero de
i 1

experimentos N, as freqncias absolutas dos elementos pertencentes aos eventos


A1, A2, ... , Ar sejam dadas, respectivamente, pelas quantidades 1 , 2 , ... , r . Se
a hiptese nula verdadeira, a distribuio conjunta das variveis 1 , 2 ,... , r
a multinomial (ver item 4.3.1, do captulo 4), cuja funo massa dada por
1 O1 , 2 O2 ,... , r Or H 0 
r

onde

N!
p1O1 p 2O2 ... p rOr
O1!O2 !... Or !

(7.23)

i 1

HIDROLOGIA ESTATSTICA

271

CAPTULO 7 - TESTES DE HIPTESES

Em seguida, considere a seguinte estatstica :


r

Oi  Npi 2

i 1

Oi


2

Oi  Ei 2

i 1

Oi

(7.24)

formada pelas realizaes Oi, das variveis  i , e pelos seus respectivos valores
esperados Ei E  i , os quais, sob a veracidade da hiptese nula, so iguais
a Npi. A estatstica 2 expressa, portanto, a soma das diferenas quadrticas
entre as realizaes das variveis aleatrias  i e suas respectivas mdias
populacionais.
No item 5.9.1, do captulo 5, viu-se que a soma das diferenas quadrticas entre
N variveis normais e independentes, e sua mdia comum , possui uma distribuio
do 2 com = N graus de liberdade. Embora seja evidente a semelhana entre a
definio da varivel da distribuio do Qui-Quadrado com a estatstica 2, a
equao 7.24 contem a soma de r variveis no necessariamente independentes
ou normais. Entretanto, possvel demonstrar que, quando N tende para o infinito,
a estatstica 2, tal como expressa pela equao 7.24, segue uma distribuio do
Qui-Quadrado, com = (r-1) graus de liberdade. Em outros termos,

lim 2 < x H 0 =

x ( r 3 ) 2 e x 2
dx
2 (r 1) 2 [ ( r 1) 2]

(7.25)

Para grandes valores de N, pode-se, portanto, empregar esse resultado para


testar a hiptese nula H0 de que as freqncias relativas esperadas de  i sejam
dadas por Npi, com pi calculadas pela distribuio de probabilidades proposta.
Um valor elevado da estatstica de teste revela grandes diferenas entre as
freqncias observadas e esperadas, sendo um indicador da pouca aderncia da
distribuio especificada, sob H0, amostra.
Observe que a distribuio limite da estatstica de teste, dada pela equao 7.25,
no depende de pi, contido em H0. De fato, a distribuio limite de 2 depende
apenas do nmero de parties r do espao amostral. Isso faz com que o teste
possa ser aplicado para diferentes hipteses nulas, desde que r seja adequadamente
especificado. Na prtica, o teste de aderncia do 2 fornece resultados satisfatrios
para N >50 e para Npi # 5, com i =1, 2, ... , r. Se as probabilidades pi forem
calculadas a partir de uma distribuio de k parmetros, estimados pelas
observaes amostrais, perde-se k graus de liberdade adicionais. Em outras
palavras, o parmetro , da distribuio da estatstica de teste 2, ser
 = (r - k-1). Os exemplos 7.7 e 7.8 ilustram a aplicao do teste de aderncia
do 2 para variveis aleatrias discretas e contnuas.

272

HIDROLOGIA ESTATSTICA

O
p

CAPTULO 7 - TESTES DE HIPTESES

Exemplo 7.7 - Considere que uma ETA recebe gua bruta de um manancial
de superfcie, captada por uma tomada dgua simples, instalada em
determinada cota. Suponha que a varivel aleatria discreta X represente o
nmero anual de dias em que o nvel dgua, medido na estao fluviomtrica
local, inferior cota da tomada dgua de projeto. Com base em 50 anos
de observaes, determinou-se a distribuio emprica das freqncias de
X, a qual dada pela Tabela 7.2. Use o mtodo dos momentos para ajustar
uma distribuio de Poisson varivel X, calcule as freqncias esperadas
por esse modelo e teste sua aderncia aos dados empricos, a um nvel de
significncia  = 0,05.

Tabela 7.2 - Nmero anual de dias em que o nvel dgua inferior cota da
tomada dgua de projeto
xi "

>8

0,0

0,06

0,18

0,2

0,26

0,12

0,09

0,06

0,03

0,0

Soluo:

f(xi)

funo

massa

de

Poisson

x
p X ( x )=
e , para x = 0 ,1, ... e > 0 , com valor esperado E  X   .
x!

A mdia amostral pode ser calculada pela ponderao de x por suas


O 3E,86
 .  x 

observadas e resulta ser x 3,86 . Portanto, pelo mtodo dos
p X E x  e , para x 0,1, ... e 
freqncias
0
x!
momentos, a estimativa do parmetro  = 3,86.
Os valores Ei, da
Tabela 7.3 representam as freqncias esperadas, tal como calculadas pela
produto de N = 50, pela funo massa de Poisson.
2

Tabela 7.3 Freqncias observadas e empricas.


xi

Oi=50 f(xi)

Ei=50pX(xi)

0
1
2
3
4
5
6
7
8
>8
Soma

0
3
9
10
13
6
4,5
3
1,5
0
50

1,0534
4,0661
7,8476
10,0973
9,7439
7,5223
4,8393
2,6685
1,2876
0,8740
50

Oi-Ei
-1,0534
-1,0661
1,1524
-0,0973
3,2561
-1,5223
-0,3393
0,3315
0,2124
-0,8740

(O

Ei )
Ei

1,0534
0,2795
0,1692
0,0009
1,0880
0,3080
0,0238
0,0412
0,0350
0,8740
3,8733

HIDROLOGIA ESTATSTICA

273

CAPTULO 7 - TESTES DE HIPTESES

A Tabela 7.3 tambm mostra os outros elementos necessrios para o clculo


da estatstica de teste 2, quais sejam, as diferenas simples e quadrticas
padronizadas, entre as freqncias empricas e esperadas pelo modelo de
Poisson. A soma da ltima coluna da tabela fornece o valor da estatstica de
teste 2 = 3,8733. O nmero total de parties do espao amostral, nesse
caso, r =10. Como foi estimado um parmetro a partir da amostra, k =1,
o que resulta em= (r - k - 1) = 8 graus de liberdade para a distribuio da
estatstica de teste. Trata-se de um teste unilateral, no qual, a regio crtica,
para = 0,05, definida por  02 ,95 ,  8 15,5 (Anexo 6). Como  2   20 ,95 ,  8 ,
a deciso a de no rejeitar a hiptese H0 de que o comportamento
probabilstico da varivel aleatria, em questo, possa ser modelado pela
distribuio de Poisson. Nesse exemplo, embora N = 50, algumas
freqncias esperadas pelo modelo de Poisson foram inferiores a 5, o que
pode vir a comprometer o poder do teste de aderncia. Essa situao pode
ser resolvida satisfatoriamente pela agregao de algumas parties do
espao amostral; por exemplo, as freqncias esperadas para x= 0 e x =1
podem ser agrupadas em uma nova partio, correspondente a x 1, cuja
nova freqncia seria 5,1195. Da mesma forma, outras parties poderiam
ser agrupadas para constituir a nova classe x 6. Evidentemente, esse
rearranjo das parties implicaria em novos valores de r e da estatstica de
teste 2.

Exemplo 7.8 Considere as vazes mdias anuais do Rio Paraopeba em


Ponte Nova do Paraopeba, listadas na Tabela 7.1, e faa um teste de
aderncia da distribuio Normal a esses dados, por meio do teste do 2, a
um nvel de significncia  = 0,05.
Soluo: No caso de variveis aleatrias contnuas, as parties do espao
amostral so feitas por meio da diviso em classes, com o clculo das
freqncias observadas e esperadas, dentro dos limites dos intervalos de
classe. Para a amostra em questo, j foram mostradas anteriormente a
tabela de freqncias absolutas e o histograma correspondente, com 7 classes
de largura fixa. A tabela de freqncias absolutas, anteriormente elaborada,
a Tabela 2.3, do captulo 2. Entretanto, nessa tabela, observa-se uma
freqncia muito pequena em alguns intervalos, o que fora o rearranjo das
classes, cujas larguras no necessitam ser fixas. A Tabela 7.4 mostra esse
rearranjo e outros elementos auxiliares para a construo da estatstica de
teste.

274

HIDROLOGIA ESTATSTICA

sxpX


CAPTULO 7 - TESTES DE HIPTESES

Tabela 7.4 Freqncias observadas e empricas.


Classe
1
2
3
4
5
6
Soma

  LI  
 


105
LS
sxpX02i ,95 86,
24,
960   

, 3 7 ,81

Intervalos

Oi

(0,60]
(60,70]
(70,90]
(90,105]
(105,120]
(120,200]

8
10
21
12
6
5
62

Ei
9,1468
6,9179
18,7621
13,2355
8,5117
5,4085
61,9824

Oi-Ei
-1,1468
3,0822
2,2379
-1,2355
-2,5117
-0,4085

O

 Ei 
Ei

0,1438
1,3732
0,2669
0,1153
0,7412
0,0309
2,6712

Comr = 6 classes de largura varivel, as freqncias observadas Oi variam em


torno de valores aceitveis. Para o clculo das freqncias esperadas pela
distribuio Normal, preciso estimar os seus parmetros  e . A amostra
fornece a mdia x = 86,105 e o desvio-padro s X = 24,960 , os quais, pelo
mtodo dos momentos, resultam nas estimativas  86,105 e  24,960 .
Desse modo, a freqncia relativa esperada na classe i dada por
)
] [(LI
)
] , onde LS e LI representam,
p i = [(LS
respectivamente, os limites superior e inferior de cada classe, e (.) denota a
e
. A freqncia absoluta Ei,
FAP da distribuio Normal de parmetros 
da classe i, dada pelo produto de pi pelo tamanho da amostra N = 62. Em
seguida, calcula-se as diferenas simples e quadrticas padronizadas, entre as
freqncias empricas e esperadas pelo modelo Normal. A soma da ltima
coluna da Tabela 7.4 fornece o valor da estatstica de teste 2 = 2,6712. O
nmero total de parties do espao amostral, nesse caso, r = 6. Como
foram estimados dois parmetros a partir da amostra, k = 2, o que resulta em
 = (r - k - 1) = 3 graus de liberdade para a distribuio da estatstica de teste.
Trata-se de um teste unilateral, no qual, a regio crtica, para = 0,05,
definida por 02 ,95 , =3 = 7 ,81 (Anexo 6). Como  2   02 ,95 , 3 , a deciso a
de no rejeitar a hiptese H0 de que o comportamento probabilstico da varivel
aleatria, em questo, possa ser modelado pela distribuio Normal.

7.4.2 O Teste de Aderncia de Kolmogorov-Smirnov (KS)


O teste de aderncia de Kolmogorov-Smirnov (KS) um teste no paramtrico,
cuja estatstica de teste tem como base a diferena mxima entre as funes de
probabilidades acumuladas, emprica e terica, de variveis aleatrias contnuas.
O teste no aplicvel a variveis aleatrias discretas.
HIDROLOGIA ESTATSTICA

275

CAPTULO 7 - TESTES DE HIPTESES

Considere que X represente uma varivel aleatria contnua, de cuja populao extraiuse a amostra {X1, X2, ... , XN}. A hiptese nula a ser testada H0: P(X< x) =FX(x),
onde FX(x) suposta completamente conhecida, ou seja, seus parmetros no so
estimados a partir da amostra. Para implementar o teste KS, inicialmente, classifique
os elementos da amostra {X1, X2, ... , XN} em ordem crescente, de modo a constituir
a seqncia {x(1), x(2), ... , x(m) , ... x(N)}, na qual 1 m N denota a ordem de
classificao. Para cada elemento x(m), a distribuio emprica FN(xm) calculada pela
proporo de valores amostrais que no excedem x(m), ou seja,

FN  x m 

m
N

(7.26)

Em seguida, calcule as probabilidades tericas, segundo FX(x), tendo como


argumento os valores x(m). A estatstica do teste KS dada por
D N sup FN  x   FX  x 
!  x !

(7.27)

e corresponde, portanto, maior diferena entre as probabilidades emprica e


terica.
Se H0 verdadeira e quando N , a estatstica DN ir tender a zero. Por outro
lado, se N um valor finito, a estatstica DN dever ser da ordem de grandeza de
1 N e, portanto, a quantidade N DN no ir tender a zero, mesmo para
valores muito elevados de N. Smirnov (1948) determinou a distribuio limite da
varivel aleatria N DN , a qual, sob a premissa de veracidade da hiptese H0,
expressa por

lim 

N "!

N DN

2k  12  2
2 !
exp  8 z 2
z k 1

(7.28)

Portanto, para amostras de tamanho superior a 40, os valores crticos da estatstica


de teste DN sero 1,3581 N , para o nvel de significncia  = 0,05, e
1,6276 N , para = 0,01; esses valores resultam da soma dos cinco primeiros
termos da somatria da equao 7.28, e permanecem praticamente inalterados a
partir do sexto termo. Para amostras de tamanho inferior a 40, os valores crticos
de DN devem ser obtidos da Tabela 7.5. O exemplo 7.9 ilustra a aplicao do
teste de aderncia de Kolmogorov-Smirnov.
A construo da estatstica do teste KS parte da premissa que FX(x)
completamente conhecida e, portanto, que seus parmetros so especificados e,
portanto, no so estimados a partir da amostra. Entretanto, quando as estimativas
dos parmetros so obtidas dos elementos da amostra, simulaes de Monte
276

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

Carlo demonstram que o teste KS conservador quanto magnitude do erro do


tipo I, podendo ocorrer rejeies indevidas da hiptese nula. Com o objetivo de
corrigir tal situao, Crutcher (1975) apud Haan (1977), apresenta novas tabelas
de valores crticos da estatstica DN, para amostras de tamanhos variveis,
considerando, sob H0, as distribuies exponencial, gama, normal e Gumbel.

Tabela 7.5 Valores crticos da estatstica DN, do teste de aderncia KS


N

DN, 0,10

DN, 0,05

DN, 0,02

DN, 0,01

DN, 0,10

DN, 0,05

DN, 0,02

DN, 0,01

10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

0,369
0,352
0,338
0,325
0,314
0,304
0,295
0,286
0,279
0,271
0,265
0,259
0,253
0,247
0,242
0,238

0,409
0,391
0,375
0,361
0,349
0,338
0,327
0,318
0,309
0,301
0,294
0,287
0,281
0,275
0,269
0,264

0,457
0,437
0,419
0,404
0,390
0,377
0,366
0,355
0,346
0,337
0,329
0,321
0,314
0,307
0,301
0,295

0,489
0,468
0,449
0,432
0,418
0,404
0,392
0,381
0,371
0,361
0,352
0,344
0,337
0,330
0,323
0,317

26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
>40

0,233
0,229
0,225
0,221
0,218
0,214
0,211
0,208
0,205
0,202
0,199
0,196
0,194
0,191
0,189

0,259
0,254
0,250
0,246
0,242
0,238
0,234
0,231
0,227
0,224
0,221
0,218
0,215
0,213
0,210

0,290
0,284
0,279
0,275
0,270
0,266
0,262
0,258
0,254
0,251
0,247
0,244
0,241
0,238
0,235

0,311
0,305
0,300
0,295
0,290
0,285
0,281
0,277
0,273
0,269
0,265
0,262
0,258
0,255
0,252

1,22

1,36

N 1,52

N 1,63

Exemplo 7.9 Refaa o exemplo 7.8, com o teste de aderncia de


Kolmogorov-Smirnov.
Soluo: A ltima coluna da Tabela 7.1 apresenta as vazes mdias anuais
do Rio Paraopeba, em Ponte Nova do Paraopeba, j classificadas em ordem
crescente. As freqncias empricas correspondentes s vazes classificadas
podem ser calculadas pela equao 7.26. As freqncias tericas,
correspondentes distribuio Normal, podem ser calculadas por
F X X t*   X t*     , onde X t* representa a vazo classificada,  e 
denotam os parmetros populacionais, supostamente iguais a
X 86,105 e s X 24,960 , respectivamente, e (.) a FAP da distribuio
Normal. A Figura 7.5 apresenta o grfico das freqncias empricas e
tericas, versus as vazes mdias anuais classificadas.
No grfico da Figura 7.5, tambm est indicada a mxima diferena absoluta
entre as freqncias empricas e tericas, a qual foi calculada em
D Ncalc 0,08179 . Consultando a Tabela 7.5, para  = 0,05 (teste unilateral) e
HIDROLOGIA ESTATSTICA

277

CAPTULO 7 - TESTES DE HIPTESES

N=62, v-se que o valor crtico da estatstica de teste


D N ,0 ,05 1,36 / N 1,36 / 62 0 ,1727 , o qual define o limite inferior da regio
de rejeio da hiptese nula. Portanto, como D Ncalc  Dn ,0,05 , a deciso a de
no rejeitar a hiptese H0 de que o comportamento probabilstico da varivel
aleatria, em questo, possa ser modelado pela distribuio Normal.

Figura 7.5 Freqncias empricas e tericas para o teste de aderncia de


Kolmogorov-Smirnov

7.4.3 O Teste de Aderncia de Anderson-Darling (AD)


O poder dos testes de aderncia do Qui-Quadrado e de Kolmogorov-Smirnov,
de discriminar entre hipteses falsas e verdadeiras, bastante diminudo nas caudas
inferior e superior, tanto em funo do reduzido nmero de observaes amostrais,
quanto em decorrncia dos maiores erros de estimao, nessas parties do espao
amostral. Alternativamente, o teste de aderncia de Anderson-Darling um teste
no-paramtrico que procura ponderar mais fortemente as caudas das
distribuies, nas quais, as maiores (ou as menores) observaes da amostra
podem alterar sobremaneira a qualidade do ajuste. O teste de aderncia de
Anderson-Darling, tal como o de Kolmogorov-Smirnov, baseia-se na diferena
entre as funes de probabilidades acumuladas, emprica, FN(x), e terica, FX(x),
de variveis aleatrias contnuas. Entretanto, o teste AD d mais peso s caudas,
por meio da diviso das diferenas entre FN(x) e FX(x) por FX  x 1  FX  x  .
Desse modo, a estatstica do teste de Anderson-Darling torna-se

FN x   FX x 2 f x  dx
F x 1  FX x  X
! X
!

A2
278

HIDROLOGIA ESTATSTICA

(7.29)

CAPTULO 7 - TESTES DE HIPTESES

onde fX(x) a funo densidade, segundo a hiptese nula. Anderson e Darling


(1954) demonstraram que a equao 7.29 equivalente a
N

2i  1ln FX xi    ln 1  FX x N i 1  

i 1

A2  N 

(7.30)

onde {x(1), x(2), ... , x(m) , ... x(N)}representam as observaes ordenadas em modo
crescente.
Se a estatstica A2 resulta ser um valor elevado, as distribuies emprica, FN(x),
e terica, FX(x), diferem muito entre si e, em conseqncia, a hiptese nula deve
ser rejeitada. A distribuio de probabilidades da estatstica do teste AD depende
da distribuio de probabilidades hipottica FX(x). Se a distribuio de probabilidades,
sob H0, a Normal ou a Log-Normal, os valores crticos de A2 so os apresentados
na Tabela 7.6.

Tabela 7.6 - Valores crticos da estatstica A 2 do teste de aderncia


AD, se a distribuio hipottica Normal ou Log-Normal
(Fonte: DAgostino e Stephens, 1986).

2
crit ,

0,1
0,631

0,05
0,752

0,025
0,873

0,01
1,035

Para esse caso, a estatstica de teste, calculada pela equao 7.30, deve ser
2
multiplicada pelo fator de correo 1  0,75 N  2 ,25 N .

Se a distribuio de probabilidades, sob H0, a Weibull de dois parmetros, para


mnimos, ou a Gumbel, para mximos, os valores crticos de A2 so os apresentados
na Tabela 7.7.

Tabela 7.7 - Valores crticos da estatstica A 2 do teste de aderncia AD,


se a distribuio hipottica Weibull (mnimos, 2p) ou Gumbel (mximos)
(Fonte: DAgostino e Stephens, 1986).

2
crit ,

0,1
0,637

0,05
0,757

0,025
0,877

0,01
1,038

Para esse caso, a estatstica de teste, calculada pela equao 7.30, deve ser
multiplicada pelo fator de correo 1  0 ,2 N . A Tabela 7.7 pode ser usada
tambm para a distribuio exponencial.

No existem tabulaes dos valores crticos da estatstica A2a, para outras


distribuies de probabilidades passveis de serem includas na hiptese H0. Para
essas, as alternativas so (i) utilizar os outros testes de aderncia ou (ii) obter
HIDROLOGIA ESTATSTICA

279

CAPTULO 7 - TESTES DE HIPTESES

resultados aproximados e independentes de N, com os valores da Tabela 7.6. O


exemplo 7.10 ilustra a aplicao do teste de Anderson-Darling para as vazes
mdias anuais do Rio Paraopeba em Ponte Nova do Paraopeba.
Exemplo 7.10 - Refaa o exemplo 7.8, com o teste de aderncia de
Anderson-Darling.
Soluo: A Tabela 7.8 apresenta um resumo dos clculos necessrios para
a determinao da estatstica A2. Na Tabela 7.8, a distribuio hipottica
FX(x) a Normal, calculada por x  86,105 24,960 . A estatstica
de teste A2, sem correo, calculada por
N

A2  N  S i / N 62   3876,63 62 0,5262 .

Nesse caso, o fator de

i 1

correo 1  0 ,75 N  2,25 N 2  1,0127 . Logo, a estatstica de teste, j


corrigida, A2=0,5329. Consultando a Tabela 7.6, para  = 0,05 (teste
2
unilateral), v-se que o valor crtico da estatstica de teste Acrit
,0 ,05 0 ,752 ,
o qual define o limite inferior da regio de rejeio da hiptese nula. Portanto,
2
como A2  Acrit
,0 ,05 , a deciso a de no rejeitar a hiptese H0 de que o
comportamento probabilstico da varivel aleatria, em questo, possa ser
modelado pela distribuio Normal.
Tabela 7.8 Clculo da estatstica do teste de aderncia AD
Vazes mdias anuais em Ponte Nova do Paraopeba

280

Ano Civil

Xt

x(i)

x(N-i+1)

w=FX( x(i))

lnw

t = 1- FX( x(N-i+1))

lnt

1938
1939
1940
1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968

104,3
97,9
89,2
92,7
98
141,7
81,1
97,3
72
93,9
83,8
122,8
87,6
101
97,8
59,9
49,4
57
68,2
83,2
60,6
50,1
68,7
117,1
80,2
43,6
66,8
118,4
110,4
99,1
71,6

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

43,6
46,8
49,4
50,1
53,1
57
57,3
59,9
60,6
61,2
62,6
63,6
64,2
66,8
67,2
68,2
68,7
69,3
71,6
72
72,4
74,8
76,4
77,6
78
78,9
79
80,2
80,9
81,1
82,2

166,9
141,8
141,7
133,4
122,8
118,4
117,1
114,9
112,2
110,8
110,4
104,3
101
100,7
100,2
99,1
98
97,9
97,8
97,3
96,3
93,9
92,7
89,8
89,2
88,1
87,6
87,4
85,1
83,8
83,2

0,0443
0,0577
0,0707
0,0746
0,0930
0,1218
0,1242
0,1469
0,1534
0,1592
0,1732
0,1836
0,1901
0,2196
0,2244
0,2366
0,2428
0,2504
0,2806
0,2860
0,2915
0,3253
0,3487
0,3666
0,3727
0,3864
0,3880
0,4065
0,4174
0,4205
0,4378

-3,1170
-2,8532
-2,6492
-2,5959
-2,3748
-2,1054
-2,0855
-1,9181
-1,8745
-1,8377
-1,7535
-1,6949
-1,6603
-1,5158
-1,4943
-1,4415
-1,4155
-1,3848
-1,2709
-1,2518
-1,2328
-1,1230
-1,0535
-1,0034
-0,9870
-0,9508
-0,9469
-0,9002
-0,8737
-0,8662
-0,8259

0,0006
0,0128
0,0130
0,0291
0,0708
0,0979
0,1072
0,1243
0,1479
0,1612
0,1652
0,2330
0,2753
0,2794
0,2861
0,3013
0,3168
0,3183
0,3197
0,3269
0,3415
0,3774
0,3958
0,4412
0,4507
0,4681
0,4761
0,4793
0,5161
0,5368
0,5463

-7,4118
-4,3561
-4,3458
-3,5385
-2,6485
-2,3243
-2,2335
-2,0849
-1,9112
-1,8249
-1,8007
-1,4567
-1,2898
-1,2752
-1,2513
-1,1996
-1,1494
-1,1449
-1,1404
-1,1181
-1,0745
-0,9744
-0,9268
-0,8184
-0,7970
-0,7590
-0,7421
-0,7354
-0,6615
-0,6221
-0,6045

HIDROLOGIA ESTATSTICA

Si

-10,5288
-21,6279
-34,9750
-42,9406
-45,2095
-48,7266
-56,1469
-60,0445
-64,3572
-69,5882
-74,6371
-72,4854
-73,7520
-75,3583
-79,6224
-81,8735
-84,6409
-88,5369
-89,2179
-92,4257
-94,5990
-90,1897
-89,1165
-85,6203
-87,4178
-87,1999
-89,5146
-89,9578
-87,5081
-87,8140
-87,2570

CAPTULO 7 - TESTES DE HIPTESES

Tabela 7.8 Continuao


Ano Civil

Xt

x(i)

1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
Soma

62,6
61,2
46,8
79
96,3
77,6
69,3
67,2
72,4
78
141,8
100,7
87,4
100,2
166,9
74,8
133,4
85,1
78,9
76,4
64,2
53,1
112,2
110,8
82,2
88,1
80,9
89,8
114,9
63,6
57,3
-

32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
-

83,2
83,8
85,1
87,4
87,6
88,1
89,2
89,8
92,7
93,9
96,3
97,3
97,8
97,9
98
99,1
100,2
100,7
101
104,3
110,4
110,8
112,2
114,9
117,1
118,4
122,8
133,4
141,7
141,8
166,9
-

x(N-i+1)

w=FX( x(i))

lnw

t = 1- FX(x(N-i+1))

82,2
81,1
80,9
80,2
79
78,9
78
77,6
76,4
74,8
72,4
72
71,6
69,3
68,7
68,2
67,2
66,8
64,2
63,6
62,6
61,2
60,6
59,9
57,3
57
53,1
50,1
49,4
46,8
43,6
-

0,4537
0,4632
0,4839
0,5207
0,5239
0,5319
0,5493
0,5588
0,6042
0,6226
0,6585
0,6731
0,6803
0,6817
0,6832
0,6987
0,7139
0,7206
0,7247
0,7670
0,8348
0,8388
0,8521
0,8757
0,8928
0,9021
0,9292
0,9709
0,9870
0,9872
0,9994
-

-0,7904
-0,7696
-0,7258
-0,6526
-0,6465
-0,6314
-0,5990
-0,5819
-0,5039
-0,4739
-0,4177
-0,3958
-0,3852
-0,3831
-0,3810
-0,3585
-0,3371
-0,3276
-0,3220
-0,2653
-0,1805
-0,1758
-0,1601
-0,1328
-0,1133
-0,1030
-0,0734
-0,0295
-0,0130
-0,0129
-0,0006
-

0,5622
0,5795
0,5826
0,5935
0,6120
0,6136
0,6273
0,6334
0,6513
0,6747
0,7085
0,7140
0,7194
0,7496
0,7572
0,7634
0,7756
0,7804
0,8099
0,8164
0,8268
0,8408
0,8466
0,8531
0,8758
0,8782
0,9070
0,9254
0,9293
0,9423
0,9557

lnt
-0,5760
-0,5457
-0,5403
-0,5217
-0,4909
-0,4884
-0,4663
-0,4567
-0,4288
-0,3935
-0,3446
-0,3369
-0,3293
-0,2882
-0,2781
-0,2699
-0,2541
-0,2480
-0,2108
-0,2029
-0,1902
-0,1734
-0,1666
-0,1589
-0,1327
-0,1299
-0,0976
-0,0775
-0,0733
-0,0594
-0,0453

Si

-86,0798
-85,4897
-84,8258
-81,0272
-80,7582
-81,7478
-79,9020
-79,9734
-73,6792
-70,2554
-63,2723
-62,2813
-62,1633
-59,7466
-59,9829
-58,4502
-56,1626
-55,8340
-52,7537
-47,2844
-38,1828
-36,6677
-34,9479
-31,7866
-27,3070
-26,3125
-19,6692
-12,5184
-10,2788
-8,7484
-5,6465

-3876,63

* S i 2i  1ln w  ln t

7.4.4 O Teste de Aderncia de Filliben


O teste de aderncia de Filliben foi introduzido por Filliben (1975), como um
teste de verificao da hiptese nula de normalidade. Posteriormente, o teste de
Filliben foi adaptado, para contemplar diversas outras distribuies de
probabilidades, sob H0. Dada uma amostra {X1, X2, ... , XN}, de uma varivel
aleatria X, e posta a hiptese nula de que a amostra foi extrada de uma populao
cuja distribuio de probabilidades FX(x), a estatstica do teste de aderncia de
Filliben construda com base no coeficiente de correlao linear r, entre as
observaes ordenadas em modo crescente {x(1), x(2), ... , x(i) , ... x(N)} e os
quantis tericos {w1, w2, ... , wi , ... wN}, os quais so calculados por
wi FX1 1  q i  , onde qi representa a probabilidade emprica correspondente
ordem de classificao i. Formalmente, a estatstica do teste de Filliben expressa
por
N
xi   x wi  w 

i 1
(7.31)
r
N

x   x  w
2

i 1

 w 2

i 1

HIDROLOGIA ESTATSTICA

281

CAPTULO 7 - TESTES DE HIPTESES

i 1

i 1

onde x xi  N e w wi N .
A idia essencial do teste de aderncia de Filliben que a eventual existncia de
uma forte associao linear entre x(i) e wi , um indicador de que as observaes
podem, de fato, ter sido extradas de uma populao cuja distribuio de
probabilidades FX(x). Portanto, a hiptese nula H0: r = 1, a qual deve ser
testada contra a hiptese alternativa H1: r < 1, tratando-se de um teste unilateral.
Nesse caso, a regio de rejeio de H0, a um nvel se significncia , formada
pelos valores de r inferiores ao valor crtico rcrit, dado pela distribuio de
probabilidades da estatstica de teste. Assim, se r < rcrit,, a hiptese nula deve ser
rejeitada em favor de H1.
Na construo da estatstica de teste, expressa pela equao 7.31, implcita a
especificao de FX(x), na forma de wi FX1 1  q i  . As probabilidades
empricas qi, correspondentes s ordens de classificao i, so tambm
denominadas posies de plotagem e variam em conformidade especificao
de FX(x). Em geral, cada uma das diferentes frmulas para a posio de plotagem
qi procura obter quantis quase no-enviesados, em relao a cada uma das
diferentes distribuies de probabilidade FX(x). A maioria dessas frmulas pode
ser expressa pela seguinte expresso geral:
qi

ia
N  1  2a

(7.32)

onde a varia conforme a especificao de FX(x). A Tabela 7.9 apresenta um


sumrio das diferentes frmulas para a posio de plotagem, indicando tambm
os valores de a correspondentes, bem como as principais motivaes de sua
proposio, em conformidade com a especificao de FX(x).

Tabela 7.9 Frmulas para o clculo da posio de plotagem qi


Denominao

Frmula

qi

Weibull

Motivao

i
N 1

Probabilidades de superao noenviesadas para todas as distribuies.

Blom

qi

i3 8
N 1 4

0,375

Quantis no-enviesados para a


distribuio Normal.

Cunnane

qi

i  0 ,40
N  0 ,2

0,40

Quantis aproximadamente no-enviesados


para quase todas as distribuies.

Gringorten

qi

i  0 ,44
N  0 ,12

0,44

Otimizada para a distribuio de Gumbel.

Fonte: adaptada de tabela original de Stedinger et al. (1993).


282

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

Uma vez que os quantis wi variam conforme FX(x), evidente que a distribuio
de probabilidades da estatstica do teste tambm ir variar, de acordo com a
especificao da distribuio FX(x), sob a hiptese H0. A Tabela 7.10 apresenta
os valores crticos rcrit,  para o caso em que FX(x) especificada como a
distribuio Normal, com as probabilidades empricas qi calculadas pela frmula
de Blom. Os valores da Tabela 7.10 permanecem vlidos para os logaritmos de
uma varivel Log-Normal.
Tabela 7.10 Valores crticos rcrit, para a distribuio
Normal, com a =0,375 na equao 7.32.
N
10
15
20
30
40
50
60
75
100

= 0,10

= 0,05

= 0,01

0,9347
0,9506
0,9600
0,9707
0,9767
0,9807
0,9835
0,9865
0,9893

0,9180
0,9383
0,9503
0,9639
0,9715
0,9764
0,9799
0,9835
0,9870

0,8804
0,9110
0,9290
0,9490
0,9597
0,9664
0,9710
0,9757
0,9812

Fonte: adaptada de tabela original de Stedinger et al. (1993).

A Tabela 7.11 apresenta os valores crticos rcrit, para o caso em que FX(x)
especificada como a distribuio de Gumbel, para mximos, com as probabilidades
empricas qi calculadas pela frmula de Gringorten. Os valores da Tabela 7.11
permanecem vlidos para o caso em que FX(x) especificada como a distribuio
de Weibull de 2 parmetros.
Tabela 7.11 Valores crticos rcrit, para a distribuio
Gumbel, com a =0,44 na equao 7.32.
N

= 0,10

= 0,05

= 0,01

10
20
30
40
50
60
70
80
100

0,9260
0,9517
0,9622
0,9689
0,9729
0,9760
0,9787
0,9804
0,9831

0,9084
0,9390
0,9526
0,9594
0,9646
0,9685
0,9720
0,9747
0,9779

0,8630
0,9060
0,9191
0,9286
0,9389
0,9467
0,9506
0,9525
0,9596

Fonte: adaptada de tabela original de Stedinger et al. (1993).

HIDROLOGIA ESTATSTICA

283

CAPTULO 7 - TESTES DE HIPTESES

A Tabela 7.12 apresenta os valores crticos rcrit, para o caso em que FX(x)
especificada como a distribuio Generalizada de Valores Extremos - GEV, com
as probabilidades empricas qi calculadas pela frmula de Cunnane. Os valores
crticos da Tabela 7.12 foram obtidos por Chowdhury et al. (1991), mediante
simulaes de amostras de diferentes tamanhos, extradas da populao de uma
varivel aleatria GEV, com parmetro de forma especificado por .

Tabela 7.12 Valores crticos rcrit, para a distribuio GEV, com a=0,40 na
equao 7.32


    =_0,30     =_0,20       =_0,10=0=0,10=0,20

0,01
0,01
0,01
0,01
0,01
0,01

5
10
20
30
50
100

0,777
0,836
0,839
0,834
0,825
0,815

0,791
0,845
0,855
0,858
0,859
0,866

0,805
0,856
0,878
0,89
0,902
0,92

0,817
0,866
0,903
0,92
0,939
0,959

0,823
0,876
0,923
0,942
0,961
0,978

0,825
0,882
0,932
0,953
0,97
0,985

0,05
0,05
0,05
0,05
0,05
0,05

5
10
20
30
50
100

0,853
0,881
0,898
0,903
0,908
0,914

0,863
0,89
0,912
0,92
0,929
0,94

0,869
0,9
0,926
0,937
0,95
0,963

0,874
0,909
0,938
0,952
0,965
0,978

0,877
0,916
0,948
0,961
0,974
0,985

0,88
0,92
0,953
0,967
0,979
0,989

0,10
0,10
0,10
0,10
0,10
0,10

5
10
20
30
50
100

0,888
0,904
0,92
0,928
0,935
0,944

0,892
0,912
0,932
0,941
0,95
0,961

0,896
0,92
0,943
0,953
0,963
0,974

0,899
0,927
0,952
0,962
0,973
0,983

0,901
0,932
0,958
0,969
0,979
0,988

0,903
0,936
0,962
0,973
0,982
0,991

Vogel e McMartin (1991) empregaram simulaes de Monte Carlo para encontrar


os valores crticos rcrit, vlidos para variveis aleatrias distribudas segundo o
modelo Pearson Tipo III. De acordo com esses autores, o valor crtico da estatstica
do teste de Filliben, a um nvel de significncia  = 0,05, pode ser aproximado
pela seguinte expresso:

rcrit ,  0 ,05 exp 3,77  0,0290 2  0,000670 N N 0 ,105  0 ,758

(7.33)

onde denota o coeficiente de assimetria populacional da distribuio de Pearson


Tipo III, com posio de plotagem calculada pela frmula de Blom (a = 0,375).
A equao 7.33 vlida para  5 , podendo ser empregada tambm para os
logaritmos de variveis aleatrias distribudas segundo um modelo Log-Pearson
Tipo III.

284

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

Exemplo 7.11 - Refaa o exemplo 7.8, com o teste de aderncia de Filliben.


Soluo: A Tabela 7.8 apresenta os quantis observados x(i), j ordenados
em modo crescente. Os quantis tericos da distribuio Normal, de mdia
86,105 e desvio-padro 24,960, devem ser calculados pela funo inversa
1 q i  , onde qi denota a probabilidade emprica, tal como calculada pela
frmula de Blom, para a ordem de classificao i. Para exemplificar esse
clculo, considere que i = 1, resultando, portanto, em q1= 0,01004, para
N = 62 e a = 0,375 na equao 7.32. A inversa 1 q i  pode ser facilmente
calculada pela funo estatstica INV.NORM do software Microsoft Excel,
com argumentos qi,  e ; para o exemplo q1= 0,01004, com  = 86,105
e  = 24,960, a funo INV.NORM retorna o valor w1= 28,0769. Esse
clculo deve ser efetuado para todas as ordens de classificao at
i = N = 62. A Figura 7.6 apresenta o grfico entre os quantis tericos wi e
os observados x(i), assim como a linha correspondente associao linear
entre ambos.

XX

Figura 7.6 Associao entre os quantis tericos Normais e os observados


no Rio Paraopeba em Ponte Nova do Paraopeba

Em seguida aos clculos mencionados anteriormente, determina-se a


estatstica do teste de Filliben pela aplicao da equao 7.31, cujo resultado
r = 0,9798. Consultando a Tabela 7.10, para= 0,05 (teste unilateral),
e usando interpolao linear entre os valores de N iguais a 60 e 75, v-se
que o valor crtico da estatstica de teste rcrit,0,05= 0,9803, o qual define o
limite superior da regio de rejeio da hiptese nula. Portanto, como
r < rcrit,0,05, a deciso a de rejeitar a hiptese H0 de que o comportamento
probabilstico da varivel aleatria, em questo, possa ser modelado pela
distribuio Normal.
HIDROLOGIA ESTATSTICA

285

CAPTULO 7 - TESTES DE HIPTESES

7.4.5 Comentrios a Respeito dos Testes de Aderncia


Em geral, os testes de aderncia so deficientes em discernir as diferenas entre
as freqncias tericas e empricas (e/ou quantis tericos e empricos), nas caudas
inferior e superior das distribuies em anlise. No contexto da anlise de freqncia
de variveis hidrolgicas, essa limitao dos testes de aderncia crtica, uma vez
que as amostras so de tamanho relativamente pequeno e que, em geral, o interesse
o de inferir sobre o comportamento da varivel aleatria, justamente, nas caudas
de sua distribuio de probabilidades. Por exemplo, o teste do 2, quando aplicado
a variveis aleatrias contnuas, est sujeito prescrio de classes, cujo nmero
e amplitude podem interferir profundamente na deciso do teste. No caso do
teste de Kolmogorov-Smirnov, a mera observao de sua tabela de valores crticos
(Tabela 7.5), revela o conservadorismo do teste no que se refere deciso de
rejeio da hiptese nula. O teste de Anderson-Darling, apesar de constituir uma
interessante alternativa aos testes KS e do 2, apresenta a limitao de que a
distribuio de sua estatstica de teste conhecida apenas para algumas
distribuies hipotticas FX(x). O teste de Filliben, como alternativa restante,
apresenta, como principais vantagens, a simplicidade de construo de sua
estatstica de teste e algumas comparaes favorveis de seu poder de teste, em
relao aos demais, tais como aquelas apontadas por Chowdhury et al. (1991) e
Vogel e McMartin (1991). Entretanto, esses mesmos autores demonstram o baixo
poder do teste de Filliben, quando se trata de anlise de freqncia local, com
base em amostras de tamanho relativamente pequeno.
Os testes de aderncia, como quaisquer testes de hipteses, tm o objetivo de
verificar se h uma diferena estatisticamente significativa entre as observaes e
as supostas realizaes, caso essas proviessem de uma populao hipottica
includa em H0. Portanto, a eventual deciso de no rejeitar a hiptese nula, a um
nvel de significncia previamente estabelecido, no implica em estabelecer a idia
de que os dados foram, de fato, amostrados a partir da populao hipottica.
Essa , por princpio, desconhecida e pode ser uma, entre tantas outras populaes
includas na hiptese alternativa H1. Por outro lado, as estatsticas dos testes de
aderncia tm distribuies de probabilidades e, portanto, valores crticos que
dependem da distribuio FX(x), sob H0, assim como, implicitamente, de suas
estimativas paramtricas e dos respectivos erros de estimativa. Com essas
consideraes em mente, possvel concluir que os resultados de diferentes testes
de aderncia no so comparveis entre si e, portanto, no se prestam seleo
do modelo distributivo mais adequado para uma certa amostra de observaes.

286

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

7.5 Teste para Deteco e Identificao de Pontos Atpicos (outliers)


Em uma certa amostra de observaes, um elemento ou ponto amostral
considerado atpico, ou um outlier, do ponto de vista estatstico, quando ele se
desvia significativamente do conjunto dos outros pontos. Esse desvio pode ter
origem em erros de medio ou de processamento, mas tambm pode ser o
produto de causas naturais indeterminadas. Em qualquer caso, a presena de
pontos atpicos em uma dada amostra, pode afetar drasticamente o ajuste de uma
certa distribuio de probabilidades queles dados. No item 2.1.4 do captulo 2,
foi descrito um procedimento de identificao de pontos atpicos, por meio dos
quartis amostrais e da amplitude inter-quartis. Este procedimento, embora bastante
til, meramente exploratrio e no constitui, do ponto de vista estatstico, um
teste de hiptese, com um nvel de significncia previamente estabelecido.
Entre os diversos testes de hipteses para deteco e identificao de pontos
atpicos, o teste de Grubbs e Beck, descrito por Grubbs (1950, 1969) e estendido
por Grubbs e Beck (1972), encontra-se entre os mais freqentemente empregados.
De acordo com esse teste, as quantidades xS e xI definem, respectivamente, os
limites superior e inferior, acima e abaixo dos quais, os pontos atpicos,
eventualmente presentes em uma amostra, so detectados e identificados. Essas
quantidades so definidas pelas seguintes expresses:
x S exp x  k N , s X 
e
x I exp x  k N , s X 

(7.34)
(7.35)

onde x e s X representam, respectivamente, a mdia aritmtica e o desvio-padro


de uma amostra de tamanho N, de uma varivel aleatria X, e kN, denota o valor
crtico da estatstica de Grubbs e Beck, para um nvel de significncia . Para
100= 10%, Pilon et al. (1985) propem a seguinte aproximao para o valor
crtico da estatstica de Grubbs e Beck:

k N , 0 ,10 3,62201  6,28446 N 1 4  2,49835 N 1 2 


0 ,491436 N

34

(7.36)

 0 ,037911 N

De acordo com o teste de Grubbs e Beck, a um nvel  = 0,10 e k N ,0,10 dado


pela equao 7.36, as observaes eventualmente superiores a xS, e/ou inferiores
a xI, estariam se desviando significativamente do conjunto dos dados e deveriam
ser consideradas como outliers.

HIDROLOGIA ESTATSTICA

287

CAPTULO 7 - TESTES DE HIPTESES

Uma vez detectados e identificados os pontos atpicos presentes em uma amostra,


a deciso de mant-los ou expurg-los da anlise de freqncia matria de
investigao suplementar. Se o exame detalhado de uma certa observao atpica
for conclusivo, quanto a caracteriz-la como uma medio incorreta ou sujeita a
erros de processamento, ela deve ser certamente expurgada da anlise. Entretanto,
se a observao atpica resultar de causas naturais, tais como a manifestao de
fenmenos extraordinrios e diferenciados, em relao ao conjunto dos outros
pontos amostrais, a melhor deciso certamente a de manter os outliers na anlise
de freqncia, buscando encontrar o modelo probabilstico, ou os modelos
probabilsticos, que melhor descrevam aquele comportamento observado.

Exerccios
1) Considere o teste da hiptese nula H0: p = 0,5, contra H1: p > 0,5, onde p
representa a probabilidade de sucesso em 18 tentativas independentes de um
processo de Bernoulli. A deciso arbitrada como a de rejeitar a hiptese nula,
caso a varivel aleatria discreta Y, dada pelo nmero de sucessos em 18 tentativas,
seja maior ou igual a 13. Calcule a funo poder do teste, denotada por [1-(p)],
e ilustre-a graficamente, para diferentes valores de p > 0,5.
2) Repita o exerccio 1, para a hiptese alternativa H1: p 0,5.
3) Considere as vazes mdias anuais do Rio Paraopeba em Ponte Nova do
Paraopeba, listadas na Tabela 7.1. Suponha que essa amostra tenha sido extrada
de uma populao Normal, de desvio-padro populacional conhecido e igual a
 = 24,960 m3/s. Teste a hiptese H0: 1= 85 m3/s, contra a alternativa
H1:2= 90 m3/s, para = 0,05.
4) Repita o exerccio 3, supondo que, desta feita, o desvio-padro populacional
no conhecido.
5) Refaa o exerccio 3 para a hiptese alternativa H1 :1 85 m3/s.
6) Repita o exerccio 5, supondo que, desta feita, o desvio-padro populacional
no conhecido.
7) Considerando, novamente, as vazes mdias anuais do Rio Paraopeba em
Ponte Nova do Paraopeba, listadas na Tabela 7.1, separe-as em duas amostras
de igual tamanho, uma para o perodo de 1938 a 1968, e a outra para o perodo
de 1969 a 1999. Supondo tratarem-se de variveis normais, teste a hiptese de
288

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

que, considerados os perodos de 1938-1968 e de 1969-1999, as mdias


populacionais correspondentes no diferem entre si, em mais de 5 m3/s, para
= 0,05.
8) De volta s vazes mdias anuais do Rio Paraopeba em Ponte Nova do
Paraopeba, listadas na Tabela 7.1, suponha que essa amostra tenha sido extrada
de uma populao Normal, de mdia populacional conhecida e igual a
 = 86,105 m3/s. Teste a hiptese H0: 1 = 25 m3/s, contra a alternativa
H1:= 1 < 25 m3/s, para = 0,05.
9) Repita o exerccio 8, supondo que, desta feita, a mdia populacional no
conhecida.
10) Considerando, novamente, as vazes mdias anuais do Rio Paraopeba em
Ponte Nova do Paraopeba, listadas na Tabela 7.1, separe-as em duas amostras
de igual tamanho, uma para o perodo de 1938 a 1968, e a outra para o perodo
de 1969 a 1999. Supondo tratarem-se de variveis normais, teste a hiptese de
que, considerados os perodos de 1938-1968 e de 1969-1999, as varincias
populacionais correspondentes no diferem entre si, para = 0,05.
11) Repita o exerccio 10, considerando que a hiptese nula, desta feita, a de
que a varincia do perodo de 1938 a 1968, 10% maior do que a correspondente
ao perodo de 1969-1999.
12) Considere a amostra de alturas dirias de precipitao mxima anual da estao
pluviomtrica de Ponte Nova do Paraopeba, listadas no Anexo 3. Teste a hiptese
nula de que as observaes so aleatrias, para = 0,05.
13) Com os dados do exerccio 12, teste a hiptese nula de que as observaes
so independentes, para = 0,05.
14) Com os dados do exerccio 12, teste a hiptese nula de que as observaes
so homogneas, para = 0,05.
15) Com os dados do exerccio 12, teste a hiptese nula de que as observaes
so estacionrias, para = 0,05.
16) Fez-se a contagem de E. Coli em 10 amostras de gua. As contagens positivas,
expressas em centenas de organismos por 100 ml de gua (102/100ml), so 17,
21, 25, 23, 17, 26, 24, 19, 21 e 17, com mdia e a varincia amostrais iguais a 21
e 10,6 respectivamente. Suponha que N represente o nmero total dos diferentes
HIDROLOGIA ESTATSTICA

289

CAPTULO 7 - TESTES DE HIPTESES

organismos presentes em cada amostra e que p represente a frao correspondente


ao organismo E. Coli. Ajuste uma distribuio Binomial varivel Y=centenas de
organismos E. Coli por 100 ml de gua. Verifique a aderncia da distribuio
Binomial aos dados amostrais, por meio do teste do2, a um nvel de significncia
= 0,10.
17) Para os dados do exerccio 12, teste a aderncia da distribuio Log-Normal,
de 2 parmetros, por meio do teste do 2, a um nvel de significncia = 0,05.
18) Para os dados do exerccio 12, teste a aderncia da distribuio Gumbel (mximos),
por meio do teste do 2, a um nvel de significncia = 0,05.
19) Para os dados do exerccio 12, teste a aderncia da distribuio GEV, por
meio do teste do 2, a um nvel de significncia = 0,05.
20) Para os dados do exerccio 12, teste a aderncia da distribuio Exponencial, por
meio do teste do 2, a um nvel de significncia = 0,05.
21) Para os dados do exerccio 12, teste a aderncia da distribuio Pearson Tipo III,
por meio do teste do 2, a um nvel de significncia = 0,05.
22) Para os dados do exerccio 12, teste a aderncia da distribuio Log-Pearson
Tipo III, por meio do teste do 2, a um nvel de significncia = 0,05.
23) Para os dados do exerccio 12, teste a aderncia da distribuio Log-Normal,
de 2 parmetros, por meio do teste de Kolmogorov-Smirnov, a um nvel de
significncia = 0,05.
24) Para os dados do exerccio 12, teste a aderncia da distribuio Gumbel
(mximos), por meio do teste de Kolmogorov-Smirnov, a um nvel de significncia
= 0,05.
25) Para os dados do exerccio 12, teste a aderncia da distribuio GEV, por
meio do teste de Kolmogorov-Smirnov, a um nvel de significncia = 0,05.
26) Para os dados do exerccio 12, teste a aderncia da distribuio Exponencial,
por meio do teste de Kolmogorov-Smirnov, a um nvel de significncia = 0,05.
27) Para os dados do exerccio 12, teste a aderncia da distribuio Pearson
Tipo III, por meio do teste de Kolmogorov-Smirnov, a um nvel de significncia
= 0,05.
290

HIDROLOGIA ESTATSTICA

CAPTULO 7 - TESTES DE HIPTESES

28) Para os dados do exerccio 12, teste a aderncia da distribuio Log-Pearson


Tipo III, por meio do teste de Kolmogorov-Smirnov, a um nvel de significncia
= 0,05.
29) Para os dados do exerccio 12, teste a aderncia da distribuio Log-Normal,
de 2 parmetros, por meio do teste de Anderson-Darling, a um nvel de significncia
= 0,05.
30) Para os dados do exerccio 12, teste a aderncia da distribuio Gumbel
(mximos), por meio do teste de Anderson-Darling, a um nvel de significncia
= 0,05.
31) Para os dados do exerccio 12, teste a aderncia da distribuio Exponencial,
por meio do teste de Anderson-Darling, a um nvel de significncia = 0,05.
32) Para os dados do exerccio 12, teste a aderncia da distribuio Log-Normal,
de 2 parmetros, por meio do teste de Filliben, a um nvel de significncia
 = 0,05.
33) Para os dados do exerccio 12, teste a aderncia da distribuio Gumbel
(mximos), por meio do teste de Filliben, a um nvel de significncia  = 0,05.
34) Para os dados do exerccio 12, teste a aderncia da distribuio GEV, por
meio do teste de Filliben, a um nvel de significncia = 0,05.
35) Para os dados do exerccio 12, teste a aderncia da distribuio Pearson Tipo III,
por meio do teste de Filliben, a um nvel de significncia = 0,05.
36) Para os dados do exerccio 12, teste a aderncia da distribuio Log-Pearson
Tipo III, por meio do teste de Filliben, a um nvel de significncia = 0,05.
37) Para os dados do exerccio 12, use o teste de Grubbs e Beck, com  = 0,10,
para detectar e identificar a presena de pontos atpicos. Compare os resultados
com aqueles encontrados por meio do critrio da amplitude inter-quartis. Lembrese que, segundo tal critrio, considerado um ponto atpico superior todo elemento
da amostra superior a (Q3+1,5AIQ) e, analogamente, um ponto atpico inferior
todo e qualquer elemento menor do que (Q1-1,5AIQ), onde Q1 e Q3 representam,
respectivamente, o primeiro e o terceiro quartis, e AIQ= Q3- Q1.

HIDROLOGIA ESTATSTICA

291

CAPTULO 7 - TESTES DE HIPTESES

292

HIDROLOGIA ESTATSTICA

Das könnte Ihnen auch gefallen