Beruflich Dokumente
Kultur Dokumente
RESUMO
Introduo: Os principais testes estatsticos tm como suposio a normalidade dos dados, que Revista HCPA. 2012;32(2):227-234
deve ser verificada antes da realizao das anlises principais.
1
Departamento de Estatstica,
Objetivo: Revisar as tcnicas de verificao da normalidade dos dados e comparar alguns testes de
Instituto de Matemtica,
aderncia normalidade para diferentes distribuies de origem e tamanho amostral.
Universidade Federal do Rio
Metodologia: Atravs da simulao de cinco distribuies (Normal, t-student, Qui-Quadrado, Grande do Sul, UFRGS.
Gama e Exponencial) e seis tamanhos amostrais (10, 30, 50, 100, 500 e 1000) foram simulados
5000 amostras de cada par distribuio-tamanho amostral e realizados os testes Qui-quadrado, 2
Unidade de Bioestatstica,
Kolmogorov-Smirnov, Lilliefors, Shapiro-Wilk, Shapiro-Francia, Cramer-von Mises, Anderson- Grupo de Pesquisa e Ps-
Darling e Jarque-Bera. Graduao, Hospital de Clnicas de
Porto Alegre.
Resultados: Os resultados obtidos mostram uma clara superioridade dos testes Shapiro-Francia e
Shapiro-Wilk, com percentuais de acerto de 72,41% e 72,15%, respectivamente. Entre os piores
Contato:
resultados encontramos o Kolmogorov-Smirnov e Qui-Quadrado, com percentual de acerto de
Vanessa Bielefeldt Leotti Torman
44,78% e 61,58%, respectivamente.
vanessa.leotti@ufrgs.br
Concluses: Para amostras pequenas recomenda-se que sejam utilizados procedimentos no Porto Alegre, RS, Brasil
paramtricos diretamente para a anlise, em funo da baixa performance dos testes de aderncia
normalidade, dado o baixo percentual de acertos. Para amostras maiores, recomenda-se o uso
dos testes Shapiro-Francia ou Shapiro-Wilk.
Palavras-chave: Distribuio normal; teste de aderncia; Qui-quadrado; Kolmogorov-Smirnov;
Lilliefors; Shapiro-Wilk; Shapiro-Francia; Cramer-von Mises; Anderson-Darling; Jarque-Bera;
poder; erro tipo I
ABSTRACT
Background: The main statistical tests have the normality assumption that must be verified before
performing the main analyzes.
Objective: To review the techniques of testing for normality of data and compare some adherence
tests for different true distributions and sample size.
Method: Through simulation of five distributions (Normal, t-Student, Chi-Square, Gamma and
Exponential) and six sample sizes (10, 30, 50, 100, 500 and 1000) were simulated 5000 samples
of each pair sample size-distribution and applied the Chi-square, Kolmogorov-Smirnov, Lilliefors,
Shapiro-Wilk, Shapiro-Francia, Cramer-von Mises, Anderson-Darling and Jarque-Bera tests.
Results: The results show a clear superiority of the Shapiro-Francia and Shapiro-Wilk tests, with
percentages of accuracy of 72.41% and 72.15% respectively. Among the worst results we find
the Kolmogorov-Smirnov and Chi-Square, with percentage of accuracy of 44.78% and 61.58%
respectively.
Toda varivel aleatria, seja idade de um grupo de pessoas Assim, importante termos mtodos para verificar se
ou a ocorrncia de um determinado desfecho, assume uma distribuio dos dados que estamos estudando se ajusta a
determinada distribuio de frequncias na populao, uma distribuio normal. H metodologias descritivas, como
que podem ter formas variadas (1). Na literatura estatstica a anlise visual de alguns grficos, e tambm testes no-
encontra-se muitas distribuies tericas. Essas so modelos paramtricos de aderncia, que testam objetivamente a
que procuram representar o comportamento de determinado hiptese de normalidade. Este artigo pretende revisar essas
evento em funo da frequncia de sua ocorrncia. No caso das metodologias existentes e comparar o desempenho de alguns
variveis contnuas, esse evento ser um intervalo de valores. testes no-paramtricos por simulao.
As distribuies de frequncias so, na verdade, distribuies
Cumpre ressaltar que os testes t de Student so classificados
de probabilidade, onde para um evento teremos uma
como testes paramtricos porque exigem uma distribuio
probabilidade de ocorrncia associada. Em outras palavras, a
de probabilidade especfica para a varivel aleatria, no
partir de uma distribuio de probabilidade completamente
caso a distribuio Normal. Entretanto, existem outras
especificada, pode-se calcular a probabilidade de uma varivel
tcnicas paramtricas que suportam outras distribuies
aleatria assumir determinado intervalo de valores.
de probabilidade. Assim, quando os dados no so normais,
Nesse artigo o objeto de estudo a mais conhecida tm-se pelo menos duas solues: a primeira procurar
distribuio de probabilidades: a distribuio Normal ou outro teste paramtrico cuja distribuio de probabilidade
Gaussiana. A suposio de normalidade da(s) varivel(is) assumida se ajuste melhor aos dados; a segunda usar testes
aleatria(s) exigida para a realizao de muitos mtodos de no-paramtricos, como o teste de Mann-Whitney, que no
inferncia estatstica, tais como: fazem pressuposio sobre a distribuio dos dados. Como
nos programas estatsticos mais conhecidos, como o SPSS,
- No caso de uma amostra de uma nica populao, a
os outros testes paramtricos no esto implementados,
suposio de normalidade exigida quando deseja-se obter
usualmente a segunda opo adotada. Assim, a classificao
intervalo de confiana ou executar teste de hiptese sobre a
de paramtrico ou no-paramtrico referente ao tipo de
mdia dessa populao baseados na estatstica t.
teste estatstico, e no varivel aleatria. No correto dizer
- No caso de duas amostras de populaes independentes, que uma especfica varivel paramtrica ou no-paramtrica.
para realizar o teste t de comparao de mdias para amostras
Na prxima sesso, os mtodos disponveis para a
independentes, necessrio que a varivel aleatria assuma
verificao da hiptese de normalidade sero revisados e o
distribuio normal em ambas as populaes (grupos).
estudo de simulao procedido ser descrito. Aps, tem-se
- No caso de duas amostras pareadas (ou relacionadas), a sesso que apresentar os resultados da simulao, e na
para utilizar o teste t de comparao das mdias, necessrio sequncia, as concluses do trabalho.
que a varivel aleatria da diferena entre as duas amostras
Mtodos
tenha distribuio normal.
O primeiro mtodo para verificao do formato da
- No caso de trs ou mais amostras de populaes
distribuio de uma varivel contnua a construo do
independentes, para comparamos as mdias das populaes
histograma. O histograma um grfico de barras justapostas em
atravs da Anlise de Varincia em classificao simples (One-
que no eixo horizontal est a varivel de interesse dividida em
Way ANOVA), entre outras suposies, tem-se que pressupor
classes e no eixo vertical a frequncia da classe correspondente
que a varivel aleatria tenha distribuio normal em cada
(2). Este grfico est disponvel na maioria dos programas
uma das populaes (grupos).
estatsticos. No SPSS verso 18.0, uma das maneiras de obter
- Na estimao da correlao linear de Pearson, o teste de esse grfico atravs do menu Analyze -> Descriptive Statistics ->
significncia do coeficiente de correlao somente vlido se Explore -> Plots marcando-se Histogram. Atravs do histograma,
ambas as variveis aleatrias tiverem distribuio Normal. buscamos verificar se a forma de sino da distribuio Normal
est presente.
- Nos modelos de regresso linear, uma das suposies de
que os resduos do modelo tenham distribuio Normal. Na Figura 1, tem-se dois exemplos de histogramas provenientes
de amostras de tamanho 100, onde, na Figura 1-a tem-se forma simtrica da Normal est presente na Figura 1-a, mas
dados gerados de uma distribuio Normal, e na Figura 1-b, no na Figura 1-b, como esperado.
dados gerados de uma distribuio Gama. Verifica-se que a
Outro grfico que pode ser utilizado para avaliar a solicitou o Histograma anteriormente.
normalidade de uma varivel o grfico Quantil-Quantil,
Na Figura 2, tem-se dois exemplos de Q-Q Plots
ou Q-Q Plot. Neste grfico, no eixo horizontal tem-se os
provenientes de amostras de tamanho 100, novamente
valores observados da varivel, e no eixo vertical, os valores
de dados gerados de uma distribuio Normal (Figura 2-a),
esperados caso a varivel tenha distribuio Normal. Se
e dados gerados de uma distribuio Gama (Figura 2-b).
h uma boa aderncia dos dados distribuio Normal os
Verifica-se que os pontos de aproximam bem da reta no
pontos esto prximos a reta de referncia apresentada no
caso da varivel com distribuio Normal, mas h um grande
grfico. No SPSS verso 18.0, obtm-se o Q-Q Plot marcando-
desvio para a varivel com distribuio Gama.
se Normality Plots with Tests, na mesma janela onde se
Os mtodos grficos citados anteriormente tm a programa R verso 2.15.0 (3), atravs das funes pearson.test,
desvantagem de serem subjetivos, pois dependem de ks.test, lillie.test, shapiro.test, sf.test, cvm.test, ad.test e jarque.
interpretao visual. Para um resultado mais objetivo, pode- beta.test, respectivamente. As funes ks.test e shapiro.test
se usar testes no-paramtricos de aderncia distribuio esto disponveis na instalao bsica do R, j a funo jarque.
Normal. Algum deles so: Qui-quadrado de Pearson (QQ), bera.test pertence ao pacote tseries (4) e as demais funes
Kolmogorov-Smirnov (KS), Lilliefors (LF) que apenas uma pertencem ao pacote nortest (5).
correo para o teste KS), Shapiro-Wilk (SW), Shapiro-Francia
Estes testes de aderncia tm estatsticas de teste e critrios
(SF), Cramer-von Mises (CM), Anderson-Darling (AD) e Jarque-
de deciso diferentes, entretanto tm em comum as hipteses
Bera (JB).
testadas: a hiptese de nulidade de que a varivel aleatria
Apenas os quatro primeiros testes citados esto disponveis adere distribuio Normal, contra a hiptese alternativa
no SPSS verso 18.0, sendo que o teste qui-quadrado de que a varivel aleatria no adere distribuio Normal.
bastante trabalhoso pois necessita que se classifique a varivel A maneira mais fcil de tomar a deciso observar o valor-p
manualmente, bem como o clculo das frequncias esperadas. dos testes e comparar com o nvel de significncia adotado.
O teste Kolmogorov-Smirnov pode ser obtido em Analyze -> Se o valor-p do teste for menor que o nvel de significncia
Nonparametric Testes -> Legacy Dialogs -> 1-Sample KS. Os escolhido, rejeita-se a hiptese de normalidade. Mais detalhes
testes de Lilliefors e Shapiro-Wilk so exibidos marcando-se sobre estes testes podem ser encontrados em (6) e (7).
Normality Plots with Tests, da mesma maneira utilizada para
Procedendo-se os testes de Lilliefors e Shapiro-Wilk para os
obter o Q-Q Plot. Todos os testes citados esto disponveis no
dados mostrados na Figura 1, tem-se os resultados do Quadro 1.
Considerando um nvel de significncia de 5%, atravs do 3) Para cada distribuio e tamanho amostral, simulou-se
Quadro 1, percebe-se que tanto os dois testes no rejeitam 5000 amostras.
a hiptese de normalidade para a varivel com distribuio
Para analisar a eficincia dos testes foi averiguado o
Normal e rejeitam esta hiptese para a varivel com
percentual de vezes que a deciso correta foi tomada,
distribuio Gama. Entretanto, em algumas situaes os testes
utilizando 5% como nvel de significncia. Isto significa que
podem discordar na deciso estatstica. Zar (8) no recomenda
para a distribuio normal foi avaliado a proporo de no
o uso dos testes qui-quadrado e Kolmogorov-Smirnov, pois os
rejeies da hiptese de nulidade, isto , o complementar da
mesmos tm poder muito baixo, ou seja, em muitas situaes
probabilidade do erro tipo I, ou seja, a especificidade do teste,
onde os dados realmente no provm de uma distribuio
enquanto para as demais distribuies foi avaliada a proporo
normal, estes testes no conseguem rejeitar a hiptese de
de rejeies da hiptese de nulidade, ou seja, o poder ou
nulidade.
sensibilidade do teste. As simulaes foram procedidas no
Assim, torna-se interessante verificar o desempenho dos programa R 2.15.0.
mesmos atravs de simulao, para tentar identificar algum
Resultados do estudo de simulao
com melhor desempenho. Para tanto, procedeu-se um estudo
As funes densidades de probabilidade das distribuies
de simulao com a seguinte configurao:
no-normais simuladas, bem como a densidade da distribuio
1) Foram simuladas variveis de 6 distribuies diferentes: Normal com mesma mdia e varincia de cada uma dessas
Normal (0,1), Qui-quadrado (3), t-student (10), Gama (10,1/3) distribuies encontram-se na Figura 3. Percebe-se que a
e Exponencial (5). distribuio mais similar Normal (representada em vermelho
em todos os grficos) a t-student (10) e a mais discrepante
2) Para todas as variveis foram utilizados 6 tamanhos
a Exponencial (5).
amostrais distintos: 10, 30, 50, 100, 500 e 1000.
Figura 3 - Funes densidade das distribuies simuladas (em preto) e distribuio normal
com mesma mdia e varincia (em vermelho).
Os resultados obtidos nas simulaes foram sintetizados e (Jarque-Bera), conforme a Tabela 1. A dificuldade dos testes em
apresentados na Figura 4, Tabela 1 e 2. identificarem corretamente a falta de normalidade quando os
dados seguem a distribuio t-student se deve ao fato das duas
Na Figura 4 encontramos o percentual de acertos de cada
distribuies possurem densidades muito parecidas. Levando
teste para cada distribuio e tamanho amostral. Em relao s
em considerao todos os tamanhos amostrais, o teste que
amostras provenientes da distribuio Normal, percebe-se que
melhor identificou os dados provenientes da distribuio
o teste de Kolmogorov-Smirnov tem um comportamento no
t-student foi o Shapiro-Francia, com 39,26% de acertos, e nas
esperado em relao ao erro tipo I pois, mesmo realizando-se
distribuies restantes o teste Shapiro-Wilk obteve melhores
o teste com 5% de significncia, este no rejeitou a hiptese
resultados.
de normalidade em nenhuma amostra independentemente do
tamanho amostral. Com exceo desse teste, todos os demais Outro resultado importante que verifica-se na Tabela 1
parecem ter taxas de erro tipo I adequadas, prximas do o percentual total de acertos de cada teste, onde o teste de
valor nominal de 5%, pois o percentual de acerto foi prximo Shapiro-Francia obteve melhor percentual de acertos (72,41%),
do esperado (95%) para a maioria dos tamanhos amostrais seguido pelo teste Shapiro-Wilk, (72,15%). J entre os piores
considerados. Em relao s demais distribuies simuladas, resultados, encontram-se o teste Qui-quadrado (61,58%) e o
o teste Kolmogorov-Smirnov apresentou o menor poder KS (44,78%).
independentemente da distribuio para amostras menores
possvel perceber tambm que o desempenho dos testes
que 500, sendo portanto no recomendvel, concordando
pode ser muito ruim para tamanhos de amostrais pequenos.
com Zar (8).
Para as distribuies mais parecidas com a Normal (Gama e t),
Para a distribuio t-student os testes diferem bastante mesmo os melhores testes s conseguem ter poder acima de
mesmo para o maior tamanho amostral, tendo o percentual de 70% a partir de n=500.
acerto variado desde 1,72% (Kolmogorov-Smirnov) at 94,36%
Tabela 1 - Percentual de acerto dos testes para cada distribuio e tamanho amostral.
Referncias
1. Callegari-Jacques SM. Bioestatstica Disponvel em: http://www.R-project. 6. Thode HC. Testing for normality. New
princpios e aplicaes. Porto Alegre: org/ York: Marcel Dekker; 2002.
Artmed; 2003.
4. Trapletti A, Hornik K. tseries: Time 7. DAgostino RB, Stephens MA.
2. Soares JF. Introduo estatstica Series Analysis and Computational Goodness-of-fit techniques. New York:
mdica. Belo Horizonte, MG: Finance. 2012. Disponvel em: http:// M. Dekker; 1986.
COOPMED; 2002. CRAN.R-project.org/package=tseries
8. Zar JH. Biostatistical analysis. Upper
3. Team RDC. R: A Language and 5. Gross J. nortest: Tests for Normality. Saddle River, N.J.: Prentice Hall; 1999.
Environment for Statistical 2012. Disponvel em: http://CRAN.R-
Computing. Vienna, Austria; 2011. project.org/package=nortest
Recebido: 16/02/2012
Aceito: 16/04/2012