Sie sind auf Seite 1von 34

Estatstica no paramtrica e

livre de distribuio
Introduo
At agora, todos os estimadores utilizados foram
paramtricos, com exceo
2
Teste de ajustamento
Teste de homogeneidade
Teste de independncia

A diferena entre os testes paramtricos e os no
paramtricos que, no primeiro, precisamos saber a forma
da distribuio da populao (normal, exp....)
Ex: teste t, precisa de uma pop. que tenha distribuio, no
mnimo, prxima de normal.
_
Introduo
Aqui, os procedimentos:
no se preocupam com os parmetros da populao
ou
no dependem do conhecimento da populao amostrada

No paramtrico: testam hipteses que no sejam
afirmaes sobre parmetros da populao
Independente de distribuio: no fazem nenhuma
suposio sobre a populao amostrada

Porm, esses termos podem ser intercambiveis, como
usaremos aqui.
Vantagens
1. Permitem teste de hiptese que no sejam afirmaes
sobre valores de parmetros da populao.

2. Testes no paramtricos podem ser usados quando a
forma da populao amostrada desconhecida.

3. So mais fceis e, mais rpidos de utilizar.

4. Podem ser aplicados quando os dados analisados
consistem de ranks ou classificaes, sem operaes
aritmticas, necessrias para os testes paramtricos.
Desvantagens
1. O uso de procedimentos no paramtricos em dados que
poderiam ser aplicados em testes paramtricos um
desperdcio, pois a anlise paramtrica tem melhores
resultados.

2. Os testes no paramtricos esto amplamente
distribudos na literatura.

3. A aplicao de alguns testes no paramtricos pode ser
trabalhosa em amostras grandes.
O teste do sinal
No podemos usar um teste t para:

(a) hiptese de que a mdia populacional seja igual a um
valor em particular
(b) hiptese de que a diferena mdia entre duas
populaes seja igual a zero, a no ser que seja conhecido
(ou que o pesquisador queira assumir) que a populao
tenha distribuio normal.

O teste do sinal
Quando no se pode supor que a Populao ~ N, ou
Quando os dados esto rankeados no lugar de estarem
em escala de medida intervalar ou de razo

Esse teste no depende das suposies do teste t, ou
medidas alm da escala ordinal, pois o foco na mediana
como medida de tendncia central, e no na mdia.

nica suposio que a distribuio da varivel de
interesse seja contnua.

Utilizar os +s e os s para os clculos
Teste do sinal exemplo 11.3.1
10 garotas com problemas mentais receberam lies sobre
cuidados pessoais e estticos.
Entrevista 2 semanas depois do curso e foram atribudas
notas s garotas com base em suas aparncias
1 pior nota, 10 melhor nota. Impossvel dizer que a
magnitude da diferena era igual dentro da escala de notas.
Por exemplo, se a diferena entre 6 e 8, igual a diferena
entre 4 e 6.
H0: mediana da populao = 5
HA: mediana da populao 5
Nvel de significncia = 0,05
Natureza da hiptese sugere
teste bicaudal
Teste do sinal exemplo 11.3.1
Nota da aparncia geral de 10 meninas com retarde mental
Garota Nota Garota Nota
1 4 6 6
2 5 7 10
3 8 8 7
4 8 9 6
5 9 10 6
Notas acima (+) e abaixo (-) da mediana hipottica
Garota 1 2 3 4 5 6 7 8 9 10
Nota
relativa
mediana
- 0 + + + + + + + +
Assumindo mediana = 5, temos:
Teste do sinal exemplo 11.3.1
Se H0 verdadeira, esperamos que metade dos valores
estejam abaixo de 5, e que a outra metade esteja acima de 5,
pois H
0
: P(+) = P(-) = 0,5
Excluir o zero, que foi atribudo ao valor que corresponde
mediana, e diminuir o n em n-1:





n =9
Nota da aparncia geral de 10 meninas com retarde mental
Garota Nota Garota Nota
1 4 6 6
2 5 7 10
3 8 8 7
4 8 9 6
5 9 10 6
Teste do sinal exemplo 11.3.1
Ser que o pequeno nmero de s ocorreu:
Porque H0 falso?
Por acaso apenas?

Baseado no Captulo 3, as observaes do exemplo
constituem um conjunto de n variveis aleatrias
independentes de uma populao de Bernoulli com
parmetro p
k = nmero de s
A distribuio amostral de k uma distribuio de
probabilidade binomial com parmetro p = 0,5 caso
H0 seja verdade
Teste do sinal exemplo 11.3.1
x n x
x
k
q p
x
n
p n x k P

=

|
.
|

\
|
= s
0
) , | (
Determinar a probabilidade de observar x ou menos
sinais de s quando temos uma amostra de tamanho
n e parmetro p:


No exemplo dado, seria:

0195 . 0 01758 . 0 00195 . 0 ) 5 . 0 ( ) 5 . 0 (
1
9
) 5 . 0 ( ) 5 . 0 (
0
9
1 9 1 0 9 0
= + =
|
.
|

\
|
+
|
.
|

\
|

Teste do sinal exemplo 11.3.1
Como demos ateno apenas ao nmero de s,
vamos realizar um teste monocaudal para saber se
rejeitamos H
0
.

Ao ajustar = 0,05, estamos dizendo que se o
nmero de s to pequeno que a probabilidade de
observar esse valor, ou menos, menor que 0,25
(/2), rejeitamos H
0
.

Conclumos que a mediana da pop no = 5
Teste do sinal
Caso haja um par de resultados para ser analisado, mas no
seja possvel aplicar um teste t, podemos utilizar o teste do
sinal, com H0 descrito da seguinte maneira:

P (X
i
> Y
i
) = P (X
i
< Y
i
) = 0,5
Com isso:
Y
i
subtrado de X
i
, mas Y
i
< X
i
, ento o resultado +
Y
i
subtrado de X
i
, mas Y
i
> X
i
, ento o resultado
No caso da diferena mediana ser = 0, esperamos que na amostra
aleatria, teremos o mesmo nmero de + e -, o que pode ser escrito

P (+) = P (-) = 0,5
Teste do sinal exemplo 11.3.2
Nota para higiene oral com instruo (Xi) e sem instruo (Yi)
Par Instrudo
(Xi)
No instrudo
(Yi)
Par

Instrud
o (Xi)
No instrudo
(Yi)
1 1,5 2,0 7 2,0 3,5
2 2,0 2,0 8 1,5 3,0
3 3,5 4,0 9 1,5 2,5
4 3,0 2,5 10 2,0 2,5
5 3,5 4,0 11 3,0 2,5
6 2,5 3,0 12 2,0 2,5
H
0
: mediana da diferena = 0
H
A
: mediana da diferena 0

Nvel de significncia = 0,05
Teste do sinal exemplo 11.3.2


Sendo k = nmeros de +s

Rejeitamos H
0
, pois 0.0327 < 0.05
Conclumos que a mediana negativa, o que significa que as
instrues foram benficas
Sinais da diferena (Xi-Yi)
Par 1 2 3 4 5 6 7 8 9 10 11 12
Sinal da diferena - 0 - + - - - - - - + -
2-2 = 0, excluir resultado, diminuir n
0327 . 0 ) 5 (. ) 5 (.
11
) 5 ,. 11 | 2 (
11
2
0
=
|
.
|

\
|
= s

=

x x
k
x
k P
Teste da mediana
O Teste do sinal tem como pr-requisito que as amostras
sejam relacionadas. Nesse teste isso no necessrio, sendo
independentes.
Testar H0: as duas populaes tem a mesma mediana
Suposies:
(a) amostras selecionadas aleatoriamente de suas populaes
(b) populaes com a mesma forma, diferindo apenas na localizao
(c) a varivel de interesse contnua.
Nvel de medida, pelo menos ordinal. Amostras no precisam ter o mesmo
tamanho.


Teste da mediana exemplo 11.4.1
Nvel de score mental no ensino mdio - Escolas
Urbana Rural Urbana Rural Urbana
35 29 23 42 33
26 50 25 32 26
27 43 25 50 46
21 22 27 37 41
27 42 45 34
38 47 46 31
Mediana unindo
as duas amostras:
(33+34)/2 = 33,5
Se as amostras viessem de populao com mesma mediana,
esperaramos que aproximadamente metade dos scores em
cada amostra estivesse acima da mediana combinada (33,5) e a
outra metade abaixo.
Teste da mediana exemplo 11.4.1
Nvel de score mental no ensino mdio Escolas
Urbana Rural Total
Score > 33,5 6 8 14
Score < 33,5 10 4 14
Total 16 12 28
33 . 2
) 14 )( 14 )( 12 )( 16 (
)] 10 )( 8 ( ) 4 )( 6 [( 28
2
2
=

= X

Tabela 2x2,
captulo 10
Valor crtico de
2
na tabela: 3.841
(com n.s. 0,05 e g.l. = 1)
2.33 < 3.841, no rejeitamos H0
Amostras podem ter vindo de
populaes com mesma mediana
_
Teste de ajustamento de Kolmogorov-Smirnov
Alternativa ao
2
quando desejamos saber quo bem uma
distribuio amostral se ajusta uma distribuio terica,

Fazemos uma comparao entre:
Funo de distribuio cumulativa terica F
T
(x)
Funo de distribuio cumulativa amostral F
S
(x)

_
Teste de ajustamento de Kolmogorov-Smirnov
Amostra aleatria de uma populao com com funo de
distribuio cumulativa desconhecida F(x)
Seo 3.2: funo de distribuio cumulativa d a probabilidade de que X
seja igual a ou menor que um particular valor, x.

Atravs da funo de distribuio cumulativa, F(x),
podemos determinar P (X x).

Proximidade entre distribuies cumulativas terica e
experimental hiptese de que a amostra foi retirada de
populao com F
T
(x), suportada.
Caso haja discrepncia muito grande para ser atribuda
apenas ao acaso hiptese rejeitada.
Teste de ajustamento de Kolmogorov-Smirnov
Para quantificar essa diferena, utilizamos o estimador
D, que a maior distncia vertical entre F
S
(x) e F
T
(x).

Quando um teste bicaudal for apropriado, isto , quando
as hipteses so:
H
0
: F(x) = F
T
(x) para todos os x de - a +
H
A
: F(x) F
T
(x) para pelo menos um x que tenha estimador
D = sup | F(x) F
T
(x) |

x
Leia-se D igual ao supremum, maior x, do valor absoluto da diferena
entre F
S
(x) - F
T
(x).
Teste de ajustamento de Kolmogorov-Smirnov
A hiptese nula rejeitada ao nvel de significncia
se o valor de D computado exceder o valor mostrado
na tabela L para 1 (bicaudal) e tamanho n da
amostra. ???
Suposies nas quais o teste baseado:
(a) a amostra aleatria
(b) a distribuio de F
T
(x) hipottica contnua
Teste de ajustamento de Kolmogorov-Smirnov ex 11.5.1
Exemplo 10.3.1:
Ho: amostra retirada de pop ~ N
Estimar mdia e desv pad
Teste de Kolmogorov-Smirnov s pode ser aplicado quando
a distribuio hipottica completamamente especificada,
isto , no caso de normal, a mdia e o desv pad assim como
a forma da distribuio so especificadas.
Na prtica, a mdia e desv pad so especificados antes do
desenho da amostra; no so estimados da amostra.
Mudaremos para testar a hiptese de que a amostra foi
retirada de pop ~ N (70.1, 18.0381)
Teste de ajustamento de Kolmogorov-Smirnov ex 11.5.1
H0: F(x) = F
T
(x) para todo x de - a +
HA: F(x) F
T
(x) para pelo menos um x
= 0,05



/ 250
Teste de ajustamento de Kolmogorov-Smirnov ex 11.5.1
+
=
Valor de D aqui o maior valor na ltima
coluna da tabela 11.5.2, que 0,0658.

O valor crtico para o teste quando = 0,05
e n > 40, de acordo com a tabela L, obtido
ao calcular 1,36n. Aqui, 1,36250 = 0,086

D = 0,0658, menor que 0,086, no
podemos rejeitar H0. A amostra pode ter
vindo da populao especificada.
Comparao entre Kolmogorov-Smirnov (K-S) e o
2
1. K-S no precisa que as observaes estejam agrupadas
como no caso do
2
, ento todos os dados presentes no
conjunto sero utilizados,
2. K-S pode ser usado com qualquer tamanho de amostra,
no
2
h um tamanho mnimo,
3. K-S no aplicvel quando os parmetros precisam ser
estimados pela amostra, j o
2
pode ser usado em tais
situaes com a reduo nos graus de liberdade para cada
valor estimado.
_
_
_
_
Anlise de varincia por ranks de Kruskal-Wallis
Captulo 7: como a anlise de varincia de 1 via poderia ser
usada para testar a hiptese nula de que vrios grupos tem a
mesma mdia.
Quando no temos as bases para esse teste
Populaes tem distribuio diferente de normal, varincias diferentes
Dados dispostos em ranks

Alternativa Teste de medianas
Porm, perderamos dados, pois s vemos se as observaes esto
acima ou abaixo da mediana das amostras combinadas

Talvez esse seja o melhor teste para anlise de varincias
por ranks
Anlise de varincia por ranks de Kruskal-Wallis
1. As obs n
1
, n
2
,...,n
k
de k grupos so combinadas em uma
nica srie de tamanho n em ordem de crescente e
substitudos por ranks de 1, a n. Caso haja valores iguais,
o rank atribudo aos nmeros ser a mdia das posies
que eles ocupariam
2. Os ranks atribudos a observaes em cada um dos k
grupos so adicionados separadamente para resultar em k
somas de ranks
3. O estimador computado

k = n de grupos n
j
= n de obs no grupo jth
n = n de obs em todos os grupos combinados
R
j
= soma dos ranks no grupo jth
) 1 ( 3
) 1 (
12
1
2
+
+
=

=
n
n
Rj
n n
H
k
j
j
Anlise de varincia por ranks de Kruskal-Wallis
3. O estimador computado, sendo

k = n de grupos
n
j
= n de obs no grupo jth
n = n de obs em todos os grupos combinados
R
j
= soma dos ranks no grupo jth

4. Quando houver 3 grupos e 5 ou menos obs em cada grupo,
a significncia do H computado determinado
consultando a tabela M. Em caso de mais de 5 obs em um
ou mais grupos, H comparado com valores tabulados de
2
com k 1 g.l.
) 1 ( 3
) 1 (
12
1
2
+
+
=

=
n
n
Rj
n n
H
k
j
j
_
Anlise de varincia por ranks de Kruskal-Wallis
exemplo 11.6.1
Um estudo dos efeitos de 2 drogas no tempo de reao um certo
estmulo foi estudado em 3 grupos de cobaias.
Grupo III controle
Grupo I Droga A antes do estmulo
Grupo II Droga B
Tempo de reao
Grupo
I
Grupo
II
Grupo
III
17 8 2
20 7 5
40 9 4
31 8 3
35
Tempo de reao em ranks
Grupo
I
Grupo
II
GrupoI
II
9 6,5 1
10 5 4
13 8 3
11 6,5 2
12
R
1
= 55 R
2
= 26 R
3
= 10
Rearranjando


em ranks
Anlise de varincia por ranks de Kruskal-Wallis
exemplo 11.6.1
H
0
: 3 grupos no diferem no tempo de reao

O H
0
implica que as obs dos 3 grupos contemplam uma amostra, de
tamanho 13, vinda da mesma populao. Esperaramos ento, ver os
ranks bem distribudos pelos 3 grupos.

Esperaramos, ento, que a soma total dos ranks estivesse dividida nos
3 grupos, proporcionalmente ao tamanho do grupo.

No estimador H, essas idias esto embutidas.

Rejeitar hiptese nula se:

Valor de H for to grande que a probabilidade de obter um valor
igualmente grande ou maior, quando H0 verdade, igual a ou menor
que o escolhido.
Anlise de varincia por ranks de Kruskal-Wallis
exemplo 11.6.1
68 . 10 ) 1 13 ( 3
4
) 10 (
4
) 26 (
5
) 55 (
) 1 13 ( 13
12
2 2 2
= +
(

+ +
+
= H
A Tabela M mostra que quando n
j
s so 5, 4 e 4, a
probabilidade de obter um valor de H 10.68 menor que
0,009.

H
0
pode ser rejeitada ao n.s. 0,1, e conclumos que h
diferena no tempo de reao mdio entre os 3 grupos.

Anlise de varincia por ranks de Kruskal-Wallis
exemplo 11.6.1
Grupo II dois valores 6,5. Podemos ajustar H para esse
empate dividindo-o por
onde T = t
3
t
t = n obs empatadas

2 valores empatados, ento: T = 2
3
2 = 6 e T = 6,

e


que tambm significante a nvel 0,1

n n
T


3
1
9973 .
13 13
6
1
3
=

71 . 10
9973 .
68 . 10
1
3
= =


n n
T
H

Das könnte Ihnen auch gefallen