Beruflich Dokumente
Kultur Dokumente
Matemática
Escola Superior de
TESTES DE HIPÓTESES NÃO PARAMÉTRICOS
Tecnologia de Viseu
Vamos agora abordar um conjunto de testes que nos permitem testar outro tipo
de hipóteses que não apenas sobre parâmetros populacionais (e.g., se a
distribuição populacional em estudo pode ser considerada Normal). Estes são
chamados testes não paramétricos.
Estes testes são, em geral, fáceis de aplicar, pois podem ser usados quando
as hipóteses exigidas por outras técnicas não são satisfeitas. Apesar de haver
certas suposições básicas associadas à maioria das provas não paramétricas,
essas suposições são em menor número e mais fracas do que as associadas às
provas paramétricas. A maior parte das provas não paramétricas servem para
pequenas amostras e, além disso, aplicam-se a dados medidos em escala
ordinal, e alguns mesmo a dados em escala nominal.
Hipóteses a testar:
Será mesmo de admitir que tais dados foram extraídos de uma pop. N(0.1, 7.2)?
determinada distribuição.
Existem vários testes de ajustamento que nos permitem fazer uma análise de
Teste do Qui-quadrado
repartidas por m classes mutuamente exclusivas, A1, A2, ... , Am (serão intervalos
Denote-se por:
em H0.
Hipóteses a testar:
ei = n×p0i.
Q=∑
m (Oi − ei )2
i=1 ei
A1=]-∞, a1[, A2=[ a1, a2[ A3=[ a2, a3[ ... Am=[ am-1, +∞[.
1/4 1/4
1/4 1/4
a1 a2 =0.1 a3
( 8 − 7 .5 ) 2 ( 8 − 7 .5 ) 2 ( 7 − 7 .5 ) 2 ( 7 − 7 .5 ) 2
Qobs= + + + = 0.13
7 .5 7 .5 7 .5 7 .5
Como Qobs ∉R.C., somos levados a não rejeitar a hipótese de que a diferença
entre os tempos de chegada e os tempos planeados tem distribuição N(0.1, 7.22).
Por outro lado, o teste K-S só pode ser aplicado quando a distribuição indicada
a outro teste, neste caso o teste desenvolvido por Lilliefors (teste de normalidade
Hipóteses a testar:
A Estatística do teste de K-S considera a maior das diferenças, em valor absoluto, entre a
proporção de observações inferiores ou iguais a x, S(x), e a probabilidade de se observar
um valor inferior ou igual a x se a distribuição populacional for a especificada em H0, F0(x):
Dn = sup S ( x) − F0 ( x)
− ∞ < x < +∞
F0(x)
S (x)
Uma vez que F0 é uma função (contínua) não decrescente e S é uma função
em escada, o supremo ocorre num ponto onde se verifica um salto de S :
Dn,obs = max { F0 ( xi ) − S ( xi ) , F0 ( xi ) − S ( xi −1 ) }.
i =1,..., n
seguinte:
198 254 262 272 275 278 285 287 287 292
EXCEL: DIST.NORM(198;290;56;VERDADEIRO)
Hipóteses a testar
H0: X ~ N(µ, σ2)
H1: X ~/ N(µ, σ2)
EXCEL: DIST.NORM(29;33.8;2.95;VERDADEIRO)
Tabelas de Contingência
Teste do Qui-quadrado de Independência
B1 B2 ... Bs
A1 O11 O12 ... O1s
A2 O21 O22 ... O2s
M M M O M
Sejam:
s
• Oi⋅ = ∑ Oij (i=1,...,r) Æ nº de elementos na amostra com modalidade Ai;
j=1
r
• O⋅j = ∑ Oij (j=1,...,s) Æ nº de elementos na amostra com modalidade Bj.
i=1
Tem-se,
r s r s
n = ∑ ∑ Oij =∑ Oi• = ∑ O • j
i=1 j=1 i=1 j=1
Hipóteses a testar:
Denote-se por:
• pij=P(Ai∩Bj) (i=1,..,r e j=1,...,s) a probabilidade (desconhecida) de um
indivíduo da população ser classificado simultaneamente nas categorias Ai de
A e Bj de B;
r s r s
1 = ∑ ∑ pij =∑ pi• = ∑ p • j .
i=1 j=1 i=1 j=1
Os verdadeiros valores das probabilidades pi⋅ e p⋅j são estimadas, a partir dos
dados amostrais, por
O O• j
p̂i• = i• e p̂• j = ,
n n
O i• × O • j
⎯⎯ ⎯ ⎯⎯→
estimado por
eij=n pij =n pi⋅× p⋅j ê ij = n p̂ i• p̂ • j =
n
Vimos que quando H0 é verdadeira eij pode ser estimado por êij = n p̂i• p̂ • j .
PERÍODO DO DIA
MODO DE PAGAMENTO Manhã Tarde Noite
Cheque 750 1500 750
Dinheiro 125 300 75
Cartão de débito/Crédito 125 200 175
Uma vez que A e B assumem cada uma 3 modalidades, sob H0, a estatística
teste tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1)=(3-1)(3-1)= 4
graus de liberdade.
PERÍODO DO DIA
MODO DE PAGAMENTO Manhã Tarde Noite Totais
Cheque 750 1500 750 3000
Dinheiro 125 300 75 500
Cartão de Crédito 125 200 175 500
Totais 1000 2000 1000 4000
Oi• O • j Oi•O• j
Cálculo das frequências esperadas: ê ij = n p̂ i• p̂ • j =n =
n n n
ê11 =(3000×1000)/4000=750
ê12 =(3000×2000)/4000=1500
ê13 =(3000×1000)/4000=750.
Frequências esperadas
PERÍODO DO DIA
MODO DE PAGAMENTO Manhã Tarde Noite Totais
Cheque 750 1500 750 3000
Dinheiro 125 250 125 500
Cartão de Crédito 125 250 125 500
Totais 1000 2000 1000 4000
Valor observado da estatística teste:
Medidas de Associação
No teste do Qui-Quadrado apresentado, se for rejeitada a hipótese de
independência entre os atributos, pode interessar medir a intensidade da
associação entre os mesmos, através de uma medida adequada.
χ2
Coeficiente de Contingência de Pearson: C =
χ2 + n
χ2
Coeficiente de Tshuprow: T =
n (r − 1) × (s − 1)
χ2
Coeficiente V de Cramer: V = , com q=min{r,s} 0≤V≤1.
n(q − 1)
Para ter uma ideia da intensidade de associação entre estes dois atributos,
calculam-se os coeficientes que acabámos de descrever.
χ2 60
Coeficiente de Contingência de Pearson: C = = = 0.122
χ2 + n 60 + 4000
χ2 60
Coeficiente de Tshuprow: T= = =0.087
n (r − 1) × (s − 1) 4000 2 × 2
χ2 60
Coeficiente V de Cramer: V = = =0.087
n(q − 1) 4000 × 2
Teste de Homogeneidade
Suponha que são recolhidas amostras aleatórias de s populações
(sub-populações ou estratos) B1, B2,..., Bs , nas quais se observa um atributo A
com r categorias A1, A2,..., Ar.
Neste contexto, surge também uma tabela de contingência r×s:
B1 B2 ... Bs
A1 O11 O12 ... O1s
A2 O21 O22 ... O2s
M M M O M
Sejam:
s
• Oi⋅ = ∑ Oij (i=1,...,r) Æ nº de elementos na categoria Ai de A em todas as
j=1
amostras;
r
• O⋅j = ∑ Oij (j=1,...,s) Æ tamanho da amostra recolhida na população Bj.
i=1
r s (Oij − êij )2
χ2 = ∑ ∑ ,
i=1 j=1 êij
Objectivo:
Dadas duas amostras aleatórias e independentes provenientes de duas
Hipóteses a testar:
H0: As duas amostras são retiradas de populações com a mesma distribuição
H1: As duas amostras são retiradas de populações com distribuições diferentes
Teste do Qui-quadrado
Teste de Kolmogorov-Smirnov
Este teste aplica-se a distribuições contínuas.
Pode-se admitir que a distribuição dos valores da análise é a mesma para as duas
variantes da doença? Servirá esta análise como meio de diagnostico da variante A ou B
desta doença? (Use α=0.01)
Variante A:
VALORES 20 22 23 26 29 30 31 33 34
N.º indivíduos 2 3 9 12 27 16 7 2 2
Freq. acumuladas 2 5 14 26 53 69 76 78 80
SA(x) 2/80 5/80 14/80 26/80 53/80 69/80 76/80 78/80 1
Variante B:
VALORES 23 24 26 28 30 31 32 33 34 36 38
N.º indivíduos 1 2 3 6 15 20 13 4 3 2 1
Freq. acumuladas 1 3 6 12 27 47 60 64 67 69 70
SB(x) 1/70 3/70 6/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1
Valores 20 22 23 24 26 28 29 30 31 32 33 34 36 38
SA(x) 2/80 5/80 14/80 14/80 26/80 26/80 53/80 69/80 76/80 76/80 78/80 1 1 1
SB(x) 0 0 1/70 3/70 6/70 12/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1
|SA(x)- SB(x)| 0,025 0,063 0,161 0,132 0,239 0,154 0,491 0,477 0,279 0,093 0,061 0,043 0,014 0
80 + 70
Para α=0.01, o ponto crítico é (consulte tabela): 1.63 = 0.267 .
80 × 70
TESTE DE KRUSKAL-WALLIS
Objectivo:
Dadas k populações nas quais se estuda uma característica comum e de onde
foram extraídas k amostras aleatórias e independentes, pretende-se testar a
hipótese H0 de que as distribuições populacionais são idênticas, isto é, as k
amostras podem ser consideradas como provenientes de populações com a
mesma distribuição.
Hipóteses a testar:
Procedimento:
ordenam-se todas as observações por ordem crescente dos seus valores;
atribui-se um nº de ordem, ou posto, Rij, a cada observação Xij (a
observação mais pequena fica com o nº de ordem, ou posto, 1 e a observação
maior com o posto N);
para cada população i determina-se o valor Ri da soma dos postos das
ni
observações correspondentes a esse grupo populacional: Ri = ∑ Rij
j =1
2 1 ⎡ k ni 2 N(N + 1)2 ⎤
S = ⎢ ∑ ∑ Rij − ⎥
N − 1 ⎣i=1 j=1 4 ⎦
Pontos críticos:
Será possível afirmar que os métodos de ensino produzem resultados diferentes no que
diz respeito à rapidez de um aluno para resolver um problema? (Use α=0.05)
Observação 9 10 11 12 13 15 16 17 18 19 20 21 22 24
Posto - Rij 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Grupo (mét.) 2 1 3 1 2 1 2 3 1 3 1 2 3 3
R1=2+4+6+9+11=32
R2=1+5+7+12=25
R3=3+8+10+13+14=48
12 k R2
Não havendo empates, a estatística de teste é H= ∑ i − 3(N + 1) cujo
N(N + 1) i=1 ni
12 ⎛ 32 2 25 2 48 2 ⎞
valor observado é: Hobs= ⎜ + + ⎟ − 3(14 + 1) = 1.963.
14(14 + 1) ⎜⎝ 5 4 5 ⎟⎠
Ri − R j , i,j=1,…,k
⎛ N( N + 1) ⎞⎛⎜1 1 ⎞⎟
c ij = χ α ,k −1 ⎜
2
⎟⎜ +
⎝ 12 ⎠⎝ n i n j ⎟⎠