Beruflich Dokumente
Kultur Dokumente
Slide 1
Estatstica no-paramtrica
Teste de ajustamento do Qui-quadrado Testes de independncia e de homogeneidade do Qui-quadrado
Algumas consideraes
Slide 2
As seces deste captulo referem-se anlise de dados categorizados (qualitativos ou atributos) os quais podem ser classificados em diferentes categorias (frequentemente designadas por clulas). Vamos usar a distribuio 2 (Qui-quadrado). No teste de ajustamento temos uma tabela com apenas uma linha ou uma coluna. Nos testes de independncia e de homogeneidade as tabelas tm, pelo menos, 2 linhas e 2 colunas.
Ana M. Abreu - 2006/07
Algumas consideraes
Definies
Testes Paramtricos
Os testes paramtricos obrigam a que as populaes envolvidas obedeam a certas premissas.
Slide 3
Testes No-Paramtricos
Nos testes no-paramtricos as populaes no tm que obedecer a quaisquer premissas. Assim sendo, este testes so tambm designados por testes distribution-free.
Ana M. Abreu - 2006/07
Slide 4
numa grande variedade de situaes pois no exigem premissas rgidas, tal como acontece com os mtodos paramtricos. Em particular, os mtodos no-paramtricos no exigem que as populaes tenham distribuio Normal. 2. Ao contrrio do que acontece com os mtodos paramtricos, os mtodos no-paramtricos podem ser aplicados a dados qualitativos. 3. Habitualmente, os mtodos no-paramtricos envolvem clculos mais simples do que os correspondentes mtodos paramtricos, donde so mais fceis de perceber Abreu - 2006/07 e aplicar. Ana M.
Slide 5
2. Os testes no-paramtricos no so to eficientes como os mtodos paramtricos logo, em geral, com um teste no-paramtrico necessrio uma maior evidncia (como, por exemplo, uma amostra maior ou maiores diferenas) para poder rejeitar a hiptese nula.
Ana M. Abreu - 2006/07
Definio
Experincia Multinomial
Esta uma experincia que obedece s seguintes condies: 1. O nmero de provas fixo. 2. As provas so independentes.
Slide 6
3. Todos os resultados de uma prova devem poder ser classificados numa s das diferentes categorias. 4. As probabilidades para cada uma das categorias permanecem constantes em cada prova.
Ana M. Abreu - 2006/07
Definio
Teste de ajustamento
Slide 7
Um teste de ajustamento usado para testar a hiptese de uma certa distribuio de frequncias observadas seguir uma certa distribuio terica.
Teste de ajustamento
Notao 0
representa a frequncia (ou valor) observada (o)
Slide 8
E
k n
representa a frequncia esperada (de acordo com a distribuio terica) representa o nmero de categorias
Frequncias Esperadas
Slide 9
E=
n k
cada valor esperado a soma de todas as frequncias observadas dividida pelo nmero de categorias.
Ana M. Abreu - 2006/07
Frequncias Esperadas
Se as frequncias esperadas forem diferentes:
Slide 10
E=np
cada valor esperado determina-se multiplicando a soma de todas as frequncias observadas pela probabilidade de cada categoria.
Ana M. Abreu - 2006/07
Teste de ajustamento
Estatstica de teste
X =
2
Slide 11
(O E)2 E
Valores crticos
1. Determinam-se usando a tabela da distribuio Qui-quadrado com k 1 graus de liberdade, onde k = nmero de categorias. 2. A hiptese alternativa sempre unilateral direita.
Ana M. Abreu - 2006/07
Se os valores observados estiverem prximos dos valores esperados, ento o valor da estatstica de teste ser pequeno (que o mesmo do que dizer que o P-value ser grande) e vice-versa.
Slide 12
Um valor muito elevado da estatstica de teste levar rejeio da hiptese nula (a qual diz que no h diferena entre os valores observados e os valores esperados)
Ana M. Abreu - 2006/07
Slide 13
Definio
Slide 14
Uma tabela de contingncia uma tabela de frequncias que representa um conjunto de dados que foram classificados simultaneamente segundo duas (bidimensional) ou mais variveis (multidimensional). As tabelas de contingncia tm, pelo menos, 2 linhas e 2 colunas.
Ana M. Abreu - 2006/07
Slide 15
Definio
Teste de Independncia
Slide 16
Este mtodo testa a hiptese nula de a varivel linha e a varivel coluna numa tabela de contingncia no estarem relacionadas. (A hiptese nula afirma que as duas variveis so independentes.)
Pressupostos
1. As observaes so seleccionadas aleatoriamente.
Slide 17
2. A hiptese nula H0 afirma que as variveis linha e coluna so independentes; a hiptese alternativa H1 afirma que as variveis linha e coluna so dependentes. 3. O valor esperado, E, de cada clula da tabela de contingncia tem que ser, pelo menos, 5. (Que no o mesmo do que dizer que cada valor observado, O, de cada clula da tabela de contingncia tenha que ser, pelo menos, 5.)
Ana M. Abreu - 2006/07
Teste de Independncia
Slide 18
Estatstica de teste
X =
2
Correco de Yates: aplica-se quando a tabela de contingncia 2x2. Neste caso, a estatstica de teste
(O E)2 E
Valores crticos:
X =
2
(|O E|-0.5)2 E
Slide 19
2. A hiptese alternativa sempre unilateral direita. (total de linha) (total de coluna) (total)
E=
E=
ni. n.j n
Ana M. Abreu - 2006/07
Teste de Independncia
Slide 20
H0: A varivel linha independente da varivel coluna. H1: A varivel linha dependente (est relacionada com a) da varivel coluna.
A dependncia entre as duas variveis significa apenas que as duas variveis esto relacionadas, no especifica o tipo de relao (por ex, do tipo causa/efeito).
Ana M. Abreu - 2006/07
1692
422
64
45
2223
Vamos usar a tabela de contingncia referente aos passageiros do Titanic para calcular as frequncias esperadas. Para a primeira clula, a que se encontra na posio 11, ou seja, 1 linha e 1 coluna, temos:
35
18
1517
1692
422
64
45
2223
Clculo da frequncia esperada da clula na posio 21, sob a hiptese de independncia entre as variveis.
1517
2223
Para interpretar o resultado obtido para a clula, por exemplo, na posio 21, dizemos que embora tivessem sido observadas 1360 mortes nos homens, se houvesse independncia entre a sobrevivncia e o facto de um indivduo ser homem, mulher, rapaz ou rapariga, esperaramos apenas 1154.64 mortes nos homens.
Slide 24
Exemplo: Teste a hiptese de a sobrevivncia dos passageiros do Titanic ser independente do facto do passageiro ser homem, mulher, rapaz ou rapariga, usando um nvel de significncia de 0.05.
H0: A sobrevivncia dos passageiros independente do facto de ser homem, mulher, rapaz ou rapariga. H1: A sobrevivncia dos passageiros dependente do facto de ser homem, mulher, rapaz ou rapariga.
Slide 25
Clculos:
X2= (332537.36)2 + (318132.022)2 + (2920.326)2 + (2714.291)2 14.291 537.36 134.022 20.326 + (13601154.64)2 + (104287.978)2 + (3543.674)2 + (1830.709)2 30.709 1154.64 43.674 287.978 X2=78.481 + 252.555 + 3.702+11.302+36.525+117.536+1.723+5.260 = 507.084
Slide 26
O nmero de graus de liberdade (r1)(c1) = (21)(41) = 3 pois a tabela tem 2 linhas e 4 colunas. Ento, o valor crtico 2(0.05;3) = 7.815
Estatstica de teste:
com = 0.05 e (r liberdade
X2 = 507.084
Slide 27
1) (c 1) = (2 1) (4 1) = 3 graus de
Valor crtico:
2 = 7.815
Slide 28
X 2 aqui
X 2 aqui
rejeitar N o r ejeitar H 0 .
Rejeitar R ejeitar H 0 .
Definio
Teste de Homogeneidade
Slide 29
Slide 30
A dimenso das amostras provenientes da diferentes populaes foi fixada partida (teste de homogeneidade), ou foi recolhida apenas uma amostra que depois foi classificada aleatoriamente nas diferentes linhas e colunas (teste de independncia)?
Ana M. Abreu - 2006/07
Slide 31
Exemplo: Atravs da tabela que se segue, teste o efeito do sexo do entrevistador nas respostas de uma amostra de indivduos do sexo masculino a uma certa sondagem, com um nvel de significncia de 0.05.
Slide 32
H0: A proporo de respostas concordantes/discordantes a mesma quer o entrevistador seja do sexo masculino ou feminino. H1: As propores so diferentes
Chi-Square Te sts Asymp. Sig. (2-sided) 1 1 1 ,011 ,013 ,010 ,011 6,524 1200 1 ,011 ,006 Exact Sig. (2-sided) Exact Sig. (1-sided)
Value Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of V alid Cases 6,529(b) 6,184 6,662
df
a Comput d only for a 2x2 table e b 0 cells (,0%) have expected count less than 5. The minimum expected count is 110,67.
Ana M. Abreu - 2006/07
Slide 33
O SPSS fornece-nos o valor da estatstica de teste X 2 = 6.184 e o P-value 0.013 (pois a tabela 2x2). Usando a abordagem atravs do P-value, rejeitamos a hiptese nula de igualdade (homogeneidade) das propores (porque o P-value menor do que 0.05). Assim, conclumos que existe evidncia suficiente para rejeitar a hiptese de igualdade de propores.