Sie sind auf Seite 1von 33

Captulo 6

Slide 1

Estatstica no-paramtrica
Teste de ajustamento do Qui-quadrado Testes de independncia e de homogeneidade do Qui-quadrado

Ana M. Abreu - 2006/07

Algumas consideraes

Slide 2

As seces deste captulo referem-se anlise de dados categorizados (qualitativos ou atributos) os quais podem ser classificados em diferentes categorias (frequentemente designadas por clulas). Vamos usar a distribuio 2 (Qui-quadrado). No teste de ajustamento temos uma tabela com apenas uma linha ou uma coluna. Nos testes de independncia e de homogeneidade as tabelas tm, pelo menos, 2 linhas e 2 colunas.
Ana M. Abreu - 2006/07

Algumas consideraes
Definies
Testes Paramtricos
Os testes paramtricos obrigam a que as populaes envolvidas obedeam a certas premissas.

Slide 3

Testes No-Paramtricos
Nos testes no-paramtricos as populaes no tm que obedecer a quaisquer premissas. Assim sendo, este testes so tambm designados por testes distribution-free.
Ana M. Abreu - 2006/07

Vantagens dos Mtodos No-paramtricos

Slide 4

1. Os mtodos no-paramtricos podem ser aplicados

numa grande variedade de situaes pois no exigem premissas rgidas, tal como acontece com os mtodos paramtricos. Em particular, os mtodos no-paramtricos no exigem que as populaes tenham distribuio Normal. 2. Ao contrrio do que acontece com os mtodos paramtricos, os mtodos no-paramtricos podem ser aplicados a dados qualitativos. 3. Habitualmente, os mtodos no-paramtricos envolvem clculos mais simples do que os correspondentes mtodos paramtricos, donde so mais fceis de perceber Abreu - 2006/07 e aplicar. Ana M.

Desvantagens dos Mtodos No-paramtricos


1. Os mtodos no-paramtricos tendem a desperdiar informao uma vez que, frequentemente, os dados quantitativos so transformados em dados qualitativos.

Slide 5

2. Os testes no-paramtricos no so to eficientes como os mtodos paramtricos logo, em geral, com um teste no-paramtrico necessrio uma maior evidncia (como, por exemplo, uma amostra maior ou maiores diferenas) para poder rejeitar a hiptese nula.
Ana M. Abreu - 2006/07

Definio
Experincia Multinomial
Esta uma experincia que obedece s seguintes condies: 1. O nmero de provas fixo. 2. As provas so independentes.

Slide 6

3. Todos os resultados de uma prova devem poder ser classificados numa s das diferentes categorias. 4. As probabilidades para cada uma das categorias permanecem constantes em cada prova.
Ana M. Abreu - 2006/07

Definio
Teste de ajustamento

Slide 7

Um teste de ajustamento usado para testar a hiptese de uma certa distribuio de frequncias observadas seguir uma certa distribuio terica.

Ana M. Abreu - 2006/07

Teste de ajustamento
Notao 0
representa a frequncia (ou valor) observada (o)

Slide 8

E
k n

representa a frequncia esperada (de acordo com a distribuio terica) representa o nmero de categorias

representa a dimenso da amostra (ou seja, neste contexto, o nmero de provas)


Ana M. Abreu - 2006/07

Frequncias Esperadas

Slide 9

Se todas as frequncias esperadas forem iguais:

E=

n k

cada valor esperado a soma de todas as frequncias observadas dividida pelo nmero de categorias.
Ana M. Abreu - 2006/07

Frequncias Esperadas
Se as frequncias esperadas forem diferentes:

Slide 10

E=np
cada valor esperado determina-se multiplicando a soma de todas as frequncias observadas pela probabilidade de cada categoria.
Ana M. Abreu - 2006/07

Teste de ajustamento
Estatstica de teste
X =
2

Slide 11

(O E)2 E

Valores crticos
1. Determinam-se usando a tabela da distribuio Qui-quadrado com k 1 graus de liberdade, onde k = nmero de categorias. 2. A hiptese alternativa sempre unilateral direita.
Ana M. Abreu - 2006/07

Se os valores observados estiverem prximos dos valores esperados, ento o valor da estatstica de teste ser pequeno (que o mesmo do que dizer que o P-value ser grande) e vice-versa.

Slide 12

Um valor muito elevado da estatstica de teste levar rejeio da hiptese nula (a qual diz que no h diferena entre os valores observados e os valores esperados)
Ana M. Abreu - 2006/07

Slide 13

Tabelas de contingncia: Independncia e Homogeneidade

Ana M. Abreu - 2006/07

Definio

Slide 14

Uma tabela de contingncia uma tabela de frequncias que representa um conjunto de dados que foram classificados simultaneamente segundo duas (bidimensional) ou mais variveis (multidimensional). As tabelas de contingncia tm, pelo menos, 2 linhas e 2 colunas.
Ana M. Abreu - 2006/07

Slide 15

Ana M. Abreu - 2006/07

Definio
Teste de Independncia

Slide 16

Este mtodo testa a hiptese nula de a varivel linha e a varivel coluna numa tabela de contingncia no estarem relacionadas. (A hiptese nula afirma que as duas variveis so independentes.)

Ana M. Abreu - 2006/07

Pressupostos
1. As observaes so seleccionadas aleatoriamente.

Slide 17

2. A hiptese nula H0 afirma que as variveis linha e coluna so independentes; a hiptese alternativa H1 afirma que as variveis linha e coluna so dependentes. 3. O valor esperado, E, de cada clula da tabela de contingncia tem que ser, pelo menos, 5. (Que no o mesmo do que dizer que cada valor observado, O, de cada clula da tabela de contingncia tenha que ser, pelo menos, 5.)
Ana M. Abreu - 2006/07

Teste de Independncia

Slide 18

Estatstica de teste
X =
2

Correco de Yates: aplica-se quando a tabela de contingncia 2x2. Neste caso, a estatstica de teste

(O E)2 E

Valores crticos:

X =
2

(|O E|-0.5)2 E

1. Determinam-se atravs da tabela da distribuio Quiquadrado com

(r 1)(c 1)=graus de liberdade


onde r o nmero de linhas e c o nmero de colunas da tabela de contingncia.
Ana M. Abreu - 2006/07

Slide 19

2. A hiptese alternativa sempre unilateral direita. (total de linha) (total de coluna) (total)

E=

E=

ni. n.j n
Ana M. Abreu - 2006/07

Teste de Independncia

Slide 20

H0: A varivel linha independente da varivel coluna. H1: A varivel linha dependente (est relacionada com a) da varivel coluna.

A dependncia entre as duas variveis significa apenas que as duas variveis esto relacionadas, no especifica o tipo de relao (por ex, do tipo causa/efeito).
Ana M. Abreu - 2006/07

Frequncias Observadas e Esperadas


Slide 21 Men Survived Died Total 332 1360 Women 318 104 Boys Girls 29 35 27 18 Total 706 1517

1692

422

64

45

2223

Vamos usar a tabela de contingncia referente aos passageiros do Titanic para calcular as frequncias esperadas. Para a primeira clula, a que se encontra na posio 11, ou seja, 1 linha e 1 coluna, temos:

n1. n.1 (706)(1692) = 537.360 E11 = = n 2223

Ana M. Abreu - 2006/07

Frequncias Observadas e Esperadas


Slide 22 Women Men 318 332 537.360 1360 104 Boys Girls 29 27 Total 706

Survived Died Total

35

18

1517

1692

422

64

45

2223

Clculo da frequncia esperada da clula na posio 21, sob a hiptese de independncia entre as variveis.

E21 = (1517)(1692) = 1154.640 2223

Ana M. Abreu - 2006/07

Frequncias Observadas e Esperadas


Slide 23 Women Boys Girls Men 29 318 27 332 537.360 134.022 20.326 14.291 1360 1154.64 1692 35 104 18 287.978 43.674 30.709 422 64 45 Total 706

Survived Died Total

1517

2223

Para interpretar o resultado obtido para a clula, por exemplo, na posio 21, dizemos que embora tivessem sido observadas 1360 mortes nos homens, se houvesse independncia entre a sobrevivncia e o facto de um indivduo ser homem, mulher, rapaz ou rapariga, esperaramos apenas 1154.64 mortes nos homens.

Ana M. Abreu - 2006/07

Slide 24

Exemplo: Teste a hiptese de a sobrevivncia dos passageiros do Titanic ser independente do facto do passageiro ser homem, mulher, rapaz ou rapariga, usando um nvel de significncia de 0.05.
H0: A sobrevivncia dos passageiros independente do facto de ser homem, mulher, rapaz ou rapariga. H1: A sobrevivncia dos passageiros dependente do facto de ser homem, mulher, rapaz ou rapariga.

Ana M. Abreu - 2006/07

Slide 25

Clculos:

X2= (332537.36)2 + (318132.022)2 + (2920.326)2 + (2714.291)2 14.291 537.36 134.022 20.326 + (13601154.64)2 + (104287.978)2 + (3543.674)2 + (1830.709)2 30.709 1154.64 43.674 287.978 X2=78.481 + 252.555 + 3.702+11.302+36.525+117.536+1.723+5.260 = 507.084

Ana M. Abreu - 2006/07

Slide 26

O nmero de graus de liberdade (r1)(c1) = (21)(41) = 3 pois a tabela tem 2 linhas e 4 colunas. Ento, o valor crtico 2(0.05;3) = 7.815

Ana M. Abreu - 2006/07

Estatstica de teste:
com = 0.05 e (r liberdade

X2 = 507.084

Slide 27

1) (c 1) = (2 1) (4 1) = 3 graus de

Valor crtico:

2 = 7.815

Ana M. Abreu - 2006/07

Relaes entre as componentes num Teste de Independncia


Com pare os valores observados, O , com os respectivos valores esperados, E . O`s e E `s prxim os. X 2 pequeno, P- value grande. -

Slide 28

O`s e E `s afastados. X 2 grande, P- value pequeno. -

X 2 aqui

X 2 aqui

rejeitar N o r ejeitar H 0 .

Rejeitar R ejeitar H 0 .

Ana M. Abreu - 2006/07

Definio
Teste de Homogeneidade

Slide 29

Num teste de homogeneidade, verificamos se diferentes populaes tm as mesmas caractersticas.

Ana M. Abreu - 2006/07

Como distinguir um teste de homogeneidade dum teste de independncia:

Slide 30

A dimenso das amostras provenientes da diferentes populaes foi fixada partida (teste de homogeneidade), ou foi recolhida apenas uma amostra que depois foi classificada aleatoriamente nas diferentes linhas e colunas (teste de independncia)?
Ana M. Abreu - 2006/07

Slide 31

Exemplo: Atravs da tabela que se segue, teste o efeito do sexo do entrevistador nas respostas de uma amostra de indivduos do sexo masculino a uma certa sondagem, com um nvel de significncia de 0.05.

Ana M. Abreu - 2006/07

Slide 32

H0: A proporo de respostas concordantes/discordantes a mesma quer o entrevistador seja do sexo masculino ou feminino. H1: As propores so diferentes
Chi-Square Te sts Asymp. Sig. (2-sided) 1 1 1 ,011 ,013 ,010 ,011 6,524 1200 1 ,011 ,006 Exact Sig. (2-sided) Exact Sig. (1-sided)

Value Pearson Chi-Square Continuity Correction(a) Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of V alid Cases 6,529(b) 6,184 6,662

df

a Comput d only for a 2x2 table e b 0 cells (,0%) have expected count less than 5. The minimum expected count is 110,67.
Ana M. Abreu - 2006/07

Slide 33

O SPSS fornece-nos o valor da estatstica de teste X 2 = 6.184 e o P-value 0.013 (pois a tabela 2x2). Usando a abordagem atravs do P-value, rejeitamos a hiptese nula de igualdade (homogeneidade) das propores (porque o P-value menor do que 0.05). Assim, conclumos que existe evidncia suficiente para rejeitar a hiptese de igualdade de propores.

Ana M. Abreu - 2006/07

Das könnte Ihnen auch gefallen