Sie sind auf Seite 1von 26

1 2

Universidade Federal do Espírito Santo


Centro de Ciências Agrárias e Engenharias
TESTES DE HIPÓTESES
Depto de Engenharia Rural
Objetivos do conteúdo:
O que é hipótese estatística
Importância dos testes de hipótese
IMPORTÂNCIA DA ESTATÍSTICA E Fundamentos do teste de hipótese
TESTES DE HIPÓTESES
CONCEITOS BÁSICOS Como proceder um teste de hipótese
Testes para uma um ou duas médias populacionais
Profa. Gisele Rodrigues Moreira Teste para duas variâncias populacionais
Enga. Agrônoma/UFES
Dra. Genetica e Melhoramento/UFV Teste para proporções e testes de Qui-quadrado
E-mail: gisele.moreira @ufes.br
giselemoreira.webnode.com Exemplos e exercícios

3 4

N = 2000
O QUE É UMA HIPÓTESE?

Dicionário Aurélio: “Suposição”

QUESTÃO: Qual a altura média das plantas?


Na pesquisa científica é uma suposta, provável e provisória
resposta a uma questão.
HIPÓTESE: A altura média das plantas é igual a 5,6 m.
Em estatística, é uma afirmativa sobre uma ou
mais populações

5 6

Duas opções…

1. Medir a altura de todas as 2000 plantas!!


TESTES DE HIPÓTESE:

2. Realizar um Teste de hipóteses (ou teste de Procedimentos estatísticos cujo objetivo é tomar
significância) ☺ ☺ ☺ ☺ ☺ decisões sobre medidas da população (parâmetros),
⇒ retirar uma amostra de plantas e avaliar a baseadas nas evidências fornecidas pelos dados
altura média;
amostrais (estimadores e estimativas).
⇒ concluir sobre a altura média da
população com base na altura média da
amostra.

1
7 8

Inferência estatística
(não dá resultado exato, então dá
margem de erro ⇐ PROBABILIDADE)
Quando o pesquisador não tem interesse apenas em
Amostra (n) População (N)
estimações, mas sim em fazer afirmações a respeito
do(s) parâmetro(s).

Inferência estatística é a parte da estatística que trata das condições


sob as quais se faz inferências (pressuposições) sobre uma
população, com base em dados obtidos na amostra.
Lembrete: Parâmetro é qualquer medida estatística obtida na população.

9 10

Formulação das hipóteses de nulidade e alternativa

⇒ Formulação das hipóteses de nulidade e alternativa


Hipótese nula ou de nulidade (H0) é aquela que
sugere que a afirmação que estamos fazendo sobre o
⇒ Decisão de um teste estatístico parâmetro é verdadeira.
- Erros tipo I e erro tipo II
- Nível de significância Hipótese alternativa (Ha) é aquela que sugere que
- Região crítica
a afirmação que estamos fazendo sobre o parâmetro é
falsa, ou seja, é menor (teste unilateral à esquerda),
- Valor crítico maior (teste unilateral à direita) ou diferente (teste
- Estatística do teste bilateral) que o estipulado.

11 12

Considerando o exemplo: Decisão de um teste estatístico


N = 2000
⇒ Decisão de um teste estatístico
- Erros tipo I e erro tipo II
- Nível de significância
HIPÓTESE: A altura média das plantas é igual a 5,6 m. - Região crítica
- Valor crítico
H 0 : µ = 5,6 m H a : µ < 5,6 m Teste unilateral à esquerda
- Estatística do teste
H a : µ > 5,6 m Teste unilateral à direita
H a : µ ≠ 5,6 m Teste bilateral

2
13 14

EXEMPLO:
Um pesquisador implantou um novo sistema para diminuir
Suponha que, em uma fábrica (N = 250), o tempo o tempo médio de execução da tarefa e uma amostra de 10
médio gasto pelos trabalhadores na execução de uma tarefa trabalhadores foi obtida, a qual forneceu uma estimativa de 14,9
seja de 15 minutos (µ = 15). Sabe-se que o tempo de execução minutos ( X = 14,9).
da tarefa é uma variável aleatória que segue distribuição
normal com variância igual a 2,5 min2 [X ~ N (15; 2,5)].
Figura 1. Distribuição de probabilidade para a variável X “médias amostrais”
População (N = 250) ⇒ µ = 15 minutos
Amostra (n = 10) ⇒ X = 14,9 minutos

Ponto de vista matemático: 14,9 < 15


Ponto de vista estatístico: 14,9 é resultado amostral sujeito à
variações.
10 11 12 13 14 15 16 17 18 19 20
Variável X

15 16

População (N = 250) ⇒ µ = 15 minutos E como saber se a diferença foi ao acaso ou não?


Amostra (n = 10) ⇒ X = 14,9 minutos
Para respondermos à pergunta teríamos duas opções: avaliar o
tempo gasto na execução da nova tarefa com todos os 250
Essa diferença de 0,1 em relação ao sistema
trabalhadores da fazenda ou tomar uma amostra de
antigo poderia ter sido simplesmente devido ao trabalhadores e proceder um TESTE DE HIPÓTESES (menos
tempo, custo e mão-de-obra), cujas hipóteses são:
acaso, devido a amostra que foi avaliada, mas poderia
ser porque realmente o tempo na execução na tarefa
realmente é menor com o sistema novo (em qualquer H 0 : µ = 15 minutos
amostra seria obtido tempo menor que 15).
H a : µ < 15 minutos

17 18

Se, com N = 250, o tempo gasto para execução da tarefa a


Porém, se a média amostral para o tempo médio de
média é 15 minutos execução da tarefa fosse igual a 6 minutos.

Amostra (n = 10) ⇒ X = 14,9 minutos Amostra (n = 10) ⇒ X = 6 minutos

Há GRANDE probabilidade de que a amostra Teríamos PREQUENA probabilidade de que a


tenha sido retirada de uma população que amostra fosse retirada de uma população que
apresenta média próxima de 15 minutos ⇒ logo, apresenta média próxima de 15 minutos ⇒ logo,
NÃO REJEITARÍAMOS a hipótese de nulidade. REJEITARÍAMOS a hipótese de nulidade.

3
19 20

Ou seja, Como definir a partir de que valor será


considerada uma pequena ou grande diferença
Quanto mais próxima a estimativa na amostra
entre o valor amostral e o populacional, a ponto de
estiver do valor na população, maior probabilidade
da amostra fazer parte daquela população e, não rejeitar Ho?
rejeitaremos a hipótese de nulidade.

E quanto mais distante a estimativa na amostra Em outras palavras, como decidir o teste
estiver do valor na população, maior probabilidade estatístico?
da amostra NÃO fazer parte daquela população e,
rejeitaremos a hipótese de nulidade.

21 22

Duas opções… Ou

1. O pesquisador estabelece o valor crítico 2. Definir o valor crítico a partir de um nível de


antes de coletar a amostra. significância (α).
Figura 1. Distribuição de probabilidade para a variável X “médias amostrais”
Uso de Tabelas ⇒ obter o valor crítico e RNRHo (região de não
Por exemplo, 12 rejeição de Ho) e RRHo (região de rejeição de Ho)
minutos. Ou seja,
qualquer média
amostral abaixo de Preceder ao cálculo de uma estatística com distribuição de
12 min rejeita-se Ho, probabilidade idêntica à usada para identificar o valor tabelado.
e acima não se
rejeita.
Comparar o valor calculado (obtido pela estatística) com o valor
tabelado, ao nível α que foi estipulado, e concluir o teste sobre a
10 11 12 13 14 15 16 17 18 19 20
rejeição ou não de Ho.
Variável X

23 24

- Erros tipo I e tipo II


Tabela 1. Situações possíveis ao testar uma hipótese estatística.
Erro tipo I Consiste em rejeitar a hipótese de nulidade
quando ela é verdadeira. Este risco é o NÍVEL DE Se Ho for:
SIGNIFICÂNCIA, e sua probabilidade de ocorrência Ação
Verdadeira Falsa
corresponde a α (geralmente se usa α = 1 ou 5%).
Não rejeitar Ho Decisão correta (1 - α) Erro tipo II (β)

Erro tipo II Consiste em não rejeitar a hipótese de Rejeitar Ho erro tipo I (α) Decisão correta (1 - β)
nulidade quando ela é falsa, e sua probabilidade de
ocorrência vale β. 1 - β = PODER DO TESTE

Obs: Para um tamanho fixo de amostra, a redução na probabilidade de um


erro normalmente aumenta a probabilidade do outro. Consegue-se reduzir
ambos os erros aumentando o tamanho da amostra.

4
25 26

- Nível de significância - Região crítica e Valor crítico e

⇒ Corresponde à área no qual se rejeita a hipótese de nulidade,


Região crítica é a área que contém todos os valores
com α% de probabilidade de se cometer o erro tipo I. Ou seja, de
rejeitar Ho, quando não deveria ser rejeitada. em α%. Ou seja, é a região que contém valores que
nos fazem rejeitar Ho.
⇒ Sempre que se concluir o teste de hipóteses, DEVE-SE citar o
nível de significância que foi utilizado.
Valor crítico é o último número que observamos ao
Quando se rejeita Ho ao nível α% de probabilidade, diz-se que passar para a região crítica. É um valor TABELADO de
o teste foi SIGNIFICATIVO.
acordo com o teste que está sendo realizado.
Quando não se rejeita Ho ao nível α% de probabilidade, diz-se
que o teste foi NÃO SIGNIFICATIVO.

27 28

- Estatística do teste

Fórmula em cada teste, cujo resultado (valor


Passo 1. Definir a hipótese Ho a ser testada e a hipótese alternativa
calculado) é usado para comparar com o valor Ha;
tabelado, permitindo assim a conclusão do teste. Passo 2. Usar a teoria estatística e as informações disponíveis para
decidir qual a estatística que será usada para testar a hipótese Ho.
⇒ Se o valor calculado pertencer à região crítica ou de rejeição de Com os dados amostrais calcular o valor da estatística do teste;
Ho (RRHo) → REJEITA-SE Ho ao nível α% → Teste significativo. Passo 3. Fixar o nível de significância α e obter o valor tabelado ou
valor crítico;
⇒ Se o valor calculado pertencer à região de não rejeição de Ho
Passo 4. Comparar o valor da estatística do teste (valor calculado)
(RNRHo) → NÃO SE REJEITA Ho ao nível α% → Teste não
com o valor tabelado e concluir o teste.
significativo.

29 30

Testes para uma média populacional µ:


- Variância σ2 conhecida
- Variância σ2 desconhecida
Testes para uma média populacional µ
Testes para duas médias populacionais (µ1 e µ2), com variâncias
(σ21 e σ22) desconhecidas:
Teste Z ⇒ quando a variância da população (σ2) é
- Dados não pareados ou amostras independentes
conhecida
- Dados pareados ou amostras dependentes
Teste t ⇒ quando a variância da população (σ2) é
Teste para comparação de duas variâncias populacionais (σ21 e
desconhecida
σ2 2)

Testes de Qui-quadrado (χ2 )

5
31 32

⇒Teste Z Etapas do teste:


(Quando a variância da população (σ2) é conhecida)
1) Elaboração das hipóteses estatísticas
Ho: µ = valor
Ha: µ < valor ou (teste unilateral a esquerda)
Objetivo do teste: µ > valor ou (teste unilateral a direita)
Testar se uma média populacional µ é igual a µ ≠ valor (teste bilateral)
um determinado valor, quando a variância desta
2) Determinação do valor calculado do teste
população (σ2) é conhecida.
3) Escolha do nível de significância (α) e obtenção do
valor crítico do teste

4) Decisão estatística e conclusão do teste

33 34

3) Escolha do nível de significância (α) e obtenção do


2) Determinação do valor calculado do teste valor crítico do teste

Erro tipo I ⇒ α = 5 ou 1%
X −µ
Z calculado =
σ/ n 1 - α = 0,95 ou 0,99

Se, 1 - α = 0,95 ⇒ Ztab = 1,96


Em que:
X = média da amostra
µ = média da população Se, 1 - α = 0,99 ⇒ Ztab = 2,57 ou 2,58
σ = desvio padrão da população
n = número de elementos que constituem a amostra
(Tabela de Z)

Tabela 1. Distribuição Normal Padrão Z~N (0,1), tal que p = P (0< Z < Zc) 35 36
Parte inteira da Segunda decimal de Zc
primeira decimal de Zc 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,10
0,20
0,0398
0,0793
0,0438
0,0832
0,0478
0,0871
0,0517
0,0910
0,0557
0,0948
0,0596
0,0987
0,0636
0,1026
0,0675
0,1064
0,0714
0,1103
0,0753
0,1141
4) Decisão estatística e conclusão do teste
0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 RAHo RAHo
0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 RRHo
0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 RRHo
0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,30
1,40
1,50
0,4032
0,4192
0,4332
0,4049
0,4207
0,4345
0,4066
0,4222
0,4357
0,4082
0,4236
0,4370
0,4099
0,4251
0,4382
0,4115
0,4265
0,4394
0,4131
0,4279
0,4406
0,4147
0,4292
0,4418
0,4162
0,4306
0,4429
0,4177
0,4319
0,4441
α 1-α 1-α α
1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 - Ztab Variável X Variável X Ztab
1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
Teste unilateral a esquerda Teste unilateral a direita
2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 RAHo
2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 RRHo RRHo
2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,80
2,90
0,4974
0,4981
0,4975
0,4982
0,4976
0,4982
0,4977
0,4983
0,4977
0,4984
0,4978
0,4984
0,4979
0,4985
0,4979
0,4985
0,4980
0,4986
0,4981
0,4986
α/2 1-α α/2
3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 - Ztab Variável X Ztab
3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 Teste bilateral
3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,60
3,70
0,4998
0,4999
0,4998
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999
0,4999 Se, Zcalc. ∈ RAHo ⇒ não se rejeita-se Ho ao
nível α% que foi realizado o teste
3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
4,00 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

6
37 38

Exemplo:

Uma máquina automática para encher pacotes de Passo 2: Usar a teoria estatística e as informações
sementes enche-os segundo uma distribuição Normal, disponíveis para decidir qual a estatística que será usada
com média µ igual a 500g e variância sempre igual a para testar a hipótese Ho. Com os dados amostrais
400g2. Periodicamente, avalia-se uma amostra de 16 calcular o valor da estatística do teste;
pacotes para verificar se a produção está sob controle,
isto é, se µ = 500g ou não. Se uma dessas avaliações
X −µ
apresentar uma média X = 492g para o peso médio Z calculado =
dos pacotes na amostra, você pararia ou não a σ/ n
produção para regular a máquina (α α = 5%)?
492 − 500
H 0 : µ = 500g Z calculado = = −1,60
Passo 1: Definir as hipóteses
20 / 16
H a : µ ≠ 500 g

39 40

Passo 3: Fixar o nível de significância α e obter o valor Passo 4: Comparar o valor da estatística do teste (valor calculado)
com o valor tabelado. Se o valor tabelado pertence à região de
tabelado ou ponto crítico. aceitação (RAHo) não se rejeita Ho, caso contrário, rejeita-se Ho .
Se α = 5%, logo, 1 - α = 1 – 0,05 = 0,95
RAHo
Como o teste é bilateral, Ztabelado = 1,96 RRHo RRHo

RAHo
RRHo RRHo
0,025 0,025
1 – 0,05

0,025 0,025
1 – 0,05 -1,96 -1,60 1,96

Conclusão: Como Zcalc = -1,60 ∈ RAHo, não se rejeita Ho, ao nível de 5% de


Ztabelado = -1,96 Variável X Ztabelado = 1,96 significância, ou seja, a produção está sob controle com o peso médio de 500g
por pacote de sementes.

41 42

⇒ Teste t Etapas do teste:


(Quando a variância da população (σ2) é desconhecida)
1) Elaboração das hipóteses estatísticas
Ho: µ = valor
Objetivo do teste: Ha: µ < valor ou (teste unilateral a esquerda)
Testar se uma média populacional µ é igual a µ > valor ou (teste unilateral a direita)
um determinado valor, quando a variância desta µ ≠ valor (teste bilateral)
população (σ2) é desconhecida. 2) Determinação do valor calculado do teste

3) Escolha do nível de significância (α) e obtenção do


Logo, em vez de σ2 usa-se seu estimador σˆ 2 valor crítico do teste

4) Decisão estatística e conclusão do teste

7
43 44

3) Escolha do nível de significância (α) e obtenção do


2) Determinação do valor calculado do teste valor crítico do teste

X −µ Erro tipo I ⇒ α = 5 ou 1%
tcalculado = Grau de liberdade = n – 1
σ̂ / n
Olha-se na tabela:
α% e GL ⇒ ttab
Em que:
X = média da amostra
µ = média da população
σ̂ = desvio padrão da amostra (Tabela de t)
n = número de elementos que constituem a amostra

Tabela 2. Distribuição de t de Student 45 46


Nível de Significância α
Área em DUAS caudas (Teste bilateral)
Graus de Liberdade (n-1)
0,20 0,10 0,05 0,025 0,01 4) Decisão estatística e conclusão do teste
Área em UMA cauda (Teste unilateral)
0,10 0,05 0,025 0,01 0,005
1 3,078 6,314 12,706 31,821 63,656
2 1,886 2,920 4,303 6,965 9,925 RAHo RAHo
3 1,638 2,353 3,182 4,541 5,841
RRHo
4 1,533 2,132 2,776 3,747 4,604 RRHo
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8
9
1,397
1,383
1,860
1,833
2,306
2,262
2,896
2,821
3,355
3,250 α 1-α 1-α α
10 1,372 1,812 2,228 2,764 3,169
11 1,363 1,796 2,201 2,718 3,106 - ttab Variável X Variável X ttab
12 1,356 1,782 2,179 2,681 3,055
13 1,350 1,771 2,160 2,650 3,012 Teste unilateral a esquerda Teste unilateral a direita
14 1,345 1,761 2,145 2,624 2,977 RAHo
15 1,341 1,753 2,131 2,602 2,947
16 1,337 1,746 2,120 2,583 2,921 RRHo RRHo
17 1,333 1,740 2,110 2,567 2,898
18 1,330 1,734 2,101 2,552 2,878
19 1,328 1,729 2,093 2,539 2,861
20
21
1,325
1,323
1,725
1,721
2,086
2,080
2,528
2,518
2,845
2,831 α/2 1-α α/2
22 1,321 1,717 2,074 2,508 2,819
23 1,319 1,714 2,069 2,500 2,807
- ttab Variável X ttab
24 1,318 1,711 2,064 2,492 2,797
25 1,316 1,708 2,060 2,485 2,787 Teste bilateral
26 1,315 1,706 2,056 2,479 2,779
27
28
1,314
1,313
1,703
1,701
2,052
2,048
2,473
2,467
2,771
2,763
Se, tcalc. ∈ RAHo ⇒ não se rejeita-se Ho ao
29
30
1,311
1,310
1,699
1,697
2,045
2,042
2,462
2,457
2,756
2,750 nível α% que foi realizado o teste

47 48

Exemplo:

Um criador de coelhos afirma que seus coelhos abatidos Passo 2: Usar a teoria estatística e as informações
aos 90 dias apresentam peso médio de 2,701kg. Uma disponíveis para decidir qual a estatística que será usada
amostra de 10 coelhos foi retirada aleatoriamente e para testar a hipótese Ho. Com os dados amostrais
calculou-se a média e o desvio-padrão (2,584 e 0,0675 calcular o valor da estatística do teste.
kg, respectivamente). Utilizando um teste de hipótese
podemos afirmar que o peso dos coelhos está X −µ
abaixo do que afirma o criador (αα = 5%)? tcalc. =
σˆ / n
H 0 : µ = 2,701 kg 2,584 − 2,701
Passo 1: Definir as hipóteses
H a : µ < 2,701 kg
tcalc. = = −5,481
0,0675 / 10

8
49 50

Passo 3: Fixar o nível de significância α e obter o valor Passo 4: Comparar o valor da estatística do teste (valor
tabelado ou ponto crítico. calculado) com o valor tabelado e concluir o teste.

Se α = 5%, e o teste é unilateral à esquerda, ttabelado = 1,83 RAHo


(olha-se na tabela com n – 1 = 10 – 1 = 9 graus de RRHo
liberdade)

RAHo
RRHo α =0,05
1 - α = 0,95

α = 0,05 Variável X
1 - α = 0,95 tcalc. = -5,48 -1,83

Conclusão: Como tcalc = -5,48 ∈ RRHo, rejeita-se Ho, ao nível de 5%


ttab.= -1,83 Variável X de significância. Logo, a média do peso dos coelhos é inferior a
2,701kg.

51 52

Teste t
Dados não pareados ou amostras independentes

Objetivo do teste:
Testes para duas médias populacionais µ1 e µ2 com variâncias
populacionais σ12 σ22 desconhecidas Testar se médias de diferentes populações são
estatisticamente iguais, com ambas as variâncias
Teste t populacionais (σ12 e σ22) desconhecidas.
Dados não-pareados ou amostras independentes
(os dados das duas amostras não estão relacionados)

Dados pareados ou amostras dependentes Logo, em vez de σ12 e σ22 usa-se seus estimadores,
(numa mesma amostra são obtidos dados antes e depois de algum
tipo de tratamento) σˆ12 e σˆ 22

53 54

Etapas: Teste F
(para comparação de duas variâncias populacionais)
1) Inicialmente testar a homogeneidade das variâncias Etapas do teste F:
populacionais, por meio do teste F para comparação de
duas variâncias populacionais!!! 1.1) Elaborar as hipóteses estatísticas

Ho: σ12 = σ 22
2) A decisão de rejeitar ou não Ho no teste F implicará na Ha: σ12 < σ22 ou σ12 > σ22
estatística correta a ser usada no teste t de comparação das
duas médias populacionais. 1.2) Determinação do valor calculado do teste

3) Após definido o procedimento correto para o teste t, 1.3) Escolha do nível de significância (α) e do valor
proceder o mesmo seguindo as etapas básicas de crítico do teste
construção de teste de hipótese.
1.4) Decisão estatística e conclusão do teste

9
55 56

1.3) Escolha do nível de significância (α) e obtenção do


1.2) Determinação do valor calculado do teste
valor crítico do teste

α = 1 ou 5%
maior variância amostral
Fcalculado =
menor variância amostral v1 = (n – 1) ⇒ graus de liberdade do numerador
v2 = (n – 1) ⇒ graus de liberdade do denominador

(Tabela de F)

Tabela 3. Distribuição de F de Fisher (α = 0,05 ou 5%) 57 58


Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.
1 2 3 4 5 6 7 8 9 10 11 12
1 161 199 216 225 230 234 237 239 241 242 243 244
2
3
18,51
10,13
19,00
9,55
19,16
9,28
19,25
9,12
19,30
9,01
19,33
8,94
19,35
8,89
19,37
8,85
19,38
8,81
19,40
8,79
19,40
8,76
19,41
8,74 1.4) Decisão estatística e conclusão do teste
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28
9
10
5,12
4,96
4,26
4,10
3,86
3,71
3,63
3,48
3,48
3,33
3,37
3,22
3,29
3,14
3,23
3,07
3,18
3,02
3,14
2,98
3,10
2,94
3,07
2,91 RAHo RRHo
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25
22
23
4,30
4,28
3,44
3,42
3,05
3,03
2,82
2,80
2,66
2,64
2,55
2,53
2,46
2,44
2,40
2,37
2,34
2,32
2,30
2,27
2,26
2,24
2,23
2,20 1 - α = 95%
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 Valores de F
29
30
4,18
4,17
3,33
3,32
2,93
2,92
2,70
2,69
2,55
2,53
2,43
2,42
2,35
2,33
2,28
2,27
2,22
2,21
2,18
2,16
2,14
2,13
2,10
2,09
Ftabelado
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00
50
60
70
4,03
4,00
3,98
3,18
3,15
3,13
2,79
2,76
2,74
2,56
2,53
2,50
2,40
2,37
2,35
2,29
2,25
2,23
2,20
2,17
2,14
2,13
2,10
2,07
2,07
2,04
2,02
2,03
1,99
1,97
1,99
1,95
1,93
1,95
1,92
1,89
Se Fcalculado < Ftabelado ⇒ Não se rejeita Ho.
80
90
3,96
3,95
3,11
3,10
2,72
2,71
2,49
2,47
2,33
2,32
2,21
2,20
2,13
2,11
2,06
2,04
2,00
1,99
1,95
1,94
1,91
1,90
1,88
1,86 Se Fcalculado > Ftabelado ⇒ Rejeita –se Ho.
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85
500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85 1,81 1,77
1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,80 1,76

59 60

Teste t 2) Determinação do valor calculado do teste


Dados não pareados ou amostras independentes

1) Elaboração das hipóteses estatísticas Se Ho for NÃO rejeitada no teste F:


Ho: µ1 = µ2
Ha: µ1 < µ2 ou (teste unilateral a esquerda)
µ1 > µ2 ou (teste unilateral a direita) ( X1 − X 2 )
tcalculado =
µ1 ≠ µ2 (teste bilateral) ( n1 − 1)σˆ12 + (n2 − 1)σˆ 22  1 1 
. + 
2) Determinação do valor calculado do teste n1 + n2 − 2  n1 n2 

3) Escolha do nível de significância (α) e obtenção do Em que:


valor crítico do teste X 1 e X 2 = médias das amostras 1 e 2, respectivamente
σˆ12 e σˆ 22 = variâncias das amostras 1 e 2, respectivamente
4) Decisão estatística e conclusão do teste n1 e n2 = número de elementos que constituem a amostra 1 e 2,
respectivamente

10
61 62

3) Escolha do nível de significância (α) e obtenção do


2) Determinação do valor calculado do teste valor crítico do teste

Se Ho for rejeitada no teste F: Se Ho for aceita no teste F:


α = 1 ou 5%
( X1 − X 2 ) Grau de liberdade = n1 + n2 – 2
t calculado =
σˆ12 σˆ 22
+ Se Ho for rejeitada no teste F: 2
n1 n2  σˆ12 σˆ 22 
 + 
α = 1 ou 5% n n2 
Em que:
v =  12 2
X 1 e X 2 = médias das amostras 1 e 2, respectivamente
 σˆ12   σˆ 22 
Grau de liberdade = v  n   n 
σˆ12 e σˆ 22 = variâncias das amostras 1 e 2, respectivamente  1  + 2 
n1 e n2 = número de elementos que constituem a amostra 1 e 2, n1 − 1 n2 − 1
respectivamente (TABELA DE t)

63 64

4) Decisão estatística e conclusão do teste 4) Decisão estatística e conclusão do teste

Se, Ha: µ1 < µ2 ⇒ teste unilateral a esquerda Se, Ha: µ1 > µ2 ⇒ teste unilateral a direita

RRHO RAHO RAHO RRHO

α 1–α 1–α α

µ1 < µ2 µ1 = µ2 µ1 = µ2 µ1 > µ2
-ttab. +ttab.
Figura 6. Distribuição de probabilidade para a variável X “médias amostrais” de duas populações, Figura 7. Distribuição de probabilidade para a variável X “médias amostrais” de duas populações,
para teste unilateral a esquerda, em que α é o nível de significância estipulado para o teste. para teste unilateral a direita, em que α é o nível de significância estipulado para o teste. RRHo é
RRHo é a região de rejeição de Ho e RAHo é a região de aceitação de Ho. a região de rejeição de Ho e RAHo é a região de aceitação de Ho.

65 66

4) Decisão estatística e conclusão do teste Exemplo:

Se, Ha: µ1 ≠ µ2 ⇒ teste bilateral Duas amostras de variedades de milho (A e B) foram


avaliadas quanto à produtividade em toneladas/hectare.
RRHO RAHO RRHO Os resultados são apresentados a seguir:

Variedade A 1,3 1,4 1,1 1,4 1,5


Variedade B 1,8 1,6 1,9 1,9 1,8
1–α α/2
α/2
Os dados amostrais são:
µ1 < µ2 µ1 = µ2 µ1 > µ2 X A = 1,34; X B = 1,80; σˆ A2 = 0,0231; σˆ B2 = 0,0150
-ttab. +ttab.
Podemos afirmar ao nível de 5% de significância que as
Figura 8. Distribuição de probabilidade para a variável X “médias amostrais” de duas populações,
para teste bilateral, em que α é o nível de significância estipulado para o teste. RRHo é a região
médias de produtividade das variedades são iguais ou
de rejeição de Ho e RAHo é a região de aceitação de Ho. não?

11
67 68

Passo 3: Fixar o nível de significância α e obter o valor


Teste F tabelado ou ponto crítico.

Se α = 5%, com 4 e 4 graus de liberdade no numerador e


H 0 : σ A2 = σ B2 denominador, respectivamente, obtemos, Ftabelado = 6,39
Passo 1: Definir as hipóteses
H a : σ A2 > σ B2 RRHo
RAHo

Passo 2: Usar a teoria estatística e as informações


disponíveis para decidir qual a estatística que será usada
para testar a hipótese Ho. Com os dados amostrais
calcular o valor da estatística do teste. 1 - α = 95%

maior variância 0,0231


Fcalculado = = = 1,54 Valores de F
menor variância 0,0150

69 70

Passo 4: Comparar o valor da estatística do teste (valor


calculado) com o valor tabelado e concluir o teste.

RAHo RRHo
Então, deve-se proceder ao Teste t utilizando a estatística
adequada para quando NÃO SE REJEITA Ho no teste F.

( X1 − X 2 )
tcalculado =
1 - α = 95% ( n1 − 1)σˆ + (n2 − 1)σˆ 22  1 1 
2
1
. + 
n1 + n2 − 2  n1 n2 
Valores de F
Ftab.= 6,39
1,54 Com (n1 + n2 – 2) ⇒ graus de liberdade
Conclusão: Como Fcalc = 1,54 ∈ RAHo, Não se rejeita Ho, ao nível de
5% de significância. Logo, as variâncias populacionais das variedades
A e B são homogêneas.

71 72

Teste t X A = 1,34; σˆ A2 = 0,0231


X B = 1,80; σˆ B2 = 0,0150

H 0 : µA = µB (X A − X B )
Passo 1: Definir as hipóteses tcalculado =
Ha : µA ≠ µB
(n A − 1)σˆ + (nB − 1)σˆ B2  1
2
1
A
. + 
Passo 2: Usar a teoria estatística e as informações disponíveis para
n A + nB − 2  n A nB 
decidir qual a estatística que será usada para testar a hipótese Ho.
(1,34 − 1,80)
Com os dados amostrais calcular o valor da estatística do teste. tcalculado =
(5 − 1)0,0231 + (5 − 1)0,0150  1 1 
( X1 − X 2 ) . + 
tcalculado = 5+5−2 5 5
(n1 − 1)σˆ12 + (n2 − 1)σˆ 22  1 1 
. + 
n1 + n2 − 2  n1 n2  tcalculado = −5,24

12
73 74

Passo 3: Fixar o nível de significância α e obter o valor Passo 4: Comparar o valor da estatística do teste (valor
tabelado ou ponto crítico. calculado) com o valor tabelado e concluir o teste.

Se α = 5%, e o teste é bilateral, ttabelado = 2,31 (olha-se na


RRHO RAHO RRHO
tabela com n1 + n2 - 2 = 5 + 5 – 2 = 8 graus de liberdade)

RRHO RAHO RRHO

1 – 0,05 0,025
0,025
µ1 < µ2 µ1 = µ2 µ1 > µ2
1 – 0,05 0,025
0,025 tcalc. = -5,24 ttab. = -2,31 ttab. = 2,31

µ1 < µ2 µ1 = µ2 µ1 > µ2
Conclusão: Como tcalc = -5,24 ∈ RRHo, rejeita-se Ho ao nível de 5%
ttab. = -2,31 ttab. = 2,31 de significância. Logo, as médias de produtividades das variedades A e
B não são iguais.

75 76

Teste F

Em um centro agrícola deseja-se testar o efeito de


determinado fertilizante sobre a produtividade de trigo H 0 : σ CF
2
= σ SF
2
Passo 1: Definir as hipóteses
(kg/ha). Para isso, 24 áreas de terra foram escolhidas, H a : σ CF
2
> σ SF
2
cada uma de 10m2. Metade dessas unidades foi tratada
com o fertilizante, enquanto a outra não (controle). Os
seguintes dados foram obtidos: Passo 2: Usar a teoria estatística e as informações
disponíveis para decidir qual a estatística que será usada
X CF = 1710; X SF = 1260;σˆ CF = 730; σˆ SF = 280 para testar a hipótese Ho. Com os dados amostrais
calcular o valor da estatística do teste.
Podemos afirmar ao nível de 5% de significância que
houve aumento na produtividade de trigo devido à maior variância 7302
aplicação do fertilizante? Fcalculado = = = 6,80
menor variância 280 2

77 78

Passo 3: Fixar o nível de significância α e obter o valor Passo 4: Comparar o valor da estatística do teste (valor
tabelado ou ponto crítico. calculado) com o valor tabelado e concluir o teste.

Se α = 5%, com 11 e 11 graus de liberdade no numerador RAHo RRHo


e denominador, respectivamente, obtemos, Ftabelado = 2,82

RAHo RRHo

1 - α = 95%

Valores de F
1 - α = 95% Ftab.= 2,82
Fcalc. = 6,80
Conclusão: Como Fcalc = 6,80 ∈ RRHo, rejeita-se Ho, ao nível de 5%
Valores de F de significância. Logo, as variâncias populacionais das áreas tratadas e
não tratadas com o fertilizante são heterogêneas.

13
79 80

Teste t

Então, deve-se proceder o Teste t utilizando a estatística


adequada para quando se REJEITA Ho no teste F. H 0 : µ CF = µSF
Passo 1: Definir as hipóteses
H a : µ CF > µ SF
( X1 − X 2 )
tcalculado =
σˆ12 σˆ 22
+ Passo 2: Usar a teoria estatística e as informações disponíveis para
n1 n2 decidir qual a estatística que será usada para testar a hipótese Ho.
Com os dados amostrais calcular o valor da estatística do teste.
2
 σˆ12 σˆ 22 
 n + n  ( X1 − X 2 )
Com v graus de liberdade, em que: v=  1 2  t calculado =
2
 σˆ   σˆ 
2 2
2
σˆ12 σˆ 22
   
1 2
+
 n1  +  n2  n1 n2
n1 − 1 n2 − 1

81 82

X CF = 1710; X SF = 1260 Passo 3: Fixar o nível de significância α e obter o valor


tabelado ou ponto crítico.
σˆ CF = 730; σˆ SF = 280
Se α = 5%, e o teste é unilateral à direita, ttabelado = 1,76
(olha-se na tabela com v = 14 graus de liberdade)
( X CF − X SF )
tcalculado = 2
 7302 2802 
2
 σˆ CF σˆ 2 
σˆ σˆ
2
2 2
 + SF   + 
CF
+ SF
 nCF nSF   12
 12 
nCF nSF v= 2 2
= 2 2
 σˆ CF
2
  σˆ SF 2
  7302   2802 
       
(1710 − 1260)  12   12 
tcalculado = = 1,99  nCF  +  nSF    + 
2 nCF − 1 nSF − 1 12 − 1 12 − 1
7302 280
+
12 12
v ≅ 14

83 84

Passo 3: Fixar o nível de significância α e obter o valor Passo 4: Comparar o valor da estatística do teste (valor
tabelado ou ponto crítico. calculado) com o valor tabelado e concluir o teste.

Se α = 5%, e o teste é unilateral à direita, ttabelado = 1,76 RAHO RRHO


(olha-se na tabela com v = 14 graus de liberdade)

RAHO RRHO

1 – 0,05 0,05

µ1 = µ2 µ1 > µ2
1 – 0,05 0,05 ttab. = 1,76
tcalc. = 1,99
µ1 = µ2 µ1 > µ2
Conclusão: Como tcalc = 1,99 ∈ RRHo, rejeita-se Ho ao nível de 5% de
ttab. = 1,76 significância. Logo, o uso do fertilizante causa um acréscimo
significativo na produção de trigo.

14
85 86

Teste t
Dados pareados ou amostras dependentes Etapas do teste:

1) Elaboração das hipóteses estatísticas


Objetivo do teste:
Testar se existe diferença entre valores obtidos a 2) Determinação do valor calculado do teste
partir do mesmo conjunto de itens ou indivíduos.
3) Escolha do nível de significância (α) e obtenção do
Consiste em testar se a média dos desvios, em uma valor crítico do teste
população antes e após a aplicação de um determinado tratamento,
é estaticamente igual a um determinado valor, geralmente se testa 4) Decisão estatística e conclusão do teste
igual a zero.

87 88

1) Elaboração das hipóteses estatísticas 2) Determinação do valor calculado do teste

Hipóteses : Estatística do teste para dados pareados:


H o : D = Do
D − Do
H a : D < Do ou D > Do ou D ≠ Do tcalculado =
σ̂ D
n
OBS: O Do pode ser ou não igual a zero!!!
Em que: n
Se Do = 0, então temos : n
(∑ Di ) 2
n
Ho : D = 0 ∑D i ∑D i
2
− i =1
n
D = i =1 σˆ D = i =1

H a : D < 0 ou D > 0 ou D ≠ 0 n n −1

89 90

3) Escolha do nível de significância (α) e do valor 4) Decisão estatística e conclusão do teste


crítico do teste
RAHo RAHo
RRHo
RRHo
Erro tipo I ⇒ α = 5 ou 1%
Grau de liberdade = n – 1 α 1-α 1-α α
- ttab Variável X Variável X ttab

Olha-se na tabela: Teste unilateral a esquerda


RAHo
Teste unilateral a direita

α% e GL ⇒ ttab RRHo RRHo

α/2 1-α α/2


(Tabela de t) - ttab Variável X ttab
Teste bilateral

Se, tcalc. ∈ RAHo ⇒ não se rejeita-se Ho ao


nível α% que foi realizado o teste

15
91 92

Exemplo: INICIALMENTE, deve-se calcular os desvios:

Os dados de peso de bezerros (kg) foram obtidos


antes e depois da aplicação de uma nova ração
Bezerros 1 2 3 4 5
(tratamento), em uma amostra de tamanho n = 5. Os
seguintes dados foram obtidos: Peso antes do tratamento 100 105 108 106 110
Peso depois do tratamento 120 115 130 140 112
Bezerros 1 2 3 4 5
Desvios (D) -20 -10 -22 -34 -2
Peso antes do tratamento 100 105 108 106 110
Peso depois do tratamento 120 115 130 140 112
Em que,
D = diferença entre os valores antes e após (ou vice-versa) a
Podemos afirmar ao nível de 5% de significância que a aplicação do tratamento.
alimentação dos animais com a ração causou acréscimo
de peso nos bezerros ?

93 94

Passo 1: Definir as hipóteses Cálculo do desvio médio:

H0 : D = 0
5

∑D i
Ha : D > 0 D = i =1
n
Passo 2: Calcular a estatística do teste. − 20 + ( − 10 ) + ( − 22 ) + ( − 34 ) + ( − 2 )
D =
5
D − Do Em que:
tcalculado = n − 88
σ̂ D n n
(∑ Di ) 2 D =
∑D 5
n i ∑D i
2
− i =1
n
D = i =1
σˆ D = i =1
D = − 17 , 6
n n −1

95 96

Cálculo do desvio padrão dos desvios:

n Passo 2: Calcular a estatística do teste.


n
(∑ Di ) 2
∑D i
2
− i =1
n D − Do
σˆ D = i =1
= tcalculado =
n −1 σˆ D
( − 88 ) 2 n
[( − 20 ) 2 + ( − 10 ) 2 + ( − 22 ) 2 + ( − 34 ) 2 + ( − 2 ) 2 ] −
σˆ D = 5 − 17,6 − 0
5 −1 tcalculado = = −3,23
12,20
5
σˆ D = 12 , 20

16
97 98

Passo 3: Fixar o nível de significância α e obter o valor Passo 4: Comparar o valor da estatística do teste (valor
tabelado ou ponto crítico. calculado) com o valor tabelado.
Se α = 5%, e o teste é unilateral à direita, ttabelado = 2,132
(olha-se na tabela com n – 1 = 5 – 1 = 4 graus de RAHo
liberdade) RRHo

RAHo
RRHo
1 - α = 95% α = 5%

1 - α = 95% α = 5% Variável X ttabelado: 2,132


3,23

Conclusão: Como tcalc= 3,23 > ttabelado= 2,13 ⇒ rejeita-se Ho, ao nível de
Variável X ttabelado: 2,132 5% de significância, ou seja, o uso da ração causa acréscimo no peso de
bezerros.

99 100

Teste χ2 DE ADERÊNCIA

Testes de Qui-quadrado Objetivo do teste:


Verificar se uma distribuição observada de
Teste de ADERÊNCIA
(verificar se uma distribuição observada de dados ajusta-se a uma frequências se ajusta a uma distribuição esperada
distribuição esperada) de valores segundo determinada teoria.
Teste de COMPARAÇÃO DE PROPORÇÕES ou DE
HETEROGENEIDADE
(comparar duas ou mais populações com relação a duas ou mais Exemplo:
variáveis qualitativas) Estudos genéticos de herança de caracteres
Teste de ASSOCIAÇÃO ou INDEPENDÊNCIA
(verificar se existe associação entre duas variáveis qualitativas)

101 102

Etapas do teste: Exemplo 1:


(Adaptado de: ATTO RAMALHO, M. A. et al. Genética na agropecuária. 4. ed., Lavras: Ed UFLA,
2008. pág. 153-155
1) Elaboração das hipóteses estatísticas
Ho:O = E
A distribuição das frequências observadas (O) é igual à Suponha um experimento envolvendo o estudo
distribuição das frequências esperadas (E) segundo a da herança da cor e da textura da semente do milho, em
teoria testada. que foram obtidas 480 sementes na geração F2
Ha: O ≠ E (descendentes da autopolinização de plantas com sementes amarelas e
lisas), assim distribuídas:
2) Determinação do valor calculado do teste
- 268 amarelas e lisas
3) Escolha do nível de significância (α) e obtenção do - 86 amarelas e rugosas
valor crítico do teste - 97 brancas e lisas
4) Decisão estatística e conclusão do teste - 29 brancas e rugosas
Se, χ2calc. < χ2tab. = não se rejeita Ho
Se, χ2calc. > χ2tab. = rejeita-se Ho

17
103 104

Considerando que o caráter cor da semente é


controlado por um gene com dominância do alelo que Ou seja, esperava-se na geração F2 nas 480 sementes
condiciona cor amarela sobre branca, e dominância do a seguinte distribuição:
alelo que condiciona textura lisa sobre a rugosa, a
segregação esperada na geração F2 é:
270 90 90 30
x Geração parental
AABB aabb

AaBb
Ou seja, se a proporção é 9:3:3:1, então:
Geração F1
16 _____ 9 16 _____ 3 16 _____ 1
480 _____ x 480 _____ x 480 _____ x
Geração F2
x = 270 x = 90 x = 30
9 A_B_ 3 A_bb 3 aaB_ 1 aabb

105 106

Etapas do teste:
A questão é:
1) Elaboração das hipóteses estatísticas
Até que ponto as diferenças entre o esperado e o
observado podem ser atribuídas ao acaso? Ho: O = E
A distribuição das frequências observadas (O) é igual à
Ou ainda, as diferenças entre o valores observado e distribuição das frequências esperadas (E) segundo a
esperado foram devido ao acaso, ou realmente a hipótese testada, ou seja a frequência dos genótipos é
hipótese testada de herança dominante para os dois igual 9 (A_B_): 3 (A_bb): 3 (aaB_): 1 (aabb)
genes não é válida para este caráter?
Ha: O ≠ E
Resposta: fazer o teste Qui-quadrado de aderência!!! Em que:
O = Número observado em cada categoria
E = Número esperado em cada categoria

107 108

2) Determinação do valor calculado do teste 2) Determinação do valor calculado do teste


Tabela 1. Frequências dos tipo de cores e texturas de sementes de milho na
suposição de que os caracteres são determinados por genes xom
dominância

(O − E ) 2

Valores Valores
χ calc .=
2 Categorias O-E (O – E )2
observados esperados
A_B_ 268 270 -2 4
E A_bb 86 90 -4 16
aaBb 97 90 +7 14
aabb 29 30 -1 1
Total 480 480 0 -
Em que:
O = Número observado de cada categoria (O − E ) 2 4 16 14 1
E = Número esperado de cada categoria χ calc
2
.= ∑ = + + +
E 270 90 90 30
χ calc
2
. = 0,770

18
109 Tabela 4. Distribuição de Qui-quadrado (χ2), tal que P (χn2 < x) 110

3) Escolha do nível de significância (α) e obtenção


do valor crítico do teste

α= 5%

Grau de liberdade: Número de classes fenotípicas – 1


Logo, GL = 4 – 1 = 3

Então, χ2(5%; 3) = 7,815 (Tabela de χ2)

111 112

Exemplo 2:
4) Decisão estatística e conclusão do teste (JAQUES-CALLEGARI, S. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003, pág.
129-133)

Um investigador está estudando a presença de


Como χ2calc. = 0,770 < χ2tab. = 7,815 antígenos R e S (fictícios) em tecido humano. O assunto
é de grande importância, pois seriam antígenos
NÃO SE REJEITA Ho ao nível de 5% de relacionados com a histocompatibilidade e qualquer
probabilidade informação relativa à herança desses antígenos é de
grande valia nos casos de transfusões e transplantes de
CONCLUSÃO: tecidos e órgãos.
A distribuição de frequências observadas não difere
da distribuição esperada, portanto as diferenças entre elas Imaginem que existem 3 tipos de pessoas:
foram devido ao acaso. Logo, NÃO há evidências que - Tipo RR: que só possuem o antígeno R;
contradigam a hipótese de que o mecanismo genético que - Tipo SS: que só possuem o antígeno S;
determina a cor e a textura da sementes de milho seja o - Tipo RS: que possuem os dois antígenos.
de dois genes com dominância.

113 114

O pesquisador faz a hipótese de que estes tipos Se a hipótese sugerida estiver correta, então
são determinados geneticamente por um par de alelos filhos resultantes de cruzamentos de mulheres RS com
R e S autossômicos co-dominantes1. homens RS devem apresentar três genótipos possíveis,
conforme determina a 1ª Lei de Mendel1, quais sejam:
Logo, os genótipos para cada tipo seriam:
- RR: determinando o fenótipo R; - RR: na frequência de ¼ ou 25%
- RS: fenótipo RS;
- RS: na frequência de ½ ou 50%
- SS: fenótipo S;
- SS: na frequência de ¼ ou 25%

1Alelos 1Primeira lei de Mendel: cada caráter é determinado por um par de fatores genéticos denominados
autossômicos e co-dominantes: estão no mesmo loco cromossômico e se expressam, ambos,
independentemente, no heterozigoto. alelos. Estes, na formação dos gametas, são separados e, desta forma, pai e mãe transmitem apenas
um para seu descendente.

19
115 116

Os resultados foram obtidos a partir de uma amostra,


então estes podem diferir do que seria esperado devido a
algum erro de amostragem.
Desejando testar a hipótese de que os alelos R e
S são co-dominantes, o pesquisador então estudou 24 A questão é:
filhos de cruzamentos RS x RS, escolhidos
aleatoriamente, e obteve:
Até que ponto as diferenças podem ser atribuídas ao
acaso?
6 RR; 15 RS e 3 SS:
Esses dados não corroboram com a ideia de Ou ainda, as diferenças entre o valores observado e
herança co-dominante, que deveria ser: esperado foram devido ao acaso, ou realmente a
hipótese testada de herança co-dominante não é válida
6 RR (1/4 de 24); 12 RS (1/2 de 24) e 6 SS (1/4 de 24) para este caráter?
Resposta: fazer o teste Qui-quadrado de aderência!!!

117 118

Etapas do teste: 2) Determinação do valor calculado do teste

1) Elaboração das hipóteses estatísticas


(O − E ) 2
Ho: O = E
A distribuição das frequências observadas (O) é
χ calc
2
.= ∑ E
igual à distribuição das frequências esperadas (E)
segundo a hipótese testada, ou seja a frequência
dos genótipos é igual ¼ RR; ½ RS: ¼ SS
Em que:
Ha: O ≠ E O = Número observado de cada categoria
E = Número esperado de cada categoria

119 120

2) Determinação do valor calculado do teste 3) Escolha do nível de significância (α) e obtenção


do valor crítico do teste
Tabela 1. Frequências dos tipos R, RS e S, na suposição de que os
antígenos deste sistema são determinados por genes
Proporção
Categorias O
esperada
E O-E (O – E )2 α = 5%
RR 6 1/4 6 0 0
RS 15 2/4 12 3 9
Grau de liberdade: Número de categorias – 1
GL = 3 – 1 = 2
SS 3 1/4 6 -3 9
Total 24 1,0 24 0 -
Logo, χ2(5%; 2) = 5,99 (tabela de χ2)
(O − E )2


0 9 9
χ calc
2
.= = + +
E 6 12 6

χ calc
2
. = 2,25

20
121 122

Exemplo 3:
4) Decisão estatística e conclusão do teste
Um pesquisador tentou verificar se a herança do
Como χ2calc. = 2,25 < χ2tab. = 5,99 tamanho das orelhas de camundongos se assemelhava
à herança observada por Mendel nas ervilhas, e para
isso cruzou camundongos de orelhas grandes (PP) com
NÃO SE REJEITA Ho ao nível de 5% de camundongos de orelhas pequenas (pp) e observou na
probabilidade geração F2 o aparecimento de 155 camundongos de
orelhas grandes e 45 com orelhas curtas. Teste
CONCLUSÃO: estatisticamente esta hipótese (Use α = 5%).
A distribuição de frequências observadas não
difere da distribuição esperada, portanto as diferenças
entre elas foram casuais. Logo, NÃO há evidências que
contradigam a hipótese de que o mecanismo genético
que determina os tipos R, RS e S é o de herança Resposta: χ2 calculado (0,6667) < χ2 tabelado (3,841), GL = 1. Não se rejeita Ho ao nível
de 5% de significância.
simples com co-dominância.

123 124

Teste χ2 Etapas do teste:


Para comparação de proporções ou de
heterogeneidade
1) Elaboração das hipóteses estatísticas
Ho: O = E
A proporção de elementos em cada categoria é a mesma
Objetivo do teste: nas diferentes populações estudadas
Ha: O ≠ E
Comparar duas ou mais populações quanto a
uma variável qualitativa. 2) Determinação do valor calculado do teste
Para este teste, os dados são organizados em
uma tabela de contingência, nas quais as linhas 3) Escolha do nível de significância (α) e obtenção do
valor crítico do teste
representam as várias amostras e as colunas, as
categorias da variável (ou vice-versa). 4) Decisão estatística e conclusão do teste
Se, χ2calc. < χ2tab. = não se rejeita Ho
Se, χ2calc. > χ2tab. = rejeita-se Ho

125 126

Exemplo:
(JAQUES-CALLEGARI, S. Bioestatística: princípios e aplicações. Porto Alegre: Artmed, 2003, pág.
133-137)

O coleóptero Chauliognathus flavipes pode


apresentar diferentes padrões para as manchas pretas A questão é:
que ocorrem sobre os élitros1, que são amarelos.

Tabela 2. Dados obtidos para três localidades, com respeito a três padrões Partindo-se do pressuposto de que não existe diferença
de manchas de élitros, nos anos de 1989 e 1990. entre as localidades, quanto às frequências dos
Padrão de élitros padrões de élitros, pode-se considerar que elas
Localidade Total
Claro Intermediário Escuro constituem uma população única no que se refere a
Porto Alegre 67 20 4 91 essa variável?
São Leopoldo 68 29 19 116
Caxias do Sul 26 3 6 35
Resposta: fazer o teste Qui-quadrado de comparação
de proporções ou heterogeneidade!!!
Total 161 52 29 242
1Élitros são asas coriáceas que ficam sobrepostas às asas membranosas protegendo-as.

21
127 128

Etapas do teste: 2) Determinação do valor calculado do teste

1) Elaboração das hipóteses estatísticas


(O − E ) 2
Ho: O = E
χ calc
2
.= ∑ E
A proporção de élitros claro, intermediário e
escuro é a mesma nas três populações. Ou
seja, não há diferença entre os locais quanto Em que:
ao padrão de élitros. O = Número observado das categorias das variáveis dois
a dois
Ha: O ≠ E E = Número esperado das categorias das variáveis dois a
dois, dado por:
total da coluna x total da linha
E=
total geral

129 130

2) Determinação do valor calculado do teste 3) Escolha do nível de significância (α) e obtenção


do valor crítico do teste
Tabela 3. Valores observados e esperados para o teste de heterogeneidade
entre as localidades.
O E (O – E) (O – E)2
67 60,5 6,5 42,25 α= 5%
68 77,2 -9,2 86,64
26 23,3 2,7 7,29
20 19,6 0,4 0,16 Grau de liberdade: (L – 1) (C – 1)
29 24,9 4,1 16,81 GL = (3 – 1) (3 – 1) = 4
3 7,5 -4,5 20,25
4 10,9 -6,9 47,61
19 13,9 5,1 26,01 Logo, χ2(5%; 4) = 9,49 (tabela de χ2)
6 4,2 1,8 3,24
Total: 242 242 0 -
Em que:
(O − E )
2


42,25 86,64 3,24 L = número de categorias da variável que está nas linhas da tabela;
χ calc
2
.= = + + ... + = 12,5 C = número de categorias da variável que está nas colunas da tabela.
E 60,5 77,2 4,2

131 132

Teste χ2
4) Decisão estatística e conclusão do teste
Para associação ou independência

Como χ2calc. = 12,5 > χ2tab. = 9,49 Objetivo do teste:


Testar a associação entre duas variáveis
REJEITA- SE Ho ao nível de 5% de
qualitativas.
probabilidade Para este teste os dados são organizados em
CONCLUSÃO: uma tabela de contingência, na qual as linhas e as
As frequências observadas diferem colunas representam as categorias das duas
significativamente das esperadas quanto à variáveis em análise.
frequência dos padrões de élitros. Portanto, as três
populações de Chauliognathus flavipes diferem
quanto ao padrão de élitro.

22
133 134

Etapas do teste: Exemplo:


(DÍAZ, F. R.; LÓPEZ, F. J. B. Bioestatística. São Paulo: Thomson Learning, 2007, pág. 225-226)

Quinhentas crianças de uma escola primária


1) Elaboração das hipóteses estatísticas foram classificadas de acordo com o grupo
Ho: O = E
Não existe associação entre as variáveis em estudo. socioeconômico e com a presença ou ausência de certa
Ha: O ≠ E falha na pronúncia.
Tabela 4. Dados obtidos para o grupo socioeconômico e a presença ou ausência de
certa falha na pronúncia em crianças de uma escola primária.
2) Determinação do valor calculado do teste
Grupo socioeconômico
Falha na
Médio- Médio- Total
3) Escolha do nível de significância (α) e obtenção do pronúncia Superior Inferior
superior inferior
valor crítico do teste
Com defeito 8 24 32 27 91
4) Decisão estatística e conclusão do teste Sem defeito 42 121 138 108 409
Se, χ2calc. < χ2tab. = não se rejeita Ho Total 50 145 170 135 500
Se, χ2calc. > χ2tab. = rejeita-se Ho

135 136

Etapas do teste:

A questão é: 1) Elaboração das hipóteses estatísticas

Ho: O = E
Esses dados são compatíveis com a hipótese de que a
Não existe associação entre as variáveis
falha na pronúncia não está relacionada com o grupo
estudadas, ou seja, o nível socioeconômico e
socioeconômico?
a falha de pronúncia são independentes

Ha: O ≠ E
Resposta: fazer o teste Qui-quadrado de associação ou Existe associação entre as variáveis estudadas,
independência!!! ou seja, o nível socioeconômico e a falha de
pronúncia NÃO são independentes

137 138

2) Determinação do valor calculado do teste 2) Determinação do valor calculado do teste


Tabela 3. Valores observados e esperados para o teste de heterogeneidade
entre as localidades.
(O − E ) 2


(O – E)2
χ calc
O E (O – E)
2
.= 8 9,10 1,10 1,21
E 24
32
26,39
30,94
2,39
1,06
5,71
1,12
27 24,57 2,43 5,90
42 40,90 1,10 1,21
Em que: 121 118,61 2,39 5,71
O = Número observado das categorias das variáveis dois 138 139,06 1,06 1,12
a dois 108 110,43 2,43 5,90
E = Número esperado das categorias das variáveis dois a Total: 500 500 0 -
dois, dado por:
E=
total da coluna x total da linha (O − E ) 2 1,21 5,71

5,90
total geral χ calc
2
.= = + + ... + = 0,78
E 9,1 26,39 110,43

23
139 140

3) Escolha do nível de significância (α) e obtenção 4) Decisão estatística e conclusão do teste


do valor crítico do teste

α= 5% Como χ2calc. = 0,78 < χ2tab. = 7,81

Grau de liberdade: (L – 1) (C – 1) NÃO SE REJEITA Ho ao nível de 5% de


GL = (2 – 1) (4 – 1) = 3 probabilidade

Logo, χ2(5%; 3) = 7,81 (tabela de χ2) CONCLUSÃO:


Não existe associação entre o problema de
pronúncia das crianças da população e o nível
Em que: socioeconômico, ou seja, as variáveis são
L = número de categorias da variável que está nas linhas da tabela; independentes .
C = número de categorias da variável que está nas colunas da tabela.

141 142

Usos e restrições do Teste χ2 RESUMO DOS TESTES DE HIPÓTESES


O teste dever ser sempre feito com as frequências
absolutas. Objetivo Teste Estatística do Grau de liberdade
teste
Só deve ser aplicado quando a amostra tiver mais de 20 Testar se uma média
1 - α = 0,95 ⇒ Ztab =
populacional µ é igual a X −µ
elementos; um determinado valor, Z calc. =
1,96
quando a variância
Teste Z
σ/ n 1 - α = 0,99 ⇒ Ztab =
Se 20 ≤ n ≤ 40, o teste de χ2 só poderá ser aplicado se desta população (σ2) é
2,57 ou 2,58
nenhuma frequência esperada for menor do que 1; conhecida.
Testar se uma média
As variáveis devem ser nominais. Para variáveis ordinais, populacional µ é igual a
um determinado valor, X −µ
aplica-se o teste de χ2 para tendências; Teste t t calc. = GL = n - 1
quando a variância
σˆ / n
desta população (σ2) é
O teste de χ2
de associação mede a significância da desconhecida.
associação entre variáveis. Há a correção de Yates, que mede
o grau desta associação.

143 144

RESUMO DOS TESTES DE HIPÓTESES RESUMO DOS TESTES DE HIPÓTESES


Objetivo Teste Estatística do teste Grau de liberdade
Objetivo Teste Estatística do teste Grau de liberdade
Se Ho não for rejeitada no teste F
(variâncias populacionais iguais::
( X1 − X 2 ) Verificar se uma
t calc. =
(n1 − 1)σˆ12 + (n2 − 1)σˆ 22  1 1 distribuição observada de GL = No de categorias
Testar se médias de . +  GL = n1 + n2 – 2 frequências se ajusta a Teste χ2 de (O − E ) 2
diferentes populações são
n1 + n2 − 2  n1 n2 
uma distribuição esperada aderência
χ calc
2
.= ∑ E
–1
estatisticamente iguais, de valores segundo
com ambas as variâncias
Teste t
Se Ho for rejeitada no teste F  σˆ12 σˆ 22 
2
determinada teoria
populacionais (σ12 e σ22) (variâncias populacionais desiguais):  + 
 
GL = v =  n1 n2 
desconhecidas. (X1 − X 2 ) 2 2 Teste χ2 de
t calc. =  σˆ12 
 
 σˆ 22 
  Comparar duas ou mais
σˆ12 σˆ 22 n    comparação (O − E ) 2
 1  +  n2  populações quanto a uma GL = (L – 1)(C – 1)
+
n1 n2 n1 − 1 n2 − 1 variável qualitativa. proporções ou χ calc
2
.= ∑ E
heterogeneidade
Testar se a média dos Teste χ2 de
desvios, em uma Teste t Testar a associação entre (O − E ) 2
população antes e após para tcalc. =
D − Do
GL = n - 1
duas variáveis qualitativas.
associação ou
independência
χ calc
2
.= ∑ E
GL = (L – 1) (C – 1)
determinado tratamento, desvio σˆ D
é igual a um determinado médio
valor. n

24
145 146

Peso (g) antes e após o


EXERCÍCIO 10 (apostila): Cobaia tratamento
Antes Após
1 635 640
Doze galinhas adultas foram submetidas ao tratamento 2 703 711
com certa ração durante uma semana. Os animais foram 3 660 673
perfeitamente identificados tendo sido mantidos, para 4 550 548
tanto, em baias individuais. Os pesos dos animais, em 5 602 609
gramas, antes e ao término da semana, são 6 735 730
apresentados na tabela a seguir: 7 678 687
8 565 575
9 623 625
Ao nível de 5% de significância podemos afirmar ao o uso 10 629 642
da ração contribuiu para o aumento do peso médio dos 11 620 618
animais? 12 725 735

147 148

EXERCÍCIO 06 (apostila): EXERCÍCIO 01 (apostila):

Em um estudo para comparar os efeitos de O cálcio apresenta-se normalmente no sangue de mamíferos em


duas dietas, A e B, sobre o crescimento, 6 concentrações ao redor de 6 mg por 100 ml do total de sangue. O
ratos foram submetido à dieta A, e 9 ratos à
desvio padrão normal dessa variável é 1 mg de cálcio por 100 ml
dieta B. Após 5 semanas, os ganhos em peso
do volume total de sangue. Uma variabilidade maior que essa
foram:
pode ocasionar graves transtornos na coagulação do sangue.
A 15 18 12 11 14 15 Uma série de nove provas sobre o paciente revelou uma média

B 11 11 12 16 12 13 8 10 13 amostral de 2 mg por 100 ml do volume total de sangue. Existe


alguma evidência, para um nível α = 5%, de que o nível médio de
Ao nível de 5% de significância teste a hipótese de que
não há diferença entre as duas dietas, contra a alternativa cálcio para esse paciente seja diferente do normal?
de que a dieta A é mais eficaz.

149 150

EXERCÍCIO: EXERCÍCIO:

Em tomate, o alelo dominante do gene C é responsável


pelo fenótipo folha normal e o alelo c pela folha batata. Já A distribuição do grupo sanguíneo na Andaluzia é de
o alelo dominante do gene A confere a cor roxa, e o a, a 35%, 10%, 6% e 49% para os grupos A, B, AB e O
cor verde das plantas. Analise o resultado abaixo do respectivamente. Em Málaga, realizou-se o estudo em
cruzamento AaCc x AaCc e proceda o teste χ2 de uma amostra de 200 indivíduos, obtendo-se uma
aderência para a proporção fenotípica 9:3:3:1. distribuição de 50%, 30%, 10% e 10% para os grupos A,
B, AB e O respectivamente. Deseja-se saber a
Fenótipo
distribuição do grupo sanguíneo em tal província é igual à
Número de Roxo Roxo Verde Verde
descendentes recortado batata recortado Batata de Andaluzia.
41 15 8 2

25
151 152

EXERCÍCIO:

Deseja-se saber se as distribuições, quanto ao grupo


FIM
Literatura recomendada:
sanguíneo em três amostras referidas e quanto ao tipo de CALLEGARI-JACQUES, S. M.; CALLEGARI-JACQUES, Sidia
pressão arterial, se distribuem de maneira igual. Para M. Bioestatística: princípios e aplicações. Porto Alegre:
Artes Médicas, 2003. 255 p. (Biblioteca Artmed. Ciências
tanto, reuniu-se uma amostra de 1500 indivíduos dos básicas)
quais se determinou seu grupo sanguíneo e se mediu a
DEVORE, J. L. Probabilidade e estatísitica para engenharia e
pressão arterial, classificando-se esta em baixa, normal e ciências. 6.ed. São Paulo: Cengage Learning, 2011. 692p.
alta. Foram obtidos os seguintes resultados:
MONTGOMERY, Douglas C.; RUNGER, George C. Estatística
Pressão Grupo sanguíneo aplicada e probabilidade para engenheiros. 2. ed. Rio de
TOTAL Janeiro: LTC, 2003. xii, 463 p.
arterial A B AB O
Baixa 28 9 7 31 75
TRIOLA, Mario F. Introdução à estatística. 10. ed. Rio de
Normal 543 211 90 476 1320
Janeiro: LTC, 2008. xxvi, 696 p.
Alta 44 22 8 31 105
TOTAL 615 242 105 538 1500 VIEIRA. S. Introdução à bioestatística. 4. ed. Rio de Janeiro:
Elsevier, 2008. 345p.

26

Das könnte Ihnen auch gefallen