You are on page 1of 10

ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3

1. HIPÓTESE ESTATÍSTICA

Na prática, o maior problema enfrentado por engenheiros e cientistas não é estimar os parâmetros populacionais
como a média e o desvio padrão, por exemplo, mas descrever um método que gere conclusões confiáveis a partir de
um conjunto de dados. Veja os exemplos as seguir:

 Um engenheiro pode ter que conferir se há diferença de massa entre dois lotes de cimento da mesma marca,
baseado em dados amostrais.
 Um cientista pode ter que investigar se a ingestão de refrigerante aumenta o risco de infarto, com base em
evidências experimentais.
 Um estudante de ciências sociais, ao avaliar os resultados do censo, pode desejar saber se há alguma relação
entre o poder aquisitivo e a estatura de uma comunidade.

Cada um desses casos envolve uma conjectura a respeito daquilo que se deseja saber, ou seja, uma hipótese.
A inferência estatística engloba os procedimentos de tomada de decisão, com base em dados experimentais,
sobre a aceitação ou a rejeição da hipótese postulada. A hipótese estatística é uma afirmação ou conjectura sobre
uma ou mais populações (Walpole et al., 2009).
É impossível afirmar, com 100% de certeza que uma determinada hipótese estatística é verdadeira ou falsa, a
menos que se faça uma investigação em toda população. Todavia, trabalhar com todos os dados de uma
população é muito oneroso e exaustivo, por isso é comum retirar uma amostra aleatória e a partir dela fazer
análises que forneçam evidências amostrais suficientes para aceitar ou refutar a hipótese sobre a população
como um todo.

2. HIPÓTESES

 Hipótese Nula (H0): hipótese existente ou a ser testada.


 Hipótese Alternativa (H1): hipótese que contraria a hipótese nula, complementar de H0.
 H0: o réu é inocente
 H1: o réu é culpado

3. TIPOS DE ERROS

Pelo fato de se trabalhar com resultados amostrais para se fazer inferência sobre uma população, o processo está
sujeito a erros, ou seja, pode-se tomar decisões corretas ou erradas, por exemplo:

 Pode-se rejeitar a hipótese nula (H0) mesmo sendo verdadeira.


 Pode-se aceitar a hipótese nula (H0) mesmo sendo falsa.

O quadro abaixo resume bem as possibilidades de erros e acertos, para tanto considere que:

 a = P(erro do tipo I) = P(rejeitar H0 / H0 é verdadeira)


 b = P(erro do tipo II) = P(aceitar H0 / H0 é falsa)

Realidade
H0 verdadeira H0 falsa
Decisão correta Erro do tipo II
Aceitar H0
(1-a) (b )
Decisão
Erro do tipo I Decisão correta
Rejeitar H0
(a ) (1-b)

A partir do quadro acima pode-se inferir que:

 Se na realidade H0 é verdadeira e a decisão é aceitar H0, a decisão é correta.


 Se na realidade H0 é falsa e a decisão é rejeitar H0, a decisão é correta.
 Se na realidade H0 é verdadeira e a decisão é rejeitar H0, a decisão é um erro denominado erro do tipo I.
 Se na realidade H0 é falsa e a decisão é aceitar H0, a decisão é um erro chamado de erro do tipo II.

1 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3
Na prática, estes conceitos podem ser extrapolados de tal forma que os erros do tipo I e II podem ser aplicados
da seguinte maneira:

 Risco do produtor: risco associado à possibilidade de erro do tipo I, ou seja, quando um lote bom é rejeitado.
 Risco do consumidor: risco associado à possibilidade de erro do tipo II, ou seja, quando um lote ruim é
aceito.

4. NÍVEL DE SIGNIFICÂNCIA

O nível de significância indica qual a probabilidade de erro se está disposto a aceitar, por exemplo, a = 1%,
significa que a probabilidade de aceitar o erro do tipo I é de 1%. Pela distribuição normal, uma área de 0,01 abaixo
da curva normal corresponde ao escore padrão de 2,58. Na prática, os valores mais adotados são:

a = 1% z = 2,58
a = 5% z = 1,64

5. ESTATÍSTICA DE TESTE

A estatística de teste é o cálculo do escore padrão que será usado para comparar com o nível de significância
determinado no problema. No entanto, há dois casos distintos para o cálculo da estatística de teste. Quando o
desvio padrão da população for conhecido usa-se a distribuição normal; quando o desvio padrão populacional for
desconhecido recomenda-se usar a distribuição t-Student, indicada para amostras menores ou iguais a 30.

Desvio padrão populacional conhecido Desvio padrão populacional desconhecido


x − µ0 x − µ0
zteste = tteste =
σ s
n n

onde: onde:

z: estatística de teste t: estatística de teste


x: média x: média
m0:média da população m0:média da população
s: desvio padrão da população s: desvio padrão da amostra
n: número de elementos na amostra n: número de elementos na amostra

6. REGIÃO CRÍTICA

A região crítica é aquela onde os valores da estatística dos testes conduzem à rejeição da hipótese nula (H0). A
área delimitada por essa região é definida como o nível de significância e sua direção é a mesma da hipótese
alternativa (H1).

Unilateral à esquerda Unilateral à direita Bilateral

H 0 : µ = µ0 H 0 : µ = µ0 H 0 : µ = µ0
H1 : µ < µ 0 H1 : µ > µ 0 H1 : µ ≠ µ 0

2 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3
7. REGRA DE DECISÃO

 Se o valor da estatística do teste cair dentro da região crítica deve-se rejeitar H0.
 Ao rejeitar a hipótese nula (H0) existe uma forte evidência nos dados de sua falsidade.
 Ao aceitar a hipótese nula (H0) não existe uma forte evidência amostral significativa para rejeitar H0.

8. TESTE DE HIPÓTESES OU TESTE DE SIGNIFICÂNCIA

1. Formulação de H0 e H1.
H 0 : µ = µ0
 µ < µ0

H1 :  µ > µ 0
µ ≠ µ
 0

2. Escolha de um nível de significância (a) e definição da região crítica.


 Se o desvio padrão populacional for conhecido, a variável teste será Normal (z) para n > 30 .
 Se o desvio padrão populacional for desconhecido, a variável teste será t de Student com ϕ = n − 1 para
n ≤ 30 .

3. Cálculo de uma estatística de teste.


x − µ0 x − µ0
zcal = ou tcal =
σ s
n n

4. Comparação do valor teste, zcal ou tcal , com o valor tabelado, ztab ou ttab .

5. Rejeitar H0 se o valor teste excede a região crítica ou aceitar em caso contrário.


 Se a variável de teste (calculada) cair dentro da região de aceitação não se pode rejeitar H0.
 Se a variável de teste (calculada) cair fora da região de aceitação, rejeita-se H0.

Exemplo 01 (Teste de significância para a média). Uma amostra aleatória de 100 registros de mortes em
Cabrobó da Serra durante o ano passado revelou uma expectativa de vida de 72 anos. Assumindo um desvio padrão
de 9 anos, isso parece indicar que a média da expectativa de vida hoje é maior do que 70 anos? Adote um nível de
significância de 0,05.

a) Defina as hipóteses:

b) Calcule a estatística de teste:

c) Identifique a estatística tabelada:

3 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3
d) Comparar o zcal com o ztab :

e) Através da tabela de distribuição de probabilidades determine P = P ( z > zcal ) .

f) Conclusão

Exemplo 02 (Teste de significância para a média). Um novo fabricante de Cabrobrolândia desenvolveu um novo
traço de concreto com carga de ruptura de 8 MPa com desvio padrão de 0,5 MPa. Teste a hipótese de que m = 8
MPa contra a alternativa de que m ≠ 8 MPa, se uma amostra aleatória de 50 vigas de concreto foi testada e
descobriu-se uma carga de ruptura de 7,8 MPa. Adote um nível de significância de 0,01.

a) Defina as hipóteses:

b) Calcule a estatística de teste:

c) Identifique a estatística tabelada:

d) Comparar o zcal com o ztab :

d) Através da tabela de distribuição de probabilidades determine P = P ( z < zcal ) .

e) Conclusão

4 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3
Exemplo 03 (Teste de significância para a média). A Thomas Franscisvaldo Edson Lumino Eletric divulgou
recentemente um relatório com o consumo semanal de energia elétrica de alguns eletrodomésticos. Verificou-se
que um “chapinha” gasta em média 46 kW/h. Se uma amostra aleatória de 12 quartos femininos indica que uma
“chapinha” consome 42 kW/h semanalmente, para um nível de significância de 5%, as “chapinhas” gastam, em
média, 46 kW/h por semana? Assuma que a distribuição de quilowatts-hora é normal.

a) Defina as hipóteses:

b) Calcule a estatística de teste:

c) Identifique a estatística tabelada:

d) Comparar o tcal com o ttab :

d) Através da tabela de distribuição de probabilidades determine P = P (t < tcal ) .

e) Conclusão

9. TESTE DO QUI-QUADRADO

Até aqui temos estudado testes paramétricos, testes de hipóteses com relação a um parâmetro populacional ou a
comparação entre dois parâmetros. Todavia, há casos em que os testes não dependem de um parâmetro
populacional nem de suas estimativas. É nesse cenário que surge o teste do Qui-quadrado. Esse teste é usado
quando o objetivo é comparar freqüências observadas com freqüências esperadas e podem ser divididos em três
grupos:

 Teste de adequação do ajustamento: indicado para verificar se as freqüências observadas concordam ou não
com as freqüências teóricas esperadas.
 Teste de aderência: indicado quando se deseja testar a natureza da distribuição amostral, ou seja, verificar se
determinado conjunto de dados tem uma boa ou má aderência a um determinado modelo de distribuição de
probabilidade (normal, binomial, Poisson etc)
 Teste de independência (tabela de contingência): indicado quando se deseja verificar a relação entre duas
ou mais variáveis de forma que as frequências observadas podem ser observadas através de uma tabela de
contingência.

5 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3
10. PROCEDIMENTO BÁSICO PARA O TESTE DO QUI-QUADRADO

1. Determina as hipóteses:
H 0 : F0 = Fe
H1 : F0 ≠ Fe

2. Escolha o nível de significância (a)

3. Calcule a estatística:
2

χ cal = ∑
2
k
( Fo − Fe )
i =1 Fe

4. Identificar a estatística tabelada:


χ tab 2 = χϕ ,α 2

5. Comparar o χ cal 2 com o χ tab 2

6. Conclusão:
Se χ cal 2 ≤ χ tab 2 , aceita-se H 0 .
Se χ cal 2 > χ tab 2 , rejeita-se H 0 .

Exemplo 01 (Teste de adequação do ajustamento). Francisvaldo, funcionário do Departamento Nacional de


Trânsito, recebe a missão de verificar se os acidentes em uma das rodovias de Cabrobó da Serra se distribuem
igualmente de segunda a sexta-feira. Para tanto, ele fez uma pesquisa e levantou os dados dispostos na tabela
abaixo. Admita nível de significância de 5%.

Dia da semana Segunda Terça Quarta Quinta Sexta


Número de acidentes 12 09 11 15 18

a) Defina as hipóteses:

b) Calcule a estatística:
2
k
χ cal 2 = ∑
( Fo − Fe )
i =1 Fe

Dia da semana Segunda Terça Quarta Quinta Sexta k = 5


Número de acidentes 8 12 23 27 30
Pi
Fe = n.pi

6 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3

c) Identifique a estatística tabelada:

 χ tab 2 = χα ,ϕ 2
 ϕ = k − 1 : quando as frequências esperadas podem ser calculadas sem as estimativas dos parâmetros
populacionais a partir das distribuições amostrais.
 ϕ = k − 1 − m : quando para a determinação das frequências esperadas, m parâmetros tiverem suas
estimativas determinadas a partir das distribuições amostrais.

d) Comparar o χ cal 2 com o χ tab 2

e) Conclusão

Exemplo 02 (Teste de independência – tabela de contingência). Cabrobó da Serra é uma cidade que tem
crescido bastante. No intuito de investigar se há relação entre o nível de renda e a escolaridade dos Cabroboenses,
Francisvaldo fez um censo a partir de uma amostra de 200 moradores, como mostra a tabela abaixo. Verifique se há
independência entre a renda e a escolaridade para um nível de significância de 1%.

Nível de escolaridade
Nível de renda
Fundamental Médio
Pobre 56 42
Rico 38 44

a) Defina as hipóteses:

b) Calcule a estatística:

2
k
( Fo − Fe )
 χ cal 2 = ∑
i =1 Fe
( soma.da.linha.i )( soma.da.coluna. j )
 Feij =
total.de.observações
 ϕ = (l − 1)(c − 1) , onde l (linha) e c (coluna)

7 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3
Nível de escolaridade
Nível de renda Total
Fundamental Médio
Pobre 90 30 120
Rico 20 60 80
Total 110 90 200

c) Identifique a estatística tabelada:

d) Comparar o χ cal 2 com o χ tab 2

e) Coeficiente de contingência (grau de relacionamento):

χ cal 2
C=
χ cal 2 + n

f) Conclusão

H0 Valor da estatística de teste H1 Região crítica


x − µ0 µ < µ0 z < − zα
z= ;
µ = µ0 σ n µ > µ0 z > zα
σ conhecido µ ≠ µ0 z < − zα 2 ou z > zα 2
x − µ0 µ < µ0 t < −tα
t= ; v = n −1
µ = µ0 s n µ > µ0 t > tα
σ desconhecido µ ≠ µ0 t < −tα 2 ou t > tα 2

8 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3
EXERCÍCIOS PROPOSTOS

Questão 01 (Walpode, 2009). Uma indústria elétrica fabrica lâmpadas cuja vida útil tem distribuição
aproximadamente normal com média de 800 horas e desvio padrão de 40 horas. Teste a hipótese de que m = 800
horas contra a alternativa m ≠ 800 horas, se uma amostra aleatória de 30 lâmpadas tem média de vida de 768 horas
e determine o valor de a abaixo do qual a média não é significante.

Questão 02 (Walpode, 2009). Afirma-se que um automóvel é dirigido, em média, mais de 20.000 quilômetros por
ano. Para testar essa afirmação, uma amostra aleatória de 100 proprietários de automóveis registra os quilômetros
viajados. Você concordaria com essa afirmação, se esta amostra mostrasse uma média de 23.500 quilômetros e
desvio padrão de 3.900 quilômetros? Use um valor P em sua conclusão?

Questão 03 (Walpode, 2009). Em uma pesquisa feita na Escola de Medicina da Universidade da Califórnia,
afirmou-se que os ratos com média de vida de 32 meses viveriam por mais ou menos 40 meses se 40% das calorias
de suas refeições fossem substituídas por vitaminas e proteínas. Há alguma razão para acreditarmos que m< 40 se
64 ratos colocados sob essa dieta têm uma média de vida de 38 meses com desvio padrão de 5,8 meses? Use um
valor P em sua conclusão.

Questão 04 (Walpode, 2009). Teste a hipótese de que o conteúdo médio de recipientes de certo lubrificante é dez
litros, se os conteúdos de uma amostra aleatória de dez recipientes são 10,2; 10,1; 10,3; 10,1; 9,8; 9,9; 10,4; 10.3 e
9.8 litros. Use o nível de significância 0,01 e assuma que a distribuição dos conteúdos dos recipientes é normal.

Questão 05 (Walpode, 2009). A altura média de estudantes calouras do sexo feminino de certa universidade é
162,5 cm, com desvio padrão de 6,9 cm. Há alguma razão para acreditar que houve uma mudança na média das
alturas se uma amostra de 50 mulheres na atual classe de calouros tem altura média de 165,2 cm? Use um valor P
em sua conclusão. Assuma que o desvio padrão continua o mesmo.

Questão 06 (Lopes, 2003). Teste para α = 5% se há alguma relação entre as notas escolares e o salário.

Notas Escolares
Salário
Alta Baixa Média
Alto 18 5 17
Médio 26 16 38
Baixo 6 9 15

Questão 07 (Lopes, 2003). Com o objetivo de investigar a relação entre a situação do emprego no momento em
que se aprovou um empréstimo e se saber se o empréstimo está, agora, pago ou não, o gerente de uma financeira
selecionou ao acaso 100 clientes obtendo os resultados da tabela abaixo. Teste a hipótese nula de que a situação de
emprego e a de empréstimo são variáveis independentes, com α = 5% .

Situação de empregado
Estado atual do empréstimo
Empregado Desempregado
Em mora 10 8
Em dia 60 22

Questão 08 (Walpole, 2009). Em um experimento para estudar a relação entre hipertensão e o hábito de fumar, os
seguintes dados forma obtidos de 180 indivíduos. Teste a hipótese de que a presença ou ausência da hipertensão
depende dos hábitos relacionados ao fumo. Use um nível de significância de 0,05.

9 Prof. M.Sc. Eng. Braitner Lobato 02/2010


ESTATÍSTICA INDUTIVA Teste de Hipóteses MÓDULO 3
Não Fumante Fumante
Fumante Moderado Inveterado
Empregado Desempregado Desempregado
Hipertenso 21 36 30
Não hipertenso 48 26 19

Questão 09 (Walpole, 2009). Uma amostra aleatória de 90 adultos é classificada de acordo com o gênero e o
número de horas que eles assistem à televisão durante a semana. Use o nível de significância de 0,01 e teste a
hipótese de que o tempo gasto com televisão é independente do gênero do telespectador.

Gênero
Masculino Feminino
Mais de 25 horas 15 29
Menos de 25 horas 27 19

Questão 10 (Walpole, 2009- adaptada). Um perito criminal conduziu uma investigação para determinar se a
incidência de certos tipos de crime varia de acordo com a região de uma cidade grande. Os tipos de crime de
interesse são: agressão, arrombamento, roubo e homicídio. A tabela a seguir mostra o número de crimes cometidos
em quatro áreas da cidade no ano passado. Pode-se concluir, com base nesses dados, num nível de significância de
0,01, que a ocorrência desses tipos de crime depende da área da cidade?

REFERÊNCIA BIBLIOGRÁFICA

 Aula 11, Estatística-UVB, Faculdade On-line UVB.


 Kato, Sérgio, Teste de hipótese, Departamento de estatística, FAMAT, PUCRS.
 Lopes, Luis Felipe Dias, (2003), Apostila de Estatística, DE-UFSM.
 Neto, Pedro Luiz de Oliveira Costa (2002); Estatística; Edgard Blücher; 2ª ed.; São Paulo.
 Walpole, Ronald E., Myers, Raymond H., Myers, Sharon L., Ye, Keying (2009); Probabilidade e Estatística para
Engenharia e Ciências; Ed. Pearson, Ed. 8ª; São Paulo.

GABARITO

Questão 01
z = -1,64 Questão 06
P = 0,10 Resposta: aceitar Ho

Questão 02 Questão 07
z = 8,97; sim, m >20.000 km; P = 0,001 Resposta: aceitar Ho

Questão 03 Questão 08
z = -2,76; sim, m <40 meses; P = 0,0029 Resposta: rejeitar Ho

Questão 04 Questão 09
t = 0,77; não rejeitar H0 Resposta: rejeitar Ho

Questão 05 Questão 10
Resposta: rejeitar Ho
z = 2,77; rejeitar H0 e concluir que m≠162,5.

“Porque Deus amou o tanto o mundo, que deu o seu único Filho, para que todo aquele que nele crer não morra,
mas tenha a vida eterna” João 3.16

10 Prof. M.Sc. Eng. Braitner Lobato 02/2010