Beruflich Dokumente
Kultur Dokumente
INFERÊNCIA Inferência
Fazer inferência (ou inferir) = tirar conclusões
A cada resultado observado, relativo à VA (variável aleatória) de interesse A média é representada pela variável µ
(i.e., uma característica crucial para o conhecimento do fenômeno aleatório
em estudo) dá-se o nome de dado estatístico. O desvio padrão é representado pela varável σ
A variância é representada pela varável σ²
POPULAÇÃO: todos os indivíduos, itens ou objetos de um grupo
considerado, ou todos os dados estatísticos de uma variável aleatória. A proporção representada pela variável π
AMOSTRA: subconjunto de uma população, selecionado para análise e Tais medidas que descrevem populações também são conhecidas como
que deverá representar o todo. parâmetros. os parâmetros são características de cada população.
Apesar de não serem os valores mais corretos, eles possuem a vantagem de População Amostra
poderem ser calculados facilmente.
µ Média x̅
Existem dois tipos de estimativas: as pontuais e as intervalares. Desvio Padrão
σ S
σ² Variância S²
π Proporção p
1
16/11/2015
2
16/11/2015
(1-α) /2 (1-α) /2
1–α
α /2 α /2
x
Importante: aqui devemos realizar uma busca inversa!!
Exemplo
EXERCÍCIO Foi realizada uma média entre 200 amostras, obtendo o valor de 15. Sabe-se
que o desvio padrão populacional é 0,5. Calcule o intervalo de confiança
Encontrar Z para com 10% de significância.
os seguintes
níveis de a) Nível de Confiança 90% ou 0,9
confiança (1-α): b) Valor de Z Procurar 0,45 na Tabela Z = 1,645
c) Valor do Erro 0,05816 Usar 0,06
a) 90% d) Intervalo de Confiança Resposta: 14,94 ≤ µ ≤ 15,06
b) 95%
c) 98%
d) 99%
Conclusão: Pode-se afirmar, com 90% de confiança, que
a média µ dessa população está entre 14,94 e 15,06.
3
16/11/2015
EXERCÍCIO
Encontrar t para
os seguintes
níveis de
confiança (1-α):
Como consequência, aqui consultamos a tabela usando α/2, ou seja, a
metade do nível de significância! Ou seja: a) 90%, 8 gdl
b) 95%, 13 gdl
Tabela z: consultar tabela para (1 – α)/2 Metade do nível de confiança c) 98%, 17 gdl
Tabela t: consultar tabela para α/2 Metade do nível de significância d) 99%, 28 gdl
4
16/11/2015
Distribuição t de σ S
student com n = 3 e = z. e = z.
n n
Substitui o desvio padrão da
A partir de aproximadamente 30 graus de liberdade, a curva t pode ser população σ pelo desvio
considerada como sendo a curva normal. padrão da amostra s
5
16/11/2015
Precisamos estimar
Intervalo de confiança
6
16/11/2015
Exercícios Exercícios
A Polícia Rodoviária faz mensalmente uma pesquisa para avaliar a velocidade Uma amostra aleatória de 40 contas não-comerciais na filial de um banco
desenvolvida nas rodovias durante o período de 2 às 4 horas da madrugada. Num acusou saldo médio de R$140,00 com desvio-padrão de R$30,00.
período de observação e em um trecho específico, 100 carros passaram por um a) Construa um intervalo de 95% confiança para a verdadeira média.
aparelho de radar a uma velocidade média de 115 km/h, com desvio padrão de b) Construa um intervalo de 99% confiança para a verdadeira média.
10 km/h. c) A que conclusão podemos chegar com os resultados das letras anteriores?
a) Qual a estimativa pontual da verdadeira média da população? 115 km/h Z 1−α = Z 0, 475 ≈ 1,96 Z 1−α = Z 0 , 495 ≈ 2,58
b) Construa um intervalo de 98% de confiança para a média da população. 2 2
Grau de confiança de 98% implica em: Intervalo de confiança Margem de erro: Margem de erro:
1 - α = 98% s 30 s 30
Z 1−α = Z 0, 49 ≈ 2,33 x−E ≤ µ ≤ x+E e = Z 1−α . = 1,96. = 9,30 e = Z 1−α . = 2,58 . = 12,24
α = 2% = 0,02 n 40 n 40
2 2 2
115 − 2,3 ≤ µ ≤ 115 + 2,3
Margem de erro: Intervalo de confiança Intervalo de confiança
s 10
e = Z 1−α . = 2,33. = 2,33 [112,7 ; 117,3] km/h
2 n 100 140 − 9,30 ≤ µ ≤ 140 + 9,30 140 − 12, 24 ≤ µ ≤ 140 + 12, 24
Usar e = 2,3 km/h [127,76 ; 152,24] R$
[130,70 ; 149,30] R$
7
16/11/2015
8
16/11/2015
9
16/11/2015
Exemplo Exemplo
O departamento de agricultura dos Estados Unidos reporta que o custo
Em Ilinois, uma amostra aleatória de 85 alunos da oitava série tem nota
médio para se criar um filho até a idade de 2 anos na zona rural é de
média de 282 com desvio padrão de 35 em um teste nacional de matemática.
$10.460. Você acredita que esse valor está incorreto, então você seleciona
O resultado do teste informa ao administrador de uma escola estadual que a
uma amostra aleatória de 900 crianças (com idade até 2 anos) e descobre
nota média no teste para os alunos da oitava série do estado é mais do que
que a média dos custos é $ 10.345 com desvio padrão de $1.540. Com α = 0,
275. Com α = 0,04, há evidência suficiente para apoiar a afirmação do
05, há evidências suficiente para concluir que a média do custo é diferente
administrador?
de $10.460?
Alegação do administrador: µ > 275
Alegação do pesquisador: µ ≠ 10.460
H0: µ = 275
H0: µ = 10.460
H1: µ > 275 Teste unicaudal superior
H1: µ ≠ 10.460 Teste bicaudal
xb = 282
xb = 10.345
S = 35
S = 1.540
n = 85 σ desconhecido e n > 30: distribuição normal
n = 900 σ desconhecido e n > 30: distribuição normal
Estatística Padronizada do Teste: z = 1,84
Estatística Padronizada do Teste: z = -2,24
Valor Crítico: zc = z0,5- α = z0,46 = 1,75
Valor Crítico: zc = z0,5- α/2 = z0,475 = 1,96
RR: |z| > zc |z| > 1,75 |z| = 1,84 > 1,75 está na Região de Rejeição de H0
RR: |z| > zc |z| > 1,96 |z| = 2,24 > 1,96 está na Região de Rejeição de H0
Conclusão: Tem-se evidência suficiente para apoiar a afirmação do administrador, ou seja,
Conclusão: Tem-se evidência suficiente para concluir que a média do custo de se criar um
há evidência de que a nota média no teste para os alunos da oitava série do estado de
criança desde o nascimento até os 2 anos em uma área rural dos Estados Unidos é
Ilinois é significativamente maior que 275 com α = 0, 04
significativamente diferente de $ 10.460 a 5% de significância.
Exemplo Exemplo
Os cinco funcionários a seguir realizaram um teste para saber qual o peso
De uma população de alunos foi extraída uma amostra de 6 indivíduos com máximo que conseguiam levantar: 25,8 36,6 26,3 21,8 27,2. Tais dados
as seguintes alturas: 150, 152, 153, 160, 161, 163. Teste a afirmativa de que a sugerem que o valor médio da população de funcionários desta empresa
média de altura desta população é 160 a 5% de significância. excede 25 kg com significância de 5%?
Alegação: µ = 160 Alegação: µ > 25
H0: µ = 160 H0: µ = 25
H1: µ ≠ 160 Teste bicaudal H1: µ > 25 Teste unicaudal superior
xb = 156,5 xb = 27,54
S = 5,46 S = 5,47
n=6 σ desconhecido e n < 30: distribuição t-Student n=5 σ desconhecido e n < 30: distribuição t-Student
RR: |t| > tc |t| > 2,571 |t| = 1,57 < 2,57 está FORA da Região de Rejeição de H0 RR: |t| > tc |t| > 2,132 t = 1,04 < 2,13 está FORA da Região de Rejeição de H0
Conclusão: Não há evidências para afirmarmos que a média de altura da população de Conclusão: Não há evidências para afirmarmos que a média de peso que pode ser
alunos seja significativamente diferente de 160 a 5% de significância. levantado pelos funcionários desta empresa significativamente maior do que 25 kg a 5% de
significância.
10
16/11/2015
Exemplo Exemplo
A Zogby Internacional declara que 45% das pessoas nos Estados Unidos
Uma pesquisa conclui (afirma) que 90% dos médicos recomendam aspirina
são a favor de tornar a venda do cigarro ilegal dentro dos próximos 10 anos.
a pacientes que têm filhos. Teste a afirmação, ao nível de significância de
Você decide testar essa afirmação e entrevista uma amostra de 200 pessoas,
0,05, de que a percentagem é inferior a 90%, se numa amostra aleatória de
dentre as quais, 49% são a favor da lei. Com α = 0,05 há evidência o
100 médicos, 80% recomendam aspirina.
Alegação: π < 90%
bastante para apoiar a afirmação?
Alegação: π = 45%
H0: π = 90%
H0: π = 45%
H1: π < 90% Teste unicaudal inferior
H1: π ≠ 45% Teste bicaudal
p = 80%
p0 = 90% e q0 = 10% p = 49%
p0 = 45% e q0 = 55%
n = 100
n = 200
Estatística Padronizada do Teste: z = -3,33
Estatística Padronizada do Teste: z = 1,14
Valor Crítico: zc = z 0,5-α = z0,45 = 1,645
Valor Crítico: zc = z 0,5-α/2 = z0,475 = 1,96
RR: |z| > zc |z| > 1,645 |z| = 3,33 < 1,645 está na Região de Rejeição de H0
RR: |z| > zc |z| > 1,96 z = 1,14 < 1,96 está FORA da Região de Rejeição de H0
Conclusão: Há evidências para afirmarmos que a proporção de médicos que recomendam
Conclusão: No nível de significância de 5%, não há evidência o suficiente para rejeitar a
aspirina a pacientes que têm filhos é menor que 90% a 5% de significância. Isto é, a
afirmação de que 45% das pessoas nos Estados Unidos são a favor de tornar a venda de
afirmativa ou conclusão da referida pesquisa não é procedente.
cigarros ilegal dentro dos próximos 10 anos.
11
16/11/2015
Como se deseja medir o tamanho da diferença entre as médias H1: µ1 – µ2 < ∆0 Teste unicaudal inferior
populacionais (através de ∆0), a Hipótese nula será a afirmação de H1: µ1 – µ2 > ∆0 Teste unicaudal superior
que a diferença entre as médias da populações é a diferença
testada, ou seja,
H1: µ1 – µ2 ≠ ∆0 Teste bicaudal
H0: µ1 – µ2 = ∆0
12
16/11/2015
Δ0 = 1 − 2
σ conhecido (para qualquer n) Distribuição Normal
σ desconhecido (para qualquer n) Distribuição t-Student
Já o valor crítico do teste (zc) é consultado na tabela de distribuição
normal. A consulta na tabela dependerá se o teste é unicaudal ou se
Estatística padronizada quando Dist. Normal: z
é bicaudal. Vale lembrar que esta forma de calcular só é válida para
Estatística padronizada quando Dist. T-Student: t
a tabela de distribuição normal para valores entre 0 e Z.
Z0,5-α se unilateral
Z(1-α)/2 se bilateral Rejeitar H0 se |z| > zc
Não rejeitar H0 caso contrário
Δ0 = 1− 2 - .= 1+ 2−2 Δ0 = 1− 2 - .= 1 + 2 −2
Já o valor crítico do teste (tc) é consultado na tabela de distribuição Já o valor crítico do teste (tc) é consultado na tabela de distribuição
t-Student. A consulta na tabela dependerá se o teste é unicaudal ou t-Student. A consulta na tabela dependerá se o teste é unicaudal ou
se é bicaudal e do número de graus de liberdade. Vale lembrar que se é bicaudal e do número de graus de liberdade. Vale lembrar que
esta forma de calcular só é válida para a tabela de distribuição t- esta forma de calcular só é válida para a tabela de distribuição t-
Student para valores entre menos infinito e t. Student para valores entre menos infinito e t.
Rejeitar H0 se |t| > tc Rejeitar H0 se |t| > tc
tgdl; α se unilateral Não rejeitar H0 caso contrário tgdl; α se unilateral Não rejeitar H0 caso contrário
tgdl; α/2 se bilateral tgdl; α/2 se bilateral
Exemplo Exemplo
Uma marca de refrigerantes quer saber se existe diferença entre Uma pizzaria resolveu anunciar que entrega pizzas mais rápido que
expôr seus produtos no centro do corredor ou expô-los na ponta do seu concorrente, que fica do outro lado da rua. Para testar esta
corredor. Para tanto, ela fez duas amostragens, uma para cada tipo alegação, foram medidos 10 tempos de entrega de cada pizzaria. A
de exposição. Em uma amostragem composta por 10 dias, pizzaria do anúncio entregou pizzas com um tempo médio de 16,7
constatou-se que a exposição normal leva a uma venda média min com desvio padrão de 3,0955 min. Já sua concorrente entregou
diária de 50,3 garrafas, com desvio padrão de 18,7264. Em outra pizzas com 18,88 min com desvio de 2,8662 min. Existe evidência
amostragem também de 10 dias, constatou-se que a exposição na para suportar a alegação da pizzaria? (5% significância)
ponta do corredor leva a uma média de 72 garrafas por dia com
desvio padrão de 12,5433. Há evidência de que o tipo de exposição n1 = 10, xb1 = 16,70 e s1 = 3,0955
influencia nas vendas diárias? (5% significância) n2 = 10, xb2 = 18,88 e s2 = 2,8662 desconhecido, 1
2 = 2
2
∆0 = 0
n1 = 10, xb1 = 50,3 e s1 = 18,7264
H 0: µ 1 – µ 2 = 0
n2 = 10, xb2 = 72,0 e s2 = 12,5433 desconhecido, 1
2 = 2
2
H1: [ µ1 – µ2 < 0 ] OU [ µ1 < µ2 ] Teste Bicaudal
∆0 = 0 Conclusão: Há evidências
suficiente de que a forma de t = -1,6341 tc = 1,7341 Não rejeita H0
H 0: µ 1 – µ 2 = 0 exposição dos refrigerantes
H 1: µ 1 – µ 2 ≠ 0 Teste Bicaudal influencia significativamente nas Conclusão: Com 5% de significância, não há evidência de que a pizzaria
vendas, com 5% de significância.
que fez o anúncio entregue pizzas em um prazo significativamente menor
t = -3,0446 tc = 2,1009 Rejeita H0 do que seu concorrente.
13
16/11/2015
1
2
- .1 = 1 −1
0=
2
2 - .2 = 2 −1
n1 = 10, xb1 = 50,3 e s1 = 18,7264 S12 = 350,6778 Teste de Independência: Testar se duas variáveis são
n2 = 10, xb2 = 72,0 e s2 = 12,5433 S22 = 157,3333 independentes ou não.
Conclusão: Não há evidências
H 0: σ 1² = σ 2² suficiente de que a forma de
H 1: σ 1² ≠ σ 2² Teste Bicaudal exposição dos refrigerantes
influencia significativamente nas
variâncias das vendas, com 5%
F = 2,2289 Fc = 4,03 Não Rejeita H0 de significância.
14
16/11/2015
Este teste é baseado em tabelas de frequências simples. Entretanto, usando o modelo probabilístico e
Comparamos a frequência esperada com a frequência observada. o número de amostras n = 100, podemos
calcular a frequência esperada para cada
fe: frequência esperada (fei = n x pi) classe:
fo: frequência observada (obtida através da amostragem)
Hipótese Nula: fe1 = fo1; fe2 = fo2 .... fek = fok (k = nro de classes)
Consultar a área da cauda superior,
Hipótese Alternativa: Existe pelo menos uma diferença
já que esta é a região de rejeição:
Caso a Hipótese Nula seja rejeitada, os dados não aderem (ou não
Região de Rejeição: Q > Qc
se adequam) ao modelo proposto. Caso ela não seja rejeitada,
então há adequação.
15
16/11/2015
16
16/11/2015
k1 = 4
k2 = 3
Q = 27,41
Qc = χ²6; 0,05 = 12,592
Exemplo
k1 = 3 k2 = 4
17