Beruflich Dokumente
Kultur Dokumente
Meta
Apresentar os conceitos fundamentais de inferncia estatstica e suas aplicaes,
bem como os conceitos de distribuio amostral comparativamente com distribuio
populacional.
Objetivos
Esperamos que, aps o estudo do contedo desta aula, voc seja capaz de:
1. Reconhecer o que inferncia estatstica, suas principais caractersticas e
aplicao.
2. Diferenciar a estatstica inferencial da estatstica descritiva.
3. Reconhecer as caractersticas e aplicar o modelo de distribuio amostral.
Pr-Requisitos
Ter cursado estatstica I (estatstica descritiva)
Introduo
A inferncia estatstica um ramo da estatstica cujo objetivo fazer afirmaes
acerca de uma populao, a partir de dados obtidos de amostra(s) desta mesma
populao. Por exemplo, nas eleies para presidente, governador, prefeito e outros
cargos polticos freqentemente nos depararam com resultados de pesquisa de
intenes de votos, que so publicadas durante o perodo de campanha. Obviamente
no seria possvel entrevistar todos os eleitores em cada pesquisa (no h tempo e o
custo seria muito elevado). Assim, a pesquisa feita com base em amostras da
populao (eleitores) e, a partir dos dados obtidos nestas, usando a teoria da
inferncia estatstica, fazem-se afirmaes e tiram-se concluses acerca de
parmetros de uma populao. Por exemplo: a inteno de votos no candidato A :
252%.
A figura 1.1 ilustra a definio de Inferncia estatstica:
O mesmo pode-se fazer, por exemplo, para avaliar as caractersticas dos produtos
de uma empresa, sem a necessidade de analisar toda a populao (resultados do
processo).
Em estatstica I, voc teve a oportunidade de calcular parmetros estatsticos bem
como a probabilidade de se selecionar ao acaso um indivduo de uma populao e o
resultado fosse maior ou menor que certo valor. Para tal necessrio se utilizar um
modelo (normal, por exemplo) e de posse de parmetros populacionais como mdia e
desvio padro, calcula-se esta probabilidade.
Agora, considere este mesmo raciocnio dentro de uma empresa qualquer. Como
os processos esto sujeitos a variaes de todos os tipos e a qualquer instante,
precisa-se (o engenheiro, o gerente do processo) avaliar constantemente os
parmetros populacionais para determinar se o processo continua normal, se teve
alguma alterao, se o produto satisfaz plenamente uma dada especificao, etc.
conceitos importantes
Parmetro
Simbologia
X=
X 1 + X 2 + ... + X n 1
=
N
N
Mdia
Varincia
1
N
i =1
(X
)2
i =1
1 N
( X i )2
N i =1
Desvio-padro
Mdia
Simbologia
X 1 + X 2 + ... + X n 1 n
= Xi
n
n i =1
Varincia
1 n
( X i X )2
n 1 i =1
1 n
( X i X )2
n 1 i =1
S
Desvio-padro
Dp
Media
7,2
7,4
5,8
6,3
4,5
8,2
3,5
9,5
6,5
Mdia:
X=
Desvio Padro:
S_ =
x
1
(7,2 6,5)2 + (7,4 6,5)2 + ........ + (6,5 6,5)2 = 1,72
(9 1)
Assim, a mdia e o desvio padro da amostra so 6,5 e 1,72, sem quaisquer grau
de incerteza.
Por outro lado, se quisermos estimar (ou inferir) valores para mdia e desvio padro
da populao a partir de amostras (tamanho muito menor que o da populao)
podemos usar os resultados da amostra (mdia e desvio padro amostral) para
inferir/fazer uma afirmativa sobre a mdia ou desvio padro da populao. Neste caso
a certeza desta afirmao no seria mais 100%, como para amostra. Na inferncia,
teramos associado um erro relativo ao mtodo de clculo.
Podemos usar a inferncia da estatstica para estimar intervalos possveis de
resultados ou verificar afirmativas acerca de uma populao (hipteses), o que muito
til na engenharia.
EXEMPO DE HIPOTESE
A partir de daos amostrais, com confiana de 98%, podemos afirmar que a
proporo de peas defeituosas menor que 1%.
Tambm muitas vezes precisamos de informaes importantes sobre a populao,
como a mdia e desvio padro populacional. Mas, quando no se conhece estes
valores ou determin-los demandariam muito tempo, O que fazer?
Estes parmetros da populao podem ser determinados (estatstica descritiva) ou
inferidos (inferncia estatstica). claro que a determinao do parmetro seria
prefervel em relao a sua estimativa (inferncia). Mas, na maioria das vezes, esta
determinao muito demorada e onerosa. Alm disto, processos de engenharia so
processos dinmicos, o que demanda seu acompanhamento dirio e contnuo. Neste
aspecto a inferncia estatstica exerce um papel crucial, pois permite obter, com certa
confiabilidade, estimativas destes parmetros da populao com menor tempo e custo.
Atividade 1
Um engenheiro precisa verificar se a mdia e a variao de espessura de um dado
produto continua dentro dos padres normais do processo (por ex. 2,5 e 0,040). Para
tal, ele coletou amostras (cinco produtos) retiradas aleatoriamente da populao, e
desta amostra foram calculados a mdia e desvio padro amostrais (a seguir).
DP
mdia
0,039121
2,552
2,467
2,524
2,482
2,462
2,498
Atividade 2
Imagine que a tabela 1.1 represente a populao de espessuras de chapas
de ao produzidas por uma dada empresa. Imagine que so chapas no
estoque e escolha aleatoriamente cinco amostras (com 5 itens cada) e
calcule as mdias e o desvios padres para cada subgrupo. Para tal use a
tabela a seguir:
media
DP
2,579
2,490
2,469
2,519
2,498
2,450
2,550
2,590
2,502
2,543
2,493
2,468
2,367
2,503
2,538
2,485
2,491
2,459
2,491
2,605
2,488
2,508
2,588
2,522
2,479
2,552
2,503
2,561
2,536
2,487
2,514
2,429
2,538
2,472
2,462
2,545
2,561
2,530
2,415
2,419
2,482
2,480
2,488
2,531
2,535
2,469
2,491
2,481
2,530
2,501
2,415
2,502
2,578
2,438
2,568
2,473
2,536
2,469
2,491
2,426
2,538
2,471
2,539
2,524
2,415
2,587
2,540
2,516
2,503
2,483
2,511
2,532
2,508
2,550
2,497
2,544
2,525
2,502
2,499
2,552
2,467
2,524
2,482
2,519
2,505
2,516
2,462
2,564
2,507
2,507
2,472
2,528
2,490
2,539
2,462
2,509
2,494
2,511
2,539
2,521
2,572
2,519
2,479
2,534
2,453
2,477
2,520
2,476
2,410
2,445
2,487
2,471
2,474
2,457
2,524
2,506
2,562
2,530
2,529
2,441
2,614
2,534
2,532
2,521
2,518
2,455
2,475
2,457
2,486
2,513
2,588
2,433
2,567
2,461
2,457
2,528
2,484
2,488
2,533
2,555
2,434
2,516
2,462
2,495
2,536
2,533
2,487
2,585
2,439
2,471
2,453
2,537
2,484
2,464
2,464
2,568
2,522
2,508
2,559
2,452
2,494
2,435
2,463
2,474
2,463
2,537
2,519
2,420
2,503
2,413
2,476
2,512
2,566
2,408
2,397
2,483
2,482
2,436
2,482
2,531
2,462
2,534
2,487
2,453
2,510
2,472
2,538
2,466
2,510
2,478
2,517
2,473
2,548
2,541
2,502
2,567
2,537
2,522
2,400
2,495
2,456
2,449
2,497
2,510
2,546
2,492
2,454
2,562
2,459
2,518
2,521
2,454
2,455
2,493
2,417
2,497
2,560
2,524
2,488
2,413
2,531
2,482
2,490
2,506
2,513
2,473
2,591
2,456
2,534
2,497
2,396
2,415
2,557
2,491
2,524
2,479
2,506
2,468
2,467
2,453
2,453
2,581
2,513
2,537
2,429
2,536
2,471
2,447
2,504
2,528
2,441
2,547
2,440
2,506
2,524
2,490
2,444
2,563
2,484
2,512
2,514
2,527
2,464
2,545
2,509
2,446
2,443
2,532
2,530
2,503
2,535
2,431
2,534
2,460
2,518
2,492
2,510
2,518
2,461
2,473
2,490
2,442
2,455
2,529
2,458
2,475
2,500
2,508
2,524
2,508
2,484
2,522
2,482
2,477
2,517
2,483
2,521
2,498
2,533
2,542
2,446
2,536
2,537
2,555
2,454
2,502
2,516
2,513
2,528
2,563
2,505
2,424
2,441
2,494
2,490
2,536
2,532
2,427
Resposta Comentada
Voc poder confirmar que os resultados das mdias e desvios padres
amostrais, calculados de amostras retiradas aleatoriamente da mesma
Assim, a idia da estatstica inferencial usar esses dados (da amostra) e fazer
afirmaes (inferncia) acerca da populao.
EXEMPLO DE INFERNCIA:
A mdia da populao est entre 2,42 e 2,58 com 95% de confiana.
Classificao
destes dados
(distribuio de
freqncia)
Coleta de dados
Utilizao do
modelo para
fazer inferncia
estatstica
Determinao de
e
Validao do
modelo
2
_
1 x
f ( x) =
exp
2 2
2
Note que em um primeiro instante temos que ter um trabalho relativamente grande
para determinao dos parmetros de interesse (neste caso e ), mas aps esta
determinao, passamos a tirar nossas concluses a partir deste modelo.
Mas, por outro lado, podemos ter variaes no processo que implicariam em novas
exaustivas medidas, o que seria um grande problema. Assim, na prtica do dia a dia
trabalha-se com amostras em vez de indivduos, o que levaria a termos uma
distribuio amostral em vez da distribuio dos indivduos.
Imagine que, por questes quaisquer (por ex. alta velocidade de produo), no
seja possvel para uma empresa produtora de esferas de ao fazer medidas sobre
todos os indivduos da populao (com mdia e desvio padro histricos de 50 e 1,0
respectivamente). Neste caso, lanamos mo de tcnicas de amostragens e nossos
resultados passam a ser estatsticas da amostra (ex. X e S). Assim cada dado deixa
de ser uma medida simples (de um indivduo) e passa a ser um resultado de uma
estatstica calculada sob a amostra. Por exemplo:
Amostra
diam.
Xi =
x1
x2
x3
x4
x5
49,2
50,5
53,6
45,2
50,0
10
11
X =
__
f ( x) =
1
2 _x 2
2
_
x
exp
_
2 x
zx =
_
_
x
ou
_
x
zx =
_
12
__
Onde
so mdias das amostras obtidas da populao,
das mdias e o desvio padro da populao.
_
x
o desvio padro
zx
das mdias.
Vamos a um exemplo prtico:
__ =
x
0,35
= 0,1565
5
Tabela 1.2
__
x
x1
x2
x3
x4
x5
14,45
15,12
14,30
14,81
14,67
15,20
14,46
15,22
15,16
14,87
14,76
15,25
15,22
14,89
15,06
15,17
15,17
15,00
15,31
14,36
14,75
14,96
14,83
15,28
14,76
14,99
15,04
14,78
15,50
15,14
14,96
15,32
15,04
15,24
14,83
14,73
15,14
15,06
14,93
15,43
14,54
14,97
15,45
14,83
14,67
14,67
14,98
15,04
15,00
14,92
15,09
15,08
15,06
14,89
13
14,96
10
15,13
14,97
15,34
14,98
14,37
11
14,49
14,78
14,77
14,94
14,97
12
14,88
14,49
15,75
14,79
14,69
13
14,83
14,85
14,03
15,23
15,36
14
15,43
14,99
15,29
14,78
15,09
15
15,47
15,25
15,15
15,08
15,20
16
15,28
14,46
14,74
15,37
14,62
17
15,00
14,71
15,34
15,31
15,01
18
15,34
15,39
15,28
14,99
14,86
19
15,20
14,94
15,14
14,70
14,77
20
15,13
14,97
15,14
15,56
15,07
21
14,76
15,09
14,83
15,38
15,36
22
15,01
14,86
14,32
14,14
14,75
23
14,78
14,94
14,74
15,13
15,23
24
15,16
15,09
15,24
15,46
15,24
25
14,89
15,43
14,80
15,73
15,10
26
15,46
14,95
15,15
14,99
14,99
27
14,85
15,02
14,80
14,57
15,08
28
14,56
14,74
15,97
15,12
14,75
29
14,87
14,87
15,23
15,50
15,26
30
14,56
14,92
15,02
15,05
14,93
14,79
14,92
14,86
15,12
15,23
14,89
15,07
15,17
14,95
15,18
15,08
14,62
14,96
15,24
15,19
15,11
14,86
15,03
15,14
14,90
( xi X )2
S_ =
n 1
x
1/ 2
14
S_ =
x
1
(14,67 15,0)2 + (15,98 15,0)2 + ........ + (14,90 15,0)2
19
S _ = 0,1526
x
Note que
_.
x
Lembrando que
S_
_
x
15
16
14
12
10
8
6
4
2
0
14
14,5
15
15,5
16
14
14,5
15
15,5
16
a)
40
35
30
25
20
15
10
5
0
B)
Figura 1.5: Polgono de frequncia de uma distribuio amostral(a) e uma distribuio
populacional (b).
Agora podemos calcular a probabilidade de uma amostra obtida ao acaso ter mdia
inferior a 14g.
16
0,35
P(
x <14,7)=0,0274
Ou seja, a probabilidade da mdia de uma amostra (n=5) ser menor que 14,7 de
2,74%.
Vale ressaltar que do mesmo modo que podemos dizer a probabilidade de uma
mdia amostral retirada de uma populao estar dentro de uma faixa de valores,
podemos tambm inferir uma faixa de valores para mdia populacional a partir de
dados de uma amostra.
Concluso
A inferncia estatstica um ramo da estatstica cujo objetivo fazer afirmaes
acerca de uma populao, a partir de dados obtidos de amostra(s) desta mesma
populao.
O modelo mais utilizado em estatstica inferencial a distribuio amostral, em que:
_
zx =
_
_
x
ou
_
zx =
_
Atividade Final
Um engenheiro obteve os resultados de um processo (30 amostras de 5
indivduos) apresentados na tabela a seguir.
A partir destes dados:
a) Determine as mdias das 30 amostras.
b) Determine o histograma destas mdias e o histograma da populao
(dos 150 indivduos)
17
6,61
5,68
7,54
6,04
9,03
8,48
6,15
7,24
7,29
9,18
6,30
7,69
7,39
6,41
7,26
5,46
7,00
6,22
7,23
8,90
7,22
7,10
8,26
5,08
5,29
7,12
7,06
6,85
9,19
7,69
7,03
4,16
8,12
6,80
7,70
7,91
8,25
6,16
7,47
8,24
5,87
7,42
6,35
6,79
7,08
6,52
7,35
7,80
4,48
8,49
6,62
6,69
9,41
5,49
6,41
6,93
7,96
8,52
4,48
8,48
7,25
6,93
6,49
6,99
5,79
8,23
6,49
6,29
7,04
6,20
6,69
8,35
8,57
7,21
6,67
6,46
6,31
6,96
7,23
5,86
8,82
7,08
7,36
7,48
5,64
7,81
8,83
6,37
7,19
8,55
7,30
9,04
5,37
6,79
6,74
7,19
5,23
6,18
7,39
6,14
8,09
6,49
6,40
7,64
6,51
8,73
6,59
6,44
8,34
6,45
6,44
6,38
7,16
5,89
7,88
6,17
5,30
6,34
6,62
7,87
6,39
7,40
7,28
7,82
7,64
4,26
5,31
7,19
7,38
7,61
6,57
5,20
8,31
7,27
7,38
6,00
8,41
6,69
7,10
5,75
7,41
6,67
7,36
8,05
7,28
6,69
8,00
7,39
8,62
7,08
18