Beruflich Dokumente
Kultur Dokumente
Johann
1. A NATUREZA DA ESTATSTICA
1.1.
INTRODUO
IDADE MDIA: as informaes eram tabuladas com finalidades tributrias e blicas. Destacam-se os
rabes (ano 721), com a coleta numrica das cidades dominadas, cmputo de suas populaes,
fbricas e de cada espcie de produto, para controle das conquistas territoriais.
SEC. XVI: surgem as primeiras anlises sistemticas de fatos sociais, como batizados, casamentos,
funerais, originando as primeiras tbuas e tabelas e os nmeros relativos.
SEC. XVII: Na Inglaterra surge a primeira investigao sobre Estatstica Demogrfica, descobrindo-se
atravs de estudos analticos propores entre os nascimentos e os adultos. Na Frana, Pierre Fermat
descobre o clculo das probabilidades e Adolphe Quetelet no sculo seguinte, aplica-o no estudo
demogrfico e social.
SEC. XVIII: a estatstica com feio cientfica batizada por Godofredo Achenwall. A Alemanha comea
a empregar a estatstica como disciplina autnoma e descreve o Estado considerando seu territrio, seu
governo e suas finanas. As tabelas tornam-se mais completas, surgem as primeiras representaes
grficas e os clculos de probabilidades. A estatstica deixa de ser uma simples catologao (tabulao)
de dados numricos para se tornar " o estudo de como se chegar a concluso sobre o todo (populao),
partindo da observao de partes dessa populao (amostras)".
Atualmente, o pblico leigo (leitor de jornais e revistas) posiciona-se em dois extremos divergentes e
igualmente errneos quanto validade das concluses estatsticas: ou cr em sua infalibilidade ou
afirma que elas nada provam. Os que assim pensam ignoram os objetivos, o campo e o rigor do mtodo
estatstico; ignoram a Estatstica, quer terica quer prtica, ou a conhecem muito superficialmente.
Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e, com seus processos e
tcnicas, tm contribudo para a organizao dos negcios do mundo moderno.
1.2.
MTODO ESTATSTICO
Muitos dos conhecimentos que temos, foram obtidos por acaso e, outros por necessidades prticas,
sem aplicao de um mtodo. Sendo assim, a estatstica pode ser vista como uma Cincia ou um
Mtodo.
Ex: Quais as causas que definem o preo de uma mercadoria quando a sua oferta diminui?
Seria impossvel, no momento da pesquisa, manter constantes a uniformidade dos salrios, o
gosto dos consumidores, nvel geral de preos de outros produtos, etc.
Os mtodos experimental e estatstico, tanto podem ser empregados juntos, como separadamente no
estudo de fenmenos.
1.3.
A ESTATSTICA
Estatstica um mtodo de estudo representativo e analtico dos elementos dos fenmenos que se
apresenta, em grande nmero, para sua subseqente interpretao.
uma parte da matemtica aplicada que fornece mtodos para coleta, organizao, descrio,
anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.
A coleta, a organizao, a descrio dos dados, o clculo e a interpretao de coeficientes
estatsticos pertencem ESTATSTICA DESCRITIVA, enquanto a anlise e a interpretao dos dados,
associada a uma margem de incerteza, ficam a cargo da ESTATSTICA INDUTIVA ou INFERENCIAL,
tambm conhecida como a medida da incerteza ou mtodo que se fundamenta na teoria da probabilidade.
A ESTATSTICA DESCRITIVA tem por objetivo reduzir um universo de informaes, at o ponto em
que se possa interpret-las de forma mais clara. Trata-se, portanto, de um nmero resumo que possibilita
reduzir os dados a propores mais facilmente interpretveis. Entretanto, deve-se tomar cuidado pois
atravs deste procedimento, muita informao ir se perder, alm de ser provvel a obteno de resultados
distorcidos, a menos que eles sejam interpretados com muita precauo.
J a ESTATSTICA INFERENCIAL refere-se a um processo de generalizao a partir de resultados
particulares. Consiste em obter e generalizar concluses, ou seja, inferir propriedades para o todo com base
na parte, no particular.
1.4.
1 - DEFINIO DO PROBLEMA: Saber exatamente aquilo que se pretende pesquisar o mesmo que
definir corretamente o problema.
2 - PLANEJAMENTO: Como levantar informaes? Que dados devero ser obtidos? Qual levantamento a
ser utilizado? Censitrio? Por amostragem? E o cronograma de atividades? Os custos envolvidos ? etc.
3 - COLETA DE DADOS: Esta a fase operacional, onde com um objetivo determinado, registra-se de
forma sistemtica os dados.
Coleta Direta: quando obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para
saber a preferncia dos consumidores pela sua marca.
A coleta direta pode ser: contnua, quando os registros so feitos continuamente (registros de
nascimento, bitos, casamentos, etc.), peridica, feita em intervalos constantes de tempo
(recenseamento demogrfico, censo industrial) e ocasional, quando feita de tal modo que no se
considera o tempo, a continuidade e nem periodicidade mas sim, o estudo de um fenmeno
especfico (registro de casos de dengue).
Coleta Indireta: Quando inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de
outros fenmenos relacionados com o fenmeno estudado, ou seja feita por dedues, analogia,
indcios, avaliao (quando por estimativa se presume valores representativos de um fenmeno),
proporcionalizao (quando a partir dos dados de um fenmeno, chega-se a uma concluso completa
do resumo). Ex.: A pesquisa de mortalidade infantil feita atravs de dados colhidos por uma coleta
direta.
Dados primrios: quando so publicados pelo pesquisador ou organizao que os haja recolhido. Ex:
Tabelas do censo demogrfico do IBGE.
OBS: mais seguro trabalhar com fontes primrias. O uso da fonte secundria traz o grande risco de erros
de transcrio.
4 - APURAO DOS DADOS: Resumo dos dados atravs de sua contagem e agrupamento. a
condensao ou tabulao de dados segundo critrios de classificao.
5 - APRESENTAO DOS DADOS: H duas formas de apresentao, que no se excluem mutuamente.
A representao tabular, uma apresentao numrica dos dados em linhas e colunas distribudas de
modo ordenado, segundo regras prticas fixadas pelo Conselho Nacional de Estatstica. A representao
grfica dos dados constitui uma apresentao geomtrica, permitindo uma viso rpida e clara do
fenmeno.
6 - ANLISE E INTERPRETAO DOS DADOS: A ltima fase do trabalho estatstico a mais importante
e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes cuja finalidade principal
descrever o fenmeno (estatstica descritiva). Na estatstica indutiva a interpretao dos dados se
fundamenta na teoria da probabilidade.
FENMENO ESTATSTICO
qualquer evento que se pretenda analisar, cujo estudo seja passvel da aplicao do mtodo
estatstico.
2.2
DADO ESTATSTICO
um dado numrico que considerado a matria-prima sobre a qual iremos aplicar os mtodos
estatsticos.
2.4.
PARMETROS
2.5.
AMOSTRA
uma parcela representativa da populao que ser examinada com o propsito de tirarmos
concluses sobre esta populao.
2.6.
ESTIMATIVA
Para que possamos estimar a caracterstica existente em uma populao, devemos fazer uso de
uma amostra representativa da populao. Assim sendo, estimativa o nome dado ao valor aproximado do
parmetro que calculado com o uso de amostras.
2.7.
ATRIBUTO
2.8.
VARIVEL
, convencionalmente, o conjunto de resultados possveis de um fenmeno.
Varivel Qualitativa: Quando seus valores so expressos por atributos e se dividem em:
Varivel Nominal: so variveis que nomeiam. Para estas variveis, a ordem no importante.
Ex.: sexo, cor da pele, rea de estudo, desempenho, raa, nacionalidade, religio, etc. .
Varivel Ordinal: so variveis que possuem com caracterstica fundamental a ordem dos dados.
Ex.: Grau de escolaridade, listas classificatrias, campeonatos, etc..
Nominais
Ordinais
Variveis
Quantitativas
Discretas
Contnuas
3.1.
REPRESENTAO TABULAR
definido como um quadro, que resume um conjunto de dados dispostos segundo linhas e colunas
de maneira sistemtica. Existem algumas normas para a construo de tabelas, e estas tm por finalidade
preservar os resultados de forma a no direcionar leituras ou interpretaes errneas. Um dos rgos que
rege estas normas a fundao IBGE, que atravs da resoluo 886, definiu algumas caractersticas para
as casas ou clulas de uma tabela. Vejamos:
um trao horizontal ( - ) quando o valor zero, no s quanto natureza das coisas, como quanto ao
resultado do inqurito;
zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada;
corpo: conjunto de linhas e colunas que contm informaes sobre a varivel em estudo;
ttulo: localizado no topo da tabela, deve ser completa e responder as seguintes perguntas: O qu?
Quando? Onde?
Fonte, Notas e Chamadas: elementos complementares que devem ser colocados no rodap
(Fonte:IBGE);
ANOS
Coluna
Indicadora
1991
2535
1992
2666
Corpo
1993
2122
1994
3750
1995
2007
Total
13080
Rodap
Ttulo
Coluna Numrica
Casa ou Clula
Fonte: IBGE
3.1.1.
Sries Estatsticas
Uma srie estatstica define-se como toda e qualquer coleo de dados estatsticos, que depois de
coletados so colocados em srie e apresentados em quadros ou tabelas.
Para diferenciar uma srie estatstica de outra, h de se levar em conta trs caractersticas:
A poca (fator temporal ou cronolgico) a que se refere o fenmeno analisado;
O local (fato espacial ou geogrfico) onde o fenmeno acontece;
O fenmeno (espcie de fato ou fator especificativo) que descrito.
As sries estatsticas podem ser de quatro tipos conforme cada um destes fatores. Entretanto se
costuma dividi-las em trs grupos: as sries homgradas, as hetergradas e as conjugadas.
3.1.1.1.
Sries Homgradas
Temporal: tambm chamada de histrica, cronolgica, evolutiva, marcha, tem como carter varivel o
fator cronolgico (tempo). O local e a espcie (fenmeno) so fixos ao passo que a poca varivel.
VENDAS DA ABC VECULOS EM 1999
PERODO
UNIDADES VENDIDAS *
Janeiro
20
Fevereiro
10
TOTAL
30
Fonte: dados fictcios
Nota: * Em mil unidades
Geogrfica: conhecida tambm como territorial, espacial, de localizao, apresenta como carter
varivel somente o fator geogrfico (local). J a poca e o fenmeno neste caso so fixos.
VENDAS DA ABC VECULOS EM 1999
FILIAIS
UNIDADES VENDIDAS *
So Paulo
13
Rio de Janeiro
17
TOTAL
30
Fonte: dados fictcios
Nota: * Em mil unidades
Especfica: ou categrica, apresenta como carter varivel o fenmeno (fato ou espcie). Sendo assim,
prevalecem como elementos fixos a poca e o local.
VENDAS DA ABC VECULOS EM 1999
MARCA
UNIDADES VENDIDAS *
FIAT
18
GM
12
TOTAL
30
Fonte: dados fictcios
Nota: * Em mil unidades
3.1.1.2.
Sries Conjugadas
Sries Hetergradas
aquela na qual o fenmeno ou fato apresenta gradaes, subdivises. Embora fixo, o fenmeno
varia em intensidade. A distribuio de freqncia ou seriao um exemplo disso e ser estudado
separadamente com mais detalhe frente.
Distribuio de freqncia: todos os elementos poca, local e fenmeno so fixos. Embora fixo, o
fenmeno apresenta-se agora atravs de gradaes, ou seja, reunidos de acordo com a sua magnitude.
REPRESENTAO GRFICA
3.2.
Largura: Ser definida por quem est fazendo o grfico. Recomenda-se espaamentos entre colunas
de at 50% da largura da coluna.
Altura: A altura deve ter, em mdia, 75% da largura. Para facilitar o trabalho, existe uma tabela que
representa os valores mnimo e mximo da altura em relao largura.
3.2.1.
Grficos de anlise: so grficos que se prestam melhor ao trabalho estatstico, fornecendo elementos
teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os grficos de anlise
freqentemente vm acompanhados de uma tabela estatstica. Inclui-se, muitas vezes um texto
explicativo, chamando a ateno do leitor para os pontos principais revelados pelo grfico.
O uso indevido de grficos pode trazer uma idia falsa dos dados que esto sendo analisados,
chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construo do grfico.
Sendo assim, deve-se tomar cuidado com o uso de escalas e sistemas de coordenadas. Como
caracterstica, os grficos devem ser apresentados de forma simples, clara e com veracidade.
3.2.2.
Por linhas
curvas
Superpostas
Em colunas
% complementar
Remontadas
Diagrama
Horizontais
Por superfcie
Em barras
Compostas
Agrupadas
bidirecionais
Em histograma
Em setores
Quantidade (ton)
P ro d u o B ra s ile ira d e le o
70
60
50
40
30
1987
1988
1989 1990
Anos
1991
1992
25
20
15
10
5
0
Janeiro
Meses
Fevereiro
Rio de Janeiro
So Paulo
5
10
Unidades vendidas
15
20
Produtos
Mquinas de Lavar
Exaustores
Refrigeradores
Batedeiras
Liquidificadores
-50
-40
-30
-20
-10
10
20
30
40
50
Percentagens
25
20
15
Rio de Janeiro
10
So Paulo
5
0
Janeiro
Fevereiro
Meses
12
10
8
6
So Paulo
Rio de Janeiro
2
0
Janeiro
Fevereiro
Meses
10
Rio de Janeiro
So Paulo
Fevereiro
Janeiro
0
4
6
8
Veculos vendidos
10
12
GM
40%
FIAT
60%
40
35
30
25
20
15
10
5
0
Sexta
1
2
Anos
Oitava
5
Sries
11
21
2
3
12
1
23
1
2
3
Figura 11 - Grfico em forma de cartograma
12
13
4. DISTRIBUIO DE FREQUNCIAS
Conforme j havamos ressaltado anteriormente, quando do estudo das sries estatsticas, a
distribuio de freqncias considerada uma srie hetergrada, onde os elementos poca, local e
fenmeno so fixos. Entretanto, o fenmeno apresenta-se agora atravs de gradaes, ou seja, distribudos
em diversas classes.
Quando se estuda uma varivel, o maior interesse do pesquisador conhecer a distribuio dessa
varivel atravs de possveis realizaes (valores) da mesma.
De todas as tabelas estatsticas, esta, trabalha com variveis quantitativas (discretas e contnuas),
as quais exigem uma maior elaborao para a sua coleta e anlise. Por se tratar de variveis numricas, na
coleta muitas vezes ocorrem repeties, exigindo que a tabela seja apresentada de forma que estas
repeties possam enumeradas e apresentadas atravs de freqncias (n de vezes que uma determinada
varivel ocorre no conjunto de dados coletados).
Em resumo, uma tabela de distribuio de freqncia pode ser considerada uma tabela que
condensa um conjunto de dados, conforme as suas freqncias.
Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram
numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo como um
todo, a partir de dados no ordenados. Vejamos o exemplo dos seguintes valores:
45, 41, 42, 41, 42, 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
Rol: a tabela obtida aps a ordenao dos dados (crescente ou decrescente). Vejamos:
41, 41, 41, 42, 42, 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Distribuio de freqncia sem intervalos de classe: a simples condensao dos dados conforme
as repeties de seus valores. Para um rol de tamanho razovel esta distribuio de freqncia
inconveniente, j que exige muito espao. Veja exemplo abaixo:
Dados
41
42
43
44
45
46
50
51
52
54
57
58
60
Total
Freqncia (fi)
3
2
1
1
1
2
2
1
1
1
1
2
2
20
Classes
41 |------- 45
45 |------- 49
49 |------- 53
53 |------- 57
57 |------- 61
Total
Freqncias (fi)
7
3
4
1
5
20
14
Embora este tipo de distribuio seja mais adequado para um grande n de dados, ela apresenta
como desvantagem a perda da individualizao dos dados.
4.1.
Limites de Classe: so os extremos de cada classe. O menor nmero o limite inferior de classe (li) e
o maior nmero, limite superior de classe(Li).
Ex: em 49 |------- 53
Amplitude do Intervalo de Classe - hi: a medida do intervalo que define a classe. Sendo assim, o
intervalo de classe obtido atravs da diferena entre o limite superior e inferior da classe, ou seja:
hi = Li - li
Por exemplo, na tabela anterior hi= 53 49 = 4.
Amplitude total da Distribuio - AT: a diferena entre o limite superior da ltima classe e o limite
inferior da primeira classe.
AT = L(max) - l(min)
Ex: na tabela anterior AT = 61 - 41= 20.
Amplitude Amostral - AA: a diferena entre o valor mximo e o valor mnimo da amostra (rol), onde:
AA = X(max) X(min).
Em nosso exemplo AA = 60 - 41 = 19.
4.2.
Ponto Mdio da Classe xi: o ponto que divide o intervalo de classe ao meio, ou seja em duas
partes iguais. Vejamos:
xi =(li + Li)/2
a
No nosso exemplo, a 3 classe 49 |----- 53 possui como ponto mdio x3 = (49+53)/2 = 51
MTODO PRTICO PARA CONSTRUO DE UMA DISTRIBUIO DE FREQNCIAS COM INTERVALOS DE
CLASSE
15
i 1 + (3,3 * log n)
onde:
i = o nmero de classes;
n = o nmero total de dados.
Com a aplicao da regra de sturges, obtivemos para diferentes n de dados, o n de classes a ser
utilizado no intuito de representar a tabela de distribuio de freqncia.
N
3 |-----| 5
6 |-----| 11
12 |-----| 22
23 |-----| 46
47 |-----| 90
91 |-----| 181
182 |-----| 362
...
i= n de classes
3
4
5
6
7
8
9
...
Obs: Qualquer regra para determinao do n de classes da tabela no nos leva a uma deciso final. Esta
vai depender, na realidade de um julgamento pessoal, que deve estar ligado natureza dos dados.
No nosso exemplo: n = 20 dados, ento pela regra de sturges teremos:
i 1+(3,3*log(20)) 1+ (3,3 * 1,30) i 5,29 5 classes.
Quanto ao arredondamento de dados, devemos utilizar a seguinte conveno:
Valores de 0 - 4 arredonda para baixo
Valores de 5 - 9 arredonda para cima
4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe h > AA/i.
Para o nosso exemplo: h = AA/i = 19/5 = 3,8.
Obs: Como h > AA/i um valor ligeiramente superior para haver folga na ltima classe. Utilizaremos ento h
=4
5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos montar a
tabela, com o cuidado para no aparecer classes com freqncia = 0 (zero).
No nosso exemplo: o menor n da amostra 41, assim o limite inferior da primeira classe l1=41.
Para determinar-se o limite superior da primeira classe - Li, basta fazermos 41 + h, ou seja 41+4=45.
Assim, a primeira classe ser representada por 41|----- 45. As classes seguintes respeitaro o
mesmo procedimento. Se for assumida esta conveno, os primeiros elementos das classes seguintes
sempre sero formados pelo ltimo elemento da classe anterior.
4.3.
Classes
41 |------- 45
45 |------- 49
49 |------- 53
53 |------- 57
57 |------- 61
Total
fi
7
3
4
1
5
= 20
xi
43
47
51
55
59
fri
0,35
0,15
0,20
0,05
0,25
= 1,00
Fi
7
10
14
15
20
-
Fri
0,35
0,50
0,70
0,75
1,00
-
Freqncia simples ou absoluta - fi: so os valores que realmente representam o nmero de dados
de cada classe, ou seja, o n de repeties de um determinado valor dentro de uma classe. A soma
das freqncias simples igual ao nmero total de observaes da distribuio.
f
i =1
=n
ou seja,
i =1
16
= f 1 + f 2 + + f 5 = 7 + 3 + + 5 = 20
Freqncia relativa simples - fri: so os valores das razes entre as freqncias simples de cada
classe e a freqncia total da distribuio. A soma das freqncias relativas igual a 1 (100 %). O
propsito das freqncias relativas o de permitir a anlise ou facilitar as comparaes.
fri =
fi
fri (%) =
ou
i
fi
fr1 (%) =
*100
i
7
*100 = 35%
20
Freqncia acumulada - Fi: o total das freqncias de todos os valores inferiores ao limite superior
do intervalo de uma dada classe.
Fi = f i (i = 1,2,..., k)
ou seja,
F1 = 7
F2 = 7 + 3 = 10
F3 = 10 + 4 = 14
Freqncia relativa acumulada - Fri: de uma classe a freqncia acumulada da classe, dividida pela
freqncia total da distribuio.
Fri =
4.4.
Fi
ou
Fri (%) =
Fi
* 100
fi
Fr2 (%) =
10
*100 = 50%
20
4.4.1.
Histograma: formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o
eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios dos intervalos de
classe.
A rea de um histograma proporcional soma das freqncias simples ou absolutas. Vejamos:
fi
8
7
6
5
4
3
2
1
//
41
45
49
53
57
61
Classes
17
fi
8
7
6
5
4
3
2
1
//
47
55
43
51
59
xi
Figura 15 - Histograma de uma tabela de distribuio de freqncia sem intervalos de classes
fi
5
4
3
2
1
0
43
47
51
55
59
Ponto mdio - xi
18
25
Frequncia acumulada
20
15
10
0
41
45
49
Classes
53
57
61
Construa o histograma, polgono de freqncia simples e polgono de freqncia acumulada para a tabela
abaixo:
CLASSE
50 |-------- 54
54 |-------- 58
58 |-------- 62
62 |-------- 66
66 |-------- 70
70 |-------- 74
Total
fi
4
9
11
8
5
3
40
xi
52
56
60
64
68
72
fri
0,100
0,225
0,275
0,200
0,125
0,075
1,000
Fi
4
13
24
32
37
40
Fri
0,100
0,325
0,600
0,800
0,925
1,000
Sendo:
fi= freqncia simples ou absoluta;
xi= ponto mdio da classe;
fri= freqncia relativa simples;
Fi= freqncia acumulada; e
Fri= freqncia relativa acumulada.
INTRODUO
5.2.
19
MDIA ARITMTICA =
Podemos definir vrios tipos de mdias de um conjunto de dados, como a mdia aritmtica, a mdia
geomtrica, a mdia harmnica e a mdia ponderada. Aqui, trataremos apenas das duas mais comuns, a
aritmtica e a poderada.
A mdia aritmtica definida como sendo a somatria () de um conjunto de valores, dividido pela
quantidade deles.
x + x 2 + x 3 + ... + x n
x= 1
n
ou
x=
i =1
xi
n
5.2.1.
Dados no-agrupados:
x = (10+14+13+15+16+18+12) / 7 = 98/7=14 kg
Como resultado, obteve-se uma venda mdia diria de 14 kg de arroz.
5.2.2.
Dados agrupados:
fi
2
6
10
12
4
34
Neste caso, a tabela deveria ser interpretada da seguinte forma, duas famlias no possuem
nenhum menino; seis famlias possuem um menino e assim por diante. Ou ainda, duas empresas no
tiveram nenhum acidente de trabalho durante aquele ano; seis empresas tiveram um acidente de trabalho
e assim por diante.
Como as freqncias neste caso so nmeros indicadores da intensidade de cada valor da varivel,
elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada,
dada pela seguinte frmula:
x=
x1 * P1 + x 2 * P2 + x 3 * P3 + ... + x n * Pn
P1 + P2 + P3 + ...Pn
xi
0
1
2
3
4
Total
ou
x=
(x * P )
P
i
fi=Pi
2
6
10
12
4
34
xi*fi
0
6
20
36
16
78
Vejamos:
20
x=
x=
(f * x )
f
i
Frequncia = fi
4
9
11
8
5
3
40
ponto mdio = xi
52
56
60
64
68
72
fi*xi
208
504
660
512
340
216
2.440
x=
5.3.
2440
= 61
40
MODA - MO
Definimos a moda (ou modas) de um conjunto de valores como o valor (os valores) de maior
freqncia. Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o
salrio recebido pelo maior nmero de empregados dessa fbrica.
5.3.1.
Dados no-agrupados
Neste caso a moda facilmente reconhecida, basta de acordo com a definio, procurar o valor
que mais se repete. Exemplos:
Na srie {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10.
5.3.2.
Dados agrupados
Freqncia= fi
3
9
12
6
30
21
Mo =
li + L i
2
onde:
li = limite inferior da classe modal; e
Li= limite superior da classe modal.
Exemplo: Calcule a moda do conjunto de dados abaixo:
Classes
50 |------------ 54
54 |------------ 58
58 |------------ 62
62 |------------ 66
66 |------------ 70
70 |------------ 74
Total
fi
4
9
11
8
5
3
40
xi
52
56
60
64
68
72
R.: classe modal 58|-------- 62, pois a de maior freqncia li=58 e Li=62
Mo=(58+62)/2=60 cm
O outro mtodo mais elaborado para determinao da moda foi desenvolvido por CZUBER:
D1
* h i
Mo = l i +
D1 + D 2
Resolvendo temos:
li=58
D1=11-9 D1=2
fi=11
hi=62-58 = 4 hi=4
D2=11-8 D2=3
8
Mo = 58 +
* 4 = 58 + = 59,60 cm
5
2 + 3
Utilizamos a moda quando desejamos obter uma medida rpida e aproximada de posio ou
quando a medida de posio deva ser o valor mais tpico da distribuio.
5.4.
22
MEDIANA MD
uma medida de posio definida como o nmero que se encontra no centro de uma srie de
valores dispostos segundo uma ordem (crescente ou decrescente). Sendo assim, a mediana separa a srie
em dois grupos que apresentam o mesmo nmero de valores.
5.4.1.
Dados no-agrupados
Se a srie tiver nmero mpar de termos, o valor mediano ser o termo de ordem dado pela frmula:
n +1
2
Se a srie tiver nmero par de termos, o valor mediano ser o termo mdio de ordem dado pela
frmula:
n n
2 + 2 + 1
10 10
2 + 2 + 1 = 5 + 6 . Assim, a mediana ser a mdia aritmtica do 5
termo + 6 termo. Considerando que o 5 termo da srie 2 e o 6 3, ento a mediana da srie ser
(2+3)/2 = Md = 2,5.
Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com
um dos elementos da srie.
Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da mediana
com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2 elementos centrais
da srie.
A mediana depende da posio e no dos valores dos elementos na srie ordenada. Essa uma das
diferenas marcantes entre mediana e mdias (que se deixa influenciar e muito, pelos valores
extremos). Vejamos:
Em {5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10
Em {5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10
5.4.2.
Dados agrupados
f );
i
23
xi
0
1
2
3
4
Total
Assim, 0 ,50 *
fi
2
6
9
13
5
35
Fi
2
8
17
30
35
O valor igual ou imediatamente superior 17,5 na coluna da freqncia acumulada ser Fi = 30, ento a
Md = 3.
Md = l i +
[( 0 ,50 * f ) F(anterior ) ] * h
i
fi
onde:
li = o limite inferior da classe mediana;
(0,50 * f ) = 0,50 * 40 = 20
i
li = 58
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
F(anterior)=13
fi=11
hi=4
Md = 5 8 +
[20 1 3 ] * 4 = 58 + ( 28/11)
11
= 60,54
5.4.3.
Emprego da Mediana
Quando desejamos obter o ponto que divide a distribuio em duas partes iguais.
5.5.
24
SEPARATRIZES
Alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no
so medidas de tendncia central, mas esto ligadas mediana, j que se baseiam em sua posio na
srie. Essas medidas - os quartis, os percentis e os decis - so, juntamente com as medianas, conhecidas
pelo nome genrico de separatrizes.
Os quartis, decis e percentis so muito similares mediana, uma vez que tambm subdividem a
distribuio de medidas de acordo com a proporo das freqncias observadas. Enquanto a mediana
divide a distribuio em duas metades, os quartis dividem-se em quatro quartos, os decis em 10 partes e os
pontos percentis dividem a distribuio em 100 partes.
5.5.1.
Quartis
Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Precisamos,
portanto de 3 quartis (Q1, Q2 e Q3) para dividir a srie em quatro partes iguais. O Q1 representa os primeiros
25% dos dados ordenados (1/4), o Q2=Md encontra-se no meio do conjunto de dados(2/4) e o Q3
representa os primeiros 75% do conjunto de dados ordenados (3/4).
5.5.1.1.
Dados no-agrupados
Q2
Q3
Q2 = Md = (5+6)/2 = 5,5;
5.5.1.2.
Dados agrupados
Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana por
(0,25 * f ) para a determinao do primeiro quartil (Q ), substituir por (0,50 * f ) para a determinao
do segundo quartil (Q ) e substituir por (0 ,75 * f ) para a determinao do terceiro quartil (Q ). Assim a
1
Q k = li +
[(% *
f i ) F(anterior )
fi
]* h
classes
50 |------------ 54
54 |------------ 58
58 |------------ 62
62 |------------ 66
66 |------------ 70
70 |------------ 74
Total
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
Q1
Q2
Q3
O primeiro passo ser encontrar a classe onde encontra-se o Q1. Para tanto, devemos utilizar a
seguinte equao 0 , 25 *
f i . Aplicando a equao a tabela teremos que 0 , 25 * 40 = 10.
Dispondo deste valor, vamos a coluna das freqncias acumuladas (Fi) e encontramos o primeiro
a
valor igual ou maior a 10. Neste caso, o Q1 encontra-se na 2 classe da tabela, pois 13 maior que 10.
Resolvendo teremos:
25
[10 4 ] * 4
Q 1 = 54 +
5 4 + [(6/9) * 4 ] = 56 , 67
Q 2 = 58 +
[20 13 ] * 4
(
Q 3 = 62 +
5.5.2.
5 8 + [(7/11) * 4 ] = 60 ,54
11
f ) (0,75 * 40 ) = 30
[30 24 ] * 4
8
62 + [(6/8) * 4 ] = 65
Decis
A definio dos decis obedece ao mesmo princpio dos quartis, com a modificao da porcentagem
de valores que ficam aqum e alm do decil que se pretende calcular. A frmula bsica ser % *
fi ,
sendo % o valor percentual em decimal do decil que pretende-se determinar. Indicamos os decis por D1, D2,
..., D9. Deste modo precisamos de 9 decis para dividir uma srie em 10 partes iguais. O D5=Q2=Md.
Exemplo: Encontre o 3 decil da tabela de distribuio de classes citada anteriormente.
este valor a mesma j apresentada nos quartis, assim, este resultado corresponder a 2 classe.
D 3 = 54 +
5.5.3.
[12 4 ] * 4
9
54 + [(8/9) * 4 ] = 57 ,55
Percentil ou Centil
Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma srie
em 100 partes iguais. Indicamos por P1, P2, ... , P99. evidente que P50 = Md ; P25 = Q1 e P75 = Q3.
O clculo de um centil segue a mesma tcnica de clculo j demonstrada anteriormente, ou seja,
(% * f ) .
i
P8 = 50 +
[3, 2 0 ] * 4
4
50 + [(3,2/4) * 4 ] = 53 , 2
26
DISPERSO OU VARIABILIDADE:
x = 350/5 = 70
y = 350/5 = 70
z = 350/5 = 70
fcil notar que o conjunto x mais homogneo que os conjuntos y e z, j que todos os valores so
iguais mdia. O conjunto y, por sua vez, mais homogneo que o conjunto z, pois h menor variabilidade
entre cada um de seus valores e a mdia representativa. Conclu-se ento que o conjunto x apresenta
disperso nula e que o conjunto y apresenta uma disperso menor que o conjunto z.
As medidas de disperso ou de variabilidade existentes so: amplitude total, varincia, desvio
padro, coeficiente de variao, desvio quartil, desvio mdio absoluto. Os 4 primeiros so os mais
utilizados e portanto sero vistos.
6.2.
AMPLITUDE TOTAL - AT
Quando os dados no esto agrupados a amplitude total a diferena entre o maior e o menor valor
observado: AT = Xmximo - Xmnimo. Para os exemplos acima temos:
ATx=70-70 =0 (disper. nula)
ATy=72-68 =4
ATz=160-5 =155
Quando os dados esto agrupados sem intervalos de classe (tab.1) e com intervalos de classe
(tab.2) temos: AT = Xmximo - Xmnimo.
Tabela 1
xi
0
1
3
4
Tabela 2
fi
2
6
5
3
Classes
4 |---------- 6
6 |---------- 8
8 |----------10
fi
6
2
3
Para a tabela 1, a amplitude total ser AT = 4 - 0 = 4. J para a tabela 2, teremos uma amplitude
total de AT = 10 - 4 = 6
A AT tem o inconveniente de s levar em conta os dois valores extremos da srie, descuidando do
conjunto de valores intermedirios. Faz-se uso da amplitude total em situaes onde deseja-se determinar a
variao da temperatura em um dia, no controle de qualidade, ou quando necessitamos de uma medida de
clculo rpido sem muita exatido para representar a variabilidade dos dados.
6.3.
6.3.1.
Varincia 2 =
Desvio Padro
27
(x
x)
ou
(xi x )
x
=
ou
2
i
x
n
2
i
xi
xi
importante ressaltar que estas frmulas devero ser aplicadas quando estivermos
trabalhando dados oriundos de uma populao. No caso e trabalharmos com dados que representam
uma amostra, as expresses acima devero ter n-1 no denominador no lugar de n. Vejamos:
Varincia
(x
=
x)
(
xi )
1
S =
* x i
n 1
n
ou
n -1
(xi x )
(
xi )
1
s=
* x i
n 1
n
Desvio Padro s =
ou
n 1
Ex.: Calcular o desvio padro da populao representada por -4, -3, -2, 3, 5
2
xi
-4
-3
-2
3
5
=-1
16
9
4
9
25
=63
(x i - x) 2
(x i - x)
xi
- 0,2
- 0,2
- 0,2
- 0,2
- 0,2
- 3,8
- 2,8
- 1,8
3,2
5,2
14,44
7,84
3,24
10,24
27,04
=62,8
2
2
2
2
2
(
4 (0.2) ) + ( 3 (0.2) ) + ( 2 (0.2) ) + (3 (0.2) ) + (5 (0.2) )
=
S2 =
Encontramos desta forma a varincia dos dados (S =12,56). Para determinarmos o desvio padro,
basta tirarmos a raiz quadrada deste valor, ou seja S 2 = 12,5 s = 12,56 s = 3,54
Outra forma de calcularmos os mesmos parmetros utilizando a seguinte equao:
63 1
S =
= 12,60 0,04 = 12,56 s = 12,56 s = 3,54
5 5
2
A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm
extremamente importante na inferncia estatstica e em combinaes de amostras.
6.3.2.
Dados agrupados
Neste caso, a varincia e o desvio padro sero dados pelas seguintes expresses:
(f * (x ) ) (f * x )
=
f
(f * (x ) ) (f * x )
f
s=
28
fi
2
6
12
7
3
=30
fi*xi
0
6
24
21
12
=63
fi*(xi)
0
6
48
63
48
=165
Classes
150 |---- 154
154 |---- 158
158 |---- 162
162 |---- 166
166 |---- 170
170 |---- 174
fi
4
9
11
8
5
3
=40
xi
152
156
160
164
168
172
fi*xi
608
1404
1760
1312
840
516
=6.440
fi*(xi)
92416
219024
281600
215168
141120
88752
=1.038.080
165 63
s=
= 5,5 4,41 = 1,09 s = 1,044
30 30
Desvio padro para dados com intervalos de classe (tab. 4):
2
s=
6.4.
1038080 6440
COEFICIENTE DE VARIAO - CV
O desvio padro por si s no nos diz muita coisa. Alm do mais, o fato do desvio padro ser
expresso na mesma unidade dos dados limita seu emprego quando desejamos comparar duas ou mais
sries de valores referentes variabilidade.
Para contornar essas dificuldades utiliza-se o coeficiente de variao - CV, que apresenta os
dados em termos relativos. Como a tabela 4, apresenta x =161 (6440/40) e s=5,567, ento:
CV =
s
* 100
x
CV =
5,567
* 100 CV = 3,46%
161
7. MEDIDAS DE FORMA
7.1.
MEDIDAS DE ASSIMETRIA - AS
29
fi
6
12
24
12
6
60
Distribuio B
xi
4
8
12
16
20
fi*xi
24
96
288
192
120
720
Classes
2 |----- 6
6 |-----10
10 |-----14
14 |-----18
18 |-----22
Total =
fi
6
12
24
30
6
78
Distribuio C
fi*xi
24
96
288
480
120
1008
Classes
2 |----- 6
6 |-----10
10 |-----14
14 |-----18
18 |-----22
Total =
fi
6
30
24
12
6
78
fi*xi
24
240
288
192
120
864
x A = (720/60) = 12 kg
x B = (1008/78) = 12,92 kg
x C =(864/78) = 11,08 kg
MdA=12 kg
MdB =13,5 kg
MdC =10,5 kg
MoA= 12 kg
MoB =16 kg
MoC = 8 kg
s = 4,42 kg
s = 4,20 kg
s = 4,20 kg
CV= 36,83%
CV=32,51%
CV=37,91%
x Mo 12-12 = 0
B.
x Mo 12,92 16 = -3,08
C.
x Mo 11,08 8 = 3,08
distribuio simtrica;
assimtrica negativa.
assimtrica positiva.
Entretanto, a medida anterior, por ser absoluta, apresenta a mesma deficincia do desvio padro,
isto , no permite a possibilidade de comparao entre as medidas de duas distribuies.
Por esse motivo, devemos utilizar um dos seguintes coeficientes para a determinao da assimetria:
AS =
(x Mo)
s
AS =
Q 3 + Q1 - (2 * x)
Q 3 + Q1
AS =
30
3 * (x Md)
s
Este coeficiente de assimetria encontrado em softwares estatsticos como o Minitab e ainda nas
planilhas do excel pelo comando distoro.
n
x x
AS =
* i
(n 1) * (n 2)
s
7.2.
MEDIDAS DE CURTOSE - C
Leptocrtica: neste caso a distribuio apresenta-se em uma curva de freqncia mais fechada que a
normal, ou seja, mais aguda e afinada em sua parte superior.
Platicrtica: neste caso a distribuio apresenta-se em uma curva de freqncia mais aberta que a
normal, ou seja, mais achatada em sua parte superior.
C=
Q 3 Q1
2 * (P90 P10 )
Este coeficiente de assimetria encontrado em softwares estatsticos como o Minitab e ainda nas
planilhas do excel pelo comando distoro.
n * (n + 1)
x x
C=
* i
(n 1) * (n 2) * (n 3)
s
31
3 * (n 1) 2
(n 2) * (n 3)
n
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
32
34
36
38
40
45
50
55
60
65
70
75
80
85
90
95
100
125
ASSIMETRIA
=10%
=5%
liminferior-superior liminferior-superior
1,370
1,155
1,321
1,086
1,278
1,040
1,230
1,009
1,194
0,980
1,163
0,954
1,135
0,930
1,109
0,910
1,083
0,890
1,060
0,870
1,037
0,851
1,018
0,830
0,998
0,814
0,980
0,799
0,960
0,783
0,943
0,768
0,926
0,753
0,910
0,740
0,893
0,727
0,879
0,714
0,861
0,702
0,833
0,681
0,808
0,662
0,786
0,642
0,768
0,625
0,749
0,608
0,700
0,571
0,665
0,541
0,663
0,516
0,606
0,495
0,582
0,478
0,560
0,461
0,543
0,447
0,526
0,435
0,511
0,424
0,500
0,415
0,488
0,406
0,479
0,398
0,430
0,356
CURTOSE
=5%
=10%
liminferior
limsuperior
liminferior
limsuperior
-1,71
3,28
-1,58
2,66
-1,62
3,22
-1,47
2,47
-1,56
3,12
-1,41
2,36
-1,51
3,02
-1,37
2,28
-1,47
2,93
-1,33
2,21
-1,43
2,85
-1,30
2,15
-1,39
2,77
-1,27
2,09
-1,35
2,70
-1,24
2,04
-1,32
2,63
-1,21
1,99
-1,29
2,56
-1,19
1,94
-1,26
2,49
-1,16
1,89
-1,24
2,42
-1,15
1,84
-1,22
2,37
-1,13
1,80
-1,20
2,32
-1,11
1,77
-1,18
2,27
-1,09
1,73
-1,17
2,20
-1,07
1,70
-1,15
2,18
-1,05
1,67
-1,14
2,14
-1,04
1,64
-1,12
2,10
-1,02
1,61
-1,11
2,07
-1,00
1,59
-1,10
2,04
-0,99
1,56
-1,07
1,98
-0,96
1,51
-1,05
1,93
-0,94
1,47
-1,03
1,88
-0,92
1,42
-1,01
1,84
-0,90
1,38
-0,99
1,80
-0,88
1,35
-0,95
1,72
-0,85
1,27
-0,92
1,64
-0,81
1,21
-0,89
1,58
-0,79
1,16
-0,86
1,51
-0,76
1,11
-0,84
1,45
-0,74
1,08
-0,82
1,40
-0,72
1,04
-0,80
1,35
-0,70
1,01
-0,78
1,29
-0,69
0,98
-0,76
1,24
-0,67
0,96
-0,74
1,19
-0,65
0,94
-0,72
1,15
-0,64
0,92
-0,70
1,10
-0,63
0,90
-0,65
1,01
-0,57
0,79
32
J se discutiu anteriormente, que tanto a mdia como o desvio padro podem no ser medidas
adequadas para representar um conjunto de valores, pois:
apenas com dois valores no temos idia da assimetria da distribuio dos valores.
Para contornar estes fatos, as seguintes medidas so sugeridas por TUKEY (1977):
a mediana (Md);
os extremos (Min e Max): o menor e o maior valor do conjunto de dados;
os quartis ou juntas (Q).
Com estes parmetros, obtemos o chamado esquema dos cinco nmeros, que est representado
abaixo, onde tambm est incorporado o nmero de pontos. Vejamos:
n
Md = Q2
Q1
Q3
I)
II)
III)
Min
Max
Estas cinco medidas so chamadas de estatsticas de ordem e so medidas resistentes de
posio de uma distribuio. Elas so consideradas resistentes porque so pouco afetadas por mudanas
de uma pequena poro de dados. Conforme j discutido anteriormente, tanto a mdia como o desvio
padro, no so consideradas medidas resistentes, pois so afetadas de maneira acentuada por valores
extremos. Uma medida de disperso alternativa que resistente o intervalo interquartil - dJ, que obtido
pela diferena entre o terceiro e o primeiro quartis, vejamos:
d J = Q3 Q1
A diferena entre Q2 Min chamada de disperso inferior ao passo que a diferena entre Max
Q2 conhecida como disperso superior. A comparao destas distncias nos fornece informao sobre a
forma da distribuio. Em uma distribuio, os dados geralmente apresentaro normalidade (simtrica e
mesocrtica) quando tivermos as seguintes relaes:
as distncias entre mediana (Md=Q2) e os quartis Q1 e Q3 sejam menores que as distncias entre
extremos e quartis.
A informao contida no esquema dos cinco nmeros pode ser traduzida graficamente num
desenho esquemtico conhecido como Boxplot. Inicialmente encontramos aqueles valores que esto muito
aqum do Q1 ou muito alm do Q3 como sendo observaes discrepantes (ou outliers). Para tanto,
considera-se dados que sejam menores que Q1 1,5 * d J ou maiores que Q 3 + 1,5 * d J como sendo
discrepantes do restante dos dados.
Para construir o Boxplot, consideraremos um retngulo onde esto representadas os quartis Q1, Q2
e Q3. A partir do retngulo para cima e para baixo, seguem linhas at o ponto mais remoto que no seja
uma observao discrepante. Obtemos ento uma figura que representa o conjunto de dados, com
exceo dos outliers. Estes sero representados por uma astersco (*).
O desenho esquemtico abaixo d uma idia da:
posio: representada atravs de valores pontuais na escala, assim temos uma idia da abrangncia ou
faixas de valores do conjunto de dados;
assimetria: pode ser visualizada quando traa-se um grfico de distribuio dos dados perpendicular ao
lado esquerdo do boxplot;
caudas: so dadas pelas linhas que vo do retngulo aos valores mais afastados que no sejam
outliers;
33
dados discrepantes: so valores que fogem do comportamento normal dos dados e assim, merecem um
estudo especfico.
Abaixo vemos a representao de um Boxplot:
*
1,5*dJ
Q3
dJ
Q2
Q1
1,5*dJ
*
Exemplo: Para estudar o desempenho de duas companhias corretoras de aes, selecionou-se de cada
uma delas amostras aleatrias das aes negociadas. Para cada ao selecionada, computou-se a
porcentagem de lucro apresentada durante um perodo fixado do tempo. Os dados esto a seguir:
Corretora A
45 60 54 62 55
70 38 48 64 55
56 55 54 59 48
65 55 60
Corretora B
57 55 58 50 52 59
59 55 56 61 52 53
57 57 50 55 58 54
59 51 56
N
18
21
Varivel
Cor_A
Cor_B
Q1
52.5
52.5
Mdia
55.72
55.43
Q3
60.5
58.0
Mediana
55.00
56.00
s
7.68
3.17
CV(%)
13,78
5,72
dJ
8.0
5.5
Min
38.00
50.00
Max
70.00
61.00
Corretora B
18
55,0
52,5
21
56,0
60,5
52,5
58,0
=
38,0
70,0
50,0
61,0
Com os valores da srie podemos obter as seguintes relaes entre o desempenho da corretora A e B:
CORRETORA A
intervalo interquartil:
d J = Q3 Q1
d J = 60,5 52,5 = 8
so considerados outliers.
observaes discrepantes:
so considerados outliers.
34
CORRETORA B
intervalo interquartil:
d J = Q3 Q1
d J = 58 52,5 = 5,5
observaes discrepantes:
so considerados outliers.
Q3 Q2: 58 56 = 2
Uma vez obtidos os parmetros do Boxplot, basta apenas constru-lo, o resultado o que podemos
ver abaixo:
Boxplot da Corretora A
Boxplot da Corretora B
70
60
Cor_B
Cor_A
60
50
55
40
50
Cor_A
Cor_B
A corretora A, pelo fato de apresentar uma amplitude amostral de 32 (diferena entre o maior lucro e o
menor lucro obtido no perodo) revela um diferencial de ganhos maior do que o caso da corretora B que
apresenta uma amplitude amostral de 11, mostrando uma menor oscilao de lucros no perodo.
Observa-se que a amplitude da corretora A aproximadamente 5,3 vezes maior que o valor da
diferena entre quartis, significando que h uma grande disperso dos dados, ao passo que a amplitude
da corretora B aproximadamente 2,2 vezes maior que o valor da diferena entre quartis, significando
uma menor disperso dos dados de lucro.
Para a corretora A, a mediana est 5 vezes mais afastado do quartil superior (Q3) do que do quartil
inferior (Q1). J para a corretora B, a mediana est aproximadamente no meio do Q1 e Q3, significando
que h uma distribuio mais homognea de lucros.
Atravs do Coeficiente de variao (CV), que mede a homogeneidade dos dados, podemos dizer que a
corretora A possui seus lucros mais dispersos em relao a corretora B.
35
Estatstica Descritiva, Probabilidades e Inferncia
uma espcie de fator de correo para os valores dos quartis. Assim, por exemplo para calcularmos o Q1 e
Q3 devemos utilizar as seguintes equaes:
Prof. Jerry A. Johann
4
4
4
4
4
4
10
12
14
15
18
20
20
ordem
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12
X13
X14
X15
X16
4
4
4
n + 1 16 + 1
=
= 4,25 4 elemento
4
4
Q3 = X 3(16+1)
4
4
3 * (n + 1) 3 * (16 + 1)
= 12,75 12 elemento
=
4
4
36
9. PROBABILIDADE
9.1
INTRODUO
Muitas pessoas interessam-se por eventos ligados s probabilidades, do contrrio, como poderamos
explicar o grande nmero de indivduos que jogam em loterias, bingos, corridas de cavalo, etc.
Imagine que um pesquisador anota a idade e a presso arterial de seus pacientes tabelas e
grficos, medidas de posio, medidas de disperso, modelos de regresso estender suas
concluses fazer inferncia conhecimento das distribuies de probabilidade.
Empresrio deseja lanar um novo produto no mercado. Ele precisar de informaes sobre a
probabilidade de sucesso para seu novo produto.
Os modelos probabilsticos podem ser teis em diversas reas do conhecimento humano, tais
como: Administrao, Economia, Psicologia, Engenharia, Biologia, Medicina e outros ramos da cincia.
9.2
EXPERIMENTO ALEATRIO
So fenmenos que mesmo repetido vrias vezes sob condies semelhantes apresentam
resultados imprevisveis. So chamados de experimentos aleatrios, pois dependem do acaso.
Embora no saibamos qual o resultado que ir ocorrer num experimento, em geral, consegue-se
descrever o conjunto de todos os resultados possveis que podero ocorrer.
Ex.1) Da afirmao " provvel que o meu time ganhe a partida hoje" pode resultar:
- que ele ganhe
37
ESPAO AMOSTRAL - S
o conjunto universo ou o conjunto de resultados possveis de um experimento aleatrio.
No experimento aleatrio "lanamento de uma moeda" temos o espao amostral S={Ca,Co}.
No experimento aleatrio "lanamento de um dado" temos o espao amostral S={1,2,3,4,5,6}.
9.4
EVENTOS - E
Em um espao amostral finito S, o n de subconjuntos que pode verificar-se ser: n(S)=x (onde
x= n de possibilidades de ocorrer cada evento e n= n de experimentos).
9.5
CONCEITO DE PROBABILIDADE
Chamamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:
P(A) =
n(A)
n(S)
onde:
n(A) = n de elementos do evento A;
n(S) = n de elementos de S;
OBS: Quando todos os elementos de S tem a mesma chance de acontecer, temos um conjunto
equiprovvel.
9.5.1.
Propriedades da probabilidade
P() =0;
38
A ) = 1 - P(A);
Caso os eventos A e B sejam mutuamente exclusivos, isto A B=, ento P(A B) = P(A) +
P(B);
Exemplos:
1) No lanamento de uma moeda qual a probabilidade de obter cara em um evento A?
S = {Ca,Co}=2
A = {ca} = 1
B = {2,4,6} = 3
C = { 1,2,3,4,5,6 } = 6
D={ }=0
P(D) = 0/6 = 0 = 0%
9.6
Considere um espao amostral finito e sejam A e B dois eventos deste espao amostral, as
seguintes operaes podem ser definidas (MORETTIN, 1999):
COMPLEMENTAO ( )
COMPLEMENTAO ( )
Sabemos que um evento pode ou no ocorrer. Sendo p a probabilidade de que ele ocorra (sucesso)
e q a probabilidade de que ele no ocorra (insucesso), para um mesmo evento existe sempre a relao:
p+q=1
ou
q = 1-p (insucesso)
39
Exemplos:
1) Sabemos que a probabilidade de tirar o n 4 no lanamento de um dado p = 1/6.
Logo, a probabilidade de no tirar o n 4 no lanamento de um dado ser: q =1- p
2) Calcular a probabilidade de um piloto de automveis vencer uma dada corrida, onde as suas
"chances", segundo os entendidos, so de "3 para 2". Calcule tambm a probabilidade dele perder.
O termo "3 para 2" significa: De cada 5 corridas ele ganha 3 e perde 2. Ento p = 3/5 (ganhar) e q = 2/5
(perder).
INTERSECO ( ) Independentes
O evento interseco formado pelos pontos amostrais que pertencem simultaneamente aos
eventos A e B.
Assim, se A B (e) este evento ocorre se A e B ocorrem. Quando A B = teremos eventos
mutuamente exclusivos.
P(AB) =1/36
40
Estatstica Descritiva, Probabilidades e Inferncia
Ento a probabilidade de obtermos simultaneamente o n 4 e o n 3 para os dados 1 e 2,
respectivamente 1/36 = 2,78%.
Prof. Jerry A. Johann
O evento reunio formado pelos pontos amostrais que pertencem pelo menos um dos
eventos A e B.
Assim, se A B (ou) este evento ocorre se A ocorre ou B ocorre, ou ambos ocorrem. Se
tivermos A
B=S os eventos sero exaustivos.
Segundo CRESPO (1998), dizemos que dois ou mais eventos so mutuamente exclusivos
quando a realizao de um exclui a possibilidade de realizao do(s) outro(s).
Assim, no lanamento de uma moeda, o evento "tirar cara" e o evento "tirar coroa" so
mutuamente exclusivos, j que, ao se realizar um deles, o outro no se realiza.
Se dois eventos so mutuamente exclusivos, a probabilidade de que um ou outro se realize igual
soma das probabilidades de que cada um deles se realize:
P(A B) = P(A ou B) = P(A) + P(B)
Exemplos:
1) No lanamento de um dado qual a probabilidade de se tirar o n 3 ou o n 4? Os dois eventos so
mutuamente exclusivos ento:P=1/6+1/6= 2/6 = 1/3
Obs: Na probabilidade da unio de dois eventos A e B, quando h elementos comuns, devemos excluir as
probabilidades dos elementos comuns a A e B (elementos de A B) para no serem computadas duas
vezes.
Assim P(A B) = P(A) + P(B) - P(A B)
2) Retirando-se uma carta de um baralho de 52 cartas, qual a probabilidade da carta retirada ser ou
um S ou uma carta de COPAS?
P(S Copas) = P(S) + P(Copas) - P(S Copas) = 4/52 + 13/52 - 1/52 = 16/52 = 4/13
9.6.1
41
9.7
P(A/B) =
P(A B)
,
P(B)
se P(B)0
B={2,4,6,8,10,12,14}.
P(A/B) =
1
P(A B)
P(A/B) = = 0,143 ou 14,3%
7
P(B)
A={a carta uma figura} = A={6} {valete, dama ,rei} (copas e ouros)
B={a carta vermelha} = B={26}
P(A/B) =
6
3
P(A B)
= = 0,231 = 23,1%
P(A/B) =
26 13
P(B)
Observem que h 6 cartas que so figuras e vermelhas, bem como 26 cartas vermelhas.
P(A/B) l-se: probabilidade de sair uma figura, dado que a carta retirada tenha sido vermelha.
3) Consideremos 250 alunos que cursam o primeiro ciclo de uma faculdade. Destes alunos 100 so
homens (H) e 150 so mulheres (M), 110 cursam fsica (F) e 140 cursam qumica (Q). A distribuio
dos alunos a seguinte:
Disciplina
Fsica (F)
Qumica (Q)
TOTAL
Homens (H)
40
60
100
Mulheres (M)
70
80
150
TOTAL
110
140
250
Sexo
Um aluno sorteado ao acaso. Qual a probabilidade de que esteja cursando qumica, dado que
mulher?
Pelo quadro vemos que esta probabilidade de 80
150
e representamos: P(Q/M) = 80
150
250
P(M) = 150
P(M Q)
. Vemos
P(M)
250 . Assim,
P(Q/M) =
9.7.1
42
80
P(A B)
, poder-se- explicitar
P(B)
P(A B) e encontrar a regra do produto para dois eventos que pertenam ao mesmo espao
amostral:
ou
Ento a probabilidade da ocorrncia simultnea de dois eventos de um mesmo espaoamostra igual a probabilidade de um deles ocorrer, pela probabilidade condicional do outro, dado o
primeiro.
Exemplos:
1) Duas cartas so retiradas de um baralho sem haver reposio. Qual a probabilidade de ambas
serem COPAS?
P(Copas1)= 13/52
P(Copas2/Copas1) = 12/51
1/4
2/5
3/5
B
3/4
2/4
Resultados
Probabilidades
BB
2 1 2
* =
5 4 20
BV
2 3 6
* =
5 4 20
VB
3 2 6
* =
5 4 20
VV
3 2 6
* =
5 4 20
TOTAL
2
6
6
6
20
+
+
+
=
=1
20 20 20 20 20
V
2/4
Considerando o mesmo exemplo, entretanto agora vamos sortear a primeira bola e a devolver urna (com
reposio). Desta forma teremos eventos independentes, pois o primeiro evento no tem influncia no
resultado da outro.
2/5
2/5
3/5
Probabilidades
BB
2 2 4
* =
5 5 25
BV
2 3 6
* =
5 5 25
VB
3 2 6
* =
5 5 25
VV
3 3 9
* =
5 5 25
TOTAL
4
6
6
9
25
+
+
+
=
=1
25 25 25 25 25
B
V
2/5
V
3/5
9.8
Resultados
3/5
REVISO
Cartas pretas = 26
Pus = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Espadas = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Cartas vermelhas = 26
Ouros = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Copas = 13 (s, 2, 3, 4, 5, 6, 7, 8, 9, 10, valete, dama, rei)
Fatorial
5! = 5*4*3*2*1=120
5!/3! = (5*4*3!)/3!= 20
(3!*4!)/5! = (3*2*1*4!)/(5*4!) = 3*2*1/5 = 1,2
43
10.
44
DISTRIBUIO DE PROBABILIDADES
No captulo anterior introduzimos alguns modelos probabilsticos atravs de espaos amostrais bem
simples, o que facilitou a compreenso. Mas para atender a situaes prticas gerais, necessitamos da
ampliao destes conceitos para que tenhamos modelos probabilsticos que representem todos os tipos de
variveis j definidas. Neste sentido sero conceituadas, analisadas e exemplificadas variveis discretas e
contnuas (qualitativas e quantitativas).
Uma distribuio de probabilidades obtida quando se atribuem valores a todos os possveis
valores de uma varivel aleatria X, tanto por uma listagem como por uma funo matemtica. Assim, uma
varivel aleatria (v.a.) aquela cujos valores so determinados por processos acidentais, ao acaso, que
no esto sob o controle do observador.
No contexto das distribuies de probabilidade, os valores individuais de probabilidade podem ser
designados por f(x) ou P(x), que enfatizam a existncia de uma funo matemtica, por P(x=X), e que a
v.a. pode assumir diversos valores.
10.1
Varivel discreta pode ter valores observados somente em pontos isolados ao longo de uma
escala de valores. Em funo de ser obtida por processos de contagem, geralmente so expressos como
nmeros inteiros.
Todos os possveis valores da v.a. discreta podem ser listados numa tabela com as
probabilidades correspondentes. Os especficos modelos discretos de probabilidade so descritos por
distribuies de probabilidade de Bernoulli, Binomial, Hipergeomtrica e de Poisson.
Vamos supor que tenhamos um espao amostral S e que a cada ponto amostral seja atribudo um
nmero. Fica, ento, definida uma funo chamada varivel aleatria.
Assim, se o espao amostral relativo ao "lanamento simultneo de duas moedas" S = {(Ca,Ca),
(Ca,Co), (Co,Ca), (Co,Co)} e se X representa o "nmero de caras" que aparecem, a cada ponto amostral
podemos associar um nmero para X, de acordo com a tabela abaixo:
Ponto Amostral
(Ca,Ca)
(Ca,Co)
(Co,Ca)
(Co,Co)
X
2
1
1
0
P(X)
1/2*1/2=1/4
1/2*1/2=1/4
1/2*1/2=1/4
1/2*1/2=1/4
1/4+1/4=2/4
P(X)
1/4
2/4
1/4
4/4 = 1
(pea boa)
P(1) =0,05
(pea defeituosa)
Pea 2
0,95
0,95
=0,9025
0,95
0,05
=0,0475
0,05
0,95
=0,0475
0,05
0,05
=0,0025
0,0950
45
P(X)
0,9025
0,0950
0,0025
1,00
Freqncia - fi
22
5
2
1
30
Probabilidade - P(X)
0,73
0,17
0,07
0,03
1,00
Construmos tambm acima, uma coluna (3 ) onde aparecem os valores de uma varivel aleatria
X e as suas respectivas probabilidades de determinado evento ocorrer. Em suma, esta coluna obtida da
mesma forma que anteriormente calculvamos a coluna das freqncias relativas, ou seja, representa uma
proporo ou ainda uma probabilidade.
Ao definir a distribuio de probabilidade, estabelecemos uma correspondncia unvoca entre os
valores da varivel aleatria X e os valores da varivel P (probabilidade). Esta correspondncia define uma
funo onde os valores xi (i=1,2,3,...,n) formam o domnio da funo e os valores Pi (i=1,2,3,...,n) o seu
conjunto imagem. Esta funo assim definida denominada de funo da probabilidade e
representada por:
f(x) = P(X=xi)
Onde a funo P(X=xi) determina a distribuio de probabilidade da varivel aleatria X.
Assim, ao lanarmos um dado, a varivel aleatria X, definida por "pontos de um dado", pode-se
tomar os valores 1,2,3,4,5 e 6. Disso, resulta a seguinte distribuio de probabilidades:
X
1
2
3
4
5
6
Total
P(X)
1/6
1/6
1/6
1/6
1/6
1/6
6/6 = 1
Exemplo 2: Na tabela abaixo est registrado o n de caminhonetes solicitadas em uma agncia de aluguel
de carros, durante um perodo de 50 dias.
Demanda
N de dias
Prob.
Valor ponderado
Quadrado pond.
2
(X)
fi
P(X)
X*P(X)
X *P(X)
3
3
0,06
0,18
0,54
4
7
0,14
0,56
2,24
5
12
0,24
1,20
6,00
6
14
0,28
1,68
10,08
7
10
0,20
1,40
9,80
8
4
0,08
0,64
5,12
2
Total
50
1,00
E(X)=5,66
E(X )=33,78
Se considerssemos apenas as 3 primeiras colunas, j poderamos tirar concluses como:
a probabilidade de serem solicitadas exatamente 7 caminhonetes em um dia aleatoriamente escolhido
no perodo de 0,20 (20%);
10.1.1
46
Tal como para conjuntos de dados de amostras e populaes, freqentemente til descrever uma
distribuio de probabilidade em termos de usa mdia e varincia.
No caso de variveis aleatrias, a mdia ser chamada valor esperado ou esperana
matemtica da distribuio de probabilidade. Assim, o valor mdio de uma varivel aleatria discreta X,
denotado por E(X), ser a mdia ponderada de todos os possveis valores da varivel com os respectivos
valores de probabilidade tomados como peso. Assim, o valor esperado de uma distribuio discreta de
probabilidade ser:
E ( X ) = [X*P(X)]
J a varincia de uma varivel aleatria X, denotada por Var(X), calculada em relao a E(X)
como a mdia da distribuio de probabilidade. A forma geral de desvios :
Var ( X ) = [ X E(X)] * P( X )
2
][
Var ( X ) = X 2 * P ( X ) X * P( X )
ou
= E ( X 2 ) [E ( X )]
E ( X ) = [ X*P(X)] E ( X ) = 5,66
][
10.1.2
Distribuio Binomial
Em cada tentativa existem dois resultados possveis mutuamente exclusivos. Eles so chamados, por
convenincia de sucesso ou fracasso (insucesso);
A probabilidade de sucesso (p), e por conseqncia de fracasso (p) [q=1- p] permanece constante de
tentativa para tentativa, ou seja, o processo estacionrio.
Assim, a distribuio Binomial pode ser utilizada para determinar a probabilidade de se obter um
dado n de sucessos em um processo de Bernoulli. Desta forma, 3 valores so necessrios: o n de
sucessos (X); o n de tentativas ou observaes (n); e a probabilidade de sucesso em cada tentativa (p).
Os problemas de distribuio Binomial so do tipo determinar a probabilidade de um certo n de
sucessos X em n tentativas e dado pela seguinte frmula:
P( x) =
( )* p
n
x
* q n x
onde:
P(X)probabilidade de que o evento se realize x vezes em n provas;
p probabilidade de que o evento se realize em uma s prova (sucesso);
q probabilidade de que o evento no se realize no decurso dessa prova (fracasso).
47
n!
x!*(n x)!
OBS: O nome binomial devido frmula, pois representa o termo geral do desenvolvimento do binmio de
Newton.
Exemplos:
1- Uma moeda lanada 5 vezes seguidas e independentes. Calcule a probabilidade de serem
obtidas 3 caras nessas 5 provas.
n=5 X=3
Se a probabilidade de obtermos cara numa s prova (sucesso) p=1/2=0,5 e a probabilidade de no
obtermos cara numa s prova (fracasso) q=1-(1/2)=1/2=0,5. Ento:
P(X = 3) =
P(X = 3) =
( )* p
5
3
* q 53 =
( )* p
5
3
* q2
5 * 4 * 3!
5 * 4 * 3!
* (0,5) 3 * (0,5) 2 =
* (0,5) 3 * (0,5) 2
3!*(5 3)!
3!*(2*1)!
2- Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A ganhar
4 jogos.
n=6 X=4
Neste caso existem trs possibilidades, que o time A ganhe, que ele perca ou que ele empate. Desta forma
a probabilidade de que o time A ganhe (sucesso p) ser de p=1/3, e a probabilidade de fracasso q
(perca ou empate) ser de q=1-1/3=2/3. Ento:
P(X = 4) =
( )* p
6
4
* q 6-4 =
( )* p
6
4
* q2
6 * 5 * 4! 1 2
6 * 5 * 4! 1 2
P(X = 4) =
* * =
* *
4!*(6 - 4)! 3 3
4!*(2 *1)! 3 3
P(X = 2) =
( )* p
6
2
* q 6-2 =
( )* p
6
2
P(X = 2) =
* q4
6 * 5 * 4! 1 2
6 * 5 * 4! 1 2
* * =
* *
2!*(6 - 2)! 3 3
2 *1!*(4!) 3 3
P(X = 3) =
( )* p
6
3
* q 6 -3 =
3
( )* p
6
3
* q3
6!
6 * 5 * 4 * 3! 1 2
6 * 5 * 4 * 3! 1 2
1 2
P(X = 3) =
* * =
* * =
* *
3!*(6 - 3)! 3 3
3!*(6 - 3)! 3 3
3!*(3* 2 * 1!) 3 3
48
P(X = 0) =
( )* p
6
0
* q 6 -0 =
( )* p
6
0
P(X = 0) =
* q6
6!
6!
1 2
1 2
2
* * =
* * = 1 *1 *
0!*(6 - 0)! 3 3
0!*(6!) 3 3
3
P(X = 4) =
( )* p
6
4
* q 6- 2 =
( )* p
6
4
*q2
6!
6!
4
2
4
2
* (0,20 ) * (0,80)
* (0,20 ) * (0,80 )
4!*(6 - 4)!
4!*(2!)
6 * 5 * 4 * 3 * 2!
4
2
P(X = 4) =
* (0,20) * (0,80) = 15 * (0,0016) * (0,64) = 0,01536 1,54%
(4 * 3 * 2) * 2!
P(X = 4) =
6- Se a probabilidade de um possvel cliente realizar uma compra 0,20 (20%), ento a probabilidade
de um vendedor que visita 15 clientes presumveis realizar menos do que 3 vendas :
Utilizando a tabela para n=15; p=0,20 e P(X<3) teremos
P(X<3) = P(X 2) P(X=0)+ P(X=1)+ P(X=2)
P(X 2)= 0,0352 + 0,1319 + 0,2309 = 0,3980 39,8%
O valor mdio e a varincia para uma distribuio Binomial podem ser determinados listando-se a
distribuio de probabilidade em uma tabela e aplicando as frmulas apresentadas na seo onde estes
dois parmetros foram definidos. Contudo, pode-se calcular diretamente o n esperado de sucessos e a
varincia pelas seguintes frmulas:
E( X ) = n * p ;
Mdia
Varincia
Var ( X ) = n * p * q
E ( X ) = 15 * 0,20 = 3,0
Mdia
Varincia
10.1.3
vendas.
vendas.
Distribuio de Poisson
Este tipo de distribuio largamente empregado quando se deseja contar o nmero de eventos
de um certo tipo, que ocorrem em um intervalo de tempo, ou superfcie ou volume. Assim, esta distribuio
tambm conhecida como distribuio de eventos raros, tais como:
O processo de Poisson similar ao de Bernoulli e sendo assim, supe-se que os eventos sejam
independentes e o processo seja estacionrio.
utilizado quando conhecemos o n de sucessos, porm se torna difcil ou sem sentido
determinarmos o n de fracassos ou o n total de provas. Vejamos: considere o n de emendas em um rolo
49
de fita adesiva, podemos saber quantas emendas possui, porm no saberemos contar quantas emendas
no ocorreram.
Aqui, necessitamos apenas do n mdio de sucessos para uma especfica dimenso de tempo ou
de espao de interesse. Este n mdio representado por (lambda). A frmula para se determinar a
probabilidade de um dado n x de sucessos em uma distribuio de Poisson :
P( x | ) =
x * e
x!
onde:
P(x=)probabilidade de que o evento se realize x vezes no espao de tempo estudado;
= *t
onde t o
E ( X ) = Var ( X ) = ;
Exemplos:
1- Um PBX recebe um mdia de 5 chamadas por minuto. Supondo que as chamadas que chegam
constituam uma distribuio de Poisson, obter a probabilidade de que o PBX no receba chamadas
durante um intervalo de um minuto.
=5 chamadas por minuto e X=0 ento:
5 0 * e 5
P( X | ) =
P ( X = 0 | = 5) =
X!
0!
P ( X = 0 | = 5) = 0,0067 = 0,67%
X * e
2 - Sabe-se por experincia que 1,5% das pastilhas de freio fabricadas por determinada empresa
apresentam defeitos. O controle de qualidade da empresa resolveu escolher ao acaso 100 peas de
pastilhas. Determine a probabilidade de que:
a) pelo menos 2 peas apresentem defeitos
=1,5% = 0,015
t= 100 peas (intervalo)
X=0 e X=1
= 0,015 *100
1,5 0 * e 1, 5
0!
1,51 * e 1,5
P ( X = 1) =
1!
P ( X = 0) =
= 1,5
P ( X = 0) = 0,2231
P ( X = 1) = 0,3347
P ( X = 2) =
1,5 2 * e 1,5
2!
P(X = 2) = 0,2510
10.2
50
Suponha que X uma varivel aleatria cujo nmero de valores possveis de X um intervalo, por
exemplo 0 x 1, ou uma coleo de intervalos. Neste caso a v.a. contnua. Assim, uma varivel
contnua pode assumir um valor em qualquer ponto fracionrio ao longo do intervalo especificado de
valores e so gerados por processos de medio.
Desta forma, para uma v.a. contnua todos os possveis valores fracionrios da varivel no podem
ser listados e desta forma as probabilidades determinadas por uma funo matemtica so retratadas aqui
por uma funo densidade ou por uma curva de probabilidade. A proporo de rea includa entre dois
pontos quaisquer, debaixo da curva de probabilidade, identifica a probabilidade de que a v.a. contnua
selecionada assuma um valor entre tais pontos.
Seja X uma v.a. contnua. A funo densidade de probabilidade (f.d.p.) f(x) uma funo que
satisfaz as seguintes condies:
f ( x) dx = 1
Distribuio Normal
Entre as distribuies tericas de varivel aleatria contnua, uma das mais empregadas a
distribuio normal de probabilidades. Suas origens remontam a Gauss em seus trabalhos sobre erros
de observaes astronmicas, por volta de 1810, por isto o nome de distribuio gaussiana para tal modelo.
A distribuio de probabilidade normal importante na inferncia estatstica por trs razes distintas:
Probabilidades normais podem ser usadas freqentemente como aproximaes de outras distribuies
de probabilidade, tais como as distribuies Binomial e de Poisson;
Dizemos que a v.a. X tem distribuio normal com parmetros e com - << + e com 0 < <
+, se sua densidade for dada por:
2
f x; ,
2
1
( x )2 / 2
=
*e
2
f(x)
51
A rea total limitada pela curva e pelo eixo das abscissas igual a 1, j que essa rea corresponde
probabilidade de a varivel aleatria X assuma qualquer valor real.
A curva normal assinttica em relao ao eixo das abscissas, isto , aproxima-se indefinidamente do
eixo das abscissas sem, contudo, alcan-la;
Como a curva simtrica em torno da mdia, a probabilidade de ocorrer valor maior que a mdia
igual probabilidade de ocorrer valor menor do que a mdia, isto , ambas as probabilidades so iguais
a 0,5 ou 50%. Cada metade da curva representa 50% de probabilidade.
z=
(x x )
s
onde:
Z= distribuio normal padronizada
x=varivel aleatria
z=
(X x )
s
z=
Utilizao da Tabela Z
Procuremos, agora, na tabela Z o valor de z=1,25
Na primeira coluna encontramos o valor at uma casa decimal=1,2. Em seguida, encontramos na primeira
linha, o valor 5, que corresponde ao ltimo algarismo do nmero 1,25. Na interseo da linha e coluna
correspondentes encontramos o valor 0,3944, o que nos permite escrever:
P(0<Z<1,25)=0,3944 ou seja 39,44% assim a probabilidade de um certo parafuso apresentar um dimetro
entre a mdia = 2cm e x=2,05cm de 39,44 %.
2 - Determine as probabilidades:
a) P(-1,25 < Z < 0)
e) P( Z < 0,92)
52
z1 =
z2 =
BIBLIOGRAFIA:
a
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatstica Bsica: mtodos quantitativos. 4 ed. So
Paulo:Atual, 1987, 321p.
CRESPO, Antnio Arnot. Estatstica fcil. So Paulo:Saraiva, 1996, 224p.
COSTA, Jos de Jesus da Serra. Elementos de probabilidade. Rio de Janeiro:Campus, 1981, 253p.
MARTINS, Gilberto de Andrade. Estatstica Geral e Aplicada. So Paulo: Atlas, 2001, 417p.
a
MORETTIN, Luiz Gonzaga. Estatstica Bsica: probabilidade. 7 ed. vol 1, So Paulo: Makron Books,
1999, 209p.
a
SPIEGEL, Murray R. Estatstica. 3 ed. So Paulo:Makron Books, 1993, 629p.
53
e s.
PARMETROS POPULAIONAIS
ESTIMATIVAS AMOSTRAIS
Mdia
Varincia
Desvio Padro
S2
Proporo
N de dados
f
n
54
Vantagens da amostra:
Custo reduzido: pois os dados so obtidos de apenas uma parte da populao, diminuindo assim os
custos envolvidos no processo.
Maior rapidez: pelo mesmo motivo, os dados podem ser coletados e sintetizados mais rapidamente por
amostragem, que por contagem completa, principalmente quando se necessita de informaes urgentes
Maior praticabilidade: pois uma contagem completa pode ser impraticvel;
Maior exatido: em virtude de se poder empregar pessoal treinado e equipamento especializado na
obteno dos dados.
Entretanto, em problemas envolvendo amostras, antes de tomarmos uma deciso, teramos que
responder a trs perguntas:
Como escolher a amostra?
Que informao pertinente (estatstica) ser retirada da amostra?
Como se comporta a estatstica quando o mesmo procedimento de escolher a amostra usado
numa populao conhecida?
Em resumo, a obteno de solues adequadas para o problema de amostragem exige, em geral,
muito bom senso e experincia. E sempre interessante que o estatstico esteja trabalhando em equipe
com algum que conhea o assunto em questo.
55
Exemplo
Problema: Considere uma populao de 300 alunos para verificarmos o nvel de escolaridade.
R. Neste caso deveramos elaborar uma lista de nomes de 300 alunos cada qual vinculado a um nmero,
por exemplo, Paulo = 52, Chica = 256, e assim por diante. Digamos que desejamos analisar uma amostra
casual simples de 30 alunos. Existem vrias formas de fazermos este sorteio aleatrio. Podemos por
exemplo utilizar a funo randmica (RND) que sorteia nmeros aleatrios, sendo os nmeros tomados
com trs casas decimais. Os nmeros sorteados acima de 0,300 (300 alunos = populao) descartam-se e
repete-se o sorteio at atingirmos a amostra de 30 nmeros que consequentemente sero os alunos
sorteados ao acaso para a amostra. Por exemplo utilizando a tecla RND da calculadora obtivemos os
seguintes nmeros:
0,059 = 59
0,132 = 132
.
.
0,049 = 49
e assim por diante at completar os 30 valores das amostras.
Uma outra forma de realizarmos uma amostragem casual simples, fazer uso da tabela dos nmeros
aleatrios. Nesta, sorteia-se uma coluna ou uma linha da tabela que ser o ponto de partida para seleo
da amostra. Para o nosso exemplo, como temos 300 alunos, do ponto de partida destacam-se nmeros de
a
3 algarismos. Utilizando a tabela de nmeros aleatrios, se o ponto de partida fosse, por exemplo, a 15
linha, teramos:
403 613 278 430 823 336 396 944 205 586 461 123 389 278 952 667 193
assim, os seguintes alunos seriam os sorteados para comporem a amostra: 278, 205, 123, 193, ... e assim
por diante, at selecionar os 30 alunos.
11.1.2 Amostragem Sistemtica - AS
Caractersticas
Ocorre quando temos os elementos de uma populao ordenada, e a retirada dos elementos da
amostra feita periodicamente. Este o caso de fichas de um fichrio, listas telefnicas, etc..
Vantagens
simples de ser realizada e, no caso de amostras muito grandes, acarreta economia de tempo e
dinheiro;
Grande facilidade de determinao dos elementos da amostra.
Desvantagens
Perigo de existncia de ciclos de variao da varivel de interesse, especialmente se o perodo desses
ciclos coincidir com o perodo de retirada dos elementos da amostra.
Exemplo
Supondo o mesmo exemplo dado acima, para organizar uma amostragem sistemtica, sorteamos um
nmero de 0 a 9, ao acaso. Supondo que o nmero sorteado tenha sido 8. Este ser o primeiro
elemento da amostra e os demais sero determinados em intervalos de 10 unidades (frao da
amostragem 300/30 = 10), Assim a amostra seria:
8 18 28 38 48 58 68 78 88 98 108 118 128 138 148
158 168 178 188 198 208 218 228 238 248 258 268 278 288 298
Assim os 30 alunos cujos nomes correspondem aos nmeros sorteados constituiriam a amostra.
Numa linha de produo, podemos a cada dez itens produzidos, retirar uma para pertencer a uma
amostra da produo diria.
56
57
Nesta amostragem uma amostra retirada em diversas etapas sucessivas. Dependendo dos
resultados observados, etapas suplementares podem ser dispensadas.
Vantagens
Sua finalidade e vantagem diminuir o nmero mdio de itens inspecionados a longo prazo, baixando
assim o custo de inspeo.
TABELA DOS NMEROS ALEATRIOS
58
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
EIXO X (3000 m)
Figura 01 rea de amostragem numa matriz de 20 linhas x 30 colunas, totalizando 600 parcelas quadradas de 100m.
28
29
30
59
EIXO Y (2000 m)
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
10
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
11
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
12
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
13
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
14
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
15
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
16
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
17
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
18
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
19
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
20
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
EIXO X (3000 m)
60
N Sorteado = Int (RND * 600 ) + 1 para calcularmos os valores sorteados, obtendo-se assim os valores entre 1 e 600, conforme tabela abaixo. Os nmeros
sorteados esto apresentados em vermelho na Figura 04 e tambm esto relacionados abaixo:
0
N. Amostra
1
2
3
4
5
6
7
8
9
10
RND
0.935
0.858
0.198
0.100
0.370
0.912
0.889
0.677
0.073
0.347
Valor Calc.
561
516
119
61
223
548
534
407
44
209
N. Amostra
11
12
13
14
15
16
17
18
19
20
RND
Valor Calc.
0.415
250
0.215
129
0.281
169
0.766
460
0.526
316
0.297
179
0.236
142
0.952
572
0.840
504
0.662
398
61
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
62
EIXO Y (2000 m)
2) Selecionar por amostragem sistemtica 20 reas quadradas de 100m de lado numa superfcie retangular de 3000 x 2000 metros.
a) Representar graficamente o resultado
1
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
10
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
11
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
12
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
13
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
14
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
15
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
16
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
17
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
18
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
19
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
20
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
EIXO X (3000 m)
Figura 05 rea de amostragem numa matriz de 20 linhas x 30 colunas numerada de 1 600, com parcelas quadradas de 100 m.
O primeiro passo definirmos a proporo de amostras para a populao. Para obtermos a proporo devemos efetuar o seguinte clculo: 600/20 = 30.
Desta forma, a proporo ser de uma unidade amostral, para cada 30 unidades populacionais. Em funo de tratar-se de uma amostragem sistemtica, devemos
sortear somente o primeiro elemento amostral por meio da seguinte expresso: N 0 Sorteado = Int (RND * 30 ) + 1 . As demais amostras sero valores dados pela
soma desta proporo (30). Para este exemplo, atravs da funo randmica da calculadora, sorteamos o nmero RND=0,131, desta forma utilizando a expresso
obtivemos: N Sorteado = Int (0,131 * 30) + 1 = 4 . Assim a parcela 4 ser a primeira amostra desta amostragem sistemtica e as demais tero um intervalo de 30
unidades. Ento as amostras para este grid sero: 4; 34; 64; 94; 124; 154; 184; 214; 244; 274; 304; 334; 364; 394; 424; 454; 484; 514; 544; 574.
0
63
1
2
3
4
5
6
EIXO Y (2000 m)
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
EIXO X (3000 m)
26
27
28
29
30
64
EIXO Y (2000 m)
3) Selecionar por amostragem estratificada, 20 reas quadradas de 100m de lado numa superfcie retangular de 3000 x 2000m. Os estratos so 4 sub-reas de
1500m x 1000m.
a) Representao grfica do resultado
1
10
11
12
13
14
15
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
10
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
11
10
11
12
13
14
15
10
11
12
13
14
15
12
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
13
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
14
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
15
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
16
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
17
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
18
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
19
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
20
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
EIXO X (3000 m)
Figura 07 rea de amostragem numa matriz de 20 linhas x 30 colunas subdividida em 4 estratos cada qual numerada de 1 150, com parcelas
quadradas de 100 m.
Abaixo temos a representao esquemtica das 4 sub-reas em estudo e mostradas acima:
Sub-rea 01
Sub-rea 02
Sub-rea 03
Sub-rea 04
65
Partindo do pressuposto de que a populao em estudo apresenta um comportamento diferente em toda a sua rea, realizou-se a subdiviso em quatro
estratos ou sub-populaes, onde de estrato para estrato, a varivel apresenta um comportamento diferente, e dentro de cada estrato um comportamento o mais
homogneo possvel. Existem 3 tipos de amostragem estratificada: uniforme; proporcional e tima. Para o caso em estudo utilizamos a amostragem proporcional,
sendo assim, teremos que realizar o sorteio das amostras dentro de cada estrato, ou seja, 5 amostras para cada sub-rea totalizando 20 amostras para toda rea.
Para a realizao deste sorteio, pode-se utilizar a funo randmica da calculadora para encontrarmos o valor entre 0 e 0,999 para cada sub-rea e em
seguida aplicamos na seguinte expresso: N 0 Sorteado = Int (RND * 150 ) + 1 obtendo-se conseqentemente os valores apresentados na tabela abaixo:
Sub-rea 01
Sub-rea 02
Sub-rea 03
Sub-rea 04
Estes nmeros correspondem as parcelas numeradas na Figura 01 e podem melhor ser visualizados na Figura 02, onde as mesmas encontram-se em
vermelho, tendo-se desta forma uma visualizao do grid de amostragem.
1
2
3
4
5
6
EIXO Y (2000 m)
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
EIXO X (3000 m)
Figura 08 Grid com as 4 sub-reas e 5 amostras selecionadas aleatoriamente por sub-rea (parcelas vermelhas).
29
30
66
12.1.1
Os mtodos de estimao por intervalo esto na maioria de suas vezes baseados no pressuposto
de que possa ser usada a distribuio normal de probabilidades. Esta pressuposio garantida
sempre que o n de dados amostrados maior que 30 (n
30).
2
x (mdia amostral)
n , ou seja, x : N( ; n ) .
2
Portanto tem-se uma distribuio Z tal que Z = x seja uma distribuio normal N(0,1).
Assim,
P( Z 2 Z Z 2 ) = 1
P x Z *
x + Z *
= 1
n
n
67
: nvel de significncia
0,20
0,15
0,10
0,05
0,025
0,01
(1-
): nvel de confiana
0,80
0,85
0,90
0,95
0,975
0,99
Z: distribuio Normal
1,28
1,44
1,65
1,96
2,24
2,58
Exemplo: Seja X a durao da vida de uma pea de equipamento tal que = 5horas. Ensaiaram-se
100 peas e estas forneceram uma durao mdia de vida de 500 horas. Deseja-se obter o IC com
95% para a mdia .
x =500hs.
= 5hs
n=100 peas
Dados:
P x Z *
x + Z *
= 1
n
n
5
P (500 0,98) = 0,95
P 500 1,96 *
100
Assim, o intervalo acima contm a verdadeira mdia (parmetro) para um nvel de significncia de 95%. Ou
ainda, pode-se dizer que 95% das vezes, o intervalo acima contm a verdadeira mdia, o que no a
mesma coisa que afirmarmos que 95% a probabilidade do parmetro cair dentro do intervalo, o que se
constitui num erro.
Para o mesmo exemplo se desejssemos obter o IC para 90% ou 99% da mdia , teramos
respectivamente:
5
P (500 0,83) = 0,90
P 500 1,65 *
100
5
P (500 1,29 ) = 0,99
P 500 2,58 *
100
12.1.2
2
n
(
xi )
1
S =
* xi
n 1 i =1
n
x
com n-1 gl.
s n
68
s
s
P x t *
x + t *
= 1
n
n
Exemplo: A seguinte amostra: 9,8,12,7,9,6,11,6,10,9 foi extrada de uma populao normal. Construir
o IC para a mdia ao nvel de 95% de confiana.
xi = 9 + 8 + 12 + 7 + 9 + 6 + 11 + 6 + 10 + 9 = 87 = 8,7
x=
n
10
10
2
n
(
xi )
1
S =
* xi
n 1 i =1
n
S2 =
10 1
10 9
ento s = 2,0
s
s
x + t *
= 1
P x t *
n
n
2,0
2,0
ou ainda
= 1 0,05
P 8,7 2,262 *
8,7 + 2,262 *
10
10
2,0
P(8,7 1,43) = 0,95
= 0,95
P 8,7 2,262 *
10
Assim, o intervalo acima contm a verdadeira mdia populacional para um nvel de significncia de 5%.
12.1.3
P( Z 2 Z Z 2 ) = 1
n
pq
ento
n
obtendo-se
P f Z *
pq
p f + Z *
n
pq
= 1
n
Como no conhecemos , e est se admitindo n>30, substitui-se nos limites do intervalo o por f e o q por
(1-f). Teremos ento:
f (1 f )
f (1 f )
= 1
P f Z *
p f + Z *
n
n
f = 260
500
P f Z *
f (1 f )
p f + Z *
n
f (1 f )
= 1
69
0,52 * (1 0,52)
0,52 * (1 0,52 )
= 0,90 ou
P 0,52 1,65 *
p 0,52 + 1,65 *
500
500
0,52 * (1 0,52)
= 0,90 P
P 0,52 1,65
500
Assim, o intervalo acima contm a verdadeira proporo populacional para um nvel de confiana de 90%.
12.1.4
Deseja-se agora construir o IC ao nvel 1- para a varincia da populao. Neste caso usar-se-
a famlia das distribuies qui-quadrado . Seja ento P
2
2
n 1,(100 2 )
n21 n21, 2 = 1
(n 1) * S 2
(
n 1) * S 2
2
2
= 1
[2(n 1);( 2 )]
[( n 1);(100 2 ) ]
Exemplo: Uma amostra de onze elementos, extrada de uma populao com distribuio normal,
2
forneceu varincia S =7,08. Construir um IC de 90% para a varincia da populao.
2
Dados:
n=11
S = 7,08
1-=90%
=10%
Na tbua IV obtemos os valores de qui-quadrado para:
2
= 1
[2(n 1);( 2 )]
[
(
n
1
)
;
(
100
2
)
]
3,94
18,307
(3,87
17,97 = 0,90
Assim, o intervalo acima contm a verdadeira varincia populacional( ) para um nvel de significncia de
90%.
2
12.1.5
Para amostras pequenas o procedimento obtido da mesma forma que encontramos a varincia
populacional, bastando extrair a raiz quadrada de cada membro da frmula, ou seja:
(n 1)* S 2
[2(n1);( 2 )]
(n 1)* S 2
[2(n 1);(100 2 ) ]
= 1
Entretanto, um mtodo aproximado pode ser usado, alternativamente, no caso de amostras grandes
(n>30). Este procedimento consiste em construir o IC para usando a expresso:
s Z 2 *
2 * (n 1)
13.
70
Veremos aqui, de acordo com COSTA NETO (1977) como determinar o tamanho das amostras
necessrias nos casos de estimao da mdia ou de uma proporo populacional.
Se o desvio padro populacional () for conhecido, podemos usar a expresso abaixo para a
determinao do tamanho da amostra necessria para se realizar a estimao por intervalo com a
confiana e a preciso desejadas.
Z *
n =
0
onde:
n: tamanho da amostra necessria;
: desvio padro populacional;
0: preciso desejada;
Z : varivel normal padronizada Z para um nvel de significncia ;
Quando desconhecemos o desvio padro populacional, devemos substitu-lo por sua estimativa
s e usar tde Student na expresso acima. Se no conhecemos s, a nica soluo ser colher uma
amostra-piloto de n elementos para estimarmos s atravs da seguinte expresso:
*s
t
n = (n1, % )
0
De forma anloga procedemos se desejamos estimar uma proporo populacional com determinada
confiana e dada preciso. No caso de populao suposta infinita, podemos obter:
Z
n =
0
* * (1 )
f(p)=p(1-p)
0,2
0,15
0,1
0,05
0
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
Como podemos notar, f() tem a forma de uma parbola com valor mximo alcanado para =1/2, o
que corresponde a f()=0,25. Assim o valor de n que estamos procurando ser sempre menor ou igual a:
Z
n' =
0
* 0,25
Logo, quando no temos nenhuma informao acerca de f(), devemos tomar n como sendo o
tamanho amostral mnimo necessrio e conseqentemente, estaremos garantindo com este valor um
coeficiente de confiana pelo menos igual ao desejado. (Prof. Miguel A. Uribe Opazo).
71
Se o custo envolvido for elevado e proporcional ao tamanho da amostra, ser mais interessante e
prudente a tomada de uma amostra-piloto.
Quando conhecido o tamanho da populao (N grande) podemos calcular o tamanho da amostra
(n) atravs da forma (Corchan, 1986)
n=
onde:
n*
encontrado por
Z
n =
0
n*
(n 1)
1+ *
N
* * (1 )
ou
Z
n' =
0
* 0,25 .
n=
N * n0
N + n0
onde:
N: tamanho da populao;
n: tamanho da amostra necessria;
2
n0 = (1/0) ;
0: preciso desejada;
Exemplo1: Qual o tamanho da amostra necessria para se estimar a mdia de uma populao infinita
cujo desvio padro igual a 4, com 99% de confiana e preciso de 0,5?
Soluo:
Ao definirmos a preciso da estimativa desejada, estamos estabelecendo o erro mximo que desejamos
cometer, com a confiana dada. Portanto temos:
Z *
n =
0
2,58 * 4
n=
0.5
Exemplo2: Qual o tamanho da amostra suficiente para estimarmos a proporo de indivduos com
uma determinada patologia, adotando-se uma preciso de 0,02 e 95% de confiana, sabendo que
essa proporo seguramente no superior a 0,20?
Soluo:
Z
n =
0
n = 1536,6
* * (1 )
1,96
n=
* 0,20 * (1 0,20 )
0,02
14
72
Os testes de hipteses so baseados nas distribuies dos estimadores. Ento as distribuies para
2
a mdia amostral ( x ), varincia amostral (S ) e a proporo (f) so utilizados para os respectivos testes
2
sobre mdia (), varincia ( ) e proporo () da populao.
14.1 CONCEITOS
Hiptese estatstica: uma suposio quanto ao valor de um parmetro populacional que ser
verificada por um teste paramtrico, ou uma afirmao quanto natureza da populao, que ser
verificada por um teste de aderncia ou no-paramtrico. Aqui, estudar-se-o apenas os testes
paramtricos que so os quais se referem a hipteses sobre os parmetros populacionais.
So exemplos de hipteses estatsticas: a mdia populacional da altura dos brasileiros 1,65m, isto ,
2
=1,65. A varincia populacional do salrio de U$ 100,00, isto , =100 dlares. A proporo de
brasileiros com doena Y 40%, ou seja, p=0,40. A distribuio dos pesos dos alunos da universidade
normal.
Teste de hiptese: uma regra de deciso para aceitar ou rejeitar uma hiptese estatstica com base
nos elementos amostrais;
As hipteses: Designa-se por H0 (hiptese nula) a hiptese a ser testada e por H1 a hiptese
alternativa. A rejeio de H0 implica na aceitao de H1. A hiptese alternativa geralmente representa a
suposio que o pesquisador quer provar, sendo H0 formulada com o propsito de ser rejeitada.
Vejamos alguns exemplos de testes:
Teste Bicaudal (bilateral)
H0: =100
H1: 100
H0: =0,10
H1: 0,10
H0: =100
H1: >100
H0: =100
2
H1: >100
H0: =100
H1: <100
H0: =100
2
H1: <100
Erros Tipo ou de primeira espcie: constitui-se em rejeitar H0 quando ela verdadeira. Designamos
por a probabilidade de se cometer o erro tipo (nvel de significncia do teste )
Erros Tipo ou de segunda espcie: constitui-se em aceitar H0 quando ela falsa. Designamos por
a probabilidade de se cometer erro do tipo ().
O objetivo de se testar uma hiptese proposta tomar uma deciso, se possvel, correta. Assim,
rejeitar H0 implica na aceitao de H1 e aceitar H0 implica na rejeio de H1.
A possibilidade de cometermos os erros Tipo e Tipo baseado em dados amostrais
apresentada na tabela abaixo:
Deciso
Realidade
Aceitar H0
Rejeitar H0
H0 verdadeira
Erro Tipo ()
H0 falsa
Erro Tipo ( )
Observe que o erro Tipo I s poder ser cometido se rejeitarmos H0, e o erro Tipo II, quando se
aceitar H0.
O tomador de deciso deseja, obviamente, reduzir ao mnimo as probabilidades dos dois tipos de
erros. Infelizmente, esta uma tarefa difcil, porque, para uma amostra de determinado tamanho, a
probabilidade de se incorrer em um erro Tipo II aumenta medida que diminui a probabilidade do
erro Tipo I, e vice-versa. A reduo simultnea dos erros poder ser alcanada pelo aumento do
tamanho da amostra.
73
14.3.1
RC
t 2
RA
RA
RC
RC
t 2
(a)
4 passo) Calcular
(b)
t cal =
RA
RC
t
(c)
x 0
s
onde:
x : mdia amostral;
0: valor de H0;
s: desvio padro amostral;
n: tamanho da amostra.
5 passo) Concluses
Se Tcal estiver em RA, aceita-se a hiptese H0, caso contrrio, rejeita-se H0 e aceita-se a hiptese H1.
(a) Se
(b) se t cal
(c) se t cal
Bicaudal
74
Exemplo: Uma mquina foi regulada para fabricar placas em mdia com de 30mm de espessura. A
distribuio das espessuras normal. Iniciada a produo, foi colhido uma amostra de 15 placas,
que forneceu as seguintes de espessura 22,31,31,26,27,22,26,24,21,40,42,30,28,26 e 25mm. Ao nvel
de 5% de significncia, pode-se aceitar a hiptese de que a regulagem da mquina satisfatria, ou
seja de 30mm?
xi = 421 = 28,07
x=
n
15
2
1
(421)2 = 1 * [520,93] = 37,21 ento s = 6,1
n
2
(
xi )
1
2
2
S
=
*
12337
S =
* xi
15 1
15 14
n 1 i =1
n
1 passo:
H0: =30
vs
H1: 30 (a)
teste bicaudal
2 passo:
Graus de liberdade: n-1 15-1=14 gl=14
Nvel de significncia=0,05 =0,05 = 5%
3 passo: busca-se na tabela t Student no eixo horizontal o valor de 5% e no eixo vertical os graus de
liberdade (gl=14). Obtendo-se desta forma o valor de 2,145. Assim teramos:
0,025
0,025
RA
RC
-2,145
0 2,145
t cal =
RC
x 0
s
t cal =
28,07 30
6,10
15
= 1,225
5 passo: Concluso
Como o valor de tcal=-1,225 encontra-se na regio aceitvel (RA), aceita-se a hiptese H0. Assim, a mdia
amostral ( x =28,07mm) estatisticamente igual a mdia populacional (=30mm).
14.3.2
As mesmas idias apresentadas no caso do teste de uma mdia podem ser utilizadas para se
realizarem testes envolvendo a proporo populacional. Assim teremos:
1 passo) Enunciar as hipteses
H0: =0
vs
H1: 0 (a)
H1: >0 (b)
H1: <0 (c)
2 passo)
Fixa-se o nvel de significncia . A varivel usada a normal padronizada Z, em geral quando
n>30.
75
2
RA
RC
Z 2
2
RA
RA
RC
RC
RC
Z 2
(a)
(b)
(c)
4 passo) Calcular
Z cal =
f 0
0 * (1 0 )
n
onde:
n: tamanho da amostra.
f: freqncia relativa evidenciando a proporo existente;
0: valor da hiptese H0;
5 passo) Concluses
Se Zcal estiver em RA, aceita-se a hiptese H0, caso contrrio, rejeita-se H0 e aceita-se a hiptese H1.
(a) Se
(b) se
(c) se
Bicaudal
0,20
1,28
0,005
0,01
2,58
Exemplo: As condies de mortalidade de uma regio so tais que a proporo de nascidos que
sobrevivem at 60 anos de 0,60. Teste a hiptese ao nvel de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes at 60 anos.
1 passo:
H0: =0,60
vs
H1: 0,60 (a)
2 passo:
3 passo: vimos anteriormente no captulo sobre intervalos de confiana que quando se trata da famlia
de distribuio normal reduzida Z, para a proporo da rea do intervalo, teremos para 95% o valor de
1,96. Obtm-se desta forma o valor crtico (RC) de Z Z 0, 05 =1,96.
76
0,025
0,025
RA
RC
RC
-1,96 0 1,96
f = 530
1000
= 0,53 que representa a proporo dos sobreviventes at 60 anos dos 1000 nascimentos
amostrados.
Z cal =
f 0
0 * (1 0 )
Z cal =
n
0,53 0,60
0,60 * (1 0,60)
1000
Z cal = 4,52
5 passo: Concluso
Como o valor de Zcal=-4,52 encontra-se na regio crtica (RC), rejeita-se a hiptese H0. Assim, a proporo
amostral (f=0,53) estatisticamente diferente da proporo populacional (=0,60).
Teste para a igualdade de duas mdias populacionais ()
14.3.3
ou 1-2=d
RA
RC
Z 2
RA
RA
RC
RC
RC
Z 2
(a)
4 passo) Calcular
(b)
Z cal =
(c)
(x1 x2 )
12
n1
onde:
22
n2
77
5 passo) Concluses
Se Zcal estiver em RA, aceita-se a hiptese H0, caso contrrio, rejeita-se H0 e aceita-se a hiptese H1.
(a) Se
(b) se
(c) se
Bicaudal
Exemplo: Um fabricante de pneus faz dois tipos. Para o tipo 1, =2500 milhas, e para o tipo 2,
=3000 milhas. Um txi testou 50 pneus do tipo 1 e 40 do tipo 2, obtendo 24000 milhas e 26000
milhas de durao mdia dos respectivos tipos. Adotando-se um risco =5%, testar a hiptese de
que a vida mdia dos dois tipos a mesma.
1 passo) Enunciar as hipteses:
H0: 1-2=0 1=2
vs
H1: 12 (a) teste bicaudal
0,025
0,025
RA
RC
RC
-1,96 0 1,96
Z cal =
(x1 x 2 )
2
1
n1
2
2
Z cal =
(24000 26000 )
(2500 )2 + (3000 )2
50
n2
Z cal = 3,38
40
5 passo: Concluso
Como o valor calculado de Zcal=-3,38 encontra-se na regio crtica (RC), rejeita-se a hiptese H0. Assim, em
mdia os dois tipos de pneus tm durabilidade diferente.
ou 1-2=d
78
2
RA
RC
2
RA
RC
t 2
RC
t 2
t cal =
RA
RC
(a)
4 passo) Calcular
(b)
( x1 x2 )
n +n
sc * 1 2
n1 * n2
sc =
onde
(c)
onde:
(b) se t cal
(c) se t cal
Bicaudal
Exemplo: Dois conjuntos de 50 crianas de uma escola primria foram ensinados a ler por dois
mtodos diferentes. Aps o trmino do ano, um teste de leitura deu os seguintes resultados: o
conjunto A teve mdia de 73,4 e desvio padro de 8,0 e o conjunto B teve mdia de 70,3 e desvio
padro de 10,0. Adotando =5%, verifique se estatisticamente estas mdias so iguais ou diferentes.
1 passo) Enunciar as hipteses:
H0: 1=2
vs
H1: 12
0,025
0,025
RA
RC
-1,980
RC
0 1,980
sc =
t cal =
(n1 1) * S12 + (n 2 1) * S 22
(n1 + n 2 2)
(x1 x2 )
sc *
n1 + n2
n1 * n2
t =
cal
79
sc =
(73,4 70,3)
9,06 *
50 + 50
50 * 50
(50 1) * 8 2 + (50 1) * 10 2
(50 + 50 2)
s c = 9,06
t cal = 1,71
5 passo: Concluso
Como o valor de tcal=1,71 encontra-se na regio aceitvel (RA), aceita-se a hiptese H0. Assim, em mdia
os dois mtodos de ensino apresentaram comportamento semelhante.
Tabela de distribuio t-Student
BIBLIOGRAFIA:
a
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de Estatstica. 6 ed. So Paulo:Atlas,
1996, 320 p.
COSTA NETO, Pedro Luis de Oliveira. Estatstica. So Paulo:Edgard Blcher, 1977, 264p.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica Aplicada. So Paulo: Saraiva, 1998, 453 p.
a
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatstica Bsica: mtodos quantitativos. 4 ed. So
Paulo:Atual, 1987, 321p.
a
SPIEGEL, Murray R. Estatstica. 3 ed. So Paulo:Makron Books, 1993, 629p.
15
80
ANLISE BIDIMENSIONAL
At agora vimos como organizar e resumir informaes pertinentes a uma nica varivel, mas
freqentemente estamos interessados em analisar o comportamento conjunto de duas ou mais variveis.
Neste sentido, a distribuio conjunta das freqncias ser um poderoso instrumento para ajudar na
compreenso dos dados. Um dos principais objetivos de uma distribuio conjunta descrever a
associabilidade existente entre as variveis, isto , queremos conhecer o grau de dependncia entre
elas, de modo que possamos prever melhor o resultado de uma delas quando conhecemos a realizao da
outra.
Por exemplo, se queremos estimar qual a renda mdia de uma famlia moradora da cidade de
So Paulo, a informao adicional sobre a classe social a que ela pertence permite-nos estimar com maior
preciso essa renda, pois sabemos da dependncia existente entre as duas variveis: renda familiar e
classe social.
15.1 CORRELAO LINEAR DE PEARSON (r) E MODELO DE REGRESSO LINEAR SIMPLES (RLS)
De um modo geral, se existe dependncia entre variveis, sempre interessante quantificar o
grau de dependncia entre estas duas variveis, o que pode ser obtido atravs do coeficiente de
correlao de Pearson.
Quando desejamos ento estudar as relaes existentes entre variveis como peso e altura de
um grupo de pessoas, uso de cigarro e incidncia de cncer, vocabulrio e compreenso da leitura,
dominncia e submisso, estamos procurando verificar se existe alguma relao entre as variveis de
cada um dos pares e qual o grau dessa relao.
Assim, havendo uma relao entre duas variveis de natureza quantitativa, a correlao o
instrumento adequado para descobrir e medir essa relao. Uma vez caracterizada a relao, podemos
ainda descrev-la atravs de uma funo matemtica. Neste sentido, a regresso o instrumento mais
adequado e apropriado para a determinao dos parmetros dessa funo.
Um procedimento bastante til para se verificar a associao entre duas variveis quantitativas, o
grfico de disperso, que nada mais do que a representao dos pares de valores num sistema
cartesiano por meio de uma nuvem de pontos. Na verdade, este diagrama nos fornece uma idia
grosseira, porm til, da correlao existente.
Notas de estatstica
Exemplo: Consideremos uma amostra aleatria de dez de um total de 98 alunos de uma classe da
universidade XYZ e pelas notas obtidas por eles em matemtica e estatstica:
NOTAS
os
N
Diagrama de Disperso entre Matemtica e Estatstica
Matemtica (xi)
Estatstica (yi)
12
01
5,0
6,0
08
8,0
9,0
10
24
7,0
8,0
38
10,0
10,0
8
44
6,0
5,0
6
58
7,0
7,0
59
9,0
8,0
4
72
3,0
4,0
80
8,0
6,0
2
92
2,0
2,0
0
Fonte: CRESPO (1998)
0
10
12
Notas de matemtica
Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal. Podemos imaginar que,
quanto mais fina for a elipse, mais ela se aproximar de uma reta. Dizemos ento, que a correlao tem
como imagem uma reta. Assim uma correlao :
Sem relao entre as variveis se os pontos apresentam-se dispersos, no oferecendo uma imagem
definida.
81
O instrumento que se utiliza para medir esta correlao linear o coeficiente de correlao de
Pearson (r). Este coeficiente deve indicar o grau de intensidade da correlao entre duas variveis, e ainda
o sentido dessa correlao (positivo ou negativo) expresso pela seguinte expresso:
r=
{n * ( x * y )} ( x * y )
{(n * x ) ( x) }* {(n * y ) ( y ) }
2
Matemtica (xi)
5,0
8,0
7,0
10,0
6,0
7,0
9,0
3,0
8,0
2,0
=65
r=
Estatstica (yi)
6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
2,0
=65
xi*yi
30
72
56
100
30
49
72
12
48
4
=473
xi
25
64
49
100
36
49
81
9
64
4
=481
r=
505
585 * 525
yi
36
81
64
100
25
49
64
16
36
4
=475
= 0,9112
Resultado que indica uma correlao linear positiva altamente significativa entre as duas variveis.
A anlise de regresso tem por objetivo descrever atravs de um modelo matemtico, a relao
entre as duas variveis (x e y), partindo de n observaes das mesmas. A varivel sobre a qual desejamos
fazer uma estimativa recebe o nome de varivel dependente (Y) e a outra o nome de varivel
independente (X). A principal funo da anlise de regresso predizer o valor de uma varivel
(dependente) dada uma varivel independente.
82
Y = a + b* X
onde,
Y = varivel dependente;
X = varivel independente;
a = coeficiente linear que representa o ponto onde a reta corta o eixo do Y;
b = coeficiente angular ou coeficiente de regresso. Nos mostra em mdia quanto a varivel
dependente Y varia para o aumento de uma unidade da varivel independente X.
As letras a e b so os parmetros do modelo que so eterminados pelas seguintes expresses:
b=
(n * ( x * y )) ( x * y )
(n * x ) ( x )
a = y bx
onde:
n o n de observaes;
xi
n
yi
n
Como estamos fazendo uso de uma amostra para obtermos os valores dos parmetros, o resultado
na realidade uma estimativa da verdadeira equao de regresso. Assim, escrevemos:
Y = a + (b * X ) +
onde
b=
Como x = 65
10
= 6,5 e
b = 0,863
y = 65 = 6,5
10
Y = 0,888 + 0,863 X
Assim:
R =83,04%
No grfico a seguir podemos visualizar o ajuste da reta aos pontos, a funo de regresso e o
2
coeficiente de determinao (R ).
83
Ttulo do grfico
12
Notas de estatstica
10
8
6
4
2
0
0
10
12
Notas de matemtica
15.2.1
84
3 passo) Com o auxlio da tabela qui-quadrado ( ), determinar as Regies Crticas (RC) e as Regies
Aceitveis (RA) em funo do nvel de ;
2
RA
RC
k21
4 passo) Clculo do valor da varivel;
k
2
=
cal
(Fo
i =1
Fei )
Fei
Se
2
cal
k21 ,
Se
2
cal
< k21 ,
1 passo:
H0: so iguais as quantidades de acidentes nos dias da semana
vs
H1: so diferentes as quantidades de acidentes nos dias da semana
2 passo:
Graus de liberdade: k-1 7-1=6 gl=6 (k=7 sete dias da semana)
Nvel de significncia =0,05 = 5%
3 passo: busca-se na tabela qui-quadrado no eixo horizontal o valor de =5% e no eixo vertical os
2
5%
RA
RC
12,59
62,5% =12,59.
85
Fe =
175
= 25
7
Fo
Fe
33
25
26
25
21
25
22
25
17
25
20
25
36
25
Assim, teremos:
k
2
cal
=
2
cal
=
(Fo
i =1
Fei )
Fei
(33 25)2 + (26 25)2 + (21 25)2 + (22 25)2 + (17 25)2 + (20 25)2 (36 25)2
25
2
cal
= 12,0
5 passo: Concluso
Como
2
2
cal
=12,0 < 6, 5% =12,59 aceita-se H0, logo so iguais as quantidades de acidentes durante os
dias da semana.
15.2.2
Aqui se deseja estudar a associao ou dependncia entre duas variveis. A representao das
freqncias observadas dada por uma tabela de dupla entrada ou tabela de contingncia. Diz-se que X e
Y so independentes se a distribuio conjunta de (X,Y) igual ao produto das distribuies marginais de X
e de Y.
RA
RC
(2L 1)*(C 1)
4 passo) Clculo do valor da varivel;
L
2
cal
=
i =1
(Foi Fei )2
j =1
Fei
Feij =
86
5 passo) Concluso
Se
2
cal
(2L1)*(C 1) , rejeita-se H0, conclui-se com um nvel de significncia de %, que as variveis
Se
2
cal
< (2L 1)*(C 1) , aceita-se H0, ou seja,
(no h correlao).
Exemplo: Deseja-se testar ao nvel de 5% se h dependncia entre as preferncias por sabor da
pasta de dentes e o bairro. Para tanto foram levantados os seguintes dados:
Bairros
Sabor da pasta
Total
A
B
C
limo
70
44
86
200
chocolate
50
30
45
125
hortel
10
6
34
50
outros
20
20
85
125
Total
500
150
100
250
1 passo:
H0: a preferncia pelo sabor independe do bairro (no h correlao)
vs
H1: a preferncia pelo sabor depende do bairro (h correlao)
2 passo:
Graus de liberdade: (L-1)*(C-1) (4-1)*(3-1)=6 gl=6
Nvel de significncia =0,05 = 5%
3 passo: busca-se na tabela qui-quadrado no eixo horizontal o valor de =5% e no eixo vertical os
2
62,5% =12,59.
5%
RA
RC
12,59
Bairros
B(2)
40
25
10
25
A(1)
60
37,5
15
37,5
C(3)
100
62,5
25
62,5
150 * 200
= 60 e assim por diante.
500
Assim,
2
cal
=
(70 60 )2 + (50 37,5)2 + (10 15)2 + (20 37,5)2 + (44 40 )2 + (30 25)2
60
37,5
15
37,5
40
25
(6 10)2 + (20 25)2 + (86 100)2 + (45 62,5)2 + (34 25)2 + (85 62,5)2
10
25
100
62,5
25
62,5
= 37,88
5 passo: Concluso
Como
2
2
cal
=37,88 > 6, 5% =12,59 rejeita-se H0, concluindo-se, ao nvelde 5% de significncia, que h
dependncia entre sabor da pasta de dentes e bairros, ou seja h correlao entre as variveis estudadas.
87
Tabela Qui-Quadrado
Graus de
0,995
0,990
0,975
0,950
Liberdade
0,900
0,750
0,250
0,100
0,050
0,025
0,010
0,005
0,001
0,004
0,016
0,102
1,323
2,706
3,841
5,024
6,635
7,879
0,010
0,020
0,051
0,103
0,211
0,575
2,773
4,605
5,991
7,378
9,210
10,597
0,072
0,115
0,216
0,352
0,584
1,213
4,108
6,251
7,815
9,348
11,345
12,838
0,207
0,297
0,484
0,711
1,064
1,923
5,385
7,779
9,488
11,143
13,277
14,860
0,412
0,554
0,831
1,145
1,610
2,675
6,626
9,236
11,071
12,833
15,086
16,750
0,676
0,872
1,237
1,635
2,204
3,455
7,841
10,645
12,592
14,449
16,812
18,548
0,989
1,239
1,690
2,167
2,833
4,255
9,037
12,017
14,067
16,013
18,475
20,278
1,344
1,646
2,180
2,733
3,490
5,071
10,219
13,362
15,507
17,535
20,090
21,955
1,735
2,088
2,700
3,325
4,168
5,899
11,389
14,684
16,919
19,023
21,666
23,589
10
2,156
2,558
3,247
3,940
4,865
6,737
12,549
15,987
18,307
20,483
23,209
25,188
11
2,603
3,053
3,816
4,575
5,578
7,584
13,701
17,275
19,675
21,920
24,725
26,757
12
3,074
3,571
4,404
5,226
6,304
8,438
14,845
18,549
21,026
23,337
26,217
28,299
29,819
13
3,565
4,107
5,009
5,892
7,042
9,299
15,984
19,812
22,362
24,736
27,688
14
4,075
4,660
5,629
6,571
7,790
10,165
17,117
21,064
23,685
26,119
29,141
31,319
15
4,601
5,229
6,262
7,261
8,547
11,037
18,245
22,307
24,996
27,488
30,578
32,801
16
5,142
5,812
6,908
7,962
9,312
11,912
19,369
23,542
26,296
28,845
32,000
34,267
17
5,697
6,108
7,564
8,672
10,085
12,792
20,489
24,769
27,587
30,191
33,409
35,718
18
6,265
1,015
8,231
9,390
10,865
13,675
21,605
25,989
28,869
31,526
34,805
37,156
19
6,844
7,633
8,907
10,117
11,651
14,562
22,718
27,204
30,144
32,852
36,191
38,582
20
7,434
8,260
9,591
10,851
12,443
15,452
23,828
28,412
31,410
34,170
37,566
39,997
21
8,034
8,897
10,283
11,591
13,240
16,344
24,935
29,615
32,671
35,479
38,932
41,401
22
8,643
9,542
10,982
12,338
14,042
17,240
26,039
30,813
33,924
36,781
40,289
42,796
23
9,260
10,196
11,689
13,091
14,848
18,137
27,141
32,007
35,172
38,076
41,638
44,181
24
9,886
10,856
12,401
13,848
15,659
19,037
28,241
33,196
36,415
39,364
42,980
45,559
25
10,520
11,524
13,120
14,611
16,473
19,939
29,339
34,382
37,652
40,646
44,314
46,928
26
11,160
12,198
13,844
15,379
17,292
20,843
30,435
35,563
38,885
41,923
45,642
48,290
27
11,808
12,879
14,573
16,151
18,114
21,749
31,528
36,741
40,113
43,194
46,963
49,645
28
12,461
13,565
15,308
16,928
18,939
22,657
32,620
37,916
41,337
44,461
48,278
50,993
29
13,121
15,257
16,047
17,708
19,768
23,567
33,711
39,087
42,557
45,722
49,588
52,336
30
13,787
14,954
16,791
18,493
20,599
24,478
34,800
40,256
43,773
46,979
50,892
53,672
88
SUMRIO
1.
2.
3.
4.
5.
6.
7.
8.
9.
89