Beruflich Dokumente
Kultur Dokumente
ESTATSTICA
AUTORIA:
presentao
bjetivo
menta
obre o Autor
UMRIO
UNIDADE 1 ........................................................................................................... 8
Histrico da Estatstica ....................................................................................... 8
UNIDADE 2 ......................................................................................................... 11
Mtodos Estatsticos ........................................................................................ 11
UNIDADE 3 ......................................................................................................... 14
Fases do Mtodo Estatstico ............................................................................ 14
UNIDADE 4 ......................................................................................................... 17
Variveis Estatsticas ....................................................................................... 17
UNIDADE 5 ......................................................................................................... 20
Amostragem ..................................................................................................... 20
UNIDADE 6 ......................................................................................................... 25
Principais tcnicas da Amostragem ................................................................. 25
UNIDADE 7 ......................................................................................................... 29
Sries Estatsticas ............................................................................................ 29
UNIDADE 8 ......................................................................................................... 32
Grficos Estatsticos ........................................................................................ 32
UNIDADE 9 ......................................................................................................... 39
Distribuio de Frequncia .............................................................................. 39
UNIDADE 10 ....................................................................................................... 43
Elementos de uma Distribuio de Frequncia ............................................... 43
UNIDADE 11 ....................................................................................................... 47
Clculo do nmero de classes (k) e intervalo de classes (hi) ......................... 47
UNIDADE 12 ....................................................................................................... 49
Medidas de Posio ......................................................................................... 49
UNIDADE 13 ....................................................................................................... 55
Copyright 2007, ESAB Escola Superior Aberta do Brasil
NIDADE
Histrico da Estatstica
Embora a palavra Estatstica ainda no existisse, h indcios de que desde 3000 A.C. j se
faziam censos na Babilnia, China e Egito.
Desde a Antiguidade, vrios povos j registravam o nmero de habitantes, de nascimentos,
de bitos, faziam estimativas das riquezas individuais e sociais, distribuam equitativamente
terras ao povo, cobravam impostos e realizavam inquritos quantitativos por processos que,
hoje, chamaramos de estatsticas.
A palavra censo deriva do latim censere, que significa taxar.
A palavra estatstica deriva do latim status, que significa estado.
Assim, a Estatstica servia como ferramenta administrativa nas mos do Estado. Na Idade
Mdia colhiam-se informaes, geralmente com a finalidade tributria ou blica.
J a partir do sculo XVI comearam a surgir os primeiros controles sistemticos de fatos
sociais, como nascimentos, batizados, casamentos e funerais, dando origem s primeiras
tbuas e tabelas e aos primeiros nmeros relativos.
Foi no sculo XVIII que os estudos de tais fatos foram adquirindo forma verdadeiramente
cientfica. Godofredo Achenwall batizou a nova cincia (ou mtodo) com o nome de
Estatstica, determinando o seu objetivo e suas relaes com as cincias.
No incio do sculo XIX, os estudos estatsticos ganharam a contribuio de grandes
matemticos. Nos trabalhos de dois deles, o francs Simon Laplace e o alemo Carl
A profisso do Estatstico
O Estatstico promove o levantamento de pesquisas estatsticas em suas aplicaes tcnicas
e cientficas, investigando, elaborando e testando mtodos matemticos e sistema de
amostragem, bem como coletando, analisando e interpretando os dados relacionados com
os fenmenos estatsticos, e ainda estudando e renovando a metodologia estatstica a fim de
estabelecer a sua evoluo e desenvolvimento.
As especializaes da profisso vinculam-se aos campos profissionais que exigem ou
permitem o exerccio do estatstico. Elas resultam da prtica profissional e decorrem quase
sempre da demanda decorrente no mercado de trabalho. So elas:
Demografia
Bioestatstica
Estatstico Matemtico
Estatstico
Estatstico Matemtico
10
NIDADE
Mtodos Estatsticos
O mtodo cientfico
Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, por
necessidades prticas, sem aplicao de um mtodo.
Atualmente, quase todo acrscimo de conhecimento resulta da observao e do estudo.
Embora muito desse conhecimento possa ter sido observado inicialmente por acaso, a
verdade que desenvolvemos processos cientficos para seu estudo e para adquirirmos tais
conhecimentos.
Podemos ento dizer que:
Mtodo um conjunto de meios dispostos convenientemente para se chegar a um fim
que se deseja.
Dos mtodos cientficos, destacaremos o mtodo experimental e o estatstico.
O mtodo experimental
O mtodo experimental consiste em manter constantes todas as causas (fatores), menos
uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso
existam.
o mtodo preferido no estudo da Fsica, da Qumica etc.
11
O Mtodo Estatstico
Muitas vezes temos necessidade de descobrir fatos em um campo em que o mtodo
experimental no se aplica (nas cincias sociais), j que os vrios fatores que afetam o
fenmeno em estudo no podem permanecer constantes enquanto fazemos variar a causa
que, naquele momento, nos interessa.
Como exemplo, podemos citar a determinao das causas que definem o preo de uma
mercadoria. Para aplicarmos o mtodo experimental, teramos de fazer variar a quantidade
da mercadoria e verificar se tal fato iria influenciar seu preo.
Porm, seria necessrio que no houvesse alterao nos outros fatores.
Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salrios, o gosto dos
consumidores deveria permanecer constante, seria necessria a fixao do nvel geral dos
preos das outras necessidades, etc. Mas isso tudo impossvel.
Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos preciso,
denominado mtodo estatstico.
A Estatstica
Exprimindo por meio de nmeros as observaes que se fazem de elementos com, pelo
menos, uma caracterstica comum (por exemplo: os alunos do sexo masculino de uma
comunidade), obtemos os chamados dados referentes a esses elementos.
12
13
NIDADE
1. Coleta de dados
Aps cuidadoso planejamento e a devida determinao das caractersticas mensurveis do
fenmeno que se quer pesquisar, damos incio coleta dos dados numricos necessrios
sua descrio.
A coleta pode ser direta ou indireta.
A coleta direta quando feita sobre elementos informativos de registro obrigatrio
(nascimentos, casamentos e bitos, importao e exportao de mercadorias, etc) ou, ainda,
quando os dados so coletados pelo prprio pesquisador atravs de inquritos e
questionrios, como o caso das notas de verificao e de exames, do censo demogrfico,
etc.
A coleta direta dos dados pode ser classificada relativamente ao fator tempo em:
14
A coleta se diz indireta quando inferida de elementos conhecidos (coleta direta) e/ou do
conhecimento de outros fenmenos relacionados com o fenmeno estudado. Como exemplo,
podemos citar a pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos
por uma coleta direta.
15
16
NIDADE
Variveis Estatsticas
Salrio
Idade
Uma varivel quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites
recebe o nome de varivel contnua; uma varivel que s pode assumir valores pertencentes
a um conjunto enumervel recebe o nome de varivel discreta ou descontnua.
17
Exemplos:
Outros exemplos:
varivel qualitativa
Populao e Amostra
Ao conjunto finito ou infinito de elementos que possuem PELO MENOS UMA caracterstica
comum denominamos populao estatstica ou universo estatstico.
Assim, os jogadores de futebol, por exemplo, constituem uma populao, pois apresentam
pelo menos uma caracterstica comum: so aqueles que jogam futebol.
Entretanto, na maioria das vezes, por impossibilidade ou inviabilidade econmica ou
temporal, limitamos as observaes referentes a uma determinada pesquisa a apenas uma
parte da populao. A essa parte proveniente da populao em estudo denominamos
amostra.
18
Assim, amostra qualquer conjunto finito e no vazio de uma populao, ou seja, uma
subcoleo.
Verificamos, ento, que a Estatstica Indutiva tem por objetivo tirar concluses sobre as
populaes, baseada em resultados verificados nas amostras retiradas destas populaes.
Entretanto, para que as inferncias estejam corretas, necessrio garantir que a amostra
seja representativa da populao, isto , a amostra deve possuir as mesmas caractersticas
bsicas da populao, no que diz respeito ao fenmeno que ser pesquisado. Dessa forma,
necessrio que a amostra a ser usada seja obtida por processos adequados.
19
NIDADE
Amostragem
a tcnica utilizada para recolher amostras, que garante, tanto quanto possvel, o acaso na
escolha.
Dessa forma, cada elemento da populao passa a ter a mesma chance de ser escolhido, o
que garante amostra o carter de representatividade. Isto muito importante pois as
concluses relativas populao vo estar baseadas nos resultados obtidos nas amostras
dessa populao.
Exemplo:
Obter uma amostra representativa de 10% da populao para a pesquisa de salrios dos 90
funcionrios de uma empresa.
20
Procedimentos:
1. Numera-se os funcionrios da empresa de 01 a 90;
2. Escreve-se os nmeros, de 01
colocando-os dentro de uma caixa. Agita-se sempre a caixa para misturar bem os
pedaos de papel e retira-se, um a um, nove nmeros que formaro a amostra, neste
caso, 10% da populao.
Quando o nmero de elementos da amostra grande, esse tipo de sorteio torna-se muito
trabalhoso. A fim de facilit-lo, foi elaborada uma tabela - TABELA DE NMEROS
ALEATRIOS, construda de modo que os dez algarismos (0 a 9) so distribudos ao acaso
nas linhas e colunas.
21
3
1
4
5
9
2
1
0
9
8
4
8
8
7
8
9
0
5
3
9
5
6
7
7
3
6
2
9
9
1
7
5
2
2
3
4
9
9
6
6
3
5
5
4
8
6
2
2
2
1
6
8
4
1
1
1
9
2
1
1
6
0
1
1
7
2
0
2
8
0
9
7
2
6
0
0
9
5
3
2
6
7
1
5
0
0
5
1
6
0
0
5
7
7
1
6
9
8
4
2
6
0
3
5
8
6
2
9
9
9
2
8
2
5
2
1
5
1
4
4
4
6
7
8
1
5
3
6
6
5
0
7
1
6
9
5
5
0
6
6
1
6
2
5
7
3
5
3
2
8
0
1
3
8
4
2
3
0
7
4
7
1
6
5
5
4
2
4
7
0
3
7
6
9
2
8
5
1
1
7
0
5
1
4
2
2
2
9
9
9
9
2
9
8
1
7
6
6
0
0
2
0
8
5
6
8
2
7
3
3
8
5
4
1
8
9
4
4
4
2
8
3
9
4
9
8
8
0
4
3
4
7
3
7
5
5
0
3
6
1
4
6
8
8
4
4
8
2
7
4
9
6
1
6
3
6
9
3
4
3
9
5
6
7
9
4
3
5
1
0
6
4
3
4
4
6
5
9
8
2
0
5
5
2
7
3
2
8
2
0
0
5
7
7
0
1
2
8
7
0
3
5
6
3
3
6
4
8
3
4
4
6
7
3
3
0
3
2
2
8
3
8
0
6
1
8
2
7
0
8
7
2
5
2
9
5
4
2
3
6
6
9
0
3
0
9
9
5
2
6
0
8
2
4
9
9
2
9
5
2
3
0
3
7
3
5
4
9
3
6
4
7
9
8
9
3
0
6
7
0
4
5
2
5
8
4
6
2
5
1
9
1
1
0
6
1
1
5
5
0
9
3
7
5
0
0
4
2
9
5
9
9
8
7
7
5
7
0
7
5
9
0
8
4
0
8
2
9
2
6
6
2
3
4
0
2
3
6
1
9
1
0
3
7
7
5
3
7
2
2
0
9
7
0
1
4
8
5
9
6
3
4
6
8
9
7
4
4
7
4
6
9
0
8
4
6
5
9
7
4
4
1
6
1
1
2
2
9
2
1
5
8
0
7
6
2
4
4
2
6
7
8
5
4
9
8
4
6
1
4
6
8
0
4
2
1
7
9
5
9
1
1
6
7
3
1
4
3
7
4
2
5
0
2
5
8
5
6
8
2
5
7
0
3
3
8
0
3
7
1
9
0
4
7
1
6
3
9
5
2
8
2
5
1
6
2
0
5
8
9
1
6
5
7
0
0
7
0
9
4
2
4
5
6
6
7
2
1
9
9
9
2
8
6
2
1
5
2
1
5
6
8
8
5
3
7
0
7
7
2
6
9
4
2
8
5
6
5
9
8
8
1
6
8
5
7
0
9
6
7
5
9
4
1
0
0
1
6
9
0
6
5
1
4
4
6
7
9
4
2
7
2
6
0
3
0
8
9
9
6
3
0
2
6
8
9
1
7
0
0
6
8
1
8
6
6
4
9
2
2
6
1
1
3
7
3
4
2
7
0
8
7
8
4
6
5
8
0
2
1
6
8
6
1
6
3
1
6
9
4
1
0
3
5
7
9
2
9
9
6
4
4
7
3
6
0
5
6
3
2
5
3
9
7
7
9
2
6
7
8
8
4
6
3
6
7
8
6
9
4
3
7
5
5
1
9
9
7
0
4
4
9
8
2
3
7
7
6
0
1
7
0
2
4
0
3
8
3
6
1
5
9
4
8
5
6
9
5
5
2
8
5
2
6
1
6
2
2
9
0
0
2
1
0
1
3
0
9
6
2
4
0
1
2
4
6
8
1
7
0
0
5
6
9
5
1
4
0
0
9
5
4
8
0
8
8
1
0
3
8
7
1
2
4
8
8
0
9
3
3
9
1
3
9
9
0
7
6
4
0
9
9
6
8
2
3
4
7
4
4
0
2
9
7
2
8
8
4
5
0
5
5
1
1
7
7
3
4
3
0
5
9
5
4
6
3
6
9
1
8
8
9
8
0
6
9
1
4
5
9
1
2
2
6
3
6
5
9
2
6
0
2
6
1
3
8
7
4
5
5
4
0
2
3
9
3
1
0
6
7
5
2
3
0
4
1
2
0
7
5
2
5
3
2
4
4
4
3
4
4
0
0
3
9
2
2
5
6
2
1
7
6
2
9
8
7
3
0
3
8
2
3
5
2
5
9
3
3
4
3
7
8
9
3
6
7
2
6
1
3
3
0
0
6
1
3
4
4
1
9
1
4
9
3
8
6
9
6
9
8
2
6
7
2
9
5
3
6
4
8
0
8
1
8
9
2
0
9
4
0
9
9
7
5
5
0
7
8
9
5
4
9
3
7
2
1
2
6
4
5
3
0
5
1
9
7
1
5
8
9
8
3
2
9
3
8
3
3
6
4
3
3
8
5
2
1
0
4
4
6
8
3
2
1
1
2
8
3
8
5
2
4
8
3
6
6
9
5
1
0
9
4
8
5
2
4
6
7
6
8
1
7
3
4
7
6
2
6
8
4
4
2
3
4
8
3
1
6
5
0
0
6
0
5
3
2
3
8
5
7
5
4
8
2
9
2
5
1
3
5
2
3
6
5
9
1
0
3
9
1
8
1
1
0
2
8
2
8
8
5
4
9
6
3
3
7
7
0
2
7
0
7
4
0
5
0
3
4
4
7
7
2
8
3
0
0
8
3
4
2
3
7
1
9
0
3
2
5
6
1
4
9
4
9
0
7
8
5
9
9
3
4
5
4
8
8
0
4
1
6
2
2
5
9
4
9
0
7
1
3
7
8
4
5
7
8
1
5
1
1
8
1
0
2
1
0
8
7
9
6
6
8
8
6
8
2
5
4
7
4
9
8
7
3
6
0
9
6
6
7
0
3
4
1
1
8
7
4
1
5
6
1
6
8
1
3
2
1
1
3
8
0
6
0
4
8
1
5
4
5
5
7
6
9
9
8
4
5
3
3
2
8
7
6
7
5
4
0
5
0
1
8
3
2
8
2
1
1
0
4
9
9
0
3
8
6
9
5
9
9
5
6
0
9
2
1
7
6
8
9
2
4
5
8
0
4
1
6
7
3
7
6
6
1
3
5
2
8
8
8
5
8
4
3
8
2
9
3
4
9
9
9
6
1
9
8
3
6
5
5
7
7
4
9
4
2
3
1
3
1
1
5
0
0
6
4
5
8
1
0
9
8
4
8
5
7
3
4
0
4
8
7
7
8
7
6
1
1
6
6
8
5
9
2
8
3
2
9
9
1
9
3
9
2
5
5
5
8
1
7
6
8
3
0
3
9
9
2
6
7
3
6
4
9
2
1
1
1
0
5
3
4
4
9
6
3
6
3
9
2
8
7
0
4
6
6
6
1
2
7
7
0
9
9
6
6
3
8
9
3
0
6
8
6
3
3
1
4
0
0
0
3
1
5
6
2
5
4
9
0
6
0
3
7
0
0
1
6
7
5
8
5
4
1
6
6
7
9
1
3
6
2
7
9
9
0
0
5
4
4
5
9
4
9
8
7
5
5
8
0
9
0
7
8
9
7
0
7
0
4
9
9
5
5
0
4
8
5
5
6
5
1
5
0
9
4
0
0
8
3
0
3
5
4
1
8
6
2
8
9
2
8
6
9
5
2
6
8
2
4
8
8
5
5
6
2
2
5
3
3
4
5
0
4
8
8
9
4
6
2
4
6
7
6
7
9
1
2
0
7
4
4
7
8
3
5
6
0
0
4
5
6
0
9
4
4
6
4
8
0
1
4
9
5
2
3
5
9
3
7
1
4
8
3
3
0
6
4
1
9
0
8
8
3
6
1
4
8
0
3
0
2
1
3
9
9
7
2
2
2
2
9
7
3
2
5
0
1
6
0
3
6
8
5
9
5
9
2
7
3
2
1
0
3
1
7
2
2
6
0
0
0
2
9
5
7
8
2
9
8
1
7
0
2
0
5
7
1
4
5
5
9
6
5
7
8
1
3
2
4
2
4
3
5
1
5
3
3
5
0
1
5
9
9
9
6
9
4
2
5
2
3
1
1
4
9
6
5
4
5
4
0
9
5
9
7
3
6
5
0
0
6
8
1
5
9
5
3
2
3
2
7
1
8
0
3
3
9
1
0
7
2
9
5
7
3
2
6
4
2
6
3
3
7
5
8
2
7
8
5
5
0
7
3
1
6
7
5
2
7
3
6
5
3
9
1
9
0
8
4
8
7
6
7
5
8
6
7
2
0
7
4
2
7
8
6
0
3
6
1
8
7
2
8
2
7
9
1
7
4
0
5
5
8
1
7
2
3
4
0
3
7
9
4
6
4
9
6
9
4
1
1
7
7
6
2
2
1
3
8
8
0
2
3
4
1
3
8
3
6
7
4
6
6
0
8
9
1
2
2
6
4
5
8
7
1
7
0
0
8
5
0
0
2
6
1
1
1
7
5
5
7
9
0
7
4
6
5
5
4
8
9
3
3
8
4
0
6
7
6
7
3
6
8
8
4
5
2
9
7
2
2
1
9
3
8
7
2
8
4
5
1
5
5
7
4
0
6
2
7
2
0
9
6
5
1
2
8
8
6
3
8
5
0
3
9
7
1
0
8
6
4
6
1
4
6
7
9
4
1
2
0
9
9
4
8
3
3
1
6
2
7
8
8
1
7
0
7
8
2
4
1
6
3
7
5
1
5
0
5
3
2
6
4
4
4
1
1
3
9
8
3
9
4
8
8
0
0
9
5
2
7
5
4
8
2
1
5
7
0
5
5
6
3
2
5
7
5
9
0
1
8
7
1
1
7
0
6
1
7
7
6
3
0
1
6
6
7
1
5
0
1
5
7
6
1
3
3
4
4
0
7
1
2
0
5
6
3
8
0
9
2
1
6
7
9
5
0
9
4
5
8
0
3
6
7
6
9
8
3
2
3
9
7
1
7
3
1
4
7
9
5
0
6
4
0
2
5
8
0
1
6
6
8
8
0
0
3
3
4
9
7
5
4
0
5
2
7
6
3
3
6
1
4
0
0
0
1
1
8
1
8
8
7
5
7
7
1
0
4
3
1
8
0
0
7
1
3
4
9
8
7
3
2
1
3
7
3
4
8
9
4
0
7
0
9
1
8
5
6
1
7
9
6
2
0
6
7
6
7
8
1
1
8
8
6
8
7
2
9
7
3
6
7
0
4
2
9
9
8
8
7
1
8
4
1
8
5
7
6
8
6
1
1
9
3
5
3
7
1
4
1
2
4
5
3
1
3
2
4
0
9
3
1
2
1
3
9
2
1
3
1
0
9
4
2
5
2
9
4
7
5
7
5
4
6
0
9
0
0
0
5
7
6
5
8
9
5
3
1
1
5
8
3
1
0
2
5
0
8
4
1
2
1
3
4
8
4
4
2
3
1
5
5
9
8
2
0
9
2
6
1
4
2
9
5
2
2
5
1
6
9
6
7
7
7
5
9
8
0
4
6
5
1
5
6
5
2
4
5
0
4
6
5
2
5
4
6
0
1
0
8
5
6
8
4
6
7
9
7
9
0
4
9
7
5
2
0
6
6
4
9
7
2
6
2
4
7
4
4
2
4
6
6
5
6
4
0
9
0
4
3
6
1
4
9
9
2
0
3
2
3
8
6
3
0
6
8
3
1
7
4
1
5
9
1
1
6
3
3
6
5
3
8
3
5
5
0
7
3
4
2
7
4
7
7
0
3
2
4
5
8
5
8
1
8
5
8
9
4
7
1
4
2
2
3
8
4
8
0
8
4
2
4
2
6
4
3
4
4
6
4
5
2
1
3
0
4
7
2
0
3
8
4
4
4
1
4
1
5
2
9
2
2
4
5
7
9
1
9
9
2
8
2
3
3
8
1
7
7
2
3
9
2
2
7
3
0
4
2
5
1
2
0
3
6
6
3
3
6
3
5
9
5
9
0
2
8
0
7
6
0
8
2
4
0
8
4
7
6
3
8
6
9
1
2
3
2
4
2
5
2
7
6
8
8
6
3
5
9
3
8
3
7
4
5
6
8
8
5
4
5
9
5
7
2
6
2
3
7
8
1
7
5
6
0
9
2
3
9
6
4
5
6
3
3
2
2
9
2
4
9
4
9
6
3
3
0
0
9
4
0
3
9
3
2
6
2
4
0
4
8
6
0
8
2
9
1
4
3
5
2
8
6
4
6
9
5
2
9
2
5
7
3
1
9
0
5
9
2
9
2
4
3
2
7
4
7
2
0
3
7
8
1
2
3
5
6
4
4
0
3
5
3
6
3
5
4
5
9
2
2
9
2
4
2
8
1
5
2
9
1
2
1
7
7
8
7
8
22
mais algarismos, conforme nossa necessidade. Os nmeros assim obtidos iro indicar os
elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),
verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou
descendente) ou formando o desenho de uma letra qualquer. A opo, porm, deve ser feita
antes de iniciado o processo.
O primeiro passo definir o critrio da leitura da tabela. Assim, consideremos, por exemplo,
a 6 linha, tomando os nmeros de dois algarismos (tantos algarismos quantos formam o
maior nmero da populao), da esquerda para direita e de cima para baixo, e assim
sucessivamente. Obtivemos ento:
62
18
54
66
06
68
95
66
09
14
97
61
18
54
66
06
68
95
66
09
66
06
68
09
14
61
14
97
61
Ou, reescrevendo:
62
18
54
09
14
18
54
61
62
66
68
Estas foram as pessoas escolhidas para o critrio adotado. Com base na listagem dos
funcionrios, deve- se buscar posteriormente as informaes salariais de cada um. Anota-se,
Copyright 2007, ESAB Escola Superior Aberta do Brasil
23
assim, os salrios das pessoas correspondentes aos nmeros sorteados, obtendo-se uma
amostra de 10% dos salrios dos 90 funcionrios da empresa.
Observe que no houve direcionamento na escolha (aleatoriedade) e todos os 90
funcionrios tiveram a mesma chance de serem escolhidos, garantindo assim, a
representatividade da amostra.
24
NIDADE
Exemplo:
Supondo que no exemplo anterior, dos 90 funcionrios, 54 sejam do sexo masculino e 36
sejam do sexo feminino, vamos obter a amostra proporcional estratificada de 10% da
populao. So, portanto, dois estratos: sexo masculino e sexo feminino.
25
Logo, teremos:
Sexo
Populao
Masculino
54
Feminino
36
TOTAL
90
10%
Amostra
10 54
5,4
100
10 36
3,6
100
10 90
9,0
100
5
4
9
19
19
99
22
18
12
24
86
07
98
71
25
63
65
02
11
15
71
24
04
19
19
99
22
18
12
24
86
07
98
71
25
63
65
02
11
15
71
24
04
26
19
22
18
65
71
86
63
02
=>
=>
12
18
19
63
65
71
86
22
=>
=>
Estas foram as pessoas escolhidas para o critrio adotado em cada estrato. Com base na
listagem dos funcionrios, deve-se buscar posteriormente as informaes salariais de cada
um. Anota-se, assim, os salrios das pessoas correspondentes aos nmeros sorteados em
cada estrato, obtendo-se uma amostra proporcional estratificada de 10% dos salrios dos 90
funcionrios da empresa, separados por sexo. Tambm pode ser verificada a aleatoriedade
na determinao da amostra, o que garante sua representatividade.
3. Amostragem Sistemtica
uma seleo feita por algum critrio preestabelecido, como, por exemplo, intervalos de
tempo para coleta, peas de uma linha de montagem, etc.
Quando os elementos da populao j se acham ordenados, no h necessidade de
construir o sistema de referncia.
27
Exemplos:
Pronturios mdicos de um hospital
Prdios de uma rua
Linhas de produo
Nestes casos, a seleo dos elementos que constituiro a amostra pode ser feita por um
sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemtica.
Assim, no caso de uma linha de produo, podemos, por exemplo, a cada dez itens
produzidos, retirar um para pertencer a uma amostra da produo diria. Neste caso,
estaramos fixando o tamanho da amostra em 10% da populao.
Exemplo:
Suponha-se uma avenida contendo 900 prdios, dos quais desejamos obter uma amostra
formada por cinquenta prdios. Podemos, neste caso, usar o seguinte procedimento: como
900
18
50
, escolhemos por sorteio casual um nmero de 1 a 18 (inclusive), o qual indicaria o
primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente
considerados de 18 em 18. Assim, se o nmero sorteado fosse o 4, tomaramos, pelo lado
direito da rua, o 4 prdio, o 22, o 40, etc. , at voltarmos ao incio da avenida, pelo lado
esquerdo.
28
NIDADE
Sries Estatsticas
Denominamos srie estatstica toda tabela que apresenta a distribuio de um conjunto de
dados estatsticos em funo da poca, do local ou da espcie.
Numa srie estatstica, observamos a existncia de trs elementos ou fatores: o tempo, o
espao e a espcie. Conforme varie um dos elementos da srie, podemos classific-la em
Histrica, Geogrfica, Especfica ou Mista.
29
30
31
NIDADE
Grficos Estatsticos
Clareza => o grfico deve possibilitar uma correta interpretao dos valores
representativos do fenmeno em estudo.
32
Exemplo:
2002
2003
2004
2005
2006
2007
2008
33
Mil Toneladas
1991
1992
1993
1994
1995
1996
1997
34
b. Grfico em Barras
500
1.000
1.500
2.000
2.500
US$ milhes
Observaes:
1. Sempre que as informaes escritas das legendas forem extensas, devemos dar
preferncia ao grfico em barras (sries geogrficas ou especficas). Porm, mesmo
assim for escolhido o grfico em colunas, as informaes das legendas devem ser
dispostas de baixo para cima, jamais o contrrio.
2. A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se
for geogrfica ou categrica.
35
Exemplo:
Importaes
US$ milhes
40.000
30.000
20.000
10.000
0
2000
2001
2002
2003
2004
36
Exemplo:
Vacinao contra doena "X"
Brasil - 2006
Regio
Quantidade
Norte
542.863
Nordeste
947.321
Sudeste
1.589.647
Sul
754.294
Centro-Oeste
349.612
TOTAL
4.183.737
37
13%
18%
Norte
Nordeste
23%
Sudeste
Sul
Centro-Oeste
38%
Observaes:
1. Para uma melhor apresentao e interpretao dos dados, o grfico em setores s
deve ser empregado quando h, no mximo, sete dados.
2. Se a srie j apresenta os dados percentuais, obtemos os respectivos valores em
graus multiplicando o valor do percentual por 3,6.
38
NIDADE
Distribuio de Frequncia
Suponhamos termos feito uma coleta de dados relativos s estaturas de 40 alunos, que
compem uma amostra dos alunos de uma Faculdade brasileira, resultando a seguinte
tabela de valores, dados em centmetros (cm):
166
160
161
150
162
160
165
167
164
160
162
161
168
163
156
173
160
155
164
168
155
152
163
160
155
155
169
151
170
164
154
161
156
172
153
157
156
158
158
161
39
154
155
157
160
161
162
164
166
169
151
155
156
158
160
161
162
164
167
170
152
155
156
158
160
161
163
164
168
172
153
155
156
160
160
161
163
165
168
173
Agora podemos obter com relativa facilidade qual a menor estatura (150 cm) e qual a
maior (173 cm). Podemos tambm determinar qual foi a amplitude de variao (173 - 150 =
23 cm) e, ainda, a ordem que um valor em particular da varivel ocupa no conjunto.
Observamos tambm que h uma concentrao das estaturas em algum valor entre 160 cm
e 165 cm e, mais ainda, existem poucos valores abaixo de 155 cm e acima de 170 cm.
Com base nas informaes anteriores, podemos organizar o que chamamos de Quadro de
Distribuio de Frequncias.
Definindo arbitrariamente, por exemplo, 6 classes, com intervalos de 4 cm, teremos:
ESTATURAS DE 40 ALUNOS
i
1
2
3
4
5
6
Estaturas (cm)
150 154
154 158
158 162
162 166
166 170
170 174
Freqncias (fi)
4
9
11
8
5
3
fi = 40
40
Assim, ao invs de dizermos que a estatura de 1 aluno 154 cm; de 4 alunos de 155 cm;
de 3 alunos de 156 cm; e de 1 aluno de 157 cm, diremos que 9 alunos tm estaturas
entre 154, inclusive, e 158 cm, exclusive. Estaremos desse modo, agrupando os valores da
varivel em intervalos, chamados em Estatstica de classes.
Ao agruparmos os valores da varivel em classes, ganhamos em simplicidade, mas
perdemos em
pormenores.
podemos verificar que 4 alunos tm 161 cm de altura e que no existe nenhum aluno com
171 cm de altura. Entretanto, no quadro acima (dados agrupados) no podemos ver se
algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurana, que 11 alunos
tm a estatura compreendida entre 158 e 162 cm.
O que se pretende com a construo deste quadro realar o que h de essencial nos
dados e, tambm, tornar possvel o uso de tcnicas analticas para sua total descrio.
Recorde que a Estatstica tem por finalidade especfica analisar o conjunto de valores,
desinteressando-se por casos isolados.
A partir do quadro anterior, podemos elaborar um quadro mais completo, pelo qual ser
possvel extrair um maior volume de informaes sobre a varivel em estudo. Este quadro
conhecido na Estatstica como Quadro de Distribuio de Frequncias, conforme abaixo:
QUADRO DE DISTRIBUIO DE FREQUNCIAS
i
1
2
3
4
5
6
Classes (cm)
150 154
154 158
158 162
162 166
166 170
170 174
TOTAL
xi
fi
fri (%)
Fi
Fri (%)
152
156
160
164
168
172
4
9
11
8
5
3
40
10,00
22,50
27,50
20,00
12,50
7,50
100
4
13
24
32
37
40
10,00
32,50
60,00
80,00
92,50
100,00
41
Com este quadro, podemos observar, por exemplo, que existem 27,5% dos alunos com
estaturas entre 158 e 162 cm. Verificamos tambm que existem 80% dos alunos com
estaturas at 166 cm e que existem 33 alunos com estaturas entre 154 e 170 cm. Cada um
dos elementos deste quadro ser detalhado a seguir.
42
NIDADE
10
2. Limites de Classe
Denominamos limites de classe os extremos de cada classe.
O menor nmero o limite inferior da classe ( i ) e o maior nmero, o limite superior da
classe (Li).
43
AT = Lmx - mn
xi
i Li
2
44
fi n
i 1
fri
fi
f
i
fi n
Fi = f1 + f2 + f3 + ... + fk
Fri
Fi
F
i
fi n
45
Antes de dar continuidade aos seus estudos fundamental que voc acesse sua
SALA DE AULA e faa a Atividade 1 no link ATIVIDADES.
46
NIDADE
11
k 1
log n
log 2
resultado
no
for
exato,
iremos
sempre
arredond-lo
para
mais,
47
Assim, temos:
hi
AA
k
Tambm iremos manter o critrio de arredondamento para mais para facilitar nossos
clculos, na medida do possvel.
Para o exemplo das estaturas dos alunos, temos:
n = 40 alunos
k 1
log 40 1,602059991
1 5,321928093 7
log 2
0,301029996
Observe que foi feito um arredondamento matemtico para mais, independente do valor
decimal encontrado.
Para o clculo de hi, temos:
AA = 173 - 150 = 23 cm
hi
AA 23
3,285714286 4
k
7
Observe que tambm foi feito um arredondamento matemtico para mais, independente do
valor decimal encontrado.
Assim, teramos para o exemplo anterior os valores calculados de k = 7 classes e hi = 4 cm.
Conforme foi dito, inicialmente no existia a preocupao em se calcular k, que havia sido
arbitrariamente definido como 6.
Sempre que for solicitada a aplicao da Frmula de Sturges, devero ser considerados k e
hi calculados.
48
NIDADE
12
Medidas de Posio
Mdia Aritmtica;
Mediana;
Moda.
49
A prpria mediana;
Os quartis;
Os decis;
Os percentis.
1. Mdia Aritmtica ( x )
o quociente da diviso da soma dos valores da varivel pela quantidade de variveis.
Para dados no agrupados, temos:
xi
n
x i fi
fi
Sendo:
=>
mdia aritmtica
xi
=>
=>
nmero de valores
fi
=>
50
A mdia utilizada quando desejamos obter a medida de posio que possui maior
estabilidade
2. Moda (Mo)
o valor que ocorre com maior frequncia em uma srie de valores.
Por exemplo, o salrio modal de uma empresa o salrio mais comum, isto , o salrio
recebido pelo maior nmero de empregados desta empresa.
Nos dados no agrupados, podemos encontrar sries que no possuam valor modal (srie
amodal). Em contra-partida, podem haver dois ou mais valores de concentrao de uma
varivel. Nestes casos, a srie chamada de bimodal, trimodal, tetramodal, etc .
Para dados agrupados, a moda o ponto mdio da classe modal, ou seja, da classe de
maior frequncia.
A moda utilizada quando:
3. A mediana ( Md )
definida como o nmero que se encontra no centro de uma srie de nmeros, estando
estes dispostos segundo uma ordem.
o valor situado de tal forma no conjunto de dados que o separa em dois subconjuntos de
mesmo nmero de elementos.
51
fi
imediatamente superior a
dados.
52
Veja o exemplo:
ESTATURAS DE 40 ALUNOS DE UMA FACULDADE
i
1
2
3
4
5
6
Classes (cm)
150 154
154 158
158 162
162 166
166 170
170 174
TOTAL
xi
fi
fri (%)
Fi
Fri (%)
152
156
160
164
168
172
4
9
11
8
5
3
40
10,00
22,50
27,50
20,00
12,50
7,50
100
4
13
24
32
37
40
10,00
32,50
60,00
80,00
92,50
100,00
Classe mediana
Como h 24 valores includos nas trs primeiras classes da distribuio e como pretendemos
determinar o valor que ocupa o 20 lugar, a partir do incio da srie, vemos que este deve
estar localizado na terceira classe (i = 3), supondo que as frequncias destas classes
estejam uniformemente distribudas.
4
4
28
20 13 7
2,54
11
11
11
53
fi
2. Calculamos 2 ;
3. Marcamos a classe correspondente frequncia acumulada imediatamente superior
fi
2 (classe mediana) e, em seguida, empregamos a frmula:
fi
*
F
(
ant
)
2
h
*
Md
f*
Na qual:
54
NIDADE
13
Medidas Separatrizes
Como vimos, a mediana caracteriza uma srie de valores devido sua posio central. No
entanto, ela apresenta outra caracterstica, to importante quanto primeira: ela separa a
srie em dois grupos que apresentam o mesmo nmero de valores.
Assim, alm das medidas de posio que estudamos, h outras que, consideradas
individualmente, no so medidas de tendncia central, mas esto ligadas mediana
relativamente sua segunda caracterstica, j que se baseiam em sua posio na srie.
Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana,
conhecidas pelo nome genrico de medidas separatrizes.
1. Os quartis
Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. H,
portanto, trs quartis:
55
fi
clculo da mediana, bastando substituir, na frmula da mediana, 2 por:
k fi
4
k fi
*
F
(
ant
)
4
h
*
Qk
f*
56
NIDADE
14
Medidas Separatrizes
2. Os decis
Denominamos decis os valores de uma srie que a dividem em dez partes iguais. H,
portanto, dez decis:
57
58
fi
O clculo de um decil segue a mesma tcnica do clculo da mediana, porm a frmula 2
ser substituda por:
k fi
10
k fi
F(ant ) h*
10
Dk *
f*
59
NIDADE
15
Medidas Separatrizes
3. Os percentis
Denominamos percentis os noventa e nove valores que separam uma srie em 100 partes
iguais.
O clculo de um percentil segue a mesma tcnica do clculo da mediana, porm a frmula
fi
2 ser substituda por:
k fi
100
k fi
F(ant ) h*
100
Pk *
f*
60
NIDADE
16
Vimos anteriormente que um conjunto de valores pode ser sintetizado por meio de
procedimentos matemticos em poucos valores representativos: mdia aritmtica, mediana
e moda. Tais valores podem servir de comparao para dar a posio de qualquer elemento
do conjunto.
No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j
convenientemente simplificados, necessrio ter-se uma ideia retrospectiva de como se
apresentavam estes mesmos dados nas tabelas.
Vemos, ento, que a mdia - ainda que considerada como um n que tem a faculdade de
representar uma srie de valores - no pode, por si mesma, destacar o grau de
homogeneidade ou heterogeneidade que existem entre os valores que compem o conjunto.
Consideremos os seguintes conjuntos de valores das variveis X, Y e Z:
X
61
x i 350
70
n
5
;
y i 350
70
n
5
;
z i 350
70
n
5
;
Vemos, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 70.
Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que
todos os valores so iguais mdia.
O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao
entre cada um de seus valores e a mdia representativa.
Chamando de disperso ou variabilidade a maior ou menor diversificao dos valores de
uma varivel em torno de um valor de tendncia central tomado como ponto de comparao,
podemos dizer que o conjunto X apresenta disperso ou variabilidade nula e que o conjunto
Y apresenta uma disperso ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior ou menor
disperso ou variabilidade entre esses valores e a sua medida de posio, a Estatstica
recorre s medidas de disperso ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, a varincia, o desvio padro e o coeficiente
de variao.
62
Amplitude Total
Para dados no agrupados
a diferena entre o maior e o menor valor observado.
AT = x(mx) x(mn)
AT = L(superior) (inferior)
63
NIDADE
17
n
fi
2
Sendo a varincia calculada a partir dos quadrados dos desvios, ela um n em unidade
quadrada em relao varivel em questo, o que, sob o ponto de vista prtico, um
inconveniente.
64
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretao prticas,
denominada desvio padro, definida como a raiz quadrada da varincia e representada por s:
s s2
s
Desvio padro:
2
x i x
n
(Para populao)
Quando nosso interesse no se restringe descrio dos dados, mas, partindo da amostra,
visamos tirar inferncias vlidas para a respectiva populao, convm efetuar uma
modificao, que consiste em utilizarmos o divisor n - 1 no lugar de n.
Assim, teremos:
2
x i x
n 1
s
Desvio padro:
(Para amostra)
2
2
x i .fi n.x
n 1
65
NIDADE
18
O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro de duas
unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 300;
no entanto, se a mdia for igual a 30, o mesmo no pode ser dito.
Alm disso, o fato de o desvio padro ser expresso na mesma unidade de medida dos dados
limita o seu emprego quando desejamos comparar duas ou mais sries de valores,
relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou
variabilidade dos dados em termos relativos a seu valor mdio. Toma-se ento uma medida
relativa da variabilidade, comparando o desvio padro com a mdia. Esta medida o
coeficiente de variao (CV).
CV
s
100
x
J vimos que o desvio padro tem a mesma unidade de medida que os dados, de modo que
o coeficiente de variao adimensional.
A grande utilidade do coeficiente de variao permitir a comparao das variabilidades de
diferentes conjuntos de dados.
66
NIDADE
19
zi
xi x
s
Dessa forma, estamos comparando a nota do aluno com a mdia do grupo, ou seja, estamos
considerando o afastamento da nota em relao mdia, tomando esta como origem. Ao
dividirmos aquela diferena pelo desvio padro s, estamos tomando o desvio padro como
unidade ou padro de medida. Da o nome desvio padro.
67
68
NIDADE
20
Medidas de Assimetria
Voc j ouviu falar dessas medidas ? Sabe como calcul-las? Vamos esto estud-las nesta
unidade.
Chamamos de assimetria o grau de desvio ou afastamento da simetria de uma distribuio
(mdia e moda).
As medidas podem ser simtricas ou assimtricas. Elas so simtricas quando os valores da
Mdia e Moda se coincidem. Quando a mdia menor que a moda, a medida assimtrica
esquerda ou negativa. Quando a mdia maior que a moda, a medida assimtrica
direita ou positiva. Naturalmente, quanto mais prxima de zero for a medida de assimetria,
mais simtrica ser a distribuio.
Os conceitos de assimetria de uma curva de frequncia esto ilustrados nos grficos abaixo:
69
x Mo = 0 =>
x Mo < 0 =>
x Mo > 0 =>
onde:
Mdia
Mo
Moda
Copyright 2007, ESAB Escola Superior Aberta do Brasil
70
Exemplos:
1. Suponhamos os seguintes valores: x = 18 e Mo = 18.
Temos nesse caso uma distribuio simtrica, pois x Mo = 18 18 = 0
2. Suponhamos os seguintes valores: x = 14,3 e Mo = 17.
Temos nesse caso uma distribuio assimtrica negativa, pois x Mo = 14,3 17 =
2,7
3. Suponhamos os seguintes valores: x = 15,1 e Mo = 12.
Temos nesse caso uma distribuio assimtrica positiva, pois x Mo = 15,1 12 =
3,1
As
3 x Md
s
, em que:
As
Mdia
Md
Mediana
Desvio-padro
71
Assim, temos:
As = 0
|As| 1
Exemplos:
1. Considere os valores: x = 10, Md = 10 e s = 4,8. Calcule o coeficiente de assimetria.
As
3 x Md
s
As
3 10 10 3 0
0
4,8
4,8
72
As
3 x Md
s
As
0,5
4,2
4,2
4,2
Como As = 0,5 e 0,15 < |As| < 1, temos neste caso uma assimetria negativa moderada.
As
3 x Md
s
As
1,4
2,1
2,1
2,1
Como As = 1,4 e |As| 1, temos neste caso uma assimetria positiva forte.
Antes de dar continuidade aos seus estudos fundamental que voc acesse sua
SALA DE AULA e faa a Atividade 2 no link ATIVIDADES.
73
NIDADE
21
Medidas de Curtose
Voc j ouviu falar dessas medidas ? Sabe como calcul-las ? Vamos esto estud-las nesta
unidade.
Chamamos de Curtose o grau de achatamento de uma distribuio em relao a uma
distribuio padro, denominada Curva Normal, que uma curva correspondente a uma
distribuio terica de probabilidade.
Quando a distribuio apresentar uma curva de frequncia mais aberta que a normal (ou
mais achatada em sua parte superior), ela receber o nome de Platicrtica.
Se a distribuio em estudo apresentar uma curva de frequncia mais fechada que a normal
(ou mais aguda em sua parte superior), ela receber o nome de Leptocrtica.
A curva normal, que a nossa base referencial, recebe o nome de Mesocrtica.
74
Coeficiente de Curtose
Uma frmula para medir a curtose mediante o clculo do Coeficiente Percentlico de
Curtose, conforme abaixo:
Q 3 Q1
2 P90 P10
onde:
C
Q1
1 Quartil da Distribuio
Q3
3 Quartil da Distribuio
P10
10 Percentil da Distribuio
P90
90 Percentil da Distribuio
75
C = 0,263
=>
Curva Mesocrtica
Se
C < 0,263
=>
Curva Leptocrtica
Se
C > 0,263
=>
Curva Platicrtica
Exemplos:
1. Sabendo que uma distribuio apresenta as seguintes medidas:
Q1
21,84 cm
Q3
45,32 cm
P10
18,69 cm
P90
53,24 cm
Soluo:
Q 3 Q1
2 P90 P10
45,32 21,84
23,48
23,48
0,3398
2 53,24 18,69 2 34,55 69,10
Como 0,3398 > 0,263 , temos uma distribuio Platicrtica em relao normal.
76
R$ 925,36
Q3
R$ 2.043,75
P10
R$ 658,31
P90
R$ 2.983,87
Soluo:
Q 3 Q1
2 P90 P10
2.043,75 925,36
1.118,39
1.118,39
0,2405
2 2.983,87 658,31 2 2.325,56 4.651,12
Como 0,2405 < 0,263 , temos uma distribuio Leptocrtica em relao normal.
77
NIDADE
22
Noes de Probabilidades
Experimento Aleatrio
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmao
provvel que o meu time ganhe a partida de hoje pode resultar:
que empate.
Como vimos, o resultado final depende do acaso. Fenmenos como esses so chamados
fenmenos aleatrios ou experimentos aleatrios.
Experimentos ou fenmenos aleatrios so aqueles que, mesmo repetidos vrias vezes sob
condies semelhantes, apresentam resultados imprevisveis.
Copyright 2007, ESAB Escola Superior Aberta do Brasil
78
Espao Amostral
o conjunto de todos os resultados possveis de um experimento. Vamos represent-lo por
S. Assim, ao lanarmos uma moeda, h dois resultados possveis: ocorrer cara ou ocorrer
coroa. Logo, temos:
S = {CARA , COROA}
79
Eventos
Chamamos de evento qualquer subconjunto do espao amostral S de um experimento
aleatrio, representado por E.
Assim, qualquer que seja E, se E S (E est contido em S), ento E um evento de S.
Se E = S, E chamado evento certo.
Se E S e E um conjunto unitrio, E chamado evento elementar.
Se E = , E chamado evento impossvel.
Exemplo:
No lanamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:
Um evento sempre definido por uma sentena. Assim, os eventos acima podem ser
definidos pelas sentenas:
80
NIDADE
23
Probabilidade
Dado um experimento aleatrio, sendo S o seu espao amostral, vamos admitir que todos os
elementos de S tenham a mesma chance de acontecer, ou seja, que S um conjunto
equiprovvel.
Chamamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:
P(A)
n( A )
n (S)
Onde:
81
P(E)
1
n
n(A
Eventos Complementares
Sabemos que um evento pode ocorrer ou no. Sendo p a probabilidade de que ele ocorra
(sucesso) e q a probabilidade de que ele no ocorra (insucesso), para um mesmo evento
existe sempre a relao:
p q 1 q 1 p
Eventos Independentes
Dizemos que dois eventos so independentes quando a realizao ou a no realizao de
um dos eventos no afeta a probabilidade da realizao do outro e vice-versa.
Por exemplo, quando lanamos dois dados, o resultado obtido em um deles independe do
resultado obtido no outro.
82
p p1 p 2
p p1 p 2
83
NIDADE
24
P( A )
Resposta:
n( A )
1
0,0192308 1,92%
n(S) 52
2. Qual a probabilidade de sair uma dama quando retiramos uma carta de um baralho de 52
cartas ?
Soluo:
Evento A = {sair dama em um baralho de 52 cartas}
P(A) = Probabilidade de ocorrer o Evento A
n(A) = Quantidade de damas existentes no baralho de 52 cartas
Copyright 2007, ESAB Escola Superior Aberta do Brasil
84
P( A )
Resposta:
n( A )
4
0,0769231 7,69%
n(S) 52
O evento obter soma igual a 7 formado pelos elementos (1, 6) , (6, 1) , (2, 5) , (5, 2) ,
(3, 4) , (4, 3). Como o nmero de elementos do Espao Amostral S 36 (pois existem ao
todo 6 x 6 = 36 possveis combinaes no lanamento de dois dados), temos que:
P( A ) =
n( A ) 6
=
16,67%
n(S) 36
Soluo:
85
P( A ) =
n( A ) 5
=
= 0,277777778 27,78 %
n(S) 18
P(B) =
n(B) 13
=
= 0,722222222 72,22 %
n(S ) 18
86
5 2 4 40
5
=
=
5,05%
11 8 9 792 99
4
1
4
1
=
=
0,15%
52 52 2704 676
87
pTotal = p1 x p2
p Total =
1 1
1
=
0,04%
52 51 2652
Observe que, aps a retirada da primeira carta, restam 51 cartas no baralho, uma
vez que a carta retirada no foi reposta, conforme solicita o enunciado da questo.
p2 = { sair 5 }
p3 = { sair 6 }
pTotal = p1 + p2 + p3
p Total =
1 1 1 3
+ + = = 50,00%
6 6 6 6
9. Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho ?
Soluo:
Sair uma figura significa sair rei ou sair dama ou sair valete.
p1 = { sair rei }
4
1
=
52
13
88
p2 = { sair dama }
4
1
=
52
13
p3 = { sair valete }
4
1
=
52
13
Como os trs eventos so mutuamente exclusivos (ou sai rei, ou sai dama ou sai
valete uma opo exclui a outra), temos que:
pTotal = p1 + p2 + p3
p Total =
1
1
1
3
+
+
=
23,08%
13 13 13 13
p Total =
12 3
=
23,08%
52 13
10. Qual a probabilidade de sair uma carta de paus ou de copas quando retiramos uma carta
de um baralho ?
Soluo:
p1 = { sair paus }
13
1
=
52
4
p2 = { sair copas }
13
1
=
52
4
Como os dois eventos so mutuamente exclusivos (ou sai paus ou sai copas uma
opo exclui a outra), temos que:
89
pTotal = p1 + p2
p Total =
1 1 2 1
+ = = = 50,00%
4 4 4 2
Soma igual a 9: Este evento formado pelos elementos (3, 6) , (6, 3) , (4, 5) , (5, 4).
Soma igual a 10: Este evento formado pelos elementos (4, 6) , (6, 4) , (5, 5).
Soma igual a 11: Este evento formado pelos elementos (5, 6) , (6, 5).
Soma igual a 12: Este evento formado pelo nico elemento (6, 6).
4
36
p2 = { sair soma 10 }
3
36
p3 = { sair soma 11 }
2
36
p4 = { sair soma 12 }
1
36
90
Como estes quatro eventos so mutuamente exclusivos (ou sai soma 9, ou soma 10,
ou soma 11 ou soma 12 uma opo exclui a outra), temos que:
pTotal = p1 + p2 + p3 + p4
p Total =
4
3
2
1 10 5
+
+
+
=
=
27,78 %
36 36 36 36 36 18
12. So dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de tirarmos um 4 e um 7, no
necessariamente nesta ordem ?
Soluo:
p1 = { sair quatro }
4
1
=
52
13
p2 = { sair sete }
4
1
=
52
13
p3 = p1 x p2
p3 =
1 1
1
=
13 13 169
p4 = p1 x p2
p4 =
1 1
1
=
13 13 169
91
pTotal = p3 + p4
p Total =
1
1
2
+
=
1,18 %
169 169 169
92
NIDADE
25
Distribuies de Probabilidade
1. Varivel Aleatria
Suponhamos um espao amostral S e que a cada ponto amostral seja atribudo um nmero.
Fica, ento, definida uma funo chamada VARIVEL ALEATRIA, indicada por uma letra
maiscula, sendo seus valores indicados por letras minsculas.
Assim, se o espao amostral relativo ao lanamento simultneo de duas moedas S =
{(Ca,Ca) , (Ca,Co) , (Co,Ca) , (Co,Co)} e se X representa o nmero de caras que
aparecem, a cada ponto amostral podemos associar um nmero para X, de acordo com a
tabela abaixo:
Ponto Amostral
(Ca,Ca)
(Ca,Co)
(Co,Ca)
(Co,Co)
93
2. Distribuio de Probabilidade
Consideremos a distribuio de frequncias relativa ao nmero de acidentes dirios em um
estacionamento:
Nmero de Acidentes
Frequncias
22
TOTAL
30
22
0,73
30
5
0,17
30
2
0,07
30
1
0,03
30
No ocorrer acidente :
Ocorrer um acidente :
94
Podemos escrever:
Nmero de Acidentes
Probabilidades
0,73
0,17
0,07
0,03
Seja X uma varivel aleatria que pode assumir os valores x1, x2, x3, ... , xn. A cada valor xi
correspondem pontos do espao amostral. Associamos, ento, a cada valor xi a
probabilidade pi de ocorrncia de tais pontos no espao amostral.
Assim, temos:
pi 1
Os valores x1, x2, x3, ... , xn e seus respectivos correspondentes p1, p2, p3, ... , pn definem
uma distribuio de probabilidade.
95
P(X)
(Ca,Ca)
1 1 1
x
2 2 4
(Ca,Co)
1 1 1
x
2 2 4
(Co,Ca)
1 1 1
x
2 2 4
(Co,Co)
1 1 1
x
2 2 4
P(X)
1
4
2
4
1
4
1
96
P(x i ) 1 ,
distribuio de probabilidade:
X
P(X)
1
6
1
6
1
6
1
6
1
6
1
6
1
97
NIDADE
26
Distribuio Binomial
O experimento deve ser repetido, nas mesmas condies, um nmero finito de vezes
(n);
(q =
98
n
f ( X) P( X k ) pk qn k
k
Onde:
n
n!
k
o coeficiente binomial de n sobre k, igual a k!( n k )! .
Essa funo, denominada lei binomial, define a distribuio binomial.
n
O termo BINOMIAL possui origem no fato de que k pk . qn-k
o termo geral do
99
NIDADE
27
Distribuio Normal
Curva Normal
Entre as distribuies tericas de varivel aleatria contnua, uma das mais empregadas a
DISTRIBUIO NORMAL.
Muitas variveis analisadas em pesquisas socioeconmicas correspondem distribuio
normal ou dela se aproximam.
O aspecto grfico de uma distribuio normal o da figura abaixo:
100
Escrevemos:
Quando temos uma varivel aleatria com distribuio normal, nosso principal interesse
obter a probabilidade de essa varivel aleatria assumir um valor em um determinado
intervalo.
Seja X a varivel aleatria que representa os dimetros dos parafusos produzidos por certa
mquina. Vamos supor que essa varivel tenha distribuio normal com os seguintes dados:
Mdia
x = 2 cm
Desvio padro
s = 0,04 cm
Copyright 2007, ESAB Escola Superior Aberta do Brasil
101
Vamos determinar a probabilidade de um parafuso ter dimetro com valor entre 2 e 2,05 cm.
Essa probabilidade indicada por: P(2 < X < 2,05) , correspondente rea hachurada na
figura abaixo:
xi x
s
Se X uma varivel aleatria com distribuio normal de mdia x e desvio padro s, ento a
varivel z tem distribuio normal reduzida, isto , tem distribuio normal de mdia 0 e
desvio padro 1, onde z o escore padronizado, calculado da seguinte forma:
xi x
s
102
103
Temos, ento, que se X uma varivel aleatria com distribuio normal de mdia x e
desvio padro s, podemos escrever:
xi x
s .
Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, devemos calcular o valor
de z que corresponde a x = 2,05 (x = 2 z = 0, pois x = 2). Temos, ento:
x i x 2,05 2 0,05
1,25
s
0,04
0,04
Onde:
P(2 < X < 2,05) = P(0 < X < 1,25)
104
105
NIDADE
28
Correlao
106
Onde
Diagrama de Disperso
Consideremos uma amostra aleatria formada por 10 dos 98 alunos de uma determinada
Faculdade A e pelas notas por eles obtidas nas disciplinas de Matemtica e Estatstica.
Vejamos os valores obtidos:
N do
aluno
01
08
24
38
44
58
59
72
80
92
NOTAS
Matemtica (xi) Estatstica (yi)
5,0
6,0
8,0
9,0
7,0
8,0
10,0
10,0
6,0
5,0
7,0
7,0
9,0
8,0
3,0
4,0
8,0
6,0
2,0
2,0
107
108
NIDADE
29
Correlao Linear
Os pontos obtidos anteriormente, vistos em conjunto, formam uma elipse em diagonal.
Podemos imaginar que, quanto mais fina for elipse, mais ela se aproximar de uma reta.
Dizemos, ento, que a correlao de forma elptica tem como imagem uma reta, sendo, por
isso, denominada correlao linear.
possvel verificar que a cada correlao est associada como imagem uma relao
funcional. Por este motivo, as relaes funcionais so chamadas relaes perfeitas.
109
Como a correlao em estudo tem como imagem uma reta ascendente, ela chamada
correlao linear positiva.
110
n x i y i x i y i
n x
2
i
x i n y i2 y i
Para que uma relao possa ser descrita por meio do Coeficiente de Correlao de Pearson
imprescindvel que ela se aproxime de uma funo linear. Uma maneira prtica de
verificarmos a linearidade da relao a inspeo do diagrama de disperso: se a elipse
apresenta salincias ou reentrncias muito acentuadas, provavelmente trata-se de
correlao curvilnea.
Para podermos tirar concluses significativas sobre o comportamento simultneo das
variveis analisadas, necessrio que:
0,6 | r | 1
111
Se 0 < | r | < 0,3 , a correlao muito fraca e praticamente nada podemos concluir
sobre a relao entre as variveis em estudo.
NOTAS
Matemtica (xi) Estatstica (yi)
5,0
6,0
8,0
9,0
7,0
8,0
10,0
10,0
6,0
5,0
7,0
7,0
9,0
8,0
3,0
4,0
8,0
6,0
2,0
2,0
2
e y i . Posteriormente devemos calcular o somatrio de cada coluna.
Assim, teremos:
Matemtica (xi)
5,0
8,0
7,0
10,0
6,0
7,0
9,0
3,0
8,0
2,0
65
Estatstica (yi)
6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
2,0
65
xi . yi
30,0
72,0
56,0
100,0
30,0
49,0
72,0
12,0
48,0
4,0
473
x2i
25,0
64,0
49,0
100,0
36,0
49,0
81,0
9,0
64,0
4,0
481
y2i
36,0
81,0
64,0
100,0
25,0
49,0
64,0
16,0
36,0
4,0
475
112
Calculando r , temos:
n x i y i x i y i
n x
2
i
x i n y i2 y i
10 473 65.65
10 481 65 2 10 475 65 2
4730 4225
585.525
505
307125
505
0,911242136 0,911
307125
O resultado indica uma correlao linear positiva forte, ou seja, aponta uma relao
altamente significativa entre as duas variveis.
113
NIDADE
30
Regresso Linear
Ajustamento da Reta
Sempre que desejamos estudar determinada varivel em funo de outra, fazemos uma
anlise de regresso.
Ela tem por objetivo descrever, atravs de um modelo matemtico, a relao entre duas
variveis, partindo de n observaes das mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel
dependente e a outra recebe o nome de varivel independente.
Assim, supondo X a varivel independente e Y a varivel dependente, vamos determinar o
ajustamento de uma reta relao entre essas variveis, ou seja, vamos obter uma funo
definida por:
Y = a.X + b
n x i y i x i y i
n x i2 x i 2
b y ax
114
Em que:
n o nmero de observaes;
xi
x
n
x a mdia dos valores de xi =>
yi
y
n
y a mdia dos valores de yi =>
Veja o exemplo:
xi
yi
5
6
8
9
7
8
10
10
6
5
7
7
9
8
3
4
8
6
2
2
Diagrama de Disperso
10,0
8,0
6,0
4,0
2,0
0,0
0,0
2,0
4,0
6,0
8,0
10,0
115
Baseado nos dados do problema, vamos determinar a equao de reta de Regresso Linear
calculando os parmetros a e b:
10 473 65.65
10.481 65
0,8632
4810 4225 585
Observe o grfico abaixo que mostra a reta ajustada ao diagrama de notas do exemplo:
10,0
8,0
= 0,8632.X + 0,8889
6,0
4,0
2,0
0,0
-2,0
0,0
2,0
4,0
6,0
8,0
10,0
116
Interpolao e Extrapolao
Observando os dados do exerccio anterior, podemos facilmente verificar que no temos a
nota 4,0 entre as notas de Matemtica.
Entretanto, obtida a equao estimada da reta, podemos estimar a nota correspondente em
Estatstica, fazendo X = 4,0 na equao estimada .
Eis uma das grandes aplicaes da Regresso Linear !!
Assim, temos que:
= 0,8632 X + 0,8889
= 0,8632 . 4,0 + 0,8889
= 4,34
Isso significa dizer que, com base nas notas apresentadas do grupo, por meio da equao da
reta de Regresso Linear, podemos estimar a nota de Estatstica. Uma pessoa que por
ventura tirasse 4,0 em Matemtica, dentro daquele grupo, essa nota estimada seria 4,34.
Como a nota 4,0 pertence ao intervalo de notas de Matemtica do grupo (que vai de 2,0 a
10,0), dizemos que foi feita uma Interpolao.
E qual seria a nota estimada de Estatstica de uma pessoa que tirasse 1,0 em Matemtica?
De forma anloga, podemos tambm fazer uma estimativa para a nota de Estatstica,
fazendo X = 1,0 na equao estimada .
Assim, temos que:
= 0,8632 X + 0,8889
= 0,8632 . 1,0 + 0,8889
= 1,75
117
Isso significa dizer que, com base nas notas apresentadas do grupo, estimamos a nota de
Estatstica como 1,75 para uma pessoa que por ventura tirasse 1,0 em Matemtica, dentro
daquele grupo.
Como a nota 1,0 no pertence ao intervalo de notas de Matemtica do grupo (que vai de 2,0
a 10,0), dizemos que foi feita uma Extrapolao.
Antes iniciar a Avaliao On-line, fundamental que voc acesse sua SALA DE
AULA e faa a Atividade 3 no link ATIVIDADES.
118
LOSSRIO
Caso haja dvidas sobre algum termo ou sigla utilizada, consulte o link Glossrio em sua
sala de aula, no site da ESAB.
119
IBLIOGRAFIA
120