Beruflich Dokumente
Kultur Dokumente
Exemplo:
Fenômeno coletivo: eleição para governador do Estado de Goiás.
População: conjunto de todos os eleitores do estado.
Parâmetro: proporção de votos de um certo candidato X.
Amostra: grupo de 1.000 eleitores selecionados em todo o estado.
Estimador: proporção de votos do candidato X, obtida na amostra.
2
Coleta
POPULAÇÃO AMOSTRA
3
VARIÁVEL é uma característica dos elementos de uma população ou de uma
amostra, que pode assumir diferentes valores, sejam numéricos ou não, e que
interessa ao estudo.
Ordinal
Qualitativa
Nominal
Variável
Discreta
Quantitativa
Contínua
Variável Qualitativa: tipo de variável que não pode ser medida numericamente.
Exemplos: cor dos cabelos, marca de refrigerantes, cor dos olhos, etc.
4
Obs.: a variável idade, apesar de ser representada, geralmente, por números
inteiros, é uma variável contínua, pois está relacionada com o tempo, que é uma
variável contínua.
Coluna Indicadora – parte da tabela que especifica o tipo de informação que cada
linha contém.
a) A chamada deve ser indicada por algarismo arábico, ou por asterisco, entre
parênteses. A chamada deve ser escrita à esquerda da casa, quando feita no
corpo da tabela, e à direita da coluna indicadora, quando feita nessa coluna.
b) Se houver mais de uma chamada na mesma tabela, elas devem ser numeradas
sucessivamente, de cima para baixo e da esquerda para a direita.
5
c) As chamadas são colocadas no rodapé da tabela, em ordem numérica e
separadas por pontos.
d) Quando a tabela ocupa várias páginas, as chamadas devem ser apresentadas na
página em que aparecem.
Exemplo de tabela:
7
Exemplo:
Apresentação do tempo:
• Toda série temporal consecutiva deve ser apresentada, em uma tabela, por seus
períodos inicial e final ligados por um hífen (-).
Exemplos:
1991 – 1995 apresenta dados numéricos para os anos de 1991, 1992, 1993,
1994, 1995;
Out 1991 – Mar 1992 apresenta dados numéricos para os meses de outubro,
novembro e dezembro de 1991 e janeiro, fevereiro e março de 1992.
• Toda série temporal não consecutiva deve ser apresentada, em uma tabela, por
seus períodos inicial e final ligados por barra (/).
Ex: 1991/1995 apresenta dados para os anos entre 1991 e 1995, deixando de
apresentar dados numéricos para algum (ns) dos anos desta série.
Exemplo:
8
Série Categórica: usada para apresentar dados que se distribuem em diferentes
categorias, em determinado tempo e local.
Exemplo:
Avicultura Brasileira
1992
Espécies Número
(1.000 cabeças)
Galinhas 204.160
Galos, frangos, frangas e pintos 435.465
Codornas 2.488
Fonte: IBGE
Exemplo:
Exportação Brasileira
1985/1995
Importadores 1985 1990 1995
América Latina 13,0 13,4 25,6
EUA e Canadá 28,2 26,3 22,2
Europa 33,9 35,2 20,7
Ásia e Oceania 10,9 17,7 15,4
África e Oriente Médio 14,0 8,8 5,5
Fontes: MIC e SECEX
Nota: Valores em percentagem
• O gráfico deve ser simples, claro e deve expressar a verdade sobre o fenômeno
em estudo;
• Todo gráfico deve ter título e escala, para que possa ser interpretado sem que
haja necessidade de esclarecimentos adicionais no texto;
• O título do gráfico pode ser escrito acima ou abaixo do gráfico. O IBGE
escreve o título acima do gráfico;
9
• As variáveis devem ser claramente identificadas;
• A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os
valores iniciais dos dados são muito altos, deve ser feita uma interrupção no
eixo, com indicação clara da posição do zero;
• O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais
leve do que a parte do gráfico que se pretende evidenciar;
• Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o
gráfico é feito dentro de um retângulo.
Tabela 1
PRODUÇÃO BRASILEIRA DE CAFÉ
1991-1995
ANOS PRODUÇÃO (1.000 t)
1991 2.535
1992 2.666
1993 2.122
1994 3.750
1995 2.007
FONTE: IBGE
10
PRODUÇÃO BRASILEIRA DE CAFÉ
1991-1995
4.000
3.500
PRODUÇÃO (1.000t)
3.000
2.500
2.000
1.500
1.000
500
0
1991 1992 1993 1994 1995
ANOS
Exemplo:
11
Tabela 1
PRODUÇÃO BRASILEIRA DE CAFÉ
1991-1995
ANOS PRODUÇÃO (1.000 t)
1991 2.535
1992 2.666
1993 2.122
1994 3.750
1995 2.007
FONTE: IBGE
4.000
3.500
3.000
PRODUÇÃO (1.000t)
2.500
2.000
1.500
1.000
500
0
1991 1992 1993 1994 1995
ANOS
Exemplo:
12
Tabela 2
EXPORTAÇÕES BRASILEIRAS
MARÇO – 1995
ESTADOS VALOR (US$ milhões)
São Paulo 1.344
Minas Gerais 542
Rio Grande do Sul 332
Espírito Santo 285
Paraná 250
Santa Catarina 202
FONTE: SECEX
E X P O R T A Ç Õ E S B R A S IL E IR A S
M A R Ç O - 1995
S a n t a C a t a r in a
P a ra n á
E s p í r it o S a n t o
R io G r a n d e d o S u l
M in a s G e r a is
S ã o P a u lo
0 500 1 .0 0 0 1 .5 0 0
V a lo r ( U S $ m ilh õ e s )
OBSERVAÇÕES:
Exemplo:
13
Tabela 3
BALANÇA COMERCIAL DO BRASIL
1989 – 1993
ESPECIFICAÇÕES VALOR (US$ 1.000.000)
1989 1990 1991 1992 1993
Exportação (FOB) 34.383 31.414 31.620 35.793 38.783
Importação 18.263 20.661 21.041 20.554 25.711
FONTE: Ministério da Fazenda
35.000
30.000
25.000
20.000
15.000
10.000
5.000
0
1989 1990 1991 1992 1993
Exemplo:
14
Tabela 4
REBANHO SUINO DO SUDESTE DO BRASIL
1992
ESTADOS QUANTIDADE (mil cabeças)
Minas Gerais 3.363,7
Espírito Santo 430,4
Rio de Janeiro 308,5
São Paulo 2.035,9
Total 6.138,5
FONTE: IBGE
33%
55%
5%
7%
15
1.6 DISTRIBUIÇÃO DE FREQUÊNCIAS
Freqüentemente, ao coletar dados, o pesquisador se depara com uma grande
massa de valores numéricos, que se repetem algumas vezes, dificultando sua
análise e interpretação. Surge então a necessidade de organizar esses dados em
uma tabela onde os valores observados se apresentam associados individualmente
ou em classes com os números de suas repetições, isto é, com suas respectivas
freqüências. Esta tabela recebe o nome de Distribuição de Freqüências.
Exemplo:
Tabela 1
16
A distribuição de freqüências por classes é uma tabela onde os valores
observados são agrupados em classes, isto é, em intervalos de variações da variável
em questão.
Esse tipo de distribuição é normalmente usado para representar variáveis
contínuas. É utilizada também para representar variáveis discretas em um grande
número de valores observados.
Exemplo:
Tabela 2
Salários dos funcionários da Loja XY
Salários (R$) Nº de funcionários
1000 1200 2
1200 1400 6
1400 1600 10
1600 1800 5
1800 2000 2
Total 25
FONTE: Dados Hipotéticos
Dados Brutos
Exemplo:
O número de peças defeituosas obtidas da produção de uma máquina durante vinte
dias foi:
2–4–2–1–2–3–1–0–5–1–0–1–1–2–0–1–3– 0–1– 2
Rol
Exemplo:
O rol do exemplo anterior é:
0–0–0–0–1–1–1–1–1–1–1–2–2–2–2–2–3–3–4–5
17
Amplitude Total (AT)
Exemplo:
A amplitude total do rol apresentado é: AT = 5 – 0 = 5
Na Tabela 1: F6 = F(5) = 1
Na Tabela 2: F2 = 6
Exemplo:
Dados Brutos:
1–3–0–5–2–1–1–0–0–1–4–3–1–0–1–2–2–1–3–1
Rol:
0–0–0–0–1–1–1–1–1–1–1–1–2–2–2–3–3–3–4–5
18
Tabela 3
Observa-se que neste tipo de tabela não há perda de informação, podendo os dados
originais serem reconstituídos a partir da distribuição elaborada.
Freqüência Total
Fi = n
i =1
19
A freqüência total de uma distribuição de freqüências é igual ao número total de
observações (n).
Exemplo:
Na Tabela 3, temos:
6
Fi = F1 + F2 + F3 + F4 + F5 + F6 = 4 + 8 + 3 + 3 +1+1 = 20
i =1
Simbolizada por fi, a freqüência relativa simples fornece a proporção de cada valor
ou de casos ocorridos em cada classe, em relação ao número total de observações.
Portanto, é um número relativo. Para calcular a freqüência relativa, basta dividir a
freqüência absoluta da ordem em questão pelo número de observações.
Fi
fi =
n
Nota: f i = 1 ou 100%
i =1
Exemplo:
Na Tabela 3, temos:
F1 4
f1 = = = 0,20 × 100 = 20 %
20 20
F2 8
f2 = = = 0,40 × 100 = 40%
20 20
F3 3
f3 = = = 0,15 × 100 = 15 %
20 20
20
F4 3
f4 = = = 0,15 × 100 = 15 %
20 20
F5 1
f5 = = = 0,05 × 100 = 5 %
20 20
F6 1
f6 = = = 0,05 × 100 = 5 %
20 20
Exemplo:
3
Fac3 = Fi = F1 + F2 + F3
i =1
Fac4 = Fi = F1 + F2 + F3 + F4
i =1
Exemplo:
Na tabela 3, temos:
Fac1 = F1 = 4 Fac4 = F1 + F2 + F3 + F4 = 15 + 3 = 18
Fac2 = F1 + F2 = 4 + 8 = 12 Fac5 = F1 + F2 + F3 + F4 + F5 = 18 + 1 = 19
Fac3 = F1 + F2 + F3 = 12 + 3 = 15 Fac6 = F1 + F2 + F3 + F4 + F5 + F6 = 19 + 1 = 20
fac3 = fi = f1 + f2 + f3
i =1
Exemplo:
Na tabela 3, temos:
15
fac3 = = 0,75 = 75 %
20
Tabela 4
Número de Irmãos de 20 alunos da Turma PEST
i xi Fi fi fi (%) Faci faci faci(%)
1 0 4 0,20 20 4 0,20 20
2 1 8 0,40 40 12 0,40 40
3 2 3 0,15 15 15 0,75 75
4 3 3 0,15 15 15 0,90 90
5 4 1 0,05 5 5 0,95 95
6 5 1 0,05 5 5 1,00 100
Total 20 1,00 100 − − −
FONTE: Dados Fictícios
22
Interpretação:
Fi
8
4
3
1
0 1 2 3 4 5 xi (numero de irmãos)
EXERCÍCIOS
Preços do Produto A
i Preço (R$) Número de Lojas
1 50 2
2 51 5
3 52 6
4 53 6
5 54 1
Total 20
FONTE: Dados Fictícios
23
a) Quantas lojas apresentam preços de R$ 52,00?
b) Determine as freqüências relativas simples e as freqüências absolutas
acumuladas.
c) Quantas lojas apresentaram um preço de até R$ 52,00 (inclusive)?
d) Qual é a percentagem de lojas com preços de até R$ 53,00 (inclusive)?
5 – 20 – 10 – 5 – 40 – 30 – 20 – 5 – 10 – 15 – 10 – 30 – 40 – 10 – 50 – 10 –
30 – 15 − 20 – 40 – 10 – 20 – 20 – 50 – 10 – 40 – 30 – 20 – 0 – 30
24
4. Dada a distribuição de freqüências:
1 3 5 7 9 2 4 6 8 10 15 20 25
0 1 2 3 4 5 6 7 8 9 9 8 7
8 6 5 4 3 2 1 0 10 15 20 25 12
8 11 6 4 2 1 3 5 7 9 11
25
1.7 Intervalo de Classe ou Classe
Uma determinada classe pode ser identificada por seus extremos ou pela ordem em
que ela se encontra na tabela (valor do índice i)
São os valores extremos de cada classe. O menor valor denomina-se limite inferior
da classe i (li) e o maior, limite superior da classe i (Li).
hi = Li − li
Exemplo:
Na Tabela 2, temos:
h1 = 1200 – 1000 = 200
h2 = 1400 – 1200 = 200
26
Em geral h1 = h2 = h3 = ... = h k = h, e determina-se a amplitude do intervalo
fazendo:
AT
h=
k
64
Exemplo: Dados: AT = 64 e k = 7. Temos: h = = 9,14 ≈ 10
7
Não existe uma regra fixa que forneça o número de classes. No entanto, como o
objetivo da distribuição de freqüências é facilitar a compreensão dos dados, é
importante que a distribuição contenha um número adequado de classes. Se este
número for escasso, os dados originais ficarão tão comprimidos que pouca
informação poderá ser extraída da tabela. Se por outro lado forem utilizadas várias
classes, haverá algumas com freqüências nulas ou muito pequenas e o resultado
será uma distribuição irregular e prejudicial à interpretação do fenômeno como um
todo. Na prática esse número não deve ser superior a 20 nem inferior a 5. Se a
quantidade de dados for pequena não se justifica a construção de uma tabela, e se
for grande, mais de 20 classes dificulta a análise.
k=5 para n ≤ 25
k = n para n > 25, onde n é o número de observações.
Exemplo:
Para n = 30, o número de classes será 30 = 5,48 ≈ 5.
b) Regra de Sturges
k = 1 + 3,3 log n,
Exemplo:
27
Para n = 30 os resultados obtidos pelos dois critérios são bastante próximos. O
mesmo não acontece para valores grandes de n onde a regra de Sturges tem o
inconveniente de prever um número relativamente pequeno de classes e o
procedimento da raiz quadrada, um número relativamente grande. Neste caso deve
prevalecer o bom senso do analista.
li + L i
O ponto médio de uma classe i é definido por: x i =
2
Muitas vezes ao efetuar esta divisão, pode-se chegar a um resultado não muito
conveniente sob o aspecto de montagens das classes. Neste caso sugere-se que o
28
valor encontrado seja aproximado para o maior inteiro, caso contrário algum dado
excederia o limite superior da última classe prevista.
Exemplo:
33 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
a) Amplitude Total: AT = 97 – 33 = 64
A T 64
c) Amplitude das Classes (h): h = = = 9,14 ≅ 10 (aproximar para o maior
k 7
inteiro)
29
Notas de 50 alunos
Classes Notas Fi fi fi(%) Faci faci faci(%) xi
1 30 |--- 40 4 0,08 8 4 0,08 8 35
2 40 |--- 50 6 0,12 12 10 0,20 20 45
3 50 |--- 60 8 0,16 16 18 0,36 36 55
4 60 |--- 70 13 0,26 26 31 0,62 62 65
5 70 |--- 80 9 0,18 18 40 0,80 80 75
6 80 |--- 90 7 0,14 14 47 0,94 94 85
7 90 |--- 100 3 0,06 6 50 1,00 100 95
Total 50 1,00 100 − − − −
FONTE: Dados Hipotéticos
Interpretação:
Exemplo:
Tabela 5
30
1.9 Gráficos de uma Distribuição de Freqüências por Classes
1. Histograma
2. Polígono de Freqüências
Exemplo:
Dada a distribuição de freqüências:
Notas dos alunos da turma PEST
Notas Fi Fac Fi xi
30 |--- 40 4 4 0,08 35
40 |--- 50 6 10 0,12 45
50 |--- 60 8 18 0,16 55
60 |--- 70 13 31 0,26 65
70 |--- 80 9 40 0,18 75
80 |--- 90 7 47 0,14 85
90 |--- 100 3 50 0,06 95
Total 50 − 1,00 −
31
Os gráficos representativos dessa distribuição são:
HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS
Fi
13 Polígono de
freqüência
9
8
7
6
4
3
30 40 50 60 70 80 90 100 classe
Fac
50
47
40
31
18
10
30 40 50 60 70 80 90 100 classe
EXERCÍCIOS
i Classes xi Fi Faci fi
1 0 |--- 2 1 4 0,04
2 2 |--- 4 8
3 4 |--- 6 5 30 0,18
4 |--- 7 27 0,27
5 8 |--- 10 15 72
6 10 |--- 12 83
7 |--- 13 10 93 0,10
8 14 |--- 16 0,07
− Total −
33
4. A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400
lotes:
69 57 72 54 93 68 72 58 64 62
65 76 60 49 74 59 66 83 70 45
60 81 71 67 63 64 53 73 81 50
67 68 53 53 65 58 80 60 63 53
142 – 178 – 164 – 190 – 146 – 131 – 119 – 131 – 187 – 158 – 168 – 111 –
96 – 118 – 182 – 116 – 188 – 207 – 229 – 180 – 181 – 175 – 205 – 179 –
184 – 227 – 210 – 210 – 213 – 190 – 240 – 215 – 226 – 188 – 190 – 205 –
8. Dada a amostra:
28 33 27 30 31 30 33 30 33 29
27 33 31 27 31 28 27 29 31 24
31 33 30 32 30 33 27 33 31 33
23 29 30 24 28 34 39 30 18 17
18 15 16 17 17 18 19 19 20 29
Nº de casas 12 18 20 10 5
35
e) O número de aluguéis cujo valor é superior ou igual a R$ 750,00.
f) A classe do 50º aluguel.
36
2. MEDIDAS DE POSIÇÃO
Sejam x1, x2, ..., xn, n valores da variável X. A média aritmética simples, denotada
por x , é definida por:
n
xi
x= i =1
,
n
Exemplo:
Determinar a média aritmética simples dos valores: 7,0; 3,0; 5,5; 6,5; 8,0.
5
xi
7,0 + 3,0 + 5,5 + 6,5 + 8,0
x= i =1
= = 6,0
5 5
37
b) Média aritmética para dados agrupados
Neste caso, usamos a média aritmética dos valores x1, x2, ..., xk, ponderada pelas
suas respectivas freqüências absolutas F1, F2, F3, ... , Fk. Desta forma, temos:
k
x i Fi
x= i =1
,
n
k
onde n = F1 + F2 + ... + Fk = Fi
i =1
Exemplos:
Solução:
38
TOTAL 20 32
Fonte: Dados Hipotéticos
k 6
x i Fi x i Fi
32
x= i =1
= i =1
= = 1,6
n 20 20
2. Dada a distribuição:
Solução:
Acrescentamos as colunas com os cálculos de xi e xiFi ,
e utilizamos a fórmula:
k 5
x i Fi x i Fi
268
x= i =1
= i =1
= = 6,7
n 40 40
39
Assim, cada família possui, em média, uma renda de R$6.700,00.
Sejam x1, x2, ..., xn, n valores da variável X. A média geométrica, denotada por
Mg, é definida por:
Mg = n x1 ⋅ x 2 ⋅ x 3 ⋅ ... ⋅ x n
Exemplo:
Mg = 5 3 × 6 × 12 × 24 × 48 = 5 248.832 = 12
Sejam x1, x2, ..., xk, valores da variável X associados às freqüências absolutas F1,
F2, F3, ... , Fk, respectivamente. A média geométrica, denotada por Mg, é definida
por:
Mg = n x1F ⋅ x 2 F ⋅ x 3 F ⋅ ... ⋅ x k F
1 2 3 k
Exemplo:
xi 1 2 3 5
Fi 8 6 5 3
40
Mg = 22 18 × 26 × 35 × 53 = 1,9311
1
F1 . log x1 + F2 . log x 2 + ... + Fk . log x k
log Mg = log ( x1F × x F2 × x 3F × ... × x Fk
1 2 3 k
) n
=
n
Sejam x1, x2, ..., xn, n valores da variável X. A média harmônica, denotada por Mh,
é definida por:
41
n
Mh =
1 1 1 1
+ + + ... +
x1 x 2 x 3 xn
Sejam x1, x2, ..., xk, valores da variável X associados às freqüências absolutas
F1, F2, F3, ... , Fk, respectivamente. A média harmônica de X, denotada por Mh, é
definida por:
n n
Mh = =
F1 F2 F3 F k
Fi
+ + + ... + k
x1 x 2 x 3 xk i =1 xi
A média harmônica poderá ser empregada, por exemplo, no caso dos preços
unitários de certas mercadorias que são inversamente proporcionais às quantidades
de lotes, se o preço total de cada lote tiver o mesmo custo. O preço médio unitário
deverá ser igual à média harmônica dos demais preços.
EXERCÍCIOS:
b)
Aluguel 1,5 |--- 3,5 3,5 |--- 5,5 5,5 |--- 7,5 7,5 |--- 9,5 9,5 |---
(R$1.000) 11,5
Nº DE IMÓVEIS 12 18 20 10 5
xi Fi
2 1
3 4
4 3
5 2
TOTAL
43
2.1.4 MEDIANA (Md)
A mediana, denotada por Md, é o valor que divide o rol em duas partes
contendo, cada uma, a mesma quantidade de elementos. Assim, a mediana é o
valor que ocupa a posição central de uma série de dados.
50% 50%
Md
n +1
i) Se n é ímpar – o rol admite apenas um termo central que ocupa a posição .
2
Interpretação: 50% dos valores da série são menores ou iguais a 12 e 50% dos
valores são maiores ou iguais a 12.
ii) Se n é par – neste caso o rol admite dois termos centrais que ocupam as
n n
posições e + 1 .
2 2
Neste caso a mediana é definida como a média aritmética destes dois termos
centrais.
Interpretação: 50% dos valores do rol são menores ou iguais a 11,5 e 50% dos
valores são maiores ou iguais a 11,5.
Exemplo 1:
i xi Fi Faci
1 2 1 1
2 5 4 5
3 8 10 15
4 10 6 21
5 12 2 23
TOTAL 23 −
n = 23 (n é ímpar)
23 + 1
A distribuição admite apenas um termo central que ocupa a posição , ou
2
seja, a 12ª posição.
45
Exemplo 2: Determinar a mediana da distribuição
i xi Fi Faci
1 0 3 3
2 1 5 8
3 2 8 16
4 3 10 26
5 5 6 32
TOTAL 32 −
n = 32 (n é par).
32 32
A série admite dois termos centrais que ocupam as posições e + 1 , ou seja,
2 2
o 16º e o 17º elementos.
Observando as freqüências acumuladas, temos:
O 1º, o 2º e o 3º elementos são iguais a 0;
O 4º, o 5º, o 6º, o 7º e o 8º são iguais a 1;
O 9º, o 10º, ... , o 16º são iguais a 2;
O 17º, o 18º, ... , o 26º são iguais a 3;
O 27º, o 28º, ..., o 32º são iguais a 5.
n
• Calcula-se , independente de n ser par ou ímpar;
2
• Localiza-se, através das freqüências acumuladas, a classe mediana, ou seja, a
n
classe que contém o termo de ordem ;
2
• Aplica-se a fórmula:
n
− Facant
Md = l Md + 2 ×h,
FMd
onde:
lMd = limite inferior da classe mediana;
Facant = freqüência acumulada da classe anterior à classe mediana;
h = amplitude da classe mediana;
FMd = freqüência absoluta da classe mediana.
46
Exemplo 1
i Altura(cm) Fi Faci
1 150 |--- 154 4 4
2 154 |--- 158 9 13
3 158 |--- 162 11 24 → classe mediana
4 162 |--- 166 8 32
5 166 |--- 170 5 37
6 170 |--- 174 3 40
TOTAL 40 −
n 40
• Calcula-se → = 20
2 2
n
• Localiza-se a classe mediana (a classe que contém o termo de ordem )
2
Classe mediana = 3ª classe
n
− Facant
• Aplica-se a fórmula: Md = l Md + 2 ×h
FMd
lMd = 158
20 − 13
Facant= 13 Md = 158 + × 4 = 160,55
11
h=4
FMd = 11
47
n 50
• Calcula-se → = 25
2 2
n
• Localiza-se a classe mediana (a classe que contém o termo de ordem )
2
Classe mediana = 4ª classe
n
− Facant
• Aplica-se a fórmula: Md = l Md + 2 ×h
FMd
lMd = 60
25 − 18
Facant= 18 Md = 60 + × 10 = 65,38
13
h = 10
FMd = 13
EXERCÍCIOS:
b)
xi 73 75 77 79 81
Fi 2 10 12 5 2
c)
d)
Classes 22 |-- 25 25 |-- 28 28 |-- 31 31 |-- 34
- - - -
Fi 3 5 8 6
48
2.1.5 MODA (Mo)
A moda é o valor mais freqüente do conjunto de dados observados.
Para determinar a moda, basta identificar o(s) elemento(s) que mais se repete(m).
a) 2; 8; 3; 5; 4; 5; 3; 5; 1
O elemento que mais se repete é o 5. Portanto: Mo = 5 (seqüência unimodal).
b) 6; 10; 5; 6; 10; 2
Neste conjunto de dados o elemento 6 e o elemento 10 se repetem mais vezes
que os demais. Portanto: Mo1 = 6 e Mo2 = 10 (seqüência bimodal).
c) 2; 2; 8; 8; 5; 5; 6; 6
Não há nenhum elemento que se destaque por possuir maior freqüência.
Portanto, a série não possui moda e é dita amodal.
i xi Fi
1 0 2
2 2 5
3 3 8
4 4 3
5 5 1
Total
Mo = 3 (Distribuição Unimodal)
49
b)
i xi Fi
1 1 2
2 2 5
3 3 4
4 4 5
5 5 1
Total
c)
i xi Fi
1 4 5
2 5 5
3 8 5
4 10 5
Total
i) Fórmula de Czuber
onde:
lMo = limite inferior da classe modal.
∆1 = diferença entre a freqüência absoluta da classe modal e a freqüência
absoluta da classe anterior à classe modal.
∆2 = diferença entre a freqüência absoluta da classe modal e a freqüência
absoluta da classe posterior à classe modal.
h = amplitude da classe modal.
50
Exemplo 1
i classes Fi
1 0 |--- 1 3
2 1 |--- 2 10
3 2 |--- 3 17 → Classe Modal
4 3 |--- 4 8
5 4 |--- 5 5
TOTAL 43
Como as amplitudes das classes não são iguais, vamos utilizar as densidades das
F
classes i para identificar a classe modal (aquela com a maior densidade)
hi
51
Salários dos Empregados da Empresa PEST
Classes Salários xi Fi Fi/hi
(classes) (pto médio) (nº funcionários) (densidade)
1 800 |- 1800 1300 70 0,07
2 1800 |- 2500 2150 140 0,20
3 2500 |- 3000 2750 140 0.28
4 3000 |- 5000 4000 60 0,03
Total 410
Fonte: Dados Hipotéticos
Mo ≅ 3Md − 2x
52
EXERCÍCIOS:
b)
Classes 7 |--- 10 10 |--- 13 13 |--- 16 16 |--- 19 19 |--- 22
Fi 6 10 15 10 5
3. MEDIDAS SEPARATRIZES
São elas:
• Mediana
• Quartis
São valores que dividem o rol em quatro partes iguais, cada uma com 25% dos
elementos. Ao todo tem-se 3 quartis: Q1 (1º quartil), Q2 (2º quartil) e Q3 (3º
quartil).
Observe que:
o Abaixo do 1º quartil tem-se 25% dos elementos;
o Abaixo do 2º quartil tem-se 50% dos elementos;
o Abaixo do 3º quartil tem-se 75% dos elementos;
• Decis
São valores que dividem o rol em dez partes iguais, cada uma com 10% dos
elementos. Ao todo tem-se 9 decis: D1 (1º decil), D2 (2º decil), ... , D9 (9º decil).
53
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
Observe que:
• Centis ou Percentis
Dividem o rol em cem partes iguais, cada uma com 1% dos elementos. Ao todo
tem-se 99 centis: P1 (1º centil), P2 (2º centil), ... , P99 (99º centil).
Observe que:
i⋅n
Quartil i: pos = ,i = 1, 2,3
4
i⋅n
Decil i: pos = ,i = 1, 2,...,9
10
i⋅n
Centil i: pos = ,i = 1,2,...,99
100
54
Observe que:
Exemplos:
1. Calcule o primeiro quartil da seqüência: 2, 5, 8, 5, 5, 10, 1, 12, 12, 11, 13, 15.
i ⋅ n 1 ⋅ 12
pos = = =3
4 4
Logo, Q1= x3 = 5.
i ⋅ n 60 ⋅ 8
pos = = = 4,8
100 100
Como este valor não é inteiro, o P60 é um valor situado entre o 4º e o 5º elemento
x + x 5 7,5 + 8
da seqüência. Logo, P60 = 4 = = 7,75
2 2
Exemplo:
55
i xi Fi Faci
1 2 3 3
2 4 5 8
3 5 8 16
4 7 6 22
5 10 2 24
Total 24 −
i ⋅ n 4 ⋅ 24
pos = = = 9,6
10 10
Como este valor não é inteiro, o D4 é um valor situado entre o 9º e o 10º elemento
da distribuição.
x + x10 5 + 5
Logo, D 4 = 9 = =5
2 2
pos − Facant
Sep = l + ×h,
F
onde:
Cálculo do 1º quartil:
n 40
• Calcula-se pos = → = 10
4 4
• Localiza-se a classe que contém o 10º termo (2ª classe)
pos − Facant
• Aplica-se a fórmula: Q1 = lQ + ×h
1
FQ 1
l Q1 = 154
10 − 4
Facant= 4 Q1 = 154 + × 4 = 156,67
9
h=4
FQ1 = 9
Cálculo do 4º decil:
4⋅n 4 ⋅ 40
• Calcula-se pos = → = 16
10 10
• Localiza-se a classe que contém o 16º termo (3ª classe)
pos − Facant
• Aplica-se a fórmula: D 4 = l D + ×h
4
FD 4
l D = 158
4
16 − 13
Facant= 13 D 4 = 158 + × 4 = 159,09
11
h = 4 e FD 4 = 11
57
Interpretação: 40% das pessoas têm altura inferior a 159,09 cm.
70 ⋅ n 70 ⋅ 40
• Calcula-se pos = → = 28
100 100
• Localiza-se a classe que contém o 28º termo (4ª classe)
pos − Facant
• Aplica-se a fórmula: C70 = lC + ×h
70
FC 70
lC = 162
70
28 − 24
Facant= 24 C70 = 162 + × 4 = 164
8
h=4
FC = 8
70
EXERCÍCIOS:
1. Para a distribuição:
58
Vendas (R$) Nº DE VENDEDORES
0 |---- 10.000 1
10.000 |---- 20.000 12
20.000 |---- 30.000 27
30.000 |---- 40.000 31
40.000 |---- 50.000 10
Total
59
4. MEDIDAS DE DISPERSÃO, MEDIDAS DE
ASSIMETRIA E MEDIDAS DE CURTOSE
Se observarmos as seqüências
concluiremos que todas possuem a mesma média 13. No entanto, são seqüências
completamente distintas do ponto de vista da variabilidade de dados.
60
Portanto, para qualificar os valores de uma dada variável, ressaltando a maior
ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição,
a Estatística recorre às medidas de dispersão.
Exemplo: Determine a amplitude total da seqüência: 11, 12, 9, 10, 10, 15.
Quando dizemos que a amplitude total dos valores é 10, estamos afirmando
alguma coisa do grau de sua concentração. É evidente que, quanto maior a
amplitude total, maior a dispersão ou variabilidade dos valores da variável.
Desde que se deseja medir a dispersão dos dados em relação à média parece
interessante fazermos a análise dos desvios em torno da média: di = (xi − x ).
62
Mas a soma de todos os desvios é igual a zero, Isto é: di = (x i − x) = 0 .
Veja que os desvios foram considerados em módulo, evitando-se assim que a soma
fosse nula.
xi 2+8+5+6
x= = = 5,25 .
n 4
x1 − x = 2 − 5,25 = 3,25
x 2 − x = 8 − 5, 25 = 2,75
x 3 − x = 5 − 5, 25 = 0,25
x 4 − x = 6 − 5, 25 = 0,25
3, 25 + 2,75 + 0, 25 + 0,75 7
DM = = = 1,75 .
4 4
63
Interpretação: Em média, cada elemento da seqüência está afastado do valor 5,25
por 1,75 unidades.
i xi Fi
1 1 2
2 3 5
3 4 2
4 5 1
TOTAL 10
x i Fi x i − x Fi
Solução: A média da série é: x = e o DM é dado por D M = .
n n
xi Fi x iF i x i − x ⋅ Fi
1 2 2 4
3 5 15 0
4 2 8 2
5 1 5 2
TOTAL 10 30 8
Logo, a média é
x i Fi 30
x= = =3
n 10
e o desvio médio é
64
x i − x Fi 8
DM = = = 0,8 .
n 10
Interpretação: Em média, cada elemento da série está afastado do valor 3 por 0,8
unidades.
x i − x ⋅ Fi
DM = ,
n
onde xi é o ponto médio da classe i.
i classes Fi
1 2 |--- 4 5
2 4 |--- 6 10
3 6 |--- 8 4
4 8 |--- 10 1
TOTAL 20
i classes Fi xi x i Fi x i − x Fi
1 2 |--- 4 5 3 15 10,5
2 4 |--- 6 10 5 50 1,0
3 6 |--- 8 4 7 28 7,6
4 8 |--- 10 1 9 9 3,9
TOTAL 20 − 102 23,0
x i Fi 102
A média da série é: x = = = 5,1 .
n 20
65
x i − x Fi 23
O desvio médio é: D M = = = 1,15 .
n 20
Interpretação: Em média, cada elemento da série está afastado de 5,1 por 1,15
unidades.
EXERCÍCIOS:
b)
xi 73 75 77 79 81
Fi 2 10 12 5 2
c)
Classes 1 |--- 3 3 |--- 5 5 |--- 7 7 |--- 9 9 |--- 11 11 |--- 13
Fi 3 5 8 6 4 3
d)
Classes 22 |--- 25 25 |--- 28 28 |--- 31 31 |--- 34
Fi 3 5 8 6
66
4.1.3 VARIÂNCIA (S2) e DESVIO PADRÃO (S)
A variância e o desvio padrão são medidas que fogem a essas falhas, pois
levam em consideração a totalidade dos valores da variável em estudo, o que faz
delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais
geralmente empregados.
(x i − x) 2
σ2 = ,
n
e o desvio padrão é σ = σ 2 .
67
• Se a seqüência representa uma amostra, a variância é calculada pela
fórmula:
(x i − x) 2
2
s = ,
n −1
e o desvio padrão é s = s 2 .
xi 22
Solução: A média da seqüência é: x = = = 5,5
n 4
2
Os quadrados das diferenças (xi − x ) valem:
(x1 − x )2 = (4 – 5,5)2 = 2,25
(x2 − x )2 = (5 – 5,5)2 = 0,25
(x3 − x )2 = (8 – 5,5)2 = 6,25
(x4 − x )2 = (5 – 5,5)2 = 0,25
2
(x i − x) 2 9
σ = = = 2,25.
n 4
68
Como há repetições de elementos na série, definimos a variância como sendo
uma média aritmética ponderada dos quadrados dos desvios dos elementos da série
para a média da série.
(x i − x) 2 ⋅ Fi
σ2 = .
n
• Se a variável discreta é representativa de uma amostra, então a variância é dada
por:
2
(x i − x) 2 ⋅ Fi
s =
n −1
Como você pode ter notado, as diferenças entre as fórmulas são: para o caso da
variância populacional σ 2 , utiliza-se a média populacional tendo como
denominador o tamanho da população. Para o cálculo da variância amostral s2,
utiliza-se a média amostral, tendo como denominador o tamanho da amostra menos
um.
σ2 =
1
⋅ x i 2 Fi −
( x i Fi )
n n
ou
2
s2 =
1
⋅ x i 2 Fi −
( x i Fi )
n −1 n
i xi Fi
1 2 3
2 3 5
3 4 8
4 5 4
Total 20
69
Solução: Utilizando a fórmula prática para o cálculo da variância, calculamos xiFi
e xi2 Fi.
i xi Fi xiFi xi2Fi
1 2 3 6 12
2 3 5 15 45
3 4 8 32 128
4 5 4 20 100
Total 20 73 285
2 1
σ = ⋅ 2
x i Fi −
( x i Fi ) =
1
⋅ 285 −
( 73)
2
=
n n 20 20
1 5329 1
= ⋅ 285 − = ⋅ [ 285 − 266, 45] =
20 20 20
1
= ⋅ [18,55] = 0,9275
20
e o desvio padrão correspondente é σ = 0,9275 = 0,963 .
s2 =
1
⋅ x i 2 Fi −
( x i Fi ) =
1
[18,55] = 0,9763
n −1 n 19
i Classes Fi
1 0 |--- 4 1
2 4 |--- 8 3
3 8 |--- 12 5
4 12 |--- 16 1
TOTAL 10
70
Solução: Ampliaremos a tabela com o cálculo de xi Fi e de xi2 Fi:
i Classes Fi xi x iF i xi2Fi
1 0 |--- 4 1 2 2 4
2 4 |--- 8 3 6 18 108
3 8 |--- 12 5 10 50 500
4 12 |--- 16 1 14 14 196
TOTAL 10 − 84 808
A variância é:
2
2 1
σ = ⋅ 2
x i Fi −
( x i Fi ) =
1
⋅ 808 −
842
n n 10 10
1 7056 1 1
= ⋅ 808 − = ⋅ [808 − 705,6] = ⋅ [102, 4] = 10,24
10 10 10 10
e o desvio padrão: σ = 10,24 = 3,2 .
Observe que agora o modelo é coerente. Mesmo quando a amostra tiver apenas
0
um elemento x1, o cálculo de s2 leva-nos a uma indeterminação do tipo . O que
0
significa que a variância existe, mas não está determinada. Significa também que
as amostras de apenas um elemento não nos fornecem informações sobre a
variância da série.
EXERCÍCIOS:
b)
Classes 7 |--- 10 10 |--- 13 13 |--- 16 16 |--- 19 19 |--- 22
Fi 6 10 15 10 5
c)
Classes 4 |--- 6 6 |--- 8 8 |--- 10 10 |--- 12
Fi 4 11 15 5
d)
Classes 20 |--- 30 30 |--- 40 40 |--- 50 50 |--- 60 60 |--- 70
Fi 3 8 18 22 24
72
4.1.4 COEFICIENTE DE VARIAÇÃO (CV)
O desvio padrão por si só não nos diz muita coisa. Assim, se uma série X
apresenta x = 10 e σ( x ) =2 e uma série Y apresenta y = 100 e σ( y) = 5, do ponto de
vista da dispersão absoluta, a série Y apresenta maior dispersão que a série X. No
entanto, se levarmos em consideração as médias das séries, o desvio padrão de Y
que é 5 em relação a 100 é um valor menos significativo que o desvio padrão de X
que é 2 em relação a 10. Além disso, o fato de o desvio padrão ser expresso na
mesma unidade dos dados limita o seu emprego quando desejamos comparar duas
ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando
expressas em unidades diferentes.
σ s
CV = ⋅ 100 ou CV = .100
x x
que é expresso em porcentagens.
73
EXERCÍCIOS
Tipos de caixas A B C
Pressão média de ruptura (bária) 150 200 300
Desvio padrão das pressões (bária) 40 50 60
74
4.2 MEDIDAS DE ASSIMETRIA (AS)
x = Md = Mo xi
Denomina-se assimetria o grau de afastamento de uma distribuição da
unidade de simetria. Se uma distribuição não for simétrica, será classificada como
assimétrica. Existem duas alternativas para uma distribuição assimétrica.
a)
Mo Md x
b)
x Md Mo
75
Existem várias fórmulas para o cálculo do coeficiente de assimetria. Dentre
elas temos o coeficiente de assimetria de Pearson dado por:
x − Mo x − Mo
AS = ou AS =
σ s
Se AS = 0 então a distribuição é simétrica.
Se AS < 0 então a distribuição é assimétrica negativa.
Se AS > 0 então a distribuição é assimétrica positiva.
mesocúrtica xi
leptocúrtica xi platicúrtica xi
76
Se C > 0,263, diz-se que a curva correspondente à distribuição de freqüência
é platicúrtica.
Se C < 0,263, diz-se que a curva correspondente à distribuição de freqüência
é leptocúrtica.
temos que
EXERCÍCIOS
Calcular os coeficientes de assimetria e os coeficientes de curtose das listas de
exercícios anteriores.
77