Beruflich Dokumente
Kultur Dokumente
DESCRITIVA
FLÁVIO TAMBELLINI
I F S P
Matão - 2013
Sumário
1 – Introdução.......................................................................................................................... 1
1.1 – Definição ......................................................................................................................... 1
1.2 – Ramos da Estatística ................................................................................................... 1
1.3 – Conceitos Básicos ....................................................................................................... 1
1.4 – Dados Estatísticos ....................................................................................................... 1
2 – Estatística Descritiva .......................................................................................................... 3
2.1 – Séries Estatísticas........................................................................................................ 3
2.2 – Gráficos........................................................................................................................... 4
2.3 – Distribuição de Frequência........................................................................................ 6
2.3.1 – Distribuição de frequência discreta ............................................................................. 6
2.3.2 – Distribuição de frequência para dados agrupados em classe ...................................... 8
2.4 – Medidas de Tendência Central para Dados não Agrupados .......................... 12
2.5 – Medidas de Tendência Central para Dados Agrupados .................................. 15
2.6 – Medidas de Tendência Central para Dados Agrupados em Classe ............. 17
2.7 – Medidas de Dispersão............................................................................................... 18
Exercícios de Estatística Descritiva .................................................................................... 24
i
Nomenclatura
Letras latinas
Letras gregas
σ2 = variância da população
σ = desvio padrão da população
Σ = soma de termos
µ = média da população
ii
1 – Introdução
1.1 – Definição
É uma metodologia ou um conjunto de técnicas que utiliza a coleta de dados, sua classificação,
sua apresentação ou representação, sua análise e sua interpretação visando sua utilização dentro de um
processo decisório.
Estatística Inferencial: é a parte da Estatística que tem o objetivo de tirar conclusões a respeito
da população a partir de observações, análises e interpretações feitas em uma amostra.
População: é um conjunto de elementos que tem pelos menos uma característica em comum
para um determinado estudo.
Amostra: é um subconjunto da população, desde que não seja vazio e nem a própria população.
Amostragem: é a maneira pela qual os elementos da população serão escolhidos para compor a
amostra.
Estimativa: é o processo que consiste em utilizar dados amostrais para estimar parâmetros
populacionais.
Podemos caracterizá-los quanto a sua organização ou quanto à sua espécie ou tipo característico.
Dados Brutos: são dados estatísticos que não estão numericamente organizados. Exemplo: uma
relação das notas de 50 estudantes, feita em ordem alfabética (não há organização de valores em
ordem crescente ou decrescente).
1
Quanto a sua espécie ou tipo característico podem ser classificados em dados discretos,
contínuos, nominais e por postos.
Dados Discretos: neste tipo de dados existem variáveis que assumem valores inteiros. Os dados
discretos são usados para contagem. Exemplo: quantidade de erros de digitação por página; número de
veículos que passam em um rodovia por dia; número de acidentes de trabalho diários, etc.
Dados Contínuos: podem assumir qualquer valor dentro de um intervalo. Estes dados estão
associados às variáveis contínuas que fazem parte do conjunto dos reais. Estes tipos de dados são
usados para medição. Exemplo: altura, peso, comprimento, temperatura, venda, lucro, etc.
Dados Nominais: surgem quando se definem categorias e não existe ordenamento entre os
dados, então se conta o número de observações pertencente a cada categoria. Exemplo: as variáveis
nominais que envolvem categorias, tais como: sexo (masculino ou feminino); se condução própria (sim,
não); campo de estudo (medicina, direito, administração, engenharia), nacionalidade (brasileira,
francesa, italiana, espanhola).
Dados Por Postos: de um modo geral, são sujeitos a avaliações subjetivas quanto à preferência
ou desempenho em um conjunto de observações. Neste caso existe um ordenamento entre os dados.
Exemplo: competições de atletismo, (classificação em termos de quem é mais rápido); concurso de
quem come mais frango; classificação de filmes (livre, impróprio para menores de 12 anos, impróprio
para menores de 14 anos, impróprio para menores de 16 anos, impróprio para menores de 18 anos);
Nível de estudo (sem instrução, primeiro grau, segundo grau, terceiro grau, especialização, mestrado,
doutorado, pós-doutorado).
2
2 – Estatística Descritiva
Esta parte da Estatística coleta os dados e os apresenta em forma de tabelas ou gráficos, podendo
ser feita uma análise posterior para se tirar conclusões a respeito dos dados coletados.
Podemos dizer que uma série estatística é um conjunto de dados estatísticos referenciados aos
seguintes fatores: tempo, local e fenômeno e eles são apresentados em forma de tabelas.
3
Série Conjugada: onde mais de um dos fatores citados variam (tempo, local e fenômeno).
2.2 – Gráficos
Os gráficos fornecem uma visão qualitativa e mais rápida dos dados coletados. Os principais
gráficos são: em colunas, em barras, em setores e em curvas.
Gráfico em Colunas
População Brasileira
180 170
160 147
Quantidade (milhões)
140 120
120
93
100
80 70
60 52
40
20
0
1950 1960 1970 1980 1991 2000
Ano
4
Gráfico em Barras
China
Coréia do Sul
2000
Malásia
1975
Cingapura
Brasil
Gráfico em Setores
19% 18%
Nordeste
Norte
7% Sudeste
Sul
11% Centro-Oeste
45%
5
Gráfico em Curvas
220
Valores em Bilhões de US$
200
180
160
140
120
100
1988 1990 1992 1994 1996 1998
Ano
Este é um caso especial para a representação dos dados estatísticos coletados na amostragem.
Serão apresentados dois tipos de tratamento tabular, um para dados discretos e o outro para dados
contínuos.
Em um período de 20 dias foi feita uma amostragem em uma loja, onde foram coletados os dados
sobre a quantidade de produtos vendidos diariamente.
Dia 1 2 3 4 5 6 7 8 9 10
Quantidade 13 10 13 14 11 12 12 14 13 15
Dia 11 12 13 14 15 16 17 18 19 20
Quantidade 12 11 14 12 13 11 13 13 12 14
A = 15 – 10 = 5 A = 5.
Frequência Simples Absoluta (f): é o número de vezes que a variável aparece na amostra.
Exemplo:
6
f(10) = 1 f(13) = 6
f(11) = 3 f(14) = 4
f(12) = 5 f(15) = 1
Frequência Acumulada (F): é a soma das frequências absolutas simples até a variável em
questão.
Exemplo:
F(10) = 1
F(11) = 1 + 3 = 4
F(12) = 1 + 3 + 5 = 9
F(13) = 1 + 3 + 5 + 6 = 15
F(14) = 1 + 3 + 5+ 6 + 4 = 19
F(15) = 1 + 3 + 5 + 6 + 4 + 1 = 20
Frequência Simples Relativa (fr): é a frequência absoluta simples dividida pelo número de
observações (tamanho da amostra ou tamanho da população).
Exemplo:
fr(10) = 1/20 = 0,05 = 5% fr(13) = 6/20 = 0,30 = 30%
fr(11) = 3/20 = 0,15 = 15% fr(14) = 4/20 = 0,20 = 20%
fr(12) = 5/20 = 0,25 = 25% fr(15) = 1/20 = 0,05 = 5%
Exemplo:
Fr(10) = 1/20 = 0,05 = 5% Fr(13) = 15/20 = 0,75 = 75%
Fr(11) = 4/20 = 0,20 = 20% Fr(14) = 19/20 = 0,95 = 95%
Fr(12) = 10/20 = 0,50 = 50% Fr(15) = 20/20 = 1,00 = 100%
A frequência relativa também fornece a porcentagem, por exemplo, fr(11) = 3/20 = 0,15 = 15%.
Isto quer dizer que dos 20 dias, 15% deles, ou seja, 3 dias, 11 produtos foram vendidos diariamente.
A frequência relativa acumulada fornece a porcentagem acumulada até aquela quantidade. Por
exemplo, Fr(11) = 4/20 = 0,20 = 20%. Isto quer dizer que 20% dos dias (4 dias) foram vendidos até 11
produtos por dia.
x f F fr = f/n Fr
10 1 1 1/20 = 0,05 = 5% 0,05 = 5%
11 3 4 3/20 = 0,15 = 15% 0,20 = 20%
12 5 9 5/20 = 0,25 = 25% 0,45 = 45%
13 6 15 6/20 = 0,30 = 30% 0,75 = 75%
14 4 19 4/20 = 0,20 = 20% 0,95 = 95%
15 1 20 1/20 = 0,05 = 5% 1,00 = 100%
20 1
7
Gráfico da Frequência Simples Absoluta
7
6
6
Frequência Simples
5
5
4
4
3
3
2
1 1
1
0
10 11 12 13 14 15
Quantidade de Produtos Vendidos Diariamente
25
20
Frequência Acumulada
20 19
15
15
10 9
5 4
1
0
10 11 12 13 14 15
Quantidade de Produtos Vendidos Diariamente
Foi feita uma pesquisa com um grupo de 40 pessoas, medindo-se as alturas destas pessoas, em
centímetros, sendo que os dados já estão em ordem crescente.
160 161 163 164 165 166 167 167 168 169
169 170 170 171 172 172 172 173 173 174
174 175 175 176 176 177 177 178 178 181
182 183 183 184 184 185 186 187 188 189
8
1 - Determinar a amplitude do conjunto de dados.
2 - Decidir quanto ao número de classes a usar. É aconselhável escolher de 5 a 15 classes.
3 - Dividir a amplitude pelo número de classes para obter a amplitude das classes.
4 - Estabelecer os limites das classes.
5 - Enquadrar os dados nas classes.
Amplitude das classes (h): é um subintervalo da amplitude, que leva em consideração esta
última e o número de classes.
Observação 1: existem fórmulas e tabelas orientando quanto ao número de classes, mas pode ser
feita a escolha de qualquer número de classes, então para este exemplo, foram escolhidas 6 classes, ou
seja, K = 6.
Observação 2: neste exemplo, pode-se observar que o menor valor encontrado nos dados é 160 e
o maior valor é 189. Então a primeira classe deve começar com um valor inferior ou igual ao menor
valor encontrado nos dados (160), por exemplo, podemos adotar o valor 160 e a última classe deve ter
um valor superior ou igual ao maior valor encontrado (189), por exemplo, podemos adotar o valor 190.
Os valores 160 e 190 garantem que todos os dados da amostra situar-se-ão entre esses dois valores. É
melhor ter classes com números "mais redondos", ou seja, números de preferência que sejam inteiros.
Isto garante que se tenha uma tabela com uma melhor apresentação dos dados.
9
A primeira classe vai de 160 a 165. A quarta classe vai de 175 a 180.
A segunda classe vai de 165 a 170. A quinta classe vai de 180 a 185.
A terceira classe vai de 170 a 175. A sexta classe vai de 185 a 190.
a) 165├─ 170 compreende todos os valores entre 165 e 170, exceto o 170.
b) 165 ─┤170 compreende todos os valores entre 165 e 170 exceto o 165.
c) 165 ├─┤170 compreende todos os valores entre 165 e 170, inclusive o 165 e o 170.
d) 165 ─ 170 compreende todos os valores entre 165 e 170 exceto o 165 e o 170.
Por exemplo:
160├─ 165 150 é o limite inferior e o 165 é o limite superior da primeira classe.
165├─ 170 160 é o limite inferior e o 170 é o limite superior da segunda classe.
170├─ 175 170 é o limite inferior e o 175 é o limite superior da terceira classe.
175├─ 180 175 é o limite inferior e o 180 é o limite superior da quarta classe.
180├─ 185 180 é o limite inferior e o 185 é o limite superior da quinta classe.
185├─ 190 185 é o limite inferior e o 190 é o limite superior da sexta classe.
Ponto Médio da Classe (x): é a soma do limite inferior da classe com o limite superior da classe
dividida por 2.
10
Classes f F fr = f/n Fr x
160├─ 165 4 4 4/40 = 0,100 (10,0%) 0,10 = 10% 162,5
165├─ 170 7 11 7/40 = 0,175 (17,5%) 0,275 = 27,5% 167,5
170├─ 175 10 21 10/40 = 0,250 (25,0%) 0,525 = 52,5% 172,5
175├─ 180 8 29 8/40 = 0,200 (20,0%) 0,725 = 72,5% 177,5
180├─ 185 6 35 6/40 = 0,150 (15,0%) 0,875 = 87,5% 182,5
185├─ 190 5 40 5/40 = 0,125 (12,5%) 1,00 = 100% 187,5
40 1 ou 100%
Representação Gráfica
Não existe uma norma rígida para a representação gráfica da frequência simples (absoluta ou
relativa) e acumulada (absoluta ou relativa), pois tanto a aquela como esta podem ser representadas
por histogramas ou polígonos de frequência.
11
Observação: note que no ponto médio da classe anterior à primeira classe, ou seja, o 157,5, a
frequência simples vale zero e que no ponto médio da classe posterior à última classe, ou seja, o 192,5,
a frequência simples vale zero.
Observação 1: note que a frequência acumulada está relacionada com o limite superior da classe,
ou seja, F = 4 para Ls = 165; F = 11 para Ls = 170; F = 21 para Ls = 175; F = 29 para Ls = 180; F = 35 para Ls
= 185; F = 40 para Ls = 190.
Observação 2: note que a frequência acumulada vale zero para o limite inferior da primeira
classe, ou seja, F = 0 para Li = 160.
O objetivo das medidas de tendência central é resumir toda a informação dos dados coletados em
uma só palavra. As principais medidas de tendência central são: média, mediana e moda.
∑
̅ ̅
12
∑
Onde:
n é o tamanho da amostra;
N é o tamanho da população;
x é a média da amostra;
μ é a média da população;
significa soma ou somatório dos valores;
Exemplo
Um vendedor, durante cinco semanas consecutivas, vendeu a seguinte quantidade de produtos
por semana: 15, 20, 18, 20 e 17. Determine a quantidade média de produtos vendidos semanalmente.
∑
̅
Média Geométrica: é a raiz e-nésima do produto dos valores de x, ou também pode ser
entendido como o produto dos valores de x, todos eles elevado a 1/n.
√
Exemplo
Sejam os seguintes valores: 1, 3, 9, 27, 81. Calcule a média geométrica destes valores.
Média Harmônica: é a quantidade de valores dividida pela soma dos inversos dos valores.
∑( ⁄ )
Exemplo
Sejam os seguintes valores: 1, 2, 2, 4, 8. Calcule a média aritmética destes valores.
Média Ponderada
Sejam as variáveis x1, x2, x3,....,xn com os seguintes pesos P1, P2, P3, ...,Pn. A média ponderada de x
representada por x é dada por:
∑
̅
∑
Onde:
n é o número de elementos do conjunto ou o tamanho da amostra;
13
P é o peso de cada variável.
Exemplo
Calcule a nota média final de uma estudante de uma determinada matéria para os quatro
bimestres, conforme as notas e os pesos dados a seguir.
Média Geral
Sejam as médias aritméticas ̅ ̅ ̅ com as seguintes quantidades . A média
geral representada por ̿ , é dada por:
̅ ̅ ̅ ̅ ∑ ̅
̿
∑
Exemplo
Um grupo de funcionários constituído por 30 homens e 20 mulheres, sendo que a média salarial
dos homens é de 3 salários-mínimos e a média salarial das mulheres é de 2,5 salários-mínimos. Calcule o
salário médio deste grupo de funcionários.
∑ ̅ ̅ ̅
̿
∑
Mediana
Colocados os elementos em ordem crescente, a mediana é o elemento que ocupa a posição
central, ou seja, possuirá o mesmo número de elementos abaixo dela e acima dela. A mediana divide
este conjunto de elementos em duas partes iguais.
Para variável discreta, existem dois casos: quando o número de elementos é ímpar e quando o
número de elementos é par.
14
a) ÍMPAR
Quando o número de elementos do conjunto de dados é ímpar, teremos um elemento central de
ordem (n+1)/2.
Neste caso, o elemento de ordem (n+1)/2 será a própria mediana.
A série de dados estatísticos possui 5 elementos, ou seja, n = 5 (ímpar), então a mediana será o
elemento de ordem (n + 1)/2, que corresponde ao elemento de ordem (5 + 1)/2 3o elemento. Neste
exemplo, o 3o elemento é o 30, consequentemente a mediana será igual a 30, ou seja, Md = 30.
Portanto, a mediana vale 30.
b) PAR
Quando o número de elementos do conjunto de dados é par, teremos dois elementos centrais,
um de ordem (n/2) e outro de ordem (n/2 + 1). Neste caso, a mediana será a média aritmética entre os
dois elementos centrais, em que se somam os dois elementos centrais e divide-se por dois.
Calcule a mediana da seguinte amostra: 140, 115, 100, 155, 135, 125, 122, 147.
Colocando a amostra em ordem crescente, temos: 100, 115, 122, 125, 135, 140, 147, 155
A série possui 6 elementos, ou seja, n = 8 (par), então a mediana será a média entre o elemento
de ordem (n /2) e o elemento de ordem (n/2 +1). O elemento de ordem (n/2) é o elemento de ordem
(8/2) 4o elemento, que neste exemplo corresponde ao número 125. O elemento de ordem (n/2 +1) é
o elemento de ordem (8/2 +1) 5o elemento, que neste exemplo corresponde ao número 135. Neste
caso, a mediana será a média aritmética entre o 125 e o 135, ou seja:
Moda
Para um conjunto de dados, a moda será o valor que mais aparece ou aquele valor que possui a
maior frequência. Se tivermos dois valores com maior frequência, então teremos uma distribuição
bimodal. Se todos tiverem a mesma frequência, teremos uma distribuição amodal, ou seja, sem moda.
Média Aritmética
Quando os dados estiverem agrupados numa distribuição de frequência, a média aritmética dos
valores x1, x2, x3,....,xn ponderados pelas respectivas frequências absolutas f1, f2, f3, ...,fn será:
15
∑ ∑
̅
∑
∑ ∑
∑
A média aritmética também pode ser calculada utilizando-se a frequência relativa na forma
decimal (ou unitária) ou na forma percentual.
∑ ∑
̅
∑
̅ ∑
∑ ∑
̅
∑
∑
̅
Mediana
O cálculo da mediana para dados discretos agrupados é o mesmo procedimento anterior para o
cálculo da mediana para dados não agrupados, ou seja, é preciso que a distribuição esteja em ordem
crescente e é preciso verificar se o tamanho da distribuição é par ou ímpar, só que agora, a identificação
da ordem do elemento central (para o caso de n ímpar) ou dos elementos centrais (n par) será feita
através da frequência acumulada.
Moda
Idem ao caso anterior, portanto é só verificar qual elemento que tem a maior frequência simples
(absoluta ou relativa).
Exemplo
Calcule a média aritmética, a mediana e a moda da amostra abaixo.
x 5 7 8 10 12 13
F 2 3 5 6 3 1
16
Montando a tabela para nos auxiliar nas contas, temos:
• Média Aritmética
∑
̅
• Mediana
• Moda
Mo = 10 (é o valor que mais aparece)
Média Aritmética
São as mesmas fórmulas utilizadas para as medidas de tendência central para dados agrupados,
mas agora a variável x é o ponto médio das classes.
Exemplo
17
Tabela para auxiliar nos cálculos necessários.
Classes F x x·f
30 – 50 5 40 40 5 = 200
50 – 70 8 60 60 8 = 480
70 – 90 15 80 80 15 = 1.200
90 – 110 10 100 100 10 = 1.000
110 – 130 8 120 120 8 = 960
130 – 150 4 140 140 4 = 560
Soma 50 4.400
A terceira coluna, ou seja, x é o ponto médio da classe, que é a soma do limite inferior com o
limite superior dividida por dois.
• Média Aritmética
∑
̅
Geralmente utiliza-se a moda quando se tem preferência por algum tipo ou produto, por
exemplo: o sabor de sorvete que mais vende; o tipo de pizza que é mais pedido; a marca de sabão em
pó mais vendida; a cor de carro preferida; um questionário com escala ótimo, bom, regular e péssimo,
qual teve maior porcentagem.
Geralmente utiliza-se a mediana quando se quer dividir um conjunto em duas partes iguais, por
exemplo: um concurso de música em que se classificam os 50% melhores; vaga para emprego, em que
os 50% melhores irão para a segunda etapa de entrevista; a divisão entre um grupo de pessoas, os 50%
mais altos e os 50% mais baixos.
De um modo geral, o que ficou serve para calcular a média aritmética, por exemplo, as vendas
médias de uma empresa ao longo do ano; o salário médio de uma categoria em uma determinada
região; o consumo médio de combustível de um grupo de carros; a média de consumo de água por
habitante, a nota média de um grupo de estudantes.
Servem para verificar a representatividade das medidas de posição, pois é muito comum
encontrarmos séries que, apesar de terem a mesma média, são compostas de maneira distinta.
É importante ressaltar que a análise completa dos dados requer não apenas sua apresentação
através de tabelas e gráficos, ou cálculo das medidas de posições já estudadas, principalmente quando
se deseja comparar dois conjuntos, onde as médias são iguais, pois caracterizá-los somente através dela,
às vezes torna-se insuficiente ou quase impossível.
As principais medidas de dispersão, que veremos logo a seguir são: amplitude total, variância,
desvio padrão e coeficiente de variação.
18
Amplitude Total
É a diferença entre o maior valor e o menor valor.
Variância Populacional
É a soma dos desvios elevados ao quadrado dividida pelo tamanho da população.
∑ ∑ ∑
∑ ∑ ∑
Variância Amostral
É a soma dos desvios elevados ao quadrado dividida pelo tamanho da amostra menos um (n – 1).
∑ ̅ ∑ ∑
∑ ̅ ∑ ∑
Onde:
S2 é a variância amostral; n é o tamanho da amostra; x é a média da amostra; f é a frequência
absoluta; σ2 é a variância populacional; µ é a média populacional; N é o tamanho da população.
Desvio Padrão
Definido como a raiz quadrada positiva da variância. É uma medida de erro em torno da média,
quanto maior o desvio padrão, maior a dispersão dos valores em torno da média e vice-versa.
√ √
Onde:
σ2 é a variância da população;
σ é o desvio padrão da população;
S2 é a variância da amostra;
S é o desvio padrão da amostra.
Todas as medidas de dispersão vistas até agora são absolutas, ou seja, elas têm unidades. Por
exemplo, se estivermos interessados na altura em centímetros (cm), a amplitude e o desvio padrão
estarão em centímetros (cm) e a variância estará em centímetros ao quadrado (cm2 ).
19
Coeficiente de Variação
É uma medida de dispersão relativa, ou seja, não tem unidade e ela é o desvio padrão dividido
pela média. O coeficiente de variação pode ser dado em porcentagem, para isto, basta multiplicar por
100%. O coeficiente de variação serve para comparar a dispersão de dois conjuntos de dados com
médias diferentes e desvios padrões diferentes.
Calcular a variância, o desvio padrão e o coeficiente de variação para o caso do vendedor, que
durante cinco semanas consecutivas, vendeu a seguinte quantidade de produtos por semana: 15, 17, 18,
20 e 20.
Como foi calculada a média de produtos, que foi igual 18 produtos por semana, já se pode
calcular o desvio absoluto médio, a variância e o desvio padrão. Neste caso, estas 5 semanas serão
consideradas como uma amostra. Aplicaremos a fórmula de desvio aboluto médio, variância para dados
não agrupados.
∑ ̅
X ̅
15 (15 – 18)2 = 9
17 (17 – 18)2 = 1
18 (18 – 18)2 = 0
20 (20 – 18)2 = 4
20 (20 – 18)2 = 4
Σ 18
∑ ̅
Σx = 15 + 17 + 18 + 20 + 20 = 90 Σx = 90
Σx2 = 152 + 172 + 182 + 202 + 202 = 225 + 289 + 324 + 400 + 400 = 1.638 Σx2 = 1.638
20
∑ ∑
Portanto, a variância amostral vale 4,5 produtos vendidos ao quadrado por semana.
√ √
Coeficiente de Variação
Calcular o desvio absoluto médio, a variância, o desvio padrão e o coeficiente de variação para a
seguinte amostra.
X 5 7 8 10 12 13
F 2 3 5 6 3 1
Este exemplo foi usado anteriormente para o cálculo das medidas de tendência central, sendo
que a média aritmética vale 9. Será feita uma tabela auxiliar para o cálculo do desvio absoluto médio e
da variância.
X f x ·f ̅
5 2 5 · 2 = 10 (5 – 9)2·2 = 32
7 3 7 · 3 = 21 (7 – 9)2·3 = 12
8 5 8 · 5 = 40 (8 – 9)2·5 = 5
10 6 10 · 6 = 60 (10 – 9)2·6 = 6
12 3 12 · 3 = 36 (12 – 9)2·3 = 27
13 1 13 · 1 = 13 (13 – 9)2·1 = 16
Soma 20 180 98
∑
Média Aritmética ̅
∑ ̅
21
Variância (segundo modo da fórmula)
x f x·f x2 · f
2
5 2 5 · 2 = 10 5 · 2 = 50
7 3 7 · 3 = 21 72 · 3 = 147
8 5 8 · 5 = 40 82 · 5 = 320
10 6 10 · 6 = 60 102 · 6 = 600
12 3 12 · 3 = 36 122 · 3 = 432
13 1 13 · 1 = 13 132 · 1 = 169
Soma 20 180 1.718
∑ ∑
Desvio Padrão
Coeficiente de Variação
Para esta amostra, a variância vale 5,158, o desvio padrão vale 2,271 e o coeficiente de variação
vale 0,252 ou 25,2%.
Do exemplo de medidas de tendência central para dados agrupados em classe, sabe-se que a
média aritmética calculada foi igual a 88.
∑ ̅
22
Tabela para auxiliar nos cálculos necessários.
Classes F x ̅
30 – 50 5 40 (40 – 88)2 · 5 = 11.520
50 – 70 8 60 (60 – 88)2 · 8 = 6.272
70 – 90 15 80 (80 – 88)2 · 15 = 960
90 – 110 10 100 (100 – 88)2 · 10 = 1.440
110 – 130 8 120 (120 – 88)2 · 8 = 8.192
130 – 150 4 140 (140 – 88)2 · 4 = 10.816
Soma 50 39.200
∑ ̅
∑ ∑
Classes f x
30 – 50 5 40 40 · 5 = 200 402 · 5 = 8.000
50 – 70 8 60 60 · 8 = 480 602 · 8 = 28.800
70 – 90 15 80 80 · 15 = 1.200 802 · 15 = 96.000
90 – 110 10 100 100 · 10 = 1.000 1002 · 10 = 100.000
110 – 130 8 120 120 · 8 = 960 1202 · 8 = 115.200
130 – 150 4 140 140 · 4 = 560 1402 · 4 = 78.400
Soma 50 4.400 426.400
∑ ∑
Desvio Padrão
√ √
Coeficiente de Variação
̅
Para esta amostra, a variância vale 800, o desvio padrão vale 28,28 e o coeficiente de variação
vale 0,321 ou 32,1%.
23
Exercícios de Estatística Descritiva
GRÁFICOS
2.1) O Prato Quente, um restaurante em São Paulo, usa um questionário para solicitar aos clientes
uma avaliação da qualidade do restaurante. Esta característica é avaliada em uma escala de ótimo (O),
bom (B), médio (M) regular (R) e fraco (F). Use a estatística descritiva para sintetizar os seguintes dados
coletados sobre a qualidade do restaurante.
2.2) Os empregados na Digital Eletrônica estão num sistema de horário flexível: eles podem
começar a almoçar às 11h, 11h30min, 12h, 12h30min ou 13h. Os seguintes dados representam uma
amostra do horário de início escolhido pelos empregados:
11h 12h 12h30 12h 11h 12h30 12h 13h 11h30 12h
12h30 11h30 13h 12h30 12h 11h30 12h 12h30 13h 11h
11h30 12h 11h 12h 12h30 13h 12h30 12h 12h 13h
12h30 13h 13h 11h30 12h 12h 11h 11h30 12h30 12h
12h 12h30 12h 12h30 11h30 12h30 12h 12h 11h 11h30
13h 12h 11h30 11h 12h 11h 13h 11h30 12h30 12h30
2.3) Uma pesquisa realizada com um grupo de 70 pessoas sobre a preferência de cor de carros
está listada abaixo.
24
a) Construa uma tabela com a cor preferida e a frequência relativa.
b) Qual a porcentagem de pessoas que prefere a cor prata ou branca ou azul?
c) Qual a porcentagem de pessoas que prefere a cor vermelha ou verde?
2.4) Uma pizzaria fez uma pesquisa pela internet sobre a qualidade das pizzas dela, conforme as
categorias: excelente, muito bom, médio, pobre e horrível. Dos 78 responderam o questionário, 44
opinaram que a pizzaria é excelente, 21 responderam que a pizzaria é muito boa, 9 avaliaram-na como
média, 2 afirmaram que a pizzaria é pobre e 2 avaliaram-na como horrível.
a) Construa uma tabela das categorias com a frequência simples e com a frequência relativa.
b) Construa um gráfico em coluna da frequência em função das categorias
c) Qual a porcentagem de pessoas que avaliaram a pizzaria como excelente ou como muito boa?
d) Qual a porcentagem de pessoas que avaliaram a pizzaria como pobre ou horrível?
2.5) Considere os dados obtidos pelas medidas das alturas de 60 indivíduos em centímetros.
154 155 156 157 157 158 159 161 162 163
163 163 164 165 165 166 167 167 168 168
169 170 170 170 171 171 172 172 173 173
173 173 173 174 174 174 175 175 175 175
176 176 176 177 177 178 178 179 179 180
180 181 181 182 183 184 185 186 187 190
0,6 1,7 2,3 2,7 2,7 2,9 2,9 3,3 3,3 3,8
4,4 5,0 5,2 5,4 5,5 5,6 5,8 6,0 6,3 6,3
6,3 6,9 7,1 7,1 7,2 7,5 7,7 8,0 8,2 8,3
8,4 8,4 8,5 8,7 9,0 9,1 9,4 9,5 9,6 9,7
25
2.7) Os dados a seguir são valores contábeis (em reais), isto é, o valor líquido dividido pelo
número de títulos em destaque, para uma amostra aleatória de 30 ações da Bolsa de Valores de São
Paulo:
11 9 12 6 11 15 9 10 9 11
8 11 14 10 7 9 10 8 5 11
10 13 16 18 10 12 13 11 7 15
2.8) Uma amostra de salários iniciais de algumas profissões é apresentada a seguir. Os dados
estão em reais.
2.9) Um fabricante de baterias pegou uma amostra de 8 baterias fabricadas em um mesmo dia de
produção e utilizou as mesmas até que falhassem. O número de horas que cada uma demorou até falhar
foi:
340 520 360 450 630 510 490 560 550
2.10) Uma amostragem foi feita com os pacotes de farinha de mandioca em um determinado
estabelecimento por um representante de pesos e medidas, sendo que os dados estão em gramas:
965 980 970 950 1.050 960 995 1.010 970 1.020
2.11) Uma pesquisa feita com algumas marcas de água mineral revelou os seguintes valores de pH
da água à temperatura de 25 oC, conforme o quadro a seguir.
26
Marca pH Marca pH
Carrefour 5,48 Genuína Lindoya 6,30
Schinchariol 7,59 Magna 5,76
Fratelli Vita 6,02 Crystal 7,22
Levíssima 4,86 Premiata 7,69
Minalba 7,80 Acqua Sadia 7,80
Prata 5,87 São Lourenço 5,29
2.12) Uma amostra de 15 vendedores apresentou os seguintes custos (em reais) com despesas
diárias de alimentação e transporte
175 170 180 185 265 175 190 200 155 205 235 165 165 175 210
2.13) Comparando a amostra do exercício sobre o pH da água (exercício 2.11) e o custo diário
(exercício 2.12), qual deles tem um comportamento mais uniforme em relação à média aritmética?
Explique por que usou tal medida para comparar?
2.14) Uma pesquisa realizada com carros 1.0 no dia 15 de julho de 2006, verificou-se os seguintes
preços.
Ka GL 1.0 22.890,00
Fiesta Hatch Pers. 5p 1.0 27.890,00
Celta Life Flex Power 3p 1.0 24.390,00
Palio Fire Flex 2p 1.0 23.490,00
Uno Mille Fire Flex 1.0 2p 21.490,00
Gol City 1.0 Total Flex 2p G4 23.390,00
Fox City 1.0 Total Flex 2p 26.990,00
27
2.15) A inflação no ano, conforme os institutos são dados a seguir.
2.16) Durante quatro semanas consecutivas, a temperatura (oC), foi medida todos os dias,
conforme o quadro abaixo.
28
2.17) Os maiores produtores de carneiro do ano de 2002 em mil toneladas são dados a seguir.
DADOS AGRUPADOS
2.18) Os dados amostrais seguintes foram obtidos da Escola Morro da Cruz que empresta livros
para as pessoas lerem. Foi feito uma amostragem sobre a quantidade de livros retirados por dia num
período de 60 dias.
29
2.19) Uma empresa prestadora de serviços anota semanalmente o número as reclamações dos
clientes sobre alguma insatisfação sobre o serviço prestado com o intuito de melhorar o seu
desempenho no mercado. Uma amostra de 80 semanas revelou o número de reclamações por semana.
Número de reclamações
Semanas
por semana
0 18
1 24
2 16
3 10
4 6
5 4
6 2
Total 80
2.20) A revista Quatro Rodas fez uma pesquisa pela Internet entre seus assinantes em uma
determinada região para saber quantos carros eles possuíam, sendo que o número de respostas obtidas
foi igual a 180.
30
2.21) A seguinte pesquisa indica o número de acidentes diários ocorridos em 200 dias em uma
estrada, sendo que os valores do número de acidentes diários estão na coluna 1 e a coluna P representa
a frequência relativa acumulada.
Número de acidentes
P
diários
0 27,5
1 52,5
2 70
3 80
4 87,5
5 92,5
6 97,5
7 100
2.22) Em uma fazenda que tem 2.000 laranjeiras, foi feita uma amostragem para um grupo de 80
laranjeiras, em que se pesou a quantidade, em quilogramas, de laranja produzida por árvore. Os dados
estão tabulados abaixo.
31
g) Calcule a variância da amostra.
h) Calcule o coeficiente de variação.
i) Qual a porcentagem de laranjeiras que produzem entre 75 e 90 kg de laranjas?
j) Qual a porcentagem de laranjeiras que produzem até 80 kg de laranjas?
Litros de combustível
Número de carros
por carro
0 – 8 15
8 – 16 25
16 – 24 20
24 – 32 18
32 – 40 8
40 – 48 7
Total 93
2.24) Os dados abaixo se referem ao tempo em dias exigido para se completar auditorias de fim
de ano para uma amostra de 120 clientes da Audicon, uma empresa de contabilidade.
Tempo de Auditoria
Número de clientes
por cliente (dias)
10 – 14 10
14 – 18 11
18 – 22 15
22 – 26 25
26 – 30 32
30 – 34 16
34 – 38 11
Total 120
32
h) Qual é a porcentagem de uma auditoria durar até 22 dias?
i) Qual é a porcentagem de uma auditoria durar entre 18 e 30 dias?
2.25) Em um shopping foi pesquisa com 300 pessoas para saber o valor do consumo por pessoa
por faixa etária, conforme a tabela a seguir.
OUTROS EXERCÍCIOS
2.26) Um supermercado tem 200 empregados, sendo 140 mulheres e 60 homens. A média salarial
das mulheres é de 3 salários mínimos e a dos homens é de 4 salários mínimos. Qual a média salarial dos
empregados deste supermercado, em salários mínimos?
2.27) Um estudante que fez 4 provas bimestrais com as respectivas notas: 7,5; 8,0; 7,0; 10. Os
pesos das provas dos 4 bimestres foram: 2, 3, 3 e 4, respectivamente. A nota final é baseada nas 4 notas
bimestrais com seus respectivos pesos. Calcule a nota final dele.
33
2.29) Uma pesquisa de preços de determinado produto, realizada em dois mercados, produziu os
resultados mostrados na tabela abaixo.
2.30) Calcular o salário médio horário de 200 funcionários de uma fábrica de tecidos, em que 60%
deles recebem R$ 20,00/h, 30% recebem R$ 55,00/h e os demais ganham R$ 70,00/h.
34
Respostas dos Exercícios de Estatística Descritiva
Exercício 2.1
10
0
Ótimo Bom Médio Regular Fraco
Exercício 2.2
a) b)
20
35
Exercício 2.3
Exercício 2.4
a) b)
Freq.
Categoria
Simples
Freq. Rel. 40
Qualidade da Pizzaria
Excelente 44 56,4 30
Muito Boa 21 26,9
Média 9 11,5 20
Pobre 2 2,6
Horrível 2 2,6 10
78 100%
0
Excelente Muito Boa Média Pobre Horrível
c) 83,3%
d) 5,2%
Exercício 2.5
b) Distribuição de Frequência
36
c) d)
Exercício 2.6
b) Distribuição de Frequência
c) d)
37
Exercício 2.7
X f F Fr (%) Fr
5 1 1 3,33 3,33
6 1 2 3,33 6,66
7 2 4 6,67 13,33
8 2 6 6,67 20
9 4 10 13,33 33,33
10 5 15 16,67 50
11 6 21 20 70
12 2 23 6,67 76,67
13 2 25 6,67 83,34
14 1 26 3,33 86,67
15 2 28 6,67 93,34
16 1 29 3,33 96,67
17 0 29 0 96,67
18 1 30 3,33 100
20
15
10
0
5 6 7 8 9 10 11 12 13 14 15 16 17 18
100
Gráfico da Freq. Rel. Acumulada
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14
38
Respostas dos Dados Não Agrupados
Exercício 2.13 O exercício 2.12 tem um comportamento menos disperso em relação à média,
pois apresenta um coeficiente de variação menor, 15,4% contra 16,7%. Utilizou-se como medida de
dispersão o coeficiente de variação, pois é uma medida de dispersão relativa, pois os dois exercícios têm
médias e desvio padrões diferentes.
Exercício 2.14
a) 6.400,00 b) 24.361,43 c) 23.490,00 d) 2.290,53 e) 9,40%
Exercício 2.16
a) Semana 1 2 3 4
Temp. Média 27,14 27,57 25,57 26,86
b) 26,79
c) Semana 1 2 3 4
Amplitude 5 5 6,5 6,5
d) 7
e) Semana 1 2 3 4
Temperatura Mediana 28 28 26 27
f) 27,5
g) Semana 1 2 3 4
Temperatura Modal 29 28,5 26 27
i) Semana 1 2 3 4
Desvio Padrão 2,116 1,694 2,281 2,174
39
j) Semana 1 2 3 4
Coeficiente de Variação 7,79 6,14 8,92 8,09
k) 2,101 l) 7,84
n) 26,79 o) 26,79
p) A temperatura média geral pode ser calculada a partir dos 28 valores, a partir das médias de
cada semana e de cada dia da semana, pois resultarão no valor de 26,79.
Exercício 2.18
a) b) 16,73
c) 16,5
10
d) 16
8
e) 6,98
Número de dias
6 f) 2,64
4 g) 15,8%
h) 18,3%
2
i) 10
0
12 13 14 15 16 17 18 19 20 21 22
Número de livros retirados diariamente
Exercício 2.19
a) b) 6
25 c) 1,775
Número de semanas
20 d) 1
15 e) 1
10 f) 2,46
5 g) 1,57
0 h) 15%
0 1 2 3 4 5 6
i) 52,5%
Número de reclamações
40
Exercício 2.20
a)
b) 40%
100
c) 10%
Porcentagem acumulada
80
d) 50%
60 e) 1,8
40 f) 1,5
g) 1
20
h) 1,26
0
0 1 2 3 4 5
Número de carros por assinante
Exercício 2.21
a) 60
50
Número de dias
40
30
20
10
0
0 2 4 6 8
Número de acidentes diários
b) 200
Número de dias acumulados
175
150
125
100
75
50
0 2 4 6 8
Número de acidentes diários
41
c) 40 d) 22,5% e) 1,925 f) 1 g) 0 h) 3,64 i) 99,1% j) 70
Exercício 2.22
a) b)
Exercício 2.23
a) b)
Exercício 2.24 a)
42
b) c)
Exercício 2.25
a)
2.29)
a) O mercado B. b) O mercado A.
c) É a medida do item b, pois ela é relativa, serve para comparar dados com médias e desvios
padrões diferentes.
2.30) 35,5
43