Beruflich Dokumente
Kultur Dokumente
eguro
& nsino
volume i
Estatstica
Bsica
para tomada
de deciso
Coleo
Seguro & Ensino
Rio de Janeiro
2013
0013-1239
CDU 519
iv
Sumrio
Apresentao, vii
APRESENTAO DOS DADOS (TABELAS E GRFICOS), 11
Sries Estatsticas.................................................................................................11
Elaborao de uma Distribuio de Frequncias Agrupada em Classes........15
Comparando Sries de Dados............................................................................19
Tcnicas Grficas para Representar Dados.................................................... 24
Grfico de Colunas . ..........................................................................................24
Grfico de Barras Horizontais...........................................................................30
Histograma.........................................................................................................30
Caractersticas das Curvas de Frequncias Assimetria e Curtose..................34
Grfico de Setores ou Pizza...............................................................................36
Grfico de Linhas...............................................................................................40
Grfico de Pontos ou Disperso.........................................................................41
Pictrogramas......................................................................................................45
Resumindo a Utilizao dos Recursos Computacionais para
Elaborao de Grficos......................................................................................47
Caractersticas de Tabelas e Grficos de Qualidade.........................................48
Exerccios..............................................................................................................52
MEDIDAS RESUMO, 53
Mdias...................................................................................................................54
Mdia Aritmtica Simples e Ponderada (x) ......................................................54
Mdia Ponderada................................................................................................57
Usando o Excel para Calcular a Mdia.......................................................58
Mediana..............................................................................................................60
Clculo da Mediana para Variveis Contnuas..................................................62
Usando o Excel para Clculo da Mediana.................................................. 64
Moda..................................................................................................................66
Usando o Excel para Clculo da Moda........................................................68
Medidas Separatrizes (ou Medidas de Posio Relativa)...................................69
Usando o Excel para o Clculo dos Quartis, Decis e Centis.......................74
Exerccios..............................................................................................................78
MEDIDAS DE DISPERSO, 79
Clculo do Desvio-Mdio simples (ou Desvio Absoluto)
para uma Populao........................................................................................ 81
Clculo da Varincia e do Desvio-Padro para uma Populao.................. 82
Clculo do DMS para Populaes......................................................................84
Clculo do Desvio-Padro para Populaes......................................................84
Trabalhando com Desvios em Amostras........................................................ 86
Calculando a Mdia, o Desvio-Mdio e o Coeficiente de Variao..................87
Calculando a Varincia, o Desvio-Padro e o Coeficiente de Variao............88
Usando o Excel para o Clculo do Desvio-Mdio e do Desvio-Padro........89
Usando a Ferramenta de Anlise de Dados Estatstica Descritiva do Excel.......92
Exerccios..............................................................................................................95
Formulrio Resumo........................................................................................ 98
vi
Apresentao
com grande satisfao que apresento este livro desenvolvido pelos professores Helio
Morrone Cosentino, lvaro Alves de Moura Jnior e Andr Castilho Ferreira da Costa,
experientes acadmicos e especialistas em mtodos quantitativos.
Eles tm atuado com sucesso em vrias instituies de ensino superior de So Paulo, notadamente na ESNS-SP, onde lecionam para o curso de graduao em Administrao.
A redao do texto, simples e objetiva, bem como a exemplificao de aplicaes na rea
de seguros, atravs da planilha Excel, certamente facilitaro o aprendizado daqueles que
necessitam utilizar a Estatstica para o processo de tomada de deciso na indstria de seguros.
O livro certamente servir como um adequado material de apoio nas disciplinas especficas
ministradas no curso de graduao em Administrao com linha de formao em Seguros
e Previdncia, assim como nos de ps-graduao em Seguros e Resseguro ministrados
pela ESNS-SP.
Espero para breve a continuidade deste projeto, com o desenvolvimento de novos volumes
pelos autores.
Uma boa leitura para todos!
Domingos Alves Corra Neto
vii
viii
Caractersticas do Mtodo
Quantitativo e sua
Relao com a Estatstica
e Nosso Dia a Dia
Ao se deparar com a necessidade de aprofundamento do conhecimento o pesquisador obrigado a compreender conjuntos de dados relevantes ao seu objeto de pesquisa.
Para tanto, necessrio trabalhar dados relativos a situaes problemas, que posteriormente se refletiro em informaes seguras para comparaes e julgamentos.
O Mtodo Quantitativo parte da metodologia cientfica que tem por objetivo coletar,
simplificar, analisar e modelar dados. Talvez seu aspecto mais relevante seja realizar
previses e projees que podem auxiliar no processo de tomada de decises, a partir
de dados relativos ao fenmeno estudado. Sua principal caracterstica que costuma
trabalhar com uma elevada quantidade de informaes.
A fase inicial deste processo est associada chamada Estatstica Descritiva, objeto
de estudo deste livro. A ela compete coletar os dados, organiz-los e resumi-los, apresentando-os (descrevendo-os) sob uma forma de fcil compreenso com tabelas, grficos e
valores tpicos que representem o comportamento de todo o conjunto dos dados.
A quantidade de informaes que temos que lidar em nosso dia a dia exige obrigatoriamente uma ferramenta capaz de controlar as vendas de uma empresa, a quantidade
de leitos livres em um hospital, a programao de entregas de uma transportadora, as
notas de um aluno etc.
RESUMINDO INFORMAES
Observe que em um jornal ou revista, aps lermos os ttulos comumente conduzimos
nossa viso diretamente para os grficos contidos nos artigos, depois para as tabelas e,
finalmente (j tendo compreendido a mensagem principal transmitida pelos grficos e
tabelas) passamos aos detalhes do texto. Muitas vezes j consideramos suficiente ler os
grficos e tabelas e damos a compreenso do assunto por completa, sem ao menos ler o texto.
Em qualquer empresa, que diariamente conte com diversos relatrios de controle
(estoques, vendas, faturamento) seus dirigentes precisam manter um panorama atualizado
da situao do negcio. Para tanto, devem consultar incontveis listagens de dados para
conhecer o desempenho de cada setor. Tarefa pouco produtiva ou mesmo impossvel!
Uma forma de simplificar a ao dos executivos dessa empresa seria resumir as informaes coletadas com o uso de recursos estatsticos, gerando uma forma de consulta
fcil e rpida, tornando o processo de controle eficaz.
De forma mais completa, o fluxo de informaes envolvido nessa empresa poderia
seguir as seguintes etapas da Fig. 1:
Figura 1
Fluxo de Informaes Tpico de um Negcio
9
0
COLETANDO OS DADOS
(Obteno dos dados brutos)
5 6
1
10
8
3
8
7
6
4
ORGANIZANDO OS DADOS
(Relatrios, listagens etc.)
RESUMINDO E MELHORANDO A
QUALIDADE DA INFORMAO
(Elaborao de tabelas)
Data
Vendas ($)
17
10
33
15
50
30
100
FACILITANDO A COMPREENSO E
VISUALIZAO DAS INFORMAES
(Elaborao de grficos)
CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO COM A ESTATSTICA E NOSSO DIA A DIA
DIRETA
COLETA
D
E
S
C
R
I
T
I
V
A
ESTATSTICA
INFERENCIAL
E MULTIVARIADA
INDIRETA
CRTICA
Anlise de
possveis falhas do
processo (erros de
informao, vcios,
fraudes etc)
APURAO
Processamento
manual/eletrnico
dos dados
TABULAO
APRESENTAO
ANLISE
Contnua
Peridica
Ocasional
RESUMINDO
OS DADOS
Descrio dos
dados obtidos
e elaborao de
tabelas e grficos
para facilitar a
visualizao e
compreenso
Concluses
Interpretaes
Previses
Embora a estatstica descritiva tambm possibilite concluses iniciais e interpretaes sobre os fatos estudados, normalmente cabe estatstica inferencial e multivariada este estudo mais completo, ou seja, a estatstica descritiva tem por foco relatar e
organizar dados passados ou presentes que serviro de base para anlises, previses e
projees futuras sobre um fenmeno.
Em uma empresa, por exemplo, os dados relativos s vendas realizadas nos ltimos
trs anos servem como base para gerarmos modelos de previso das vendas do prxi-
A COLETA DE DADOS
A coleta de dados DIRETA realizada a partir dos elementos estudados e pode ser
classificada sob trs formas diferentes:
CONTNUA: controle dirio de frequncia de alunos, registros de nascimentos,
cotao do valor dirio de uma ao.
PERIDICA: mdias semestrais dos alunos, censo demogrfico (a cada 10 anos).
NECESSIDADES MOMENTNEAS: pesquisas de opinio para lanamento de
um novo produto, cadastramento de vtimas ou sobreviventes de uma epidemia.
J a coleta de dados INDIRETA elaborada a partir de dados previamente reunidos
pela coleta direta (algum j fez a coleta direta antes). Por exemplo, a quantidade de
nascimentos mensais em um estado pode ser obtida (indiretamente) a partir do nmero
de nascimentos dirios registrados em cada uma das diversas cidades daquele estado.
O pesquisador precisa apenas juntar os dados previamente obtidos.
Populao
Amostra
A coleta de dados deve ser realizada de forma bastante criteriosa, uma vez que servir
como base para todo o estudo estatstico sobre o fenmeno.
Ela pode ser realizada atravs de um CENSO, que envolve todos os elementos de
uma populao, ou por AMOSTRAGEM quando usa apenas um subconjunto significativo dessa populao.
CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO COM A ESTATSTICA E NOSSO DIA A DIA
A utilizao do censo bastante restritiva, uma vez que costuma envolver custos
elevados e dificuldade da obteno de dados.
J a utilizao de AMOSTRAS, obtidas atravs de tcnicas amostrais busca a reduo de custos e uma maior facilidade na obteno e processamento de dados. A ideia
estudar apenas parte da populao e transferir as informaes obtidas a partir desta
amostra para toda a populao.
Desta forma evita-se analisar um a um os elementos da populao, minorando custos
e trabalho, porm aumentando-se o risco de erro.
Matematicamente, a POPULAO (alguns chamam de UNIVERSO) definida
como o conjunto constitudo por todos os elementos que poderiam ser investigados no
estudo, j a AMOSTRA um subconjunto desta populao. muito importante que a
amostra seja realmente representativa da populao, ou seja, ela deve guardar as mesmas
caractersticas da populao de onde se originou.
Costumeiramente a discusso sobre tcnicas amostrais realizada em um captulo
parte, dada sua vital importncia em estudos estatsticos. Desta forma, abordaremos
aqui apenas suas principais ideias, sem esgot-las, mas em profundidade suficiente para
o entendimento dos conceitos ora abordados. A Fig. 3 demonstra as possveis espcies
de amostras.
Figura 3
Tipos de Amostragem Possveis
Populao
Amostra
P R O B A B I L S T I C A
NO-PROBABILSTICA
Convenincia
(ou julgamento
ou acessibilidade)
Quota
Fatia
Em contraponto, as tcnicas de
amostragem no probabilsticas NO
permitem generalizaes nem projees
que fujam estritamente aos elementos
pesquisados.
Na amostra PROBABILSTICA ocorre a escolha de elementos com base em probabilidades determinadas (na verdade h uma chance igual de qualquer elemento ser
selecionado), j na amostra NO PROBABILSTICA no so aferidas a probabilidade
de suas ocorrncias.
Por esses motivos, o uso de amostras no probabilsticas deve ser restrito a estudos
iniciais de um fenmeno, ou quando se deseja conhec-lo de forma inicial, devendo ser
seguido depois de uma explorao mais rigorosa, caso sejam desejados resultados consistentes que permitam generalizaes, estabelecimentos de leis ou obteno de padres
de comportamento.
A utilizao de procedimentos estatsticos que envolvam amostras no probabilsticas dificilmente pode ser empregada na modificao de processos de quaisquer espcies (administrativos, industriais ou mesmo tericos), uma vez que pode ser afetado
pelo vis da escolha da amostra. Amostras com vieses so ditas tendenciosas, impedem
generalizaes e podem implicar em erros.
CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO COM A ESTATSTICA E NOSSO DIA A DIA
Se houver dvida sobre a escolha do tipo de amostra, para maior segurana recomenda-se a amostragem aleatria simples. A Fig. 4 procura estabelecer com mais detalhes:
Figura 4
Tipos de Amostragens Probabilsticas, Caractersticas e Usos
TIPO
CARACTERSTICAS
ALEATRIA SIMPLES
ESTRATIFICADA
SISTEMTICA
GRUPO (cluster)
ALGUNS USOS
Controle de qualidade
VARIVEIS
Embora na metodologia cientfica o conceito de varivel seja mais amplo, sob o
ponto de vista da estatstica a denominao de varivel dada s possveis formas de
representao de um fenmeno em estudo, como representa a Fig. 5.
Em uma pesquisa de opinio, por exemplo, as diversas questes contidas no questionrio buscam avaliar todas as variveis envolvidas no problema. O termo varivel
bem apropriado, visto que se espera que as respostas possam variar para cada um
dos entrevistados.
Figura 5
Ideia de Varivel
Fenmeno
Resultados Possveis
Variveis
Questes relativas
ao estudo
No de filhos?
Qual sua estatura?
Compraria esta revista?
Respostas
0; 1; 2; 3; ........
1,65 m; 1,87 m; ........
Sim; No; Talvez; ...
CARACTERSTICAS DO MTODO QUANTITATIVO E SUA RELAO COM A ESTATSTICA E NOSSO DIA A DIA
TIPOS DE VARIVEIS
Figura 6
Tipos de Variveis
Qualitativa
Expressa por
ATRIBUTOS:
cor (branca/negra/amarela....),
sexo (masc./fem.), ...
Varivel
Quantitativa
Varivel Discreta
Assume um valor nico em
um conjunto enumervel
(ex.: no de pacientes em
um hospital, pode ser 1;
2; 3; 4 ... e nunca 2,3;
3,745 ..).
Expressa por
VALOR NUMRICO:
idade, salrio, quantidade
de produtos vendidos
Exerccios
10
Sexo
Idade
Cor
Gravidade
Episdios
39
branca
Leve
amarela
Leve
24
preta
Moderada
13
branca
Grave
20
parda
Leve
preta
Moderada
12
amarela
Moderada
43
branca
Leve
preta
Grave
10
30
branca
Grave
11
12
branca
Moderada
12
11
parda
Leve
SRIES ESTATSTICAS
Uma forma bastante til na apresentao dos dados atravs das sries estatsticas,
as quais os dados so dispostos em diferentes tipos de tabelas, que podem ser classificadas em quatro tipos:
11
12
i) Srie Temporal: um tipo de srie na qual o elemento varivel representa um determinado perodo (dia, ms, trimestre, ano etc).
Exemplo Srie Temporal
Exportaes Brasileiras (FOB)
em US$ milhes
Ano
Exportaes FOB
2000
55.085,60
2001
58.222,64
2002
60.361,79
2003
73.084,14
2004
96.475,24
2005
118.308,39
2006
137.807,47
2007
160.649,07
2008
197.942,44
2009
152.994,74
2010
201.915,29
2011
256.039,58
Fonte: BCB
ii) Srie Geogrfica: expressa um tipo de srie em que o elemento varivel expresso
por uma determinada localidade (bairro, cidade, estado, regio, pas etc).
Exemplo Srie Geogrfica
DPVAT Indenizaes Pagas por Regio 2010
REGIO
Qtde Total
Indenizaes Pagas
NORTE
21.254
R$ 196.615.694,48
NORDESTE
61.316
R$ 485.943.320,08
CENTRO OESTE
21.350
R$ 221.743.217,62
SUDESTE
70.501
R$ 535.016.405,38
SUL
77.930
R$ 589.468.442,53
TOTAL
252.351
R$ 2.028.787.080,09
iii) Srie Especfica: expressa um tipo de srie em que o chamado elemento varivel
um determinado fenmeno (mortes por acidente de carros, exportaes por setor de
atividade etc).
Exemplo Srie Especfica
Ocorrncias Policiais Registradas, por Natureza 2 Trimestre de 2011
Discriminao
Capital
Estado
Contra a pessoa
34.071
164.887
Contra o patrimnio
112.846
286.517
Contra os costumes
834
3.519
Entorpecentes
1.520
11.721
Contravencionais
3.835
19.545
6.490
32.746
38.198
81.588
Total de delitos
159.596
518.935
No Criminais
92.784
262.082
N. de Alunos (fi)
1,0
2,0
3,0
4,0
5,0
12
6,0
7,0
8,0
9,0
10,0
Total
50
13
14
Frequncia (fi)
Menor 1 ano
1 a 4 anos
5 a 9 anos
11
10 a 14 anos
23
15 a 19 anos
101
20 a 29 anos
340
30 a 39 anos
218
40 a 49 anos
148
50 a 59 anos
137
60 a 69 anos
91
70 a 79 anos
96
80 anos e mais
66
Idade ignorada
28
Total
Fonte: DATASUS
1.263
Dados
brutos
Rol
(opcional)
Tabela de
Frequncia
15
16
Observe a seguinte sequncia de dados e sua apresentao em uma tabela. Por serem dados com caractersticas discretas, em pequena quantidade e se repetirem no rol,
poderemos usar uma tabela de distribuio de frequncia simples:
Rol: 25, 25, 30, 45, 45, 50, 62, 77
xi
fi
Fi
fi %
Fi %
25
2/8 = 25%
25%
30
2+1 = 3
1/8 = 12,5 %
37,5 %
45
2+1+2 = 5
25%
62,5%
50
2+1+2+1 = 6
12,5 %
75%
62
2+1+2+1+1 = 7
12,5 %
87,5%
77
2+1+2+1+1 +1
=8
12,5 %
100%
Coluna das
variveis (xi)
indica quais as
variveis presentes
no rol
100%
Coluna das
frequncias
simples ( fi )
indica quantas
vezes cada
varivel aparece
no rol
fi = n = no de
elementos do rol
Coluna das
frequncias
(relativas)
porcentuais
( fi %) indica a
participao %
de cada uma das
variveis no todo
No nosso caso, A = (77 25) / 3 = 17,3 que pode ser utilizado desta forma, ou arredondado para 18 ou mesmo 20. Desta forma, a classe no 1 inicia-se em 25 (menor valor
do rol) e adicionado da amplitude A = 20 e assim por diante, ou seja:
25 + 20 = 45 ou 25 | 45 e depois
45 + 20 = 65 ou 45 | 65 e finalmente
65 + 20 = 85 ou 65 | 85
A aproximao (arredondamento) da amplitude de classe para valores inteiros normalmente facilita a compreenso dos resultados, mas deve ser utilizado com parcimnia,
para no distorcer muito os resultados. O resultado final seria:
Classe
xi
fi
Fi
fi %
Fi %
25 a 45
37,50%
37,50%
45 a 65
50,00%
87,50%
65 a 85
12,50%
100,00%
100,00%
Total
Perceba no exemplo acima que os valores esto sendo repetidos, ou seja, no primeiro
intervalo o limite superior da primeira classe, o valor 45, igual ao limite inferior da
17
18
Vale ressaltar que a escolha desses intervalos depende da disposio dos dados ao
longo da distribuio de frequncias, o que significa que cada caso dever ser avaliado
individualmente, sempre seguindo a mxima de tornar a interpretao o mais fcil
possvel para o leitor.
Dois pesquisadores diferentes podem escolher valores de K e de A diversos, pois a
regra no d uma soluo exata para a disposio da distribuio de frequncias, o que
implicar em duas, ou mais, tabelas diferentes, que representaro o mesmo fenmeno.
Se no exemplo acima tivssemos escolhido A = 18, teramos:
Classe
xi
fi
25 | 43
43 | 61
61 | 79
Total
Cheque
12,00
19,00
45,00
88,33
95,40
125,12
Carto
26,00
29,50
32,00
44,00
48,00
56,30
59,50
60,00
60,00
132,25
n=6
ou
K = 30 = 5,48 = 6 classes
n = 10
Para melhorar ainda mais o aspecto final da tabela, alm de forarmos a aproximao
da amplitude da classe (A) para $ 25,00 poderamos iniciar tambm a classe no 1 em zero,
uma vez que o menor valor dos ris ($2,00) prximo a este valor. Teramos ento:
Xi (R$)
Dinheiro fi
Cheque fi
Carto fi
0 | 25
11
25 | 50
50 | 75
75 | 100
100 | 125
125 | 150
14
10
Classe
Total
19
20
Classe
1
2,00 | 23,71
23,71 | 45,42
45,42 | 67,13
67,13 | 88,84
88,84 | 110,55
110,55 | 132,26
No entanto, possvel criar alguns critrios para os softwares que nos permita
elaborar tabelas de distribuio de frequncias condizentes com as operaes que
realizamos acima.
Vamos nos basear em um novo exemplo para elaborar uma Distribuio de Frequncias pelo Excel. A tabela abaixo apresenta os valores (em R$ mil) dos totais dos
contratos de seguros de automveis fechados pela Corretora Mega Seguro durante o
perodo de 60 dias.
Dia
Valor
em R$
Dia
Valor
em R$
Dia
Valor
em R$
Dia
Valor
em R$
Dia
Valor
em R$
Dia
Valor
em R$
15
11
16
21
22
31
24
41
31
51
28
16
12
17
22
23
32
27
42
28
52
35
17
13
18
23
15
33
29
43
25
53
35
18
14
18
24
16
34
29
44
35
54
31
19
15
19
25
17
35
34
45
25
55
32
20
16
20
26
18
36
26
46
36
56
35
20
17
20
27
19
37
34
47
30
57
35
22
18
20
28
20
38
31
48
37
58
32
23
19
21
29
21
39
25
49
33
59
34
10
16
20
21
30
22
40
34
50
28
60
24
O primeiro passo consiste em elaborar as classes, o que pode ser feito seguindo as
regras j citadas, ou at mesmo a experincia do pesquisado em dispor os valores analisados. Para o exemplo acima, a distribuio ter cinco classes, sendo que a amplitude
de cada classe ser de R$ 5 mil, como est descrito abaixo:
Classes
xi
(R$ mil)
15 | 20
20 | 25
25 | 30
30 | 35
35 | 40
Total
Uma vez definidas, manualmente, as classes, j possvel informar quais os parmetros para o Excel, para que o software possa fazer os clculos que nos permitiro
elaborar uma distribuio de frequncias.
Cabe lembrar que tais recursos servem para facilitar o nosso trabalho, sobretudo
quando estamos trabalhando com um grande nmero de dados observados (500, 1.000,
10.000), o que tornaria a elaborao manual de uma tabela de distribuio bastante
trabalhosa e passvel de vrios erros. Com o Excel, uma vez definidas as classes e a
amplitude de cada classe, essa busca ser rpida e precisa.
Definidos esses parmetros, precisamos inform-los levando em considerao apenas um valor numa nova coluna, uma vez que o Excel no l os intervalos como esto
descritos acima. O novo valor indicado representa sempre o intervalo superior da classe,
sendo que o valor informado tambm ser considerado para aquela classe. Dessa forma,
como a nossa distribuio acima exclui o valor superior, devemos informar que o limite
superior da primeira classe ser 19,99, e assim consecutivamente para as demais classes,
conforme est descrito na tabela abaixo:
Classes
xi (terico)
xi (Excel)
15 | 20
19,99
20 | 25
24,99
25 | 30
29,99
30 | 35
34,99
35 | 40
39,99
Total
21
22
Para que o Excel faa o clculo das frequncias devemos numa nova coluna,
da frequncia simples, inserir a funo estatstica Frequncia, conforme est ilustrado
abaixo:
Ao clicarmos na funo, abrir uma caixa, para a qual deveremos informar a Categoria (Estatstica) e a funo (Frequncia), conforme segue:
Em seguida, abrir uma nova caixa solicitando a matriz dos dados (dados brutos) e
a Matriz-bin (as classes):
Clique Ok. Mas ainda no terminou. Agora selecione a coluna da frequncia, clique
F2 (vai aparecer a frmula da frequncia na clula), e em seguida clique Ctrl Shift e Enter
ao mesmo tempo. Ateno, no clique apenas Enter, preciso utilizar o comando Ctrl
Shift e Enter para replicar a frmula para as demais clulas da frequncia. Realizada essa
etapa, o Excel distribuir os dados nas classes previamente definidas, como segue:
23
24
As demais frequncias podero ser inseridas como frmulas e replicadas para todas
as classes, conforme segue:
Classes
xi (Terico)
xi (Excel)
fi
Fi
fi %
Fi %
15 | 20
19,99
16
16
26,67%
26,67%
20 | 25
24,99
16
32
26,67%
53,33%
25 | 30
29,99
10
42
16,67%
70,00%
30 | 35
34,99
11
53
18,33%
88,33%
35 | 40
39,99
60
11,67%
100,00%
60
100,00%
Total
Grfico de Colunas
o tipo de grfico utilizado para a apresentao de sries cronolgicas, categricas
(atributos) e de localizao (departamentos, regies).
Algumas dicas para a utilizao desses dos grficos de coluna:
Sugere-se no utilizar esse tipo de grfico para um nmero muito grande de observaes e/ou variveis.
Tal qual o histograma, sugere-se a utilizao de dois eixos (principal e secundrio),
quando as unidades das variveis analisadas so diferentes. Exemplo: nmeros
absolutos e porcentagem.
Agora vamos elaborar um grfico de colunas no Excel. Para tanto, vamos utilizar o
exemplo acima.
Selecione as clulas que contm os dados do exemplo. Clique em Inserir, em seguida em Grfico. Aparecero vrias opes de grficos, clicar no Grfico de Colunas,
em seguida mais uma srie de opes, agora s de grficos de coluna ser ofertada.
Escolha aquele que desejar e for adequado ao trabalho que est realizando.
25
26
Basta escolher o tipo de grfico de coluna desejado e clicar enter que o grfico j estar
pronto. Caso queira, poder fazer uma srie de ajustes para melhorar o grfico elaborado.
No caso de duas unidades diferentes, o ideal que cada unidade esteja associada a
um eixo vertical, ou seja, deve trabalhar com um eixo vertical principal e um eixo vertical
secundrio, conforme o exemplo abaixo.
Evoluo das Indenizaes Pagas por Natureza
no 1o Trimestre de 2012 Quantidade e %
Para elaborar um grfico de coluna e linha no Excel so necessrios alguns macetes. Tais como, criar uma coluna vertical secundria e mudar o tipo de grfico para
uma das variveis analisadas.
Perceba no exemplo acima que o eixo vertical esquerdo est em quantidade de indenizaes pagas, enquanto que o eixo vertical direito em porcentagem. Para elaborar
esse grfico no Excel sero necessrios os seguintes procedimentos:
1o) clique com o boto direito do mouse sobre a coluna da porcentagem, aberta a Janela,
clique em Formatar Srie de Dados.
A janela Formatar Srie de Dados se abrir, sendo que a primeira opo para formatao a Opes de Srie, escolher Plotar srie no Eixo Secundrio.
27
28
Perceba que a coluna da quantidade de indenizaes sumiu. Para resolver isso, vamos mudar o tipo de grfico da coluna %. Para tanto, clique com o boto direito do
mouse sobre a coluna, e escolha Alterar tipo de grfico na janela que se abrir.
Uma dica importante, desde que a srie estatstica no seja muito longa adicionar os rtulos (valores das variveis) no grfico. Para tanto, basta clicar com o
boto direito do mouse sobre a coluna e sobre a linha, quando houver, e solicitar
Adicionar rtulo de dados, e o grfico ficar com a seguinte aparncia:
29
30
Para elaborar o grfico acima no Excel siga os mesmos passos do exemplo de Grfico
em Colunas, exceto que dever escolher a opo de grfico em barras.
Histograma
utilizado para apresentao de dados de uma tabela de distribuio de frequncias.
No deixa de ser um grfico de colunas, porm com algumas caractersticas peculiares.
So representadas as variveis ou intervalos de classes no eixo horizontal e as frequncias no eixo vertical.
fi
Histograma simples
Grfico de disperso
31
32
Num histograma para variveis discretas, o polgono das frequncias uma linha
que une os pontos mdios das bases superiores das colunas. A rea do polgono igual
rea do histograma (colunas).
Vamos nos basear no exemplo acima para elaborar um Histograma no Excel. No caso
do Histograma o Excel possui uma Ferramenta de Anlise que nos permite no apenas
elaborar uma tabela de Distribuio de Frequncias, igual quela que j elaboramos, mas
tambm preparar o grfico correspondente, ou seja, o histograma da distribuio.
Para tanto, clique em Dados, e em seguida em Anlise de Dados. Abrir uma janela
com diversas ferramentas de anlise, escolha a opo Histograma.
33
Assim como demonstrado anteriormente, a apresentao do grfico pode ser aprimorada para melhorar a compreenso do mesmo, basta explorar os diversos recursos
do Excel.
Frequncia
34
Assim como a tabela de distribuio de frequncias, o histograma pode ser complementado a partir do clculo das demais frequncias (absolutas e relativas) j discutidas,
lembrando que quando houver diferentes unidades aconselhvel a utilizao de dois
eixos verticais (o principal e o secundrio).
Assimetria
Negativamente
Assimtrica
Mdia
Moda
Simtrica
Mediana
Possitivamente
Assimtrica
Moda
Mdia
Mediana
Curtose
Leptocrtica
Mesocrtica
Platicrtica
35
36
Existem tcnicas estatsticas que nos permitem calcular tanto o grau de assimetria
de uma curva de frequncia quanto de Curtose. No entanto, nos restringiremos apenas
s avaliaes conceitual e grfica dessas medidas.
Sudeste
80.364.410;
42,1%
Norte
15.864.454;
8,3%
Nordeste
53.081.950;
27,8%
Basta clicar no grfico selecionado e a operao ser realizada. Uma srie de melhorias no aspecto visual do grfico poder ser feita, apenas clique com o boto direito
do mouse sobre o grfico para efetu-las.
37
38
Uma das melhorias sugeridas a incluso dos valores da srie no prprio grfico.
Para tanto, clique com o boto direito exatamente sobre o grfico, ao abrir a janela escolha Adicionar Rtulo de Dados.
Mas ainda possvel incluir os percentuais. Para tanto, clique novamente sobre o
grfico e, em seguida, em Formatar Rtulos de Dados na janela aberta.
Ao abrir a Janela Formatar Rtulo de Dados, clique nas opes desejadas, sempre
objetivando tornar ainda mais clara a interpretao dos resultados.
Busque sempre explorar todas as opes que o software nos fornece, e se no gostar
do resultado s desfazer a opo escolhida.
39
Grfico de Linhas
Geralmente utilizado para descrever sries temporais, principalmente quando so
bastante longas. O grfico de linhas, por descrever uma srie temporal, permite que o
leitor identifique a tendncia do fenmeno analisado ao longo do tempo.
Sugere-se que se a varivel apresentar uma amplitude muito grande de um momento
para o outro, o grfico seja separado de tal modo que a tendncia possa ser mais visvel.
No exemplo abaixo possvel ver uma situao em que uma grande amplitude no
permite ver, em detalhes, o comportamento do ndice de inflao a partir de 1994.
ndice Geral de Preos IGP-DI 1945/2011 em %
40
Fonte: FGV
Para esse caso reitera-se a sugesto de separar o grfico, de tal modo que se possa detalhar o comportamento do aumento dos preos. Perceba, no exemplo abaixo, que o ndide
de inflao tem oscilado bastante aps 1994. No grfico anterior essas variaes no eram
visveis, em funo dos elevados ndices registrados entre os anos de 1986 e 1995.
Assim como os demais grficos, o grfico de linha pode ser complementado com
rtulos, bem como uma srie de ajustes podem ser feitos para melhorar a apresentao
e facilitar sua compreenso.
em %
Fonte: FGV
Recomenda-se, ainda, que para sries temporais curtas no seja utilizado o grfico
de linhas. Nesse caso, o grfico de colunas ser mais apropriado.
41
Perceba que os pontos esto bastante prximos uns dos outros, e seguem uma
tendncia crescente, corroborando a hiptese de associao entre renda e aumento do
nmero de pessoas empregadas, que tem como contrapartida a reduo do nmero
de pessoas desempregadas.
Pessoas Ocupadas Renda Mdia (R$) (PME/IBGE)
42
Para reforar essa constatao, que apenas visual, o Excel dispe de um recurso
adicional, que permite a incluso de uma linha de tendncia, que mede o grau de associao entre as duas variveis. Para tanto, o software estima uma funo matemtica
Renda Mdia = f (Nmero de pessoas ocupadas), e mede o Coeficiente de Determinao
R 2 (que o quadrado do Coeficiente de Correlao entre variveis).
Vamos elaborar o grfico do exemplo anterior, e incluir a linha de tendncia para o
grfico acima.
Para tanto, selecione as clulas em que se encontram os dados observados para as
duas variveis (apenas as colunas cujos dados sero utilizados para efeito de construo
do grfico. Observe que a coluna do perodo no far parte do grfico, logo no est
sendo selecionada. Em seguida, Clique em inserir, Grficos e escolha um dos Grficos
de Diperso apresentados.
Uma vez elaborado o grfico, clique com o boto direito do mouse sobre os dados e
pea para Adicionar Linha de Tendncia.
43
44
Em seguida uma janela, chamada Formatar Linha de Tendncia se abrir. Nessa janela
ser solicitada a escolha de tipo de Tendncia (funo matemtica) que ser utilizada, o
que requer uma certa experincia por parte do pesquisador, ou que a mesma j seja definida previamente pelo estudo em questo. No nosso exemplo escolhemos uma tendncia
Linear. Vrias outras informaes so requeridas, vamos escolher apenas duas delas:
que seja informada a Equao da linha de tendncia e o Coeficiente de Determinao
que mede o grau de associao entre as variveis.
em R$
y = 0,1646x 2195,9
R = 0,9291
Pictrogramas
Geralmente so grficos de barras horizontais ou de colunas, mas com a diferena
que as barras e colunas so substitudas por figuras, cujo tamanho procura reproduzir
as propores das variveis analisadas.
Esse tipo tem um objetivo mais visual do que tcnico, e so mais apropriados para
apresentaes ou textos menos formais.
Para elaborar um Pictograma no Excel necessrio, inicialmente, criar um grfico
de colunas (ou de barras horizontais) primeiro. Uma vez criado o grfico, clique com o
boto direito do mouse sobre as colunas, e em seguida sobre Formatar Srie de Dados.
Escolha Preenchimento, e em seguida Preenchimento da Imagem ou Textura, em Arquivos escolha uma imagem previamente gravada e pronto, ela ser anexada s colunas
do grfico.
45
46
11.719
10.000
8.000
6.314
6.000
5.084
4.000
2.000
0
So Paulo Capital
Interior
Bom, esses so os principais grficos utilizados para complementar a tarefa de apresentar um conjunto de dados. Porm, outros tipos de grficos podem ser encontrados
tanto nos livros de estatstica quanto no prprio Excel.
ETAPA 1
Permite ao
usurio escolher o
modelo de grfico
desejado (Pizza,
colunas, barras,
linhas...)
ETAPA 2
Pede ao usurio
que escolha e
indique os dados
numricos a
partir dos quais
ser elaborado o
grfico
ETAPA 3
Permite escolher
a diagramao do
grfico (colocao
de ttulos, escolha
de cores, tipos de
bordas...)
ETAPA 4
Salva o grfico
necessrio
que voc j
tenha os dados
previamente
disponveis em
uma tabela
Para saber mais sobre montagem de grficos no Excel, veja uma aula virtual na
pgina www.mat 1 xyz......com.br. L voc poder ver com detalhes a confeco
de grficos.
47
48
Participao
no mercado
% de
participao
Previso
R$ 12.000
12%
+12 %
R$ 135.000
5%
R$ 120.000
CONCORRNCIA
Crescimento
Regio Norte
25 %
+4 %
Regio Sul
12 %
22%
+ 76 %
Regio Leste
15 %
R$ 2.000
13%
5%
Regio Oeste
15%
CO
R$ 20.000
18%
+23%
Regio Oeste
5%
SU
R$ 132.000
No determ.
------
Tot
------------
72%
CONCORRNCIA
CONCORRNCIA
Regio Norte
Regio Sul
Regio Leste
Regio Oeste
Repetio da
palavra Regio.
Seria melhor
o ttulo
CONCORRNCIA
POR REGIO
4) Alinhe os valores numricos sua direita. Isto permite melhor visualizao das grandezas envolvidas. Caso haja a presena de valores negativos eles podem ser coloridos
ou negritados para chamar a ateno. comum em atos contbeis coloc-los entre
parnteses. Neste caso use uma legenda logo abaixo da tabela indicando algo como
( ) ...valores negativos.
Participao
% de
no mercado participao
Previso
Participao
no mercado
(em R$)
Participao
(em %)
Previso
(em %)
R$ 12.000
12%
+12 %
12.000
12
12
R$ 135.000
5%
+4 %
135.000
R$ 120.000
22%
+ 76 %
120.000
22
76
R$ 2.000
13%
5%
2.000
13
R$ 20.000
18%
+23%
20.000
18
23
R$ 132.000
No determ.
-----
132.000
----------
-------
MELHOR
Valores indeterminados
devem ser representados
por traos. Nunca misture
notaes diferentes, ou
use zero ou f (vazio).
Use zero exclusivamente
para zero.
49
50
PARTICIPAO NO
MERCADO
(em R$)
PARTICIPAO
(em %)
PREVISO
NORTE
12.000
12
12
SUL
135.000
LESTE
120.000
22
76
OESTE
2.000
13
(5)
CENTRO-OESTE
20.000
18
23
SUDESTE
132.000
-------
------
( ) ...valores negativos
Fonte: Diretoria de Planejamento e Marketing (agosto 2009)
As caractersticas apresentadas neste captulo podem no possuir rigor adequado para trabalhos acadmicos e cientficos em nveis mais elaborados. Nosso objetivo foi proporcionar ao aluno alguns conceitos bsicos de comunicao
visual, uma vez que ele est tomando os primeiros contatos com o tema de maneira mais aplicada sua futura prtica
de trabalho. Ao longo de seu curso de graduao, espera-se que o aluno aprimore tais conhecimentos.
1
51
Exerccios
52
8,0
9,0
8,0
8,0
8,0
9,0
5,0
8,0
6,0
6,0
6,0
7,0
8,0
4,0
10,0
7,0
6,0
10,0
6,0
5,0
5,0
7,0
2,0
8,0
7,0
10,0
8,0
a) Organize o rol.
b) Monte uma tabela de frequncias, indicando a frequncia
simples, a frequncia relativa simples, a frequncia acumulada e a frequncia relativa acumulada.
c) Com a ajuda do Excel, monte grficos que mostrem o
desempenho do restaurante.
2) A tabela abaixo indica o tamanho do estabelecimento por nmero de funcionrios, em 31 de dezembro de 2011, no setor
de atividades auxiliares dos servios financeiros, seguros,
previdncia complementar, planos de sade e de resseguros
no municpio de So Paulo, de acordo com o tamanho do
estabelecimento:
Tamanho do
Estabelecimento por
nmero de funcionrios (xi)
Nmero de
Estabelecimentos
(fi)
De 1 a 4
3.011
De 5 a 9
2.480
De 10 a 19
3.228
De 20 a 49
5.906
De 50 a 99
6.217
De 100 a 249
9.271
De 250 a 499
11.070
De 500 a 999
Total
7.102
48.285
Medidas Resumo
Temos insistido ao longo dos captulos anteriores sobre a principal funo da Estatstica Descritiva, que seria a capacidade de resumir dados e apresent-los de forma
acessvel e de fcil compreenso. Para tanto, exploramos nos captulos anteriores a
forma de faz-lo, atravs de tabelas e grficos.
Uma outra forma de obter elementos que permitam caracterizar sries de valores
estabelecer algumas medidas resumo, ou seja, encontrar um ou mais nmeros que
representem todos os demais valores que compem o estudo. So as chamadas medidas
de posio (medidas de tendncia central e separatrizes).
Tais medidas representam um valor ao redor do qual os elementos da srie esto
distribudos; em uma representao grfica, posicionaria a srie em um eixo horizontal,
localizando um determinado valor em torno do qual a srie se concentra.
Num passo seguinte, no prximo captulo, ser discutida a qualidade destas medidas resumo como representantes do todo, ou seja, estudaremos se, de fato, este valor
competente para representar toda uma populao ou amostra.
O quadro a seguir, mostra algumas caractersticas destas medidas de tendncia central:
Tipo
Representao
Usos e Caractersticas
Mdia
x (amostra) ou
(populao)
Mediana
md
Moda
mo
53
54
MDIAS
Talvez sejam as medidas de posio mais comumente utilizadas, o que acaba muitas
vezes representando um problema, uma vez que so usadas indiscriminadamente (quando
seria mais adequado o uso da mediana ou da moda), causando percepes distorcidas
do fenmeno estudado.
Costuma ser usada de forma incompleta, pois a utilizao da mdia implica na
necessidade do clculo de outra grandeza chamada desvio (disperso), que ser estudada
no captulo seguinte.
Por exemplo, se um aluno tirou, em trs avaliaes, as notas zero, cinco e dez, supondo que o peso de cada prova o mesmo, a mdia desse aluno ser cinco. Perceba que
a mdia desse aluno no reflete com exatido o seu desempenho, uma vez que ele tirou
uma nota muito ruim (zero) e uma nota mxima (dez). Para avaliar o comportamento
desse fenmeno, e de qualquer outro, o ideal utilizar outras medidas estatsticas, sobretudo aquelas que vo medir a disperso dos dados observados no exemplo as trs
notas em relao mdia.
Portanto, expressar uma mdia sem seu correspondente valor de desvio pode implicar
em grave erro de avaliao de um fenmeno.
Os diferentes tipos de mdias so representados a seguir:
Mdia
Aritmtica Simples
Aritmtica Ponderada
Geomtrica
Geomtrica Ponderada
Harmnica
Mas agora vamos formalizar esse clculo, utilizando as frmulas apropriadas para
tanto. Neste caso, como representa uma mdia aritmtica simples, a frmula utilizada
para tanto a seguinte:
MEDIDAS RESUMO
Podemos refazer esse clculo levando em considerao as frequncias das notas, para
tanto vamos dispor essas notas numa tabela de distribuio de frequncia comum:
xi
fi
Total
10
Neste caso, vamos utilizar uma nova frmula que utilize as frequncias como uma
forma de ponderar as notas.
Perceba que o elemento no numerador da frmula passou a ser multiplicado (ponderado) pela frequncia, e o denominador a somatria da frequncia, que corresponde
exatamente ao nmero de dados observados. Precisamos, primeiramente, multiplicar os
dados observados (notas) pelas respectivas frequncias:
xi
fi
xi fi
15
12
14
Total
10
57
55
56
fi
xi fi
10
10
Total
15
Voc deve estar se perguntando porque complicar tanto o clculo de uma simples mdia.
O fato que situaes mais complexas, tais como a utilizao de uma grande quantidade
de dados observados ou sries estatsticas j dispostas em distribuies de frequncias,
passam a requerer essa forma de calcular a mdia. Os exemplos utilizados realmente no
demandam a utilizao da frmula para o clculo da mdia, mas com esses exemplos
procuramos demonstrar como a interpretao dessa medida estatstica fcil.
O exemplo seguinte demonstra o clculo da mdia para uma varivel contnua ou
para uma distribuio de frequncias agrupada em classes. Assim como no exemplo dos
dez alunos, neste caso calculamos a mdia aritmtica ponderada que pode ser obtida
a partir de uma tabela de distribuio de frequncias.
Vale lembrar que nesses casos os dados observados so apresentados em intervalos,
como no exemplo abaixo, em que na primeira classe os valores observados vo de 2
(inclusive) a 6 (exclusive), e assim por diante.
xi
fi
2 | 6
6 | 10
10 | 14
14 | 18
Total
10
MEDIDAS RESUMO
xi
fi
xi fi
2 | 6
(2+6) / 2
4 . 4 = 16
6 | 10
(6 + 10 ) / 2
8 . 2 = 16
10 | 14
(10+14)/2
12
12 . 1 =12
14 | 18
(14+18)/2
16
16 . 3 = 48
10
94
Uma vez identificado o ponto mdio de cada intervalo, basta aplicar a frmula da
mdia tal qual fizemos no exemplo anterior:
Mdia Ponderada
Outra medida de posio comumente utilizada a mdia ponderada. Essa medida
semelhante obtida a partir da distribuio de frequncias. Como observamos, em
uma distribuio de frequncias, elas assumem a funo de ponderao na composio
da somatria dos dados observados.
No caso a seguir essa mesma perspectiva existe. A diferena que passamos a chamar
tal componente de peso ou ponderao (pi). No exemplo a seguir temos uma empresa
que est buscando apurar a sua margem de lucro, que obtida a partir da venda de seis
produtos com participaes e taxas de retorno diferentes.
Para que possamos identificar o lucro auferido com os seis produtos devemos, inicialmente, calcular a participao de cada produto no volume total de vendas e, assim,
compor os pesos ou ponderaes de cada um deles.
Uma vez que calculamos o peso de cada produto devemos multiplic-los pela respectiva margem de lucro. A somatria desses resultados compe a mdia ponderada da
margem de lucro da empresa.
57
58
Produtos
Vendas
Margem de Lucro
(xi)
Participao nas
Vendas (pi)
xi pi
Produto A
R$ 60.000
4,00%
0,3158
1,2632%
Produto B
R$ 40.000
6,00%
0,2105
1,2632%
Produto C
R$ 30.000
8,00%
0,1579
1,2632%
Produto D
R$ 25.000
3,00%
0,1316
0,3947%
Produto E
R$ 20.000
5,00%
0,1053
0,5263%
Produto F
R$ 15.000
7,00%
0,0789
0,5526%
Total
R$ 190.000
5,26%
Sinistralidade
Ms/Ano
Sinistralidade
jul/10
0,65
jul/11
0,68
ago/10
0,64
ago/11
0,72
set/10
0,64
set/11
0,68
out/10
0,63
out/11
0,68
nov/10
0,65
nov/11
0,69
dez/10
0,6
dez/11
0,63
jan/11
0,67
jan/12
0,7
fev/11
0,66
fev/12
0,68
mar/11
0,65
mar/12
0,72
abr/11
0,63
abr/12
0,69
mai/11
0,68
mai/12
0,72
jun/11
0,68
jun/12
0,7
Fonte: SUSEP
MEDIDAS RESUMO
Para que o Excel identifique todos os dados da tabela, lembre-se que os mesmos
devero estar dispostos numa nica coluna.
59
60
Mediana
A mediana (md) um valor que separa o rol em duas partes com o mesmo nmero de
elementos, ou seja, o valor que ocupa a posio central do conjunto de dados observados.
Clculo da mediana para variveis discretas:
Na srie 8, 4, 5, 9, 5, 2, 7 teramos:
ROL:
2 4 5 5 7 8 9
MEDIDAS RESUMO
Portanto, a Mediana do conjunto de dados acima Md=5, ou seja, esse valor divide
o rol exatamente ao meio. Perceba que 50% dos dados esto abaixo da mediana e 50%
acima. Para calcular a Mediana necessrio identificar o Elemento Mediano (EMd), que
corresponde posio, no rol, em que se encontra a Mediana.
Quando o nmero de dados observados mpar, neste caso so sete dados, o
elemento mediano calculado da seguinte maneira:
, ou seja, a Mediana est na quarta posio, ou o quarto elemento
da srie de dados, que para esse caso igual a 5.
Rol
Posio
Dados
Quando a srie possui um nmero par de elementos, temos dois termos centrais:
(n /2) e (n/2 + 1). Exemplo: na srie 7, 21, 13, 15, 10, 8, 9, 13
61
62
De acordo com a frmula acima, o elemento mediano est na quarta posio. Porm, como j foi demonstrado, esse valor no est dividindo a srie
exatamente ao meio, por isso se faz necessrio o segundo passo:
2o passo) Calcule a mdia simples do valor que est na quarta posio e na posio
imediatamente posterior, ou seja, na quinta posio, que para esse exemplo
so os valores 10 e 13.
Rol
Posio
Dados
10
13
13
15
21
Idades (xi)
fi
18 | 22
22 | 26
26 | 30
30 | 34
34 | 38
Total
21
MEDIDAS RESUMO
Portanto, o valor mediano na posio 10,5. Para identificar a classe em que se encontra esse valor mediano precisamos complementar a distribuio com a Frequncia
Acumulada.
Classe
Idades (xi)
fi
Fi
18 | 22
22 | 26
26 | 30
15
30 | 34
19
34 | 38
21
21
Total
Intervalo
(idades)
fi
Fi
26 | 30
15
7
Classe mediana
Este intervalo de quatro elementos (26 a 30 anos) possui oito funcionrios, ento
podemos dividi-lo de forma adequada:
Idades:
26 anos
Termo da srie:
md
30 anos
x=?
7o
10,5o
15o
63
64
Ou seja:
15 7
4
10,5 7
x
ou seja
8
4
10,5 7
Desta forma, Md = 26 + x md = 26 +
x
10,5 7
8
x=
10,5 7
8
.4
. 4 md = 27,8
onde:
l md Limite inferior da classe onde se encontra o valor mediano;
EMd Elemento mediano;
Fant Frequncia acumulada da classe anterior classe onde se encontra o valor mediano;
f Md Frequncia simples da classe onde se encontra o valor mediano; e
h Amplitude do intervalo onde se encontra o valor mediano.
MEDIDAS RESUMO
Escolha uma clula e clique em fx, e uma nova janela Inserir funo se abrir.
Uma vez aberta a janela Inserir funo escolha a funo Med (de Mediana), e em seguida
clique OK.
65
66
Moda
A moda (mo) o valor que possui maior frequncia em uma srie, ou seja, o valor
que mais se repete na srie.
No caso de tratarmos com variveis discretas, basta identificar no rol ou na tabela
de distribuio a varivel que possui maior frequncia.
Exemplo 1
No rol 5 5 6 6 6 9 10 12 12
Mo = 6
Caso tivssemos este mesmo rol expresso na forma de uma tabela de distribuio:
xi
fi
10
12
Mo = 6
MEDIDAS RESUMO
Exemplo 2
No Rol 2 3 4 4 5 5 6 7 8 9.
Existem dois valores modais: Mo=4 e Mo=5. Uma srie pode ter mais do que
dois valores modais.
Exemplo 3:
No Rol 1 2 3 4 5 6 7 8 9 10.
Neste caso, no existe nenhum dado observado que se repete, logo, dizemos que
a srie AMODAL.
Onde,
Mo o valor modal;
lmo o limite inferior da classe em que se encontra o valor modal;
fpost frequncia simples da classe posterior quela em que se encontra o valor modal;
fant o limite inferior da classe anterior quela em que se encontra o valor modal; e
h a amplitude da classe em que se encontra o valor modal.
Calculemos a Moda para o exemplo abaixo, que apresenta a distribuio de idades
dos 21 funcionrios de uma empresa:
Classe
Idades (xi)
fi
18 | 22
22 | 26
26 | 30
30 | 34
34 | 38
Total
21
67
68
O primeiro passo consiste em identificar a classe em que se encontra o valor modal, que
para o exemplo em questo a terceira, uma vez que este intervalo apresenta a maior frequncia. Em seguida, apliquemos a frmula identificando cada um dos seus elementos:
MEDIDAS RESUMO
D OK, e o valor da Moda ser apresentado na clula escolhida, que para o presente
exemplo igual a 0,68.
69
70
Q1
Q2
Q3
Mediana
D2
D3
D4
D5
D6
D7
D8
D9
Mediana
C2...
C10...
C40...
C50...
C60...
C70...
C90...
C95...
C99
Mediana
Observe nas figuras acima que para as trs medidas separatrizes possvel identificar um valor mediano correspondente, pois essa estatstica alm de ser uma medida
de tendncia central, tambm tem a funo de uma separatriz ao dividir exatamente ao
meio uma srie de dados. Portanto, o valor da mediana o mesmo do segundo quartil,
do quinto decil e do quinquagsimo centil.
Vamos trabalhar sobre um exemplo, para que possamos calcular as trs medidas separatrizes, bem como interpretar os seus resultados. A srie abaixo, apresentada numa distribuio
de frequncias comum, representa a idade de 110 clientes da Corretora Alpha com idade entre
18 e 39 anos, que contrataram seguro de automvel num determinado perodo.
xi
fi
18
19
20
10
21
12
22
15
23
18
24
21
25
23
Total
110
MEDIDAS RESUMO
Vamos calcular o primeiro quartil (Q1). Para tanto, precisamos identificar a posio
desse valor, ou seja, precisamos o elemento do primeiro quartil
O resultado acima indica que o Q1 est na 27,5a posio no rol. Para identificarmos
essa posio na srie precisamos de mais uma informao, a frequncia acumulada:
xi
fi
18
19
11
20
10
21
21
12
33
22
15
48
23
18
66
24
21
87
25
23
110
Total
110
sio, ou seja, est na stima classe, o que significa que 75% dos clientes dessa amostra
tm at 24 anos de idade.
Baseando-nos no mesmo exemplo, vamos calcular agora o quarto decil (D4), para
o qual o elemento decil
decil est na 44a posio da srie, ou na quinta classe, logo D4=22, o que significa que
40% dos clientes dessa amostra tm entre 18 e 22 anos.
Ainda em relao ao exemplo acima, vamos calcular o 60o centil. Neste caso, o
elemento centil ser
na 66a posio, temos que o D60=23. Portanto, 60% dos clientes da amostra tm entre
18 e 23 anos de idade.
Como os dados do exemplo anterior esto dispostos numa distribuio de frequncia
simples ou comum, foi possvel realizar o clculo das medidas separatrizes baseando-se
71
72
apenas nos correspondentes elementos, que ao indicarem a posio das medidas nos
forneceram a classe (ou a idade dos clientes). Porm, quando trabalhamos com variveis
contnuas ou com uma distribuio de frequncias agrupadas em classes, precisamos calcular um valor aproximado que corresponder aos quartis, decis ou centis desejados.
Suponha que a Corretora Alpha tenha 140 clientes que contrataram seguro residencial, e que estamos interessados em avali-los de acordo com a faixa salarial (em
salrios mnimos) de cada um deles. Para tanto, foi elaborada a seguinte distribuio
de frequncias:
xi
fi
5 | 10
10
10
10 | 15
17
27
15 | 20
25
52
20 | 25
35
87
25 | 30
21
108
30 | 35
18
126
35 | 40
14
140
Total
140
Baseado no exemplo acima, vamos calcular o primeiro quartil (Q1). Assim como
na distribuio anterior, precisamos identificar o elemento quartil, que neste caso ser
. De acordo com o resultado, o Q1 est na 35a posio, ou seja, na
terceira classe. Lembre-se, nessa classe se encontram os valores da srie (ou do rol) que
esto dispostos entre 28a e a 52a posio. Porm, como a distribuio est agrupada em
classes, precisaremos recorrer a uma frmula, semelhante a da mediana, para poder
encontrar o valor do primeiro quartil, que ser a seguinte:
Sendo que:
lQi o limite inferior da classe em que se encontra o i-simo quartil;
EQi o i-simo quartil;
FAnt a frequncia acumulada da classe anterior quela em que se encontra o i-simo
quartil;
fQi a frequncia simples da classe em que se encontra o i-simo quartil; e
h a amplitude da classe em que se encontra o i-simo quartil.
MEDIDAS RESUMO
Muito bem, agora precisamos encontrar o Elemento Decil, que neste caso ser
. Como o quinto decil est na 70a posio da srie temos que o
mesmo se encontra na quarta classe (20 | 25 salrios mnimos). Neste sentido, temos:
. Portanto, 50% dos clientes dessa
carteira ganham at 22,6 salrios mnimos.
Lembre-se que 5o decil, assim como o 2o quartil e o 50o centil correspondem mediana
da srie, assim sendo, o valor calculado acima tambm representa o valor mediano da
srie. Aplique a frmula da mediana para tirar a prova do que est sendo afirmado.
Para finalizar as medidas separatrizes, vamos calcular o 65o centil, sendo que a frmula para o clculo dos decis :
centil
O resultado indica que 65% dos clientes da carteira de seguro residencial da Corretora
Alpha tem uma renda de at 26 salrios mnimos.
73
74
Em seguida uma nova janela, denominada Argumentos da Funo se abrir, solicitando que seja informada a Matriz, que corresponde srie de dados, e o K, que se refere
ao i-simo percentil. Note que tanto o clculo dos quartis quanto dos decis e dos centis
ser realizado a partir dessa funo Percentis. Basta indicar o valor percentil proporcional
medida que busca calcular, sendo que o intervalo desse valor vai de 0 a 1.
MEDIDAS RESUMO
75
76
Para o clculo dos decis a lgica a mesma. Por exemplo, para calcular o 4o decil
(que corresponde ao 40o centil), indique para o valor percentil 0,4.
MEDIDAS RESUMO
Por fim, o clculo dos centis corresponde ao prprio Percentil, sendo que qualquer valor
indicado entre 0 e 1 resultar no i-simo centil. Por exemplo, o clculo do 65o centil.
O centil calculado ser igual a 24, lembrando que de acordo com esse resultado 65%
dos clientes analisados pela amostra tm at 24 anos de idade.
Uma vez abordadas as medidas estatsticas denominadas de Tendncia Central e Separatrizes, vamos abordar, agora, as medidas que permitem complementar a anlise descritiva
de uma srie de dados a partir de medidas que nos permitem analisar a disperso (ou variabilidade) dos dados observados da srie em relao s medidas de Tendncia Central.
77
Exerccios
78
8,0
9,0
8,0
8,0
8,0
9,0
5,0
8,0
6,0
6,0
6,0
7,0
8,0
4,0
10,0
7,0
6,0
10,0
6,0
5,0
5,0
7,0
2,0
8,0
7,0
10,0
8,0
Nmero de
Estabelecimentos
(fi)
De 1 a 4
3.011
De 5 a 9
2.480
De 10 a 19
3.228
De 20 a 49
5.906
De 50 a 99
6.217
De 100 a 249
9.271
De 250 a 499
11.070
De 500 a 999
7.102
Total
48.285
Medidas de Disperso
Piloto B
Decolar
10
Pousar
zero
Nota mdia:
Tomando sua deciso somente pelo valor da mdia voc incorrer em um erro de
julgamento grave, pois o piloto A no sabe sequer pousar o avio. J analisando a distribuio de notas dos candidatos, podemos observar um maior equilbrio das habilidades
do piloto B, que seria uma melhor opo.
79
80
O fato de preferirmos o piloto B deve-se comparao da sua nota mdia com cada
uma das suas habilidades, ou seja:
Piloto A
Piloto B
Decolar
10
Pousar
zero
Nota mdia:
desvios
10
Desvio: 5 5 = 0
para as duas
habilidades do piloto B
Para o piloto A teramos as seguintes diferenas (desvios) entre a mdia e suas notas,
que devem ser calculadas em valores absolutos (mdulo):
d A = d1 + d2 = |10-5| + |0-5| = 5 + 5 = 10 (maior desvio total)
J para o piloto B:
d B = d1 + d2 = |5-5| + |5-5| = 0 + 0 = 0 (menor desvio total)
Cuidado
Se no utilizssemos o valor absoluto, teramos para o piloto A: (5-10) + (5-0) =
-5 + 5 = 0 o que daria a falsa impresso que no existem diferenas entre os dois pilotos, pois ambos teriam desvios iguais a zero! De qualquer forma, devemos lembrar
que no existem notas negativas; o fato de ocorrer um desvio -5 indica apenas que
ele est abaixo da mdia, e +5 est acima da mdia, como em uma escala.
Pousar
Decolar
Piloto A:
-5
mdia ( x ) = 5
+5
MEDIDAS DE DISPERSO
Desvios (di)
Decolar
10
d1 = |10 5| = 5
Pousar
Zero
d2 = | 0 5 | = 5
di = 5+5 = 10
81
82
Desvios (di)
d1 = |5 5| = 0
Pousar
d2 = |5 5| = 0
Decolar
di = 0 + 0 = 0
Amplitude
DMS
CV%
Piloto A
10 0 = 10
100 %
Piloto B
5 5=0
0%
MEDIDAS DE DISPERSO
Elevar um valor de desvio ao quadrado evita que tenhamos valores negativos, porm
aumenta seu valor, que fica bastante ampliado em relao realidade. Uma forma de
compensarmos este aumento indevido determinarmos a raiz quadrada da varincia,
que o chamado desvio-padro, representado pela letra grega sigma ()
Temos ento:
2
e
comum associarmos ao clculo dos desvios-padro um Coeficiente de variao
percentual, expresso por uma razo entre o desvio-padro e a mdia da srie, ou seja:
Por que utilizar este artifcio, elevar ao quadrado e depois extrair a raiz quadrada? No seria mais simples trabalharmos com o valor absoluto (mdulo), ou seja,
usar o desvio-mdio simples (DMS) em vez do desvio-padro ()?
Na realidade o clculo do valor absoluto no uma operao algbrica (adio,
multiplicao, extrao de razes ou potenciao com valores inteiros ou fracionados),
o que causar dificuldades em clculos posteriores de inferncias estatsticas.
Tal fato no acontece com a varincia, que possui maior versatilidade algbrica.
Por exemplo, a varincia possui a propriedade aditiva: duas populaes independentes,
com varincias distintas, ao terem um elemento de cada populao escolhidos aleatoriamente e somados, apresentaro uma varincia igual soma da varincia das populaes
de onde foram extrados.
J o uso de valores absolutos criaria dificuldades neste tipo de clculo.
Desta forma, mais comum o uso do desvio-padro () do que o desvio-mdio
simples (DMS), no dia a dia da estatstica. Compare as duas formas de clculo:
Na srie: 2 4 4 4 5 6 6 6 9 9
x = (2 + 12 + 5 + 18 + 18) / 10 = 5,5
n = 10
Repare que nos clculos dos desvios abaixo, poderamos calcular o desvio de cada
uma das medidas individualmente, um a um, ou multiplic-los pela sua frequncia ( f i).
Por exemplo, o valor 4 aparece trs vezes no rol, o que permite calcular uma vez seu
desvio e multiplic-lo por trs agilizando o trabalho.
83
84
fi
xi X fi
|2 5,5| . 1 = 3,5
|4 5,5| . 3 = 4,5
|5 5,5| . 1 = 0,5
|6 5,5| . 3 = 4,5
|9 5,5| . 2 = 9,0
10
= 22,0
xi
fi
( xi X )2 fi
10
= 50,7
MEDIDAS DE DISPERSO
observe que os clculos dos dois tipos de desvios resultam em valores diferentes,
porm ambos podem ser usados para medir a disperso de uma srie em torno de
sua mdia;
o clculo do desvio-padro () necessita do clculo prvio da varincia (2);
o clculo da varincia (2), neste primeiro momento, s tem utilidade como passo
intermedirio para determinao do desvio-padro (), mas em tpicos avanados
de estatstica ter papel fundamental na anlise de dados;
as unidades dimensionais da mdia e dos desvios correspondem s dimenses originais dos dados, ou seja, se estivermos tratando com idades, o valor mdio ser
expresso, por exemplo, em anos, assim como qualquer um dos desvios. A dimenso
da varincia (2), no entanto, no ter significado prtico (anos2);
qualquer um dos tipos de desvios adotados acima (DMS ou ), apoiados pelo clculo
da amplitude (A), permitem uma avaliao segura de dados;
se estivermos trabalhando com uma nica populao o clculo do coeficiente de
variao (CV%) opcional;
a maior utilidade do coeficiente de variao (CV%) o de permitir uma comparao
entre duas populaes diferentes; e
as ideias desenvolvidas at o momento neste captulo so aplicveis a populaes e precisam de algumas adaptaes para o uso em amostras, conforme veremos a seguir.
85
86
Desvio-mdio simples
Desvio-mdio simples
Varincia e desvio-padro
Varincia e desvio-padro
MEDIDAS DE DISPERSO
Suponha que o exemplo da Corretora Alpha de 140 clientes que contrataram seguro
residencial seja uma amostra extrada do total de clientes de todos os tipos de seguro
comercializado pela corretora. Vamos avaliar esses clientes, de acordo com a faixa salarial
(em salrios mnimos) de cada um deles, calculando a renda mdia (Mdia) e as disperses
em relao mdia (Desvio-Mdio, Desvio-Padro e Coeficiente de Variao).
xi
fi
5 | 10
10
10 | 15
17
15 | 20
25
20 | 25
35
25 | 30
21
30 | 35
18
35 | 40
14
Total
140
xi
fi
xi
xi fi
xi X
xi X fi
5 | 10
10
7,5
75
15,3571
153,571
10 | 15
17
12,5
212,5
10,3571
176,0707
15 | 20
25
17,5
437,5
5,3571
133,9275
20 | 25
35
22,5
787,5
0,3571
12,4985
25 | 30
21
27,5
577,5
4,6429
97,5009
30 | 35
18
32,5
585
9,6429
173,5722
35 | 40
14
37,5
525
14,6429
205,0006
Total
140
3.200
952,1414
87
88
fi
xi
xi fi
( xi X )2
( xi X )2 fi
5 | 10
10
7,5
75
235,8405
2.358,4052
10 | 15
17
12,5
212,5
107,2695
1.823,5818
15 | 20
25
17,5
437,5
28,69852
717,4630
20 | 25
35
22,5
787,5
0,12752
4,4632
25 | 30
21
27,5
577,5
21,55652
452,6869
30 | 35
18
32,5
585
92,98552
1.673,7394
35 | 40
14
37,5
525
214,4145
3.001,8033
Total
140
3.200
10.032,1429
Varincia:
Desvio-Padro:
MEDIDAS DE DISPERSO
Para calcular o Desvio-Mdio lembre-se que os dados devem estar dispostos numa
nica coluna. Escolha uma clula em branco e clique em inserir funo, ou no cone fx,
para abrir a janela funo. Selecione a Categoria Estatstica, e a funo Desv. Mdio.
89
90
MEDIDAS DE DISPERSO
91
92
Fonte: FUNENSEG
MEDIDAS DE DISPERSO
93
94
MEDIDAS DE DISPERSO
7,0
3,0
8,0
8,0
9,0
8,0
8,0
8,0
9,0
5,0
8,0
6,0
6,0
6,0
7,0
8,0
4,0
10,0
7,0
6,0
10,0
6,0
5,0
5,0
7,0
2,0
8,0
7,0
10,0
8,0
a) Calcule o desvio-mdio.
b) Calcule o coeficiente de variao.
c) Calcule o desvio-padro.
d) Calcule o coeficiente de variao.
2) A tabela abaixo indica o tamanho do estabelecimento por nmero de funcionrios, em 31 de dezembro de 2011, no setor
de atividades auxiliares dos servios financeiros, seguros,
previdncia complementar, planos de sade e de resseguros
no municpio de So Paulo, de acordo com o tamanho do
estabelecimento:
Tamanho do
Estabelecimento
por nmero
de funcionrios
registrados (Xi)
Nmero de
Estabelecimentos
(fi)
De 1 a 4
3.011
De 5 a 9
2.480
De 10 a 19
3.228
De 20 a 49
5.906
De 50 a 99
6.217
De 100 a 249
9.271
De 250 a 499
11.070
De 500 a 999
7.102
Total
48.285
a) Calcule o desvio-mdio.
b) Calcule o coeficiente de variao.
c) Calcule o desvio-padro.
d) Calcule o coeficiente de variao.
Ex
xe
e rr c
c c
c ii o
os
s
E
95
Exerccios
96
Exerccios Complementares
As tabelas a seguir indicam os vnculos empregatcios ativos
em 31 de dezembro de 2011, no setor de atividades auxiliares
dos servios financeiros, seguros, previdncia complementar,
planos de sade e de resseguros no municpio de So Paulo.
1) De acordo com a remunerao em salrios mnimos:
Remunerao em
Salrio Mnimo
(Xi)
Nmero de Funcionrios
Registrados (fi)
At 0,50
11
0,51 a 1,00
274
1,01 a 1,50
3.964
1,51 a 2,00
5.265
2,01 a 3,00
8.617
3,01 a 4,00
6.009
4,01 a 5,00
3.983
5,01 a 7,00
5.372
7,01 a 10,00
4.800
10,01 a 15,00
4.076
15,01 a 20,00
2.052
Total
44.423
Pede-se:
a) Complete a tabela de distribuio de frequncia com a fr (%),
F e Fr (%).
b) Calcule a mdia e analise o resultado.
c) Calcule a moda e analise o resultado.
d) Calcule a Mediana e analise o resultado.
e) Calcule o 1o e o 3o quartil e analise os resultados.
f) Calcule o 3o e o 7o Decil e analise os resultados.
g) Calcule o Coeficiente de Variao a partir do Desvio-Mdio.
h) Calcule o Coeficiente de Variao a partir do Desvio-Padro.
i) Calcule o 33o e o 67o centil e analise os resultados.
j) Calcule o Coeficiente de Variao a partir do Desvio-Mdio.
h) Calcule o Coeficiente de Variao a partir do Desvio-Padro.
i) Analise os resultados.
MEDIDAS DE DISPERSO
Faixa Etria
(Xi)
10 a 14
15 a 17
18 a 24
25 a 29
30 a 39
40 a 49
50 a 64
Total
Nmero de Funcionrios
Registrados (fi)
1
293
8.871
11.212
16.966
7.710
3.050
48.103
Pede-se:
a) Complete a tabela de distribuio de frequncia com a fr (%),
F e Fr (%).
b) Calcule a mdia e analise o resultado.
c) Calcule a moda e analise o resultado.
d) Calcule a Mediana e analise o resultado;
e) Calcule o 1o e o 3o quartil e analise os resultados.
f) Calcule o 3o e o 7o Decil e analise os resultados.
g) Calcule o Coeficiente de Variao a partir do Desvio-Mdio.
h) Calcule o Coeficiente de Variao a partir do Desvio-Padro.
i) Calcule o 33o e o 67o centil e analise os resultados.
j) Calcule o Coeficiente de Variao a partir do Desvio-Mdio.
h) Calcule o Coeficiente de Variao a partir do Desvio-Padro.
i) Analise os resultados.
3) De acordo com o grau de escolaridade
Grau de Instruo
(Xi)
Analfabeto
At 5a incompleto
5a completo
a
6 a 9a fundamental
Fundamental completo
Mdio incompleto
Mdio completo
Superior incompleto
Superior completo
Mestrado
Doutorado
Total
Nmero de Funcionrios
(fi)
1
75
132
241
655
1.173
14.668
8.871
22.119
289
61
48.285
Ex
xe
e rr c
c c
c ii o
os
s
E
97
98
FORMULRIO RESUMO
1) Mdia Aritmtica
a) Dados Brutos (No Agrupados)
b) Dados Agrupados em Tabelas de Frequncia Variveis Discretas
c) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas
2) Mdia aritmtica
3) Mediana
a) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas
Onde:
l md Limite inferior da classe onde se encontra o valor mediano;
EMd Elemento mediano;
Fant Frequncia acumulada da classe anterior classe onde se encontra o valor mediano;
f Md Frequncia simples da classe onde se encontra o valor mediano; e
h Amplitude do intervalo onde se encontra o valor mediano.
4) Moda
a) Dados Agrupados em Tabelas de Frequncia Variveis Contnuas
Moda de King:
Onde:
Mo o valor modal;
lmo o limite inferior da classe em que se encontra o valor modal;
fpost frequncia simples da classe posterior quela em que se encontra o valor modal;
fant o limite inferior da classe anterior quela em que se encontra o valor modal; e
h a amplitude da classe em que se encontra o valor modal.
MEDIDAS DE DISPERSO
5) Amplitude total
99
100