Sie sind auf Seite 1von 44

1

Visualizando informaes

Primeiras impresses
Quero ficar bonita e
bem-arrumada para causar a
impresso certa.

Voc no consegue diferenciar entre fatos e nmeros? 


A estatstica ajuda voc a dar sentido aos confusos conjuntos de dados,
transformando aquilo que complexo em algo simples. E, quando voc tiver
descoberto o que realmente est acontecendo, ser necessrio achar uma
forma de visualizar a situao e cont-la para os outros. Portanto, se voc
quer escolher o melhor grfico para seu trabalho, pegue suas coisas, no se
esquea da sua melhor rgua de clculo e embarque conosco nesta viagem
Terra da Estatstica.

este um captulo novo 1

bem-vindo terra da estatstica!

A estatstica est por toda parte


Para qualquer lugar que voc olhar, encontrar a estatstica, seja navegando na
Internet, praticando esportes ou analisando sua pontuao no seu videogame
favorito. Mas o que realmente vem a ser estatstica?
Estatstica so nmeros que resumem fatos e nmeros puros dando-lhes algum
significado. Ela apresenta idias-chave que podem no estar imediatamente
aparentes ao observar dados puros; quando usamos a palavra dados, queremos
dizer fatos ou nmeros com base nos quais podemos tirar concluses. Como
exemplo, no preciso analisar minuciosamente toda a pontuao dos times
de futebol quando tudo que voc deseja saber a posio do seu time favorito
no campeonato. Nesse caso, basta um pouco de estatstica para rapidamente ter
acesso s informaes de que voc precisa.
O estudo da estatstica abrange vrios aspectos, entre eles a origem da estatstica,
como calcul-la e como us-la de forma eficaz.

Colha os dados

to
Na raiz da estatstica es
m
de
po
os dados. Estes
o
ser colhidos analisand
,
tes
as fontes existen
ou
realizando experincias
.
as
uis
sq
conduzindo pe

Analise
Com os dados em mos, vo
c
pode analis-los e gerar da
dos
estatsticos. possvel calcu
lar
a probabilidade de determi
nados
eventos ocorrerem, testar
idias e
indicar a confiana que vo
c tem nos
resultados obtidos.

Tendo analisado os dados,


voc toma decises e faz
previses.

2 Captulo 1

Tire concluses

visualizando informaes

Mas por que aprender estatstica?


Entender o que realmente est acontecendo em estatstica lhe d mais
poder. Se voc realmente entender estatstica, conseguir tomar decises
objetivas, fazer previses precisas e inspiradas e transmitir a mensagem
que deseja da forma mais eficaz possvel.
A estatstica pode ser uma excelente maneira de resumir verdades
essenciais sobre dados, mas ela tambm possui um lado obscuro.
Voc
pode usar a estatstica
para ajudar a explicar
coisas sobre o mundo.

Voc pode
dizer o que bem
entender usando
estatstica. At mesmo
mentir.

A estatstica baseada em fatos, mas, mesmo assim, eles podem s vezes ser enganosos.
Podem ser usados para dizer a verdade ou a mentira. O problema como saber
quando esto dizendo a verdade a voc e quando esto contando uma mentira.
Ter um bom conhecimento em estatstica coloca voc em uma posio privilegiada.
Voc se torna muito mais bem preparado para dizer quando determinados dados
estatsticos esto errados ou so enganosos. Em outras palavras, o estudo da estatstica
uma excelente forma de ter certeza de que voc no vai ser enganado.
Como exemplo, veja os lucros obtidos por uma empresa no ltimo semestre do ano
passado.

Ms

Jul

Lucro (milhes) 2,0

Ago

Set

Out

Nov

Dez

2,1

2,2

2,1

2,3

2,4

O lucro est
se mantendo constante,
mas no chega a ser algo
extraordinrio.

Caramba! As
aes da empresa
esto simplesmente
detonando!

Como pode haver duas interpretaes para os


mesmos dados? Vamos examinar isso mais de perto.
voc est aqui 4 3

diferenas na interpretao de dados

A histria de dois grficos


Como explorar essas duas interpretaes diferentes para os mesmos dados?
Precisamos de alguma maneira de visualiz-los. Se preciso visualizar
informaes, nada melhor que usar um grfico. Grficos podem ser uma
forma rpida de resumir informaes puras e podem ajud-lo a ter uma
noo do que est acontecendo com um rpido olhar. Mas preciso ter
cuidado, pois at mesmo os grficos mais simples podem ser usados para
sutilmente engan-lo e confundi-lo.

Lucro da empresa por ms

Viu s o que eu
disse? O lucro
praticamente o mesmo
a cada ms.

2,5
2,0
1,5
1,0
0,5
0,0

Jul

De forma
alguma! O lucro
est esplndido. Olhe
s como ele cresce!

4 Captulo 1

Ago

Set

Out

Nov

Dez

Ms

Ambos os grficos so baseados nas


mesmas informaes, mas parecem
totalmente diferentes. O que est
acontecendo?
Lucro (milhes de dlares)

Lucro (milhes de dlares)

Veja dois grficos mostrando os lucros de uma empresa durante seis meses.
Eles so baseados nas mesmas informaes, mas por que parecem diferentes?
Eles apresentam verses drasticamente diferentes das mesmas informaes.

Lucro da empresa por ms


2,5
2,4
2,3
2,2
2,1
2,0

Jul

Ago

Set

Out

Ms

Nov

Dez

visualizando informaes

Observe os dois grficos da pgina anterior. Em sua


opinio, quais seriam as diferenas principais? Como
pode haver diferena na primeira impresso que temos
dos dados?

no existem

P:
R:

Perguntas Idiotas

Por que no se basear simplesmente nos


dados? Por que coloc-los em um grfico?
s vezes, difcil enxergar o que realmente est
acontecendo observando-se simplesmente os dados puros.
Pode haver padres e tendncias existentes nos dados,
mas eles podem ser difceis de identificar se voc estiver
analisando uma grande quantidade de nmeros. Os grficos
oferecem uma forma de literalmente enxergar os padres
existentes em seus dados. Eles permitem visualizar os dados
e ver o que est realmente acontecendo em um rpido
passar de olhos.

P:
R:

Qual a diferena entre informaes e dados?

Dados se referem a fatos e nmeros puros que


foram colhidos. Informaes so dados que possuem
algum tipo de significado adicional.

Como exemplo, tome os nmeros 5, 6 e 7. Sozinhos,


eles so simplesmente nmeros. No se sabe o que
eles significam ou representam. Eles so dados. Se
algum lhe disser que estas so as idades de trs
crianas, voc passa a ter informaes, pois os nmeros
passam a ter um significado

voc est aqui 4 5

aponte seu lpis soluo

O primeiro grfico mostra que o lucro


relativamente constante. Isso obtido
com o eixo vertical comeando em 0 e,
em seguida, marcando-se o lucro para
cada ms em funo disso.
Observe bem com
o
os eixos verticais
so diferentes em
cada grfico.
O segundo grfico d uma impresso
diferente fazendo com que o eixo
vertical comece em um lugar diferente e
ajustando a escala proporcionalmente.
primeira vista, os lucros parecem estar
aumentando drasticamente a cada ms.
S quando voc olha mais de perto
que consegue ver o que est realmente
acontecendo.
O eixo desse grfico comea em
2,0, e no em 0. Por isso, no de
causar surpresa que o lucro parea
to esplndido.

Lucro (milhes de dlares)

Ambos os grficos so baseados nos


mesmos dados existentes, mas cada um
deles envia uma mensagem diferente.

Lucro (milhes de dlares)

Observe os dois grficos da pgina anterior. Em sua opinio,


quais seriam as diferenas principais? Como pode haver
diferena na primeira impresso que temos dos dados?

Lucro da empresa por ms

2,5
2,0
1,5
1,0
0,5
0,0

Jul

Ago

Out

Nov

Dez

Ms
Lucro da empresa por ms

2,5
2,4
2,3
2,2
2,1
2,0

Jul

Ago

Por que me preocupar


com grficos? Os softwares
grficos resolvem tudo por voc;
para isso que eles existem.

Softwares no podem pensar por voc.


Softwares grficos podem lhe poupar bastante tempo e gerar grficos
eficientes, mas, ainda assim, necessrio entender o que est
acontecendo.
Ao final do dia, os dados so seus, e voc responsvel por escolher
o grfico certo para o trabalho e ter certeza de que seus dados sejam
apresentados da forma mais eficaz possvel transmitindo a mensagem
que voc deseja.
Softwares podem traduzir dados em grficos, mas voc o
responsvel por garantir que o grfico esteja correto.

6 Captulo 1

Set

Set

Out

Ms

Nov

Dez

visualizando informaes

A empresa Manic Mango precisa de alguns grficos


Manic Mango, uma empresa de jogos criativos que est
comeando a dominar o mundo, est precisando de algum que
entenda de grficos. O diretor executivo foi convidado a fazer uma
importante apresentao na prxima exposio mundial de jogos.
Ele precisa de alguma forma rpida e persuasiva de apresentar
dados e pediu que voc providenciasse o que fosse necessrio. H
muita coisa pegando carona nesse barco. Se a apresentao for
boa, a Manic Mango conseguir mais receitas de patrocinadores, e
possvel que voc ganhe um bnus generoso pelo seu esforo.
A primeira coisa que o diretor deseja fazer comparar a
porcentagem de jogadores satisfeitos para cada gnero de jogo.
Ele comeou a tarefa inserindo os dados que possui em um
software grfico, e aqui esto os resultados:

Outros
1.500
Armas
3.500
Ao
6.000

Estratgia
11.500

Esporte
27.500

Unidades Vendidas por Gnero

PODERDO
CREBRO
Observe o grfico de setores que o diretor elaborou. O que representa
cada fatia? O que voc pode inferir com relao popularidade relativa
dos diferentes gneros de videogame?

voc est aqui 4 7

anatomia de um grfico de setores

O humilde grfico de setores


Grficos de setores funcionam dividindo seus dados em categorias ou grupos
distintos. O grfico consiste de um crculo dividido em fatias de pizza, cada
qual representando um grupo. O tamanho de cada fatia proporcional
quantidade de algo em cada grupo em comparao com os outros. Quanto
maior a fatia, maior a popularidade relativa daquele grupo. A quantidade de
algo em determinado grupo chamada de freqncia.
Grficos de setores dividem seu conjunto inteiro de dados em grupos distintos.
Isso significa que, se voc somar a freqncia de cada fatia, obter 100%.
Vamos examinar mais de perto nosso grfico de setores mostrando a quantidade
de unidades vendidas por gnero:

Outros

Armas 1.500
3.500
Ao

6.000

Estratgia

Essa fatia muito menor


que as outras, o que
significa que as vendas
so muito inferiores para
essa categoria.
Essa fatia muito
maior que todas as
outras, o que significa
que a freqncia maior
para essa categoria.

Gnero

Unidades
vendidas

Esporte

27.500

Estratgia

11.500

Ao

6.000

Armas

3.500

Outros

1.500

Esporte
27.500

11.500

r cada
Voc pode identifica cia
ando sua freqn
Unidades Vendidas por Gnero fatia us
.
ou uma porcentagem

Ento quando os grficos de


setores so teis?
J vimos que o tamanho de cada fatia representa
a freqncia relativa de cada grupo de dados que
voc est exibindo. Por causa disso, os grficos de
setores podem ser teis se voc deseja comparar
propores bsicas. Geralmente, fcil dizer
primeira vista quais grupos tm uma freqncia alta
em comparao com os outros. Grficos de setores
so menos teis se todas as fatias tiverem tamanhos
semelhantes, pois se torna difcil visualizar
diferenas sutis entre os tamanhos das fatias.
E o grfico de setores que o diretor executivo da
Manic Mango criou?

8 Captulo 1

Estatstica vital

Freqncia
A freqncia descreve quantos itens
existem em um determinado grupo
ou intervalo. Ela uma contagem
de quantos itens existem.

visualizando informaes

Falha no grfico
O grfico de setores funcionou to perfeitamente para exibir as unidades
vendidas por gnero que o diretor executivo decidiu criar outro grfico para
demonstrar a satisfao dos consumidores com os jogos da Manic Mango.
O diretor precisa de um grfico que permita comparar a porcentagem de
jogadores satisfeitos para cada gnero de jogo. Ele rodou os dados novamente
no software grfico, mas, dessa vez, no ficou to impressionado assim.
O que houve aqui? Todas as
fatias tm o mesmo tamanho, mas
as porcentagens so todas diferentes
e muito maiores que as fatias. Ser que
voc poderia me ajudar a consertar
este grfico? Agora?

Outros
85%

Esporte
99%

Armas
95%

Grficos de setores so usados


para comparar as propores de
grupos ou categorias diferentes,
mas, neste caso, h pouca variao
entre cada grupo.
difcil perceber primeira vista qual categoria
tem um nvel mais alto de satisfao entre
jogadores.

Diretor
executivo da
Manic Mango

Geralmente, tambm um pouco confuso


identificar os grficos de setores com
porcentagens que no esto relacionadas
proporo total da fatia. Como exemplo, a fatia
referente a Esporte identificada com 99%,
mas ela preenche somente cerca de 20% do
grfico. Outro problema que no sabemos
se h um nmero igual de respostas para
cada gnero; por isso, no sabemos se justo
comparar a satisfao entre gneros dessa forma.

Estratgia
90%
Ao
85%
Porcentagem de
Jogadores Satisfeitos
por Gnero

Grficos
de setores
representam
propores

PODERDO
CREBRO
Observe os dados e pense nos problemas que existem com este grfico.
Que tipo de grfico seria melhor para esse tipo de informao?

voc est aqui 4 9

dois tipos de grfico de barras

Grficos de barras oferecem mais preciso


Uma forma melhor para exibir esse tipo de dados utilizar um grfico
de barras. Assim como grficos de setores, grficos de barras permitem
comparar tamanhos relativos, mas a vantagem de utilizar um grfico de
barras que ele permite um maior grau de preciso. So ideais em situaes
em que as categorias tm praticamente o mesmo tamanho, pois possvel
identificar com muito mais preciso qual categoria tem a freqncia mais
alta. Torna-se mais fcil enxergar as pequenas diferenas.
Em um grfico de barras, cada barra representa uma determinada categoria,
e o comprimento da barra indica o valor. Quanto mais longa a barra, maior
o valor. Todas as barras tm a mesma largura, o que facilita sua comparao.
Grficos de barras podem ser traados vertical ou horizontalmente.

Grficos de barras verticais


Grficos de barras verticais mostram categorias no eixo horizontal e a
freqncia ou a porcentagem no eixo vertical. A altura de cada barra indica
o valor de sua categoria. Veja um exemplo mostrando os nmeros das
vendas em unidades para cinco regies, A, B, C, D e E:

A escala
referente
s vendas
fica aqui.

a as
A altura de cada barra mostr la regio.
ue
aq
ra
pa
s
de
vendas em unida

10000
9000
8000

Vendas (unidades)

7000
6000

Vendas (unidades)

Cada barra
representa uma
regio.

5000
4000
3000
2000
1000
0

Vendas por Regio em Unidades

10 Captulo 1

Regio

Vendas
(unidades)

1.000

5.000

7.500

8.000

9.500

visualizando informaes

Grficos de barras horizontais


Grficos de barras horizontais so como grficos de barras verticais,
exceto pelo fato de que os eixos so invertidos. Em grficos de barras
horizontais, as categorias so mostradas no eixo vertical e a freqncia ou
a porcentagem no eixo horizontal.
Veja um grfico de barras horizontais para representar os dados que
o diretor colheu para cada gnero de jogos na pgina 9. Como pode
ser visto, bem mais fcil identificar rapidamente qual categoria tem o
maior valor e qual tem o menor valor.
O comprimento de cada

Todas as barras so
desenhadas horizontalmente.

barra
representa a porcentagem de
jogadores satisfeitos para
aquele gnero.

Porcentagem de Jogadores
Satisfeitos por Gnero

Esporte

Porcentagem Satisfeita

Estratgia

Gnero

Porcentagem
Satisfeita

Ao

Armas

Outros

Cada barra
representa
um gnero.

10

20

30

40

50

60

70

80

90

Esporte

99%

Estratgias

90%

Ao

85%

Armas

95%

Outros

80%

100

Porcentagem Satisfeita

s so
As porcentagen la
ca
es
mostradas na
horizontal.

Grficos de barras verticais tendem a ser mais comuns, mas grficos


de barras horizontais so teis se os nomes de suas categorias forem
muito longos. Eles lhe do mais espao para mostrar o nome de cada
categoria sem ter de escrever de lado as identificaes das barras.
O grfico de barras verticais mostra
freqncia, e o grfico de barras horizontais
mostra porcentagens. Mas quando devo
usar freqncias e quando devo usar
porcentagens?

Depende de qual mensagem voc deseja transmitir.


Vamos olhar isso mais de perto.
voc est aqui 4 11

uma olhada em escalas

uma questo de escala


A compreenso do uso de escalas permite criar excelentes grficos de
barras destacando os principais fatos que voc deseja realar. Mas tenha
cuidado as escalas tambm podem esconder fatos essenciais sobre seus
dados. Vejamos como isso acontece.

Usando escalas de porcentagem


Vamos comear observando mais a fundo o grfico de barras que mostra
a satisfao dos jogadores por gnero de jogo. O eixo horizontal mostra a
satisfao dos jogadores em termos de porcentagem, o nmero de pessoas em
cada grupo de 100 pessoas que esto satisfeitas com aquele gnero.
Porcentagem de Jogadores
Satisfeitos por Gnero
Esporte

Porcentagem Satisfeita

Estratgia
Ao
Armas
Outros
0

10 20 30 40 50 60 70 80 90 100

Aqui esto as porcentagens.

Porcentagem Satisfeita

A finalidade deste grfico permitir a comparao de diferentes porcentagens e


tambm a leitura das porcentagens a partir do grfico.
Mas h um probleminha ele no nos diz quantos jogadores existem para cada gnero.
Isso pode no parecer importante, mas significa que no temos nenhuma idia de
se ele reflete a viso de todos os jogadores, de apenas alguns deles ou at mesmo de
alguns poucos. Em outras palavras, no sabemos at que ponto essas informaes so
representativas dos jogadores como um todo. A regra para traar grficos que mostram
porcentagens tentar indicar as freqncias, no prprio grfico ou ao lado dele.

Tenha bastante cuidado quando lhe for fornecida uma


porcentagem sem nenhuma freqncia ou uma
freqncia sem nenhuma porcentagem.

s vezes, essa uma ttica usada para esconder fatos essenciais


sobre os dados existentes, pois apenas com base no grfico
impossvel saber at que ponto ele representativo dos dados. Voc pode pensar
que uma grande porcentagem de pessoas prefere um determinado gnero de jogo,
mas descobrir que somente 10 pessoas foram questionadas. Ou, por outro lado, voc
pode descobrir que 10.000 jogadores gostam mais de jogos esportivos, mas tal nmero
sozinho no lhe diz se essa uma proporo alta ou baixa entre todos os jogadores
de videogame.
12 Captulo 1

visualizando informaes

Usando escalas de freqncia


possvel mostrar freqncias em sua escala em vez de
porcentagens. Isso facilita ver exatamente quais so as freqncias
e comparar valores.

Quantidade de Jogadores Satisfeitos por Gnero


Satisfeitos

Esporte

antas
Este grfico reflete qu
itas,
pessoas esto satisfe em.
ntag
em vez de usar porce

Estratgia
Ao
Armas
Outros
0

5000 10000 15000 20000 25000 30000

Quantidade Satisfeita

Normalmente, sua escala deve comear em 0, mas tome cuidado! Nem


todos os grficos fazem isso, e, como visto anteriormente na pgina 6,
usar uma escala que no comea em 0 pode dar uma primeira impresso
diferente para seus dados. Isso algo a que voc deve ficar atento nos
grficos de outras pessoas, pois muito fcil passar despercebido dando
a impresso errada sobre os dados.

Ento voc est


me dizendo que tenho que
escolher entre mostrar a
freqncia ou porcentagens?
E se eu quiser usar
ambas?

H maneiras de se desenhar grficos de barras


que lhe oferecem mais flexibilidade.
O problema com esses grficos de barras que eles mostram a
quantidade de jogadores satisfeitos ou a porcentagem e mostram
apenas jogadores satisfeitos.
Vejamos como dar um jeito nesse problema.

voc est aqui 4 13

dois conjuntos de dados em um nico grfico de barras

Trabalhando com vrios conjuntos de dados


Em grficos de barras, na verdade, bastante fcil mostrar mais de um conjunto
de dados. Como exemplo, podemos mostrar a porcentagem de jogadores
satisfeitos e a porcentagem de jogadores insatisfeitos no mesmo grfico.

Grfico de barras com diviso por categorias


Uma maneira de resolver essa questo usar uma barra para a freqncia de
jogadores satisfeitos e outra para os insatisfeitos, para cada gnero. Esse tipo
de grfico til se voc deseja comparar freqncias, mas difcil enxergar
propores e porcentagens.
Satisfao dos Jogadores por Gnero
Satisfeitos

Esporte

Insatisfeitos
Estratgia
Ao
Armas
Outros
0

5000 10000 15000 20000 25000 30000

Freqncia

Grfico de barras segmentado


Se voc deseja mostrar freqncias e porcentagens, tente usar um grfico de
barras segmentado. Para isso, use uma barra para cada categoria, mas divida a
barra proporcionalmente. O comprimento total da barra reflete a freqncia total.
Esse tipo de grfico permite rapidamente ver a freqncia total de cada categoria
nesse caso, o nmero total de jogadores para cada gnero e a freqncia da
satisfao dos jogadores. possvel tambm ver rapidamente as propores.
Satisfao dos Jogadores por Gnero
Satisfeitos

Esporte

Insatisfeitos

Estratgia
Ao
Armas
Outros
0

14 Captulo 1

5000 10000 15000 20000 25000 30000

Freqncia

visualizando informaes

O diretor executivo precisa de outro grfico para a apresentao


que vai fazer. Observe os dados fornecidos e tente esboar o
grfico de barras.
Continente

Vendas
(unidades)

Amrica do Norte

1.500

Amrica do Sul

500

Europa

1.500

sia

2.000

Oceania

1.000

frica

500

Antrtida

Veja outro quadro gerado pelo software. Qual foi o


gnero mais vendido em 2007? Como foram as vendas
desse gnero em 2006?

Vendas por Gnero


2006

Esporte

2007

Gnero

Estratgia

Ao

Armas

Outros
0

5000

10000

15000

20000

25000

30000

Vendas
voc est aqui 4 15

solues dos exerccios

O diretor executivo precisa de outro grfico para a apresentao que vai


fazer. Observe os dados fornecidos e tente esboar o grfico de barras.
Vendas por Continente
Amrica do Norte

Vendas
(unidades)

Continente

Vendas
(unidades)

Amrica do Norte 1.500


Amrica do Sul

500

Europa

1.500

sia

2.000

Oceania

1.000

frica

500

Antrtida

Continente

Amrica do Sul
Europa
sia
Oceania
frica
Antrtida
0

200

400

600

800 1000 1200 1400 1600 1800 2000

Vendas

Veja outro quadro gerado pelo software. Qual foi o


gnero mais vendido em 2007? Como foram as vendas
desse gnero em 2006?

Vendas por Gnero


2006

Esporte

2007

Gnero

Estratgia

O gnero Esporte foi o que mais vendeu em


2007. Foram vendidas 27.500 unidades.

Ao

Em 2006, foram vendidas apenas 14.000


unidades desse gnero; portanto, menos que
em 2007. Em 2006, o gnero Estratgia vendeu
mais unidades que qualquer outro gnero.

Armas

Outros
0

5000

10000

15000

20000

25000

30000

Vendas
16 Captulo 1

visualizando informaes

Seus grficos de barras so o mximo


O diretor executivo est entusiasmado com os grficos de barras que voc construiu,
mas ainda h mais dados que ele precisa apresentar em sua conferncia.

timo trabalho! Estes grficos vo ser um grande


sucesso na exposio. Tenho outra tarefa para voc.
Estamos testando um novo jogo com um grupo de
voluntrios e precisamos de um grfico para mostrar
a diviso das pontuaes por jogo. Veja os dados:

As pessoas podem marcar


entre 0 e 999 pontos, e
os dados so divididos em
grupos. Como exemplo,
alguns jogadores marcaram
entre 0 e 199 em cinco
ocasies diferentes.

Pontuao

Freqncia

0-199

200-399

29

400-599

56

600-799

17

800-999

Estes dados parecem


diferentes dos outros tipos de
dados que vimos at agora. Ser que por
causa disso devemos trat-los de forma
diferente?

A freqncia o
nmero de vezes que
uma pontuao
atingida dentro de
cada intervalo.

PODERDO
CREBRO
Faa uma reviso no captulo. Que diferena voc
acha que existe nesse tipo de dados? Que impacto
voc acha que isso poderia ter nos grficos?

voc est aqui 4 17

dados numricos e categricos

Categorias versus nmeros


Ao trabalhar com grficos, uma das principais coisas que voc precisa descobrir
o tipo de dados com que est trabalhando. Descoberto isso, ser muito mais fcil
tomar decises importantes sobre qual grfico necessrio para melhor representar
os seus dados.

Dados categricos ou
qualitativos
A maioria dos dados que vimos
at agora composta por dados
categricos. Os dados so divididos em
categorias que descrevem qualidades
ou caractersticas. Por esse motivo,
tambm so chamados de dados
qualitativos. Um exemplo de dados
qualitativos so os gneros dos jogos;
cada gnero forma uma categoria
separada.
O principal a ser lembrado com
relao a dados qualitativos que
os valores dos dados no podem ser
interpretados como nmeros.

raas
de ces
tipo de
sobremesa

Dados numricos ou quantitativos


Dados numricos, por outro lado, trabalham com nmeros.
Eles so dados onde os valores tm significado como
nmeros, e isso envolve medidas ou contagens. Dados
numricos tambm so chamados de dados quantitativos,
pois descrevem quantidades.

comprimento
Ento, qual o impacto que isso tem nos grficos da Manic Mango?

18 Captulo 1

peso

tempo

visualizando informaes

Trabalhando com dados agrupados


Pontuao Freqncia

As pontuaes
so numricas
e agrupadas em
intervalos

O ltimo conjunto de dados do diretor


executivo da Manic Mango numrico,
e, alm disso, as pontuaes esto
agrupadas em intervalos. Portanto, qual
a melhor forma de representar esses
dados em um grfico?

0-199

200-399

29

400-599

56

600-799

17

800-999

fcil, no basta usar


um grfico de barras como
fizemos anteriormente?
Podemos tratar cada grupo como
uma categoria separada.

Sim, poderamos, mas h uma maneira melhor.


Em vez de tratar cada intervalo de pontuao como uma categoria
separada, podemos aproveitar o fato de que os dados so
numricos e apresent-los usando uma escala numrica contnua.
Isso significa que, em vez de usar barras para representar um
nico item, podemos usar cada barra para representar um
intervalo de pontuaes.
Para isso, podemos criar um histograma.
Histogramas so como grficos de barras, mas com duas
importantes diferenas. A primeira que a rea de cada barra
proporcional freqncia, e a segunda que no h nenhum
espao vazio entre as barras no grfico. Veja um exemplo de
histograma mostrando o nmero mdio de jogos comprados por
ms por residncias na Terra da Estatstica:

A rea de
cada barra
proporcional
freqncia.

Freqncia

Nmero de Jogos Comprados por Ms


3

No h espaos vazios
entre as barras.

-1

Os valores so
mostrados em uma
escala numrica
contnua.

Nmero de Jogos
voc est aqui 4 19

construindo um histograma

Para criar um histograma, comece


achando as larguras das barras
O primeiro passo para criar um histograma observar cada
intervalo e descobrir a largura que cada um deve ter, bem
como qual intervalo de valores cada um precisa cobrir.
Enquanto fazemos isso, precisamos ter certeza de que no
haja nenhum espao vazio entre as barras no histograma.
Vamos comear com os dois primeiros intervalos, 0 a
199 e 200 a 399. Pelo que parece, o primeiro intervalo
termina com a pontuao 199, e o segundo comea com a
pontuao 200. No entanto, quando marcamos os pontos
dessa forma ocorre um problema. Acabaramos tendo um
espao vazio entre a pontuao 199 e 200, como a seguir:

199

Pontuao

Freqncia

0199

200399

29

400599

56

600799

17

800999

200

Histogramas no devem ter espaos vazios entre as barras; portanto, para resolver
esse problema, prolongamos seus intervalos um pouco. Em vez de um intervalo
que termina na pontuao 199 e outro que comea na pontuao 200, fazemos
com que os dois intervalos se encontrem em 199,5, da seguinte forma:

199.5

Ao fazer isso, voc cria um limite nico e tem a certeza de que no h


nenhum espao vazio entre as barras no histograma. Se fizermos o
mesmo para o restante dos intervalos, obteremos os seguintes limites:

0-199
-0.5

200-399
199.5

399.5

800-999

600-799

400-599
599.5

799.5

Cada intervalo abrange 200 pontuaes, e a largura de cada intervalo 200. Cada
intervalo tem a mesma largura.
Como todos os intervalos tm a mesma largura, criamos o histograma traando
barras verticais para cada intervalo de pontuao, usando os limites para formar o
ponto inicial e final de cada barra. A altura de cada barra igual freqncia.

20 Captulo 1

999.5

visualizando informaes

Veja novamente os dados referentes Manic Mango.


Pontuao

Freqncia

0199

200399

29

400599

56

600799

17

800999

Tente usar os limites das classes para criar um histograma para esses dados.
Lembre-se de que a freqncia fica no eixo vertical.

60

50

40

30

20

10

100

200

300

400

500

600

700

800

900

1000

voc est aqui 4 21

soluo do exerccio

Veja novamente os dados referentes Manic Mango.


Pontuao

Freqncia

0199

200399

29

400599

56

600799

17

800999

Tente usar os limites das classes para criar um histograma para esses dados.
Lembre-se de que a freqncia fica no eixo vertical.

A freqncia lhe fornece a


altura de cada barra.

Freqncia

60

Pontuaes por jogo

50

Voc usa os limites


de cada intervalo
para encontrar a
A
largura das barras.
barra referente s
pontuaes de 600
a 799 vai de 599,5 a
799,5.

40

30

20

10

100

200

300

400

500

600

700

800

900

Pontuao

22 Captulo 1

1000

visualizando informaes

no existem

Perguntas Idiotas

P:
R:

Ento um histograma usado basicamente


para dados numricos agrupados?

Sim. A vantagem de um histograma que, por ser


numrico, voc pode us-lo para mostrar a largura de
cada intervalo bem como a freqncia.

P:
R:

E se os intervalos tiverem larguras diferentes?


Ainda assim, posso usar um histograma?
Com certeza. mais comum encontrarmos
intervalos com a mesma largura, mas isso no
necessrio quando se trata de histogramas. Existem
mais alguns passos que devem ser seguidos para criar
um histograma com intervalos de tamanhos diferentes,
mas isso ser mostrado mais adiante.

P:
R:

Por que histogramas no devem ter espaos


vazios entre as barras?

H pelo menos dois bons motivos. O primeiro


mostrar que no h espaos vazios nos valores e que
todos os valores esto includos. O segundo para que
a largura do intervalo reflita o intervalo dos valores que
voc est incluindo.

Como exemplo, se marcssemos o intervalo de 0 a 199


prolongando-o do valor 0 ao valor 199, a largura sobre o
grfico seria de apenas 199 0 = 199.

P:
R:

Ento por que fazemos com que as barras se


encontrem no meio do caminho entre os dois?

As barras tm de se encontrar, e isso geralmente


acontece no meio do caminho, mas tudo se resume a
como voc arredonda os seus valores. Ao arredondar
valores, normalmente voc os arredonda para o nmero
inteiro mais prximo. Isso significa que o intervalo de
valores de 0,5 a 0,5 arredondado para 0, e, assim,
quando mostramos 0 no histograma, isso feito usando
o intervalo de valores de 0,5 a 0,5.

P:
R:

H alguma exceo?

Sim, a idade uma exceo. Se voc tiver de


representar o intervalo de idades de 18 a 19 anos em
um histograma, isso normalmente ser feito usando
um intervalo que vai de 18 a 20. O motivo que
normalmente classificamos algum como tendo 19
anos, por exemplo, at seu 20 aniversrio. Na verdade,
arredondamos as idades para baixo.

PONTOS DE BALA

categricos se os nomes das categorias


forem curtos.

Freqncia uma forma estatstica de dizer


quantos itens existem em uma categoria.
Grficos de setores so adequados para
representar propores bsicas.

Grficos de barras oferecem mais


flexibilidade e preciso.
Dados numricos trabalham com nmeros
e quantidades; dados categricos trabalham
com palavras e qualidades.
Grficos de barras horizontais so
usados para dados categricos,
principalmente onde os nomes das
categorias so muito longos.
Grficos de barras verticais so usados
para dados numricos, ou dados

Voc pode representar vrios conjuntos


de dados em um grfico de barras, e
pode escolher como fazer isso. possvel
comparar freqncias mostrando barras
relacionadas lado a lado em um grfico de
barras com diviso de categorias. possvel
mostrar propores e freqncias totais
empilhando as barras uma em cima da outra
em um grfico de barras segmentado.
As escalas dos grficos de barras podem
representar porcentagens ou freqncias.
Existem muitas variedades para cada tipo de
grfico..

voc est aqui 4 23

um problema com intervalos de larguras diferentes

A Manic Mango precisa de outro grfico


O diretor executivo est muito satisfeito com o histograma que
voc criou para ele tanto assim que ele quer que voc crie outro
histograma. Desta vez, ele quer um grfico que mostre quanto tempo os
jogadores tendem a passar jogando jogos da Manic Mango on-line num
perodo de 24 horas. Veja os dados:

horas
Este o nmero de
am
ss
pa
que as pessoas
jogando

Horas

Freqncia

01

4,300

13

6,900

35

4,900

510

2,000

1024

2,100

Esta a freqncia com que


as pessoas jogam durante
esse espao de tempo

H algo de engraado
nesses dados. Eles esto
agrupados como da ltima vez,
mas nem todos os intervalos
tm a mesma largura.

Ele est certo, as larguras dos intervalos no so


todas iguais.
Se voc observar os intervalos, poder ver que eles tm larguras
diferentes. Como exemplo, o intervalo de 10 a 24 abrange muito mais
horas do que o intervalo de 0 a 1.
Se tivssemos acesso aos dados puros, poderamos tentar construir
intervalos com larguras iguais, mas, infelizmente, esses so todos os dados
de que dispomos. Precisamos de uma forma de construir um histograma
que permita que os dados tenham larguras diferentes.

PODERDO
CREBRO
No caso de histogramas, a freqncia proporcional
rea de cada barra. Como voc usaria esse fato
para criar um histograma para esses dados? O que
voc deve levar em considerao?
24 Captulo 1

visualizando informaes

Acho que basta criar o histograma


exatamente como fizemos antes no h maiores
problemas. Desenhamos barras em uma escala
numrica, mas, desta vez, as barras tm larguras
diferentes.

Voc acha que ela est certa?

Freqncia

Veja o esboo do grfico, usando a freqncia na escala vertical


e desenhando barras com larguras proporcionais ao tamanho
de cada intervalo. Voc v algum problema?

Horas de Jogo por Dia

7000
6000
5000
4000

luna
Por que esta co
E?
D
N
to GRA

3000
2000
1000
0
0

9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Horas

A rea da barra de um histograma deve ser proporcional freqncia


O problema que h neste grfico que, ao tentarmos fazer com que a largura
de cada barra refletisse a largura de cada intervalo, as barras acabaram ficando
desproporcionalmente grandes. S de olhar o grfico, possvel que voc tenha
uma falsa impresso do nmero de horas por dia que as pessoas realmente passam
jogando. Como exemplo, a barra que ocupa a maior rea a barra que representa
o intervalo de 10 a 24 horas de jogo, embora a maioria das pessoas no jogue esse
tempo todo.
Como isso um histograma, precisamos fazer a rea da barra proporcional
freqncia que ela representa. Como as barras tm larguras desiguais, o que
devemos fazer com a altura da barra?

voc est aqui 4 25

ajustando a rea da barra

Faa a rea das barras do histograma proporcional


freqncia
At agora, pudemos usar a altura de cada barra para representar
a freqncia de um determinado nmero ou categoria.

No caso de
histogramas,
a freqncia
representada
pela rea da
barra

Desta vez, estamos trabalhando com dados numricos


agrupados onde as larguras dos intervalos so desiguais.
Podemos fazer com que a largura de cada barra reflita a largura
de cada intervalo, mas o problema est no fato de que barras de
largura diferente afetam a rea total de cada barra.
Precisamos ter certeza de que a rea de cada barra seja
proporcional sua freqncia. Isso significa que, se ajustarmos
a largura da barra, tambm precisamos ajustar a altura da barra.
Dessa forma, podemos alterar as alturas das barras para que elas
reflitam a largura do grupo, mas mantemos o tamanho de cada
barra proporcional sua freqncia.
Faamos uma reviso sobre como criar esse novo histograma.

Passo 1: Ache as larguras das barras


Achamos a largura que as barras devem ter observando o intervalo de valores que
elas abrangem. Em outras palavras, precisamos descobrir quantas horas inteiras
so abrangidas por cada grupo.
Tomemos o grupo de 1 a 3. Esse grupo abrange 2 horas inteiras, 1 a 2 e 2 a 3. Isso
significa que a largura da barra precisa ser igual a 2, tendo 1 e 3 como limites.

e2
Este o grupo de 1 a 3; ele abrang
2.
ura
larg
a
,
isso
por
e,
horas inteiras
100

200

300

Calculando o resto das larguras, obtemos:

Horas

Freqncia

Largura

01

4,300

13

6,900

35

4,900

510

2,000

1024

2,100

14

Agora que descobrimos as larguras das barras, podemos


dar um passo adiante e calcular as alturas.

26 Captulo 1

visualizando informaes

Passo 2: Ache as alturas das barras


Agora que temos as larguras de todos os grupos, podemos us-las para achar as
alturas que as barras devem ter. Lembre-se de que precisamos ajustar as alturas das
barras para que a rea total de cada barra seja proporcional freqncia do grupo.
Primeiramente, vamos tomar a rea de cada barra. Dissemos que a freqncia
e a rea so equivalentes. Como j sabemos qual a freqncia de cada grupo,
tambm sabemos quais devem ser as reas:

rea da barra = Freqncia do grupo


Cada barra basicamente apenas um retngulo, o que significa que a
rea de cada barra igual largura multiplicada pela altura. Como a
rea nos fornece a freqncia, isso significa que:

Isto nos foi fornecido


logo no incio;
portanto, sabemos
a rea que estamos
procurando.

Freqncia = Largura da barra Altura da barra


Achamos as larguras das barras no ltimo passo, o que significa que
podemos us-las para achar a altura que cada barra deve ter. Em
outras palavras,

Altura da barra =

Freqncia

rea = freqncia

Altura

Altura da barra

Largura
A altura da barra usada para medir a concentrao da freqncia
em relao a um determinado grupo. uma forma de medir a
densidade da freqncia, uma forma de dizer se os nmeros so
largos ou finos na parte inferior. A altura da barra chamada de
densidade da freqncia.

Qual deve ser a altura de cada barra? Complete a tabela.

Horas

Freqncia

Largura

Altura (densidade da freqncia)

01

4,300

4,300 1 = 4,300

13

6,900

35

4,900

510

2,000

1024

2,100

14
voc est aqui 4 27

desenhe o histograma

Qual deve ser a altura de cada barra? Complete a tabela.

Horas

Freqncia

Largura

Altura (densidade da freqncia)

01

4,300

4,300 1 = 4,300

13

6,900

6,900 2 = 3,450

35

4,900

4,900 2 = 2,450

510

2,000

2,000 5 = 400

1024

2100

14

2,100 14 = 150

Passo 3: Desenhe seu grfico um histograma


Agora que calculamos as larguras e as alturas de cada barra, podemos desenhar o histograma.
Desenhamos o histograma da mesma forma que fizemos antes, exceto pelo fato que, desta vez,
usamos a densidade da freqncia no eixo vertical, e no a freqncia.
Veja nosso histograma revisado.

Densidade da Freqncia

Horas de Jogo por Dia

Esta legenda facilita


enxergar o que a rea
representa. Ela opcional.

5000
4000

Representa 1.000 dias

3000

1000
0

o
A quantidade de espa
am
up
oc
s
rra
que as ba
o
est agora em propor
com os dados.

Observe que no
h espaos vazios
entre as barras.

2000

Embora a barra de 1 a 3 tenha uma


freqncia mais alta, a densidade
da freqncia na verdade menor
do que para o intervalo de 0 a 1.

28 Captulo 1

10

24

As barras so desenhadas em
uma escala numrica contn
ua.

Horas

visualizando informaes

A Densidade da Freqncia
Vista de Perto

A densidade da freqncia se refere


concentrao de valores nos dados. Ela est
relacionada com a freqncia, mas no
a mesma coisa. Veja uma analogia para
demonstrar a relao entre as duas.

Suponha que voc tenha despejado uma


quantidade de suco em um copo, como ao lado:

Aqui est todo o


suco dentro do
copo. Ele chega at
esse nvel.

E se voc despejasse a mesma quantidade


de suco em um copo de tamanho diferente,
por exemplo, um copo mais largo? O que
aconteceria com o nvel do suco? Desta vez, o
copo mais largo e, por isso, o nvel ao qual
o suco chega mais baixo.

O copo
mais largo
e, portanto,
o nvel no
tem a mesma
altura.

O nvel do suco varia de acordo com a


largura do corpo; quanto mais largo o copo,
mais baixo o nvel. O inverso tambm
verdadeiro; quanto mais estreito o copo, mais
alto o nvel do suco.

E o que o suco tem a ver com a densidade da freqncia?

Suco = Freqncia
Suponha que, em vez de despejar o suco em copos, voc esteja
despejando a freqncia nas barras do seu grfico. Assim como voc
sabe a largura do copo, voc tambm sabe a largura das barras. E, assim
como o espao que o suco ocupa no copo (largura x altura) lhe diz
a quantidade de suco que est no copo, a rea da barra no grfico
equivalente sua freqncia.
A densidade da freqncia , ento, igual altura da barra.
Continuando com nossa analogia, ela equivalente ao nvel ao qual o
suco chega em cada copo. Assim como um copo mais largo significa
que o suco chega a um nvel mais baixo, uma barra mais larga significa
uma densidade de freqncia mais baixa.

Barra

Densidade da
Freqncia

Suco

Freqncia

voc est aqui 4 29

pontos de bala e nenhuma pergunta idiota

PONTOS DE BALA

A densidade da freqncia est


relacionada concentrao das freqncias
para dados agrupados. Ela calculada
atravs da frmula

Densidade da frequencia = Frequencia



Largura do Grupo

Histograma um grfico especializado


em dados agrupados. Ele se parece com
um grfico de barras, mas a altura de cada
barra igual densidade da freqncia, e
no igual freqncia.

Ao desenhar histogramas, a largura de cada


barra proporcional largura de seu grupo.
As barras so mostradas em uma escala
numrica contnua.
Em um histograma, a freqncia de um
grupo dada pela rea de sua barra.
Um histograma no possui espaos vazios
entre suas barras.

no existem

Perguntas Idiotas

P:

Por que usamos a rea para representar


a freqncia quando estamos construindo
histogramas?

R:

Essa uma forma de ter certeza de que os


tamanhos relativos de cada grupo mantm uma
proporo com os dados e so fiis. Com dados
agrupados, precisamos de uma maneira visual de
expressar a largura de cada grupo e tambm sua
freqncia. Alterar a largura das barras uma maneira
intuitiva de refletir o intervalo do grupo, mas tem o efeito
colateral de fazer com que os tamanhos das barras
paream desproporcionais. Uma maneira de contornar
tal situao ajustar a altura da barra e usar a rea
para representar a freqncia. Dessa forma, nenhum
grupo representado erroneamente ocupando mais ou
menos espao do que deveria.

P:
R:

O que densidade da freqncia mesmo?

A densidade da freqncia uma forma de


indicar a concentrao dos valores em um determinado
intervalo. Ela oferece uma forma de comparar intervalos
diferentes que podem ter larguras diferentes. Alm disso,
faz com que a freqncia seja proporcional rea de
uma barra, em vez

30 Captulo 1

da altura. Para achar a densidade da freqncia, tome a


freqncia de um intervalo e divida-a pela largura.

P:

Se eu tenho dados numricos agrupados, mas


todos os intervalos tm a mesma largura, posso
usar um grfico de barras normal?

R:

O uso de um histograma representa melhor seus


dados, pois voc ainda est trabalhando com dados
agrupados. Na verdade, voc quer que sua freqncia
seja proporcional sua rea, e no altura.

P:

Os histogramas tm obrigatoriamente de
representar dados agrupados? possvel us-los
para nmeros separados bem como para grupos de
nmeros?

R:

Sim, possvel. O que voc deve ter em mente


que preciso ter certeza de que no haja nenhum
espao vazio entre as barras e que voc faa cada barra
com uma unidade de largura. Normalmente, isso feito
posicionando o seu nmero no centro da barra. Como
exemplo, para desenhar uma barra para representar o
nmero 1 separadamente, voc desenharia uma barra
indo de 0,5 a 1,5, com o 1 no centro.

visualizando informaes

Veja um histograma representando o nmero de nveis completados


em cada jogo Vacas Loucas. Quantos jogos foram realizados no total?
Considere que cada nvel seja um nmero inteiro.

Densidade da Freqncia

Nmero de Nveis Completados por Jogo

-1

50

Representa 10 jogos

40
30
20
10

0,5 a 0,5 representa 0 nvel, pois


todos os valores dentro desse
intervalo so arredondados para 0.

Nvel

voc est aqui 4 31

soluo do exerccio

Veja um histograma representando o nmero de nveis completados


em cada jogo Vacas Loucas. Quantos jogos foram realizados no total?
Considere que cada nvel seja um nmero inteiro.

Densidade da Freqncia

Nmero de Nveis Completados por Jogo


50

Representa 10 jogos

40

Cada nvel um
nmero inteiro;
portanto, a barra
referente ao nvel 3 vai
de 2,5 a 3,5.

30
20
10

-1

Nvel

Precisamos achar o nmero total de jogos realizados, o que significa que precisamos achar a
freqncia total.
A freqncia total igual rea de todas as barras somadas juntas. Em outras palavras,
multiplicamos a largura de cada barra pela sua densidade de freqncia para obter a
freqncia e, depois, somamos o conjunto todo.
Nvel

Largura

Densidade da Freqncia

Freqncia

10

1x10 = 10

30

1x30 = 30

50

1x50 = 50

30

1x30 = 30

45

10

2x10 = 20

Freqncia Total = 10 + 30 + 50 + 30 + 20

= 140

32 Captulo 1

visualizando informaes

Histogramas no podem fazer tudo


Embora histogramas sejam uma excelente forma de exibir dados numricos
agrupados, existem alguns tipos de dados cuja forma ideal de representao
no atravs de histogramas como totais acumulados
Eu gostaria muito de poder ver rapidamente
quantas pessoas jogam abaixo de um determinado
nmero de horas. Por exemplo, em vez de ver
quantas pessoas jogam entre 3 e 5 horas, seria
possvel fazer um grfico que mostrasse quantas
pessoas jogam at 5 horas?

Densidade da Freqncia

Vamos tentar ajudar o diretor executivo. Veja o


histograma que tnhamos antes.

Horas de Jogo por Dia


5000

Representa
1000 Dias

4000

O histograma nos diz a


densidade da freqncia de
determinados grupos. Mas ele
j no to til assim ao nos
dar informaes sobre quantos
jogadores jogam abaixo de um
certo nmero de horas.

3000
2000
1000
0

10

24

Horas

difcil ver rapidamente quais so os totais acumulados neste grfico. Para achar
a freqncia de jogadores que jogam at 5 horas, precisamos somar freqncias
diferentes. Precisamos de outro tipo de grfico... mas qual?

PODERDO
CREBRO
Que tipo de informaes voc acha que deveramos mostrar no grfico? Que
tipo de informaes deveramos marcar no grfico? Escreva sua resposta
abaixo.

voc est aqui 4 33

grficos de freqncia acumulada

Estatstica vital

Introduzindo freqncia
acumulada

Freqncia
Acumulada

O diretor executivo precisa de algum tipo de


grfico que mostre a ele a freqncia total abaixo
de um determinado valor: a freqncia acumulada.
Por freqncia acumulada queremos basicamente
dizer o total acumulado.

A freqncia total at um
determinado valor. Ela
basicamente um total acumulado
das freqncias.

O que precisamos criar algum tipo de grfico que


mostre as horas no eixo horizontal e a freqncia
acumulada no eixo vertical. Dessa forma, o diretor
executivo poder tomar um valor e ler a freqncia
correspondente at aquele ponto. Ele poder descobrir quantas
pessoas jogam at 5 horas, 6 horas ou qualquer que seja o
nmero de horas em que ele esteja interessado no momento.

Antes de desenharmos o grfico, precisamos saber o que


exatamente necessitamos marcar no grfico. Precisamos calcular
as freqncias acumuladas para cada um dos intervalos que
temos e calcular tambm o limite superior de cada intervalo.

Horas

Freqncia

01

4,300

13

6,900

35

4,900

510

2,000

1024

2,100

Vamos comear observando os dados.

Ento quais so as freqncias acumuladas?

Aqui esto os dado

s.

Primeiro de tudo, suponhamos que o diretor executivo precise marcar no grfico a freqncia
acumulada, ou a freqncia total, referente a at 1 hora. Se olharmos os dados, sabemos que a
freqncia do grupo de 0 a 1 4.300 e podemos ver que esse o limite superior do grupo. Isso
significa que a freqncia acumulada de horas at 1 4.300.
Em seguida, vamos olhar a freqncia total at 3. Sabemos quais so as freqncias dos grupos
de 0 a 1 e de 1 a 3, e 3 novamente o limite superior. Para achar a freqncia total de horas at
3, somamos a freqncia do grupo de 0 a 1 e do grupo de 1 a 3.
Voc consegue ver um padro existente? Se tomarmos o limite superior de cada um dos grupos
de horas, podemos achar a freqncia total de horas at aquele valor somando as freqncias.
Ao aplicarmos isso a todos os grupos, obtemos

jogar
is voc no pode
Inclumos o 0, po 0 hora por semana.
de
jogos por MENOS
Horas

Freqncia

Limite superior

Freqncia acumulada

01

4,300

4,300

13

6,900

4,300+6,900 = 11,200

35

4,900

4,300+6,900+4,900 = 16,100

510

2,000

10

4,300+6,900+4,900+2,000 = 18,100

1024

2,100

24

4,300+6,900+4,900+2,000+2,100 = 20,200

34 Captulo 1

visualizando informaes

Desenhando o grfico de
freqncias acumuladas

Freqncias
acumuladas
nunca
podem
diminuir.

Agora que temos os limites superiores e as freqncias


acumuladas, podemos marc-las em um grfico.
Trace dois eixos, sendo o vertical para a freqncia
acumulada e o horizontal para as horas. Feito isso,
marque cada um dos limites superiores em funo da
sua freqncia acumulada e, depois, una os pontos
com uma linha da seguinte forma:

Se sua freqncia
acumulada diminuir em
qualquer ponto, confira seus
clculos.

Freqncia Acumulada

Total Acumulado de Horas de Jogo


22500
20000
17500
15000
12500
10000
7500
5000
2500
0.0

u
Sempre comece se cia
n
q
fre
a
grfico onde
0.
acumulada

o
Defina este pont em
ras
marcando 10 ho ncia
eq
fr
funo de uma 00.
.1
18
acumulada de

10

15

20

25

Horas

O diretor executivo quer que voc ache o nmero de


pessoas jogando on-line at 4 horas. Tente estimar esse
valor usando o diagrama de freqncias acumuladas.

voc est aqui 4 35

soluo do aponte seu lpis e nenhuma pergunta idiota

O diretor executivo quer que voc ache o nmero de


pessoas jogando on-line at 4 horas. Tente estimar esse
valor usando o diagrama de freqncias acumuladas.

13750

15000

Para fazer isso, achamos 4 no eixo horizontal,


achamos onde esse valor encontra a linha
do grfico e lemos a freqncia acumulada
correspondente no eixo vertical.

12500
10000
7500
5000

Isso nos d uma resposta de


aproximadamente 13.750. Em outras palavras,
h aproximadamente 13.750 ocorrncias de
pessoas jogando on-line abaixo de 4 horas.

2500
0.0

no existem

P:

O que freqncia
acumulada?

R:

Freqncia acumulada de um
valor a soma das freqncias at
aquele valor, inclusive. Ela lhe diz
a freqncia total at aquele ponto.
Como exemplo, suponha que voc
tenha dados que digam a idade das
pessoas. A freqncia acumulada
para o valor 27 lhe diz quantas
pessoas tm at 27 anos de idade,
inclusive.

P:

Os grficos de freqncias
acumuladas so usados s para
dados agrupados?

R:

Absolutamente; voc pode


us-los para qualquer tipo de dados
numricos. O mais importante se
voc deseja saber a freqncia total
at um determinado valor ou se est
mais interessado nas freqncias
de determinados valores.

36 Captulo 1

Perguntas Idiotas

P:

Em alguns grficos,
possvel mostrar mais de um
conjunto de dados no mesmo
grfico. E no caso de grficos de
freqncia acumulada?

R:

Para grficos de freqncia


acumulada, isso pode ser feito
traando-se uma linha para
cada conjunto de dados. Se, por
exemplo, voc quisesse comparar
as freqncias acumuladas por
sexo, poderia traar uma linha
representando homens e outra
representando mulheres. Seria
bem mais eficaz mostrar as duas
linhas em um nico grfico, pois
isso facilita a comparao dos dois
conjuntos de dados.

P:

Existe algum limite para


quantas linhas voc pode mostrar
em um grfico?

R:

No h um limite especfico,
pois tudo depende dos seus dados.
Tente no fazer muitas linhas para
que o grfico no fique

sobrecarregado e voc no consiga


ler as freqncias acumuladas e
comparar os conjuntos de dados.

P:

O que devo fazer para achar


a freqncia acumulada de um
valor?

R:

Para achar a freqncia


acumulada, basta l-la diretamente
no grfico. Encontre o valor para o
qual voc deseja achar a freqncia
acumulada no eixo horizontal,
ache onde ele encontra a curva
da freqncia acumulada e, em
seguida, leia o valor da freqncia
acumulada no eixo vertical.

P:

Se eu j souber a freqncia
acumulada, posso usar o
grfico para achar o valor
correspondente?

R:

Sim, pode. Procure a


freqncia acumulada no eixo
vertical, ache onde ela encontra a
curva da freqncia acumulada e,
em seguida, leia o valor.

visualizando informaes

Durante a apresentao da Manic Mango, o diretor executivo quer explicar


como ele pretende direcionar seu alvo para determinados grupos de idade.
Ele possui um grfico de freqncia acumulada mostrando a freqncia
acumulada das idades, mas precisa tambm das freqncias, e seu
cachorro comeu a folha de papel em que elas estavam escritas. Tente usar
o grfico de freqncia acumulada para estimar quais so as freqncias
de cada grupo.

O limite superior 18, pois uma pessoa classificada como


tendo
17 anos a partir do ponto do seu 17 aniversrio at o ponto
em que
faz 18 anos. As idades so geralmente arredondadas para baixo
.
Faixa
etria

Limite
superior

Freqncia
acumulada

Freqncia

<0

017

18

1824
2539
4054
5579
8099
Nmero de Jogadores Abaixo de uma Determinada Idade

Freqncia Acumulada

10000

7500

5000

2500

0.0

10

20

30

40

50

60

70

80

90

100

Horas
voc est aqui 4 37

soluo do exerccio

Durante a apresentao da Manic Mango, o diretor executivo quer explicar


como ele pretende direcionar seu alvo para determinados grupos de idade.
Ele possui um grfico de freqncia acumulada mostrando a freqncia
acumulada das cidades, mas precisa tambm das freqncias, e seu
cachorro comeu a folha de papel em que elas estavam escritas. Tente usar
o grfico de freqncia acumulada para estimar quais so as freqncias
de cada grupo.
Faixa
etria

Limite
superior

Freqncia
acumulada

Freqncia

<0

017

18

2,000

2,000

1824

25

4,500

4,500 - 2,000 = 2,500

2539

40

6,500

6,500 - 4,500 = 2,000

4054

55

8,500

8,500 - 6,500 = 2,000

5579

80

9,400

9,400 - 8,500 = 900

8099

100

9,500

9,500 - 9,400 = 100

Use o grfico para


achar as freqncia
s
acumuladas.

r as freqncias
Voc pode acha acumulada
ncia
tomando a freq do da primeira.
atual e subtrain

No se preocupe se voc obtiver


resultados ligeiramente diferentes
eles so apenas estimativas.

Nmero de Jogadores Abaixo de uma Determinada Idade

Freqncia Acumulada

10000

7500

5000

2500

0.0

10

20

30

40

50

60

70

80

90

100

Horas
38 Captulo 1

visualizando informaes

Escolhendo o grfico certo


O diretor executivo est muito contente com seu trabalho com os grficos de
freqncia acumulada, e seu bnus j est praticamente no bolso. Ele est quase
terminando de preparar a apresentao, mas ainda h mais uma coisa de que ele
precisa: um grfico que mostre os lucros da Manic Mango em comparao com
os lucros dos seus principais rivais. Que grfico ele deveria usar?

Veja dois possveis grficos que o diretor executivo poderia usar em sua
apresentao. Sua tarefa anotar algo sobre cada um e dizer, em sua
opinio, quais so os pontos fortes e fracos de um em relao ao outro.
Qual deles voc escolheria?
Lucro em dlares

Lucro (milhares)

600

Manic Mango

500

Concorrente

400
300
200
100
0.0

2003

2004

2005

2006

2007

Ano

Lucro (milhares)

600

Lucro em dlares
Manic Mango

500

Concorrente

400
300
200
100
0
2003

2004

2005

2006

2007

Ano
voc est aqui 4 39

soluo do exerccio

Veja dois possveis grficos que o diretor executivo poderia usar em sua
apresentao. Sua tarefa anotar algo sobre cada um e dizer, em sua
opinio, quais so os pontos fortes e fracos de um em relao ao outro.
Qual deles voc escolheria?
Lucro em dlares

Lucro (milhares)

600

Manic Mango

500

Concorrente

400
300
200
100
0.0

2003

2004

2005

2006

2007

Ano

O grfico de barras funciona muito bem


para comparar o lucro de ano em ano
e excelente se voc deseja comparar
lucros em um nico ano. Como
exemplo, podemos ver que, at 2007,
o concorrente teve um lucro maior,
mas em 2007 foi a Manic Mango que
teve maior lucro.

Um dos pontos fracos deste grfico que, se o diretor executivo, de repente, decidisse
acrescentar um terceiro concorrente, poderia ficar um pouco mais difcil analisar o grfico
com um rpido passar de olhos.

Lucro (milhares)

600

Lucro em dlares

Manic Mango

500

Concorrente

400

Escolheramos o grfico de linhas,


pois a tendncia geral mais clara
do que no grfico de barras. Mas no
se preocupe se voc escolher o outro;
o grfico que voc usa depende de
quais so os fatores principais que
voc deseja enfatizar.

300
200
100
0
2003

2004

2005

2006

2007

Ano

O grfico de linhas melhor para mostrar uma tendncia, os lucros de ano em ano para cada
empresa. A linha de tendncias para cada empresa bem definida, o que significa que podemos
facilmente ver o padro dos lucros: os lucros da Manic Mango esto crescendo bem, onde seu
concorrente est comeando a ter uma queda. Seria fcil tambm acrescentar outra empresa sem
sobrecarregar o grfico.
Um ponto fraco que voc tambm pode comparar o lucro de ano em ano, mas talvez o grfico
de barras seja mais claro.
40 Captulo 1

visualizando informaes

A Densidade da Freqncia
Vista de Perto
Grficos de linhas so bons para mostrar tendncias em seus dados. Para cada
conjunto de dados, voc marca os pontos e depois os une com linhas. fcil mostrar
vrios conjuntos de dados no mesmo grfico sem sobrecarreg-lo. Mas deixe claro
qual linha qual.
Assim como outros tipos de grficos, voc pode escolher entre mostrar a freqncia
ou as porcentagens no eixo vertical. A escala que voc utiliza depende de quais
fatores deseja destacar.
Grficos de linhas so geralmente usados para mostrar medidas de tempo. O tempo
sempre fica no eixo horizontal, e a freqncia no vertical. Voc pode ler a freqncia
para qualquer perodo de tempo escolhendo o valor do tempo no eixo horizontal e
lendo a freqncia correspondente quele ponto sobre a linha.

Lucro (milhares)

600

Lucro em dlares

500
400
300
200
100
0
2003

2004

2005

2006

2007

Ano

Freqncia

Grficos de linhas devem ser


usados somente para dados
numricos, e no categricos.
Isso se deve ao fato de que faz
sentido comparar categorias
diferentes, mas no faz
sentido traar uma linha de
tendncias. Use um grfico de
linhas somente se voc estiver
comparando categorias com
alguma unidade numrica,
como o tempo, e, neste caso,
voc deve usar uma linha
separada para cada categoria.

Esta linha de
tendncias no
significativa. O que
aconteceria se voc
reorganizasse as
categorias?

2
1

Azul Castanho Verde Vermelho

Cor do Olho
voc est aqui 4 41

pontos de bala e nenhuma pergunta idiota

PONTOS DE BALA

Freqncia acumulada a freqncia


total at um determinado valor. Ela o total
acumulado das freqncias.

linha para cada conjunto de dados e deixe


claro qual linha qual.

Use um grfico de freqncia acumulada


para marcar o limite superior de cada
grupo de dados em funo da freqncia
acumulada.
Use um grfico de linhas se voc deseja
mostrar tendncias, por exemplo com
relao ao tempo.

possvel mostrar mais de um conjunto de


dados em um grfico de linhas. Use uma

possvel usar grficos de linhas para fazer


previses bsicas, pois fcil ver o formato
da tendncia. Basta prolongar a linha de
tendncias, tentando manter o mesmo
formato bsico.
No use grficos de linhas para mostrar
dados categricos a no ser que voc
esteja mostrando tendncias para cada
categoria, por exemplo com relao ao
tempo. Se fizer isso, trace uma linha para
cada categoria.

no existem

Perguntas Idiotas

P:

P:

P:

R:

R:

R:

Grficos de linhas so a
mesma coisa que grfico de srie
temporal? Acha que j ouvi esse
nome sendo usado antes.

O grfico de srie temporal


, na verdade, um grfico de linhas
que se concentra em intervalos
de tempo, exatamente como os
exemplos que usamos. Um grfico
de linhas, entretanto, no tem de se
concentrar s no tempo.

P:

H alguma variedade
especial de grficos de linhas?

R:

Sim. Na verdade, voc j


se deparou com um deles. O
grfico de freqncia acumulada
um tipo de grfico de linhas que
mostra a freqncia total at um
determinado valor.

42 Captulo 1

Grficos de linhas podem


mostrar dados categricos bem
como dados numricos?
Grficos de linha devem
somente ser usados para mostrar
dados categricos se voc estiver
mostrando tendncias para cada
categoria, e no se esquea de
usar uma linha separada para cada
categoria.
O que voc no deve fazer usar
um grfico de linhas para traar
linhas de categoria em categoria.

P:

Ento grficos de linhas so


melhores para mostrar tendncias
sobrepostas e grficos de barras
so melhores para comparar
valores ou categorias?

R:

Exatamente. A deciso
de qual grfico voc deve usar,
na verdade, se resume a qual
mensagem voc deseja transmitir e
quais fatores voc deseja minimizar.

Agora que sei como criar


grficos corretamente, posso
usar softwares grficos para fazer
o trabalho pesado?
Claro que sim! Softwares
grficos podem lhe poupar muito
tempo e trabalho, e os resultados
podem ser excelentes. O importante
ao usar softwares para gerar seus
grficos lembrar que o software
no pode pensar por voc. Voc
continua tendo de decidir qual
grfico representa melhor seus fatos,
e preciso verificar se o software
gera exatamente o que voc espera.

visualizando informaes

A Manic Mango conquistou o mercado de jogos!


Voc ajudou a gerar alguns excelentes grficos para a Manic Mango, e graas a voc
a apresentao foi um enorme sucesso. A Manic Mango conseguiu uma enorme
quantidade de publicidade para seus jogos e est jorrando dinheiro vindo dos
patrocinadores e das propagandas. A voc, s resta pensar em todas as coisas que
poderia fazer e os lugares que poderia ir com seu bnus bem merecido.
Voc teve a primeira prova de como a estatstica pode ajud-lo e o que voc pode
atingir entendendo o que realmente est acontecendo. Continue lendo e vamos
mostrar-lhe mais coisas que voc pode fazer, comeando a realmente alongar os
msculos da estatstica.
Excelente trabalho
com esses grficos! Os
investidores esto fazendo fila
do lado de fora do escritrio.
Tire longas frias, tudo por
minha conta!

voc est aqui 4 43

Das könnte Ihnen auch gefallen