Sie sind auf Seite 1von 11

Estatstica

Autoria: Oderson Dias de Mello | 4


o
semestre
Tema 01
Estatstica Descritiva
Tema 01
Estatstica Descritiva
Autoria: Oderson Dias de Mello
Como citar esse documento:
MELLO, Oderson Dias de. Estatstica: Estatstica Descritiva. Caderno de Atividades. Valinhos: Anhanguera Educacional, 2014.
ndice
2014 Anhanguera Educacional. Proibida a reproduo fnal ou parcial por qualquer meio de impresso, em forma idntica, resumida ou modifcada em lngua
portuguesa ou qualquer outro idioma.
Pg. 18
Pg. 19 Pg. 20
Pg. 19
Pg. 16 Pg. 14
ACOMPANHENAWEB
Pg. 3
CONVITELEITURA
Pg. 3
PORDENTRODOTEMA
3
Estatstica Descritiva
Distribuio de frequncias e grcos
Podemos olhar para o nosso planeta e dizer que ele est cheio de problemas. Para solucionarmos boa parte deles
precisamos de informaes. Mas, como saber quais informaes precisamos? Em qual quantidade? Como organizar
essas informaes? E depois? O que fazer com elas para resolvermos nossos problemas?
A Estatstica trabalha com essas informaes, associando os dados ao problema que procuramos resolver, nos auxiliando
a descobrir o que deve ser coletado, como deve ser organizado e visualizado, para nos ajudar a obter concluses e
apresentar o problema e sua soluo de maneira que outras pessoas possam mais facilmente entender.
Voc j pensou em como organizar um grande conjunto de dados de forma a facilitar a viso de padres? Imagine
um leitor assduo das pginas sobre futebol em um jornal. O que o leitor prefere ler? Uma descrio completa de tudo
que ocorreu em todas as partidas de futebol da ltima rodada do campeonato? Ou melhor ter um resumo, por exemplo,
do nmero de faltas cometidas, o total de gols marcados e sofridos por cada time, o total de expulses, os artilheiros do
campeonato e a relao dos goleiros mais frangueiros? Claro que a segunda opo a mais interessante. Para esse
tipo de organizao e resumo dos dados que existe a rea da Matemtica chamada Estatstica.
Nesse tema voc vai aprender como construir um histograma, um polgono de frequncia e diferentes tipos de
apresentao de dados. Tambm vai calcular a mdia, a mediana, a moda, a amplitude, a varincia e o desvio padro
de um conjunto de dados.
CONVITELEITURA
Estatstica Descritiva
de um conjunto de dados.
PORDENTRODOTEMA
4
dessa forma que os rgos estatsticos dos governos realizam os censos da populao, constroem e calculam
os ndices de infao, o produto interno bruto (PB), o ndice de desemprego, a produo industrial etc. Esses tipos
de estatsticas nos dizem se o pas est crescendo populacionalmente, se a renda bem distribuda ou no, qual o
percentual da populao que tem acesso gua tratada, esgoto ou energia eltrica, qual o percentual da populao que
mora em residncia prpria e em residncia alugada, qual deve ser o resultado das prximas eleies etc.
A Estatstica uma parte da Matemtica que apresenta mtodos para a coleta, organizao e descrio de dados.
Tambm oferece uma metodologia para anlise e interpretao dos dados, de forma a possibilitar a utilizao destes
para nos auxiliar na tomada de decises (Correia, 2013).
Quando analisarmos um conjunto de dados, devemos sempre determinar se temos uma amostra ou uma populao.
Essa determinao afetar no s os mtodos utilizados, como tambm os resultados, pois ao trabalhar com uma
amostra, os resultados encontrados so estimativas para a populao.
Outro conceito muito importante em Estatstica o de frequncia. A frequncia de uma observao o nmero de
repeties que ocorre nessa observao, ou seja, quantas vezes o fenmeno em questo acontece.
Os dados observados podem ser classifcados de forma diferente. Vejamos algumas classifcaes a seguir.
Dados brutos
So os dados originais, ainda no organizados para a anlise. Por exemplo: o nmero de alunos de uma escola
que faltaram mais de quatro dias seguidos em determinado bimestre.
1 bimestre 2 bimestre 3 bimestre 4 bimestre
2011 22 12 22 19
2012 25 15 6 11
PORDENTRODOTEMA
5
Rol
So os mesmos dados brutos, mas agora organizados em ordem crescente ou decrescente. Para o exemplo
anterior temos em rol:
6 11 12 15
19 22 22 25
Dados discretos
Os dados so considerados discretos quando so em nmero fnito ou so enumerveis. Exemplos:
O nmero de televisores em cada residncia do estado do Piau: 0, 1, 2, 3, ...
Quantidade de dias chuvosos em determinada localidade a cada ms: 22, 4, 2, 0, 23, 17, ...
Nmero de prises efetuadas em cada um dos ltimos trs anos na cidade X: 239, 333, 108.
Dados contnuos
Os dados quantitativos contnuos assumem valores em um intervalo contnuo dos nmeros reais. Por exemplo, o
peso das pessoas considerado um conjunto de dados contnuos, pois pode tomar qualquer valor em um intervalo que
vai de zero vrgula alguma coisa em quilos, se considerarmos a formao inicial de um feto, at, quem sabe, 400 kg.
Assim, uma amostra do peso de quatro pessoas pode ser: 23,3 kg; 46,0 kg; 99,1 kg e 103,3 kg.
Dados tabulados no agrupados em classes
Os dados so colocados em uma tabela de forma individual junto com a frequncia que cada um ocorre. Por
exemplo, veja a tabela da idade dos alunos que se tornaram novatos de determinado curso superior em 2012:
PORDENTRODOTEMA
6
Idade N de alunos
17 1
18 4
19 6
20 2
21 7
22 3
23 4
24 0
25 7
26 4
27 3
28 6
29 em diante 0
Dados tabulados agrupados em classes
Os valores no aparecem de forma individual, mas agrupados dentro de classes. Veja como fcaria para o
exemplo anterior:
PORDENTRODOTEMA
7
Faixa etria
N de alunos
(frequncia)
17 | 19 5
19 | 21 8
21 | 23 10
23 | 25 4
25 | 27 11
27 | 29 9
Note que o smbolo "| quer dizer que o intervalo deve incluir desde o nmero antes do smbolo at o dado
imediatamente anterior ao nmero depois do smbolo. Assim, 17 | 19 na tabela inclui todos os alunos de 17 e 18
anos, portanto, 1 + 4 = 5.
Distribuio de frequncia
Uma distribuio de frequncia nada mais do que uma tabela que mostra classes de dados com uma contagem
do nmero de entradas em cada classe (Larson; Farber, 2010, p. 32).
Na ltima tabela anteriormente apresentada temos:
Seis classes.
As frequncias para cada uma das seis classes so: 5, 8, 10, 4, 11 e 9.
Cada classe tem um limite inferior, que o menor nmero que pode pertencer classe. No caso temos que os
limites inferiores das classes so: 17, 19, 21, 23, 25 e 27.
A largura de uma classe a diferena entre o limite inferior da classe seguinte e seu prprio limite inferior. Assim,
para a primeira classe da tabela temos que sua largura 19 17 = 2.
No exemplo da tabela, dizemos que a amplitude dos dados a diferena entre o maior e o menor valor dos dados. Assim,
como a maior idade encontrada entre os novatos foi 28 anos e a menor 17, a amplitude calculada como 28 17 = 11.
PORDENTRODOTEMA
8
O ponto mdio de uma classe a soma dos limites inferior e superior da classe dividida por dois. Assim, para a
primeira classe da tabela temos que seu ponto mdio
1719
2
18
.
A frequncia relativa de uma classe a frequncia da classe dividida pelo tamanho da amostra. Assim, como temos
um total de 47 novatos em nosso exemplo, a frequncia relativa da primeira classe (17 | 19)
5
47
0,106 10, 6%
.
A frequncia acumulada de uma classe igual soma da frequncia para aquela classe e todas as anteriores.
Assim, a frequncia acumulada da segunda classe do nosso exemplo 5 + 8 = 12.
Histograma
Um histograma de frequncias um grfco de barras que apresenta a distribuio de frequncia de um conjunto
de dados. A escala horizontal mede os valores dos dados enquanto a escala vertical mede as frequncias das classes.
As barras do grfco so apresentadas todas encostadas. Veja no Grfco 1.1 a seguir o histograma do exemplo da idade
dos alunos que se tornaram novatos de determinado curso superior em 2012:
Grfco 1.1: N de alunos (frequncia)
Fonte: elaborao do autor
PORDENTRODOTEMA
9
Polgono de frequncia
Unindo por linhas retas os pontos mdios das bases dos retngulos do histograma, obtm-se outra representao
dos dados, denominada polgono de frequncia.
Veja no Grfco 1.2 a seguir o polgono de frequncia que corresponde ao histograma anterior:
Grfco 1.2: N de alunos (frequncia)
Fonte: elaborao do autor
PORDENTRODOTEMA
10
Tambm comum utilizar o polgono de frequncia com a rea entre o grfco e o eixo horizontal hachurada, conforme
descrito no Grfco 1.3 a seguir:
Grfco 1.3: N de alunos (frequncia)
Fonte: elaborao do autor
Medidas de posio e medidas de disperso
Quando temos muitos dados para analisar, comum procurarmos uma medida de tendncia central que
represente de certa forma esses dados. As trs medidas de tendncia central mais utilizadas em estatstica so: a
mdia, a mediana e a moda.
A mdia
A mdia defnida como a soma de todos os dados dividida pelo nmero de dados. Como exemplo, vamos supor
que voc esteja querendo comprar um novo aparelho celular. Voc pesquisa preos em seis lojas diferentes e pode,
portanto, construir a seguinte tabela:
PORDENTRODOTEMA
11
Lojas: 1 2 3
Preos: R$2.000,00 R$1.950,00 R$2.100,00
Lojas: 4 5 6
Preos: R$2.200,00 R$1.900,00 R$1.950,00
Claro que voc quer comprar na loja de preo mais barato, mas como voc um estudante curioso, quis calcular qual o preo
mdio do celular nas seis lojas. Basta, portanto, somar os preos e dividir pelo nmero total de lojas pesquisadas: seis. Ento,
temos que a soma de todos os preos R$2.000,00 + R$1.950,00 + R$2.100,00 + R$2.200,00 + R$1.900,00 + R$1.950,00
= R$12.100,00. Dividindo esse valor por seis (R$12.100,00 / 6), obtemos que a mdia de preos igual a R$2.016,67.
Mediana
Outra medida de tendncia central a mediana. A mediana, como o nome j indica, o valor no meio dos dados
quando o conjunto de dados est ordenado. Se o nmero de dados mpar, a mediana o dado do meio. J, se o
nmero de dados for par, ento a mediana ser a mdia entre os dois dados do meio do conjunto ordenado (LARSON;
FARBER, 2010).
Para calcularmos a mediana da pesquisa que voc fez dos preos do aparelho celular que deseja comprar, a primeira
coisa a fazer ordenar os dados. Colocando em ordem crescente, temos:
R$1.900,00 R$1.950,00 R$1.950,00 R$2.000,00 R$2.100,00 R$2.200,00
Nota-se que o nmero de dados par (seis) e, portanto, a mediana calculada como a mdia dos dois dados do
meio. Somando os dois dados do meio, R$1.950,00 e R$2.000,00 e dividindo por dois, temos que a mediana igual a
R$1.975,00.
Moda
A moda o valor do conjunto de dados que ocorre com mais frequncia. Note que pela defnio podemos ter mais
de uma moda para o mesmo conjunto de dados. Dizemos neste caso que o conjunto de dados multimodal. J quando
todos os dados se repetem o mesmo nmero de vezes, no temos moda e o conjunto chamado de amodal.
PORDENTRODOTEMA
12
Na tabela da pesquisa de preos do aparelho celular vemos que o valor que se repete mais vezes, duas no caso,
R$1950,00 e, portanto, este o valor da moda do conjunto.
Desvio
magine agora que voc tenha uma pequena pizzaria. Nos ltimos seis dias (de tera-feira a domingo) voc vendeu
a seguinte quantidade de pizzas:
1 dia 2 dia 3 dia 4 dia 5 dia 6 dia
50 46 39 45 48 359
Voc deve estar pensando que errou na contagem de pizzas do sexto dia, no ? Mas lembra-se daquele domingo
que voc quase fcou louco de tanto trabalho? Quando, por conta da indicao de um cliente, um time de basquete
com a comisso tcnica e suas respectivas famlias chegaram perto da hora de fechar e voc teve que atender aquele
povo todo esfomeado depois de um jogo? E ainda levaram pizzas para casa! Pois ... O dado est certinho, sua
pizzaria realmente vendeu 359 pizzas naquele dia! Voc calculou a mdia das vendas dos ltimos seis dias e viu que
dava
50 4639 45 48359
6
98. Claro que esse valor, de 98 pizzas na mdia, no quer dizer muita coisa, pois voc v
facilmente que, se fzesse a mdia sem o dia de 359 pizzas vendidas, teria
50 46 39 45 48
5
46, um valor bem mais
razovel para considerar como mdia. Talvez, a moda poderia vir a ser uma medida de tendncia mais adequada
para suas vendas mensais. Mas como nenhum valor se repete, dizemos que o conjunto de dados amodal. Difcil?
Quem sabe ento voc poderia escolher a mediana, e assim obter o valor de
46 48
2
47
, mais razovel para fazer uma
estimativa de vendas mais realista em um ms futuro.
Uma das formas de verifcarmos se um dado est muito distante da mdia medirmos seu desvio, da seguinte maneira:
x - x, onde x o dado e x a mdia.
No caso da sua pizzaria, temos vrios dados prximos mdia e um deles muito distante, o que acaba por tornar a
mdia poluda.
Outras medidas que nos auxiliam em nosso estudo estatstico so medidas de disperso ou variao que medem, por
exemplo, quo longe os dados esto da mdia. O desvio uma delas, mas temos outras, que veremos a seguir.
PORDENTRODOTEMA
13
Amplitude
A amplitude de um conjunto de dados a diferena entre a maior e a menor entrada de dados. Para sua pizzaria,
fcil ver que a amplitude 359 39 = 320.
Varincia
Temos duas defnies para a varincia. Se estivermos calculando a varincia de uma amostra de dados, temos
que ela ser , onde x representa cada um dos dados, x a mdia dos dados da amostra e n o nmero de
elementos na amostra. J a varincia de uma populao
os,
, onde a mdia dos dados da populao e N
o nmero de elementos.
Exemplifcando, vamos calcular a varincia do conjunto de dados 0, 3 e 3. A mdia igual a 2, portanto,
a varincia 3
3
) 3 3 ( ) 3 3 ( ) 3 0 (
2
2 2


. J para o conjunto de dados 0, 1 e 14, a mdia 5 e a varincia
... 666 , 0 4
3
1 8 6 1 5 2
3
) 5 4 1 ( ) 5 1 ( ) 5 0 (
2
2 2


Desvio padro
O desvio padro defnido como a raiz quadrada da varincia. Assim, nos exemplos anteriores, temos que os
desvios padro so respectivamente 3 e 40, 67 .
Separatrizes
Tambm podemos dividir uma distribuio de dados ordenada em vrias partes iguais. Chamamos a diviso de
separatriz. Quando dividimos os dados ordenados em duas partes temos a mediana separando os dois conjuntos.
Podemos, da mesma forma, dividir o conjunto em quatro, dez ou cem partes iguais e chamamos cada um dos elementos
que separam essas partes de quartil, decil ou percentil, respectivamente. Assim, o primeiro quartil, por exemplo, separa
a sequncia ordenada mantendo 25% de seus valores esquerda e 75% de seus valores direita. O segundo quartil
exatamente a mediana do conjunto e o terceiro quartil separa a sequncia ordenada mantendo 75% de seus valores
esquerda e 25% de seus valores direita.
PORDENTRODOTEMA
14
Para exemplifcar, vamos separar em quartis os dados abaixo:
1 2 3 4 5 6 7 8 9 39 45 46 48 50 88
nicialmente importante conferir se os dados esto ordenados, se no ser necessrio orden-los primeiro. Depois
podemos encontrar a mediana, que o segundo quartil. Nesse caso, o oitavo elemento do conjunto de dados: 8.
O primeiro e o terceiro quartil so as medianas das metades inferior e superior do conjunto de dados, ou seja, 4 e 46
respectivamente.
Todas as medidas que vimos neste tema nos auxiliam principalmente quando temos um grande conjunto de dados.
Nosso crebro consegue raciocinar melhor com essas medidas que ajudam a resumir os dados, do que olhando para
todos os dados.
PORDENTRODOTEMA
Clique
Acesse &
Clique
Acesse &
Distribuies de frequncias e seus grcos
O stio bem interativo. Voc mesmo pode entrar com dados nos exemplos e uma aplicao
em Java construir as tabelas e grfcos utilizando as informaes que voc inseriu.
Link: <http://www.uff.br/cdme/distfreq/distfreq-html/dfreqint.html>.
Portal Action
Apresenta exemplos de dados qualitativos e quantitativos.
Link: <http://www.portalaction.com.br/content/13-exposio-dos-dados>.
todos os dados.
Distribuies de frequncias e seus grcos
ACOMPANHENAWEB
15
Estatstica distribuio de frequncias
O professor Srgio Dantas apresenta nesse vdeo um exemplo muito simples e claro de
clculos relacionados distribuio de frequncias: amplitude da amostra, nmero de classes,
frequncia absoluta, frequncia relativa, frequncia relativa acumulada etc.
Link: <http://www.youtube.com/watch?v=Ovwo-xwvBUE>.
Tempo: 8:30.
Mdias: aritmtica, ponderada e geomtrica
Apresenta as defnies das mdias aritmtica, ponderada e geomtrica, alm de vrios
exemplos.
Link: <http://www.youtube.com/watch?v=7SeCSogbDQc>.
Tempo: 9:51.
ACOMPANHENAWEB ACOMPANHENAWEB
16
Instrues:
Agora, chegou a sua vez de exercitar seu aprendizado. A seguir, voc encontrar algumas questes de mltipla
escolha e dissertativas. Leia cuidadosamente os enunciados e atente-se para o que est sendo pedido.
AGORAASUAVEZ
Questo 1
Qual parte da Matemtica os governos utilizam como ferramenta para conhecerem caractersticas da sua populao e posterior-
mente implementarem polticas pblicas?
Questo 2
O histograma a seguir (Grfco 1.4) representa a distribuio dos Qs de candidatos a determinada vaga de emprego. Q o quo-
ciente de inteligncia. Quantos candidatos tem Q entre 90 e 110?
Grfco 1.4: Q dos candidatos
Fonte: elaborao do autor
17
AGORAASUAVEZ
a) 45.
b) 35.
c) 25.
d) 40.
e) 15.
Questo 3
O polgono de frequncias a seguir (Grfco 1.5) apresenta a frequncia por idade de alunos de uma escola que so viciados em
lcool ou em drogas ilcitas. possvel concluir que:
Grfco 1.5: N de alunos (frequncia)
Fonte: elaborao do autor
18
AGORAASUAVEZ
a) A maior frequncia de alunos viciados entorno de 22 anos.
b) A faixa de idade com maior frequncia de viciados a dos 24 a 26 anos.
c) Pode-se dizer com certeza que a escola no tem nenhum aluno com mais de 30 anos.
d) O nmero de viciados est diminuindo na escola.
e) O polgono de frequncias apresentado o grfco da frequncia acumulada.
Questo 4
Calcule a varincia populacional do conjunto de dados: 7; 5 e 3.
Questo 5
Calcule o desvio padro populacional do conjunto de dados: 4; 4 e 7.
Nesse tema voc viu como organizar dados estatsticos em rol e tambm como tabul-los em classes. Aprendeu
vrias defnies importantes, tais como: populao e amostra; largura, frequncia e ponto mdio de uma classe; mdia,
moda, mediana, varincia e desvio padro. Tambm aprendeu a construir um histograma e um polgono de frequncias.
Calcule o desvio padro populacional do conjunto de dados: 4; 4 e 7.
Nesse tema voc viu como organizar dados estatsticos em rol e tambm como tabul-los em classes. Aprendeu
FINALIZANDO
19
CORREA, Sonia Maria Barros Barbosa. Probabilidade e estatstica. 2. ed. Belo Horizonte: PUCMNAS Virtual, 2003. 116 p.
Disponvel em: <http://estpoli.pbworks.com/f/livro_probabilidade_estatistica_2a_ed.pdf>. Acesso em: 4 mar. 2014.
DANTAS, Srgio. Estatstica: Distribuio de Frequncias. Disponvel em: <http://www.youtube.com/watch?v=Ovwo-xwvBUE>.
Acesso em: 4 mar. 2014.
LARSON, Ron; FARBER, Betsy. Estatstica Aplicada. 4. ed. So Paulo: Pearson Prentice Hall, 2010.
UFF. Distribuies de frequncias e seus grfcos. Disponvel em: <http://www.uff.br/cdme/distfreq/distfreq-html/dfreqint.html>.
Acesso em: 4 mar. 2014.
Portal Action. Exposio dos Dados. Disponvel em: <http://www.portalaction.com.br/content/13-exposio-dos-dados>. Acesso
em: 4 mar. 2014.
Mdias: Aritimtica, Ponderada e Geomtrica. Disponvel em: <http://www.youtube.com/watch?v=7SeCSogbDQc>. Acesso em:
04 mar. 2014.
REFERNCIAS
Amostra: um conceito estatstico que signifca um subconjunto de elementos da populao. A informao estatstica
obtida de uma amostra com o objetivo de ser generalizada para toda a populao.
Censos: so estudos estatsticos referentes populao que possibilitam o conhecimento de vrias informaes, tais
como o nmero de homens, mulheres, crianas e idosos, onde vivem as pessoas, quanto ganham etc.
Conjunto de dados: coleo de dados frequentemente tabulados.
Hachurada: destacada.
04 mar. 2014.
Amostra: um conceito estatstico que signifca um subconjunto de elementos da populao. A informao estatstica
GLOSSRIO
20
Medidas de tendncia central: so utilizadas para caracterizar um conjunto de valores, representando-os adequada-
mente. A denominao medida de tendncia central se deve ao fato de que, por ser uma medida que caracteriza um
conjunto, estar no meio dos valores. A mdia aritmtica e a mediana so exemplos de medidas de tendncia central.
Medidas de variao: As medidas de variao ou disperso servem para avaliar o quanto os dados so semelhantes
e descrevem o quanto os dados distam do valor central. Dessa maneira, as medidas de disperso servem tambm para
avaliar qual o grau de representao da mdia.
Polgono: fgura plana limitada por uma linha.
Populao: o conjunto de todos os elementos sob anlise estatstica. Se contrape ao conceito de amostra, que
uma parte, ou subconjunto da populao.
GLOSSRIO
uma parte, ou subconjunto da populao.
GABARITO
Questo 1
Resposta: A Estatstica muito utilizada pelos governos. Atravs de censos e pesquisas, os governos conhecem melhor
sua populao e suas necessidades.
Questo 2
Resposta: Alternativa D. 15 (entre 90 e 100) + 25 (entre 100 e 110).
Questo 3
Resposta: Alternativa A. Pelo grfco, possvel ver que a frequncia mxima acontece aos 22 anos.
Questo 4
Resposta: A mdia dos dados
7 5 3
3
5, ento a varincia ... 666 , 2
3
8
3
) 5 3 ( ) 5 5 ( ) 5 7 (
2 2 2


21
Questo 5
Resposta: A mdia dos dados
4 4 7
3
5, portanto a varincia 2
3
6
3
) 5 7 ( ) 5 4 ( ) 5 4 (
2 2 2


e, por sua vez, o desvio
padro 414 , 1 2 .