Sie sind auf Seite 1von 34

Apostila concurso

ESTATSTICA
Contedo
1.
2.
3.
4.
5.

Introduo
Organizao de Dados Estatsticos
Medidas de Posio
Medidas de Disperso
Medidas de Assimetria e Curtose

pag. 02
pag. 03
pag. 14
pag. 27
pag. 32

ESTATSTICA
1. INTRODUO
ESTATSTICA:

ramo da matemtica aplicada.

ANTIGUIDADE:

os povos j registravam o nmero de habitantes, nascimentos, bitos.


Faziam "estatsticas".

IDADE MDIA:

as informaes eram tabuladas com finalidades tributrias e blicas.

SEC. XVI:

surgem as primeiras anlises sistemticas, as primeiras tabelas e os nmeros


relativos.

SEC. XVIII: a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL.
As tabelas ficam mais completas, surgem as primeiras representaes grficas
e os clculos de probabilidades. A estatstica deixa de ser uma simples
tabulao de dados numricos para se tornar "O estudo de como se chegar a
concluso sobre uma populao, partindo da observao de partes dessa
populao (amostra)".
MTODO ESTATSTICO
MTODO:

um meio mais eficaz para atingir determinada meta.

MTODOS CIENTFICOS:

destacamos o mtodo experimental e o mtodo estatstico.

MTODO EXPERIMENTAL:

consiste em manter constante todas as causas,


menos uma, que sofre variao para se observar
seus efeitos, caso existam. Ex: Estudos da Qumica,
Fsica, etc.

MTODO ESTATSTICO:

diante da impossibilidade de manter as causas


constantes (nas cincias sociais), admitem todas
essas causas presentes variando-as, registrando
essas variaes e procurando determinar, no
resultado final, que influncias cabem a cada uma
delas. Ex: Quais as causas que definem o preo de
uma mercadoria quando a sua oferta diminui?

Seria impossvel, no momento da pesquisa, manter constantes a uniformidade dos


salrios, o gosto dos consumidores, nvel geral de preos de outros produtos, etc.
A ESTATSTICA
uma parte da matemtica aplicada que fornece mtodos para coleta,
organizao, descrio, anlise e interpretao de dados e para a utilizao dos
mesmos na tomada de decises.
A coleta, a organizao ,a descrio dos dados, o clculo e a interpretao de
coeficientes pertencem ESTATSTICA DESCRITIVA, enquanto a anlise e a
interpretao dos dados, associado a uma margem de incerteza, ficam a cargo da

ESTATSTICA INDUTIVA ou INFERENCIAL, tambm chamada como a medida da


incerteza ou mtodos que se fundamentam na teoria da probabilidade.
.

2. ORGANIZAO DE DADOS ESTATSTICOS


FASES DO MTODO ESTATSTICO
1 - DEFINIO DO PROBLEMA :

2 - PLANEJAMENTO :

Como levantar informaes ? Que dados devero ser obtidos ?


Qual levantamento a ser utilizado? Censitrio? Por amostragem?
E o cronograma de atividades ? Os custos envolvidos ? etc.

3 - COLETA DE DADOS:

Dados primrios:

Fase operacional. o registro sistemtico de dados, com


um objetivo determinado.
quando so publicados pela prpria pessoa ou organizao que
os haja recolhido. Ex: tabelas do censo demogrfico do IBGE.

Dados secundrios:

OBS:

Coleta Direta:

Saber exatamente aquilo que se pretende pesquisar


o mesmo que definir corretamente o problema.

quando so publicados por outra organizao. Ex: quando


determinado jornal publica estatsticas referentes ao censo
demogrfico extradas do IBGE.

mais seguro trabalhar com fontes primrias. O uso da fonte


secundria traz o grande risco de erros de transcrio.
quando obtida diretamente da fonte. Ex: Empresa que realiza
uma pesquisa para saber a preferncia dos consumidores pela
sua marca.
coleta contnua:
coleta peridica:
coleta ocasional:
Coleta Indireta:

4 - APURAO DOS DADOS:

registros de nascimento, bitos, casamentos;


recenseamento demogrfico, censo industrial;
registro de casos de dengue.
feita por dedues a partir dos elementos
conseguidos pela coleta direta, por analogia,
por avaliao,indcios ou proporcionalizao.

Resumo dos dados atravs de sua contagem e


agrupamento. a condensao e tabulao de
dados.

5 - APRESENTAO DOS DADOS: H duas formas de apresentao, que no se


excluem mutuamente. A apresentao tabular, ou
seja uma apresentao numrica dos dados em
linhas e colunas distribudas de modo ordenado,
segundo regras prticas fixadas pelo Conselho
Nacional de Estatstica. A apresentao grfica dos
dados numricos constitui uma apresentao
geomtrica permitindo uma viso rpida e clara do
fenmeno.
6 - ANLISE E INTERPRETAO DOS DADOS: A ltima fase do trabalho estatstico a
mais importante e delicada. Est ligada
essencialmente
ao
clculo
de
medidas e coeficientes, cuja finalidade

principal descrever
(estatstica descritiva).

fenmeno

DEFINIES BSICAS DA ESTATSTICA


.
FENMENO ESTATSTICO:
qualquer evento que se pretenda analisar, cujo estudo
seja possvel a aplicao do mtodo estatstico. So
divididos em trs grupos:
Fenmenos de massa ou coletivo:

so aqueles que no podem ser definidos por


uma simples observao. A estatstica dedicase ao estudo desses fenmenos. Ex: A
natalidade na Grande Vitria, O preo mdio
da cerveja no Esprito Santo, etc.

Fenmenos individuais:

so aqueles que iro compor os fenmenos de


massa.
Ex: cada nascimento na Grande Vitria,
cada preo de cerveja no Esprito Santo, etc.

Fenmenos de multido:

quando as caractersticas observadas para a massa


no se verificam para o particular.

DADO ESTATSTICO:

POPULAO:

AMOSTRA:

um dado numrico e considerado a matria-prima sobre a


qual iremos aplicar os mtodos estatsticos.

o conjunto total de elementos portadores de, pelo menos, uma


caracterstica comum.

uma parcela representativa da populao que EXAMINADA com o


propsito de tirarmos concluses sobre a essa populao.

PARMETROS:

So valores singulares que existem na populao e que servem para


caracteriz-la. Para definirmos um parmetro devemos examinar toda a
populao. Ex: Os alunos do 2 ano da FACEV tm em mdia 1,70
metros de estatura.

ESTIMATIVA:

um valor aproximado do parmetro e calculado com o uso da


amostra.

ATRIBUTO:

VARIVEL:

quando os dados estatsticos apresentam um carter qualitativo, o


levantamento e os estudos necessrios ao tratamento desses dados so
designados genericamente de estatstica de atributo.
o conjunto de resultados possveis de um fenmeno.

VARIVEL QUALITATIVA:

Quando seu valores so expressos por atributos: sexo, cor


da pele,etc.

VARIVEL QUANTITATIVA:

Quando os dados so de carter nitidamente


quantitativo, e o conjunto dos resultados possui uma
estrutura numrica, trata-se portanto da estatstica de
varivel e se dividem em :

VARIVEL DISCRETA OU DESCONTNUA: Seus valores so expressos


geralmente atravs de nmeros inteiros no negativos. Resulta normalmente
de contagens. Ex: N de alunos presentes s aulas de introduo estatstica
econmica no 1 semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36.

VARIVEL CONTNUA: Resulta normalmente de uma mensurao, e a


escala numrica de seus possveis valores corresponde ao conjunto R dos
nmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre
dois limites. Ex.: Quando voc vai medir a temperatura de seu corpo com um
termmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao
dilatar-se, passar por todas as temperaturas intermedirias at chegar na
temperatura atual do seu corpo.
Exemplos . Cor dos olhos das alunas:
. ndice de liquidez nas indstrias capixabas:
. Produo de caf no Brasil:
. Nmero de defeitos em aparelhos de TV:
. Comprimento dos pregos produzidos por uma empresa:
. O ponto obtido em cada jogada de um dado:

qualitativa
quantitativa
quantitativa
quantitativa
quantitativa
quantitativa

contnua
contnua
discreta
contnua
discreta

AMOSTRAGEM
MTODOS PROBABILSTICOS
Exige que cada elemento da populao possua determinada probabilidade de ser
selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o
tamanho da populao, a probabilidade de cada elemento ser selecionado ser 1/N.
Trata-se do mtodo que garante cientificamente a aplicao das tcnicas estatsticas
de inferncias. Somente com base em amostragens probabilsticas que se podem
realizar inferncias ou indues sobre a populao a partir do conhecimento da
amostra.
uma tcnica especial para recolher amostras, que garantem, tanto
quanto possvel, o acaso na escolha.
.
AMOSTRAGEM CASUAL ou ALEATRIA SIMPLES
o processo mais elementar e freqentemente utilizado. equivalente a um sorteio
lotrico. Pode ser realizada numerando-se a populao de 1 a n e sorteando-se, a
seguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa seqncia, os
quais correspondero aos elementos pertencentes amostra.
Ex:
Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura
de 90 alunos de uma escola:
1 - numeramos os alunos de 1 a 90.
2 - escrevemos os nmeros dos alunos, de 1 a 90, em pedaos iguais de papel,
colocamos na urna e aps mistura retiramos, um a um, nove nmeros que formaro a
amostra.
OBS: quando o nmero de elementos da amostra muito grande, esse tipo de sorteio
torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de nmeros aleatrios,
construda de modo que os algarismos de 0 a 9 so distribudos ao acaso nas linhas e
colunas.
.
.AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:

Quando a populao se divide em estratos (sub-populaes), convm que o sorteio


dos elementos da amostra leve em considerao tais estratos, da obtemos os
elementos da amostra proporcional ao nmero de elementos desses estratos.
Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo
anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. So
portanto dois estratos (sexo masculino e sexo feminino). Logo, temos:
POPULAC 10 % AMOSTR
O
A
MASC.
54
5,4
5
FEMIN.
36
3,6
4
Total
90
9,0
9
SEXO

Numeramos ento os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e


procedemos o sorteio casual com urna ou tabela de nmeros aleatrios.
.
AMOSTRAGEM SISTEMTICA:
Quando os elementos da populao j se acham ordenados, no h necessidade de
construir o sistema de referncia. So exemplos os pronturios mdicos de um
hospital, os prdios de uma rua, etc. Nestes casos, a seleo dos elementos que
constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador.
Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra
formada por 50 casas para uma pesquisa de opinio. Podemos, neste caso, usar o
seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um nmero
de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais
elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que
o nmero sorteado fosse 4 a amostra seria: 4 casa, 22 casa, 40 casa, 58 casa, 76
casa, etc.
AMOSTRAGEM POR CONGLOMERADOS (ou AGRUPAMENTOS)
Algumas populaes no permitem, ou tornam extremamente difcil que se
identifiquem seus elementos. No obstante isso, pode ser relativamente fcil identificar
alguns subgrupos da populao. Em tais casos, uma amostra aleatria simples
desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve
ser feita para o conglomerado sorteado. Agrupamentos tpicos so quarteires,
famlias, organizaes, agncias, edifcios etc.
Ex: Num levantamento da populao de determinada cidade, podemos dispor do
mapa indicando cada quarteiro e no dispor de uma relao atualizada dos seus
moradores. Pode-se, ento, colher uma amostra dos quarteires e fazer a contagem
completa de todos os que residem naqueles quarteires sorteados.
MTODOS NO PROBABILSITCOS
So amostragens em que h uma escolha deliberada dos elementos da amostra.
No possvel generalizar os resultados das pesquisas para a populao, pois as
amostras no-probabilsticas no garantem a representatividade da populao.
AMOSTRAGEM ACIDENTAL
Trata-se de uma amostra formada por aqueles elementos que vo aparecendo,
que so possveis de se obter at completar o nmero de elementos da amostra.
Geralmente utilizada em pesquisas de opinio, em que os entrevistados so
acidentalmente escolhidos.

Ex: Pesquisas de opinio em praas pblicas, ruas de grandes cidades;


AMOSTRAGEM INTENCIONAL
De acordo com determinado critrio, escolhido intencionalmente um grupo de
elementos que iro compor a amostra. O investigador se dirige intencionalmente a
grupos de elementos dos quais deseja saber a opinio.
Ex: Numa pesquisa sobre preferncia por determinado cosmtico, o pesquisador se
dirige a um grande salo de beleza e entrevista as pessoas que ali se encontram.
AMOSTRAGEM POR QUOTAS
Um dos mtodos de amostragem mais comumente usados em levantamentos de
mercado e em prvias eleitorais. Ele abrange trs fases:
1 - classificao da populao em termos de propriedades que se sabe, ou presume,
serem relevantes para a caracterstica a ser estudada;
2 - determinao da proporo da populao para cada caracterstica, com base na
constituio conhecida, presumida ou estimada, da populao;
3 - fixao de quotas para cada entrevistador a quem tocar a responsabilidade de
selecionar entrevistados, de modo que a amostra total observada ou entrevistada
contenha a proporo e cada classe tal como determinada na 2 fase.
Ex:
Numa pesquisa sobre o "trabalho das mulheres na atualidade", provavelmente
se ter interesse em considerar: a diviso cidade e campo, a habitao, o nmero de
filhos, a idade dos filhos, a renda mdia, as faixas etrias etc.
A primeira tarefa descobrir as propores (porcentagens) dessas caractersticas na
populao. Imagina-se que haja 47% de homens e 53% de mulheres na populao.
Logo, uma amostra de 50 pessoas dever ter 23 homens e 27 mulheres. Ento o
pesquisador receber uma "quota" para entrevistar 27 mulheres. A considerao de
vrias categorias exigir uma composio amostral que atenda ao n determinado e
s propores populacionais estipuladas.
.

SRIES ESTATSTICAS
TABELA:

um quadro que resume um conjunto de dados dispostos segundo linhas e


colunas de maneira sistemtica.

De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos
colocar :
um trao horizontal ( - ) quando o valor zero;
trs pontos ( ... ) quando no temos os dados;
zero ( 0 ) quando o valor muito pequeno para ser expresso pela
unidade utilizada;
um ponto de interrogao ( ? ) quando temos dvida quanto exatido
de determinado valor.
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto..

SRIE ESTATSTICA:

qualquer tabela que apresenta a distribuio de um conjunto de


dados estatsticos em funo da poca, do local ou da espcie.

SRIES HOMGRADAS:

so aquelas em que a varivel descrita apresenta variao


discreta ou descontnua. Podem ser do tipo temporal,
geogrfica ou especfica.

a) Srie Temporal:

Identifica-se pelo carter varivel do fator cronolgico. O


local e a espcie (fenmeno) so elementos fixos. Esta srie
tambm chamada de histrica ou evolutiva.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 1996
PERODO UNIDADES VENDIDAS
JAN/96
20000
FEV/96
10000
TOTAL
30000

.
b) Srie Geogrfica:

Apresenta como elemento varivel o fator geogrfico. A


poca e o fato (espcie) so elementos fixos. Tambm
chamada de espacial, territorial ou de localizao.

ABC VECULOS LTDA.


Vendas no 1 bimestre de 1996
FILIAIS
UNIDADES VENDIDAS
So Paulo
13000
Rio de Janeiro
17000
TOTAL
30000
c) Srie Especfica:

O carter varivel apenas o fato ou espcie. Tambm


chamada de srie categrica.

ABC VECULOS LTDA.


Vendas no 1 bimestre de 1996
MARCA UNIDADES VENDIDAS *
FIAT
18000
GM
12000
TOTAL
30000

SRIES CONJUGADAS:

Tambm chamadas de tabelas de dupla entrada. So


apropriadas apresentao de duas ou mais sries de maneira
conjugada, havendo duas ordens de classificao: uma
horizontal e outra vertical. O exemplo abaixo de uma srie
geogrfica-temporal.
ABC VECULOS LTDA.
Vendas no 1 bimestre de 1996

FILIAIS
Janeiro/96 Fevereiro/96
So Paulo
10000
3000
Rio de Janeiro 12000
5000
TOTAL
22000
8000
GRFICOS ESTATSTICOSG
So representaes visuais dos dados estatsticos que devem corresponder, mas
nunca substituir as tabelas estatsticas.
Caractersticas:

Uso de escalas, sistema de coordenadas, simplicidade, clareza e


veracidade.

Grficos de informao:

Grficos de anlise:

So grficos destinados principalmente ao pblico em geral,


objetivando proporcionar uma visualizao rpida e clara.
So grficos tipicamente expositivos, dispensando
comentrios explicativos adicionais. As legendas podem ser
omitidas, desde que as informaes desejadas estejam
presentes.
So grficos que prestam-se melhor ao trabalho estatstico,
fornecendo elementos teis fase de anlise dos dados, sem
deixar de ser tambm informativos. Os grficos de anlise
freqentemente vm acompanhados de uma tabela estatstica.
Inclui-se, muitas vezes um texto explicativo, chamando a ateno
do leitor para os pontos principais revelados pelo grfico.

Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo
analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um
problema de construo de escalas.
.
Classificao dos grficos:
Diagramas, Estereogramas, Pictogramas e Cartogramas.
.
1 - DIAGRAMAS:
So grficos geomtricos dispostos em duas dimenses. So os mais usados na
representao de sries estatsticas. Eles podem ser :
1.1-

Grficos em barras horizontais.

1.2-

Grficos em barras verticais ( colunas ).


Quando as legendas no so breves usa-se de preferncia os grficos em barras
horizontais. Nesses grficos os retngulos tm a mesma base e as alturas so
proporcionais aos respectivos dados.
A ordem a ser observada a cronolgica, se a srie for histrica, e a
decrescente, se for geogrfica ou categrica.

1.2-

Grficos em barras compostas.

1.4-

Grficos em colunas superpostas.


Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de
apresentar cada barra ou coluna segmentada em partes componentes. Servem para
representar comparativamente dois ou mais atributos.

1.5-

Grficos em linhas ou lineares.

So freqentemente usados para representao de sries cronolgicas com um


grande nmero de perodos de tempo. As linhas so mais eficientes do que as
colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de
se representarem vrias sries em um mesmo grfico.
Quando representamos, em um mesmo sistema de coordenadas, a variao de dois
fenmenos, a parte interna da figura formada pelos grficos desses fenmenos
denominada de rea de excesso.
1.5-

Grficos em setores.
Este grfico construdo com base em um crculo, e empregado sempre que
desejamos ressaltar a participao do dado no total. O total representado pelo
crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais
que suas reas so respectivamente proporcionais aos dados da srie. O grfico em
setores s deve ser empregado quando h, no mximo, sete dados.
Obs: As sries temporais geralmente no so representadas por este tipo de grfico.

.
2 - ESTEREOGRAMAS:
So grficos geomtricos dispostos em trs dimenses, pois representam volume.
So usados nas representaes grficas das tabelas de dupla entrada. Em alguns
casos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso que
oferecem.
.
3 - PICTOGRAMAS:
So construdos a partir de figuras representativas da intensidade do fenmeno. Este
tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua
forma atraente e sugestiva. Os smbolos devem ser auto-explicativos. A
desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno,
e no de detalhes minuciosos. Veja o exemplo abaixo:

4- CARTOGRAMAS:
So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de
figurar os dados estatsticos diretamente relacionados com reas geogrficas ou
polticas.

DISTRIBUIO DE FREQNCIA
um tipo de tabela que condensa uma coleo de dados conforme as
freqncias (repeties de seus valores).
Tabela primitiva ou dados brutos:

uma tabela ou relao de elementos que no


foram numericamente organizados. difcil

formarmos uma idia exata do comportamento do


grupo como um todo, a partir de dados no
ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
ROL:

a tabela obtida aps a ordenao dos dados (crescente ou decrescente).


Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

Distribuio de freqncia SEM INTERVALOS DE CLASSE:


a simples condensao
dos dados conforme as repeties de seu valores. Para um ROL de tamanho razovel esta
distribuio de freqncia inconveniente, j que exige muito espao. Veja exemplo abaixo:
Dados Freqncia
41
3
42
2
43
1
44
1
45
1
46
2
50
2
51
1
52
1
54
1
57
1
58
2
60
2
Total
20
Distribuio de freqncia COM INTERVALOS DE CLASSE:Quando o tamanho da
amostra elevado, mais racional efetuar o agrupamento dos valores em vrios intervalos
de classe.
Classes Freqncias
41 |------- 45
7
45 |------- 49
3
49 |------- 53
4
53 |------- 57
1
57 |------- 61
5
Total
20

ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA (com intervalos de classe)


CLASSE:

so os intervalos de variao da varivel e simbolizada por i e o nmero total


de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 |------- 53 a 3
classe, onde i = 3.

LIMITES DE CLASSE:

so os extremos de cada classe. O menor nmero o limite


inferior de classe ( li ) e o maior nmero, limite superior de classe (
Li ). Ex: em 49 |------- 53,... l3 = 49 e L3 = 53. O smbolo |------representa um intervalo fechado esquerda e aberto direita.
O dado 53 do ROL no pertence a classe 3 e sim a classe 4
representada por 53 |------- 57.

AMPLITUDE DO INTERVALO DE CLASSE:

AMPLITUDE TOTAL DA DISTRIBUIO:

obtida atravs da diferena entre o limite


superior e inferior da classe e simbolizada
por hi = Li - li. Ex: na tabela anterior hi = 53
- 49 = 4. Obs: Na distribuio de freqncia
c/ classe o hi ser igual em todas as
classes.

a diferena entre o limite superior da ltima


classe e o limite inferior da primeira classe. AT
= L(max) - l(min). Ex: na tabela anterior AT =
61 - 41= 20.

AMPLITUDE TOTAL DA AMOSTRA (ROL): a diferena entre o valor mximo e o valor


mnimo da amostra (ROL). Onde AA = Xmax Xmin. Em nosso exemplo AA = 60 - 41 = 19.
Obs: AT sempre ser maior que AA.

PONTO MDIO DE CLASSE:

o ponto que divide o intervalo de classe em duas partes


iguais. ....... Ex: em 49 |------- 53 o ponto mdio x3 =
(53+49)/2 = 51, ou seja x3=( l3 + L3 )/2.

Mtodo prtico para construo de uma Distribuio de Freqncias c/ Classe


1 -

Organize os dados brutos em um ROL.

2 -

Calcule a amplitude amostral AA.


No nosso exmplo: AA = 60 - 41 = 19

3 -

Calcule o nmero de classes atravs da "Regra de Sturges":


I
n de classes
3 |-----| 5
3
6 |-----| 11
4
12 |-----| 22
5
23 |-----| 46
6
47 |-----| 90
7
91 |-----| 181
8
182 |-----| 362
9
n

Obs: Qualquer regra para determinao do n de classes da tabela no nos levam a


uma deciso final; esta vai depender, na realidade de um julgamento pessoal,
que deve estar ligado natureza dos dados.
No nosso exemplo:
classes.

n = 20 dados, ento ,a princpio, a regra sugere a adoo de 5

4 -

Decidido o n de classes, calcule ento a amplitude do intervalo de classe h > AA / i.


No nosso exemplo: AA/i = 19/5 = 3,8 . Obs: Como h > AA/i um valor ligeiramente
superior para haver folga na ltima classe. Utilizaremos ento h = 4

5 -

Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo.


Podemos montar a tabela, com o cuidado para no aparecer classes com freqncia =
0 (zero).
No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a primeira classe ser
representada por ...... 41 |------- 45. As classes seguintes respeitaro o mesmo
procedimento.
O primeiro elemento das classes seguintes sempre sero formadas pelo ltimo
elemento da classe anterior.

REPRESENTAO GRFICA DE UMA DISTRIBUIO


Histograma, Polgono de freqncia e Polgono de freqncia acumulada
Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas)
colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as
freqncias.
.
Histograma:

formado por um conjunto de retngulos justapostos, cujas bases se


localizam sobre o eixo horizontal, de tal modo que seus pontos mdios
coincidam com os pontos mdios dos intervalos de classe. A rea de um
histograma proporcional soma das freqncias simples ou absolutas.
Freqncias simples ou absoluta:
so os valores que realmente representam o nmero
de dados de cada classe. A soma das freqncias
simples igual ao nmero total dos dados da
distribuio.
Freqncias relativas:

so os valores das razes entre as freqncia absolutas de cada


classe e a freqncia total da distribuio. A soma das
freqncias relativas igual a 1 (100 %).

.
Polgono de freqncia:

um grfico em linha, sendo as freqncias marcadas sobre


perpendiculares ao eixo horizontal, levantadas pelos pontos
mdios dos intervalos de classe. Para realmente obtermos um
polgono (linha fechada), devemos completar a figura, ligando os
extremos da linha obtida aos pontos mdios da classe anterior
primeira e da posterior ltima, da distribuio.

.
Polgono de freqncia acumulada: traado marcando-se as freqncias acumuladas
sobre perpendiculares ao eixo horizontal, levantadas
nos pontos correspondentes aos limites superiores
dos intervalos de classe.

Freqncia simples acumulada de uma classe:

o total das freqncias de todos os


valores inferiores ao limite superior do
intervalo de uma determinada classe.

Freqncia relativa acumulada de um classe:

a freqncia acumulada da classe,


dividida pela freqncia total da
distribuio.

...CLASSE.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri.....


50 |-------- 54
4
52
0,100
4
0,100
54 |-------- 58
9
56
0,225
13
0,325
58 |-------- 62
11
60
0,275
24
0,600
62 |-------- 66
8
64
0,200
32
0,800
66 |-------- 70
5
68
0,125
37
0,925
70 |-------- 74
3
72
0,075
40
1,000
Total
40
1,000

fi = freqncia simples; xi = ponto mdio de classe; fri = freqncia simples acumulada;


Fi = freqncia relativa e Fri = freqncia relativa acumulada.
Obs: uma distribuio de freqncia sem intervalos de classe representada
graficamente por um diagrama onde cada valor da varivel representado por um
segmento de reta vertical e de comprimento proporcional respectiva freqncia.
.

3. MEDIDAS DE POSIO
Introduo
So as estatsticas que representam uma srie de dados orientando-nos quanto
posio da distribuio em relao ao eixo horizontal do grfico da curva de
freqncia.
As medidas de posies mais importantes so as medidas de tendncia central ou
promdias (verifica-se uma tendncia dos dados observados a se agruparem em
torno dos valores centrais).
As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e
mediana. Outros promdios menos usados so as mdias: geomtrica, harmnica,
quadrtica, cbica e biquadrtica.
As outras medidas de posio so as separatrizes, que englobam: a prpria
mediana, os decis, os quartis e os percentis.
.

MDIA ARITMTICA =
igual ao quociente entre a soma dos valores do conjunto e o nmero total dos
valores.

......
onde xi so os valores da varivel e n o nmero de valores.
.
Dados no-agrupados: Quando desejamos conhecer a mdia dos dados no-agrupados
em tabelas de freqncias, determinamos a mdia aritmtica
simples.
Ex:
Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10,
14, 13, 15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de:
.= (10+14+13+15+16+18+12) / 7 = 14 kilos

Desvio em relao mdia:

a diferena entre cada elemento de um conjunto de


valores e a mdia aritmtica, ou seja:.
. di = Xi -

No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 ,


d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ... e. ..
d7 = 12 - 14 = - 2.
.

Propriedades da mdia aritmtica

1 propriedade:

A soma algbrica dos desvios em relao mdia nula.

No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0


2 propriedade:

Somando-se (ou subtraindo-se) uma constante (c) a todos os


valores de uma varivel, a mdia do conjunto fica aumentada ( ou
diminuda) dessa constante.

Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel


temos:
Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou
Y=

3 propriedade:

.+ 2 = 14 +2 = 16 kilos

Multiplicando-se (ou dividindo-se) todos os valores de uma varivel


por uma constante (c), a mdia do conjunto fica multiplicada ( ou
dividida) por essa constante.

Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da


varivel temos:

Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou
Y=

x 3 = 14 x 3 = 42 kilos

.
Dados agrupados:
Sem intervalos de classe

Consideremos a distribuio relativa a 34 famlias de quatro


filhos, tomando para varivel o nmero de filhos do sexo
masculino. Calcularemos a quantidade mdia de meninos
por famlia:
N de meninos freqncia = fi
0
2
1
6
2
10
3
12
4
4
total
34

Como as freqncias so nmeros indicadores da intensidade de cada valor da


varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a
mdia aritmtica ponderada, dada pela frmula:

..xi.
0
1
2
3
4
total

..fi. ..xi.fi .
2
0
6
6
10 20
12 36
4
16
34 78

onde 78 / 34 = 2,3 meninos por famlia


Com intervalos de classe
Neste caso, convencionamos que todos os valores includos
em um determinado intervalo de classe coincidem com o
seu ponto mdio, e determinamos a mdia aritmtica
ponderada por meio da frmula:
..
onde Xi o ponto mdio da classe.
Ex: Calcular a estatura mdia de bebs conforme a tabela abaixo.
Estaturas (cm) freqncia = fi ponto mdio = xi
50 |------------ 54
4
52
54 |------------ 58
9
56
58 |------------ 62
11
60

..xi.fi.
208
504
660

62 |------------ 66
66 |------------ 70
70 |------------ 74
Total

8
5
3
40

64
68
72

Aplicando a frmula acima temos: 2.440 / 40.= 61. logo...


MDIA GEOMTRICA =

512
340
216
2.440

= 61 cm

a raiz n-sima do produto de todos eles.

Mdia Geomtrica Simples:

ou .

Ex.: - Calcular a mdia geomtrica dos seguintes conjuntos de nmeros:E


a) { 10, 60, 360 }.:
b) { 2, 2, 2 }........:
c) { 1, 4, 16, 64 }:
.

= ( 10 * 60 * 36 0) ^ (1/3) ....R: 60
= (2 * 2 * 2 ^ (1/3) ...R: 2
= (1 * 4 * 16 * 64 ) ^(1/4) ....R: 8

Mdia Geomtrica Ponderada :

ou ..
Ex - Calcular a mdia geomtrica dos valores da tabela abaixo:
...xi... ...fi...
1
2
3
4
9
2
27
1
Total 9
= (12 * 34 * 92 * 271) (1/9)........R: 3,8296

.
MDIA HARMNICA -

o inverso da mdia aritmtica dos inversos.


.
Mdia Harmnica Simples:. (para dados no agrupados)

..

ou

.
Mdia Harmnica Ponderada : (para dados agrupados em tabelas de freqncias)

..

Ex.: Calcular a mdia harmnica dos valores da tabela abaixo:


classes
....fi.... ....xi.... ........fi/xi........
1 |--------- 3
2
2
2/2 = 1,00
3 |--------- 5
4
4
4/4 = 1,00
5 |--------- 7
8
6
8/6 = 1,33
7 |--------- 9
4
8
4/8 = 0,50
9 |--------- 11
2
10
2/10 = 0,20
total
20
4,03
Resp: 20 / 4,03 = 4,96
OBS:

A mdia harmnica no aceita valores iguais a zero como dados de uma


srie.

A igualdade
iguais.
OBS:

g =

h.=

....s ocorrer quando todos os valores da srie forem

Quando os valores da varivel no forem muito diferentes, verifica-se


aproximadamente a seguinte relao:

g = ( .+

h ) /.2

Demonstraremos a relao acima com os seguintes dados:


z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 }
Mdia aritmtica = 51,3 / 5
Mdia geomtrica=

= 10,2600
= 10,2587

Mdia harmnica = 5 / 0,4874508

= 10,2574

Comprovando a relao: 10,2600 + 10,2574 / 2 = 10,2587 = mdia geomtrica


.
MODA - Mo
o valor que ocorre com maior freqncia em uma srie de valores.
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa fbrica.
.
A Moda quando os dados no esto agrupados

A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor


que mais se repete.
Ex: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.
H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea
mais vezes que outros.
Ex: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.
.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,
ento, que a srie tem dois ou mais valores modais.
Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A
srie bimodal.
.
A Moda quando os dados esto agrupados
a) Sem intervalos de classe:

Uma vez agrupados os dados, possvel determinar


imediatamente a moda: basta fixar o valor da varivel de
maior freqncia.

Ex: Qual a temperatura mais comum medida no ms abaixo:


Temperaturas Freqncia
0 C
3
1 C
9
2 C
12
3 C
6
Resp: 2 C a temperatura modal, pois a de maior freqncia.
.
b) Com intervalos de classe: A classe que apresenta a maior freqncia denominada
classe modal. Pela definio, podemos afirmar que a
moda, neste caso, o valor dominante que est
compreendido entre os limites da classe modal. O
mtodo mais simples para o clculo da moda consiste em
tomar o ponto mdio da classe modal. Damos a esse valor
a denominao de moda bruta.
Mo = ( l* + L* ) / 2
onde l* = limite inferior da classe modal e L* = limite superior da classe modal.
Ex: Calcule a estatura modal conforme a tabela abaixo.
Classes (em cm) Freqncia
54 |------------ 58
9
58 |------------ 62
11
62 |------------ 66
8
66 |------------ 70
5

Resposta: a classe modal 58|-------- 62, pois a de maior freqncia. l* = 58 e


L* = 62
Mo = (58+62) / 2 = 60 cm ( este valor estimado, pois no conhecemos o valor
real da moda).
.
Mtodo mais elaborado pela frmula de CZUBER:

Mo = l* + (d1/(d1+d2)) x h*

l* = limite inferior da classe modal..... e..... L* = limite superior da classe modal


d1 = freqncia da classe modal - freqncia da classe anterior da classe modal
d2 = freqncia da classe modal - freqncia da classe posterior da classe modal
h* = amplitude da classe modal
Mo = 58 + ((11-9) / ((11-9) + (11 8)) x 4

Mo = 59,6

Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada
de posio ou quando a medida de posio deva ser o valor mais tpico da
distribuio. J a mdia aritmtica a medida de posio que possui a maior
estabilidade.

MEDIANA - Md
A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente
ou decrescente), o valor situado de tal forma no conjunto que o separa em dois
subconjuntos de mesmo nmero de elementos.
.
A mediana em dados no-agrupados
Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }
De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao
(crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9.
.
Mtodo prtico para o clculo da Mediana:
Se a srie dada tiver nmero mpar de termos:
ordem dado pela frmula :

O valor mediano ser o termo de

.( n + 1 ) / 2

Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 }


1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada
ser a mediana
A mediana ser o 5 elemento = 2
.
Se a srie dada tiver nmero par de termos:

O valor mediano ser o termo de ordem


dado pela frmula :....

.[( n/2 ) +( n/2+ 1 )] / 2


Obs:

n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor
correspondente.
Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2
[( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2
5 termo = 2
6 termo = 3
A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser a mdia
aritmtica do 5 e 6 termos da srie.
Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da
mediana com um dos elementos da srie.
Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia
da mediana com um dos elementos da srie. A mediana ser sempre a mdia
aritmtica dos 2 elementos centrais da srie.
Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo
valor.
A mediana, depende da posio e no dos valores dos elementos na srie
ordenada. Essa uma da diferenas marcantes entre mediana e mdia ( que se
deixa influenciar, e muito, pelos valores extremos). Vejamos:
Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10
Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10
isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por
influncia dos valores extremos, ao passo que a mediana permanece a mesma.
A mediana em dados agrupados
a) Sem intervalos de classe:

Neste caso, o bastante identificar a freqncia acumulada


imediatamente superior metade da soma das freqncias.
A mediana ser aquele valor da varivel que corresponde a
tal freqncia acumulada.

Ex.: conforme tabela abaixo:


Varivel xi Freqncia fi Freqncia acumulada
0
2
2
1
6
8
2
9
17
3
13
30
4
5
35
total
35
Quando o somatrio das freqncias for mpar o valor mediano ser o termo de
ordem dado pela frmula :
.

Como o somatrio das freqncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3..


Quando o somatrio das freqncias for par o valor mediano ser o termo de ordem
dado pela frmula:

Ex: Calcule Mediana da tabela abaixo:


Varivel xi Freqncia fi Freqncia acumulada
12
1
1
14
2
3
15
1
4
16
2
6
17
1
7
20
1
8
total
8
Aplicando frmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 +
16) / 2 = 15,5
b) Com intervalos de classe:

Devemos seguir os seguintes passos:

1)

Determinamos as freqncias acumuladas ;

2)

Calculamos

3)

Marcamos a classe correspondente freqncia acumulada imediatamente superior

. Tal classe ser a classe mediana ;


4) Calculamos a Mediana pela seguinte frmula:.

M Md = l* + [(

- FAA ) x h*] / f*

l*
= o limite inferior da classe mediana.
FAA = a freqncia acumulada da classe anterior classe mediana.
f*
= a freqncia simples da classe mediana.
h*
= a amplitude do intervalo da classe mediana.
Ex:
classes
freqncia = fi Freqncia acumulada
50 |------------ 54
4
4
54 |------------ 58
9
13
58 |------------ 62
11
24
62 |------------ 66
8
32
66 |------------ 70
5
37

70 |------------ 74
total

3
40

40

= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62


l* = 58........... FAA = 13........... f* = 11........... h* = 4
Substituindo esses valores na frmula, obtemos:
Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54
OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio.
Emprego da Mediana
Quando desejamos obter o ponto que divide a distribuio em duas partes iguais.
Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica.
Quando a varivel em estudo salrio.

SEPARATRIZES
Alm das medidas de posio que estudamos, h outras que, consideradas
individualmente, no so medidas de tendncia central, mas esto ligadas
mediana relativamente sua caracterstica de separar a srie em duas partes que
apresentam o mesmo nmero de valores.
Essas medidas - os quartis, os decis e os percentis - so, juntamente com a
mediana, conhecidas pelo nome genrico de separatrizes.
.
QUARTIS - Q
Denominamos quartis os valores de uma srie que a dividem em quatro partes
iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a srie em
quatro partes iguais.
Obs: O quartil 2 ( Q2 ) SEMPRE SER IGUAL A MEDIANA DA SRIE.
Quartis em dados no agrupados
O mtodo mais prtico utilizar o princpio do clculo da mediana para os 3
quartis. Na realidade sero calculadas " 3 medianas " em uma mesma srie.
Ex 1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 }
- O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos
valores: { 2, 5, 6, 9, 10, 13, 15 }
- O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9 que
ser = Q2 = 9
- Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais
proporcionados pela mediana ( quartil 2 ). Para o clculo do quartil 1 e 3 basta
calcular as medianas das partes iguais provenientes da verdadeira Mediana da
srie (quartil 2).
Logo em { 2, 5, 6 } a mediana = 5 . Ou seja: ser o quartil 1 = Q1 = 5
em {10, 13, 15 } a mediana =13 . Ou seja: ser o quartil 3 = Q = 13

Ex 2: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 }


- A srie j est ordenada, ento calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5
- O quartil 1 ser a mediana da srie esquerda de Md : { 1, 1, 2, 3, 5, 5 }
Q1 = (2+3)/2 = 2,5
- O quartil 3 ser a mediana da srie direita de Md : {6, 7, 9, 9, 10, 13 }
Q3 = (9+9)/2 = 9
Quartis para dados agrupados em classes
Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da
mediana,
E fi / 2.... por ... k . E fi / 4 ... sendo k o nmero de ordem do quartil.
Assim, temos:
Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f*
Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f*
Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f*
Ex 3 - Calcule os quartis da tabela abaixo:
classes
freqncia = fi Freqncia acumulada
50 |------------ 54
4
4
54 |------------ 58
9
13
58 |------------ 62
11
24
62 |------------ 66
8
32
66 |------------ 70
5
37
70 |------------ 74
3
40
total
40
- O quartil 2 = Md , logo:
= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62
l* = 58........... FAA = 13........... f* = 11........... h* = 4
Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f*
- Substituindo esses valores na frmula, obtemos:
Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 = Q2

- O quartil 1 : E fi / 4 = 10
Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f*
Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 = Q1
.
- O quartil 3 : 3.E fi / 4 = 30
Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f*
Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 = Q3

DECIS - D
A definio dos decis obedece ao mesmo princpio dos quartis, com a modificao da
porcentagem de valores que ficam aqum e alm do decil que se pretende calcular. A
frmula bsica ser : k .E fi / 10 onde k o nmero de ordem do decil a ser
calculado. Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis
para dividirmos uma srie em 10 partes iguais.
De especial interesse o quinto decil, que divide o conjunto em duas partes
iguais. Assim sendo,o QUINTO DECIL IGUAL AO SEGUNDO QUARTIL, que por
sua vez IGUAL MEDIANA.
Para D5 temos :

5.E fi / 10 = E fi / 2

Ex: Calcule o 3 decil da tabela anterior com classes.


k= 3 onde

3 .E fi / 10 = 3 x 40 / 10 = 12.

Este resultado corresponde a 2 classe.


D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55 = D3

PERCENTIL ou CENTIL
Denominamos percentis ou centis como sendo os noventa e nove valores que
separam uma srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente que
P50 = Md ; P25 = Q1 e P75 = Q3.
O clculo de um centil segue a mesma tcnica do clculo da mediana, porm a
frmula ser : k .E fi / 100 onde k o nmero de ordem do centil a ser calculado.

Disperso ou Variabilidade:

a maior ou menor diversificao dos valores de uma


varivel em torno de um valor de tendncia central ( mdia
ou mediana ) tomado como ponto de comparao.

A mdia - ainda que considerada como um nmero que tem a faculdade de


representar uma srie de valores - no pode, por si mesma, destacar o grau de
homogeneidade ou heterogeneidade que existe entre os valores que compem o
conjunto.

Consideremos os seguintes conjuntos de valores das variveis X, Y e Z:


X = { 70, 70, 70, 70, 70 }
Y = { 68, 69, 70 ,71 ,72 }
Z = { 5, 15, 50, 120, 160 }
-

Observamos ento que os trs conjuntos apresentam a mesma mdia


aritmtica = 350/5 = 70

Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e


Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais
homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus
valores e a mdia representativa.
Conclumos ento que o conjunto X apresenta DISPERSO NULA e que o conjunto
Y apresenta uma DISPERSO MENOR que o conjunto Z.

4. MEDIDAS DE DISPERSO ABSOLUTA


AMPLITUDE TOTAL:

a nica medida de disperso que no tem na mdia o ponto


de referncia.

Quando os dados no esto agrupados a amplitude total a diferena entrE o maior e


o menor valor observado:
AT = X mximo - X mnimo.
Ex:
Para os valores 40, 45, 48, 62 e 70 a amplitude total ser: AT = 70 - 40 = 30
Quando os dados esto agrupados sem intervalos de classe ainda temos :
AT = X mximo - X mnimo.
Ex:
xi
0
1
3
4

fi
2
6
5
3

AT = 4 - 0 = 4
* Com intervalos de classe a AMPLITUDE TOTAL a diferena entre o limite superior da
ltima classe e o limite inferior da primeira classe. Ento:
AT = L mximo - l mnimo
Ex:
Classes
4 |------------- 6
6 |------------- 8
8 |------------- 10

fi
6
2
3

AT = 10 - 4 = 6
A amplitude total tem o inconveniente de s levar em conta os dois valores extremos
da srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude
total quando se quer determinar a amplitude da temperatura em um dia, no
controle de qualidade ou como uma medida de clculo rpido sem muita
exatido.
DESVIO QUARTIL:

Tambm chamado de amplitude semi-interquatlica e baseada


nos quartis.
Smbolo: Dq

Frmula: Dq = (Q3 - Q1) / 2

Observaes:
1-

23-

O desvio quartil apresenta como vantagem o fato de ser uma medida fcil de calcular
e de interpretar. Alm do mais, no afetado pelos valores extremos, grandes ou
pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem
valores extremos que no se consideram representativos.
O desvio quartil dever ser usado preferencialmente quando a medida de tendncia
central for a mediana.
Trata-se de uma medida insensvel distribuio dos itens menores que Q1, entre Q1
e Q3 e maiores que Q3.
Ex: Para os valores 40, 45, 48, 62 e 70 o desvio quartil ser:
Q1 = (45+40)/2 = 42,5

Q3 = (70+62)/2 = 66

Dq = (66 - 42,5) / 2 = 11,75

DESVIO MDIO ABSOLUTO - Dm


Para dados brutos:

a mdia aritmtica dos valores absolutos dos desvios


tomados em relao a uma das seguintes medidas de tendncia
central: mdia ou mediana.

para a Mdia =

Dm = E | Xi -

| /n

para a Mediana =

Dm = E | Xi - Md | / n

As barras verticais indicam que so tomados os valores absolutos, prescindindo do


sinal dos desvios.
Ex: Calcular o desvio mdio do conjunto de nmeros { - 4 , - 3 , - 2 , 3 , 5 }
= - 0, 2 e Md = - 2

Tabela auxiliar para clculo do desvio mdio


Xi
-4
-3
-2
3
5

Xi | Xi - |
(- 4) - (-0,2) = -3,8
3,8
(- 3) - (-0,2) = -2,8
2,8
(- 2) - (-0,2) = -1,8
1,8
3 - (-0,2) = 3,2
3,2
5 - (-0,2) = 5,2
5,2
E=

Pela Mdia :

Dm = 16,8 / 5 = 3,36

16,8

Xi - Md

| Xi - Md |

(- 4) - (-2) = - 2
(- 3) - (-2) = - 1
(- 2) - (-2) = 0
3 - (-2) = 5
5 - (-2) = 7

2
1
0
5
7

E=

15

Pela Mediana :

Dm = 15 / 5 = 3

DESVIO PADRO - S
a medida de disperso mais geralmente empregada, pois leva em considerao
a totalidade dos valores da varivel em estudo. um indicador de variabilidade
bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia
aritmtica e a sua frmula bsica pode ser traduzida como : a raiz quadrada da
mdia aritmtica dos quadrados dos desvios e representada por S .

A frmula acima empregada quando tratamos de uma populao de dados noagrupados.


Ex: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5
Xi
-4
-3
-2
3
5

- 0,2
- 0,2
- 0,2
- 0,2
- 0,2

- 3,8
- 2,8
- 1,8
3,2
5,2

14,44
7,84
3,24
10,24
27,04

E=

62,8

Sabemos que n = 5 e 62,8 / 5 = 12,56.


A raiz quadrada de 12,56 o desvio padro = 3,54
Obs: Quando nosso interesse no se restringe descrio dos dados mas, partindo da
amostra, visamos tirar inferncias vlidas para a respectiva populao, convm
efetuar uma modificao, que consiste em usar o divisor n - 1 em lugar de n. A
frmula ficar ento:

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padro


amostral seria a raiz quadrada de 62,8 / (5 -1) = 3,96
O desvio padro goza de algumas propriedades, dentre as quais destacamos:

1 =

Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o


desvio padro no se altera.

2 =

Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante
(diferente de zero), o desvio padro fica multiplicado ( ou dividido) por essa constante.

Quando os dados esto agrupados (temos a presena de freqncias) a frmula do


desvio padro ficar :

ou
Ex:

quando se trata de uma amostra

Calcule o desvio padro populacional da tabela abaixo:


Xi
0
1
2
3
4

f i Xi . f i
2
6
12
7
3

0
6
24
21
12

Total 30

63

.fi
2,1
2,1
2,1
2,1
2,1

-2,1
-1,1
-0,1
0,9
1,9

4,41
1,21
0,01
0,81
3,61

8,82
7,26
0,12
5,67
10,83

E=

32,70

- Sabemos que E fi = 30 e 32,7 / 30 = 1,09.


- A raiz quadrada de 1,09 o desvio padro = 1,044
- Se considerarmos os dados como sendo de uma amostra o desvio padro seria :
raiz quadrada de 32,7 / (30 -1) = 1,062

Obs: Nas tabelas de freqncias com intervalos de classe a frmula a ser utilizada
a mesma do exemplo anterior.
VARINCIA - S2
o desvio padro elevado ao quadrado. A varincia uma medida que tem pouca
utilidade como estatstica descritiva, porm extremamente importante na inferncia
estatstica e em combinaes de amostras.

MEDIDAS DE DISPERSO RELATIVA


Coeficiente de Variao de Pearson - CVP
Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um
desvio padro de 2 unidades pode ser considerado pequeno para uma srie de

valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no
pode ser dito.
Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados
limita o seu emprego quando desejamos comparar duas ou mais sries de valores,
relativamente sua disperso ou variabilidade, quando expressas em unidades
diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou
variabilidade dos dados em termos relativos a seu valor mdio, medida essa
denominada de CVP: Coeficiente de Variao de Pearson ( A RAZO ENTRE O
DESVIO PADRO E A MDIA REFERENTES A DADOS DE UMA MESMA SRIE).

CVP = (S /

) x 100

o resultado neste caso expresso em percentual, entretanto pode ser


expresso tambm atravs de um fator decimal, desprezando assim o
valor 100 da frmula.
Ex: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de
indivduos:
Discriminao
ESTATURAS
PESOS

MDIA
175 cm
68 kg

DESVIO PADRO
5,0 cm
2,0 kg

- Qual das medidas (Estatura ou Peso) possui maior homogeneidade ?


Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado
menor ser o de maior homogeneidade ( menor disperso ou variabilidade).
CVP estatura =
CVP peso =

( 5 / 175 ) x 100
( 2 / 68 ) x 100

= 2,85 %
= 2,94 %.

Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso


que os pesos.
Coeficiente de Variao de Thorndike - CVT
igual ao quociente entre o desvio padro e a mediana.
CVT = ( S / Md ) x 100 %

Coeficiente Quartlico de Variao - CVQ


Esse coeficiente definido pela seguinte expresso:
CVQ = [(Q3 - Q1) / (Q3 + Q1)] x 100 %.

Desvio quartil Reduzido Dqr


Dqr = [(Q3 - Q1) / 2Md ] x 100 %.

5. MEDIDAS DE ASSIMETRIA
Introduo:
Uma distribuio com classes simtrica quando :
Mdia = Mediana = Moda
Uma distribuio com classes :
Assimtrica esquerda ou negativa quando :

Mdia < Mediana < Moda

Assimtrica direita ou positiva quando :

Mdia > Mediana > Moda

Coeficiente de assimetria:

A medida anterior, por ser absoluta, apresenta a mesma


deficincia do desvio padro, isto , no permite a
possibilidade de comparao entre as medidas de duas
distribuies. Por esse motivo, daremos preferncia ao
coeficiente de assimetria de Person:

As = 3 ( Mdia - Mediana ) / Desvio Padro

Escalas de assimetria:
| AS | < 0,15

assimetria pequena

0,15 < | AS | < 1

assimetria moderada

| AS | > 1

assimetria elevada

Obs: Suponhamos AS = - 0,49


negativa
Suponhamos AS = 0,75
positiva

a assimetria considerada moderada e

a assimetria considerada moderada e

MEDIDAS DE CURTOSE
Introduo:
Denominamos CURTOSE o grau de achatamento de uma distribuio em relao a
uma distribuio padro, denominada curva normal (curva correspondente a uma
distribuio terica de probabilidade).

Quando a distribuio apresenta uma curva de freqncia mais fechada que a


normal (ou mais aguda ou afilada em sua parte superior), ela recebe o nome de
leptocrtica.
Quando a distribuio apresenta uma curva de freqncia mais aberta que a
normal (ou mais achatada em sua parte superior), ela recebe o nome de platicrtica.
A curva normal, que a nossa base referencial, recebe o nome de mesocrtica.
Coeficiente de curtose
C1 = (Q3 - Q1) / 2(P90 - P10)

Este coeficiente conhecido como percentlico de curtose.


Relativamente a curva normal, temos:
C1 = 0,263
C1 < 0,263
C1 > 0,263

curva mesocrtica
curva leptocrtica
curva platicrtica

O coeficiente abaixo ( C2 )ser utilizado em nossas anlises:

onde S desvio padro


C2 = 3
C2 > 3
C2 < 3

curva mesocrtica
curva leptocrtica
curva platicrtica

FIM

Das könnte Ihnen auch gefallen