Sie sind auf Seite 1von 72

RESUMO

ESTATSTICA
BSICA

Contedo

1. Introduo
pag. 02
2. Organizao de Dados
Estatsticos pag. 03
3. Medidas de
Posio pag. 14
4. Medidas de
Disperso pag. 27
5. Medidas de Assimetria e
Curtose pag. 32
Alexandre Jos Granzotto Julho a
Outubro / 2002

RESUMO - ESTATSTICA BSICA

1. INTRODUO

ESTATSTICA: ramo da matemtica aplicada.

ANTIGUIDADE: os povos j registravam o nmero de habitantes,


nascimentos, bitos. Faziam "estatsticas".

IDADE MDIA: as informaes eram tabuladas com finalidades


tributrias e blicas.

SEC. XVI: surgem as primeiras anlises sistemticas, as primeiras


tabelas e os nmeros relativos.

SEC. XVIII: a estatstica com feio cientfica batizada por


GODOFREDO ACHENWALL. As tabelas ficam mais
completas, surgem as primeiras representaes grficas e
os clculos de probabilidades. A estatstica deixa de ser
uma simples tabulao de dados numricos para se
tornar "O estudo de como se chegar a concluso sobre
uma populao, partindo da observao de partes
dessa populao (amostra)".

MTODO ESTATSTICO

MTODO: um meio mais eficaz para atingir determinada meta.

MTODOS CIENTFICOS: destacamos o mtodo experimental e


o mtodo estatstico.

MTODO EXPERIMENTAL: consiste em manter constante


todas as causas, menos uma,
que sofre variao para se
observar seus efeitos, caso
existam. Ex: Estudos da Qumica,
Fsica, etc.

MTODO ESTATSTICO: diante da impossibilidade de


manter as causas
constantes (nas cincias sociais),
admitem todas essas causas
presentes variando-as,
registrando essas variaes e
procurando determinar, no
resultado final, que influncias
cabem a cada uma
delas. Ex: Quais as causas que
definem o preo de uma
mercadoria quando a sua oferta
diminui?
Seria impossvel, no momento da pesquisa, manter constantes
a uniformidade dos salrios, o gosto dos consumidores, nvel
geral de preos de outros produtos, etc.

A ESTATSTICA

uma parte da matemtica aplicada que fornece mtodos


para coleta, organizao, descrio, anlise e interpretao
de dados e para a utilizao dos mesmos na tomada de
decises.

A coleta, a organizao ,a descrio dos dados, o clculo e


a interpretao de coeficientes pertencem ESTATSTICA
DESCRITIVA, enquanto a anlise e a interpretao dos
dados, associado a uma margem de incerteza, ficam a cargo
da ESTATSTICA INDUTIVA ou INFERENCIAL, tambm
chamada como a medida da incerteza ou mtodos que se
fundamentam na teoria da probabilidade.

2. ORGANIZAO DE DADOS ESTATSTICOS

FASES DO MTODO ESTATSTICO

1 - DEFINIO DO PROBLEMA : Saber exatamente aquilo que


se pretende pesquisar o mesmo
que definir corretamente o
problema.

2 - PLANEJAMENTO : Como levantar informaes ? Que dados


devero ser obtidos ? Qual levantamento a ser
utilizado? Censitrio? Por amostragem? E o
cronograma de atividades ? Os custos
envolvidos ? etc.

3 - COLETA DE DADOS: Fase operacional. o registro


sistemtico de dados, com um objetivo
determinado.

Dados primrios: quando so publicados pela prpria pessoa ou


organizao que os haja
recolhido. Ex: tabelas do censo demogrfico
do IBGE.

Dados secundrios: quando so publicados por outra


organizao. Ex: quando determinado
jornal publica estatsticas referentes ao
censo demogrfico extradas do IBGE.

OBS: mais seguro trabalhar com fontes


primrias. O uso da fonte secundria traz o
grande risco de erros de transcrio.

Coleta Direta: quando obtida diretamente da


fonte. Ex: Empresa que realiza uma pesquisa
para saber a preferncia dos consumidores
pela sua marca.

coleta contnua: registros de nascimento,


bitos, casamentos;

coleta peridica: recenseamento demogrfico,


censo industrial;
coleta ocasional: registro de casos de
dengue.

Coleta Indireta: feita por dedues a partir


dos elementos conseguidos
pela coleta direta, por
analogia, por
avaliao,indcios ou
proporcionalizao.

4 - APURAO DOS DADOS: Resumo dos dados


atravs de sua contagem e
agrupamento. a condensao e
tabulao de dados.

5 - APRESENTAO DOS DADOS: H duas formas de


apresentao, que no se excluem
mutuamente. A apresentao
tabular, ou seja uma apresentao
numrica dos dados em linhas e
colunas distribudas de modo
ordenado, segundo regras prticas
fixadas pelo Conselho Nacional de
Estatstica. A apresentao grfica dos
dados numricos constitui uma
apresentao geomtrica
permitindo uma viso rpida e
clara do fenmeno.

6 - ANLISE E INTERPRETAO DOS DADOS: A ltima fase do


trabalho estatstico a
mais importante e
delicada. Est ligada
essencialmente ao
clculo de medidas e
coeficientes, cuja
finalidade principal
descrever o fenmeno
(estatstica descritiva).
DEFINIES BSICAS DA ESTATSTICA

FENMENO ESTATSTICO: qualquer evento que se pretenda


analisar, cujo estudo seja possvel a
aplicao do mtodo estatstico. So
divididos em trs grupos:

Fenmenos de massa ou coletivo: so aqueles que no podem ser


definidos por uma simples
observao. A estatstica
dedica-se ao estudo desses
fenmenos. Ex: A natalidade
na Grande Vitria, O preo
mdio da cerveja no Esprito
Santo, etc.

Fenmenos individuais: so aqueles que iro compor os


fenmenos de massa. Ex: cada
nascimento na Grande Vitria,
cada preo de cerveja no Esprito
Santo, etc.

Fenmenos de multido: quando as caractersticas observadas


para a massa no se verificam
para o particular.

DADO ESTATSTICO: um dado numrico e considerado


a matria-prima sobre a qual iremos aplicar
os mtodos estatsticos.

POPULAO: o conjunto total de elementos portadores de,


pelo menos, uma caracterstica comum.
AMOSTRA: uma parcela representativa da populao que
EXAMINADA com o propsito de tirarmos concluses
sobre a essa populao.

PARMETROS: So valores singulares que existem na


populao e que servem para caracteriz-la. Para
definirmos um parmetro devemos examinar toda a
populao. Ex: Os alunos do 2 ano da FACEV tm
em mdia 1,70 metros de estatura.

ESTIMATIVA: um valor aproximado do parmetro e


calculado com o uso da amostra.

ATRIBUTO: quando os dados estatsticos apresentam um carter


qualitativo, o levantamento e os estudos necessrios ao
tratamento desses dados so designados
genericamente de estatstica de atributo.

VARIVEL: o conjunto de resultados possveis de um


fenmeno.

VARIVEL QUALITATIVA: Quando seu valores so expressos


por atributos: sexo, cor da pele,etc.

VARIVEL QUANTITATIVA: Quando os dados so de carter


nitidamente quantitativo, e o conjunto
dos resultados possui uma estrutura
numrica, trata-se portanto da
estatstica de varivel e se dividem em :
VARIVEL DISCRETA OU DESCONTNUA: Seus valores
so expressos geralmente atravs de nmeros inteiros
no negativos. Resulta normalmente de
contagens. Ex: N de alunos presentes s aulas de
introduo estatstica econmica no 1 semestre de
1997: mar = 18 , abr = 30 , mai = 35 , jun = 36.

VARIVEL CONTNUA: Resulta normalmente de


uma mensurao, e a escala numrica de seus
possveis valores corresponde ao conjunto R dos
nmeros Reais, ou seja, podem assumir, teoricamente,
qualquer valor entre dois limites. Ex.: Quando voc vai
medir a temperatura de seu corpo com um termmetro de
mercrio o que ocorre o seguinte: O filete de mercrio,
ao dilatar-se, passar por todas as temperaturas
intermedirias at chegar na temperatura atual do seu
corpo.

Exemplos -

. Cor dos olhos das


alunas: qualitativa

. ndice de liquidez nas indstrias


capixabas: quantitativa contnua

. Produo de caf no
Brasil: quantitativa contnua

. Nmero de defeitos em aparelhos de


TV: quantitativa discreta

. Comprimento dos pregos produzidos por uma


empresa: quantitativa contnua

. O ponto obtido em cada jogada de um


dado: quantitativa discreta
AMOSTRAGEM

MTODOS PROBABILSTICOS

Exige que cada elemento da populao possua


determinada probabilidade de ser selecionado. Normalmente
possuem a mesma probabilidade. Assim, se N for o tamanho da
populao, a probabilidade de cada elemento ser
selecionado ser 1/N. Trata-se do mtodo que garante
cientificamente a aplicao das tcnicas estatsticas de
inferncias. Somente com base em amostragens probabilsticas
que se podem realizar inferncias ou indues sobre a
populao a partir do conhecimento da amostra.

uma tcnica especial para recolher amostras, que


garantem, tanto quanto possvel, o acaso na
escolha.

AMOSTRAGEM CASUAL ou ALEATRIA SIMPLES

o processo mais elementar e freqentemente utilizado.


equivalente a um sorteio lotrico. Pode ser realizada
numerando-se a populao de 1 a n e sorteando-se, a seguir,
por meio de um dispositivo aleatrio qualquer, x nmeros dessa
seqncia, os quais correspondero aos elementos
pertencentes amostra.

Ex: Vamos obter uma amostra, de 10%, representativa para


a pesquisa da estatura de 90 alunos de uma escola:
1 - numeramos os alunos de 1 a 90.

2 - escrevemos os nmeros dos alunos, de 1 a 90, em pedaos


iguais de papel, colocamos na urna e aps mistura retiramos,
um a um, nove nmeros que formaro a amostra.

OBS: quando o nmero de elementos da amostra muito


grande, esse tipo de sorteio torna-se muito trabalhoso. Neste
caso utiliza-se uma Tabela de nmeros aleatrios, construda de
modo que os algarismos de 0 a 9 so distribudos ao acaso nas
linhas e colunas.

.AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:

Quando a populao se divide em estratos (sub-populaes),


convm que o sorteio dos elementos da amostra leve em
considerao tais estratos, da obtemos os elementos da
amostra proporcional ao nmero de elementos desses estratos.

Ex: Vamos obter uma amostra proporcional estratificada, de


10%, do exemplo anterior, supondo, que, dos 90 alunos, 54
sejam meninos e 36 sejam meninas. So portanto dois estratos
(sexo masculino e sexo feminino). Logo, temos:

POPULAC AMOSTR
SEXO 10 %
O A
MASC. 54 5,4 5
FEMIN. 36 3,6 4
Total 90 9,0 9

Numeramos ento os alunos de 01 a 90, sendo 01 a 54 meninos


e 55 a 90, meninas e procedemos o sorteio casual com urna ou
tabela de nmeros aleatrios.

.
AMOSTRAGEM SISTEMTICA:

Quando os elementos da populao j se acham ordenados,


no h necessidade de construir o sistema de referncia. So
exemplos os pronturios mdicos de um hospital, os prdios de
uma rua, etc. Nestes casos, a seleo dos elementos que
constituiro a amostra pode ser feita por um sistema imposto
pelo pesquisador.

Ex: Suponhamos uma rua com 900 casas, das quais desejamos
obter uma amostra formada por 50 casas para uma pesquisa de
opinio. Podemos, neste caso, usar o seguinte
procedimento: como 900/50 = 18, escolhemos por sorteio
casual um nmero de 01 a 18, o qual indicaria o primeiro
elemento sorteado para a amostra; os demais elementos seriam
periodicamente considerados de 18 em 18. Assim, suponhamos
que o nmero sorteado fosse 4 a amostra seria: 4 casa, 22
casa, 40 casa, 58 casa, 76 casa, etc.

AMOSTRAGEM POR CONGLOMERADOS (ou AGRUPAMENTOS)

Algumas populaes no permitem, ou tornam extremamente


difcil que se identifiquem seus elementos. No obstante isso,
pode ser relativamente fcil identificar alguns subgrupos da
populao. Em tais casos, uma amostra aleatria simples
desses subgrupos (conglomerados) pode se colhida, e uma
contagem completa deve ser feita para o conglomerado
sorteado. Agrupamentos tpicos so quarteires, famlias,
organizaes, agncias, edifcios etc.

Ex: Num levantamento da populao de determinada cidade,


podemos dispor do mapa indicando cada quarteiro e no
dispor de uma relao atualizada dos seus moradores. Pode-se,
ento, colher uma amostra dos quarteires e fazer a contagem
completa de todos os que residem naqueles quarteires
sorteados.

MTODOS NO PROBABILSITCOS

So amostragens em que h uma escolha deliberada dos


elementos da amostra. No possvel generalizar os
resultados das pesquisas para a populao, pois as amostras
no-probabilsticas no garantem a representatividade da
populao.

AMOSTRAGEM ACIDENTAL

Trata-se de uma amostra formada por aqueles elementos


que vo aparecendo, que so possveis de se obter at
completar o nmero de elementos da amostra. Geralmente
utilizada em pesquisas de opinio, em que os entrevistados
so acidentalmente escolhidos.

Ex: Pesquisas de opinio em praas pblicas, ruas de grandes


cidades;

AMOSTRAGEM INTENCIONAL

De acordo com determinado critrio, escolhido


intencionalmente um grupo de elementos que iro compor a
amostra. O investigador se dirige intencionalmente a grupos de
elementos dos quais deseja saber a opinio.
Ex: Numa pesquisa sobre preferncia por determinado
cosmtico, o pesquisador se dirige a um grande salo de beleza
e entrevista as pessoas que ali se encontram.

AMOSTRAGEM POR QUOTAS

Um dos mtodos de amostragem mais comumente usados


em levantamentos de mercado e em prvias eleitorais. Ele
abrange trs fases:

1 - classificao da populao em termos de propriedades que


se sabe, ou presume, serem relevantes para a caracterstica a
ser estudada;

2 - determinao da proporo da populao para cada


caracterstica, com base na constituio conhecida, presumida
ou estimada, da populao;

3 - fixao de quotas para cada entrevistador a quem tocar a


responsabilidade de selecionar entrevistados, de modo que a
amostra total observada ou entrevistada contenha a proporo e
cada classe tal como determinada na 2 fase.

Ex: Numa pesquisa sobre o "trabalho das mulheres na


atualidade", provavelmente se ter interesse em considerar: a
diviso cidade e campo, a habitao, o nmero de filhos, a
idade dos filhos, a renda mdia, as faixas etrias etc.

A primeira tarefa descobrir as propores (porcentagens)


dessas caractersticas na populao. Imagina-se que haja 47%
de homens e 53% de mulheres na populao. Logo, uma
amostra de 50 pessoas dever ter 23 homens e 27 mulheres.
Ento o pesquisador receber uma "quota" para entrevistar 27
mulheres. A considerao de vrias categorias exigir
uma composio amostral que atenda ao n determinado e s
propores populacionais estipuladas.

SRIES ESTATSTICAS

TABELA: um quadro que resume um conjunto de dados


dispostos segundo linhas e colunas de maneira
sistemtica.

De acordo com a Resoluo 886 do IBGE, nas casas ou clulas


da tabela devemos colocar :

um trao horizontal ( - ) quando o valor zero;


trs pontos ( ... ) quando no temos os dados;
zero ( 0 ) quando o valor muito pequeno para ser
expresso pela unidade utilizada;
um ponto de interrogao ( ? ) quando temos dvida
quanto exatido de determinado valor.

Obs: O lado direito e esquerdo de uma tabela oficial


deve ser aberto..

SRIE ESTATSTICA: qualquer tabela que apresenta a


distribuio de um conjunto de dados
estatsticos em funo da poca, do local ou
da espcie.
SRIES HOMGRADAS: so aquelas em que a varivel
descrita apresenta variao discreta ou
descontnua. Podem ser do tipo
temporal, geogrfica ou especfica.

a) Srie Temporal: Identifica-se pelo carter varivel do fator


cronolgico. O local e a espcie (fenmeno)
so elementos fixos. Esta srie tambm
chamada de histrica ou evolutiva.

ABC VECULOS LTDA.

Vendas no 1 bimestre de 1996

PERODO UNIDADES VENDIDAS


JAN/96 20000
FEV/96 10000
TOTAL 30000

b) Srie Geogrfica: Apresenta como elemento varivel o


fator geogrfico. A poca e o fato
(espcie) so elementos fixos. Tambm
chamada de espacial, territorial ou de
localizao.

ABC VECULOS LTDA.

Vendas no 1 bimestre de 1996

FILIAIS UNIDADES VENDIDAS


So Paulo 13000
Rio de Janeiro 17000
TOTAL 30000
c) Srie Especfica: O carter varivel apenas o fato ou
espcie. Tambm chamada de
srie categrica.

ABC VECULOS LTDA.

Vendas no 1 bimestre de 1996

MARCA UNIDADES VENDIDAS *


FIAT 18000
GM 12000
TOTAL 30000

SRIES CONJUGADAS: Tambm chamadas de tabelas de dupla


entrada. So apropriadas apresentao de
duas ou mais sries de maneira conjugada,
havendo duas ordens de classificao: uma
horizontal e outra vertical. O exemplo abaixo
de uma srie geogrfica-temporal.

ABC VECULOS LTDA.

Vendas no 1 bimestre de 1996

FILIAIS Janeiro/96 Fevereiro/96


So Paulo 10000 3000
Rio de Janeiro 12000 5000
TOTAL 22000 8000

GRFICOS ESTATSTICOSG
So representaes visuais dos dados estatsticos que devem
corresponder, mas nunca substituir as tabelas estatsticas.

Caractersticas: Uso de escalas, sistema de coordenadas,


simplicidade, clareza e veracidade.

Grficos de informao: So grficos destinados principalmente ao


pblico em geral, objetivando
proporcionar uma visualizao rpida e
clara. So grficos tipicamente
expositivos, dispensando comentrios
explicativos adicionais. As legendas
podem ser omitidas, desde que as
informaes desejadas estejam
presentes.

Grficos de anlise: So grficos que prestam-se melhor ao trabalho


estatstico, fornecendo elementos teis fase
de anlise dos dados, sem deixar de ser
tambm informativos. Os grficos de anlise
freqentemente vm acompanhados de uma
tabela estatstica. Inclui-se, muitas vezes um
texto explicativo, chamando a ateno do
leitor para os pontos principais revelados pelo
grfico.

Uso indevido de Grficos: Podem trazer uma idia falsa dos


dados que esto sendo analisados, chegando mesmo a
confundir o leitor. Trata-se, na realidade, de um problema de
construo de escalas.

.
Classificao dos grficos: Diagramas, Estereogramas,
Pictogramas e Cartogramas.

1 - DIAGRAMAS:

So grficos geomtricos dispostos em duas dimenses. So


os mais usados na representao de sries estatsticas. Eles
podem ser :

1.1- Grficos em barras horizontais.

1.2- Grficos em barras verticais ( colunas ).

Quando as legendas no so breves usa-se de preferncia os


grficos em barras horizontais. Nesses grficos os retngulos
tm a mesma base e as alturas so proporcionais aos
respectivos dados.

A ordem a ser observada a cronolgica, se a srie


for histrica, e a

decrescente, se for geogrfica ou categrica.

1.2- Grficos em barras compostas.

1.4- Grficos em colunas superpostas.

Eles diferem dos grficos em barras ou colunas convencionais


apenas pelo fato de apresentar cada barra ou coluna
segmentada em partes componentes. Servem para representar
comparativamente dois ou mais atributos.

1.5- Grficos em linhas ou lineares.


So freqentemente usados para representao de sries
cronolgicas com um grande nmero de perodos de tempo. As
linhas so mais eficientes do que as colunas, quando existem
intensas flutuaes nas sries ou quando h necessidade de se
representarem vrias sries em um mesmo grfico.

Quando representamos, em um mesmo sistema de


coordenadas, a variao de dois fenmenos, a parte interna da
figura formada pelos grficos desses fenmenos denominada
de rea de excesso.

1.5- Grficos em setores.

Este grfico construdo com base em um crculo, e


empregado sempre que desejamos ressaltar a participao do
dado no total. O total representado pelo crculo, que fica
dividido em tantos setores quantas so as partes. Os setores
so tais que suas reas so respectivamente proporcionais aos
dados da srie. O grfico em setores s deve ser empregado
quando h, no mximo, sete dados.

Obs: As sries temporais geralmente no so representadas


por este tipo de grfico.

2 - ESTEREOGRAMAS:

So grficos geomtricos dispostos em trs dimenses, pois


representam volume. So usados nas representaes grficas
das tabelas de dupla entrada. Em alguns casos este tipo de
grfico fica difcil de ser interpretado dada a pequena preciso
que oferecem.

3 - PICTOGRAMAS:
So construdos a partir de figuras representativas da
intensidade do fenmeno. Este tipo de grfico tem a vantagem
de despertar a ateno do pblico leigo, pois sua forma
atraente e sugestiva. Os smbolos devem ser auto-explicativos.
A desvantagem dos pictogramas que apenas mostram uma
viso geral do fenmeno, e no de detalhes minuciosos. Veja o
exemplo abaixo:

4- CARTOGRAMAS:
So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse
grfico o de figurar os dados estatsticos diretamente relacionados com
reas geogrficas ou polticas.

DISTRIBUIO DE FREQNCIA

um tipo de tabela que condensa uma coleo de dados


conforme as freqncias (repeties de seus valores).

Tabela primitiva ou dados brutos: uma tabela ou relao de elementos


que no foram numericamente
organizados. difcil formarmos
uma idia exata do comportamento
do grupo como um todo, a partir de
dados no ordenados.
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54,
52, 58, 57, 58, 60, 51

ROL: a tabela obtida aps a ordenao dos


dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52,
54, 57, 58, 58, 60, 60

Distribuio de freqncia SEM INTERVALOS DE a simples


CLASSE:
condensao dos dados conforme as repeties de seu valores. Para
um ROL de tamanho razovel esta distribuio de freqncia
inconveniente, j que exige muito espao. Veja exemplo abaixo:

Dados Freqncia
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1
52 1
54 1
57 1
58 2
60 2
Total 20

Distribuio de freqncia COM INTERVALOS DE CLASSE:Quando


o tamanho da
amostra elevado, mais racional efetuar o agrupamento dos valores
em vrios intervalos de classe.

Classes Freqncias
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20

ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA (com


intervalos de classe)

CLASSE: so os intervalos de variao da varivel e simbolizada


por i e o nmero total de classes simbolizada por k. Ex: na
tabela anterior k = 5 e 49 |------- 53 a 3 classe, onde i =
3.

LIMITES DE CLASSE: so os extremos de cada classe. O menor


nmero o limite inferior de classe ( li ) e o
maior nmero, limite superior de classe
( Li ). Ex: em 49 |------- 53,... l3 = 49 e L3 =
53. O smbolo |------- representa um intervalo
fechado esquerda e aberto direita. O
dado 53 do ROL no pertence a classe 3 e
sim a classe 4 representada por 53 |------- 57.

AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da


diferena entre o limite
superior e inferior da classe
e simbolizada por hi = Li -
li. Ex: na tabela
anterior hi = 53 - 49 =
4. Obs: Na distribuio de
freqncia c/ classe o hi ser
igual em todas as classes.

AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o


limite superior da ltima
classe e o limite inferior da
primeira classe. AT = L(max) -
l(min). Ex: na tabela
anterior AT = 61 - 41= 20.

AMPLITUDE TOTAL DA AMOSTRA (ROL): a diferena entre o


valor mximo e o valor
mnimo da amostra (ROL).
Onde AA = Xmax - Xmin. Em
nosso exemplo AA = 60 - 41
= 19.

Obs: AT sempre ser maior


que AA.

PONTO MDIO DE CLASSE: o ponto que divide o intervalo de


classe em duas partes
iguais. .......Ex: em 49 |------- 53 o ponto
mdio x3 = (53+49)/2 = 51, ou seja x3=(
l3 + L3 )/2.
Mtodo prtico para construo de uma Distribuio de
Freqncias c/ Classe

1 - Organize os dados brutos em um ROL.

2 - Calcule a amplitude amostral AA.

No nosso exmplo: AA = 60 - 41 = 19

3 - Calcule o nmero de classes atravs da "Regra de Sturges":

I
n
n de classes
3 |-----| 5 3
6 |-----| 11 4
12 |-----| 22 5
23 |-----| 46 6
47 |-----| 90 7
91 |-----| 181 8
182 |-----| 362 9

Obs: Qualquer regra para determinao do n de classes da


tabela no nos levam a uma deciso final; esta vai
depender, na realidade de um julgamento pessoal, que
deve estar ligado natureza dos dados.

No nosso exemplo: n = 20 dados, ento ,a princpio, a regra sugere


a adoo de 5 classes.

4 - Decidido o n de classes, calcule ento a amplitude do intervalo


de classe h > AA / i.
No nosso exemplo: AA/i = 19/5 = 3,8 . Obs: Como h > AA/i um
valor ligeiramente superior para haver folga na ltima classe.
Utilizaremos ento h = 4

5 - Temos ento o menor n da amostra, o n de classes e a


amplitude do intervalo. Podemos montar a tabela, com o cuidado
para no aparecer classes com freqncia = 0 (zero).

No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a


primeira classe ser representada por ...... 41 |------- 45. As
classes seguintes respeitaro o mesmo procedimento.

O primeiro elemento das classes seguintes sempre sero


formadas pelo ltimo elemento da classe anterior.

REPRESENTAO GRFICA DE UMA DISTRIBUIO

Histograma, Polgono de freqncia e Polgono de freqncia


acumulada

Em todos os grficos acima utilizamos o primeiro quadrante do


sistema de eixos coordenados cartesianos ortogonais. Na linha
horizontal (eixo das abscissas) colocamos os valores da varivel
e na linha vertical (eixo das ordenadas), as freqncias.

Histograma: formado por um conjunto de retngulos


justapostos, cujas bases se localizam sobre o eixo
horizontal, de tal modo que seus pontos mdios
coincidam com os pontos mdios dos intervalos de
classe. A rea de um histograma proporcional
soma das freqncias simples ou absolutas.

Freqncias simples ou absoluta: so os valores que realmente


representam o nmero de dados
de cada classe. A soma das
freqncias simples igual ao
nmero total dos dados da
distribuio.

Freqncias relativas: so os valores das razes entre as freqncia


absolutas de cada classe e a freqncia total
da distribuio. A soma das freqncias
relativas igual a 1 (100 %).

Polgono de freqncia: um grfico em linha, sendo as


freqncias marcadas sobre perpendiculares
ao eixo horizontal, levantadas pelos pontos
mdios dos intervalos de classe. Para
realmente obtermos um polgono (linha
fechada), devemos completar a figura,
ligando os extremos da linha obtida aos
pontos mdios da classe anterior primeira e
da posterior ltima, da distribuio.

Polgono de freqncia acumulada: traado marcando-se as


freqncias acumuladas sobre
perpendiculares ao eixo horizontal,
levantadas nos pontos
correspondentes aos limites
superiores dos intervalos de
classe.

Freqncia simples acumulada de uma classe: o total das freqncias de


todos os valores
inferiores ao limite
superior do intervalo de
uma determinada
classe.

Freqncia relativa acumulada de um classe: a freqncia acumulada da


classe, dividida pela
freqncia total da
distribuio.

...CLASSE.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri.....


50 |-------- 54 4 52 0,100 4 0,100
54 |-------- 58 9 56 0,225 13 0,325
58 |-------- 62 11 60 0,275 24 0,600
62 |-------- 66 8 64 0,200 32 0,800
66 |-------- 70 5 68 0,125 37 0,925
70 |-------- 74 3 72 0,075 40 1,000
Total 40 1,000

fi = freqncia simples; xi = ponto mdio de classe; fri =


freqncia simples acumulada;

Fi = freqncia relativa e Fri = freqncia relativa acumulada.

Obs: uma distribuio de freqncia sem intervalos de classe


representada graficamente por um diagrama onde cada valor da
varivel representado por um segmento de reta vertical e de
comprimento proporcional respectiva freqncia.

.
3. MEDIDAS DE POSIO

Introduo

So as estatsticas que representam uma srie de dados


orientando-nos quanto posio da distribuio em relao ao
eixo horizontal do grfico da curva de freqncia.

As medidas de posies mais importantes so as medidas de


tendncia central ou promdias (verifica-se uma tendncia
dos dados observados a se agruparem em torno dos valores
centrais).

As medidas de tendncia central mais utilizadas so: mdia


aritmtica, moda e mediana. Outros promdios menos usados
so as mdias: geomtrica, harmnica, quadrtica, cbica e
biquadrtica.

As outras medidas de posio so as separatrizes, que


englobam: a prpria mediana, os decis, os quartis e
os percentis.

MDIA ARITMTICA =

igual ao quociente entre a soma dos valores do conjunto e o


nmero total dos valores.
......

onde xi so os valores da varivel e n o nmero de valores.

Dados no-agrupados: Quando desejamos conhecer a mdia dos dados


no-agrupados em tabelas de freqncias,
determinamos a mdia aritmtica simples.

Ex: Sabendo-se que a venda diria de arroz tipo A, durante


uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos,
para venda mdia diria na semana de:

.= (10+14+13+15+16+18+12) / 7 = 14 kilos

Desvio em relao mdia: a diferena entre cada elemento


de um conjunto de valores e a mdia
aritmtica, ou seja:.
. di = Xi -

No exemplo anterior temos sete desvios:... d1 = 10 - 14 = -


4 , ...d2 = 14 - 14 = 0 , d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 =
1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e. .. d7 = 12 - 14 = -
2.

Propriedades da mdia aritmtica

1 propriedade: A soma algbrica dos desvios em relao


mdia nula.

No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0

2 propriedade: Somando-se (ou subtraindo-se) uma constante


(c) a todos os valores de uma varivel, a mdia
do conjunto fica aumentada ( ou diminuda)
dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos
valores da varivel temos:

Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou

Y= .+ 2 = 14 +2 = 16 kilos

3 propriedade: Multiplicando-se (ou dividindo-se) todos os


valores de uma varivel por uma constante (c), a
mdia do conjunto fica multiplicada ( ou dividida)
por essa constante.

Se no exemplo original multiplicarmos a constante 3 a cada um


dos valores da varivel temos:

Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou

Y= x 3 = 14 x 3 = 42 kilos

.
Dados agrupados:

Sem intervalos de classe Consideremos a distribuio relativa


a 34 famlias de quatro filhos, tomando
para varivel o nmero de filhos do sexo
masculino. Calcularemos a quantidade
mdia de meninos por famlia:

N de meninos freqncia = fi
0 2
1 6
2 10
3 12
4 4
total 34

Como as freqncias so nmeros indicadores da intensidade


de cada valor da varivel, elas funcionam como fatores de
ponderao, o que nos leva a calcular a mdia aritmtica
ponderada, dada pela frmula:

..xi. ..fi. ..xi.fi .


0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
total 34 78

onde 78 / 34 = 2,3 meninos por famlia


Com intervalos de classe Neste caso, convencionamos que
todos os valores includos em um
determinado intervalo de classe
coincidem com o seu ponto mdio, e
determinamos a mdia aritmtica
ponderada por meio da frmula:

..

onde Xi o ponto mdio da classe.

Ex: Calcular a estatura mdia de bebs conforme a tabela abaixo.

Estaturas (cm) freqncia = fi ponto mdio = xi ..xi.fi.


50 |------------ 54 4 52 208
54 |------------ 58 9 56 504
58 |------------ 62 11 60 660
62 |------------ 66 8 64 512
66 |------------ 70 5 68 340
70 |------------ 74 3 72 216
Total 40 2.440

Aplicando a frmula acima temos: 2.440 / 40.= 61. logo... = 61 cm

MDIA GEOMTRICA = g
a raiz n-sima do produto de todos eles.

Mdia Geomtrica Simples: ou .

Ex.: - Calcular a mdia geomtrica dos seguintes conjuntos de


nmeros:E

a) { 10, 60, 360 }.: = ( 10 * 60 * 36 0) ^ (1/3) ....R: 60

b) { 2, 2, 2 }........: = (2 * 2 * 2 ^ (1/3) .. .R: 2

c) { 1, 4, 16, 64 }: = (1 * 4 * 16 * 64 ) ^(1/4) ....R: 8

Mdia Geomtrica Ponderada :

ou ..

Ex - Calcular a mdia geomtrica dos valores da tabela abaixo:

...xi... ...fi...
1 2
3 4
9 2
27 1
Total 9

= (12 * 34 * 92 * 271) (1/9)........R: 3,8296


.

MDIA HARMNICA - h

o inverso da mdia aritmtica dos inversos.

Mdia Harmnica Simples:. (para dados no agrupados)

.. ou

Mdia Harmnica Ponderada : (para dados agrupados em tabelas


de freqncias)

..
Ex.: Calcular a mdia harmnica dos valores da tabela abaixo:

classes ....fi.... ....xi.... ........fi/xi........


1 |--------- 3 2 2 2/2 = 1,00
3 |--------- 5 4 4 4/4 = 1,00
5 |--------- 7 8 6 8/6 = 1,33
7 |--------- 9 4 8 4/8 = 0,50
9 |--------- 11 2 10 2/10 = 0,20
total 20 4,03

Resp: 20 / 4,03 = 4,96

OBS: A mdia harmnica no aceita valores iguais a zero


como dados de uma srie.

A igualdade g = h.= ....s ocorrer quando todos os


valores da srie forem iguais.

OBS: Quando os valores da varivel no forem muito


diferentes, verifica-se aproximadamente a seguinte
relao:

g = ( .+ h ) /.2
Demonstraremos a relao acima com os seguintes dados:

z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 }

Mdia aritmtica = 51,3 / 5 = 10,2600

Mdia geomtrica= = 10,2587

Mdia harmnica = 5 / 0,4874508 = 10,2574

Comprovando a relao: 10,2600 + 10,2574 / 2 = 10,2587 =


mdia geomtrica

MODA - Mo

o valor que ocorre com maior freqncia em uma srie


de valores.

Desse modo, o salrio modal dos empregados de uma fbrica


o salrio mais comum, isto , o salrio recebido pelo maior
nmero de empregados dessa fbrica.

.
A Moda quando os dados no esto agrupados

A moda facilmente reconhecida: basta, de acordo com definio,


procurar o valor que mais se repete.

Ex: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda


igual a 10.

H sries nas quais no exista valor modal, isto , nas quais nenhum
valor aparea mais vezes que outros.

Ex: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie


amodal.

.Em outros casos, pode haver dois ou mais valores de concentrao.


Dizemos, ento, que a srie tem dois ou mais valores modais.

Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas


modas: 4 e 7. A srie bimodal.

A Moda quando os dados esto agrupados

a) Sem intervalos de classe: Uma vez agrupados os dados,


possvel determinar imediatamente a
moda: basta fixar o valor da varivel
de maior freqncia.

Ex: Qual a temperatura mais comum medida no ms


abaixo:
Temperaturas Freqncia
0 C 3
1 C 9
2 C 12
3 C 6

Resp: 2 C a temperatura modal, pois a de


maior freqncia.

b) Com intervalos de classe: A classe que apresenta a maior


freqncia denominada classe
modal. Pela definio, podemos afirmar
que a moda, neste caso, o valor
dominante que est compreendido
entre os limites da classe modal. O
mtodo mais simples para o clculo da
moda consiste em tomar o ponto mdio
da classe modal. Damos a esse valor a
denominao de moda bruta.

Mo = ( l* + L* ) / 2

onde l* = limite inferior da classe modal e L* = limite superior da


classe modal.

Ex: Calcule a estatura modal conforme a tabela abaixo.

Classes (em cm) Freqncia


54 |------------ 58 9
58 |------------ 62 11
62 |------------ 66 8
66 |------------ 70 5
Resposta: a classe modal 58|-------- 62, pois a de maior
freqncia. l* = 58 e L* = 62

Mo = (58+62) / 2 = 60 cm ( este valor estimado, pois no


conhecemos o valor real da moda).

Mtodo mais elaborado pela frmula de CZUBER: Mo = l* + (d1/


(d1+d2)) x h*

l* = limite inferior da classe modal..... e..... L* = limite superior da


classe modal

d1 = freqncia da classe modal - freqncia da classe anterior da


classe modal

d2 = freqncia da classe modal - freqncia da classe posterior


da classe modal

h* = amplitude da classe modal

Mo = 58 + ((11-9) / ((11-9) + (11 8)) x 4 Mo = 59,6

Obs: A moda utilizada quando desejamos obter uma medida


rpida e aproximada de posio ou quando a medida de
posio deva ser o valor mais tpico da distribuio. J
a mdia aritmtica a medida de posio que possui a
maior estabilidade.
MEDIANA - Md

A mediana de um conjunto de valores, dispostos segundo


uma ordem ( crescente ou decrescente), o valor situado de tal
forma no conjunto que o separa em dois subconjuntos de
mesmo nmero de elementos.

A mediana em dados no-agrupados

Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }

De acordo com a definio de mediana, o primeiro passo a ser dado


o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9,
10, 13, 15 }

O valor que divide a srie acima em duas partes iguais igual a 9,


logo a Md = 9.

Mtodo prtico para o clculo da Mediana:

Se a srie dada tiver nmero mpar de termos: O valor


mediano ser o termo de ordem dado pela frmula :

.( n + 1 ) / 2
Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 }

n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5


elemento da srie ordenada ser a mediana

A mediana ser o 5 elemento = 2

Se a srie dada tiver nmero par de termos: O valor


mediano ser o termo
de ordem dado pela
frmula :....

.[( n/2 ) +( n/2+ 1 )] / 2

Obs: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo
valor correspondente.

Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }

1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }

n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2

[( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2

5 termo = 2

6 termo = 3

A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no


exemplo ser a mdia aritmtica do 5 e 6 termos da srie.

Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver
coincidncia da mediana com um dos elementos da srie.

Quando o nmero de elementos da srie estatstica for par, nunca


haver coincidncia da mediana com um dos elementos da srie. A
mediana ser sempre a mdia aritmtica dos 2 elementos centrais
da srie.

Em uma srie a mediana, a mdia e a moda no tm,


necessariamente, o mesmo valor.

A mediana, depende da posio e no dos valores dos


elementos na srie ordenada. Essa uma da diferenas marcantes
entre mediana e mdia ( que se deixa influenciar, e muito, pelos
valores extremos). Vejamos:

Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10

Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10

isto , a mdia do segundo conjunto de valores maior do que


a do primeiro, por influncia dos valores extremos, ao passo que
a mediana permanece a mesma.

A mediana em dados agrupados

a) Sem intervalos de classe: Neste caso, o bastante identificar


a freqncia acumulada imediatamente
superior metade da soma das
freqncias. A mediana ser aquele
valor da varivel que corresponde a tal
freqncia acumulada.

Ex.: conforme tabela abaixo:

Varivel xi Freqncia fi Freqncia acumulada


0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
total 35

Quando o somatrio das freqncias for mpar o valor mediano


ser o termo de ordem dado pela frmula :

Como o somatrio das freqncias = 35 a frmula ficar:


( 35+1 ) / 2 = 18 termo = 3..

Quando o somatrio das freqncias for par o valor mediano


ser o termo de ordem dado pela frmula:

Ex: Calcule Mediana da tabela abaixo:

Varivel xi Freqncia fi Freqncia acumulada


12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
total 8

Aplicando frmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4 termo


+ 5 termo) / 2 = (15 + 16) / 2 = 15,5

b) Com intervalos de classe: Devemos seguir os seguintes


passos:

1) Determinamos as freqncias acumuladas ;

2) Calculamos ;

3) Marcamos a classe
correspondente freqncia acumulada imediatamente superior
. Tal classe ser a classe mediana ;

4) Calculamos a Mediana pela seguinte frmula:. M Md = l* + [(


- FAA ) x h*] / f*

l* = o limite inferior da classe mediana.

FAA = a freqncia acumulada da classe anterior classe


mediana.

f* = a freqncia simples da classe mediana.

h* = a amplitude do intervalo da classe mediana.


Ex:

classes freqncia = fi Freqncia acumulada


50 |------------ 54 4 4
54 |------------ 58 9 13
58 |------------ 62 11 24
62 |------------ 66 8 32
66 |------------ 70 5 37
70 |------------ 74 3 40
total 40

= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62

l* = 58........... FAA = 13........... f* = 11........... h* = 4

Substituindo esses valores na frmula, obtemos:

Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54

OBS: Esta mediana estimada, pois no temos os 40 valores


da distribuio.

Emprego da Mediana

Quando desejamos obter o ponto que divide a distribuio em duas


partes iguais.
Quando h valores extremos que afetam de maneira acentuada a mdia
aritmtica.
Quando a varivel em estudo salrio.
SEPARATRIZES

Alm das medidas de posio que estudamos, h outras que,


consideradas individualmente, no so medidas de tendncia
central, mas esto ligadas mediana relativamente sua
caracterstica de separar a srie em duas partes que
apresentam o mesmo nmero de valores.

Essas medidas - os quartis, os decis e os percentis - so,


juntamente com a mediana, conhecidas pelo nome genrico
de separatrizes.

QUARTIS - Q

Denominamos quartis os valores de uma srie que a dividem


em quatro partes iguais. Precisamos portanto de 3 quartis
(Q1 , Q2 e Q3) para dividir a srie em quatro partes iguais.

Obs: O quartil 2 ( Q2 ) SEMPRE SER IGUAL A MEDIANA DA


SRIE.

Quartis em dados no agrupados

O mtodo mais prtico utilizar o princpio do clculo da


mediana para os 3 quartis. Na realidade sero calculadas " 3
medianas " em uma mesma srie.

Ex 1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 }


- O primeiro passo a ser dado o da ordenao (crescente ou
decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }

- O valor que divide a srie acima em duas partes iguais igual


a 9, logo a Md = 9 que ser = Q2 = 9

- Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois


grupos de valores iguais proporcionados pela mediana ( quartil
2 ). Para o clculo do quartil 1 e 3 basta calcular as medianas
das partes iguais provenientes da verdadeira Mediana da
srie (quartil 2).

Logo em { 2, 5, 6 } a mediana = 5 . Ou seja: ser o quartil 1 =


Q1 = 5

em {10, 13, 15 } a mediana =13 . Ou seja: ser o quartil 3 = Q


= 13

Ex 2: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10,


13 }

- A srie j est ordenada, ento calcularemos o Quartil 2


= Md = (5+6)/2 = 5,5

- O quartil 1 ser a mediana da srie esquerda de Md : { 1, 1,


2, 3, 5, 5 }

Q1 = (2+3)/2 = 2,5
- O quartil 3 ser a mediana da srie direita de Md : {6, 7, 9,
9, 10, 13 }

Q3 = (9+9)/2 = 9

Quartis para dados agrupados em classes

Usamos a mesma tcnica do clculo da mediana, bastando


substituir, na frmula da mediana,

Efi / 2.... por ... k . E fi / 4 ... sendo k o nmero de ordem


do quartil.

Assim, temos:

Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f*

Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f*

Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f*

Ex 3 - Calcule os quartis da tabela abaixo:

classes freqncia = fi Freqncia acumulada


50 |------------ 54 4 4
54 |------------ 58 9 13
58 |------------ 62 11 24
62 |------------ 66 8 32
66 |------------ 70 5 37
70 |------------ 74 3 40
total 40

- O quartil 2 = Md , logo:

= 40 / 2 =.20........... logo.a classe mediana ser 58


|---------- 62

l* = 58........... FAA = 13........... f* = 11........... h* = 4

Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f*

- Substituindo esses valores na frmula, obtemos:

Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 =


Q2

- O quartil 1 : E fi / 4 = 10

Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f*

Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 = Q1

- O quartil 3 : 3.E fi / 4 = 30
Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f*

Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 = Q3

DECIS - D

A definio dos decis obedece ao mesmo princpio


dos quartis, com a modificao da porcentagem de valores que
ficam aqum e alm do decil que se pretende calcular. A frmula
bsica ser : k .E fi / 10 onde k o nmero de ordem
do decil a ser calculado. Indicamos os decis : D1, D2, ... , D9.
Deste modo precisamos de 9 decis para dividirmos uma srie
em 10 partes iguais.

De especial interesse o quinto decil, que divide o conjunto


em duas partes iguais. Assim sendo,o QUINTO DECIL
IGUAL AO SEGUNDO QUARTIL, que por sua vez IGUAL
MEDIANA.

Para D5 temos : 5.E fi / 10 = E fi / 2

Ex: Calcule o 3 decil da tabela anterior com classes.


k= 3 onde 3 .E fi / 10 = 3 x 40 / 10 = 12.

Este resultado corresponde a 2 classe.

D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55 = D3

PERCENTIL ou CENTIL

Denominamos percentis ou centis como sendo os noventa e


nove valores que separam uma srie em 100 partes iguais.
Indicamos: P1, P2, ... , P99. evidente que P50 = Md ; P25 =
Q1 e P75 = Q3.

O clculo de um centil segue a mesma tcnica do clculo da


mediana, porm a frmula ser : k .E fi / 100 onde k o
nmero de ordem do centil a ser calculado.

Disperso ou Variabilidade: a maior ou menor diversificao


dos valores de uma varivel em torno de
um valor de tendncia central ( mdia ou
mediana ) tomado como ponto de
comparao.
A mdia - ainda que considerada como um nmero que tem a
faculdade de representar uma srie de valores - no pode, por si
mesma, destacar o grau de homogeneidade ou heterogeneidade
que existe entre os valores que compem o conjunto.

Consideremos os seguintes conjuntos de valores das


variveis X, Y e Z:

X = { 70, 70, 70, 70, 70 }

Y = { 68, 69, 70 ,71 ,72 }

Z = { 5, 15, 50, 120, 160 }

- Observamos ento que os trs conjuntos apresentam a


mesma mdia aritmtica = 350/5 = 70

Entretanto, fcil notar que o conjunto X mais


homogneo que os conjuntos Y e Z, j que todos os valores
so iguais mdia. O conjunto Y, por sua vez, mais
homogneo que o conjunto Z, pois h menor diversificao
entre cada um de seus valores e a mdia representativa.

Conclumos ento que o conjunto X apresenta DISPERSO


NULA e que o conjunto Y apresenta uma DISPERSO
MENOR que o conjunto Z.
4. MEDIDAS DE DISPERSO ABSOLUTA

AMPLITUDE TOTAL: a nica medida de disperso que no


tem na mdia o ponto de referncia.

Quando os dados no esto agrupados a amplitude total a


diferena entrE o maior e o menor valor observado:

AT = X mximo - X mnimo.
Ex: Para os valores 40, 45, 48, 62 e 70 a amplitude total
ser: AT = 70 - 40 = 30

Quando os dados esto agrupados sem intervalos de


classe ainda temos :

AT = X mximo - X mnimo.

Ex:

xi fi
0 2
1 6
3 5
4 3

AT = 4 - 0 = 4

* Com intervalos de classe a AMPLITUDE TOTAL a diferena


entre o limite superior da ltima classe e o limite inferior da
primeira classe. Ento:

AT = L mximo - l mnimo

Ex:

Classes fi
4 |------------- 6 6
6 |------------- 8 2
8 |------------- 10 3

AT = 10 - 4 = 6
A amplitude total tem o inconveniente de s levar em conta os
dois valores extremos da srie, descuidando do conjunto de
valores intermedirios. Faz-se uso da amplitude total quando se
quer determinar a amplitude da temperatura em um dia,
no controle de qualidade ou como uma medida de clculo
rpido sem muita exatido.

DESVIO QUARTIL: Tambm chamado de amplitude semi-


interquatlica e baseada nos quartis.

Smbolo: Dq e a Frmula: Dq = (Q3 -


Q1) / 2

Observaes:

1- O desvio quartil apresenta como vantagem o fato de ser uma


medida fcil de calcular e de interpretar. Alm do mais, no
afetado pelos valores extremos, grandes ou pequenos, sendo
recomendado, por conseguinte, quando entre os dados figurem
valores extremos que no se consideram representativos.

2- O desvio quartil dever ser usado preferencialmente quando a


medida de tendncia central for a mediana.

3- Trata-se de uma medida insensvel distribuio dos itens


menores que Q1, entre Q1 e Q3 e maiores que Q3.

Ex: Para os valores 40, 45, 48, 62 e 70 o desvio quartil ser:

Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5)


/ 2 = 11,75
DESVIO MDIO ABSOLUTO - Dm

Para dados brutos: a mdia aritmtica dos valores absolutos


dos desvios tomados em relao a uma das
seguintes medidas de tendncia central: mdia
ou mediana.

para a Mdia = Dm = E | Xi - | /n

para a Mediana = Dm = E | Xi - Md | / n
As barras verticais indicam que so tomados os valores
absolutos, prescindindo do sinal dos desvios.

Ex: Calcular o desvio mdio do conjunto de nmeros { - 4 , - 3 , - 2


,3,5}

= - 0, 2 e Md = - 2

Tabela auxiliar para clculo do desvio mdio

Xi Xi - | Xi - | Xi - Md | Xi - Md |
-4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2
-3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1
-2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0
3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5
5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7

E = 16,8 E = 15

Pela Mdia : Dm = 16,8 / 5


= 3,36 Pela Mediana : Dm = 15 / 5 = 3
DESVIO PADRO - S

a medida de disperso mais geralmente empregada,


pois leva em considerao a totalidade dos valores da
varivel em estudo. um indicador de variabilidade
bastante estvel. O desvio padro baseia-se nos desvios em
torno da mdia aritmtica e a sua frmula bsica pode ser
traduzida como : a raiz quadrada da mdia aritmtica dos
quadrados dos desvios e representada por S .

A frmula acima empregada quando tratamos de


uma populao de dados no-agrupados.

Ex: Calcular o desvio padro da populao representada por - 4 ,


-3 , -2 , 3 , 5

Xi
-4 - 0,2 - 3,8 14,44
-3 - 0,2 - 2,8 7,84
-2 - 0,2 - 1,8 3,24
3 - 0,2 3,2 10,24
5 - 0,2 5,2 27,04

E= 62,8

Sabemos que n = 5 e 62,8 / 5 = 12,56.

A raiz quadrada de 12,56 o desvio padro = 3,54

Obs: Quando nosso interesse no se restringe descrio dos


dados mas, partindo da amostra, visamos tirar inferncias
vlidas para a respectiva populao, convm efetuar uma
modificao, que consiste em usar o divisor n - 1 em lugar de n.
A frmula ficar ento:

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra


o desvio padro amostral seria a raiz quadrada de 62,8 / (5 -1)
= 3,96

O desvio padro goza de algumas propriedades, dentre as


quais destacamos:
1 = Somando-se (ou subtraindo-se) uma constante a todos os
valores de uma varivel, o desvio padro no se altera.

2 = Multiplicando-se (ou dividindo-se) todos os valores de uma


varivel por uma constante (diferente de zero), o desvio padro
fica multiplicado ( ou dividido) por essa constante.

Quando os dados esto agrupados (temos a presena de


freqncias) a frmula do desvio padro ficar :

ou quando se trata
de uma amostra

Ex: Calcule o desvio padro populacional da tabela abaixo:

Xi f i Xi . f i .fi
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83

Total 30 63 E= 32,70

- Sabemos que E fi = 30 e 32,7 / 30 = 1,09.


- A raiz quadrada de 1,09 o desvio padro = 1,044

- Se considerarmos os dados como sendo de uma amostra o


desvio padro seria : a raiz quadrada de 32,7 / (30 -1) = 1,062

Obs: Nas tabelas de freqncias com intervalos de classe a


frmula a ser utilizada a mesma do exemplo anterior.

VARINCIA - S2

o desvio padro elevado ao quadrado. A varincia uma


medida que tem pouca utilidade como estatstica descritiva,
porm extremamente importante na inferncia estatstica e em
combinaes de amostras.

MEDIDAS DE DISPERSO RELATIVA

Coeficiente de Variao de Pearson - CVP

Na estatstica descritiva o desvio padro por si s tem grandes


limitaes. Assim, um desvio padro de 2 unidades pode ser
considerado pequeno para uma srie de valores cujo valor
mdio 200; no entanto, se a mdia for igual a 20, o mesmo
no pode ser dito.
Alm disso, o fato de o desvio padro ser expresso na mesma
unidade dos dados limita o seu emprego quando desejamos
comparar duas ou mais sries de valores, relativamente sua
disperso ou variabilidade, quando expressas em unidades
diferentes.

Para contornar essas dificuldades e limitaes, podemos


caracterizar a disperso ou variabilidade dos dados em termos
relativos a seu valor mdio, medida essa denominada de CVP:
Coeficiente de Variao de Pearson ( A RAZO ENTRE O
DESVIO PADRO E A MDIA REFERENTES A DADOS DE
UMA MESMA SRIE).

CVP = (S / ) x 100

o resultado neste caso expresso em percentual,


entretanto pode ser expresso tambm atravs de
um fator decimal, desprezando assim o valor 100 da
frmula.

Ex: Tomemos os resultados das estaturas e dos pesos de um


mesmo grupo de indivduos:

Discriminao MDIA DESVIO PADRO


ESTATURAS 175 cm 5,0 cm
PESOS 68 kg 2,0 kg

- Qual das medidas (Estatura ou Peso) possui maior


homogeneidade ?

Resposta: Teremos que calcular o CVP da Estatura e


o CVP do Peso. O resultado menor ser o de maior
homogeneidade ( menor disperso ou variabilidade).

CVP estatura = ( 5 / 175 ) x 100 = 2,85 %

CVP peso = ( 2 / 68 ) x 100 = 2,94 %.

Logo, nesse grupo de indivduos, as estaturas apresentam


menor grau de disperso que os pesos.

Coeficiente de Variao de Thorndike - CVT

igual ao quociente entre o desvio padro e a mediana.


CVT = ( S / Md ) x 100 %

Coeficiente Quartlico de Variao - CVQ

Esse coeficiente definido pela seguinte expresso:

CVQ = [(Q3 - Q1) / (Q3 + Q1)] x 100 %.

Desvio quartil Reduzido Dqr


Dqr = [(Q3 - Q1) / 2Md ] x 100 %.

5. MEDIDAS DE ASSIMETRIA

Introduo:

Uma distribuio com classes simtrica quando :

Mdia = Mediana = Moda

Uma distribuio com classes :

Assimtrica esquerda ou negativa quando : Mdia <


Mediana < Moda

Assimtrica direita ou positiva quando : Mdia >


Mediana > Moda

Coeficiente de assimetria: A medida anterior, por ser absoluta,


apresenta a mesma deficincia do
desvio padro, isto , no permite a
possibilidade de comparao entre as
medidas de duas distribuies. Por esse
motivo, daremos preferncia
ao coeficiente de assimetria de
Person:
As = 3 ( Mdia - Mediana ) / Desvio Padro

Escalas de assimetria:

| AS | < 0,15 assimetria


pequena

0,15 < | AS | < 1 assimetria moderada

| AS | > 1 assimetria elevada

Obs: Suponhamos AS = - 0,49 a assimetria


considerada moderada e negativa

Suponhamos AS = 0,75 a assimetria


considerada moderada e positiva

MEDIDAS DE CURTOSE

Introduo:

Denominamos CURTOSE o grau de achatamento de uma


distribuio em relao a uma distribuio padro, denominada
curva normal (curva correspondente a uma distribuio terica
de probabilidade).

Quando a distribuio apresenta uma curva de freqncia mais


fechada que a normal (ou mais aguda ou afilada em sua parte
superior), ela recebe o nome de leptocrtica.

Quando a distribuio apresenta uma curva de freqncia mais


aberta que a normal (ou mais achatada em sua parte superior),
ela recebe o nome de platicrtica.

A curva normal, que a nossa base referencial, recebe o


nome de mesocrtica.

Coeficiente de curtose

C1 = (Q3 - Q1) / 2(P90 - P10)

Este coeficiente conhecido como percentlico de curtose.

Relativamente a curva normal, temos:


C1 = 0,263 curva mesocrtica

C1 < 0,263 curva leptocrtica

C1 > 0,263 curva platicrtica

O coeficiente abaixo ( C2 )ser utilizado em nossas anlises:

onde S desvio padro

C2 = 3 curva mesocrtica

C2 > 3 curva leptocrtica

C2 < 3 curva platicrtica


FIM

Das könnte Ihnen auch gefallen