Sie sind auf Seite 1von 26

INTRODUO ESTATSTICA

1
O que Estatstica?
A palavra Estatstica comumente associada aos recenseamentos gerais (Censos:
Demogrficos, agropecurio, Industrial, Comercial, dos Transportes e Comunicaes e de
Servios) realizados no Pas e que constituem tarefas complexas e rduas, visando obteno
de informaes necessrias demandadas pela sociedade e pelos governos. Desta forma,
atravs dos recenseamentos so realizadas contagem de populaes e propriedades,
fornecendo informaes sobre seus habitantes, sua condio socioeconmica, sua cultura,
religio, economia, etc. H mais de quatro mil anos os chineses utilizavam tabelas estatsticas
na agricultura. A Bblia cita vrios operaes de recenseamento. Por exemplo, no IX Livro de
Moiss descrito o processo de enumerao dos israelitas em condies de portar armas, o
recenseamento geral ordenado por Csar Augusto no ano do nascimento de Cristo, etc. Da
mesma, forma os egpcios, os gregos e os persas realizaram inquritos semelhantes, obtendo
estatsticas rudimentares, tais como: conhecimento da extenso de domnios, riquezas, poderio
militar, etc.
Essa associao da Estatstica ao Censo perfeitamente correta do ponto vista
histrico, embora a Estatstica englobe muitos outros diferentes aspectos, sendo
imprescindvel na obteno e anlise de dados provenientes de quaisquer processos onde
exista a variabilidade.
Embora no exista uma definio clssica para essa cincia descrita primeiramente
por italianos em plena Idade Mdia e desenvolvida por matemticos ao longo do Sculo XIX,
pode-se dizer, linhas gerais, que a Estatstica constri tcnicas e mtodos de anlise que
permitem tomar decises acertadas nos mais diferentes setores do saber: onde houver
incerteza, l estar a Estatstica. neste contexto que se insere a Estatstica, que tem por
objetivo fornecer mtodos e tcnicas para convivermos, racionalmente, com a variabilidade.
Combinando os elementos dispersos e heterogneos do cotidiano, as informaes estatsticas
nos possibilitam a compreenso e a transformao da realidade, em escalas apropriadas
compreenso humana.
Os ndices de inflao e de emprego e desemprego, divulgados e analisados
permanentemente pela mdia, so outro exemplo da contribuio da Estatistica no nosso dia-a-
dia. E quanto aos sistemas de pesquisas domiciliares, voc j ouviu falar? Essas pesquisas so
realizadas pelo Instituto Brasileiro de Geografia e Estatistica - IBGE, e tm como finalidade a
produo de informaes bsicas para o estudo e anlise da evoluo socioeconmica do Pais.
A Pesquisa Nacional por Amostra de Domiclios - PNAD e a Pesquisa Mensal de Empregos -
INTRODUO ESTATSTICA
2
PME, fornecem informaes importantes que subsidiam os estudos e planejamento
governamentais.
Na prtica, a Estatstica pode ser empregada em muitas outras situaes. Na rea
mdica, por exemplo, a Estatstica fornece metodologia adequada que possibilita decidir
corretamente se um novo medicamento eficiente no combate determinada doena. Esta
metodologia considera os vrios tipos de reao que os indivduos possam apresentar ao
medicamento, ou seja, ela considera a existncia de variabilidade nas respostas ao
medicamento. Atravs da Estatstica possvel identificar situaes crticas e,
consequentemente, atuar em seu controle. Por exemplo, as pesquisas mdicas sobre a
distribuio, incidncia e evoluo da AIDS no mundo atual.
Para registrar, classificar, controlar e estudar mais adequadamente fenmenos, fatos,
eventos e ocorrncias, foram sendo criadas, desenvolvidas e aperfeioadas muitas tcnicas de
obteno e anlises de informaes. Esses conjuntos de tcnicas e mtodos de pesquisa, que,
entre outros tpicos envolve o planejamento de experimentos a ser realizado, a coleta
qualificada dos dados, a inferncia e o processamento e anlise das informaes o que
modernamente se conhece como Cincia Estatsticas, ou simplesmente Estatstica.
Conceitos, definies importantes
Populao o conjunto de todas as unidades de um determinado tipo, em certa regio, num
determinado perodo de tempo. Desta forma, pode-se ter uma populao constituda de todas
as pessoas moradoras no municpio de Nova Iguau ou de todos os automveis em circulao
no municpio de Nova Iguau em certa poca. Uma populao poder ser finita ou infinita
dependendo de se o nmero de elementos finito ou infinito. Nas aplicaes prticas
normalmente ter-se- populao finita.
Unidade elementar, ou simplesmente elemento de uma populao, o objeto ou entidade
portadora das informaes que pretende-se coletar. Pode ser uma pessoa, famlia, domiclio,
loja, empresa, estabelecimento, classe de alunos, escola, etc. importante que a unidade
elementar seja claramente definida, para que o processo de coleta e anlise tenha sempre um
significado preciso e uniforme. Por exemplo, o conceito de famlia parece ser natural, mas,
sem uma definio adequada pessoas distintas teriam dificuldade de dar uma mesma
classificao para situaes especiais. Veja um destes casos: suponha que em um domiclio
vive um casal com filhos adultos, inclusive uma de suas filhas casada, com o genro e um neto.
Deve-se considerar uma ou duas famlias? Suponha, agora, que a filha divorciada, e claro, o
genro no vive com eles: mudaria alguma coisa na sua definio? Nestas situaes, em vez de
tentar criar definies prprias, recomenda-se fortemente buscar estudos j realizados, onde
INTRODUO ESTATSTICA
3
esses problemas j foram estudados e as definies sero mais amplas e permitiro
comparaes entre pesquisas. Para o exemplo citado acima, sugere consultar os manuais de
metodologia de pesquisa editados pelo IBGE. Na Fig.1 temos as comparaes das
populaes-alvo, referenciada e amostrada.
Figura 1 As diversas populaes possveis.

Parmetro uma medida numrica que descreve alguma caracterstica de uma populao.
(Referncia, padro)
Amostra como o prprio nome indica, qualquer parte da populao ou em outras palavras
um subconjunto da populao. O propsito da amostra o de fornecer informaes que
permitam descrever os parmetros da populao, da maneira mais adequada possvel. A boa
amostra permite a generalizao de seus resultados dentro de limites aceitveis de dvidas.
Qualquer amostra fornece informaes, porm no qualquer uma que permite estender os
resultados para a populao da qual foi retirada. Ouve-se frequentemente o argumento de uma
boa amostra aquela que representativa. Vejamos um exemplo a seguir.
Suponha que o objetivo estudar a renda familiar de certa cidade. O conhecimento
da geografia da cidade possibilita agrupar, aproximadamente, os bairros em mais ricos (A),
mdios (B) e pobres (C). Uma consulta aos registros da prefeitura permite afirmar que 10%
dos domiclios pertencem classe A, 30% classe B e os restantes 60% classe C. Se o
oramento garante entrevistar 1.000 domiclios, a amostra representativa seria selecionar
100 do estrato A, 300 do estrato B e 600 do estrato C. Observe que uma outra amostra no
INTRODUO ESTATSTICA
4
representativa que alocasse 600 no estrato A, 300 no estrato B e 100 no estrato C pode
apresentar resultados mais confiveis.
Diante da dificuldade em definir amostra representativa, os estatsticos preferem
trabalhar com o conceito de amostra probabilstica, que so os procedimentos onde cada
possvel amostra tem uma probabilidade conhecida, a priori, de ocorrer. Desse modo, tem-se
toda a teoria de probabilidade e inferncia estatstica para dar suporte s concluses.
Estatstica uma medida numrica que descreve alguma caracterstica de uma amostra.
Poder ser igual ou diferente de amostra para amostra.
Estimador chamamos de estimador a quantidade, calculada em funo dos elementos da
amostra, que ser usada no processo de estimao do parmetro desejado.
Estimativa chamaremos estimativa a cada particular valor assumido por um estimador.
A estatstica dedutiva e a estatstica indutiva
Quando temos conhecimento do todo e desejamos estudar o particular, estamos
fazendo uma deduo e quando temos conhecimento de uma parte e desejamos extrapolar
para a populao fazemos uma inferncia ou induo. A Estatstica Indutiva, ir nos dizer at
que ponto podemos estar errando em nossas indues, e com que probabilidade.
Em suma, a Estatstica Indutiva busca obter resultados sobre as populaes a partir
das amostras, dizendo tambm qual a preciso desses resultados e com que probabilidade se
pode confiar nas concluses obtidas.
Consideraes sobre o levantamento de informaes estatsticas: censitrias e amostras
Introduo
Abordaremos alguns aspectos relacionados ao campo de amostragem e que so
fundamentais para realizao e execuo de um bom modelo de amostragem.
Inicialmente, sero feitos alguns comentrios relacionados aos censos e s
amostragens no que diz respeito, no s aos levantamentos, como tambm aos diferentes
tipos de tendncias e erros no amostrais que esto presentes nos tipos de levantamentos.
Sero apresentados tambm, os principais conceitos, definies e notaes que sero
utilizados no desenvolvimento dos tpicos.
Comparao entre censos e amostras
As informaes estatsticas podem ser obtidas de diferentes maneiras. Uma das
formas mais antigas de levantamentos de dados estatsticos atravs da realizao de censos,
INTRODUO ESTATSTICA
5
os quais por definio pesquisam todas as unidades pertencentes populao para o qual o
censo foi planejado. Essas unidades podem ser pessoas, famlias, fbricas, fazendas, etc.
Em virtude desta definio, a idia que se tem dos resultados divulgados por um
censo, que os mesmos so precisos, ou seja, isentos de erros, porm medida que passam a
ser considerados alguns aspectos envolvidos nestes levantamentos, constata-se de imediato,
que esta idia errnea e que os resultados divulgados por um levantamento censitrio esto
sujeitos a erros, que podero ser muito maiores que os encontrados em levantamentos no
censitrios.
Os erros que ocorrem com maior freqncia na realizao dos censos so os que
esto relacionados identificao correta da rea onde o recenseador dever trabalhar e ao
preenchimento das informaes desejadas.
O gigantismo de uma operao censitria torna necessrio o envolvimento de um
nmero muito grande de pessoas, principalmente na fase de coleta de dados.
Para tornar mais gil a coleta, a rea a ser pesquisado, por exemplo, no caso de um
municpio, o mesmo dividido em reas menores, que no Brasil so chamados setores
censitrios e que e que possuem em mdia 300 domiclios nas reas urbanas e 200 nas reas
rurais.
Ocorre, entretanto que, em muitas situaes prticas, estas reas so difceis de serem
identificadas em campo, como no caso das favelas no municpio do Rio de J aneiro. Esta
dificuldade faz com que surjam omisses e/ou duplicaes de domiclios, gerando, por
conseguinte, erros no cadastramento.
No que diz respeito ao preenchimento dos questionrios, vrios estudos
desenvolvidos aps a realizao dos censos demonstraram, dentre outras falhas, a existncia
de omisso de pessoas, principalmente de recm-nascidos, cuja taxa varia de acordo com a
infra-estrutura adotada pelo pas onde o censo foi realizado.
O censo demogrfico tem como objetivo maior arrolar as pessoas moradoras nos
domiclios, tarefa esta aparentemente fcil do ponto de vista de coleta. Para conseguir boa
coleta, torna-se necessrio montar uma infra-estrutura que, dentre outras coisas, exiga uma
equipe de campo qualificada e para que este objetivo seja alcanado, fundamental um
treinamento bem estruturado de forma a permitir a homogeneizao da equipe.
Vejamos o Brasil como exemplo, pode-se facilmente imaginar a impossibilidade de
uniformizar uma equipe de 115.000 recenseadores, espalhados por todo o territrio nacional.
A seleo dos recenseadores normalmente leva em conta alguns pr-requisitos, destacando-se
entre estes o nvel de escolaridade. Se para alguns municpios, possvel formar um corpo de
INTRODUO ESTATSTICA
6
recenseadores com o segundo grau completo, para outros municpios impossvel conseguir
uma equipe com o primeiro grau completo. Esta heterogeneidade por si s, j um fator
limitante para que seja atingida o objetivo desejado, que associado com a forma de
treinamento adotado no censo restringe ainda mais a meta a ser alcanada, pois o treinamento
para estas equipes feito em cadeia e normalmente a ltima fase, fica a cargo dos
supervisores, que alm de ser de curta durao, ministrado por pessoas que na sua maioria
nunca participaram de pesquisas, ou seja, no tem experincia necessria para realizar este
tipo de orientao. Diante desta situao, pode-se concluir que os resultados divulgados por
um censo no so exatos e dependendo das caractersticas da populao que se deseje estudar,
esses erros podem ser maiores ou menores.
A existncia de informaes estatsticas atualizadas de fundamental importncia,
pois alm de ajudarem na tomada de decises, permitem a elaborao de projetos que
objetivam alcanar projees para o futuro. Para a consecuo destes objetivos, no de
capital importncia a exatido dos dados, visto que quaisquer projees esto sujeita a erros,
mesmo que os dados estejam corretos.
Um planejamento perfeito para o futuro, isto , sem qualquer erro, uma tarefa
praticamente impossvel, pois para atingir este objetivo tornar-se-ia necessrio possuir
informaes sobre o comportamento futuro de uma gama de variveis envolvidas num
projeto, bem como, se as necessidades futuras no sero alteradas em funo das condies
atuais.
O comportamento destas variveis de um modo geral aleatrio, pois dependem de
fatores scio-econmicos.
Diante disso, verifica-se de imediato, a presena de algum grau de incerteza e assim,
em qualquer planejamento torna-se obrigatrio admitir uma margem de erro, denominado
erro permissvel.
Visto que um censo no fornece informaes exatas, o que se questiona se, com
esta, margem de erro permissvel e com um custo menor, no seria possvel encontrar um
outro mtodo de pesquisa com a mesma eficincia.
Os custos envolvidos na realizao de um censo, a demora na divulgao dos
resultados, alm de outros fatores, fez com que fosse pensado uma forma alternativa de
levantamento, que tornasse mais gil a divulgao dos resultados e oferecesse uma
confiabilidade igual ou maior do que o censo.
INTRODUO ESTATSTICA
7
Como o censo investiga todas as unidades da populao e como esta investigao
no poderia ser demasiadamente grande, pelas razes j abordadas, foi introduzida nos censos
uma investigao por amostra para algumas caractersticas scio-econmicas.
Este procedimento, alm de permitir uma ampliao no leque de investigaes,
viabilizou uma divulgao mais rpida dos resultados reduzindo tambm os custos de coleta.
Os levantamentos por amostragem consistem em trabalhar, dentro de certos critrios,
com uma parte da populao selecionada aleatoriamente e tomando por base esta
investigao, fazer inferncia para a populao como um todo. Como este trabalho feito
apenas com parte da populao e a inferncia feita para o todo, ele estar sujeita a um erro de
amostragem.
Se nos censos no existe o erro de amostragem, pois por definio toda a populao
ser estudada, ocorrem outros tipos de erros, chamados erros no amostrais, e que so
comuns tanto nos censos como em pesquisas por amostragem.
Erros no amostrais
i. Questionrios;
ii. Treinamento;
iii. Coleta de dados;
iv. Critica de questionrio.
Processo de Tecnologia de Amostragem - Princpios Bsicos
Amostragem Probabilstica
i. Amostragem Aleatria Simples (AAS) esse tipo de amostragem, tambm chamada
simples ao acaso, aleatria, elementar, randmica, etc., equivalente a um sorteio
lotrico. Nela todos os elementos da populao tm igual probabilidade de pertencer
amostra, e todas as possveis amostras tm igual probabilidade de ocorrer. Na prtica, a
amostragem aleatria simples pode ser realizada numerando-se a populao de 1 a N,
sorteando-se, a seguir, por meio de um dispositivo aleatrio qualquer, n nmeros dessa
sequncia, os quais correspondero aos elementos sorteados para a amostra.
Um instrumento til para realizar o sorteio acima descrito a tabela de nmeros
aleatrios. Tal tabela simplesmente constituda por inmeros dgitos que foram obtidos por
algum processo equivalente a um sorteio equiprovvel.



INTRODUO ESTATSTICA
8
Observaes:
1. a amostragem aleatria simples pode ser realizada sem reposio das unidades
elementares ou com reposio destas. No caso de populaes muito grandes, a
amostragem sem reposio pode ser tratada com reposio.
2. Fica evidente pela prpria definio de amostragem aleatria sem reposio e com
reposio, que a primeira mais precisa, pois numa amostra, por exemplo, de 50
indivduos, no 1 caso os mesmos sero distintos ao passo que se for com reposio pode-
se ter o mesmo indivduo repetido 50 vezes o que em termos prticos nada acrescenta aos
objetivos desejados.
ii. Amostragem Sistemtica (AS) quando os elementos da populao se apresentam
ordenados e a retirada dos elementos feita periodicamente, atravs de passos pr
determinados. O primeiro sorteio realizada fazendo-se uso da AAS e os demais
elementos sero sorteados atravs de intervalos (saltos) de tamanho constante at
completar a quantidade de elementos da amostra.
iii. Amostragem Aleatria Estratificada (AAE) muitas vezes a populao se divide em
subpopulaes ou estratos, sendo razovel supor que, de estrato para estrato, a varivel de
interesse apresenta um comportamento substancialmente diverso, tendo, entretanto,
comportamento razoavelmente homogneo dentro de cada estrato.
Observao:
1. Estratos homogneos dentro varincia pequena;
Estratos heterogneos entre varincia grande.
iv. Amostragem por Conglomerado (AC) quando a populao apresenta uma subdiviso em
pequenos grupos, chamados conglomerados, possvel e muitas vezes conveniente fazer-se
amostragem por meio desses conglomerados, a qual consiste em sortear um nmero
suficiente de conglomerados, cujos elementos constituiro a amostra.
Observaes:
1. A amostragem por conglomerados pode ser 1 estgio ou em mltiplos estgios. Na
amostragem conglomerada e um estgio ou mono-etpica, uma vez selecionados os
conglomerados so examinados todos os elementos do conglomerado. Mais geralmente
teremos amostragem em mltiplos estgios.
Exemplo:
Estgio 1: Municpios;
Estgio 2: Bairro;
Estgio 3: Quarteiro;
INTRODUO ESTATSTICA
9
Estgio 4: Domiclio
2. Situaes em que usada a amostragem por conglomerado.
2.1. Quando no se dispe de uma listagem completa dos elementos na populao. mais
fcil fazer essa listagem uma vez selecionados os conglomerados.
2.2. Por economia de tempo e dinheiro
3. Desvantagem: Em geral, a AC menos precisa que a AAS.
Exemplo: numa pesquisa de 600 domiclios numa cidade mais rpido selecionar 20
quarteires com 30 domiclios cada do que selecionar por AAS 600 domiclios da cidade.
No exemplo acima, 600 domiclios selecionados por AAS cobrem melhor a cidade
que 20 quarteires de 30 domiclios cada, sendo, portanto a AAS mais precisa.
Amostragem no Probabilstica:
i. Amostragem de Convenincia a amostragem em que o amostrador, para facilitar o
processo, procura ser aleatrio sem, no entanto, realizar propriamente o sorteio usando
algum dispositivo aleatrio confivel;
ii. Inacessibilidade a toda Populao uma situao muito comum em que ficamos diante da
inacessibilidade a toda populao o caso em que parte da populao no tem existncia
real, ou seja, uma parte da populao ainda hipottica;
iii. Amostragem Intencional enquadram-se aqui os diversos casos em que o amostrador
deliberadamente escolhe certos elementos para pertencer amostra, por julgar elementos
bem representativos da populao. Na Fig.2 temos as amostras probabilsticas (AAS, AS,
AG e AE) e no-probabilsticas
Figura 2: exemplos de amostras probabilsticas e no-probabilsticas

INTRODUO ESTATSTICA
10
Varivel
uma caracterstica qualquer do objeto em estudo. Pode ser classifica como:
- varivel qualitativa quando apresenta como possveis resultados uma qualidade ou
atributo do objeto em estudo.
- varivel quantitativa quando apresenta como possveis resultados, nmeros resultantes de
uma contagem ou mensurao.
As variveis qualitativas podem ainda se subdividir em: nominais, ordinais e as
variveis quantitativas tambm podem ser subdividir em: discretas e contnuas.
Resumo:
Nominal
Qualitativa
Ordinal
Varivel
Discretas
Quantitativa
Contnuas




Tcnicas de Descrio Grfica
O primeiro passo para se descrever graficamente um conjunto de dados observados
verificar as freqncias dos diversos valores existentes da varivel. Definimos a freqncia de
um dado valor de uma varivel (qualitativa ou quantitativa) como o nmero de vezes que esse
valor foi observado. Denotaremos a freqncia do i-simo valor observado por
i
f . Sendo n o
nmero total de elementos observados, verifica-se imediatamente que

=
=
k
i
i
n f
1

onde k o nmero de diferentes valores existentes da varivel.
A associao das respectivas freqncias a todos os diferentes valores observados
define a distribuio de freqncias do conjunto de valores observados. Definimos a
freqncia relativa, ou proporo de um valor e uma varivel (qualitativa ou quantitativa),
como o quociente de sua freqncia pelo nmero total de elementos observados. Ou seja,
denotando por
i
p' a freqncia relativa ou proporo do i-simo elemento observado, temos
n
f
p
i
i
= '
claro que

=
= '
k
i
i
p
1
1

INTRODUO ESTATSTICA
11
Descrio grfica das variveis (Qualitativas e Quantitativas)
No caso de variveis qualitativas, a descrio grfica muito simples, bastando
computar as freqncias ou freqncias relativas das diversas classificaes existentes,
elaborando a seguir um grfico conveniente. Esse grfico poder ser de barras, setores, ou
outro qualquer tipo de diagrama equivalente. No caso das variveis quantitativas discretas o
primeiro passo fazer a tabulao do conjunto de valores e depois o modelo mais adequado
para representao grfica (lembre-se uma boa visualizao muito importante tenha bom
senso).
Descrio grfica das variveis qualitativas contnuas
A construo do grfico para variveis contnuas segue o mesmo princpio do grfico de
barras, sendo que no grfico de barras a representao pontual e no histograma contnua.
Para construo do histograma segue a regra abaixo:
1) os dados devem ser colocados em rol (ordem crescente ou decrescente);
2) devemos calcular o nmero de classes: N K = ,
4
5 , 2 N x K = , N k log 3 , 3 1+ =
onde N o nmero de observaes;
3) agora calcularemos a amplitude total:
r menor valo r maior valo
X X AT =
4) finalizando devemos calcular a amplitude de classe ou a amplitude padro:
k
AT
h =
Medidas de Tendncia Central:
1. Mdia Aritmtica;
2. Mediana;
3. Moda;
Mdia Aritmtica Simples.
Seja
1
, ,
n
X X , elementos de um conjunto de dados, definimos como mdia
aritmtica o somatrio do conjunto de valores pelo total de elementos.
1
N
i
i
X
X
N
=
=


No caso, de termos uma distribuio de freqncia podemos reescrever a frmula
anterior da seguinte forma:
1
k
i i
i
k
i
i
X f
X
f
=

=


INTRODUO ESTATSTICA
12
Para dados agrupados em forma de intervalos de classes a mdia poder ser assim
reescrita:
( )
1
k
to
i i
i
k
i
i
P medio f
X
f
=

=


Propriedades da mdia aritmtica
P1. A soma algbrica dos desvios de um conjunto de valores observados em relao mdia
aritmtica, nula.
Supondo um conjunto de N observaes tm-se: x x x x X x d
N
= = =
N 2 2 1 1
d , , d ,
Somando-se as diferenas
i
d resulta em:
N
X
X que visto , 0
) ( ) ( ) (
N
1 i
i
1
1
1 1
2 1 2 1

=
=
= = = =
+ + + = + + +
N
i
N
i
i
i
N
i
i
N
i
i
N N
N
X
N X X N X d
X X X X X X d d d

Exemplo: Considere o conjunto de valores observados: 5, 7, 8, 9, 4 e 3
P2. Se somarmos (ou subtrairmos) uma mesma constante C, a todos os valores observados, a
mdia aritmtica ficar aumentada (ou diminuda) desta constante.
( ) ( ) ( )
C X
N
NC
N
X
N
NC X
N
C X C X C X
N
i
i
N
i
i
N
+ = + =
+
=
+ + + + + +

= = 1 1 2 1

Considere o exemplo anterior e some-se o valor 2 a todas observaes.
P3. Multiplicando-se (ou dividindo-se) todas as observaes por uma mesma constante C, a
mdia aritmtica fica multiplicada (ou dividida) por esta constante.
X C
N
X C
N X C C X C X C X C X
N
i
i N
i
i N
N
i
i
= = = + + + =


=
= =
1
1
2 1
1


Considere o exemplo anterior e multiplica-se o valor 2 a todas observaes.
P4. A soma dos quadrados dos desvios em relao a mdia aritmtica, um mnimo.
Considere-se o exemplo utilizado para a mdia aritmtica simples dos dados anteriores.
Subtraindo-se a mdia aritmtica 6 de todos os valores observados. Depois elevando os
resultados ao quadrado e somando.
Considere agora um outro valor qualquer, diferente da mdia, Subtraindo agora por
exemplo 5 de todos os valores observados. Depois elevando os resultados ao quadrado e
somando. Agora compare os resultados.
INTRODUO ESTATSTICA
13
Obs: Qualquer outro valor que venha ser considerado ter uma soma maior do que em relao
ao valor mdio.
Mediana
Definimos mediana de um conjunto de valores ordenados, sendo n mpar, como
igual ao valor de ordem central que divide o conjunto de valores em duas partes iguais (50%
para cada lado). Se n for par, a mediana poder ser definida como sendo valor mdio dos
dois valores centrais.
Para dados agrupados em forma de intervalos de classes para clculo da mediana
usaremos a frmula de Czuber:
2
a
i
md
n
f
md L h
f
| |

|
\ .
= +



onde:
i
L : o limite inferior da classe que contm a mediana;
a
f : a freqncia das classes anteriores que contm a mediana;
md
f : a freqncia da classe que contm a mediana;
h : amplitude de classe padro.
Moda:
Definimos a moda (ou modas) de um conjunto de valores como o valor de freqncia
(ou valores) de mxima freqncia.
Para dados agrupados em forma de intervalos de classes para clculo da moda
faremos uso da frmula de Czuber:
1
1 2
o i
d
m L h
d d
= +
+

onde:
i
L : o limite inferior da classe modal;
1
d : a diferencia entre a freqncia da classe moda e a da classe imediatamente anterior;
2
d : a diferencia entre a freqncia da classe moda e a da classe imediatamente seguinte;
h : amplitude de classe padro.

INTRODUO ESTATSTICA
14
Coeficiente de Assimetria de Pearson
O coeficiente de assimetria de Pearson definido da seguinte forma:
o
p
X X
A
S

=
Podemos ter os seguintes resultados possveis:
- A
p
<0Assimtrica negativa ou esquerda;
- A
p
=0 Simtrica;
- A
p
>0Assimtrica positiva ou direita.
OBS: A resposta de A
p
deve ser dada em desvios padres.

Nas distribuies simtricas, a mdia, a mediana e a moda coincidem enquanto que
nas distribuies moderadamente assimtricas, Pearson props uma relao entre a mdia, a
mediana e a moda, que a seguinte: a moda igual a trs vezes a mediana menos duas vezes
a mdia aritmtica.
X M M
e o
= 2 3 ou ) ( 3
e o
M X M X =
Desvio quartlico ou Amplitude semi-interquartlica A metade da diferena entre o terceiro
quartil e o primeiro.
2
1 3
Q Q
Q

=
Quando temos os dados em rol:
N Q
N Q
N Q
4
3
2
1
4
1
3
2
1
=
=
=





INTRODUO ESTATSTICA
15
Quando temos dados agrupados em intervalos de classes:
(padro). quartil o contm que classe de intervalo do amplitude
desejado; quartil o contm que classe da simples freqncia a
i ordem de quartil o contm que anterior classe a at acumulada freqncia a
3 2 1 i ordem de quartlico elemento o
4
quartil o contm que classe da inferior limite
h
f
; F
); ou , (i
N i
E
; l
xh
f
F E
l Q
classe
or ac. anteri
Q
i
classe
r ac.anterio Q
i i
i
i
=
=
=
=

=
=
(


+ =

Curtose
Mede o grau de achatamento da curva. O coeficiente percentlico de curtose
definido da seguinte forma:
3 1
95 5
2
Q Q
K
P P


3 75%
1 25%
Q P
Q P
=
=

Podemos ter os seguintes resultados possveis:
K <0,262 Leptocrtica;
K =0,262 Mesocrtica, Padro ou Normal;
K >0,262 Platicrtica.
Medidas de Disperso ou Variabilidade.
i) Intervalo total ou Amplitude Total;
ii) Desvio quartlico ou Amplitude semi-interquartlica;
iii) Desvio mdio ou Afastamento mdio;
iv) Varincia;
v) Desvio padro;
vi) Coeficiente de variao ou Erro relativo.
Intervalo total ou Amplitude Total - a diferena entre o maior valor e o menor valor da
srie:
min max
X X R =
Obs.: claro que o valor de R est relacionado com a disperso dos dados. Entretanto, por
depender de apenas dois valores do conjunto de dados, a amplitude contm relativamente
pouca informao quanto disperso. Salvo aplicaes no controle de qualidade, a amplitude
no muito utilizada como medida de disperso.
INTRODUO ESTATSTICA
16
Desvio mdio ou Afastamento mdio
Esta medida pode ser obtida, calculando-se o afastamento de cada termo, em relao
a mdia (ou mediana) e posteriormente a mdia desses afastamentos. O afastamento de cada
termo em relao a mdia (ou mediana) considerado em valor absoluto (Mdulo). Uma
medida de disperso na totalidade dos dados ser bem mais fidedigna, um bom exemplo para
reflexo o caso anterior.
N
f d
d
N
d
d
i
N
i
i
m
N
i
i
m

=
=

=
=
1
1



s. observae de nmero o N e mdia a X termo, o Xi onde , X - X d Sendo
i i
i-simo =

N
f d
d
i
N
i
i
m

=

=1

X P d mdio
to
i
= : classes de intervalos em agrupados dados Para

Notas:
1) O somatrio dos d
i
sempre ser zero;
2) Os desvios mdios ou afastamentos mdios so menores, quando tomados em relao a
mediana, do que em relao a mdia aritmtica, porm na maioria das vezes, o desvio mdio
se baseia na mdia, principalmente pela facilidade operacional;
3) O desvio mdio substitui o desvio padro (que ser visto a seguir), quando este for
influenciado fortemente pelos valores extremos.
Varincia
No podemos usar a soma dos desvios como medida de disperso porque, de acordo
como vimos, essa soma totalizar sempre zero. Ento, para caracterizar a disperso dos dados,
devemos considerar os desvios independentemente do sinal, o que se pode obter tomando os
desvios ao quadrado.
O valor da soma dos quadrados dos desvios ( )

2
i
d dividido pelo nmero de
observaes obtemos a varincia dos dados:
INTRODUO ESTATSTICA
17
( )
( )
Populao
1
2
2
1
2
2

=
=
N
f X
N
X
j
i
j i
N
i
i

( )
( )
Amostra

1
1
1
2
2
1
2
2

=
=
n
f X X
s
n
X X
s
j
i
j i
n
i
i

Quando os dados forem agrupados (Populao ou Amostra) substituir por
i
X por
mdio
to
P , a varincia como medida de disperso tem o inconveniente de apresentar unidade de
medida igual ao quadrado da unidade de medida dos dados. Assim, por exemplo, se X
medida em kg, a varincia medida em kg
2
. O desvio padro por definio, a raiz quadrada,
com sinal positivo, da varincia. A unidade de medida do desvio padro igual unidade de
medida dos dados.
Desvio Padro
A medida de disperso mais utilizada o desvio padro que expressa o grau da
grandeza mdia dos espalhamentos da distribuio em torno de sua mdia aritmtica, e
representado por (para populao) e S (para amostra).
( )
( )
Populao
1
2
2
1
2
2


= =

= =

=
=
N
f X
N
X
j
i
j i
N
i
i


( )
( )
Amostra

1
1
1
2
2
1
2
2


= =

= =

=
=
n
f X X
s s
n
X X
s s
j
i
j i
n
i
i

Quando os dados forem agrupados (Populao ou Amostra) substituir
i
X por
mdio
to
P , tambm a frmula da amostra pode ser reescrita:
( )
1
1
2 2

=

=
n
X n X
s
n
i
i
ou
1
1
2
1 2

|
.
|

\
|

=


=
=
n
n
X
X
s
n
i
n
i
i
i

Interpretao e compreenso do desvio padro
Algumas informaes importantes no uso do desvio padro. Nos casos em que o
fator sob estudo puder ser descrito por uma distribuio normal (que ser visto
posteriormente), os valores das medidas de disperso tm uma relao definida e conhecida a
seguir:
INTRODUO ESTATSTICA
18
Tem-se que, cerca de dois teros dos valores da distribuio, caem dentro de um
desvio padro em torno de sua mdia, e praticamente todos os valores, dentro de trs desvios
padro, engloba para ambos os lados em torno da mdia, ou seja, 68% dos valares entre a
mdia e mais ou menos um desvio padro e 99,7% entre a mdia e mais ou menos trs
desvios padro.








Observaes acerca do desvio padro:
1) A soma dos quadrados dos desvios ser mnimo quando os desvios forem calculados em
relao mdia aritmtica. Portanto, se no clculo dos desvios for considerado quaisquer
outros valores, essa soma dos quadrados dos desvios resultar em valores superiores ao
obtido com a mdia aritmtica;
2) Se cada elemento do conjunto de valores for multiplicado ou dividido por uma constante
qualquer, o desvio padro ficar multiplicado ou dividido por esta constante.
Conseqentemente, a varincia ficar multiplicada ou dividida pelo quadrado da constante;
3) Se a cada elemento do conjunto de valores for adicionado ou subtrado uma constante
qualquer, o desvio padro no se altera. Idem, para a varincia;
4) O desvio padro maior do que o desvio mdio.
Regra Emprica da amplitude
Para estimar um valor do desvio padro s: para estimar grosseiramente o desvio padro, use:
4
total amplitude
~ s
Para interpretar um valor conhecido do desvio padro s: se o desvio padro s conhecido,
use-o para estimativas razoveis dos valores amostrais mximo e mnimos usuais, usando:
padro) (desvio 2 (mdia) usual" " mximo valor
padro) (desvio 2 - (mdia) usual" " mnimo valor
+ ~
~


INTRODUO ESTATSTICA
19
Coeficiente de variao ou Erro relativo
O coeficiente de variao definido como sendo a razo entre o desvio padro e sua mdia.

= CV
Populao

X
S
CV
Amostra
=

O coeficiente de variao muito utilizado na prtica, pois alm de permitir a
comparao do grau de homogeneidade entre distribuies de diferentes caractersticas de
uma mesma populao ou amostra, permite a comparao entre distribuies de mesmas
caractersticas entre diferentes populaes ou amostras.
Este valor normalmente expresso em percentagem (%). O quadrado do erro
relativo ou do coef. de variao, fornece a varincia relativa, analogamente ao que foi visto,
e o quadrado do desvio padro a varincia absoluta.
Exerccios para Relaxar a Mente
1. Com relao a amostragem, analise as afirmativas abaixo e assinale a alternativa mais
correta.
I. Na amostragem aleatria simples, cada uma das amostras tem a mesma probabilidade de ser
selecionada;
II. Na amostragem sistemtica selecionado todo K-simo elemento da populao. O valor
K representa intervalo de seleo ou salto para seleo;
III. Na amostragem por conglomerados, pressupe-se a diviso dos itens de uma populao
em subgrupos homogneos entre si e heterogneos dentro, representativos da populao;
IV. Na amostragem estratificada, pressupe-se a diviso dos itens de uma populao em
subgrupos que no se superpem e homogneos, procedendo-se a amostragem aleatria
simples em cada subgrupo.
a) Apenas a afirmativa I verdadeira;
b) As afirmativas I e III so verdadeiras;
c) Apenas a afirmativa II verdadeira;
d) As afirmativas II e IV so verdadeiras;
e) As afirmativas I, II, III e IV so verdadeiras;
2. Dentre 240 pessoas escaladas para o sorteio do jri, 120 so brancas, 80 so negras e 40
hispnicas. Quantas amostras estratificadas de seis dessas 240 pessoas podemos formar, se:
a) um tero da amostra deve ser atribuda a cada um dos trs estratos;
b) a alocao deve ser proporcional?
INTRODUO ESTATSTICA
20
3. Amostra Aleatria e Amostra Aleatria Simples. Imagine uma sala de aula com 60 alunos
arrumados em seis filas de 10 alunos cada. Suponha que o professor selecione uma amostra de
10 alunos jogando e selecionando a fila correspondente ao resultado da jogada. O resultado
uma amostra aleatria? amostra aleatria simples?
4. A tabela abaixo refere-se a uma pesquisa, realizada com 200 alunos de uma escola, a
respeito do esporte preferido:
Esporte Freqncia Absoluta Freqncia Relativa Porcentagem
Futebol 108
Vlei 0,21
Basquete
Natao 12
Outros 8,5%
Total 200 1,00 100%
5. A fim de ter um perfil de seu pblico nos finais de semana, o proprietrio de um cinema
contrata uma empresa jnior (Prestape-UEZO). A pesquisa foi realizada no perodo de 15 de
junho 15 de julho de 2007. Os resultados esto representados no banco de dados abaixo:
a) Escolha uma varivel qualitativa e construa pelos menos dois grficos e analise o mesmo;
b) Escolha uma varivel quantitativa e construa um histograma e analise o mesmo;

















INTRODUO ESTATSTICA
21
6. Classifique as variveis em Qualitativas (nominais ou ordinais) ou Quantitativas (discretas
ou contnuas)
a) Sexo
b) Hemoglobina plasmtica
c) Idade exata
d) Peso
e) Nmero de leitos no hospital
f) Altura
g) Nmero de alunos
h) Comprimento
i) Dimetro de uma esfera
j) Nota de prova
7. Seja X a varivel renda disponvel em salrio mnimos dos alunos da UEZO no ano de
2007. Construa um histograma e uma breve analise do perfil dos dados.
3 6 3 3 1
1 0,5 1 2 3
3 2 1 5 1
2 3 10 1 1
1 1 3 3 1
2 4 1 5 4
1 1 1
8. Considere os pesos de 20 alunos relacionados a seguir como uma amostra:
69 67 54 69 63
65 93 68 54 64
71 63 60 75 67
65 69 58 80 69
Determine:
a) Mdia aritmtica, moda, mediana dos dados;
b) Varincia, desvio padro e coeficiente de variao.
9. Define-se a mdia aritmtica de n nmeros dados como os resultados da diviso por n
da soma dos n nmeros dados. Sabe-se que 3,6 a mdia aritmtica de 2,7; 1,4; 5,2 e X. O
nmero de X igual a?



INTRODUO ESTATSTICA
22
10. Um provedor mediu o tempo (em minutos) de uso dirio da Internet por seus assinantes.
Com os dados obtidos constitui-se o seguinte histograma:

a) Que porcentagem do total de assistentes fica entre meia hora e uma hora e meia na rede?
b) Qual a mdia, media e a moda do tempo de uso da Internet?

11. Dada a distribuio abaixo, determine a idade mdia, mediana e a moda.
Idade (anos) Freqncia
0 4 5
5 9 25
10 14 35
15 19 25
20 24 10
12. O histograma a seguir apresenta os dados a respeito de uma amostra de pesos, em kg, de
duzentos homens:

Os nmeros indicados no eixo dos pesos so os pontos mdios de cada intervalo. O peso
mdio desta amostra, obtido a partir destes dados grupados, em kg, igual a:
(A) 75,6 (B) 78,9 (C) 79,1 (D) 82,3 (E) 84,2
13. Numa cidade, a renda mdia mensal dos trabalhadores do sexo masculino de R$520,00,
enquanto dos de sexo feminino de R$400,00. Se, nesta cidade, h 1.500 trabalhadores
homens e 1.000 trabalhadoras, ento a renda mdia do total dos trabalhadores desta cidade,
em reais, de:
(A) 456 (B) 464 (C) 472 (D) 488 (E) 496
INTRODUO ESTATSTICA
23
14. Os candidatos A, B e C submetem-se a um concurso que consta de 3 provas: portugus ,
matemtica e ingls. As notas obtidas foram:
Candidato Portugus Matemtica Ingls
A 8 5 6
B 6 6 5
C 6 8 4
A classificao final apresentou-se da seguinte da seguinte forma: em 1 lugar:
disciplina de total
Disciplina da Nota
1
i
=
=
n
i
X o Classifica

15. Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra
aleatria, de 50 preos (Xi) de aes, tomada numa bolsa de valores internacional. A unidade
monetria o dlar americano: 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9,
9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15, 15, 16, 16, 18, 23. Os
valores seguintes foram calculados para amostra:
50
1
50
2
1
490
5470
i
i
i
i
x
x
=
=
=
=


Calcule a media e varincia amostral, respectivamente (com aproximao de uma casa
decimal).
16. O grfico de barras a seguir indica a quantidade de estudantes, por faixa etria e sexo, do
CEFET Qumica que participaram da construo de um reservatrio para captao da gua da
chuva.






A mdia aritmtica da idade de todos os estudantes :


INTRODUO ESTATSTICA
24
17. Dado do histograma da figura abaixo e sabendo que todas as classes tm igual amplitude,
calcule a moda, mediana e o coeficiente de variao da distribuio.

18. Considerando a tabela abaixo, calcule para essa amostra o coeficiente de variao das
variveis peso e estatura, respectivamente:
Peso (kg) Estatura( cm)
60 1,60
75 1,80
70 1,70
75 1,65
19.
Turmas Mdia das Notas Varincia
A 60 36
B 66 225
C 62 16
Considerando os resultados obtidos relativos as notas mdias dos alunos de 3 turmas
estudadas, demonstrados na tabela acima, assinale a alternativa correta.
a) O coeficiente de variao da turma A menor do que o da turma B e C;
b) A turma que possui menor coeficiente de variao a C e a que possui maior coeficiente de
variao a B;
c) Nada se pode afirmar sobre o coeficiente de variao baseado nas informaes contidas na
tabela, por insuficincia de informaes;
d) A turma que possui o menor coeficiente de variao a turma B, e a que possui maior
coeficiente de variao a turma A;
e) O coeficiente de variao da turma B igual ao da turma C, porm, maior que o da turma
A.
INTRODUO ESTATSTICA
25
20. A tabela a seguir registra uma amostra da rentabilidade mdia anual entre a Ao A e a
Ao B durante 5 anos. Determine a ao que teve uma rentabilidade mais homognea e qual
teve a rentabilidade mais heterognea?
Ao A Ao B
9,00% 12,00%
10,00% 10,50%
12,00% 9,50%
10,50% 11,00%
9,50% 12,50%
21. Considerando as seguintes medidas, relativas a trs distribuies de freqncia.
Distribuies Q
1
Q
3
P
10
P
90

A 814 935 772 1012
B 63,7 80,3 55,0 86,6
C 28,8 45,6 20,5 49,8
Como so Classificadas as distribuies A, B e C, respectivamente, quanto curtose?
22. Em uma granja foi observada a distribuio dos frangos em relao ao peso, que era a
seguinte:
Peso (gramas) Freqncia
960 980 60
980 1.000 160
1.000 1.020 280
1.020 1.040 260
1.040 1.060 160
1.060 1.080 80
Total 1.000
Deseja-se dividir os frangos em quatro categorias, com relao ao peso, de modo que:
- os 20% mais leves sejam da categoria D;
- os 30 %seguintes sejam da categoria C;
- os 30% seguintes sejam da categoria B; e
- os 20% seguintes sejam da categoria A.
Quais os limites de peso entre as categorias, A, B, C e D?





INTRODUO ESTATSTICA
26
23. Uma amostra de oitenta peas retiradas de um grande lote forneceu a seguinte distribuio
de comprimentos:
Classes Freqncia
50 60 1
60 70 3
70 80 6
80 90 15
90 100 25
100 110 20
110 120 7
120 130 3
A especificao para esse tipo de material exige que o comprimento mdio das peas esteja
compreendido entre 92 e 96 mm, que o coeficiente de variao seja inferior a 20% e que a
distribuio dois comprimentos seja simtrica. Quais dessas exigncias parecem no estar
satisfeita no presente caso?

Das könnte Ihnen auch gefallen