Beruflich Dokumente
Kultur Dokumente
ESTATSTICA
Contedo
1.
2.
3.
4.
5.
Introduo
Organizao de Dados Estatsticos
Medidas de Posio
Medidas de Disperso
Medidas de Assimetria e Curtose
pag. 02
pag. 03
pag. 14
pag. 27
pag. 32
ESTATSTICA
1. INTRODUO
ESTATSTICA:
ANTIGUIDADE:
IDADE MDIA:
SEC. XVI:
SEC. XVIII: a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL.
As tabelas ficam mais completas, surgem as primeiras representaes grficas
e os clculos de probabilidades. A estatstica deixa de ser uma simples
tabulao de dados numricos para se tornar "O estudo de como se chegar a
concluso sobre uma populao, partindo da observao de partes dessa
populao (amostra)".
MTODO ESTATSTICO
MTODO:
MTODOS CIENTFICOS:
MTODO EXPERIMENTAL:
MTODO ESTATSTICO:
2 - PLANEJAMENTO :
3 - COLETA DE DADOS:
Dados primrios:
Dados secundrios:
OBS:
Coleta Direta:
principal descrever
(estatstica descritiva).
fenmeno
Fenmenos individuais:
Fenmenos de multido:
DADO ESTATSTICO:
POPULAO:
AMOSTRA:
PARMETROS:
ESTIMATIVA:
ATRIBUTO:
VARIVEL:
VARIVEL QUALITATIVA:
VARIVEL QUANTITATIVA:
qualitativa
quantitativa
quantitativa
quantitativa
quantitativa
quantitativa
contnua
contnua
discreta
contnua
discreta
AMOSTRAGEM
MTODOS PROBABILSTICOS
Exige que cada elemento da populao possua determinada probabilidade de ser
selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o
tamanho da populao, a probabilidade de cada elemento ser selecionado ser 1/N.
Trata-se do mtodo que garante cientificamente a aplicao das tcnicas estatsticas
de inferncias. Somente com base em amostragens probabilsticas que se podem
realizar inferncias ou indues sobre a populao a partir do conhecimento da
amostra.
uma tcnica especial para recolher amostras, que garantem, tanto
quanto possvel, o acaso na escolha.
.
AMOSTRAGEM CASUAL ou ALEATRIA SIMPLES
o processo mais elementar e freqentemente utilizado. equivalente a um sorteio
lotrico. Pode ser realizada numerando-se a populao de 1 a n e sorteando-se, a
seguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa seqncia, os
quais correspondero aos elementos pertencentes amostra.
Ex:
Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura
de 90 alunos de uma escola:
1 - numeramos os alunos de 1 a 90.
2 - escrevemos os nmeros dos alunos, de 1 a 90, em pedaos iguais de papel,
colocamos na urna e aps mistura retiramos, um a um, nove nmeros que formaro a
amostra.
OBS: quando o nmero de elementos da amostra muito grande, esse tipo de sorteio
torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de nmeros aleatrios,
construda de modo que os algarismos de 0 a 9 so distribudos ao acaso nas linhas e
colunas.
.
.AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:
SRIES ESTATSTICAS
TABELA:
De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos
colocar :
um trao horizontal ( - ) quando o valor zero;
trs pontos ( ... ) quando no temos os dados;
zero ( 0 ) quando o valor muito pequeno para ser expresso pela
unidade utilizada;
um ponto de interrogao ( ? ) quando temos dvida quanto exatido
de determinado valor.
Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto..
SRIE ESTATSTICA:
SRIES HOMGRADAS:
a) Srie Temporal:
.
b) Srie Geogrfica:
SRIES CONJUGADAS:
FILIAIS
Janeiro/96 Fevereiro/96
So Paulo
10000
3000
Rio de Janeiro 12000
5000
TOTAL
22000
8000
GRFICOS ESTATSTICOSG
So representaes visuais dos dados estatsticos que devem corresponder, mas
nunca substituir as tabelas estatsticas.
Caractersticas:
Grficos de informao:
Grficos de anlise:
Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo
analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um
problema de construo de escalas.
.
Classificao dos grficos:
Diagramas, Estereogramas, Pictogramas e Cartogramas.
.
1 - DIAGRAMAS:
So grficos geomtricos dispostos em duas dimenses. So os mais usados na
representao de sries estatsticas. Eles podem ser :
1.1-
1.2-
1.2-
1.4-
1.5-
Grficos em setores.
Este grfico construdo com base em um crculo, e empregado sempre que
desejamos ressaltar a participao do dado no total. O total representado pelo
crculo, que fica dividido em tantos setores quantas so as partes. Os setores so tais
que suas reas so respectivamente proporcionais aos dados da srie. O grfico em
setores s deve ser empregado quando h, no mximo, sete dados.
Obs: As sries temporais geralmente no so representadas por este tipo de grfico.
.
2 - ESTEREOGRAMAS:
So grficos geomtricos dispostos em trs dimenses, pois representam volume.
So usados nas representaes grficas das tabelas de dupla entrada. Em alguns
casos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso que
oferecem.
.
3 - PICTOGRAMAS:
So construdos a partir de figuras representativas da intensidade do fenmeno. Este
tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua
forma atraente e sugestiva. Os smbolos devem ser auto-explicativos. A
desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno,
e no de detalhes minuciosos. Veja o exemplo abaixo:
4- CARTOGRAMAS:
So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de
figurar os dados estatsticos diretamente relacionados com reas geogrficas ou
polticas.
DISTRIBUIO DE FREQNCIA
um tipo de tabela que condensa uma coleo de dados conforme as
freqncias (repeties de seus valores).
Tabela primitiva ou dados brutos:
LIMITES DE CLASSE:
2 -
3 -
4 -
5 -
.
Polgono de freqncia:
.
Polgono de freqncia acumulada: traado marcando-se as freqncias acumuladas
sobre perpendiculares ao eixo horizontal, levantadas
nos pontos correspondentes aos limites superiores
dos intervalos de classe.
3. MEDIDAS DE POSIO
Introduo
So as estatsticas que representam uma srie de dados orientando-nos quanto
posio da distribuio em relao ao eixo horizontal do grfico da curva de
freqncia.
As medidas de posies mais importantes so as medidas de tendncia central ou
promdias (verifica-se uma tendncia dos dados observados a se agruparem em
torno dos valores centrais).
As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e
mediana. Outros promdios menos usados so as mdias: geomtrica, harmnica,
quadrtica, cbica e biquadrtica.
As outras medidas de posio so as separatrizes, que englobam: a prpria
mediana, os decis, os quartis e os percentis.
.
MDIA ARITMTICA =
igual ao quociente entre a soma dos valores do conjunto e o nmero total dos
valores.
......
onde xi so os valores da varivel e n o nmero de valores.
.
Dados no-agrupados: Quando desejamos conhecer a mdia dos dados no-agrupados
em tabelas de freqncias, determinamos a mdia aritmtica
simples.
Ex:
Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10,
14, 13, 15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de:
.= (10+14+13+15+16+18+12) / 7 = 14 kilos
1 propriedade:
3 propriedade:
.+ 2 = 14 +2 = 16 kilos
Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou
Y=
x 3 = 14 x 3 = 42 kilos
.
Dados agrupados:
Sem intervalos de classe
..xi.
0
1
2
3
4
total
..fi. ..xi.fi .
2
0
6
6
10 20
12 36
4
16
34 78
..xi.fi.
208
504
660
62 |------------ 66
66 |------------ 70
70 |------------ 74
Total
8
5
3
40
64
68
72
512
340
216
2.440
= 61 cm
ou .
= ( 10 * 60 * 36 0) ^ (1/3) ....R: 60
= (2 * 2 * 2 ^ (1/3) ...R: 2
= (1 * 4 * 16 * 64 ) ^(1/4) ....R: 8
ou ..
Ex - Calcular a mdia geomtrica dos valores da tabela abaixo:
...xi... ...fi...
1
2
3
4
9
2
27
1
Total 9
= (12 * 34 * 92 * 271) (1/9)........R: 3,8296
.
MDIA HARMNICA -
..
ou
.
Mdia Harmnica Ponderada : (para dados agrupados em tabelas de freqncias)
..
A igualdade
iguais.
OBS:
g =
h.=
g = ( .+
h ) /.2
= 10,2600
= 10,2587
= 10,2574
Mo = l* + (d1/(d1+d2)) x h*
Mo = 59,6
Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada
de posio ou quando a medida de posio deva ser o valor mais tpico da
distribuio. J a mdia aritmtica a medida de posio que possui a maior
estabilidade.
MEDIANA - Md
A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente
ou decrescente), o valor situado de tal forma no conjunto que o separa em dois
subconjuntos de mesmo nmero de elementos.
.
A mediana em dados no-agrupados
Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }
De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao
(crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9.
.
Mtodo prtico para o clculo da Mediana:
Se a srie dada tiver nmero mpar de termos:
ordem dado pela frmula :
.( n + 1 ) / 2
n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor
correspondente.
Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2
[( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2
5 termo = 2
6 termo = 3
A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser a mdia
aritmtica do 5 e 6 termos da srie.
Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da
mediana com um dos elementos da srie.
Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia
da mediana com um dos elementos da srie. A mediana ser sempre a mdia
aritmtica dos 2 elementos centrais da srie.
Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo
valor.
A mediana, depende da posio e no dos valores dos elementos na srie
ordenada. Essa uma da diferenas marcantes entre mediana e mdia ( que se
deixa influenciar, e muito, pelos valores extremos). Vejamos:
Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10
Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10
isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por
influncia dos valores extremos, ao passo que a mediana permanece a mesma.
A mediana em dados agrupados
a) Sem intervalos de classe:
1)
2)
Calculamos
3)
M Md = l* + [(
- FAA ) x h*] / f*
l*
= o limite inferior da classe mediana.
FAA = a freqncia acumulada da classe anterior classe mediana.
f*
= a freqncia simples da classe mediana.
h*
= a amplitude do intervalo da classe mediana.
Ex:
classes
freqncia = fi Freqncia acumulada
50 |------------ 54
4
4
54 |------------ 58
9
13
58 |------------ 62
11
24
62 |------------ 66
8
32
66 |------------ 70
5
37
70 |------------ 74
total
3
40
40
SEPARATRIZES
Alm das medidas de posio que estudamos, h outras que, consideradas
individualmente, no so medidas de tendncia central, mas esto ligadas
mediana relativamente sua caracterstica de separar a srie em duas partes que
apresentam o mesmo nmero de valores.
Essas medidas - os quartis, os decis e os percentis - so, juntamente com a
mediana, conhecidas pelo nome genrico de separatrizes.
.
QUARTIS - Q
Denominamos quartis os valores de uma srie que a dividem em quatro partes
iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a srie em
quatro partes iguais.
Obs: O quartil 2 ( Q2 ) SEMPRE SER IGUAL A MEDIANA DA SRIE.
Quartis em dados no agrupados
O mtodo mais prtico utilizar o princpio do clculo da mediana para os 3
quartis. Na realidade sero calculadas " 3 medianas " em uma mesma srie.
Ex 1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 }
- O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos
valores: { 2, 5, 6, 9, 10, 13, 15 }
- O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9 que
ser = Q2 = 9
- Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais
proporcionados pela mediana ( quartil 2 ). Para o clculo do quartil 1 e 3 basta
calcular as medianas das partes iguais provenientes da verdadeira Mediana da
srie (quartil 2).
Logo em { 2, 5, 6 } a mediana = 5 . Ou seja: ser o quartil 1 = Q1 = 5
em {10, 13, 15 } a mediana =13 . Ou seja: ser o quartil 3 = Q = 13
- O quartil 1 : E fi / 4 = 10
Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f*
Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 = Q1
.
- O quartil 3 : 3.E fi / 4 = 30
Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f*
Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 = Q3
DECIS - D
A definio dos decis obedece ao mesmo princpio dos quartis, com a modificao da
porcentagem de valores que ficam aqum e alm do decil que se pretende calcular. A
frmula bsica ser : k .E fi / 10 onde k o nmero de ordem do decil a ser
calculado. Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis
para dividirmos uma srie em 10 partes iguais.
De especial interesse o quinto decil, que divide o conjunto em duas partes
iguais. Assim sendo,o QUINTO DECIL IGUAL AO SEGUNDO QUARTIL, que por
sua vez IGUAL MEDIANA.
Para D5 temos :
5.E fi / 10 = E fi / 2
3 .E fi / 10 = 3 x 40 / 10 = 12.
PERCENTIL ou CENTIL
Denominamos percentis ou centis como sendo os noventa e nove valores que
separam uma srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente que
P50 = Md ; P25 = Q1 e P75 = Q3.
O clculo de um centil segue a mesma tcnica do clculo da mediana, porm a
frmula ser : k .E fi / 100 onde k o nmero de ordem do centil a ser calculado.
Disperso ou Variabilidade:
fi
2
6
5
3
AT = 4 - 0 = 4
* Com intervalos de classe a AMPLITUDE TOTAL a diferena entre o limite superior da
ltima classe e o limite inferior da primeira classe. Ento:
AT = L mximo - l mnimo
Ex:
Classes
4 |------------- 6
6 |------------- 8
8 |------------- 10
fi
6
2
3
AT = 10 - 4 = 6
A amplitude total tem o inconveniente de s levar em conta os dois valores extremos
da srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude
total quando se quer determinar a amplitude da temperatura em um dia, no
controle de qualidade ou como uma medida de clculo rpido sem muita
exatido.
DESVIO QUARTIL:
Observaes:
1-
23-
O desvio quartil apresenta como vantagem o fato de ser uma medida fcil de calcular
e de interpretar. Alm do mais, no afetado pelos valores extremos, grandes ou
pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem
valores extremos que no se consideram representativos.
O desvio quartil dever ser usado preferencialmente quando a medida de tendncia
central for a mediana.
Trata-se de uma medida insensvel distribuio dos itens menores que Q1, entre Q1
e Q3 e maiores que Q3.
Ex: Para os valores 40, 45, 48, 62 e 70 o desvio quartil ser:
Q1 = (45+40)/2 = 42,5
Q3 = (70+62)/2 = 66
para a Mdia =
Dm = E | Xi -
| /n
para a Mediana =
Dm = E | Xi - Md | / n
Xi | Xi - |
(- 4) - (-0,2) = -3,8
3,8
(- 3) - (-0,2) = -2,8
2,8
(- 2) - (-0,2) = -1,8
1,8
3 - (-0,2) = 3,2
3,2
5 - (-0,2) = 5,2
5,2
E=
Pela Mdia :
Dm = 16,8 / 5 = 3,36
16,8
Xi - Md
| Xi - Md |
(- 4) - (-2) = - 2
(- 3) - (-2) = - 1
(- 2) - (-2) = 0
3 - (-2) = 5
5 - (-2) = 7
2
1
0
5
7
E=
15
Pela Mediana :
Dm = 15 / 5 = 3
DESVIO PADRO - S
a medida de disperso mais geralmente empregada, pois leva em considerao
a totalidade dos valores da varivel em estudo. um indicador de variabilidade
bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia
aritmtica e a sua frmula bsica pode ser traduzida como : a raiz quadrada da
mdia aritmtica dos quadrados dos desvios e representada por S .
- 0,2
- 0,2
- 0,2
- 0,2
- 0,2
- 3,8
- 2,8
- 1,8
3,2
5,2
14,44
7,84
3,24
10,24
27,04
E=
62,8
1 =
2 =
Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante
(diferente de zero), o desvio padro fica multiplicado ( ou dividido) por essa constante.
ou
Ex:
f i Xi . f i
2
6
12
7
3
0
6
24
21
12
Total 30
63
.fi
2,1
2,1
2,1
2,1
2,1
-2,1
-1,1
-0,1
0,9
1,9
4,41
1,21
0,01
0,81
3,61
8,82
7,26
0,12
5,67
10,83
E=
32,70
Obs: Nas tabelas de freqncias com intervalos de classe a frmula a ser utilizada
a mesma do exemplo anterior.
VARINCIA - S2
o desvio padro elevado ao quadrado. A varincia uma medida que tem pouca
utilidade como estatstica descritiva, porm extremamente importante na inferncia
estatstica e em combinaes de amostras.
valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no
pode ser dito.
Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados
limita o seu emprego quando desejamos comparar duas ou mais sries de valores,
relativamente sua disperso ou variabilidade, quando expressas em unidades
diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou
variabilidade dos dados em termos relativos a seu valor mdio, medida essa
denominada de CVP: Coeficiente de Variao de Pearson ( A RAZO ENTRE O
DESVIO PADRO E A MDIA REFERENTES A DADOS DE UMA MESMA SRIE).
CVP = (S /
) x 100
MDIA
175 cm
68 kg
DESVIO PADRO
5,0 cm
2,0 kg
( 5 / 175 ) x 100
( 2 / 68 ) x 100
= 2,85 %
= 2,94 %.
5. MEDIDAS DE ASSIMETRIA
Introduo:
Uma distribuio com classes simtrica quando :
Mdia = Mediana = Moda
Uma distribuio com classes :
Assimtrica esquerda ou negativa quando :
Coeficiente de assimetria:
Escalas de assimetria:
| AS | < 0,15
assimetria pequena
assimetria moderada
| AS | > 1
assimetria elevada
MEDIDAS DE CURTOSE
Introduo:
Denominamos CURTOSE o grau de achatamento de uma distribuio em relao a
uma distribuio padro, denominada curva normal (curva correspondente a uma
distribuio terica de probabilidade).
curva mesocrtica
curva leptocrtica
curva platicrtica
curva mesocrtica
curva leptocrtica
curva platicrtica
FIM