Sie sind auf Seite 1von 54

Medidas de Disperso ou variabilidade

A mdia - ainda que considerada como


um nmero que tem a faculdade de
representar uma srie de valores - no
pode, por si mesma, destacar o grau de
homogeneidade ou heterogeneidade
que existe entre os valores que
compem o conjunto.

Disperso ou Variabilidade:
a maior ou menor diversificao dos valores de
uma varivel em torno de um valor de tendncia
central ( mdia ou mediana ) tomado como
ponto de comparao.

Consideremos os seguintes conjuntos de valores das variveis:


X = { 170, 170, 170, 170, 170 }
Y = { 168, 169, 170 ,171 ,172 }
Z = { 105, 115, 150, 220, 260 }
Observamos ento que os trs conjuntos apresentam a mesma
mdia aritmtica = 850/5 = 170.
Entretanto, fcil notar que o conjunto X mais homogneo
que os conjuntos Y e Z, j que todos os valores so iguais
mdia. O conjunto Y, por sua vez, mais homogneo que o
conjunto Z, pois h menor diversificao entre cada um de seus
valores e a mdia representativa.

Conclumos ento que o conjunto X apresenta


disperso nula e que o conjunto Y apresenta
uma disperso menor que o conjunto Z.

MEDIDAS DE DISPERSO ABSOLUTA


Amplitude total (At) : a nica medida de
disperso que no tem na mdia o ponto de
referncia. Quando os dados no esto
agrupados a amplitude total a diferena entre
o maior e o menor valor observado:
At = x mximo - x mnimo.

Exemplo: Para os valores 80, 85, 88, 102 e 110 a amplitude total
ser: At = 110 - 80 = 30
Com intervalos de classe a amplitude total a diferena entre o
limite superior da ltima classe e o limite inferior da primeira
classe. Ento At = L mximo - L mnimo.
Exemplo: Classes fi
4 |--- 6 6
6 |--- 8 2
8 |--- 10 3
At = 10 - 4 = 6

Varincia da populao e varincia da amostra:


Em estatstica, o conceito de varincia tambm
pode ser usado para descrever homogeneidade
de um conjunto de observaes. Quando o
conjunto das observaes uma populao,
chamada de varincia populacional. Se o
conjunto das observaes (apenas)
uma amostra estatstica, chamamos-lhe de
varincia amostral (varincia da amostra).

2
(

)
1
2 =

:
2
1 ( )
2
=
2

2
1 ( )
2
=
1

:
= 2

2 = 1

:
= 2

Propriedades da varincia e do desvio padro:


1- somando-se ou subtraindo-se um mesmo valor a
todos os termos de uma sequncia numrica o desvio
padro e a varincia no se alteram.
2- multiplicando-se ou dividindo-se um mesmo valor a
todos os termos da sequencia numrica o desvio
padro se altera da mesma forma.
3- multiplicando-se ou dividindo-se um mesmo valor a
todos os termos da sequencia numrica a varincia se
altera do quadrado do valor da mesma forma.

Exemplo:

O desvio padro do seguinte conjunto de dados:


2 4 5 6 8 superior a 5.

Soluo: 2 4 5 6 8
Em primeiro lugar vamos calcular os quadrados de
todos os valores da sequencia:
X2: 4 16 25 36 64 -> mdia = 145/5 = 29
Depois calcular a media dos valores e elevar ao
quadrado:
2

2+4+5+6+8 2
(
)
5

=
= 52 =25
2 = 29 25 = 4
=

4 =2

Logo o item esta ERRADO

Exemplo:
Um grupo e formado por 10 pessoas, cujas
idades so: 18 19 19 20 20 20 21 22 23 24
A varincia populacional 3,24.

Soluo: Quando os valores das variveis so altos


usamos a propriedade da subtrao:
Ache a mediana( 18 19 19 20 20 20 21 22 23 24 ) = 20,
assim subtramos esse valor de todos os termos
gerando uma nova sequencia:
NOVA SEQUENCIA = -2,-1,-1,0,0,0,1,2,3,4
MEDIA X2 = ( 4+1+1+0+0+0+1+4+9+16) / 10 = 3,6
2 = [(-2-1-1+0+0+0+1+2+3+4 ) / 10]2 = 0,36
VAR = 3,6 0,36 = 3,24

logo o item est correto

Exemplo:
Em uma pesquisa de preos de determinado produto, foram obtidos os valores, em
reais, de uma amostra aleatria colhida em 6 estabelecimentos que o comercializam.

A varincia dessa amostra e


(A) 1,50 (B) 1,75 (C) 2,00 (D) 2,25 (E) 2,50

Soluo:
ROL DA SEQUENCIA : 4 , 5 , 6 , 6 , 7 , 8
MEDIANA DA SEQUENCIA = 6
NOVA SEQUENCIA = -2,-1,0,0,1,2
MEDIA QUADRATICA = ( 4+1+0+0+1+4) / 6 = 10/6
MEDIA2 = [(-2-1+0+0+1+2 ) / 6]2 = 0
VAR = 10/6 0 = 10/6
VARIANCIA AMOSTRAL = (6 / 6 1) X10/6 = 10/5 = 2

Amplitude Interquartil
A mediana e a amplitude inter-quartis
Uma outra forma de sumarizar dados em termos
dos quartis. Essas medidas so particularmente teis
para dados no simtricos. A mediana (ou quartil 2)
definida como o valor que divide os dados ordenados
ao meio, i.e. metade dos dados tm valores maiores do
que a mediana, a outra metade tem valores menores
do que a mediana.

Adicionalmente, os quartis inferior e superior,


Q1 e Q3, so definidos como os valores abaixo
dos quais esto um quarto e trs quartos,
respectivamente, dos dados. Estes trs valores
so frequentemente usados para resumir os
dados juntamente com o mnimo e o mximo.

A medidade de disperso a amplitude interquartis:


Dj = Q3 - Q1,
i.e. a diferena entre o quartil superior e o
inferior.

Exemplo:
Os quartis de uma distribuio so Q1 = 4, Q2 = 6 e
Q3 = 10. Essa distribuio:
(A) simtrica.
(B) assimtrica direita.
(C) assimtrica esquerda.
(D) tem moda maior que a mdia
(E) tem moda igual mdia

Soluo:
Se observarmos a distancia Q2 Q1 = 6 4 = 2,
J se compararmos a Q3 Q2 = 10 6 = 4
Podemos perceber que a segunda maior que a
primeira. Sendo assim os 25% dos termos que
ficam no fim estao mais dispersos do que os
25% do inicio. Entao podemos concluir :

Gabarito letra B

MEDIDA DE DISPERSO RELATIVA


Notao: CV = coeficiente de variao de
Pearson ou apenas coeficiente de variao.
O fato de o desvio padro ser expresso na
mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou
mais sries de valores, relativamente sua
disperso ou variabilidade, quando expressas
em unidades diferentes.

Assim, um desvio padro de 2 unidades pode


ser considerado pequeno para uma srie de
valores cujo valor mdio 200; no entanto, se a
mdia for igual a 20, o mesmo no pode ser
dito.

Para contornar essas dificuldades e limitaes, podemos


caracterizar a disperso ou variabilidade dos dados em termos
relativos a seu valor mdio, medida essa denominada de CV:
Coeficiente de Variao de Pearson ( a razo entre o desvio
padro e a mdia referentes a dados de uma mesma srie).

Exemplo: Tomemos os resultados das estaturas


e dos pesos de um mesmo grupo de indivduos:
Discriminao M D I A DESVIO PADRO
ESTATURAS
175 cm
5,0 cm
PESOS
68 kg
2,0 kg
Das medidas (Estatura ou Peso) a que possui
maior homogeneidade o peso.

Soluo: Teremos que calcular o CV da Estatura e o


CV do Peso. O resultado menor ser o de maior
homogeneidade (menor disperso ou
variabilidade).
CVestatura = ( 5 / 175 ) x 100 = 2,85 %
CVpeso = ( 2 / 68 ) x 100 = 2,94 %.
Logo, nesse grupo de indivduos, as estaturas
apresentam menor grau de disperso que os
pesos.

Logo podemos concluir que o item esta


ERRADO.

Distribuio Normal
Em forma de Sino
Unimodal
Simtrica
Mdia, mediana e
moda so iguais
Assinttica em relao
ao Eixo X
Amplitude Interquartil

1,33 s ou [Q3-Q1] = 4/3 s

50%
f(X)

Q1

Mdia,
Mediana
Moda

Q3

Modelo Matemtico

1
f X
e
2
2s

1
2s

X: valores da varivel aleatria


F(X):funo densidade probabilidade da varivel
aleatria X
: mdia da populao
s: desvio padro da populao

Distribuio Normal Padronizada


Tabela (Parte)

Z 0
Z

.00

.01

sZ 1

.02
0,5478

0.0 .5000 .5040 .5080

0.1 .5398 .5438 .5478


0.2 .5793 .5832 .5871
Probabilidades

0.3 .6179 .6217 .6255

0
Z = 0,12

Uma nica Tabela basta!

essa a soluo

Valor da V. A. Normal Z Padronizada:


x
z
s

x = valor da V. A. Normal X
s = desvio padro da V. A. Normal X
= mdia da V. A. Normal X
z = valor padronizado de x (nmero de desvios
padro com relao mdia)

Para os exemplos a seguir usaremos:


+ < < X uma varivel aleatria
Mdia = 5
= 10

Exemplo: padronizar 6.2


Z

6.2 5

0.12
10
Z: Distribuio
Normal Padronizada

X: Distribuio Normal

s 10

sZ 1

6.2

Z 0

0.12

clculo da rea entre dois nmeros


P 2.9 X 7.1 .1664
Z

2.9 5

.21
10

7.1 5

.21
10

Z: Distribuio
Normal Padronizada

X: Distribuio Normal

s 10

.0832

sZ 1
.0832

2.9

7.1

0.21

Z 0

0.21

Inverso: obter z, conhecido p =


0,5832
Z

.00

.01

.02

0,5832

0.0 .5000 .5040 .5080


0.1 .5398 .5438 .5478

0.2 .5793 .5832 .5871


0.3 .6179 .6217 .6255

0
Z = 0,21

Recuperando X para Probabilidades


Conhecidas
Distribuio
Normal Padronizada

Distribuio Normal

s 10

sZ 1

.1179

.3821

Z 0

0.30

X Zs 5 .3010 8

RESUMO FINAL
Padronizao

rea Total = 1
probabilidade = rea sob
a curva Normal

mdia = mediana

TESTE DE HIPTESES
uma regra de deciso utilizada para aceitar
ou rejeitar uma hiptese estatstica com base
em elementos amostrais.
Hipteses: Teremos sempre duas hipteses,
H0 (Ag-zero), que a hiptese nula ou
hiptese probanda e H1 ou HA (hiptese
alternativa).

A hiptese nula sempre a hiptese a ser


examinada. Se a aceitarmos, implicitamente
estaremos rejeitando H1 e se rejeitarmos H0,
ento no podemos rejeitar H1, devendo esta
ser aceita.

Tipos de erro:
Dois tipos de erro podem ser cometidos num
Teste de Hipteses:
Erro Tipo I () -> A hiptese nula verdadeira
e o pesquisador a rejeita.
Erro Tipo II ()-> A hiptese nula falsa e o
pesquisador a aceita.

TIPOS DE TESTE DE HIPTESES PARA A


MDIA:
1) Bicaudal ou Bilateral
H0: = 0
H1: 0;Onde: a mdia populacional e 0 o valor
suposto para a mdia populacional.

2) Teste Unicaudal ou Unilateral direita


H0: 0
H1: > 0

3) Teste Unicaudal ou Unilateral esquerda


H0: 0
H1: < 0

Repare que na hiptese nula sempre temos uma


igualdade (=, ou ) e na hiptese alternativa uma
desigualdade (, > ou <).
Se n > 30 ou for conhecido, usamos distribuio
Normal;
Se n 30 e for desconhecido, usamos distribuio tStudent;
Outro detalhe importante que a tabela da
distribuio t-Student bi-paramtrica.


Onde :
=1
=

Para procedermos ao teste, alm de conhecer o


valor tabelado (ZTAB se usarmos Distribuio Normal ou tTAB
se usarmos Distribuio t-Student), temos que
encontrar o valor calculado (ZCALC ou tCALC), dado
por:

Exemplo 1 :
Uma amostra de 36 elementos de uma varivel
X normalmente distribuda forneceu: X = 42,3 e
S = 5,2. Testar, no nvel de significncia 0,05, a
hiptese de que > 40.

Resoluo: Seguindo o roteiro, temos:


1 passo:
H0: = 40;
H1: > 40 (teste unilateral direita);
2 passo: a amostra grande (n > 30). Logo, usaremos
a Tabela Normal;
3 passo: o teste unilateral, com = 0,05. Logo, para
uma rea de 0,45, teremos ZTAB=1,64;
4 passo: desenhar a curva, plotando ZTAB;

5 passo: calcular a estatstica teste.

Zcalc =

42,340
5,2
36

= 2,65.

6 passo: ZCALC > ZTAB. Concluso: ao nvel de significncia de


5%, REJEITO H0: = 40. Logo, > 40.

EXEMPLO 2:
Uma amostra de 20 elementos de uma varivel
X normalmente distribuda forneceu: X = 53,4 e
S = 7,5. Testar, no nvel de significncia 0,05, a
hiptese de que = 50.

soluo:
Hipteses:
H0: = 50;
H1: 50 (teste bilateral);
A amostra pequena (n 30) e (desvio padro
populacional) desconhecido. Logo, a distribuio a
ser utilizada a t-Student, com n = 20 = 19 e
= 0,05. Consultando a tabela, encontraremos
tTab= 0930,2.

Como: tTAB < tCALC < tTAB, ao nvel de significncia de 5% ACEITO


H0: = 50.

Das könnte Ihnen auch gefallen