Sie sind auf Seite 1von 144

ESCOLA POLITCNICA DA UNIVERSIDADE DE SO PAULO

DEPARTAMENTO DE ENGENHARIA DE PRODUO

ESTATSTICA I

Prof. Alberto W. Ramos

SO PAULO, 2016

ESTATSTICA

ESTATSTICA

a cincia que trata da coleta, organizao, descrio,


anlise e interpretao de dados experimentais

Dados

ESTATSTICA

Informaes

Para que precisamos de informaes ?

ALBERTO W. RAMOS 2016

ESTATSTICA

TERMOS BSICOS
Termo
Populao (ou universo)
Amostra
Censo
Varivel

Significado
a coleo de todas as unidades sobre as quais desejamos
informaes
parte da coleo total de
unidades
a pesquisa que envolve 100%
da populao
Aquela caracterstica na qual
estamos interessados

Inferncia
Estatstica

POPULAO
(OU
UNIVERSO)

AMOSTRA

Probabilidade

ALBERTO W. RAMOS 2016

ESTATSTICA

Clculo de
Probabilidades

ALBERTO W. RAMOS 2016

ESTATSTICA

PROBABILIDADE

DETERMINSTICOS

FENMENOS

PROBABILSTICOS

Definies:
a) Espao Amostral (S): conjunto de todos os resultados
possveis de um fenmeno probabilstico.
Ex.: lanamento de dado  S = {1,2,3,4,5,6}
b) Evento (A,B,C,...): qualquer subconjunto de S.
Ex.:

P = ponto par = {2,4,6}


I = ponto mpar = {1,3,5}
T = ponto maior que trs = {4,5,6}

Obs.: S = evento certo


= evento impossvel

ALBERTO W. RAMOS 2016

ESTATSTICA

OPERAES COM EVENTOS


a) Evento interseco: A B
Ex.: P T = {4,6} (ambos ocorrem)
A

AB
B

b) Evento unio: A B
Ex.: P I = {1,2,3,4,5,6} = S (pelo menos um ocorre)
S
A

B
AB
B

c) Evento complementar: A
Ex.: P = {1,3,5} = I

(P no ocorre)
S
A
A

c) Eventos mutuamente exclusivos: A B =


Ex.: P I =

(P e I no ocorrem ao mesmo tempo)


A

ALBERTO W. RAMOS 2016

ESTATSTICA

DEFINIO DE PROBABILIDADE
um nmero real, associado a um evento, que mede sua
chance de ocorrncia:

P( A ) =

m
n

onde:
m o nmero de resultados favorveis a A
n o nmero de resultados possveis, desde que igualmente provveis

Observaes:
a) 0 P(E) 1
b) P(AB) = P(A) + P(B) - P(AB)
c) P( A ) = 1 - P(A)

ALBERTO W. RAMOS 2016

ESTATSTICA

EXEMPLO
Seja o lanamento de dois dados: um preto e outro banco.
Qual a probabilidade de se obter ponto no dado preto menor
que o branco?

(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)


(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
S=

(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)


(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

PRETO

BRANCO
P( A ) =

15
36

ALBERTO W. RAMOS 2016

ESTATSTICA

PROBABILIDADE CONDICIONADA

Notao: P(A/B)

probabilidade do evento A, sabendo-se


que o evento B ocorreu

Ex.: A chuva
B previso de chuva
P(A/B)

probabilidade de chuva dado que houve


previso de chuva

Definio:
P(A/B) =

P( A B)
, P(B) 0
P(B)

P(B/A) =

P( A B)
, P(A) 0
P( A )

ou

logo:
P(AB) = P(A) . P(B/A) = P(B) . P(A/B)

ALBERTO W. RAMOS 2016

ESTATSTICA

10

EXEMPLO
Seja o lanamento de dois dados, com A: dar ponto 1, 2 ou 3
no primeiro dado e B: dar soma 6. Calcular P(A/B) e P(B/A).

AB

(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)


(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
S=

(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)


(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

P( A ) =

18 1
=
36 2

A
15 5
P(B) =
=
36 12

P( A B)
P(A/B) =
=
P(B)

1
3
5
12

P( A B)
P(B/A) =
=
P( A )

P( A B) =

1
3
1
2

12 4
=
15 5

ALBERTO W. RAMOS 2016

2
3

12 1
=
36 3

ESTATSTICA

11

EVENTOS INDEPENDENTES
Se P(A/B) = P(A/ B ) = P(A) o evento A estatisticamente
independente de B P(B/A) = P(B/ A ) = P(B)
Neste Caso:
P(AB) = P(A) . P(B)

ALBERTO W. RAMOS 2016

ESTATSTICA

12

TEOREMA DA PROBABILIDADE TOTAL


Sejam A1, A2, ..., An eventos mutuamente exclusivos e
exaustivos (partio) e seja B um evento qualquer de S.

A1

A2

A3

B
A4

...

An

i =1

i =1

B = U A i B P(B) = P( A i B)
n

P(B) = P(Ai ).P(B/Ai )


i =1

ALBERTO W. RAMOS 2016

(TPT)

ESTATSTICA

13

TEOREMA DE BAYES
Nas mesmas condies do Teorema da Probabilidade Total.
P( A j / B) =

P( A j / B) =

P( A j B)
P(B)

P( A j ).P(B / A j )
n

P(A i ).P(B / A i )
i=1

ALBERTO W. RAMOS 2016

(TB)

ESTATSTICA

14

Variveis
Aleatrias

ALBERTO W. RAMOS 2016

ESTATSTICA

15

VARIVEIS ALEATRIAS
Uma varivel aleatria (VA) a representao dos eventos
de uma partio de S atravs de nmeros reais.
Exemplos:
a) nmero de caras obtidas no lanamento de trs moedas.
b) soma de pontos obtida no lanamento de dois dados.

0
1
A1

A2

p
VA

A3

Probabilidade em S
Funo VA
Funo Probabilidade

ALBERTO W. RAMOS 2016

ESTATSTICA

16

TIPOS DE VARIVEIS ALEATRIAS (VA)

Discreta  S finito
VA
Contnua S infinito

VA Discretas:
A distribuio de probabilidade representada pela funo
probabilidade, tal que:
a) P(X=xi) 0, xi
b)

P( X = xi ) = 1
i

c)

P( X = xi ) = P(a < X b)

xi >a

ALBERTO W. RAMOS 2016

ESTATSTICA

17

EXEMPLO
Seja X o nmero de caras (K) obtidas no lanamento de trs
moedas.

CCC KCC KKC KKK

S=
CKC KCK

CCK CKK

xi

P(X=xi)

1/8

3/8

3/8

1/8

P(X=xi)
3/8
2/8
1/8
0

ALBERTO W. RAMOS 2016

xi

ESTATSTICA

18

VA Contnuas:
S infinito e a probabilidade de cada resultado individual
zero (mas no teoricamente impossvel). A distribuio de
probabilidade representada pela funo densidade de
probabilidade fX(x).
a) fX(x) 0
+

b)

( x )dx = 1

a)

( x )dx = P(a < x b), b > a

fX(x)
P(a<xb)

ALBERTO W. RAMOS 2016

ESTATSTICA

19

EXEMPLO
Seja uma funo densidade de probabilidade definida como:

fX(x)
K

a) determinar o valor de K.
b) equacionar esta fdp.

ALBERTO W. RAMOS 2016

ESTATSTICA

20

FUNO DE REPARTIO OU DE
DISTRIBUIO ACUMULADA
definida por:
FX ( x ) = P( X x )

- < x < +

Para VAB discretas tem-se:

FX (a) =

P( X = x )
i

x i a

Para VAB contnuas tem-se:


a

FX (a) =

( x )dx

Propriedades:
a) FX ( ) = 0
b) FX ( +) = 1
c) P(a < X b) = FX (b) FY (a)

ALBERTO W. RAMOS 2016

ESTATSTICA

21

EXEMPLO
Obter as funes de distribuio acumulada dos dois
exerccios anteriores.

ALBERTO W. RAMOS 2016

ESTATSTICA

22

PARMETROS DE POSIO
Indicam onde se localiza o centro da distribuio.
1) Mdia ou Valor Esperado: (X)
VA Discreta: ( X) = x i.P( X = x i )
VA Contnua: ( X) = x.fX ( x )dx
Propriedades:
a) (K) = K, K = constante
b) (K.X) = K. (X)

c) (X+Y) = (X) + (Y)


d) (X-Y) = (X) - (Y)
e) (XK) = (X) K
f) Se X e Y so independentes (X.Y) = (X) . (Y)

2) Mediana: MD
o ponto tal que: P(X<MD) = P(X>MD) = .
3) Moda: MO
o ponto de mxima probabilidade ou densidade de
probabilidade.

ALBERTO W. RAMOS 2016

ESTATSTICA

23

PARMETROS DE DISPERSO
Indicam a variabilidade da distribuio de probabilidade.
1) Varincia: 2(X), V(X)

2 ( X) = [( X )2 ] = ( X2 ) [( X)]2
VA Discreta:

( X) = ( xi ) .P( X = x i ) = x .P( X = xi ) xi.P( X = xi )


i

i
i
2

2
i

VA Contnua:

( X) = ( x ) .fX ( x )dx = x .fX ( x )dx x.fX ( x )dx

Propriedades:
a) 2(K) = 0, K = constante
b) 2(K.X) = K2. 2(X)

c) Se X e Y so independentes:
2(X+Y) = 2(X) + 2(Y)
2(X-Y) = 2(X) + 2(Y)
d) 2(XK) = 2(X)

ALBERTO W. RAMOS 2016

ESTATSTICA

24

2) Desvio-Padro: (X)

( X) = 2 ( X)

3) Coeficiente de Variao: CV

CV =

( X)
( X)

ALBERTO W. RAMOS 2016

ESTATSTICA

25

EXEMPLOS
Seja X o nmero de caras (K) obtidas no lanamento de trs
moedas.
xi

P(X=xi)

1/8

3/8

3/8

1/8

P(X=xi)
3/8
2/8
1/8
0

( X) = x i.P( X = x i ) = 0 x

xi2.P( X = xi ) = 02 x
i

xi

1
3
3
1 12
+ 1x + 2 x + 3 x =
= 1,5
8
8
8
8 8

3
1 24
1 2 3
+ 1 x + 22 x + 3 2 x =
=3
8
8
8
8 8

2 ( X) = x i2 .P( X = x i ) x i.P( X = x i ) = 3 (1,5 )2 = 0,75


i

ALBERTO W. RAMOS 2016

ESTATSTICA

26

EXEMPLO
Seja uma funo densidade de probabilidade definida como:

fX(x)
K

Determinar a mdia (X) e a varincia 2(X).

ALBERTO W. RAMOS 2016

ESTATSTICA

27

Principais
Distribuies de
Probabilidade

ALBERTO W. RAMOS 2016

ESTATSTICA

28

DISTRIBUIES DISCRETAS
Distribuio de Bernoulli
Seja uma prova que s possa ter dois resultados:
1-p

fracasso  X = 0

p
sucesso  X = 1
com X = nmero de sucessos (0 ou 1)
xi
P(X = xi)

0
1-p

1
p

P(X=xi)
1-p
p
0

( X) = 0 (1 p) + 1 p = p
( X 2 ) = 0 2 (1 p) + 12 p = p
2 ( X) = ( X2 ) [( X)]2 = p p2 = p(1 p)

ALBERTO W. RAMOS 2016

xi

ESTATSTICA

29

EXEMPLO
Um dado lanado cinco vezes. Qual a probabilidade de
sair ponto seis duas vezes ?
Eventos:

S (sucesso)  sair ponto seis


F (fracasso)  no sair ponto seis

Existem 10 maneiras (possibilidades) disto ocorrer:


SSFFF
SFSFF
SFFSF
SFFFS
FSFFS
FFSFS
FFFSS
FSSFF
FSFSF
FFSSF
Contudo existe uma maneira mais fcil, sem ter necessidade
de listar todas as possibilidades:

n
n!
= Cn,x =
x! (n x )!
x
n = nmero de tentativas (5 lanamentos)
x = nmero de sucessos (2 pontos seis)

ALBERTO W. RAMOS 2016

ESTATSTICA

30

Distribuio Binomial

P( X = x ) = C n,x .p x .(1 p) n x
onde:
n = nmero de tentativas
x = nmero de sucessos
p = probabilidade de sucesso
A mdia e a varincia desta distribuio so:
( X) = n.p
2 ( X) = n.p.(1 p)

Um lote de 1000 peas foi recebido na empresa e sabe-se


que este tem 200 itens defeituosos. Se for retirada (com
reposio) uma amostra de 10 peas, qual a chance desta
conter 1 defeituosa ?

ALBERTO W. RAMOS 2016

ESTATSTICA

31

Distribuio de Poisson

e t .( t )x
P( X = x ) =
x!
onde:
e = nmero de Euler (2,72)
= freqncia mdia de sucessos
t = intervalo de observao
Nesta distribuio a mdia e a varincia so:
( X) = t
2 ( X ) = t

Em um restaurante, no horrio do almoo, em mdia chegam


10 clientes por minuto. Qual a probabilidade de em dez
minutos chegarem exatamente 122 clientes ?

ALBERTO W. RAMOS 2016

ESTATSTICA

32

APROXIMAES DE DISTRIBUIES

Se p 0,10 pode-se empregar a Distribuio de Poisson


no lugar da Binomial, fazendo-se n.p = .t.

Ex.: n = 20 e p = 0,02
PBINOMIAL (X=1) = 0,273

PPOISSON (X=1) = 0,268

ALBERTO W. RAMOS 2016

ESTATSTICA

33

DISTRIBUIES CONTNUAS
Distribuio Exponencial
Seja T o intervalo decorrido entre dois sucessos consecutivos de um fenmeno de Poisson, com parmetro :

P( X = 0) = e t
P(X=0) a probabilidade de nenhum sucesso no intervalo de
observao t. Significa tambm a probabilidade do primeiro
sucesso levar mais do que t para ocorrer.

P( X = 0) = P(T > t ) = e t

P(T t ) = FT ( t ) = 1 e t
fT ( t ) =

d
FT ( t ) = e t , t 0
dt

f(t)
1,0

0,8

0,6

=1

0,4

0,2

0,0
0

10

(T ) =

2 (T ) =

ALBERTO W. RAMOS 2016

1
2

ESTATSTICA

34

Distribuio Normal (ou de Gauss)


Seja X uma varivel aleatria contnua com a seguinte
distribuio:

1 x 2
1
fX ( x ) =
exp
, - < x < +

2
2

f(x)
0,18
0,16

( x ) = 5 0
(x ) = 2 , 5

0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
42

44

46

48

50

52

54

56

Esta distribuio tem mdia e varincia:


( X) =
2 ( X) = 2
Obs.:

a) exp z = ez
b) comum escrever-se: X N(;2)

ALBERTO W. RAMOS 2016

58
X

ESTATSTICA

35

DISTRIBUIO NORMAL REDUZIDA


(OU PADRONIZADA)
Seja X uma varivel aleatria tal que X N(;2) e seja Z
definida como:

z=

Ento: Z N(0;1), com:


f(z)
0,4

( z ) =0
(z ) = 1

0,3

0,2

0,1

0,0
-3

-2

-1

( Z ) = 0
2 ( Z ) = 1
Obs.:

a) P( x x 0 ) P(0 z z0 )

x
b) P( X x ) = P Z

ALBERTO W. RAMOS 2016

ESTATSTICA

36

TABELA DA DISTRIBUIO NORMAL


valores de P(0 < Z < z0)

z0

0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9

0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000

0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,4991
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,5000

0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3685
0,3888
0,4066
0,4222
0,4357
0,4474
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,4991
0,4994
0,4995
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,0120
0,0517
0,0910
0,1293
0,1664
0,2019
0,2357
0,2673
0,2967
0,3238
0,3485
0,3708
0,3907
0,4082
0,4236
0,4370
0,4484
0,4582
0,4664
0,4732
0,4788
0,4834
0,4871
0,4901
0,4925
0,4943
0,4957
0,4968
0,4977
0,4983
0,4988
0,4991
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2703
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495
0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505
0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,4992
0,4994
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,4992
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,4993
0,4995
0,4996
0,4997
0,4998
0,4999
0,4999
0,4999
0,5000

0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
0,4993
0,4995
0,4997
0,4998
0,4998
0,4999
0,4999
0,4999
0,5000

FONTE: COSTA NETO, P.L.O. Estatstica. So Paulo, Edgard Blucher, 1978.

ALBERTO W. RAMOS 2016

ESTATSTICA

37

TEOREMA DO LIMITE CENTRAL


Uma varivel aleatria resultante da soma de n variveis
aleatrias independentes, no limite, quando n , tem
distribuio Normal.

TEOREMA DAS COMBINAES LINEARES


Uma varivel aleatria obtida pela combinao linear de
variveis aleatrias Normais independentes tem tambm
distribuio Normal.

ALBERTO W. RAMOS 2016

ESTATSTICA

38

APROXIMAES PELA NORMAL


Binomial pela Normal
Se np 5 e n.(1-p) 5 vale a aproximao da
distribuio Binomial pela Normal.

Poisson pela Normal


Se t 5 vale a aproximao da distribuio de Poisson
pela Normal.

Correo da Continuidade
Como se aproxima uma distribuio discreta (Binomial ou
Poisson) por uma contnua (Normal), necessria esta
correo:
discreta: P(X=xi) Normal: P( x i 21 X xi + 21 )
discreta: P(x1Xx2) Normal: P( x 1 21 X x 2 + 21 )

ALBERTO W. RAMOS 2016

ESTATSTICA

39

Estatstica
Descritiva

ALBERTO W. RAMOS 2016

ESTATSTICA

40

TIPOS DE VARIVEIS
Nominais
Qualitativas
Ordinais
Variveis
Discretas
Quantitativas
Contnuas

Exemplo ( Variveis em uma ficha cadastral PF )


Varivel
1

Nmero de dependentes

Idade

Local de nascimento

Nvel educacional

Tipo

Qualitativa, nominal

Qualitativa, ordinal

Quantitativa, discreta

Quantitativa, contnua

ALBERTO W. RAMOS 2016

ESTATSTICA

41

AMOSTRAGEM
To importante quanto determinar quantos itens devem ser
examinados na amostragem (tamanho da amostra), determinar
como coletar estes itens.
1. Amostragem simples (aleatria ou casual): todos itens da
populao tm igual chance de pertencer amostra (sorteio)
.

SORTEIO

AMOSTRA
POPULAO

2. Amostragem sistemtica: os itens encontram-se ordenados e


a retirada de elementos da amostra feita periodicamente
.

........

8 7 6 5 4 3 2 1

POPULAO

ALBERTO W. RAMOS 2016

7 4 1

AMOSTRA

ESTATSTICA

42

3. Amostragem estratificada: a populao encontra-se dividida


em vrios estratos e as amostras so coletadas
aleatoriamente de cada estrato.
.

AMOSTRA
POPULAO

4. Amostragem por agrupamentos: a populao encontra-se


fisicamente dividida em pequenos grupos, que so sorteados
para formar a amostra.
.

AMOSTRA
POPULAO

ALBERTO W. RAMOS 2016

ESTATSTICA

43

Distribuies
de Frequncias

ALBERTO W. RAMOS 2016

ESTATSTICA

44

DISTRIBUIES DE FREQUNCIAS

Quando h uma grande quantidade de dados disponveis


( n 30 ) mais adequado trabalhar-se com estes agrupados
do que com os valores individualmente

Distribuies de frequncias permitem observar :

Quantas vezes ocorre um certo resultado

Simetria ou assimetria dos dados

Onde se concentram mais os valores

Qual a variabilidade (disperso) dos dados

Existncia de valores discrepantes (dados suspeitos)

Estratificao (diferentes subgrupos de dados)

ALBERTO W. RAMOS 2016

ESTATSTICA

45

EXEMPLO
Trinta empresas foram selecionadas
classificadas de acordo com seu tamanho:
Tamanho
1 a 100 funcionrios
101 a 500 funcionrios
mais de 500 funcionrios

aleatoriamente

Categoria
P
M
G

Os resultados foram os seguintes:


M
M
G

P
G
P

M
M
G

M
M
G

M
M
G

P
M
G

G
M
M

G
P
M

M
G
P

G
M
G

Distribuio de frequncias:
Porte
P
M
G
Total

f
5
14
11
30

p
0,16
0,47
0,37
1,00

f : frequncia absoluta
p : frequncia relativa

14

12

Frequncia

10

0
P

Tamanho

ALBERTO W. RAMOS 2016

ESTATSTICA

46

EXEMPLO
Nmero de pedidos de concesso de emprstimo recebidos por
uma agncia nas ltimas 20 semanas.
( 1) 2
( 5) 7
( 9) 1
(13) 3
(17) 4

( 2) 3
( 6) 4
(10) 3
(14) 4
(18) 1

( 3) 5
( 7) 2
(11) 3
(15) 0
(19) 2

Min = 0

( 4) 4
( 8) 5
(12) 5
(16) 3
(20) 3

Mx = 7 ( 8 valores distintos )

Distribuio de frequncias :
pedidos
frequncia

0
1

1
2

2
3

3
6

4
4

5
3

6
0

Frequncia

0
0

Pedidos

ALBERTO W. RAMOS 2016

7
1

ESTATSTICA

47

EXEMPLO
Porcentagem do faturamento recolhido sob a forma de tributos
federais por 50 empresas
Souza Cruz
Autolatina
General Motors
Brahma
Philip Morris
Shell
Gessy Lever
IBM
Fiat Automveis
Nestl
Goodyear
Esso
Mercedes-Benz
Firestone
Pirelli
Texaco
Atlantic
Skol
Consul
Santa Marina
CBA
Antarctica Paulista
Brastemp
Suzano
Philips

36,9
28,4
25,7
65,4
46,7
3,4
15,8
20,6
14,2
9,0
15,1
1,8
1,9
32,7
17,6
3,8
4,5
37,5
14,3
20,3
7,7
46,5
12,1
12,7
4,8

Petrleo Ipiranga
Johnson & Johnson
Avon
Antarctica Rio
Alcan
Bosch
Klabin
Glasurit
Kaiser SP
Krupp
Carrefour
Usiminas
3M
Hoechst
Poliolefinas
Cebrasp
Arno
MBR
Estrela
Solvay
Kodak
Metal Leve
Champion
Rhodia
Antarctica Nordeste

ALBERTO W. RAMOS 2016

3,1
10,1
17,8
28,9
7,8
18,9
11,0
11,1
56,1
27,0
2,4
5,2
26,0
8,0
22,9
30,0
13,9
8,0
3,4
13,3
10,2
14,2
9,1
4,8
29,4

ESTATSTICA

48

Como existem 50 (n=50) diferentes valores, vamos agrupar os


dados em classes, seguindo o seguinte procedimento:
a) Obter uma amostra de 50 a 100 dados (50 < n < 100)
b) Determinar o maior e o menor valor (xmax e xmin)
c) Calcular a amplitude total dos dados RT = xmax - xmin
d) Determinar o nmero de classes k = n
e) Calcular a amplitude das classes h = R/k
f) Determinar os limites das classes
g) Construir uma tabela de freqncias
h) Traar o diagrama

Resoluo:
xmin = 1,8

xmax = 65,4

RT = 65,4 1,8 = 63,6


k=

n = 50 7

h = 63,6/7 10
Limites das classes:
Limite inferior da 1 classe = 0
Limite inferior da 2a classe = 0 + 10 = 10
Limite inferior da 3a classe = 10+ 10 = 20 ....

ALBERTO W. RAMOS 2016

ESTATSTICA

49

TABELA DE FREQUNCIAS
Classes

pA

0x<10

4,95

17

0,34

17

0,34

10x<20

14,95

16

0,32

33

0,66

20x<30

24,95

0,18

42

0,84

30x<40

34,92

0,08

46

0,92

40x<50

44,95

0,04

48

0,96

50x<60

54,95

0,02

49

0,98

60x<70

64,95

0,02

50

1,00

50

1,00

Total

Notao:
c : ponto mdio (centro) da classe
f : Frequncia absoluta
p: Proporo (frequncia relativa)
F : Frequncia absoluta acumulada
pA : Frequncia relativa acumulada

ALBERTO W. RAMOS 2016

ESTATSTICA

50

HISTOGRAMA

18
16
14

Frequencia

12
10
8
6
4
2
0
0

10

20

30

40

50

ALBERTO W. RAMOS 2016

60

70

ESTATSTICA

51

ANLISE DE HISTOGRAMAS

BIMODAL

TRUNCADO

RETNGULOS
ISOLADOS

ASSIMTRICO

ALBERTO W. RAMOS 2016

ESTATSTICA

52

POLGONO DE FREQUNCIAS
ACUMULADAS
1

0,9

0,8

0,7

% Acumulada

0,6

0,5

0,4

0,3

0,2

0,1

0
0

10

20

30

40

50

ALBERTO W. RAMOS 2016

60

70

ESTATSTICA

53

Medidas
Descritivas

ALBERTO W. RAMOS 2016

ESTATSTICA

54

MEDIDAS DESCRITIVAS

Quando queremos caracterizar uma amostra, podemos


caracteriz-la mediante o clculo de certas quantidades
chamadas de medidas descritivas

1. Medidas de Posio
Mediana ( md ou Q2 ) e Quartis ( Q1 e Q3 )
Mdia ( x )
Moda ( mo )

2. Medidas de Disperso
Amplitude ( R )
Varincia ( s2 )

Desvio-padro ( s )

ALBERTO W. RAMOS 2016

ESTATSTICA

55

MEDIANA

A mediana a quantidade que divide o conjunto de dados


ordenados da amostra em duas metades com igual nmero
de elementos. Quartil, por sua vez, divide em quatro metades
com iguais quantidades de elementos.

Exemplo
Participao de mercado das 12 maiores seguradoras em % do
valor total dos prmios emitidos. (Fonte: FENASEG in Exame,
Fev / 93 )
1,9

2,0

2,1

2,5

3,0

3,1

3,3

Mediana

md = 3,2

Primeiro Quartil

Q1 = 2,3

Terceiro Quartil

Q3 = 6,9

3,7

ALBERTO W. RAMOS 2016

6,1

7,7

17,1 18,7

ESTATSTICA

56

EXEMPLO
Participao de mercado das 11 principais modalidades de
seguros em % do valor total dos prmios emitidos (outras
modalidades correspondem 6,9%)
RAMO
Automvel
Sade
Incndio
Vida
Riscos Diversos
Habitao
Transporte
Acidentes Pessoais
Obrigatrio Veculos
Riscos de Engenharia
Responsabilidade Civil *

%
33,6
14,0
12,9
12,2
5,5
5,3
3,1
2,9
1,7
1,0
0,9

Terceiro Quartil
Mediana
Primeiro Quartil

Fonte ( Fenaseg, in Exame, Fev / 93 )

ALBERTO W. RAMOS 2016

ESTATSTICA

57

MDIA ARITMTICA
x=

x
n

Exemplos
A)

23

25

37

47

x ( A ) = 33

B)

10

57

60

x ( B ) = 33

C)

10

14

100 x ( C ) = 33

C
B
A

10

20

30

40

50

60

70

80

Quais as diferenas entre os conjuntos de dados ?

ALBERTO W. RAMOS 2016

90

100

ESTATSTICA

58

No se deve tomar decises baseadas apenas na mdia


A mdia nem sempre o valor "mais comum" ou "mais tpico"
ou "ponto de simetria".
x
x
x
x
1

x
16

A mdia influenciada por dados suspeitos (outliers)


Salrios de uma empresa ( US$ )
800

800

1000

1400

96000 x = 20000

ALBERTO W. RAMOS 2016

ESTATSTICA

59

VARINCIA E DESVIO-PADRO
Varincia:

( x x )2
s =
n 1
2

Desvio-Padro:

s = s2

Exemplo
A)

23

25

37

47

s2 = 125,33

s = 11,2

B)

10

57

60

s2 = 872,67

s = 29,5

C)

10

14

100

C
B
A
0

20

40

60

ALBERTO W. RAMOS 2016

80

100

ESTATSTICA

60

DADOS AGRUPADOS
S devem ser utilizados quando no se dispuser dos dados
originais, uma vez que so valores aproximados. Em geral, a
aproximao boa.

Classes

pA

0x<10

4,95

17

0,34

17

0,34

10x<20

14,95

16

0,32

33

0,66

20x<30

24,95

0,18

42

0,84

30x<40

34,92

0,08

46

0,92

40x<50

44,95

0,04

48

0,96

50x<60

54,95

0,02

49

0,98

60x<70

64,95

0,02

50

1,00

50

1,00

Total

x=

f .c
x =
n

(f.c )2
f.c
( c x )2 f

2
2
n
s =
s =
n 1
n 1
2

s2 =

=
ALBERTO W. RAMOS 2016

ESTATSTICA

61

MEDIANA E QUARTIS
Pode-se calcul-los utilizando o polgono de frequncias
acumuladas e observando o valor no eixo das abscissas.
1

0,9

0,8

0,7

% Acumulada

0,6

0,5

0,4

0,3

0,2

0,1

0
0

10

20

30

40

50

ALBERTO W. RAMOS 2016

60

70

ESTATSTICA

62

Distribuies
Amostrais

ALBERTO W. RAMOS 2016

ESTATSTICA

63

DISTRIBUIO DA MDIA ( x )
Como:

x=
ento:

xi

( x ) =

1
( x1 + x 2 + x 3 + ... + x n )
n

1
[( x1) + ( x 2 ) + ... + ( xn )]
n

1
[ + + ... + ] = n. =
n
n

por outro lado:


2

1
( x ) = 2 ( x1) + 2 ( x 2 ) + ... + 2 ( x n )
n
2

1 2
n. 2 2
2
2
= 2 [ + + ... + ] = 2 =
n
n
n
( x ) =

Obs.: se a amostragem sem reposio e a populao


finita, ento:

2 N n
( X) =

n N 1
2

ALBERTO W. RAMOS 2016

ESTATSTICA

64

A distribuio de x normal, devido ao Teorema Limite


Central, desde que n seja suficientemente grande.
f(x)
0,20

0,15

distribuio de x
0,10

distribuio de x
0,05

0,00
10

15

20

25

30

35

40

f(x)
0,4

0,3

distribuio de x

0,2

0,1

distribuio de x
0,0
0

10

12

14

ALBERTO W. RAMOS 2016

ESTATSTICA

65

DISTRIBUIO 2 (QUI-QUADRADO)
2

xi
=
= z i2

i =1
i=1
2

( 2 ) = ( zi2 ) = .( zi2 ) =
2 ( 2 ) = 2.
Propriedades:
a) Quando , 2 Normal (Teorema do Limite Central)
b) Se as variveis so independentes 21 + 2 2 = 21 + 2
f( 2)
0,5

0,4

=2
0,3

=3

0,2

=6

0,1

0,0
0

10

15

20

ALBERTO W. RAMOS 2016

ESTATSTICA

66

TABELA DA DISTRIBUIO 2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60

0,99
0,0002
0,0201
0,115
0,297
0,554
0,872
1,239
1,646
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565
14,256
14,953
22,164
29,707
37,485

0,95
0,0039
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188

0,90
0,0158
0,211
0,584
1,064
1,610
2,204
2,833
3,490
4,168
4,865
5,578
6,304
7,042
7,790
8,547
9,312
10,085
10,865
11,651
12,443
13,240
14,041
14,848
15,659
16,473
17,292
18,114
18,939
19,768
20,599
29,051
37,689
46,459

0,10
2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256
51,805
63,167
74,397

0,05
3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773
55,758
67,505
79,082

0,01
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
63,691
76,154
88,379

FONTE: COSTA NETO, P.L.O. Estatstica. So Paulo, Edgard Blucher, 1978.

ALBERTO W. RAMOS 2016

ESTATSTICA

67

DISTRIBUIO DA VARINCIA (s2)


Relembrando:

( x i x )2

s =
2

n 1

2
Se X ~ N(;) s2 ~ n
1 . Note que foi substitudo por x .

x x
n21 = i
=

i =1

( xi x)
2

( x i x )2 n 1 (n 1) s2

=
n 1

Logo:

2 2
s =
n 1
n 1
2

2
2
2
(s ) =
(n 1 ) =
(n 1) = 2
n 1
n 1
2

4
4
2.4
2
2
(s ) =
( n 1 ) =
2(n 1) =
(n 1)2
(n 1)2
n 1
2

ALBERTO W. RAMOS 2016

ESTATSTICA

68

DISTRIBUIO DA FREQUNCIA (f)


Se a populao infinita ou amostragem com reposio p
(probabilidade de sucesso) constante.
Distribuio de f: Binomial.

( f ) = n.p
2 ( f ) = n.p.(1 p)

DISTRIBUIO DA PROPORO (p)


p =

f
n

Distribuio de p: Binomial.

f ( f ) n.p
(p) = =
=
=p
n
n
n

f 2 ( f ) n.p.(1 p) p.(1 p)

(p) = = 2 =
=
n
n2
n
n
2

ALBERTO W. RAMOS 2016

ESTATSTICA

69

DISTRIBUIO t-STUDENT
Se X tem distribuio normal com mdia e desvio-padro
x tambm ter distribuio com mdia , mas com desviopadro / n
Pode-se definir:

z=

Se no lugar de for usado s, ento:

tn 1 =

x
s
n

0,20

distribuio de z
0,15

0,10

distribuio
de t n-1

0,05

0,00
-8

-6

-4

-2

ALBERTO W. RAMOS 2016

z, t

ESTATSTICA

70

TABELA DA DISTRIBUIO t-STUDENT

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
30
50
80
120

0,100
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,310
1,299
1,292
1,289
1,282

0,050
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,697
1,676
1,664
1,657
1,645

0,025
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,042
2,009
1,990
1,980
1,960

0,010
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,457
2,403
2,374
2,351
2,326

FONTE: COSTA NETO, P.L.O. Estatstica. So Paulo, Edgard Blucher, 1978.

ALBERTO W. RAMOS 2016

ESTATSTICA

71

Estimao de
Parmetros

ALBERTO W. RAMOS 2016

ESTATSTICA

72

Quando um parmetro de uma populao desconhecido,


vamos estim-lo a partir das estatsticas fornecidas pelas
amostras.

AMOSTRA
ESTATSTICA
POPULAO
PARMETRO

ALBERTO W. RAMOS 2016

ESTATSTICA

73

ESTIMADOR E ESTIMATIVA

Estimador:

Quantidade calculada em funo dos


elementos da amostra, que ser usada
na estimao do parmetro.

Estimativa:

Um certo valor de um estimador.

EXEMPLO
113 - 124 - 115 - 107 - 120 - 115 110
estimador (de )
x
~
x
m0

estimativa
114,9
115
115

ALBERTO W. RAMOS 2016

ESTATSTICA

74

ESTIMAO POR PONTO


A estimao por ponto consiste em fornecer um nico valor,
que a melhor estimativa para o parmetro da populao.
a) Estimao com base em uma amostra
Parmetro
Estimado

Melhor
Estimador
xi
x=
n
( x i )2

2
s =
n
( x i x )2

2
s =
n 1
s = s2
1
s=
s2
c4
f
p =
n

Observaes

conhecido
desconhecido

ALBERTO W. RAMOS 2016

n 30
n < 30

ESTATSTICA

75

b) Estimao com base em vrias (k) amostras


Valores
x11 x12 x13 ... x1n
x21 x22 x23 ... x2n
x31 x32 x33 ... x3n
.
.
.
xk1 xk2 xk3 ... xkn

Amostra
1
2
3
.
.
.
k

x=

x
x1
x2
x3
.
.
.
xk

n1.x1 + n2 .x 2 + n3 .x 3 + ... + nk .x k
n1 + n2 + n3 + ... + nk

Se n1 = n2 = n3 = ... = nk x =

xi
k

(n1 1)s12 + (n2 1)s22 + ... + (nk 1)sk2


s =
n1 + n2 + ... + nk k
2
p

si2

Se n1 = n2 = n3 = ... = nk s =
2
p

pp =

n1.p1 + n2 .p2 + ... + nk .pk


n1 + n2 + ... + nk

pi
Se n1 = n2 = n3 = ... = nk pp =
k

ALBERTO W. RAMOS 2016

s2
s12
s22
s32
.
.
.
sk2

ESTATSTICA

76

ESTIMAO POR INTERVALO


Todas as estimativas por ponto contm um erro, pois so
diferentes do valor do parmetro, embora prximas. Para
avaliar a magnitude do erro de estimao, constri-se um
Intervalo de Confiana (IC) em torno da estimativa, com
probabilidade conhecida.

Notao:
f(z)
0,4

z =1
0,3

0,2

0,1

0,0

p
0

zp

mdia da populao
x mdia da amostra
desvio-padro da populao
s desvio-padro da amostra
n tamanho da amostra
e0 semi-amplitude do IC IC = 2.e0

ALBERTO W. RAMOS 2016

ESTATSTICA

77

a) IC para com conhecido:


0,20

0,15

0,10

1
0,05

0,00

/ 2

/ 2
-e 0

+e0

P( e0 x + e0 ) = 1
e0 x

x + e0

x + e0

x e0

x e0 x + e0
P( x e0 x + e0 ) = 1

ALBERTO W. RAMOS 2016

_
x

ESTATSTICA

78

( + e 0 )
= z / 2

e0 = z / 2

IC para :

x z / 2

b) IC para com desconhecido:


Se desconhecido, substitui-se por s na frmula
anterior e, neste caso, passa-se a ter um t-Student com
n-1 graus de liberdade.

x t n 1; / 2

s
n

ALBERTO W. RAMOS 2016

ESTATSTICA

79

c) IC para 2:

/ 2

/ 2

n21 =

(n 1) 2
s
2

P(n21;1 / 2 n21 n21; / 2 ) = 1

2
n 1;1 / 2

(n 1)s2

n21; / 2
2

(n 1)s2
(n 1)s2
2
2
n21; / 2
n 1;1 / 2

2
(n 1)s2

(
n

1
)
s
2

= 1
P 2
2
n1;1 / 2
n1; / 2

ALBERTO W. RAMOS 2016

ESTATSTICA

80

d) IC para
(n 1)s 2
(n 1)s 2

n21; / 2
n21;1 / 2

= 1

e) IC para p
p tem Distribuio Binomial (p) = p
p(1 p)
2 (p) =
n
Se n.p 5 e n.(1-p) 5 vale aproximao pela Normal.

e0 = z / 2

p(1 p)
n

Como no conhecemos p, usamos p:

p z / 2

p.(1 p)
n

ALBERTO W. RAMOS 2016

ESTATSTICA

81

TAMANHO DE AMOSTRAS
(PARA ESTIMAO)
a) Mdia:
. Se conhecido:

e0 = z / 2

n = / 2
e0

. Se desconhecido:

t
n = n 1; / 2
e0

n = tamanho da amostra-piloto
b) Proporo Populacional (probabilidade):
2

z
n = / 2 p(1 p)
e0

Se no h estimativa para p, adotar p = 1/2.

ALBERTO W. RAMOS 2016

ESTATSTICA

82

Testes de
Hipteses

ALBERTO W. RAMOS 2016

ESTATSTICA

83

Com base nos resaultados da amostra, quer se testar uma


certa hiptese (considerada como vlida, at prova em
contrrio), a respeito de um parmetro da populao.
Notao:
H0 = hiptese nula, a ser testada
H1 = hiptese alternativa
Exemplo:
H0 = o ru inocente
H1 = o ru culpado
Vai se obter uma amostra e:
aceito H0 (fraco)
rejeito H0 e afirmo H1 (forte)

ALBERTO W. RAMOS 2016

ESTATSTICA

84

TIPOS DE ERROS
Dois tipos de erros podem ser cometidos em testes de
hipteses:
a) Erro tipo I: rejeitar H0 quando H0 verdadeira.
Ex.: juiz condenar um ru inocente.
b) Erro tipo II: aceitar H0 quando H0 falsa.
Ex.: juiz absolve um ru culpado.
Cada tipo de erro tem uma certa probabilidade de ser
cometido ( e , respectivamente).

REALIDADE

H0 verdadeira

H0 falsa

aceitar
H0

deciso correta
1-

erro tipo II

rejeitar
H0

erro tipo I

deciso correta
1-

DECISO

ALBERTO W. RAMOS 2016

ESTATSTICA

85

EXEMPLO

Um certo fabricante de pneus afirma que estes tm durao


mdia de 45.000 Km e desvio-padro de 3.000 Km. Uma
empresa adquiriu um lote deste produto, retirou e testou uma
amostra de 16 pneus que forneceu x = 44.175 Km. Qual a
deciso: aceitar ou rejeitar o lote?
DICA:

quando montar as hipteses, colocar sempre


em H1 aquilo que se deseja afirmar ou provar.

ALBERTO W. RAMOS 2016

ESTATSTICA

86

Hipteses:
H0: 45.000
H1: < 45.000
Se H0 verdadeira x ~ N(; n )

= 45.000
3.000
=
= 750
n
16
0,0005

_x = 7 5 0
0,0004

0,0003

1 = 0,95
0,0002

0,0001

0,0000

= 0,05
_
x1

z1 = 1,645 1,645 =

= 45000

_
X

x1 45.000
x1 43.766
750

Como x = 44.175, ainda cai na regio de probabilidade 1 -


= 95% aceito H0

ALBERTO W. RAMOS 2016

ESTATSTICA

87

TESTES PARA A MDIA


A) conhecido:
1 Caso: H0: = 0
H1: < 0

_
x1

_
x

0
x1 = 0 z

Se x CALC < x1 rejeito H0

ou se

z CALC =

x CALC 0
< z
rejeito H0

ALBERTO W. RAMOS 2016

ESTATSTICA

88

2 Caso: H0: 0
H1: > 0

_
x2

x 2 = 0 + z

Se x CALC > x 2 rejeito H0

ou se z CALC > z rejeito H0

ALBERTO W. RAMOS 2016

_
x

ESTATSTICA

89

3 Caso: H0: = 0
H1: 0

/ 2
_
x1

/ 2
_
x2

x1 = 0 z / 2

x 2 = 0 + z / 2

Se x CALC < x1 ou x CALC > x 2 rejeito H0

ou se z CALC < z / 2ou z CALC > z / 2 rejeito H0

ALBERTO W. RAMOS 2016

_
x

ESTATSTICA

90

B) desconhecido:
1 Caso: H0: = 0
H1: < 0

x1 = 0 t n 1;

ou

t CALC =

x CALC 0
s
n

Se x CALC < x 1 ou t CALC < t n1; rejeito H0

2 Caso: H0: 0
H1: > 0

x 2 = 0 + t n 1;

s
n

Se x CALC > x 2 ou t CALC > t n1; rejeito H0

ALBERTO W. RAMOS 2016

ESTATSTICA

91

3 Caso: H0: = 0
H1: 0

x1 = 0 tn 1; / 2

s
n

x 2 = 0 + t n 1; / 2

s
n

Se x CALC < x1 ou x CALC > x 2 rejeito H0


Ou se t CALC < t n1; / 2 ou t CALC > t n1; / 2 rejeito H0

ALBERTO W. RAMOS 2016

ESTATSTICA

92

TESTES PARA VARINCIA


1 Caso: H0: 2 = 02
H1: 2 > 02
Se H0 for verdadeira ( 2 = 02 ), resulta:

(n 1)s2
= n21
2
0

1
0

s22

2
Se sCALC
> s22 rejeito H0
2
(n 1)sCALC
Se
> n21; rejeito H0
2
0
2
Se CALC
> n21; rejeito H0

ALBERTO W. RAMOS 2016

s2

ESTATSTICA

93

2 Caso: H0: 2 = 02
H1: 2 < 02
2
< n21;1 rejeito H0
Se CALC

3 Caso: H0: 2 = 02
H1: 2 02
2
Se CALC
< n21;1 / 2 rejeito H0

ou
2
2
Se CALC > n1; / 2 rejeito H0

ALBERTO W. RAMOS 2016

ESTATSTICA

94

TESTES PARA PROPORO


Sabemos que p tem distribuio binomial. Porm, se n.p0 5
e n.(1-p0) 5 a distribuio de p poder ser aproximada
por uma distribuio normal*
1 Caso: H0: p = p0
H1 : p < p 0
p1 = p0 z

Se p' < p1 ou z CALC =

p0 (1 p0 )
n

p'p 0
p 0 (1 p 0 )
n

< z rejeito H
0

2 Caso: H0: p = p0
H1 : p > p 0
p2 = p0 + z

Se p' > p 2 ou z CALC =

p0 (1 p0 )
n

p'p 0
p 0 (1 p0 )
n

> z rejeito H
0

Nota: se esta aproximao no for vlida, deve-se empregar o


teste exato de Fischer, cuja teoria foge ao escopo deste curso.

ALBERTO W. RAMOS 2016

ESTATSTICA

95

3 Caso: H0: p = p0
H1 : p p 0

p1 = p0 z / 2

p0 (1 p0 )
n

p 2 = p0 + z / 2

p0 (1 p0 )
n

Se p' < p1 ou se p' > p2 rejeito H0


ou ainda, se z CALC < z / 2 ou se z CALC > z / 2 rejeito H0

ALBERTO W. RAMOS 2016

ESTATSTICA

96

TAMANHO DE AMOSTRA PARA


TESTES DE HIPTESES
Sejam as hipteses:
H0: 0
H1: > 0
e vamos assumir que:
conhecido e;
e esto fixados (determinados).
Se H0 verdadeira, ou seja, se = 0

_
x2

x 2 = 0 + z

ALBERTO W. RAMOS 2016

_
x

ESTATSTICA

97

Mas, se em realidade = >0, ento

_
x2

'

E, consequentemente
x 2 = z

igualando-se ambas expresses, resulta em

z + z
n =

0

ou, se desconhecido

+t
t
n = n 1; n 1;
0

ALBERTO W. RAMOS 2016

_
x

ESTATSTICA

98

Se, alternativamente, as hipteses testadas fossem:


H0: = 0
H1: 0
Ento:
z / 2 + z
n =

0

ou, se s fr desconhecido
t n 1; / 2 + t n 1;
n=

Analogamente, para o caso de testes unilaterais da


proporo, considerada vlida a aproximao da distribuio
da binomial pela normal:
z p 0 (1 p 0 ) + z p' (1 p' )

n=

p'p 0

Como ficara a expresso acima para teste bilateral da


proporo?

ALBERTO W. RAMOS 2016

ESTATSTICA

99

Comparaes
Mltiplas

ALBERTO W. RAMOS 2016

ESTATSTICA

100

COMPARAO DE VRIAS VARINCIAS


Sejam vrias amostras, de mesmo tamanho (n), retiradas de
k populaes Normais.
Se quisermos testar as hipteses:
H0: 12 = 22 = ... = k2
H1: pelo menos um i2 diferente dos demais
obtemos:

gCALC

max si2
=
(i = 1, 2,..., k)
2
si

e tambm:
gCRIT funo de n, k e
Se gCALC > gCRIT rejeito H0 e afirmo H1

ALBERTO W. RAMOS 2016

ESTATSTICA

101

TABELA g
( = 5%)
k=2
3
4
5
6
7
8
9
10

n=2
0,9985
0,9669
0,9065
0,8412
0,7808
0,7271
0,6798
0,6385
0,6020

3
0,9750
0,8709
0,7679
0,6838
0,6161
0,5612
0,5157
0,4775
0,4450

4
0,9392
0,7977
0,6841
0,5931
0,5321
0,4800
0,4377
0,4027
0,3733

5
0,9057
0,7457
0,6287
0,5441
0,4803
0,4307
0,3910
0,3584
0,3311

6
0,8772
0,7071
0,5895
0,5065
0,4447
0,3974
0,3595
0,3286
0,3029

7
0,8534
0,6771
0,5598
0,4783
0,4184
0,3726
0,3362
0,3067
0,2823

Observaes:
k = quantidade de amostras
n = tamanho da amostra

ALBERTO W. RAMOS 2016

8
0,8332
0,6530
0,5365
0,4564
0,3980
0,3535
0,3185
0,2901
0,2666

9
0,8159
0,6333
0,5157
0,4387
0,3817
0,3384
0,3043
0,2768
0,2541

10
0,8010
0,6167
0,5017
0,4241
0,3682
0,3259
0,2926
0,2659
0,2439

ESTATSTICA

102

EXEMPLO
Cinco amostras com quatro elementos cada forneceram si2 :
3,7 - 2,5 - 5,1 - 6,0 - 3,2. Ao nvel de significncia de 5%,
existe evidncia que alguma i2 seja diferente das demais?
n=4

k=5

max si2 = 6,0


2
si = 20,5

Com isso, temos:

gCALC =

6,0
= 0,2927
20,5

gCRIT = g5;4;5% = 0,5931

aceito que as varincias so iguais, ou seja:

12 = 22 = 32 = 24 = 52

ALBERTO W. RAMOS 2016

ESTATSTICA

103

COMPARAO DE VRIAS MDIAS


Vamos imaginar que temos trs grupos de pessoas e que se
quer verificar se o seu QI (quociente de inteligncia) mdio
igual. Para tanto, sorteiou-se oito indivduos de cada grupo e
a estes foi aplicado um certo teste.
Os resultados obtidos sero apontados numa tabela da
seguinte forma:
Grupo
1

Notas
x12 x13 .... x18

x
x1

s2
s12

x21 x22 x23 .... x28

x2

s22

x31 x32 x33 .... x38

x3

s32

x11

Notao empregada:
n - tamanho da amostra (8, no caso)
k - quantidade de mdias comparadas (3, no caso)
x i - mdia da amostra do grupo i

x - mdia geral (mdia das mdias)


si2 - varincia da amostra do grupo i
s2d - varincia dentro da amostra (ou residual)
s2e - varincia entre amostras
s2t - varincia total

ALBERTO W. RAMOS 2016

ESTATSTICA

104

Como no se conhece a varincia da populao, chamada de


2, pode-se estim-la mediante trs mtodos diferentes:

Mtodo 1: atravs dos s2 obtidos em cada grupo


2

s =

s2d

2
si2 ( xij x i )

=
=

k.(n 1)

Mtodo 2: atravs das mdias dos grupos

s2e

( x i x )2

= n.
k 1

Mtodo 3: atravs de todos os dados individuais

s2t

( xij x )2

=
n.k 1

Como toda esta notao muito complicada, vamos mostrar


os conceitos mediante aplicao ao exemplo do QI.

ALBERTO W. RAMOS 2016

ESTATSTICA

105

Imagine que os resultados obtidos tenham sido os seguintes:


Grupo
1
4 5 5
2
2 4 3
3
3 6 6

Notas
4 8 4 3 7
7 5 4 2 5
4 5 4 6 6

x
5,0
4,0
5,0

s2

2,9
2,9
1,4

Mtodo 1: atravs dos s2 obtidos em cada grupo

s2d =

2,9 + 2,9 + 1,4


= 2,4
3

Mtodo 2: atravs das mdias dos grupos

x=

s2e

5,0 + 4,0 + 5,0


= 4,7
3

[(5,0 4,7)2 + ( 4,0 4,7)2 + (5,0 4,7)2 ]


= 8.
= 2,7
(3 1)

Mtodo 3: atravs de todos os dados individuais

s2t

[( 4 4,7)2 + (5 4,7)2 + (5 4,7)2 + ... + (6 4,7)2 ]


=
= 2,4
8.3 1

Pode-se perceber que:


as mdias x so prximas;
os valores de s2d , s2e e s2t tambm so prximos.

ALBERTO W. RAMOS 2016

ESTATSTICA

106

Imagine, agora, que os resultados obtidos fossem:


Grupo
1
4 5 5
2
0 2 1
3
7 10 10

Notas
4 8 4 3 7
5 3 2 0 3
8 9 8 10 10

x
5,0
2,0
9,0

s2

2,9
2,9
1,4

Mtodo 1: atravs dos s2 obtidos em cada grupo

s2d =

2,9 + 2,9 + 1,4


= 2,4
3

Mtodo 2: atravs das mdias dos grupos

x=

s2e

5,0 + 2,0 + 9,0


= 5,3
3

[(5,0 5,3)2 + (2,0 5,3)2 + (9,0 5,3)2 ]


= 8.
= 98,7
(3 1)

Mtodo 3: atravs de todos os dados individuais

s2t

[( 4 5,3)2 + (5 5,3)2 + (5 5,3)2 + ... + (6 5,3)2 ]


=
= 10,8
8.3 1

Pode-se perceber, neste novo conjunto de resultados, que:


as mdias x no mais so prximas;
o valor de s2d no se alterou;
os valores de s2e e s2t aumentaram muito.
ALBERTO W. RAMOS 2016

ESTATSTICA

107

Os grficos abaixo ajudam na interpretao dos resultados.


No primeiro conjunto de dados as mdias estavam prximas:
12
10
8
6
4
2
0
Max
Min

-2

Mdia

J no outro conjunto, as mdias apresentavam-se mais


afastadas umas em relao s outras:
12
10
8
6
4
2
0
-2

Max
Min
1

ALBERTO W. RAMOS 2016

Mdia

ESTATSTICA

108

COMENTRIOS

1. Se as mdias das populaes so iguais, os valores de x i


sero prximos e tanto faz estimar-se 2 atravs de s2d , s2e
ou s 2t , pois todos eles fornecero valores prximos.
2. Mas, quando as mdias das populaes so diferen-tes, os
valores de x i divergiro entre si. Embora s2d continue sendo
um bom estimador de 2, s2e e s2t no mais o sero, pois
so afetados pela diferena entre as mdias.
3. Assim, pode-se comparar as mdias das diversas populaes (k) atravs da comparao de varincias: s2e e s2d ,
respectivamente. Este teste chamado de teste F, onde:
s2e
Fcalc = 2
sd
4. s2e tem (k-1) graus de liberdade, s2d tem [k.(n-1)] graus de
liberdade. Portanto, Fcalc ter (k-1) no seu numerador; [k.(n1)] graus de liberdade no seu denominador.
5. Quanto maior o valor de Fcalc maior a probabilidade de
que as mdias sejam diferentes entre si. Para chegar a
uma concluso, Fcalc comparado contra um Fcrit, obtido a
partir de uma tabela.
6. Se Fcalc < Fcrit, ento admite-se que as mdias so iguais.
7.A anlise de varincia assume a hiptese de que as
populaes possuem a mesma varincia (2). Se isto no
ocorrer, os resultados no sero vlidos.
ALBERTO W. RAMOS 2016

ESTATSTICA

109

DISTRIBUIO F-SNEDECOR
Sejam duas amostras independentes, retiradas de
populaes Normais, com mesma varincia (2), que
forneceram estimativas s12 e s22 , respectivamente. Ao
quociente de s12 por s22 , chamamos de:

Fn1 1;n 2 1 =

s12
s 22

f(F)
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
0

ALBERTO W. RAMOS 2016

7
F

ESTATSTICA

110

TABELA F-SNEDECOR
( = 5%)
1
2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

1
2
3
4
5
6
7
8
9
10
161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9
18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40
10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79
7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96
6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74
5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06
5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64
5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35
5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98
4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75
4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67
4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60
4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54
4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49
4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45
4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41
4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38
4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35
4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32

FONTE: COSTA NETO, P.L.O. Estatstica. So Paulo, Edgard Blucher, 1978.

ALBERTO W. RAMOS 2016

ESTATSTICA

111

EXEMPLO
O segundo conjunto de resultados do teste de QI, forneceu:

s2e = 98,7

s2d = 2,4

logo

Fcalc =

98,7
= 41,1
2,4

Fcalc tem (3 -1) = 2 GL no numerador e [3 x (8-1)] = 21 GL no


denominador.
Fcrit (para um =5%) ser F2, 21, 5% = 3,47 => pelo menos uma
turma diferente das demais.

ALBERTO W. RAMOS 2016

ESTATSTICA

112

TABELA DA ANLISE DE VARINCIA


comum apresentar-se os resultados da anlise de varincia
na forma de uma tabela, similar de baixo:

Fonte

SQ

GL

QM

FCALC

Entre

n. ( xi x )2

(k-1)

s2e

s2e / s2d

Dentro

( xij xi )2
( xij x )2

k.(n-1)

s2d

k.n-1

s2t

Total

onde:
SQ - a soma de quadrados
GL - so os graus de liberdade das estimativas
QM - o quadrado mdio = SQ/GL
No caso de nosso exemplo do teste de QI, com o segundo
conjunto de dados, tem-se:

Fonte
Entre
Dentro
Total

SQ
197,3
50,0
247,3

GL
2
21
23

QM
98,7
2,4
10,8

ALBERTO W. RAMOS 2016

FCALC
41,4

ESTATSTICA

113

AMOSTRAS DE TAMANHOS DIFERENTES


H situaes onde, eventualmente, pode-se estar
trabalhando com amostras de tamanho diferente. Neste caso,
a tabela da Anlise de Varincia modificada da seguinte
forma:

Fonte
Entre

SQ

GL

SQE=SQT-SQD

Residual SQR = (ni 1)si2


Total

SQT = ( x ij x ) 2

(k-1)

ni k

QM
SQE
k 1
SQR
sR2 =
ni k
sE2 =

ni 1

s 2T

Obs: neste caso

(n1 1)s12 + (n2 1)s22 + ... + (nk 1)sk2


s =
n1 + n2 + ... + nk k
2
R

ALBERTO W. RAMOS 2016

FCALC

sE2 / sR2

ESTATSTICA

114

ALGUNS CUIDADOS
A anlise de varincia tem algumas hipteses bsicas que
so assumidas para sua validade:
o modelo vlido do tipo x ij = + i + ij , onde a mdia
geral, i o efeito do nvel i do fator e ij o erro;
as populaes so homocedsticas, ou seja, possuem a
mesma varincia em comum 2;
as populaes podem ser adequadamente representadas
por uma distribuio de probabilidade normal;
conseqentemente, ij ~N(0; 2).
1. A condio de homocedasticidade fundamental para que
os resultados sejam vlidos e pode ser verificada mediante
uma anlise de resduos ou, ento, pelo teste de Cochran
ou de Bartlett.
2. A condio de normalidade dos dados no essencial,
pois a anlise de varincia fornece bons resultados mesmo
quando a populao no normal. Ela pode ser verificada
atravs do papel de probabilidade normal.

ALBERTO W. RAMOS 2016

ESTATSTICA

115

Correlao e
Regresso

ALBERTO W. RAMOS 2016

ESTATSTICA

116

CORRELAO

Quando duas (ou mais) variveis apresentam tendncia de


variao conjunta, diz-se que estas se correlacionam

EXEMPLO

Criana
1
2
3
4
5
6
7
8
9
10

Peso
30
32
24
28
26
34
25
23
35
31

Altura
145
150
125
140
127
145
132
112
155
145

Existe correlao entre peso e altura ?

ALBERTO W. RAMOS 2016

ESTATSTICA

117

O diagrama de disperso uma maneira rpida e eficiente


de verificar a existncia de correlao

PESO x ALTURA
165
155
145
135
125
115
105
22

24

26

28

30

Qual a concluso ?

ALBERTO W. RAMOS 2016

32

34

36

ESTATSTICA

118

TIPOS DE CORRELAO
CORRELAO LINEAR POSITIVA
(QUANDO X AUMENTA => Y TAMBM AUMENTA)
14
12
10

8
6
4
2
0

10

12

14

CORRELAO LINEAR NEGATIVA


(QUANDO X AUMENTA => Y DIMINUI)
14
12
10

8
6
4
2
0

8
X

CORRELAO NO LINEAR
7
6
5

4
3
2
1
0

10

12

14

ALBERTO W. RAMOS 2016

10

12

14

ESTATSTICA

119

COEFICIENTE DE CORRELAO LINEAR


Para medir o grau de correlao entre duas variveis, podese utilizar o coeficiente de correlao linear:

r=

( x i x )( y i y )
( x i x ) 2( y i y )2

onde:
S XY = x i .y i

S XY
S XX .S YY

( x i . y i )
n

S XX =

x i2

( x i )2

S YY =

y i2

( y i )2

A sua interpretao a seguinte:

o valor de r varia de -1 a +1 (inclusive)


r > 0 indica correlao linear positiva
r < 0 indica correlao linear negativa
r = -1 indica correlao linear negativa perfeita
r = +1 indica correlao linear positiva perfeita

ALBERTO W. RAMOS 2016

ESTATSTICA

120

CUIDADOS NA CORRELAO
a) Estratificao de Dados
y

b) Amplitude do Estudo de Correlao


y

CONDIO
NORMAL

c) Picos e Vales
y

ALBERTO W. RAMOS 2016

ESTATSTICA

121

TESTE DA CORRELAO
Para determinar se a correlao estatisticamente
significativa ou no, faz-se um teste de hipteses quanto ao
coeficiente de correlao populacional (). Assim:
H 0: = 0

(no h correlao)

H 1: 0

(h correlao)

Estas hipteses sero testadas mediante o clculo de um t


de Student, definido como:

t calc = t n 2 = r

n2
1 r2

que ser comparado contra tcrit = tn-2;/2.


Se |tcalc| > tcrit  H0 ser rejeitada e pode-se afirmar que a
correlao existe.

ALBERTO W. RAMOS 2016

ESTATSTICA

122

REGRESSO
O objetivo fundamental da regresso descobrir a equao
que relaciona duas (ou mais) variveis, ou seja:

y = f(x1, x2, ... , xk) +

onde:
x1, x2, ... , xk so chamadas de fatores;
f(x1, x2, ... , xk) indica uma funo de vrias variveis;

chamado de erro.
EXEMPLOS

Resposta
Presso
Rendimento
Viscosidade

Variveis
Volume e
Temperatura
Temperatura, Tempo e Quantidade
de Catalisador
Temperatura, Presso, Velocidade e
Vazo

ALBERTO W. RAMOS 2016

ESTATSTICA

123

REGRESSO LINEAR SIMPLES


Admite que uma equao do primeiro grau representa
satisfatoriamente o modelo:

y = 0 + 1.x
como as constantes 0 e 1 so desconhecidas, ento a
equao da reta ser estimada atravs de:

y = b0 + b1.x
onde:
b0 - o intercepto da reta
b1 - a coeficiente angular da reta
y

^
y = b0 + b1x

tg = b1

b0
x

ALBERTO W. RAMOS 2016

ESTATSTICA

124

EXEMPLO
Foi feito um levantamento de diversos modelos de
automveis quanto a potncia do motor (Hp) e o
consumo mdio (km/l).

Carro
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

Potncia
130
81
93
113
90
63
55
102
92
81
103
90
74
73
102
78
100
100

Consumo
10,1
10,5
11,3
10,5
11,6
12,4
15,0
11,3
12,4
12,0
10,9
11,6
12,4
13,1
10,9
12,0
10,5
10,5

ALBERTO W. RAMOS 2016

ESTATSTICA

125

DETERMINAO DA EQUAO DA RETA


A equao da reta determinada a partir dos dados da
tabela anterior, atravs do mtodo dos mnimos quadrados,
utilizando-se as seguintes frmulas:

b1 =

S XY
S XX

onde:

S XY = x i y i

( xi. yi )
n

S XX =

xi2

2
(
xi )

O outro termos obtido atravs de:


_
_
b0 = y - b1.x

ALBERTO W. RAMOS 2016

ESTATSTICA

126

Para facilitar os clculos, usa-se uma tabela auxiliar:


xi2
Potncia Consumo
yi2
xiyi
(xi)
(yi)
16900 102,01 1313,0
10,1
1
130
850,5
6561
110,25
81
10,5
2
106,09
957,9
11,3
8649
3
93
12769 110,25 1186,5
113
10,5
4
134,56 1044,0
11,6
8100
5
90
3969
153,76
781,2
12,4
6
63
825,0
3025
225,00
55
15,0
7
11,3
10404 127,69 1152,6
8
102
8464
153,76 1140,8
92
12,4
9
144,00
972,0
12,0
6561
10
81
10609 118,81 1122,7
103
10,9
11
134,56 1044,0
11,6
8100
12
90
917,6
5476
153,76
74
12,4
13
13,1
14
73
102
10,9
15
12,0
16
78
10,5
100
17
10,5
100
18
TOTAL
1620
208,0
151404 2429,42 18411,9
Carro

SXY =
SXX =
b1 =
b0 =

ALBERTO W. RAMOS 2016

ESTATSTICA

127

Assim sendo, resulta que a reta (de regresso) :

y = 16,504 - 0,055.x

Abaixo mostrado um grfico (diagrama de disperso) com


os pontos e a reta marcados.
15.5

QUILOMETRAGEM

14.5

^
y = 16,504 - 0,055.x

13.5
12.5
11.5
10.5
9.5
40

50

60

70

80

90

100

110

120

130

140

POTNCIA

Qual a melhor estimativa do consumo mdio do carro quando


seu motor tem 90 Hp de potncia?

ALBERTO W. RAMOS 2016

ESTATSTICA

128

COMENTRIOS:
o mtodo dos mnimos quadrados busca traar a melhor
reta atravs dos pontos, ou seja, aquela que torna mnima
a distncia destes reta;
sempre possvel obter a equao de uma reta que passa
por um conjunto de pontos, mas isto no significa que o
modelo seja necessariamente adequado;
para se verificar a adequao do modelo, emprega-se a
anlise de varincia (ANOVA).
recomendvel tambm fazer uma anlise de resduos
para completar a anlise de adequao do modelo.

ALBERTO W. RAMOS 2016

ESTATSTICA

129

ANLISE DE VARINCIA APLICADA


REGRESSO
Para verificar se a regresso linear estatisticamente
significativa, deve-se testar o seguinte conjunto de hipteses:
H 0 : 1 = 0

(no h regresso)

H 1 : 1 0

(h regresso)

Este teste pode ser feito mediante a aplicao do mtodo da


anlise de varincia. Pode-se identificar dois tipos de
varincia diferentes: a total e a residual.
A varincia total estimada atravs de:
n

s2T =

( y i y )2
i =1

n 1

S YY
n 1

A varincia residual (ou em torno da reta de regresso)


estimada atravs de:
n

2
R

s =

(y

y ) 2

i =1

n2

S b1 S XX
= YY
n2

ALBERTO W. RAMOS 2016

ESTATSTICA

130

diferena entre estas duas varincias chama-se de


varincia devido ao modelo de regresso, que estimada
atravs de:
2

b S
s = 1 XX
1
2
M

Se a regresso for significativa, ento a varincia residual (ou


devida ao erro) deve ser pequena quando comparada com a
varincia devida a regresso. Consequentemente, o
quociente das duas varincias (regresso/erro) pode ser
testado mediante um F-Snedecor. Em termos de tabela, este
teste fica:
Fonte

GL

SQ

QM

Fcalc

b12SXX

b12SXX

b1 S XX
sR2

S b1 .S XX
s = YY
n2

Regresso

Erro

n-2

SYY b12SXX

Total

n-1

SYY

2
R

Fcalc ser comparado contra Fcrit = F1; n-2; e se |Fcalc| > Fcrit
 rejeita-se H0

ALBERTO W. RAMOS 2016

ESTATSTICA

131

ANLISE DE RESDUOS
O resduo (ou erro) definido como sendo a diferena entre o
valor observado (y) e o valor previsto pela equao obtida (ychapu). Assim, no exemplo:

Amostra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

x
130
81
93
113
90
63
55
102
92
81
103
90
74
73
102
78
100
100

y
10,1
10,5
11,3
10,5
11,6
12,4
15,0
11,3
12,4
12,0
10,9
11,6
12,4
13,1
10,9
12,0
10,5
10,5

y
9,4
12,0
11,4
10,3
11,6
13,0
13,5
10,9
11,4
12,0
10,8
11,6
12,4
12,5
10,9
12,2
11,0
11,0

ALBERTO W. RAMOS 2016

e = y - y
0,7
-1,5
-1,1
0,2
0
-0,6
1,5
0,4
1,0
0
0,1
0
0
0,6
0
-0,2
-0,5
-0,5

ESTATSTICA

132

Se o modelo (linear) ajustado aos dados for adequado, ento


os resduos devem se apresentar distribudos aleatoriamente
em torno do valor zero, quando marcados num grfico
cartesiano como o abaixo.
2
1.5
1

RESDUO

0.5
0
-0.5
-1
-1.5
-2
9.5

10.5

11.5

12.5

13.5

14.5

15.5

Padres estranhos observados na forma em que os resduos


se distribuem neste grfico podem indicar problemas.

ALBERTO W. RAMOS 2016

ESTATSTICA

133

Papel de
Probabilidade
Normal

ALBERTO W. RAMOS 2016

ESTATSTICA

134

PAPEL DE PROBABILIDADE NORMAL (PPN)

O PPN tem por objetivo verificar graficamente se dados


experimentais aderem distribuio normal.

1o Caso: muitos dados (n> 30)

EXEMPLO
Durao
50 x < 55
55 x < 60
60 x < 65
65 x < 70
70 x < 75
75 x < 80

Quantidade
5
23
36
27
8
1

ALBERTO W. RAMOS 2016

% acumulada
5,0
28,0
64,0
91,0
99,0
100,0

ESTATSTICA

135

ALBERTO W. RAMOS 2016

ESTATSTICA

136

2o Caso: poucos dados (n<30)

EXEMPLO
Valores
-8,75
23,75
-1,75
-6,25
0,75
5,25
-1,25

P=

i (posto)
1
2
3
4
5
6
7

(i 0,5)
x100 %
7

Valor
-8,75
-6,25
-1,75
-1,25
0,75
5,25
23,75

P (percentil)
7,1
21,4
35,7
50,0
64,3
78,6
92,9

ALBERTO W. RAMOS 2016

ESTATSTICA

137

ALBERTO W. RAMOS 2016

ESTATSTICA

138

INTERPRETAO
HISTOGRAMA
NORMAL

ASSIMTRICO A ESQUERDA

ASSIMTRICO A DIREITA

ACHATADO

ALONGADO

BIMODAL

ALBERTO W. RAMOS 2016

PPN

ESTATSTICA

139

Teste QuiQuadrado

ALBERTO W. RAMOS 2016

ESTATSTICA

140

TESTE QUI-QUADRADO
O teste qui-quadrado serve para avaliar se duas variveis
qualitativas (tambm chamadas de categricas) so ou no
independentes entre si.
.

Contnuas
Quantitativas
Discretas
Variveis
Ordinal
Qualitativas
Nominal

Logo, o conjunto de hipteses que est sendo testado :


H0: as variveis so independentes
H1: as variveis so dependentes

ALBERTO W. RAMOS 2016

ESTATSTICA

141

EXEMPLO
Uma amostra de 300 estudantes de uma universidade foi obtida,
e estes foram classificados quanto a :
rea de concentrao
Jornal preferido

: Exatas ; Humanas
: A, B, C, Outros

Obtendo-se os seguintes resultados.


Oij

Jornal A

Jornal B

Jornal C

Outros

Total

Exatas

60

20

90

20

190

Humanas

30

40

30

10

110

Total

90

60

120

30

300

Existem evidncias de que rea de Concentrao e Jornal


Preferido estejam relacionados (dependncia) ?

ALBERTO W. RAMOS 2016

ESTATSTICA

142

As hipteses testadas, neste caso, so:


Ho : rea e Jornal Preferido so independentes
H1 : rea e Jornal Preferido no so independentes
Na amostra havia 190 alunos de Exatas, num total de 300, ou
seja, 190/300 = 0,633 ou 63,3% e, conseqentemente, havia
110/300 = 0,366 ou 36,6% de alunos de Humanas.
Na coluna do Jornal A obteve-se um total de 90 alunos. Logo, se
no houver dependncia entre rea e jornal, espera-se que:
Proporo de Exatas

190
x90 = 57

300

110
x90 = 33
Proporo de Humanas 
300
Analogamente, para as demais colunas, obtem-se os valores
entre parnteses da tabela abaixo.
Oij (Eij)

Jornal A

Jornal B

Jornal C

Outros

Total

Exatas

60(57)

20(38)

90(76)

20(19)

190

Humanas

30(33)

40(22)

30(44)

10(11)

110

Total

90

60

120

30

300

Ou, genericamente:
Eij =
Li = Total da linha i

Li C j
n
Cj = Total da coluna j

ALBERTO W. RAMOS 2016

ESTATSTICA

143

Assim, pode-se obter as diferenas entre o observado (Oij) e o


esperado (Eij ) na tabela, conforme abaixo:
Oij - Eij

Jornal A

Jornal B

Jornal C

Outros

Total

Exatas

+3

-18

+14

+1

Humanas

-3

+18

-14

-1

Total

Define-se como qui-quadrado, estatstica:

2
Exatas
Humanas
Total

2
calc

(Oij Eij )2
Eij

Jornal A

Jornal B

Jornal C

Outros

Total

0,158
0,273
0,431

8,526
14,727
23,254

2,579
4,455
7,033

0,053
0,091
0,144

11,316
19,545
30,861

que, para a deciso, ser comparado contra


2
crtico
= (2L 1)(C 1); = 32;5% = 7,815

como calc >

2
crtico
Rejeito Ho

ALBERTO W. RAMOS 2016

ESTATSTICA

144

BIBLIOGRAFIA

BUSSAB, W. O.; MORETTIN, P. A.


ed. So Paulo, Saraiva, 2004.

Estatstica bsica. 5

COSTA NETO, P. L. O. Estatstica.


Edgard Blucher, 2002.
DOWNING, D.; CLARK, J.
Paulo, Saraiva, 1999.

2 ed. So Paulo,

Estatstica aplicada.

So

FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L.


Estatstica aplicada. So Paulo, Atlas, 1982.
FREUND, J. E.; SIMON, G. A. Estatstica aplicada.
Alegre, Bookman, 2000.
LAREDO, A. Notas de aula do curso de estatstica I.
Paulo, FGV, 1998.

ALBERTO W. RAMOS 2016

Porto
So

Das könnte Ihnen auch gefallen