Sie sind auf Seite 1von 237

ESTATSTICA II 1

ALBERTO W. RAMOS




ESCOLA POLITCNICA DA UNIVERSIDADE DE SO PAULO
DEPARTAMENTO DE ENGENHARIA DE PRODUO









PRO 2711


ESTATSTICA II







Prof. Alberto W. Ramos








SO PAULO, 2010
ESTATSTICA II 2
ALBERTO W. RAMOS



















Reviso do
Clculo de
Probabilidades
ESTATSTICA II 3
ALBERTO W. RAMOS




PROBABILIDADE

FENMENOS
DETERMINSTICOS
PROBABILSTICOS


Definies:

a) Espao Amostral (S): conjunto de todos os resultados
possveis de um fenmeno probabilstico.
Ex.: lanamento de dado S = {1,2,3,4,5,6}

b) Evento (A,B,C,...): qualquer subconjunto de S.
Ex.: P = ponto par = {2,4,6}
I = ponto mpar = {1,3,5}
T = ponto maior que trs = {4,5,6}

Obs.: S = evento certo
= evento impossvel

ESTATSTICA II 4
ALBERTO W. RAMOS


OPERAES COM EVENTOS

a) Evento interseco: B A
Ex.: } 6 , 4 { T P (ambos ocorrem)





b) Evento unio: B A
Ex.: S } 6 , 5 , 4 , 3 , 2 , 1 { I P (pelo menos um ocorre)





c) Evento complementar: A
Ex.: I } 5 , 3 , 1 { P (P no ocorre)





c) Eventos mutuamente exclusivos: B A
Ex.: I P (P e I no ocorrem ao mesmo tempo)



S
A B
A B
S
A B
A B
S
A
A
S
A B
ESTATSTICA II 5
ALBERTO W. RAMOS





DEFINIO DE PROBABILIDADE

um nmero real, associado a um evento, que mede sua
chance de ocorrncia:
n
m
) A ( P
onde:
m o nmero de resultados favorveis a A
n o nmero de resultados possveis, desde que igual-
mente provveis


Observaes:
a) 0 P(E) 1
b) P(AB) = P(A) + P(B) - P(AB)
c) P( A) = 1 - P(A)

ESTATSTICA II 6
ALBERTO W. RAMOS



PROBABILIDADE CONDICIONADA

Notao: P(A/B) probabilidade do evento A, sabendo-se
que o evento B ocorreu
Definio:
P(A/B) =
) B ( P
) B A ( P
, P(B) 0
ou
P(B/A) =
) A ( P
) B A ( P
, P(A) 0
logo:
P(AB) = P(A) . P(B/A) = P(B) . P(A/B)


Se P(A/B) = P(A/ B ) = P(A) o evento A estatisticamente
independente de B P(B/A) = P(B/ A ) = P(B)

Neste Caso:
P(AB) = P(A) . P(B)
ESTATSTICA II 7
ALBERTO W. RAMOS

EXEMPLO

Seja o lanamento de dois dados, com A: dar ponto 1, 2 ou 3
no primeiro dado e B: dar soma 6. Calcular P(A/B) e P(B/A).

2
1
36
18
) A ( P
12
5
36
15
) B ( P
3
1
36
12
) B A ( P


P(A/B) =
5
4
15
12
) B ( P
) B A ( P
12
5
3
1




P(B/A) =
3
2
) A ( P
) B A ( P
2
1
3
1


(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
B
A
S =
AB
ESTATSTICA II 8
ALBERTO W. RAMOS


TEOREMA DA PROBABILIDADE TOTAL
Sejam A
1
, A
2
, ..., A
n
eventos mutuamente exclusivos e
exaustivos (partio) e seja B um evento qualquer de S.



n
1 i
i
n
1 i
i
) B A ( P ) B ( P B A B
U


) A .P(B ) A ( P ) B ( P
i
n
1 i
i
|


(TPT)




TEOREMA DE BAYES
Nas mesmas condies do Teorema da Probabilidade Total.

) B ( P
) B A ( P
) B A ( P
j
j

|

) A B ( P ). A ( P
) A B ( P ). A ( P
) B A ( P
j
n
1 j
j
j j
j
|
|
|

(TB)



S
A
1
A
2
A
3
A
n
A
4
...
B
ESTATSTICA II 9
ALBERTO W. RAMOS















Variveis
Aleatrias
ESTATSTICA II 10
ALBERTO W. RAMOS




VARIVEIS ALEATRIAS UNIDIMENSIONAIS

Uma varivel aleatria (VA) a representao dos eventos
de uma partio de S atravs de nmeros reais.


Exemplos:
a) nmero de caras obtidas no lanamento de trs moedas.
b) soma de pontos obtida no lanamento de dois dados.



A
1
A
2
A
3
p
VA
0
1
Probabilidade em S
Funo VA
Funo Probabilidade
ESTATSTICA II 11
ALBERTO W. RAMOS







TIPOS DE VARIVEIS ALEATRIAS (VA)


Discreta S finito


Contnua S infinito


VA Discretas:

A distribuio de probabilidade representada pela funo
probabilidade, tal que:
a) P(X=x
i
) 0, x
i


b)


i
i
1 ) x X ( P
c)

>
<
b
a x
i
i
) b X a ( P ) x X ( P
VA
ESTATSTICA II 12
ALBERTO W. RAMOS




EXEMPLO

Seja X o nmero de caras (K) obtidas no lanamento de trs
moedas.

'

KKK
CKK
KCK
KKC
CCK
CKC
KCC CCC
S

x
i
0 1 2 3
P(X=x
i
) 1/8 3/8 3/8 1/8


x
i
1
P(X=x
i
)
2 3
3/8
2/8
1/8
0
ESTATSTICA II 13
ALBERTO W. RAMOS




VA Contnuas:

S infinito e a probabilidade de cada resultado individual
zero (mas no teoricamente impossvel). A distribuio de
probabilidade representada pela funo densidade de
probabilidade f
X
(x).

a) f
X
(x) 0
b)

+

1 ) x ( f
X

a)

> <
b
a
X
a b ), b x a ( P ) x ( f






x
f
X
(x)
a
b
P(a<xb)
ESTATSTICA II 14
ALBERTO W. RAMOS







EXEMPLO

Seja uma funo densidade de probabilidade definida como:



a) determinar o valor de K.

b) equacionar esta fdp.


x 1 2
f
X
(x)
K
0
ESTATSTICA II 15
ALBERTO W. RAMOS




FUNO DE REPARTIO OU DE
DISTRIBUIO ACUMULADA

definida por:

+ < < x - ) x X ( P ) x ( F
X


Para VAB discretas tem-se:


a x
i X
i
) x X ( P ) a ( F


Para VAB contnuas tem-se:

a
X X
dx ) x ( f ) a ( F

Propriedades:
a)
0 ) ( F
X


b) 1 ) ( F
X
+
c) ) a ( F ) b ( F ) b X a ( P
Y X
<
ESTATSTICA II 16
ALBERTO W. RAMOS

PARMETROS DE POSIO

Indicam onde se localiza o centro da distribuio.


1) Mdia ou Valor Esperado: (X)

VA Discreta:

) x X ( P . x ) X (
i i


VA Contnua:

dx ) x ( f . x ) X (
X


Propriedades:
a) (K) = K, K = constante
b) (K.X) = K. (X)
c) (X+Y) = (X) + (Y)
d) (X-Y) = (X) - (Y)
e) (XtK) = (X) t K
f) Se X e Y so independentes (X.Y) = (X) . (Y)


2) Mediana: MD

o ponto tal que: P(X<MD) = P(X>MD) = .


3) Moda: M
O


o ponto de mxima probabilidade ou densidade de
probabilidade.

ESTATSTICA II 17
ALBERTO W. RAMOS




PARMETROS DE DISPERSO

Indicam a variabilidade da distribuio de probabilidade.

1) Varincia:
2
(X), V(X)
2 2 2 2
)] X ( [ ) X ( ] ) X [( ) X (
VA Discreta:

1
]
1


i i
2
i
i i i
2
i i
2
i
2
) x X ( P . x ) x X ( P . x ) x X ( P . ) x ( ) X (

VA Contnua:

+

+

+

1
]
1


2
X X
2
X
2 2
dx ) x ( f . x dx ) x ( f . x dx ) x ( f . ) x ( ) X (

Propriedades:
a)
2
(K) = 0, K = constante
b)
2
(K.X) = K
2
.
2
(X)
c) Se X e Y so independentes:

2
(X+Y) =
2
(X) +
2
(Y)

2
(X-Y) =
2
(X) +
2
(Y)
d)
2
(XtK) =
2
(X)
ESTATSTICA II 18
ALBERTO W. RAMOS











2) Desvio-Padro: (X)
) X ( ) X (
2


3) Coeficiente de Variao: CV
) X (
) X (
CV


ESTATSTICA II 19
ALBERTO W. RAMOS


EXEMPLOS

Seja X o nmero de caras (K) obtidas no lanamento de trs
moedas.

x
i
0 1 2 3
P(X=x
i
) 1/8 3/8 3/8 1/8

5 , 1
8
12
8
1
x 3
8
3
x 2
8
3
x 1
8
1
x 0 ) x X ( P . x ) X (
i i
+ + +


+ + +
i
2 2 2 2
i
2
i
3
8
24
8
1
x 3
8
3
x 2
8
3
x 1
8
1
x 0 ) x X ( P . x

( ) 75 , 0 5 , 1 3 ) x X ( P . x ) x X ( P . x ) X (
2
i
2
i
i i i
2
i
2

1
]
1




x
i
1
P(X=x
i
)
2 3
3/8
2/8
1/8
0
ESTATSTICA II 20
ALBERTO W. RAMOS







EXEMPLO

Seja uma funo densidade de probabilidade definida como:



Determinar a mdia (X) e a varincia
2
(X).


x 1 2
f
X
(x)
K
0
ESTATSTICA II 21
ALBERTO W. RAMOS





VARIVEIS ALEATRIAS BIDIMENSIONAIS
(VAB)

VAB Discretas

A distribuio fica caracterizada pela funo probabilidade, tal
que:
a) j i, 0 ) y Y ; x X ( P
j i

b)


j
j i
i
1 ) y Y ; x X ( P


VAB Contnuas

Neste caso, tem-se a funo densidade de probabilidade
conjunta, tal que:
a) 0 ) y , x ( f
XY

b)

+

+

1 dxdy ) y , x ( f
XY

ESTATSTICA II 22
ALBERTO W. RAMOS


EXEMPLOS

Sejam dois dados viciados, com X o ponto obtido no 1
o

dado e Y, o ponto no 2
o
dado

x
i
P(X=x
i
) y
j
P(Y=y
j
)
1 1/21 1 1/12
2 2/21 2 2/12
3 3/21 3 3/12
4 4/21 4 3/12
5 5/21 5 2/12
6 6/21 6 1/12


A funo probabilidade fica:

X Y 1 2 3 4 5 6 Total
1 1/252 2 3 3 2 1 1/21
2 2/252 4 6 6 4 2 2/21
3 3/252 6 9 9 6 3 3/21
4 4/252 8 12 12 8 4 4/21
5 5/252 10 15 15 10 5 5/21
6 6/252 12 18 18 12 6 6/21
Total 1/12 2/12 3/12 3/12 2/12 1/12 1

ESTATSTICA II 23
ALBERTO W. RAMOS



Seja

2 y x 1, x 0 y kx ) y , x ( f
2
XY
+

Determinar o valor de k.

1
2
1 x
y



( )
4
15
k 1
15
k 4
dx x x 4 4 x
2
k
dx
2
y x
k 1 ydy kx dx
2
1
0
2
x 2
0
x 2
0
1
0
2 2
2
1
0
+



ESTATSTICA II 24
ALBERTO W. RAMOS



FUNO DE REPARTIO OU DE
DISTRIBUIO ACUMULADA
BIDIMENSIONAL

definida por:

+ + < < + < < y - , x - ) y Y , x X ( P ) y , x ( F
XY


Para VAB discretas tem-se:



a x b y
j i XY
i j
) y Y ; x X ( P ) b , a ( F

Para VAB contnuas tem-se:

a b
XY XY
dy ) y , x ( f dx ) b , a ( F
Propriedades:
a) 0 ) , ( F
XY

d) 1 ) , ( F
XY
+ +
e) ) x ( F ) , x ( F
x XY
+
f) ) y ( F ) y , ( F
Y XY
+
g)
) c , a ( F ) c , b ( F
) d , a ( F ) d , b ( F ) d Y c ; b X a ( P
XY XY
XY XY
+
< <

h) Se X e Y so independentes F
XY
(x,y) = F
X
(x).F
Y
(y)
ESTATSTICA II 25
ALBERTO W. RAMOS





DISTRIBUIES MARGINAIS

Se quisermos saber a distribuio de probabilidade de uma
VAB, independentemente da outra, diremos que esta a sua
distribuio marginal.

Caso discreto
i ) y Y ; x X ( P ) x X ( P
j
j
i i




i
j i j
j ) y Y ; x X ( P ) y Y ( P

Caso contnuo

+

dy ) y , x ( f ) x ( f
XY X

+

dx ) y , x ( f ) y ( f
XY Y


ESTATSTICA II 26
ALBERTO W. RAMOS



EXEMPLOS

1) No caso dos dados viciados, a distribuio marginal do 1
o

dado :

x
i
P(X=x
i
)
1 1/21
2 2/21
3 3/21
4 4/21
5 5/21
6 6/21


2) Seja:
2 y 0 1, x 0 y kx ) y , x ( f
2
XY


1 x 0 kx 2
2
y x
k ydy kx ) x ( f
2
2
0
2
0
2 2
2
X




ESTATSTICA II 27
ALBERTO W. RAMOS





DISTRIBUIES CONDICIONADAS

Caso discreto
i
) y Y ( P
) y Y ; x X ( P
) y / x X ( P
0
0 i
0 i




j
) x X ( P
) y Y ; x X ( P
) x / y Y ( P
0
j 0
0 j




Caso contnuo
) y ( f
) y , x ( f
) y / x ( f
0 Y
0 XY
0 X


) x ( f
) y , x ( f
) x / y ( f
0 X
0 XY
0 Y



ESTATSTICA II 28
ALBERTO W. RAMOS


EXEMPLOS

1) Dados viciados, para Y=3 tem-se que P(Y=3) = 3/12 e

x
i
P(X=x
i
/3)
1 1/21
2 2/21
3 3/21
4 4/21
5 5/21
6 6/21

2) Seja
2 y 0 1, x 0 y kx ) y , x ( f
2
XY


determinar f
Y
(y/1).

Para X=1 f
XY
(1,y) = ky

f
X
(1) = 2k

logo:
2
y
k 2
ky
) 1 / y ( f
Y

ESTATSTICA II 29
ALBERTO W. RAMOS






VAB INDEPENDENTES


Se X e Y so independentes entre si, ento:

j i, ) y Y ( P ). x X ( P ) y Y ; x X ( P
j i j i


j i, ) y ( f ). x ( f ) y , x ( f
Y x XY




A distribuio de probabilidades das VAB igual ao
produtos das distribuies marginais.


ESTATSTICA II 30
ALBERTO W. RAMOS




COVARINCIA

A covarincia entre duas VA definida como sendo:

( )( ) [ ] ) Y ( Y ) X ( X ) Y , X ( COV

Caso discreto
( ) ( )


i j
j i j i
) y Y , x X ( P . ) Y ( y . ) X ( x ) Y , X ( COV

Caso contnuo
( ) ( )

+

+

dxdy ) y , x ( f . ) Y ( y . ) X ( x ) Y , X ( COV
XY j i


TEO: COV(X,Y) = (XY)-(X).(Y)

onde


i j
j i j i
) y Y ; x X ( P . y . x ) XY (
ou
dxdy ) y , x ( f . y . x ) XY (
XY

+

+


ESTATSTICA II 31
ALBERTO W. RAMOS








COEFICIENTE DE CORRELAO

) Y ( ). X (
) Y , X ( COV



TEO: 1 1 +

Observaes:
a) Se h independncia COV(X,Y) = 0 = 0
b) Se > 0, quando X aumenta, Y aumenta
c) Se < 0, quando X aumenta, Y diminui

ESTATSTICA II 32
ALBERTO W. RAMOS




MDIA CONDICIONADA

Caso discreto
) y / x X ( P . x ) y / X (
i
j i i j



Caso contnuo

+

dx ) y / x ( f . x ) y / X (
X




VARINCIA

Se X e Y no so independentes entre si, ento:

2
(X+Y) =
2
(X) +
2
(Y) + 2.COV(XY)

2
(X-Y) =
2
(X) +
2
(Y) 2.COV(XY)



ESTATSTICA II 33
ALBERTO W. RAMOS










Distribuies
Discretas de
Probabilidade
ESTATSTICA II 34
ALBERTO W. RAMOS


DISTRIBUIO DE BERNOULLI
Seja uma prova que s possa ter dois resultados:

fracasso X = 0



sucesso X = 1

com X = nmero de sucessos (0 ou 1)

x
i
0 1
P(X = x
i
) 1-p p


p p 1 ) p 1 ( 0 ) X ( +

p p 1 ) p 1 ( 0 ) X (
2 2 2
+

) p 1 ( p p p )] X ( [ ) X ( ) X (
2 2 2 2

1-p
p
x
i
P(X=x
i
)
p
1-p
0 1
ESTATSTICA II 35
ALBERTO W. RAMOS








DISTRIBUIO BINOMIAL

So realizadas n provas independentes de Bernoulli, todas
com a mesma probabilidade de sucesso p.

Seja:

X = nmero de sucessos nas n provas = 0, 1, 2,...

x n x
d , n
) p 1 .( p . C ) x X ( P




p . n ) X (

) p 1 .( p . n ) X (
2


ESTATSTICA II 36
ALBERTO W. RAMOS








DISTRIBUIO DE POISSON

Seja:

X = nmero de sucessos em um intervalo de observao
contnuo t = 0, 1, 2,...
= freqncia mdia de sucessos no fenmeno (constante)


! x
) t .( e
) x X ( P
x t






t ) X (

t ) X (
2


ESTATSTICA II 37
ALBERTO W. RAMOS





DISTRIBUIO HIPERGEOMTRICA

So realizadas n provas com
X = nmero de sucessos nas n provas
N = tamanho da populao
S = nmero de elementos favorveis (sucesso)

inteiro x ,
n
N
x n
S N
x
S
) x X ( P
i
i i
i

,
_

,
_

,
_



com
( ) ( ) n , S min x s N n , 0 max
i
+

fazendo-se p = S/N

1 N
n N
). p 1 ( p . n ) X (
p . n ) X (
2





ESTATSTICA II 38
ALBERTO W. RAMOS



DISTRIBUIO GEOMTRICA

So realizadas tantas provas de Bernoulli quantas forem
necessrias, at se obter o 1
o
sucesso.

Seja:
X = o nmero de provas necessrias para obter o 1
o
sucesso

Nesta Situao, deve-se ter somente fracassos nas (x
i
-1)
primeiras provas. Logo:

,... 4 , 3 , 2 , 1 x p . ) p 1 ( ) x X ( P
i
1 x
i
i




2
2
p
p 1
) X (
p
1
) X (





Obs.: Esta distribuio no tem memria, ou seja
P(X=s+t/X>s) = P(X=t)

ESTATSTICA II 39
ALBERTO W. RAMOS



DISTRIBUIO DE PASCAL

So realizadas tantas provas de Bernoulli quantas forem
necessrias, at se obter o s-simo sucesso.

Seja:
X = nmero de provas necessrias at o s-simo sucesso

Nesta Situao, deve-se ter (s-1) sucessos nas (x
i
-1)
primeiras provas. Logo:

2,... s 1, s s, x ) p 1 .( p .
1 s
1 x

p . ) p 1 .( p .
1 s
1 x
) x X ( P
s x s
i
s x 1 s
i
i
i
i
+ +

,
_

,
_




2
2
p
) p 1 ( s
) X (
p
s
) X (





Obs.: a distribuio geomtrica a Pascal para s=1
ESTATSTICA II 40
ALBERTO W. RAMOS





DISTRIBUIO MULTINOMIAL

So realizadas n provas independentes, cada uma com um
nico dentre r possveis resultados e, as probabilidades p
i
de
ocorrncia de um determinado resultado so constantes.

r 2 1
x
r
x
2
x
1
r 2 1
i i
p .... p . p
! x !... x ! x
n!
1,2,3,...) i , x X ( P

com


i
i
i
i
1 p n x

) p 1 .( p . n ) X (
p . n ) X (
i i
2
i




Obs.: as distribuies marginais de x
i
so binomiais.


ESTATSTICA II 41
ALBERTO W. RAMOS











Distribuies
Contnuas de
Probabilidade

ESTATSTICA II 42
ALBERTO W. RAMOS




DISTRIBUIO UNIFORME

Seja X uma varivel aleatria tal que:
b x a
a b
1
) x ( f
X



5,0 4,5 4,0 3,5 3,0 2,5 2,0
1,0
0,8
0,6
0,4
0,2
0,0
X
f
(
x
)
a=2 b=5


2 2
) a b (
12
1
) X (
2
b a
) X (

+



ESTATSTICA II 43
ALBERTO W. RAMOS


DISTRIBUIO EXPONENCIAL
Seja T o intervalo decorrido entre dois sucessos consecutivos
de um fenmeno de Poisson, com parmetro :

t
e ) 0 X ( P



P(X=0) a probabilidade de nenhum sucesso no intervalo de
observao t. Significa tambm a probabilidade do primeiro
sucesso levar mais do que t para ocorrer.

t
e ) t T ( P ) 0 X ( P

>

t
T
e 1 ) t ( F ) t T ( P



t
T T
e ) t ( F
dt
d
) t ( f

, t 0
8 7 6 5 4 3 2 1 0
1,0
0,8
0,6
0,4
0,2
0,0
X
f
(
x
)
=1


1
) T ( e
2
2
1
) T (


ESTATSTICA II 44
ALBERTO W. RAMOS

DISTRIBUIO NORMAL (OU DE GAUSS)
Seja X uma varivel aleatria contnua com a seguinte
distribuio:

1
1
]
1

,
_

2
X
x
2
1
exp
2
1
) x ( f , - < x < +

110 105 100 95 90
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
X
f
(
x
)


Esta distribuio tem mdia e varincia:

) X ( e
2 2
) X (

Obs.: a) exp z = e
z
b) comum escrever-se: X N(;
2
)

ESTATSTICA II 45
ALBERTO W. RAMOS
DISTRIBUIO NORMAL REDUZIDA
(OU PADRONIZADA)

Seja X uma varivel aleatria tal que X N(;
2
) e seja Z
definida como:

x
z

Ento: Z N(0;1), com:

3 2 1 0 -1 -2 -3
0,4
0,3
0,2
0,1
0,0
z
f
(
z
)

0 ) Z ( e 1 ) Z (
2



Obs.: a) ) z z 0 ( P ) x x ( P
0 0


b)

,
_

,
_



x x
Z P ) x X ( P

ESTATSTICA II 46
ALBERTO W. RAMOS


TABELA DA DISTRIBUIO NORMAL
valores de P(0 < Z < z
0
)


z
0
0 1 2 3 4 5 6 7 8 9
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3685 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

FONTE: COSTA NETO, P.L.O. Estatstica. So Paulo, Edgard Blucher, 1978.

ESTATSTICA II 47
ALBERTO W. RAMOS


DISTRIBUIO NORMAL TRUNCADA

Diz-se que uma distribuio normal truncada quando ela
no possui uma ou ambas as caudas.

110 105 100 95 90
0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
X
f
(
x
)

Uma distribuio truncada nada mais do que uma
distribuio condicionada, ou seja, no caso da figura acima:


) 104 X / 104 X ( P < < <



Tanto como o da distribuio normal completa so
afetados pelo truncamento.
ESTATSTICA II 48
ALBERTO W. RAMOS



DISTRIBUIO NORMAL BIVARIADA

Uma distribuio normal dita bivariada se a sua fdp :


1
1
]
1

'

,
_

,
_

,
_

,
_

2
Y
Y
Y
Y
X
X
2
X
X
2
2
Y X
XY
y y x
2
x
) 1 ( 2
1
exp x
x
1 2
1
) y , x ( f


< < X < < Y
1 1 < <




ESTATSTICA II 49
ALBERTO W. RAMOS





Dependendo do valor de , a base da normal bivariada
modifica-se:


!
[ [
\
[
\






ESTATSTICA II 50
ALBERTO W. RAMOS

DISTRIBUIO GAMA
Seja T o intervalo decorrido entre s sucessos consecutivos de
um fenmeno de Poisson com parmetro :

P(X=0) + P(X=1) + P(x=2) + ... + P(X=s-1)

a probabilidade de ocorrerem menos do que s sucessos no
intervalo de observao t. , tambm, a probabilidade do s-
simo sucesso levar mais do que t para ocorrer.

>
1 s
0 x
i
t x
i
i
! x
e ) t (
) t T ( P


1 s
0 x
i
t x
T
i
i
! x
e ) t (
1 ) t ( F ) t T ( P

0 t , e . t .
)! 1 s (
) t ( F
dt
d
) t ( f
t 1 s
s
T T




10 8 6 4 2 0
1,0
0,8
0,6
0,4
0,2
0,0
X
f
(
x
)
s=1
s=2
s=3

2
2
s
) T (
s
) T (



ESTATSTICA II 51
ALBERTO W. RAMOS






Observaes:
a) Para s=1 a distribuio gama torna-se a exponencial;
b) Escreve-se (s-1)! como (s);
c) (s+1) = s.(s);
d) Uma funo gama definida como sendo:

0 t , dx . e . x ) t (
x
0
1 t
>



e) Para n inteiro

,
_

+
n
2
) 1 n 2 ...( 5 . 3 . 1
2
1
n

f)

,
_

2
1
(por definio)
g) A distribuio gama no tem memria
h) Se Y = X
1
+ X
2
+ ... + X
n
, com cada X
i
sendo uma varivel
independente Gama de parmetros s e , ento:

2
2
s
n ) Y ( e
s
n ) Y (






ESTATSTICA II 52
ALBERTO W. RAMOS


DISTRIBUIO BETA
Sejam X
1
e X
2
duas variveis com distribuio gama, de
parmetros s
1
e e s
2
e , respectivamente, e seja Y definida
como:

2 1
1
X X
X
Y
+



ento Y ter distribuio beta com:

0 s e 0 s 1 y 0 ) y 1 ( y
) s ( ) s (
) s s (
) y ( f
2 1
1 s 1 s
2 1
2 1
Y
2 1
> > < <

+


1,0 0,8 0,6 0,4 0,2 0,0
3,0
2,5
2,0
1,5
1,0
0,5
0,0
X
f
(
x
)
s1=s2=0,5
s1=s2=5
s1=s2=1
s1=s2=1,5
s2=5
s1=1,5
s2=1,5
s1=5

) 1 s s ( ) s s (
s s
) Y (

s s
s
) Y (
2 1
2
2 1
2 1
2
2 1
1
+ + +

+


ESTATSTICA II 53
ALBERTO W. RAMOS



Observaes:
a) A distribuio Beta limitada inferior e superiormente e,
portanto, til quando h situaes em que ocorre um
valor mximo e um mnimo para a varivel.
b) Se s
1
= s
2
= 1, a distribuio Beta vira uma distribuio
uniforme no intervalo de 0 a 1.
c) A quantidade
) s s (
) s ( ) s (
2 1
2 1
+

tambm chamada de funo
Beta, ou seja, B(s
1
, s
2
).
d)



1
0
1 s 1 s
2 1
dy ) y 1 ( y ) s , s ( B
2 1
, ou seja, a funo Beta
apenas um ajuste para que a integral da distribuio Beta
seja igual a 1.
e) Para a distribuio Beta ser valida no intervalo entre a e
b, adotar a seguinte transformao:

0 s e 0 s b y a
a b
y b
a b
a y
) s ( ) s (
) s s (
a b
1
) y ( f
2 1
1 s 1 s
2 1
2 1
Y
2 1
> > < <

,
_

,
_



e neste caso

) 1 s s ( ) s s (
s s ) a b (
) Y (

s s
s
). a b ( a ) Y (
2 1
2
2 1
2 1
2
2
2 1
1
+ + +

,
_

+
+


f) Se a = 0 e b =1, na expresso anterior, retorna-se ao
caso da distribuio Beta padro, ou seja, no intervalo de
0 a 1.


ESTATSTICA II 54
ALBERTO W. RAMOS


DISTRIBUIO LOGNORMAL

Seja X uma varivel aleatria tal que X~N(,
2
) e seja Y
definida como:

Y = e
X


Demonstra-se que Y tem distribuio lognormal com:

+ < <
1
]
1


y 0 ,
y ln
2
1
exp
2 y
1
) y ( f
2
Y

8 7 6 5 4 3 2 1 0
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
X
f
(
x
)

( ) ( )
2 2 2
2
2 exp 2 2 exp ) Y (
2
exp ) Y (
+ +

,
_


+



Para trabalhar com esta distribuio, basta tomar logaritmo
natural de Y, pois estes valores tero distribuio normal.


ESTATSTICA II 55
ALBERTO W. RAMOS















Teoria da
Confiabilidade









ESTATSTICA II 56
ALBERTO W. RAMOS



CONFIABILIDADE


a probabilidade de um sistema desempenhar
satisfatoriamente a sua misso, (ou seja, sem falhar) durante
um certo tempo e sob determinadas condies de operao
ou uso.
16 14 12 10 8 6 4 2 0
0,20
0,15
0,10
0,05
0,00
X
f
(
x
)
P(T > 6)

Conceitos importantes envolvidos nesta definio:

Probabilidade
Sistema
Misso
Tempo de Uso
Condies de Uso


ESTATSTICA II 57
ALBERTO W. RAMOS



FUNO DE CONFIABILIDADE

>
0
t
0
T 0 T 0 0 0
dt ) t ( f 1 ) t ( F 1 ) t T ( P 1 ) t T ( P ) t ( R

onde:

R(t
0
) = funo de confiabilidade

f
T
(t) = funo densidade de probabilidade

F
T
(t) = funo de repartio ou de distribuio acumulada





VIDA MDIA




0 0
dt ) t ( R dt ) t ( f . t ) T (

Existem dois casos a considerar:

sistemas reparveis Tempo Mdio Entre Falhas
(TMEF).
sistemas no-reparveis: Tempo Mdio Para Falha
(TMPF)


ESTATSTICA II 58
ALBERTO W. RAMOS


TAXA DE FALHAS

A probabilidade de um sistema falhar entre t
1
e t
2
dado por:


2
1
t
t
T 2 1
dt ) t ( f ] t T t [ P


A probabilidade de um sistema falhar no intervalo [t, t
1
], dado
que ele sobreviveu entre [0, t] :

) t ( R
) t ( F ) t ( F
] t T [ P
] t T t [ P
] t T [ P
)] t T ( ) t T t [( P
] t T | t T t [ P
T 1 T 1 1
1

>

>
>
>


Se substituirmos t
1
por t + t e dividirmos ambos lados da
expresso anterior por t, fazendo o limite de t 0

) t ( Z
) t ( R
) t ( f
t
) t ( F ) t t ( F
lim
) t ( R
1
t
] t T | t T t [ P
lim
T T T
0 t
1
0 t

>



Z(t) a probabilidade de falha no instante imediatamente
posterior a t, dado que o sistema no falhou antes de t.


EXEMPLO

A taxa de falhas de um produto, para 1000 horas, 0,01%.


Dentre as unidades funcionando na hora 1000,
haver 0,01% delas falhando neste instante.


ESTATSTICA II 59
ALBERTO W. RAMOS


CURVA DE VIDA
t
Z(t)
Vida til
Mortalidade
Infantil
Desgaste


No perodo de mortalidade infantil, a taxa de falhas
decresce em funo do tempo;
No perodo de vida til, a taxa de falhas mantm-se
aproximadamente constante;
No perodo de desgaste, a taxa de falhas cresce com o
tempo.



Em cada perodo, h uma ou mais distribuies de
probabilidade adequada representao da confiabilidade.

ESTATSTICA II 60
ALBERTO W. RAMOS



DISTRIBUIO EXPONENCIAL

0 t , e . ) t ( f
t
T




onde:
parmetro de escala (freqncia mdia de sucessos da
distribuio de Poisson).

8 7 6 5 4 3 2 1 0
1,0
0,8
0,6
0,4
0,2
0,0
X
f
(
x
)
=1
=2
=1, 5


1
) T (
2
2
1
) T (



ESTATSTICA II 61
ALBERTO W. RAMOS





DISTRIBUIO NORMAL (OU DE GAUSS)

1
]
1

,
_

2
T
t
2
1
exp
2
1
) t ( f , - < t < +

20 15 10 5 0
0,4
0,3
0,2
0,1
0,0
X
f
(
x
)
=1
=2
=3

Esta distribuio tem mdia e varincia:

) T (

2 2
) T (



ESTATSTICA II 62
ALBERTO W. RAMOS



DISTRIBUIO DE WEIBULL

0 0, 0, 0, t , e . ) t .( . ) t ( f
) t ( 1
T
> > >




onde:
parmetro de escala;
parmetro de forma;
parmetro de localizao (t 0).

5 4 3 2 1 0
1,2
1,0
0,8
0,6
0,4
0,2
0,0
X
f
(
x
)
=1
=2
=3

'

1
]
1

,
_


,
_


+
,
_

2
2
2
1
1
1
1
2
) T (
1
1
) T (


ESTATSTICA II 63
ALBERTO W. RAMOS









DISTRIBUIO DE WEIBULL II

Por vezes, nos livros, encontra-se alternativamente a
seguinte expresso para a distribuio Weibull:

0 0, 0, 0, t e
t
) t ( f
t
1
T
> > >

,
_

1
1
]
1

,
_



onde:

vida caracterstica =

1


ESTATSTICA II 64
ALBERTO W. RAMOS


EMPREGO DAS DISTRIBUIES
R(t) Z(t)
R(t) Z(t)
R(t) Z(t)

e
-t
1
1


ESTATSTICA II 65
ALBERTO W. RAMOS


EXERCCIO


Determinar R(t) e Z(t) para as distribuies exponencial,
normal e Weibull.



ESTATSTICA II 66
ALBERTO W. RAMOS










PAPIS DE PROBABILIDADE

Os papis de probabilidade so testes de aderncia grfica,
ou seja, servem para verificar se um dado conjunto de dados
adequadamente representado por uma certa distribuio de
probabilidade.

No caso de confiabilidade, trs papis so costumeiramente
empregados:

papel de probabilidade normal

papel de probabilidade Weibull
ESTATSTICA II 67
ALBERTO W. RAMOS






PAPEL DE PROBABILIDADE NORMAL (PPN)


O PPN tem por objetivo verificar se os valores de uma
determinada varivel seguem a distribuio normal



1
o
Caso: muitos dados (n > 30)


EXEMPLO

DURAO
QUANTIDADE
% ACUMULADA
600 x 500
500 x 400
400 x 300
300 x 200
200 x 100
100 x 0
<
<
<
<
<
<

5
23
36
27
8
1
5,0
28,0
64,0
91,0
99,0
100,0


ESTATSTICA II 68
ALBERTO W. RAMOS

ESTATSTICA II 69
ALBERTO W. RAMOS




2
o
Caso: poucos dados (n < 30)



EXEMPLO

Valores
97,8
102,3
100,4
95,2
105,1
98,4
101,6


% 100 x
4 , 0 n
3 , 0 i
P
+





i (posto) Valor P
1
2
3
4
5
6
7
95,2
97,8
98,4
100,4
101,6
102,3
105,1
9,5
23,0
36,5
50,0
63,5
77,0
90,5

ESTATSTICA II 70
ALBERTO W. RAMOS

ESTATSTICA II 71
ALBERTO W. RAMOS




INTERPRETAO

HISTOGRAMA


PPN
NORMAL




ASSIMTRICO A ESQUERDA




ASSIMTRICO A DIREITA




ACHATADO




ALONGADO




BIMODAL





ESTATSTICA II 72
ALBERTO W. RAMOS






PAPEL DE PROBABILIDADE WEIBULL (PPW)

similar ao PPN, porm presta-se para verificar se
os valores de uma determinada varivel seguem a
distribuio Weibull




1
o
Caso: muitos dados (n > 30)



EXEMPLO

DURAO QUANTIDADE % ACUMULADA
25 x 0 <
50 x 25 <
75 x 50 <
100 x 75 <
125 x 100 <
150 x 125 <
175 x 150 <
200 x 175 <
110
215
225
195
130
65
30
30
11,0
32,5
55,0
74,5
87,5
94,0
97,0
100,0





ESTATSTICA II 73

ALBERTO W. RAMOS

1
0
0
,
0
9
0
,
0
8
0
,
0
7
0
,
0
6
0
,
0
5
0
,
0
4
0
,
0
3
0
,
0
2
0
,
0
1
0
,
0
9
,
0
8
,
0
7
,
0
6
,
0
5
,
0
4
,
0
3
,
0
2
,
0
1
,
0
0
,
9
0
,
8
0
,
7
0
,
6
0
,
5
0
,
4
0
,
3
0
,
2
0
,
1
99
95
90
80
70
60
50
40
30
25
20
15
10
5
4
3
2
1,5
1
0,5
0,4
0,3
0,2
0,15
0,1
F
(
t
)

=

%

A
c
u
m
u
l
a
d
a
Papel de Probabilidade Weibull
B
=
l
n

l
n
(
1
/
(
1
-
F
(
t
)
)
)
A = ln(t- )
0
0

ESTATSTICA II 74

ALBERTO W. RAMOS









2
o
Caso: poucos dados (n < 30)


% 100 x
4 , 0 n
3 , 0 i
P
+




i (posto) Valor P
1
2
3
4
5
6
7
8
9
10
7,6
35,4
52,4
82,1
93,7
131,9
137,7
269,1
300,4
396,2
6,7
16,3
26,0
35,6
45,2
54,8
64,4
74,0
83,7
93,3


ESTATSTICA II 75

ALBERTO W. RAMOS

1
0
0
,
0
9
0
,
0
8
0
,
0
7
0
,
0
6
0
,
0
5
0
,
0
4
0
,
0
3
0
,
0
2
0
,
0
1
0
,
0
9
,
0
8
,
0
7
,
0
6
,
0
5
,
0
4
,
0
3
,
0
2
,
0
1
,
0
0
,
9
0
,
8
0
,
7
0
,
6
0
,
5
0
,
4
0
,
3
0
,
2
0
,
1
99
95
90
80
70
60
50
40
30
25
20
15
10
5
4
3
2
1,5
1
0,5
0,4
0,3
0,2
0,15
0,1
F
(
t
)

=

%

A
c
u
m
u
l
a
d
a
Papel de Probabilidade Weibull
B
=
l
n

l
n
(
1
/
(
1
-
F
(
t
)
)
)
A = ln(t- )
0
0
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

ENSAIOS DE CONFIABILIDADE

Existem, basicamente, os seguintes tipos de ensaio:
a) Ensaios Completos: o ensaio encerrado somente
quando a ltima unidade falhar



b) Ensaios Suspensos ou Censurados: o ensaio
interrompido quando uma certa quantidade de unidades
falhar, ou aps certo tempo decorrido.

7HPSR
8 QL
GDGH
W

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS








c) Ensaios de Morte Sbita: o ensaio suspenso aps a
falha da primeira unidade do grupo em avaliao




d) Ensaios Acelerados: o ensaio executado em uma
condio mais severa do que a sua condio normal de
uso.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS







ENSAIOS COM DADOS COMPLETOS

Neste tipo de ensaio, ele somente interrompido quando
todas as unidades falharem.


Existem dois casos a considerar:

a) Dados Agrupados: isto normalmente ocorre quando se
possui uma grande quantidade de unidades em ensaio
(n>30).

b) Dados No-agrupados: neta situao h poucas
unidades disponveis (n<30).




Em ambos os casos pode-se empregar o papel de
probabilidade Weibull, conforme mostrado anteriormente.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

ENSAIOS SUSPENSOS OU CENSURADOS

Neste caso no h dados completos, pois se busca reduzir
o tempo para avaliar os resultados mais rapidamente.
Normal mente, h poucas unidades em ensaio.

Os ensaios podem ser suspensos de duas formas distintas:

a) Por atingir um certo tempo ou porque certa quantidade
pr-estabelecida de itens falhou (censura simples);

b) Pois certas unidades so retiradas antes de atingir o
tempo ou quantidade especificados (censura mltipla).



Censura esquerda (a): quando a unidade j est
funcionando antes do incio do ensaio;

Censura direita (b e c): quando a unidade removida
do ensaio antes de falhar ou, ento, ainda est
funcionando quando o ensaio interrompido;

Censura por intervalo (d): quando a unidade falha em
um intervalo particular do ensaio.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS






EXEMPLO CENSURA SIMPLES

20 unidades foram colocadas em ensaio. Quando haviam
decorrido 500 horas, o ensaio foi suspenso. Os dados
encontram-se a seguir:

% 100 x
4 , 20
3 , 0 i
Acumulada %




Posto (i) Durao (h) % Acumulada
1 54 3,4
2 187 8,3
3 216 13,2
4 240 18,1
5 244 23
6 335 27,9
7 361 32,8
8 373 37,7
9 375 42,6
10 386 47,5

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS
10000 1000 100 10
99,99
95
80
50
20
5
2
1
Horas
%

A
c
u
m
u
l
a
d
a



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



EXEMPLO CENSURA MLTIPLA


Suponho que 5 unidades tenham sido postas em ensaio.
Contudo, quando se atingiu 200 horas a unidade 2 foi
retirada, conforme apresentam os dados abaixo:

Unidade
Tempo da
Falha (h)
Situao
1 120 F1
2 200 S
3 225 F2
4 350 F3
5 480 F4

A unidade 2, que teve seu ensaio suspenso, poderia estar
no posto 2, 3, 4 ou 5 se fosse feito um ensaio completo.

Situaes possveis a considerar

Posto F2 F3 F4
2 3 4 5
3 2 4 5
4 2 3 5
5 2 3 4
Soma 9 14 19
Posto
Mdio
2,25 3,5 4,75

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS
EXEMPLO CENSURA MLTIPLA

Para evitar a anlise de todas as possibilidades de posto para a unidade suspensa, emprega-se a
seguinte frmula:

suspensa unidade da alm unidades de nmero 1
i ) 1 n (
Incremento
1 i
t
+
+




onde i
ti-1
ordem do posto anterior e incremento i i
1 i i
t t
+



Posto (i) Durao (t
i
) F/S Incremento i
ti
% Acumulada
1 150 F1 1 1 6,1
2 340 S1
3 560 F2 (11-1)/(1+8)=1,111 1+1,111=2,111 17,4
4 800 F3 2,111+1,111=3,222 28,1
5 1130 S2
6 1720 F4 (11-3,222)/(1+5)=1,2963 3,222+1,2963=4,518 40,6
7 2470 S3
8 4210 S4
9 5230 F5 (11-4,518)/(1+2)=2,160 4,518+2,160=6,679 61,3
10 6890 F6 6,679+2,160=8,839 82,1
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS
100000 10000 1000 100 10
99
90
80
70
60
50
40
30
20
10
5
3
2
1
Horas
%

A
c
u
m
u
l
a
d
a

ESTATSTICA II 85

ALBERTO W. RAMOS


ENSAIOS DE MORTE SBITA

O objetivo maior deste tipo reduzir o tempo total de ensaio
e, conseqentemente, o seu custo. Embora seja bastante
popular nas empresas, possui limitaes quanto baixa
preciso que as estimativas costumam possuir.

1. Formar g grupos com n unidades cada um;
O nmero de unidades em cada grupo deve ser igual;
Quanto mais unidades forem testadas at a falha,
mais precisa ser a anlise dos resultados.

2. Colocar as n unidades do grupo em ensaio;

3. Quando a primeira unidade do grupo falhar, o ensaio do
restante do grupo suspenso;

4. Uma vez que o ensaio de todos os grupos tenha sido
completado, os tempos so marcados num papel de
probabilidade Weibull;
Somente o tempo at a falha da unidade mais fraca
do grupo considerado na anlise;
O tempo das unidades suspensas no interfere na
anlise.

5. Traar uma linha atravs dos pontos marcados;
Esta linha chamada de linha de morte sbita;
Ela representa a populao das primeiras falhas no
grupo de tamanho (n).

6. Outra linha, representando a populao traada paralela
linha de morte sbita, cuja distncia determinada pelo
posto mediano (% acumulada) e o nmero de unidades (n)
em cada grupo.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




EXEMPLO - MORTE SBITA

40 unidades foram selecionadas para ensaio por morte
sbita. Elas foram divididas em 8 grupos, cada um com 5
unidades. Os resultados so apresentados a seguir.

Grupo
Unidade que
Falhou
Tempo da
Falha (h)
1 2 120
2 5 200
3 2 185
4 3 55
5 4 265
6 4 90
7 2 300
8 1 155


Posto
Tempo da
Falha (h)
%
Acumulada
1 55 8,3
2 90 20,2
3 120 32,1
4 155 44,0
5 185 56,0
6 200 67,9
7 265 79,8
8 300 91,7


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


1000 100 10
99,9
99
90
80
70
60
50
40
30
20
10
5
3
2
1
Horas
%

A
c
u
m
u
l
a
d
a


A prxima etapa consiste em traar a linha que represente
toda a populao, com base na linha de morte sbita. Como
cada grupo ensaiado tem 5 unidades, a sua primeira unidade
a falhar ter um posto mediano igual a:


% 95 , 12 % 100 x
4 , 0 5
3 , 0 1
% 100 x
4 , 0 n
3 , 0 i
Acumulada %
+




Para valer para toda a populao, deve-se igualar a mediana
(50%) da linha de morte sbita ao percentil de 12,95% da
populao. Isto feito transladando a linha conforme
mostrado a seguir:

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

1000 100 10
99,9
99
90
80
70
60
50
40
30
20
10
5
3
2
1
Horas
%

A
c
u
m
u
l
a
d
a


1000 100 10
99,9
99
90
80
70
60
50
40
30
20
10
5
3
2
1
Horas
%

A
c
u
m
u
l
a
d
a

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


ENSAIOS ACELERADOS

Ensaios Acelerados de Vida tm como objetivo identificar
prematuramente modos de falha no produto e obter
estimativas de vida. Isto obtido atravs de um fator
acelerador, que faz com que haja um maior estresse e,
consequentemente, que as falhas ocorram mais rapidamente.

O Fator Acelerador (FA) pode ser pelo aumento de:
Temperatura;
Umidade;
Tenso;
Vibrao;
Taxa de Uso;
Taxa de Envelhecimento (Degradao);
Salinidade;
Presso;
Solicitao Mecnica.

As falhas podem ocorrem por fadiga mecnica, corroso,
reao qumica, migrao, ou outras.

Em geral, quando h acelerao, o novo nvel de estresse
costuma ser adequadamente representado por uma
transformao linear, ou seja, basta multiplicar a tempo para
falha com estresse por FA para obter o tempo para falha em
condies de uso normal.

Uso de Normais Condies em Mdia Vida
Estresse com Mdia Vida
FA

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





Seja:
t
s
= tempo para falha com estresse
t
u
= tempo para falha em uso normal
F
s
(t) = FDA com estresse
F
u
(t) = FDA em uso normal
f
s
(t) = FDP com estresse
f
u
(t) = FDP em uso normal
h
s
(t) = taxa de falhas com estresse
h
u
(t) = taxa de falhas em uso normal

As relaes lineares ficam:

Tempo para Falha t
u
= AF t
s

Probabilidade de Falha F
u
(t) = F
s
(t/AF)
Confiabilidade R
u
(t) = R
s
(t/AF)
FDP f
u
(t) = (1/AF)f
s
(t/AF)
Taxa de Falha h
u
(t) = (1/AF) h
s
(t/AF)
Nota: diferentes modos de falha costumam ser diferentemente afetados pelos
FAs. Logo, improvvel que um nico FA serva para todas as situaes.


A conseqncia direta desta relao linear que o parmetro
de forma ( na distribuio Weibull) no se altera com
diferentes estresses. Logo, a reta dos pontos marcados no
papel de probabilidade para a condio de estresse ser
paralela de uso normal.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



EXEMPLO ENSAIO ACELERADO

Pilhas alcalinas foram ensaiadas quanto sua durabilidade,
sendo expostas a uma temperatura de 80
o
C. Os resultados
obtidos foram:


Posto (i) Dias
%
Acumulada
1 18 4,55
2 44 11,04
3 85 17,53
4 167 24,03
5 176 30,52
6 210 37,01
7 274 43,51
8 336 50,00
9 407 56,49
10 423 62,99
11 532 69,48
12 639 75,97
13 749 82,47
14 784 88,96
15 1254 95,45


sabido que 1 dia neste ensaio equivale (em mdia) a 5 dias
em condies normais de uso.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


1000 100 10
99,99
95
80
50
20
5
2
1
Horas
%

A
c
u
m
u
l
a
d
a



1000 100 10
99,99
95
80
50
20
5
2
1
Horas
%

A
c
u
m
u
l
a
d
a
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




MODELOS DE ACELERAO

Caso haja um modelo fsico que permita descrever a variao
do tempo de vida em funo da solicitao, possvel se
adotar algum modelo de acelerao de acordo com o FA e
tipo de falha:

1. Arrhenius prev tempos de falha em funo do FA
temperatura;

2. Potencial prev tempo para falha em funo da tenso
(em capacitores);

3. Exponencial idem ao anterior, mas para dispositivos
eletrnicos em geral;

4. Voltagem/temperatura para quando estes dois FAs
estejam presentes;

5. Eletromigrao para pelculas condutoras submetidas
alta temperatura e densidade de corrente;

6. Eyring quando os FAs so temperatura, tenso e
umidade;

7. Coffin-Manson modelos para falhas mecnicas, fadiga
ou deformao.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS
Comentrios importantes:

Normalmente, os ensaios acelerados de vida so
executados em componentes ou subsistemas, e no em
equipamentos complexos;

A razo disto que estes apresentam grande diversidade
de modos de falha e, portanto, a acelerao de uma
condio pode afetar mais de um modo de falha
simultaneamente e, assim, dificultar a anlise;

A faixa de validade do modelo no pode ser excedida ou
se incorrer em custos desnecessrios de mudana de
projeto;

Na maioria dos casos, fatores de acelerao podem ser
obtidos atravs de um estudo da literatura disponvel.
Contudo, e alguns casos, estes modelos necessitam ser
desenvolvidos especificamente;

Existem diversos manuais do departamento de Defesa
Norte-Americano que podem auxiliar na realizao dos
ensaios:
o MIL-HDBK-19500/620D
o MIL-HDBK-217/F
o MIL-HDBK-338
o MIL-HDBK-344/A
o MIL-HDBK-721/C
o MIL-HDBK-781/A
o MIL-HDBK-810/E
o MIL-HDBK-2164

Ensaios acelerados devem sempre ser abordados com o
devido cuidado. Existem limitaes bsicas para a tcnica.
Toda aplicao nica. Diferenas sutis na aplicao
podem invalidar as concluses obtidas.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



CONFIABILIDADE DE SISTEMAS

Quando associamos componentes entre si, se conhecemos a
confiabilidade de cada um destes individualmente, possvel
determinar a confiabilidade do sistema geral.



Sistema em Srie: basta um componente falhar para o
sistema falhar

C1 C2
R
1
(t
0
) R
2
(t
0
)
.



( ) ( ) [ ]
) t ( xR ) t ( R
t T t T P ) t T ( P ) t ( R
0 2 0 1
0 2 0 1 0 SISTEMA 0 SISTEMA

> > >





para o caso de n componentes independentes em srie:

n
1 i
0 i 0 SISTEMA
) t ( R ) t ( R


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





Sistema em Paralelo: todos os componentes devem falhar
para o sistema falhar


C1
C2
R
1
(t
0
)
R
2
(t
0
)
.



( ) ( ) [ ]
( ) ( ) [ ] ) t ( R 1 x ) t ( R 1 1
t T t T P 1 ) t T ( P 1 ) t ( R
0 2 0 1
0 2 0 1 0 SISTEMA 0 SISTEMA

< < <



para o caso de n componentes independentes em paralelo:

( )


n
1 i
0 i 0 SISTEMA
) t ( R 1 1 ) t ( R


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





Sistema em Stand-by: o sistema comuta para o
componente reserva quando o componente principal
falha


S
C
1
C
2
.



T
SISTEMA
= T
1
+ T
2



Se C
1
e C
2
so independentes:

dx ) x t ( f ). x ( f ) t ( f
t
0
2 1 SISTEMA


Nesta situao, a vida mdia do sistema :

) T ( ) T ( ) T (
2 1 SISTEMA
+



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



EXERCCIOS


1) Qual a confiabilidade do sistema abaixo, para um
perodo de 100 horas, sabendo se que cada componente
possui uma confiabilidade de 0,95 para o mesmo perodo.


C
1
C
2
C
3
C
4
C
5
C
6
.



2) Deseja-se substituir o sistema anterior pelo equivalente
abaixo, com a ressalva de que a confiabilidade deva
permanecer, no mnimo, igual anterior para um perodo
de 100 horas. Se os componentes do novo sistema tem
distribuio exponencial, qual deve ser o valor de ?


C
1
C
2
.



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




3) Dado o seguinte conjunto de valores, verificar se o mesmo
pode ser considerado como proveniente de uma
distribuio Weibull? Caso positivo, quais seriam as
estimativas para , e ?

297 210 292 91 389 297

166 389 146 430 219 - 285


4) Um avio possui quatro turbinas, sendo duas de cada lado
da asa (tipo Boeing 474). Construir os diagramas de bloco
para as seguintes situaes:
a) O avio cai se somente uma turbina falhar
b) O avio cai se duas ou mais turbinas falharem


5) Qual dos dois sistemas abaixo fornece maior confiabili-
dade para um determinado perodo, admitindo-se que os
seus componentes tm a mesma confiabilidade?

C C
.
C C
C C
.
C C

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS










Amostragem
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



TCNICAS DE AMOSTRAGEM

To importante quanto determinar quantos itens devem
compor a amostra (tamanho da amostra), determinar como
coletar estes itens.


1. Amostragem simples (aleatria ou casual): todos itens do
lote tm igual chance de pertencer populao (sorteio)

SORTEIO
.
LOTE
AMOSTRA



2. Amostragem sistemtica: os itens encontram-se ordena-
dos e a retirada de elementos da amostra feita
periodicamente

1 2 3 4 5 6 7 8
........
1 4 7
AMOSTRA
LOTE
.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


3. Amostragem estratificada: a populao encontra-se
dividida em vrios estratos e as amostras so coletadas
aleatoriamente de cada estrato.

.
LOTE
AMOSTRA



4. Amostragem por agrupamentos: a populao encontra-se
fisicamente dividida em pequenos grupos, que so
sorteados para formar a amostra.

.
LOTE
AMOSTRA



5. Amostragem de materiais a granel: se o material liquido
ou gasoso necessrio primeiro homogeneiz-lo e, ento,
retirar uma amostra a esmo. Para materiais slidos, a
retirada da amostra feita mediante quarteamento.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS














Anlise de
Dados
Suspeitos

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





DADOS SUSPEITOS


Na anlise de um conjunto de dados, pode ser que sejam
observados valores totalmente atpicos em relao aos demais.
Diremos, ento, que se trata de um dado suspeito.




A amostra de 7 peas foi obtida de uma certa mquina:


12 - 18 - 11 - 20 - 34 - 15 - 16


O valor 34, aparentemente diferente dos demais valores da
amostra que variam entre 11 e 20 e, portanto, pode ser um dado
suspeito.




Quando esto sendo avaliados dados deve-se tomar cuidado
com dados suspeitos, pois eles afetam as mdias e
disperses que sero utilizadas na anlise estatstica.



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS












TCNICAS PARA ANLISE DE DADOS
SUSPEITOS



Existe uma infinidade de tcnicas para deteco de dados
suspeitos. Vamos nos concentrar em duas que so
particularmente teis:

Mtodo do valor padronizado;


Mtodo do diagrama de juntas.



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS








MTODO DO VALOR PADRONIZADO

Este mtodo no totalmente novo. Na verdade, ele parte da
idia da padronizao usada na distribuio de probabilidade
normal.

Seja M definido como:


M = | x
i
x-barra | / s


M a distncia do valor mdia, em termos de desvios-
padres. M pequeno (positivo ou negativo) significa um valor
prximo mdia, enquanto que M grande, um valor afastado.


Para se empregar este mtodo, elimina-se o dado suspeito
do conjunto de dados e calcula-se a mdia e o desvio-padro
dos dados restantes. Se M > 4 o dado suspeito.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS







Exemplo


Seja o conjunto de dados:

12 - 18 - 11 - 20 - 34 - 15 16


Eliminando-se 34 do conjunto de dados resulta:

12 - 18 - 11 - 20 - 15 16


Este novo conjunto apresenta:

x-barra = 15,3

s = 3,4

Logo:

M = | 34 15,3 |/3,4 = 5,5 um dado suspeito



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




DIAGRAMA DE J UNTAS (BOXPLOT)

O boxplot tambm uma maneira de avaliar a presena de
dados suspeitos em um conjunto de dados, com a vantagem de
ser um mtodo visual.



1) Ordenar os valores em ordem crescente;

2) Determinar a mediana (Q2) dos valores ordenados;

3) Determinar o primeiro e terceiro quartis (Q1 E Q3) dos valores
ordenados;

4) Determinar a amplitude (H), definida como sendo a diferena
entre o primeiro e terceiro quartis:

H = Q3 - Q1

5) Calcular os limites extremos, superior e inferior, para os valores
ordenados, definidos como:

LXS = Q3 + (1,5 x H)
LXI = Q1 - (1,5 x H)

6) Verificar se h valores fora dos limites extremos;

7) Todos valores acima de LXS ou abaixo de LXI devem ser
considerados como dados suspeitos.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





EXERCCIO - DIAGRAMA DE J UNTAS

Os seguintes dados esto disponveis:


12 - 18 - 11 - 20 - 34 - 15 - 16


Existem dados suspeitos?


1) Ordenao dos dados:

11 12 15 16 18 20 - 34

2) O segundo quartil (Q2) a mediana destes valores, ou seja, o
valor que tem metade do total abaixo e acima de si.

Q2 = 16


3) Primeiro e terceiro quartis (Q1 E Q3):

Q1 = 12

Q3 = 20

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


4) Amplitude (H)

H = 20 12 = 8


5) Limites extremos

LXS = Q3 + 1,5 x H = 20 + 1,5 x 8 = 32

LXI = Q1

-

1,5

x H = 12 1,5 x 8 = 0


6) Diagrama de juntas

35 30 25 20 15 10



7) Anlise dos dados

Como o valor 34 superior a LXSI, o mesmo um dado
suspeito.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS







CUIDADOS COM DADOS SUSPEITOS

A pergunta que surge naturalmente : o que fazer com um
dado suspeito?

Embora muitos pensem que a resposta seja simplesmente
elimin-los, ela est errada! O fato que quando surge um
dado suspeito, precisa-se identificar porque este ocorreu:

Erro na coleta do dado?
Erro no apontamento do dado?
Erro na transcrio do dado?

E o mais importante: o que pode ser feito para evitar que o
erro ocorra novamente.

Ao final, pode at ocorrer de se descartar o valor (dado
suspeito), porm isto ocorre apenas aps uma boa dose de
investigao sobre este.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS















Estimao de
Parmetros
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS






Quando um parmetro de uma populao desconhecido,
vamos estim-lo a partir das estatsticas fornecidas pelas
amostras.



POPULAO
AMOSTRA
PARMETRO
ESTATSTICA
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





ESTIMADOR E ESTIMATIVA


Estimador (T): Quantidade calculada em funo dos
elementos da amostra, que ser usada
na estimao do parmetro ().

Estimativa (t): Um certo valor de um estimador.



EXEMPLO

113 - 124 - 115 - 107 - 120 - 115 110


Estimador de ? (T)
Estimativa (t)
x
114,9
x
~

115
m
0
115




PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


CRITRIOS PARA ESTIMADORES
Para cada parmetro, sempre possvel achar mais de um
estimador. Resta, portanto, determinar qual destes superior
aos outros. Para tanto, aplicam-se os seguintes critrios:

a) Justeza ou No Tendenciosidade

Se

) T (

ento T um estimador justo ou no-viesado de .

Interpretao: o valor mdio do estimador deve ser igual ao
valor do parmetro.


EXEMPLO

Seja x a mdia de uma amostra com n elementos, retirada
de uma populao infinita:

n
x ... x x x
n
x
x
n 3 2 1
n
1 i
i
+ + + +



Como

+ + + +
) x (
n
) x ( . n
n
) x ... x x x (
) x (
n 3 2 1


Ento, x um estimador justo de .
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

b) Coerncia

Se

0 ) T ( P lim
n
>

, para todo > 0

ento T um estimador coerente de .

Interpretao: quando se aumenta o tamanho da amostra, o
vcio (ou vis) tende a zero.


TEOREMA

Se

) T ( lim
n
, e se 0 ) T ( lim
2
n


, ento T ser um
estimador coerente de .


EXEMPLO

Seja x a mdia de uma amostra com n elementos, retirada
de uma populao infinita:

n
x ... x x x
n
x
x
n 3 2 1
n
1 i
i
+ + + +



Como
n
) x (
n
) x ( . n
n
x ... x x x
) x (
2
2
2
n 3 2 1
2 2


,
_

+ + + +



Ento, x um estimador coerente de , pois


) x ( lim
n

e
0 ) x ( lim
2
n


.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS








c) Eficincia

Se, para um mesmo tamanho de amostra,

[ ] [ ]
2
2
2
1
) T ( ) T ( <

ento T
1
um estimador mais eficiente do que T
2


Interpretao: quando se tm dois estimadores justos, T
1
e
T
2
, o melhor ser aquele que possuir menor varincia


d) Suficincia

Um estimador suficiente se contm o mximo possvel de
informao com referncia ao parmetro estimado.

Interpretao: um estimador que utilize a informao contida
na amostra da melhor forma sempre prefervel.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



EXEMPLO


Uma empresa recebeu um lote de 100 peas de um
fornecedor. Foi retirada uma amostra de 10 itens e
encontrou-se x peas defeituosas.

Seja:

x a quantidade de peas defeituosas encontrada

n
x
' p
a proporo defeituosa encontrada


Como x tem distribuio binomial:

n
) p 1 ( p
n
) p 1 ( np
n
) x (
n
x
) ' p (
p
n
np
n
) x (
n
x
) ' p (
2 2
2
2 2

,
_

,
_




Assim sendo, conclui-se que:

p um estimador justo de p, pois (p) = p;
p um estimador coerente de p, pois 0 ) ' p ( lim
2
n


;
pode-se, tambm, demonstrar que p eficiente e
suficiente.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


EXERCCIO

Seja x
1
, x
2
, ..., x
5
uma amostra retirada de uma populao
com mdia (X) = e desvio-padro (X) = . So sugeridos
os seguintes estimadores de :

) x x x x x (
5
1
x T
) x 2 x (
2
1
T ) x x (
2
1
T x T
5 4 3 2 1 4
5 1 3 5 1 2 1 1
+ + + +
+ +


Qual destes estimadores propostos melhor?


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


MTODOS PARA OBTENO DE
ESTIMADORES

Mtodo da Mxima Verossimilhana

Seja f
x
(x) a fdp de uma varivel aleatria X contnua, ou
P(X=x) a funo probabilidade de uma varivel aleatria X
discreta.

Seja X
1
, X
2
, ..., X
n
uma amostra aleatria da varivel aleatria
X e sejam x
1
, x
2
, ..., x
n
os valores amostrais.

Define-se como funo de verossimilhana L, como a funo
da amostra e de :

( ) ) ; X ( f )... ; X ( f ). ; X ( f ; X ,..., X , X L
n x 2 x 1 x n 2 1



Comentrios:

Se X for discreta ( ) ( )
n n 1 1 n 2 1
x X ,..., x X P ; X ,..., X , X L

Se X for contnua ( ) ( )
n 2 1 X ,..., X n 2 1
X ,..., X , X f ; X ,..., X , X L
n 1




Ao valor de que maximize a funo de mxima
verossimilhana, ser a melhor estimativa.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



EXEMPLO


Uma caixa contm 4 bolas, das quais h um nmero
desconhecido de bolas brancas. Foi retirada uma amostra
de 2 bolas (sem reposio) e encontrou-se 1 bola branca.
Qual a estimativa de mxima verossimilhana para ?



Pode-se admitir que h bolas brancas na caixa e (4-) no-
brancas. X ter distribuio hipergeomtrica, ou seja, a
probabilidade de em uma extrao sem reposio de 2 bolas
sair exatamente uma branca ser:

,
_

,
_

,
_



2
4
x 2
4
x
) x X ( P
i



Logo:

) 4 , 3 , 2 , 1 , 0 | , 1 X ( P ) ( L




PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





0 ) 0 | 1 X ( p



2
1
2
4
1
3
1
1
) 1 | 1 X ( p

,
_

,
_

,
_





3
2
2
4
1
2
1
2
) 2 | 1 X ( p

,
_

,
_

,
_





2
1
2
4
1
1
1
3
) 3 | 1 X ( p

,
_

,
_

,
_





0 ) 4 | 1 X ( p



Logo, pelo mtodo da mxima verossimilhana 2


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS










EXERCCIOS


Repetir o exerccio anterior, mas supondo amostragem com
reposio.
Dica: neste caso, empregar a distribuio binomial.




Suponha que numa seqncia de n tentativas independentes
e idnticas de Bernoulli, X sucessos foram observados.
Encontrar o estimador de mxima verossimilhana de p, a
probabilidade de sucesso em uma nica tentativa.
Dica: usar o ln da funo de mxima verossimilhana na derivao para facilitar
as coisas.



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





Mtodo dos Mnimos Quadrados

Este mtodo j foi aplicado ao caso de regresso simples,
visto no semestre anterior, para a obteno das melhores
estimativas de e na equao:

Y = + .X



Mtodo de Bayes

Este mtodo baseia-se na idia da teorema de Bayes, ou
seja, de incorporar as informaes contidas na amostra ao
processo de estimao. Para tanto emprega:

uma distribuio de probabilidade, chamada de distri-
buio priori;
a aplicao do Teorema de Bayes para a obteno de uma
nova distribuio de probabilidade, chamada de distribui-
o posteriori;
a associao de uma funo perda, normalmente
quadrtica, para determinar a melhor estimativa.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS






ESTIMAO POR PONTO

A estimao por ponto consiste em fornecer um nico valor,
que a melhor estimativa para o parmetro da populao.


a) Estimao com base em uma amostra

Parmetro
Estimado
Melhor
Estimador
Observaes

n
x
x
i

2

n
) x (
s
2
i
2


1 n
) x x (
s
2
i
2



conhecido

desconhecido

2
s s
2
4
s
c
1
s
n 30

n < 30
p
n
x
p





PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


b) Estimao com base em vrias (k) amostras

Amostra Valores
x
s
2

1 x
11
x
12
x
13
... x
1n

1
x
2
1
s
2 x
21
x
22
x
23
... x
2n

2
x
2
2
s
3 x
31
x
32
x
33
... x
3n

3
x
2
3
s
.
.
.
.
.
.
.
.
.
.
.
.
k x
k1
x
k2
x
k3
... x
kn

k
x
2
k
s


k 3 2 1
k k 3 3 2 2 1 1
n ... n n n
x . n ... x . n x . n x . n
x
+ + + +
+ + + +


Se n
1
= n
2
= n
3
= ... = n
k

k
x
x
i




k n ... n n
s ) 1 n ( ... s ) 1 n ( s ) 1 n (
s
k 2 1
2
k k
2
2 2
2
1 1
2
p
+ + +
+ + +


Se n
1
= n
2
= n
3
= ... = n
k

k
s
s
2
i
2
p




k 2 1
k k 2 2 1 1
p
n ... n n
p . n ... p . n p . n
p
+ + +
+ + +



Se n
1
= n
2
= n
3
= ... = n
k

k
p
p
i
p



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




ESTIMAO POR INTERVALO

Todas as estimativas por ponto contm um erro, pois so
diferentes do valor do parmetro, embora prximas. Para
avaliar a magnitude do erro de estimao, constri-se um
Intervalo de Confiana (IC) em torno da estimativa, com
probabilidade conhecida.


Notao:

mdia da populao
x mdia da amostra
desvio-padro da populao
s desvio-padro da amostra
n tamanho da amostra
e
0
semi-amplitude do IC IC = 2.e
0


0 z
p
z
p

z
= 1
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


a) IC para com conhecido:


+ 1 ) e x e ( P
0 0


x e
0

0
e x +

0
e x +
0
e x

0 0
e x e x +

+ 1 ) e x e x ( P
0 0


2 /
n
0
z
) e (


+


n
z e
2 / 0





IC para :
n
z x
2 /

t




+e
0
/2
-e
0
/2
1 -
n
x


x
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



b) IC para com desconhecido:

n
s
t x
2 / ; 1 n
t




c) IC para
2
:

2
2
2
1 n
s
) 1 n (







1 ) ( P
2
2 / ; 1 n
2
1 n
2
2 / 1 ; 1 n


2
2 / ; 1 n
2
2
2
2 / 1 ; 1 n
s ) 1 n (



2
2 / 1 ; 1 n
2
2
2
2 / ; 1 n
2
s ) 1 n ( s ) 1 n (

,
_


1
s ) 1 n ( s ) 1 n (
P
2
2 / 1 ; 1 n
2
2
2
2 / ; 1 n
2


/2 /2
1 -
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS






d) IC para

,
_


1
s ) 1 n ( s ) 1 n (
P
2
2 / 1 ; 1 n
2
2
2 / ; 1 n
2




e) IC para p

p tem Distribuio Binomial p ) p (
n
) p 1 ( p
) p (
2



Se n.p 5 e n.(1-p) 5 vale aproximao pela Normal.

n
) p 1 ( p
z e
2 / 0





Como no conhecemos p, usa-se p:

n
) p 1 .( p
z p
2 /

t





PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

ESTIMAO POR INTERVALO PARA SOMAS
OU DIFERENAS DE MDIAS

Seja a diferena
1
-
2
entre as mdias de duas populaes
normais com desvios-padres
1
e
2
, respectivamente.

Neste caso:

( ) ( ) ( )
( )
2
2
2
1
2
1
2 1
2 1
2 1 2 1
n n
x x
x x x x





Caso geral:

2
2
2
1
2
1
2 /
2 1
n n
z x x

+

t



Caso 1: Se
1
=
2
= , mas desconhecido

,
_

+ t
+
2 1
2
p 2 / ; 2 n n
2 1
n
1
n
1
s t x x
2 1


Caso 2: Se
1

2


2
2
2
1
2
1
2 / ; 2 n n
2 1
n
s
n
s
t x x
2 1
+ t
+



Como ficariam os intervalos para somas de mdias?

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS








ESTIMAO POR INTERVALO PARA SOMAS
OU DIFERENAS DE PROPORES

Seja a diferena p
1
- p
2
entre as propores de duas
populaes. Neste caso, as propores populacionais sero
estimadas pelas freqncias relativas (propores) p
1
e p
2


Supondo que a aproximao pela normal seja vlida, tem-se:


2
2 2
1
1 1
2 / 2 1
n
) ' p 1 ( ' p
n
) ' p 1 ( ' p
z ' p ' p

+

t





Como ficaria o caso da soma de propores?



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



TAMANHO DE AMOSTRAS
(PARA ESTIMAO)

a) Mdia:

. Se conhecido:
n
z e
2 / 0





2
0
2 /
e
z
n

,
_





. Se desconhecido:
2
0
2 / ; 1 n
s
e
t
n

,
_




n = tamanho da amostra-piloto


b) Proporo Populacional (probabilidade):

) p 1 ( p s
e
z
n
2
0
2 /

,
_




Se no h estimativa para p, adotar p = 1/2.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS












Testes de
Hipteses
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS







Com base nos resultados da amostra, quer se testar uma
certa hiptese (considerada como vlida, at prova em
contrrio), a respeito de um parmetro da populao.


Notao:

H
0
= hiptese nula, a ser testada
H
1
= hiptese alternativa


Exemplo:

H
0
= o ru inocente
H
1
= o ru culpado


Vai se obter uma amostra e, com base nesta, ou aceita-se H
0

(fraco) ou rejeita-se H
0
(forte).



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




TIPOS DE ERROS

Dois tipos de erros podem ser cometidos nos testes de
hipteses:

a) Erro tipo I: rejeitar H
0
quando H
0
verdadeira.
Ex.: juiz condenar um ru inocente.

b) Erro tipo II: aceitar H
0
quando H
0
falsa.
Ex.: juiz absolve um ru culpado.


Cada tipo de erro tem uma certa probabilidade de ser
cometido ( e , respectivamente).


REALIDADE

H
0
verdadeira H
0
falsa

aceitar
H
0


deciso correta
1 -
erro tipo II

DECISO

rejeitar
H
0


erro tipo I

deciso correta
1 -


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

TESTES PARA A MDIA

A) conhecido:

1 Caso: H
0
: =
0

H
1
: <
0


n
z x
0
CRIT





Se <
CRIT CALC
x x Rejeita-se H
0


chamando-se de

n
x
z
0
CALC




e

z
CRIT
= z



Se <
CRIT CALC
z z rejeita-se H
0

0
CRIT

1 -
x
x
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



2 Caso: H
0
:
0

H
1
: >
0

n
x
z
0
CALC



e

z
CRIT
= z




Se >
CRIT CALC
z z rejeita-se H
0

3 Caso: H
0
:
0

H
1
:
0

n
x
z
0
CALC




e
z
CRIT
= z
/2



Se >
CRIT CALC
z | z | rejeita-se H
0

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

desconhecido:

1 Caso: H
0
:
0

H
1
: <
0



n
s
x
t
0
CALC



e

t
CRIT
= t
n1;



Se <
CRIT CALC
t t rejeita-se H
0


2 Caso: H
0
:
0

H
1
: >
0

n
s
x
t
0
CALC


e

t
CRIT
= t
n1;



Se >
CRIT CALC
t t rejeita-se H
0
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS







3 Caso: H
0
:
0

H
1
:
0

n
s
x
t
0
CALC



e
t
CRIT
= t
n-1;/2



Se >
CRIT CALC
t | t | rejeita-se H
0

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


TESTES PARA VARINCIA

1 Caso: H
0
:
2
0
2

H
1
:
2
0
2
>

Se H
0
for verdadeira (
2
0
2
), resulta:
2
1 n
2
0
2
s ) 1 n (




Se >
2
2
2
CALC
s s rejeito H
0


Se >


2
; 1 n
2
0
2
CALC
s ) 1 n (
rejeito H
0


Se >

2
; 1 n
2
CALC
rejeito H
0

1 -
s
2
s
2
2
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





2 Caso: H
0
:
2
0
2

H
1
:
2
0
2
<

Se <

2
1 ; 1 n
2
CALC
rejeito H
0




3 Caso: H
0
:
2
0
2

H
1
:
2
0
2


Se <

2
2 / 1 ; 1 n
2
CALC
rejeito H
0


ou

Se
>

2
2 / ; 1 n
2
CALC
rejeito H
0

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



TESTES PARA PROPORO

Se n.p
0
5 e n.(1-p
0
) 5 p ter distribuio Normal


1 Caso: H
0
: p = p
0

H
1
: p < p
0


n
) p 1 ( p
p ' p
z
0 0
0
CALC




Se <

z z z
CRIT CALC
rejeito H
0


2 Caso: H
0
: p = p
0

H
1
: p > p
0


n
) p 1 ( p
p ' p
z
0 0
0
CALC




Se >

z z z
CRIT CALC
rejeito H
0

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS








3 Caso: H
0
: p = p
0

H
1
: p p
0


n
) p 1 ( p
p ' p
z
0 0
0
CALC




Se > <
2 / CALC 2 / CALC
z z se ou z z rejeito H
0
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

TAMANHO DE AMOSTRA PARA

TESTES DE HIPTESES

Sejam as hipteses:

H
0
:
0
H
1
: >
0


e vamos assumir que:

conhecido e;
e esto fixados (determinados).


Se H
0
verdadeira, ou seja, se
0





n
z x
0 CRIT

+

1 -
x
C
A
x
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



Mas, se em realidade >
0
, ento


E, conseqentemente


n
z x
CRIT






igualando-se as expresses, resulta em

2
0

z z
n

,
_




ou, se desconhecido

2
0
; 1 n ; 1 n
s

t t
n

,
_

1 -
x

1 -
x
C
A
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS










Se, alternativamente, as hipteses testadas fossem:

H
0
:
0

H
1
:
0

Ento:

2
0
2 /

z z
n

,
_




ou, se fr desconhecido

2
0
; 1 n 2 / ; 1 n
s

t t
n

,
_







PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




COMPARAO DE DUAS MDIAS

Quando se deseja comparar uma mdia contra outra, tem-se:

H
0
:
1
=
2



H diversos casos a considerar



Comparao
de Mdia
Dados
Emparelha-
dos
Dados No
Emparelha-
dos
's Desco-
nhecidos
mas iguais
's
Conhecidos
's Desco-
nhecidos e
diferentes
.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



DADOS EMPARELHADOS


Nesta situao, os dados das duas amostras encontram-se
emparelhados, ou seja, cada elemento da amostra est
perfeitamente identificado e possvel saber o seu resultado
antes e aps certo tratamento.

So exemplos de dados emparelhados situaes do tipo
antes x depois, onde h correspondncia entre os elementos
da amostra.

A hiptese H
0
pode ser modificada

H
0
:
1
=
2
H
0
:
1
-
2
=

logo, H
0
pode ser re-escrita como

H
0
: ? = 0

que ser testada contra

H
1
: > 0

ou

H
1
: < 0

ou ainda

H
1
: 0
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS






Se H
0
for verdadeira, ento ter distribuio normal com
mdia 0 e desvio-padro

. Como no se conhece ()??nem

, eles sero estimados mediante:



2 1 x x d e
( )
1 n
d d
s
2
i
d




Ento, o teste pode ser feito atravs de um t de Student, tal
que:

n
s
d
n
s
d
t t
d d
1 n CALC








Hipteses Rejeio de H
0

H
0
: ? = 0
H
1
: < 0
CRIT CALC
t t <
H
0
: ? = 0
H
1
: > 0
CRIT CALC
t t >
H
0
: ? = 0
H
1
: 0
CRIT CALC
t | t | >

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


EXEMPLO

Dez alunos foram submetidos a um novo mtodo de ensino
(tratamento de choque). Os QIs de cada aluno foram
medidos antes e depois, conforme tabela abaixo. H
evidncias de que o mtodo aumente o QI mdio? (=5%)

Aluno QI Antes QI Depois d
1 105 115 -10
2 115 122 -7
3 98 102 -4
4 95 99 -4
5 102 101 1
6 105 107 -2
7 120 118 2
8 100 101 -1
9 104 110 -6
10 102 110 -8

H
0
: ? = 0
H
1
: < 0

93 , 3 s 90 , 3 d
d


833 , 1 t t
14 , 3
10
93 , 3
90 , 3
t t
% 5 ; 9 CRIT
9 CALC





Logo, rejeita-se H
0




PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


DADOS NO-EMPARELHADOS

Nesta situao, continua-se querendo testar:

H
0
:
1
-
2
=

A diferena entre as mdias amostrais 2 1 x x ser usada e
lembrando que


( )
2
2
2
1
2
1
2 1
2
n n
x x

+




Admitindo-se que as varincias populacionais sejam
conhecidas, ento o teste pode ser feito mediante um z,
definido como


2
2
2
1
2
1
2 1
CALC
n n
) x x (
z





Se
2 2
2
2
1
, a expresso anterior resume-se a


2 1
2 1
CALC
n
1
n
1
) x x (
z
+



PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




Se as varincias populacionais
2
2
2
1
e no forem
conhecidas, elas sero substitudas por
2
2
2
1
s e s ,
respectivamente. Se, tambm, pode-se admitir que
2 2
2
2
1
, ento esta ser estimada por


2 n n
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1
2
p
+
+




Conseqentemente, o teste ser conduzido por um t de
Student, tal que

2 1
p
2 1
2 n n CALC
n
1
n
1
s
) x x (
t t
2 1
+


+



Por fim, se as varincias populacionais
2
2
2
1
e no forem
conhecidas, e no puder ser admitido que
2 2
2
2
1
, ento
o teste ser realizado atravs de


2
2
2
1
2
1
2 1
CALC
n
s
n
s
) x x (
t t
+




PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





Para se determinar a quantidade de graus de liberdade desta
estatstica, pode-se empregar o critrio de Aspin-Welch,
definido como


( )
2
1 n
w
1 n
w
w w
2
2
2
1
2
1
2
2 1

+
+
+
+


onde

2
2
2
2
1
2
1
1
n
s
w e
n
s
w


Os critrios de deciso continuam sendo os mesmos, ou seja

Hipteses Rejeio de H
0

H
0
: ? = 0
H
1
: < 0
CRIT CALC
t t <
H
0
: ? = 0
H
1
: > 0
CRIT CALC
t t >
H
0
: = 0
H
1
: 0
CRIT CALC
t | t | >

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

EXEMPLO


Dois tipos de borracha esto sendo comparados quanto
sua durabilidade mdia de pneus. Foram fabricados seis
pneus com cada tipo de borracha. possvel afirmar, ao nvel
de significncia de 10%, que a borracha A melhor que a B?

A B
mdia 35,30 31,50
desvio-padro 3,93 3,73
n 6 6


O teste a ser executado

H
0
: = 0
H
1
: > 0

Como os desvios-padres amostrais so prximos,
razovel admitir-se que as populaes tm a mesma
disperso. Logo:

68 , 14
2
) 73 , 3 ( ) 93 , 3 (
s
2 2
2
p

+


736 , 1
6
1
6
1
68 , 14
80 , 3
t
CALC

,
_

+


t
CRIT
= t
10;10%
= 1,372

Ao nvel de significncia de 10% rejeita-se H
0
.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



COMPARAO DE DUAS VARINCIAS


Na comparao de duas varincia, tem-se

H
0
:
2 2
2
2
1


contra, por exemplo

H
1
:
2
2
2
1
>

Como as varincias populacionais
2
2
2
1
e so desconheci-
das, elas sero substitudas por
2
2
2
1
s e s , respectivamente, e o
teste conduzido atravs de um F-Snedecor, definido como:


2
2
2
1
1 n ; 1 n CALC
s
s
F F
2 1





que ser comparado contra

; 1 n ; 1 n CRIT
2 1
F F

Se F
calc
> F
crit
rejeita-se H
0

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

Se, alternativamente

H
1
:
2
2
2
1
<

ento


2
2
2
1
1 n ; 1 n CALC
s
s
F F
2 1





que ser comparado contra

1 ; 1 n ; 1 n CRIT
2 1
F F

Se F
calc
< F
crit
rejeita-se H
0



Finalmente, se

H
1
:
2
2
2
1


pode-se fazer


) s ; s min(
) s ; s max(
F
2
2
2
1
2
2
2
1
CALC



que ser comparado contra

2 / ; ; CRIT
2 1
F F



Se F
calc
> F
crit
rejeita-se H
0

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




EXEMPLO


Um engenheiro acredita ter conseguido reduzir a
variabilidade do processo de usinagem. Para tanto, usinou 20
peas na condio anterior e obteve s
2
=0,125 e, na nova
condio, obteve s
2
=0,102. Ele est certo? Admitir dados
com distribuio normal.

H
0
:
2
DEPOIS
2
ANTES


H
1
:
2
DEPOIS
2
ANTES
>



23 , 1
102 , 0
125 , 0
F
CALC




18 , 3 F F
% 5 ; 19 ; 19 CRIT



Aceito H
0
, ou seja, no h evidncias ao nvel de significncia
de 5% de que tenha havido reduo da variabilidade.




PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS















Comparaes
Mltiplas
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


COMPARAO DE VRIAS VARINCIAS

Sejam vrias amostras, de mesmo tamanho (n), retiradas de
k populaes Normais.

Se quisermos testar as hipteses:
H
0
:
2
k
2
2
2
1
...
H
1
: pelo menos um
2
i
diferente dos demais

Calcula-se a estatstica g, definida como:

2
i
2
i
CALC
s
s max
g (i = 1, 2,..., k)

e obtm-se de uma tabela g
CRIT
, que funo de n, k e . Se
>
CRIT CALC
g g rejeita-se H
0
e afirma-se H
1



Este mtodo conhecido como Teste de Cochran.
Caso as amostras no tenham tamanhos iguais,
deve-se empregar o Teste de Bartlett.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS









TABELA g
( = 5%)

n = 2 3 4 5 6 7 8 9 10
k = 2 0,9985 0,9750 0,9392 0,9057 0,8772 0,8534 0,8332 0,8159 0,8010
3 0,9669 0,8709 0,7977 0,7457 0,7071 0,6771 0,6530 0,6333 0,6167
4 0,9065 0,7679 0,6841 0,6287 0,5895 0,5598 0,5365 0,5157 0,5017
5 0,8412 0,6838 0,5931 0,5441 0,5065 0,4783 0,4564 0,4387 0,4241
6 0,7808 0,6161 0,5321 0,4803 0,4447 0,4184 0,3980 0,3817 0,3682
7 0,7271 0,5612 0,4800 0,4307 0,3974 0,3726 0,3535 0,3384 0,3259
8 0,6798 0,5157 0,4377 0,3910 0,3595 0,3362 0,3185 0,3043 0,2926
9 0,6385 0,4775 0,4027 0,3584 0,3286 0,3067 0,2901 0,2768 0,2659
10 0,6020 0,4450 0,3733 0,3311 0,3029 0,2823 0,2666 0,2541 0,2439

Observaes:
k = quantidade de amostras
n = tamanho da amostra

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





EXEMPLO

Cinco amostras com cinco elementos cada uma forneceram
2
i
s : 3,7 - 2,5 - 5,1 - 6,0 - 3,2. Ao nvel de significncia de 5%,
existe evidncia que alguma
2
i
seja diferente das demais?
n = 5 e k = 5
max
2
i
s = 6,0

5 , 20 s
2
i


Com isso, temos:
2927 , 0
5 , 20
0 , 6
g
CALC


5441 , 0 g g
% 5 ; 5 ; 5 CRIT


aceito que as varincias so iguais, ou seja:

2
5
2
4
2
3
2
2
2
1

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


ANLISE DE VARINCIA COM UM FATOR
(UMA CLASSIFICAO)

Sejam trs grupos de pessoas que se quer verificar se sua
inteligncia (medida pelo QI) mdia igual. Para tanto,
sorteou-se oito indivduos de cada grupo e a estes foi
aplicado um certo teste.

Pode-se, em outras palavras, dizer que h um nico fator em
avaliao (inteligncia) em trs nveis (grupos), conforme
revela a tabela abaixo.


Grupo Notas
x
s
2

1 x
11
x
12
x
13
.... x
18

x
1

s
1
2

2 x
21
x
22
x
23
.... x
28

x
2

s
2
2

3 x
31
x
32
x
33
.... x
38

x
3

s
3
2



Notao empregada:

n - tamanho da amostra (8, no caso)
k - quantidade de mdias comparadas (3, no caso)
i
x - mdia da amostra do grupo i
x - mdia geral (mdia das mdias)
2
i
s - varincia da amostra do grupo i
2
R
s - varincia dentro da amostra (ou residual)
2
E
s - varincia entre amostras
2
T
s - varincia total
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




Como no se conhece a varincia da populao, chamada
de
2
, pode-se estim-la mediante trs mtodos diferentes:


Mtodo 1: atravs dos s
2
obtidos em cada grupo

) 1 n .( k
) x x (
k
s
s
2
i
ij
2
i
2
R





Mtodo 2: atravs das mdias dos grupos

1 k
) x x (
. n s
2
i
2
E






Mtodo 3: atravs de todos os dados individuais

1 k . n
) x x (
s
2
ij 2
T






Como toda esta notao muito complicada, vamos mostrar
os conceitos mediante aplicao ao exemplo do QI.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


Imagine que os resultados obtidos tenham sido os seguintes:

Grupo Notas
x
s
2

1 4 5 5 4 8 4 3 7 5,0 2,9
2 2 4 3 7 5 4 2 5 4,0 2,9
3 3 6 6 4 5 4 6 6 5,0 1,4

Mtodo 1: atravs dos s
2
obtidos em cada grupo

4 , 2
3
4 , 1 9 , 2 9 , 2
s
2
R

+ +



Mtodo 2: atravs das mdias dos grupos

7 , 4
3
0 , 5 0 , 4 0 , 5
x
+ +


7 , 2
) 1 3 (
] ) 7 , 4 0 , 5 ( ) 7 , 4 0 , 4 ( ) 7 , 4 0 , 5 [(
. 8 s
2 2 2
2
E

+ +



Mtodo 3: atravs de todos os dados individuais

4 , 2
1 3 . 8
] ) 7 , 4 6 ( ... ) 7 , 4 5 ( ) 7 , 4 5 ( ) 7 , 4 4 [(
s
2 2 2 2
2
T

+ + + +



Pode-se perceber que:
as mdias x so prximas;
os valores de
2
R
s ,
2
E
s e
2
T
s tambm so prximos.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


Imagine, agora, que os resultados obtidos fossem:

Grupo Notas
x
s
2

1 4 5 5 4 8 4 3 7 5,0 2,9
2 0 2 1 5 3 2 0 3 2,0 2,9
3 7 10 10 8 9 8 10 10 9,0 1,4

Mtodo 1: atravs dos s
2
obtidos em cada grupo

4 , 2
3
4 , 1 9 , 2 9 , 2
s
2
R

+ +



Mtodo 2: atravs das mdias dos grupos

3 , 5
3
0 , 9 0 , 2 0 , 5
x
+ +


7 , 98
) 1 3 (
] ) 3 , 5 0 , 9 ( ) 3 , 5 0 , 2 ( ) 3 , 5 0 , 5 [(
. 8 s
2 2 2
2
E

+ +



Mtodo 3: atravs de todos os dados individuais

8 , 10
1 3 . 8
] ) 3 , 5 6 ( ... ) 3 , 5 5 ( ) 3 , 5 5 ( ) 3 , 5 4 [(
s
2 2 2 2
2
T

+ + + +



Pode-se perceber, neste novo conjunto de resultados, que:
as mdias x no mais so prximas;
o valor de
2
R
s no se alterou;
os valores de
2
E
s e
2
T
s aumentaram muito.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

Os grficos abaixo ajudam na interpretao dos resultados.
No primeiro conjunto de dados as mdias estavam prximas:

Max
Min
Mdia
-2
0
2
4
6
8
10
12
1 2 3



J no outro conjunto, as mdias apresentavam-se mais
afastadas umas em relao s outras:

Max
Min
Mdia
-2
0
2
4
6
8
10
12
1 2 3

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

COMENTRIOS

1. Se as mdias das populaes (grupos) so iguais, os
valores de
i
x sero prximos e tanto faz estimar-se
2

atravs de
2
R
s ,
2
E
s ou
2
T
s , pois todos elas fornecero valores
prximos.

2. Contudo, quando as mdias das populaes so diferen-
tes, os valores de
i
x divergiro entre si. Embora
2
R
s
continue sendo um bom estimador de
2
,
2
E
s e
2
T
s no mais
o sero, pois so afetados pela diferena entre as mdias.

3. Assim, pode-se comparar as mdias das diversas popula-
es (k) atravs da comparao de varincias:
2
E
s e
2
R
s ,
respectivamente. Este teste chamado de teste F, onde:
2
R
2
E
calc
s
s
F

4. Enquanto que
2
E
s tem (k-1) graus de liberdade,
2
R
s tem
[k.(n-1)] graus de liberdade (veja os denominadores destas
varincias). Portanto, F
calc
ter (k-1) no seu numerador;
[k.(n-1)] graus de liberdade no seu denominador.

5. Quanto maior o valor de F
calc
maior a probabilidade de
que as mdias sejam diferentes entre si. Para chegar a
uma concluso, F
calc
comparado contra um F
crit
, obtido a
partir de uma tabela.

6. Se F
calc
< F
crit
, ento admite-se que as mdias so iguais.

7.A anlise de varincia assume a hiptese de que as
populaes possuem a mesma varincia (
2
). Se isto no
ocorrer, os resultados no sero vlidos.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS






DISTRIBUIO F-SNEDECOR

Sejam duas amostras independentes, retiradas de
populaes Normais, com mesma varincia (
2
), que
forneceram estimativas
2
1
s e
2
2
s , respectivamente. Ao
quociente de
2
1
s por
2
2
s , chamamos de:

2
2
2
1
1 n ; 1 n
s
s
F
2 1



F
f(F)
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




TABELA F-SNEDECOR
( = 5%)


1

2
1 2 3 4 5 6 7 8 9 10
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32

FONTE: COSTA NETO, P.L.O. Estatstica. So Paulo, Edgard Blucher, 1978.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS









EXEMPLO

O segundo conjunto de resultados do teste de QI, forneceu:

2
E
s = 98,7 e
2
R
s = 2,4

logo

1 , 41
4 , 2
7 , 98
F
calc


F
calc
tem (3 -1) = 2 GL no numerador e [3 x (8-1)] = 21 GL no
denominador.

F
crit
(para um =5%) ser F
2, 21, 5%
= 3,47 pelo menos uma
turma diferente das demais.


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


TABELA DA ANLISE DE VARINCIA


comum apresentar-se os resultados da anlise de varincia
na forma de uma tabela, similar de baixo:

Fonte SQ GL QM F
CALC

Entre


2
i ) x x ( . n SQE
(k-1)
1 k
SQE
s
2
E


2
E
s /
2
R
s
Residual


2
i
ij
) x x ( SQR
k.(n-1)
) 1 n ( k
SQR
s
2
R


Total


2
ij
) x x ( SQT
k.n-1

onde:
SQ - a soma de quadrados
GL - so os graus de liberdade das estimativas
QM - o quadrado mdio = SQ/GL

perceba que:
SQTotal = SQEntre + SQResidual

GLTotal = GLEntre + GLResidual


No caso de nosso exemplo do teste de QI, com o segundo
conjunto de dados, tem-se:

Fonte SQ GL QM F
CALC

Entre amostras 197,3 2 98,7 41,4
Residual 50,0 21 2,4
Total 247,3 23
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS







AMOSTRAS DE TAMANHOS DIFERENTES


H situaes onde, eventualmente, pode-se estar
trabalhando com amostras de tamanho diferente. Neste caso,
a tabela da Anlise de Varincia modificada da seguinte
forma:



Fonte SQ GL QM F
CALC

Entre SQE=SQT-SQD (k-1)
1 k
SQE
s
2
E


2
E
s /
2
R
s
Residual


2
i i
s ) 1 n ( SQR

k n
i

k n
SQR
s
i
2
R
Total


2
ij
) x x ( SQT

1 n
i


Obs: neste caso

k n ... n n
s ) 1 n ( ... s ) 1 n ( s ) 1 n (
s
k 2 1
2
k k
2
2 2
2
1 1
2
R
+ + +
+ + +




PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS






ALGUNS CUIDADOS

A anlise de varincia tem algumas hipteses bsicas que
so assumidas para sua validade:
o modelo vlido do tipo
ij i ij
x + + , onde a mdia
geral,
i
o efeito do nvel i do fator e
ij
o erro;
as populaes so homocedsticas, ou seja, possuem a
mesma varincia;
as populaes podem ser adequadamente representadas
por uma distribuio de probabilidade normal;
conseqentemente,
ij
~N(0;
2
).

1. A primeira hiptese fundamental para que os resultados
sejam vlidos. A condio de homocedasticidade pode ser
verificada mediante uma anlise de resduos ou, ento,
pelo teste de Cochran ou de Bartlett.

2. A segunda hiptese (normalidade dos dados) no
essencial, pois a anlise de varincia fornece bons
resultados quando a populao no normal. Ela pode ser
verificada atravs do papel de probabilidade normal.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



ANLISE DE RESDUOS


Um resduo (e
ij
) definido como sendo a quantidade:

i
ij ij
x x e

onde
i
x a mdia do grupo i.



costume fazer a anlise de resduos por meios grficos, j
que estes facilitam a visualizao. Dentre estes, os mais
habituais so:

Ferramenta Forma e Objetivo
Papel de
Probabilidade
Normal
Os resduos so ordenados e marcados
no PPN. Desvios de normalidade indicam
inadequao do modelo, ou seja, erros
no-aleatrios em torno da mdia geral
Grfico Linear Constri-se um grfico com os resduos
ordenados no tempo para avaliar a sua
aleatoriedade e eventual presena de
dados suspeitos (outliers)
Grfico de
resduos x
amostra
um grfico cartesiano das amostras
pelos respectivos resduos, visando
verificar se h problemas de disperso, ou
seja, se em certos pontos h maior
diferena entre resultados do que em
outros.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

EXEMPLO

Grupo Resduo
1 -1 0 0 -1 +3 -1 -2 +2
2 -2 0 -1 +3 +1 -1 -2 +1
3 -2 +3 +3 -1 0 -1 +1 +1


Residuo
P
e
r
c
e
n
t
a
g
e
m
4 3 2 1 0 -1 -2 -3 -4
99
95
90
80
70
60
50
40
30
20
10
5
1


Observao
R
e
s
i
d
u
o
24 22 20 18 16 14 12 10 8 6 4 2
3
2
1
0
-1
-2


Mdia
R
e
s
i
d
u
o
9 8 7 6 5 4 3 2
3
2
1
0
-1
-2
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

COMPARAES MLTIPLAS

A anlise de varincia testa se as mdias das populaes
podem ser assumidas como iguais ou no, mas no revela
que mdias so diferentes umas das outras.

Para realizar esta tarefa, pode recorrer aos intervalos de
confiana empregando a estimativa da varincia residual (
2
R
s )
na sua construo. Assim, para cada mdia, faz-se o
seguinte intervalo:

i
2
R
2 / ; 1 n
i
n
s
t x
i

t


se estes se sobrepuserem, ento no se pode dizer que h
diferena entre as mdias.


EXEMPLO

Para os dados do ltimo exerccio, tem-se:

Grupo
x
n

2
R
s
t
7;2,5%
Min Max
1 5,0 8 2,4 2,365 3,7 6,3
2 2,0 8 2,4 2,365 0,7 3,3
3 9,0 8 2,4 2,365 7,7 10,3


Grupo N Mdia DP -------+---------+---------+---------+--
1 8 5,000 1,690 (----*----)
2 8 2,000 1,690 (----*----)
3 8 9,000 1,195 (----*----)
-------+---------+---------+---------+--
2,5 5,0 7,5 10,0
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS






ANLISE DE VARINCIA COM DOIS
FATORES
(DUAS CLASSIFICAES)
Quando h mais de um fator (ou classificao) em avaliao,
a anlise de varincia ligeiramente diferente do caso de um
nico fator.

Por exemplo, para dois fatores, as hipteses a serem
testadas so:

H
01
:
11
=
12
=
13
= ....

H
02
:
21
=
22
=
23
= ....

contra:

H
1
: pelo menos um
ij
diferente dos demais

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS

EXPERIMENTOS SEM REPETIO
(BLOCOS)


Trs modelos diferentes de carros foram testados por seis
motoristas, obtendo-se os seguintes desempenhos (Km/l):

Motorista
Carro 1 2 3 4 5 6
x
s
2

A 15,1 14,7 16,0 14,3 13,9 14,2 14,7 0,58
B 13,9 13,7 14,4 13,3 13,6 14,5 13,9 0,22
C 16,0 15,4 15,8 14,4 14,2 15,4 15,2 0,54

Usando-se a Anlise de Varincia com um fator, vem:

45 , 0
3
54 , 0 22 , 0 58 , 0
s
2
R

+ +



58 , 2
) 1 3 (
] ) 6 , 14 2 , 15 ( ) 6 , 14 9 , 13 ( ) 6 , 14 7 , 14 [(
. 6 s
2 2 2
2
E

+ +



E a tabela da Anlise de Varincia fica:

Fonte SQ GL QM F
CALC
F
CRIT

Entre 5,16 2 2,58 5,73 3,68
Residual 6,75 15 0,45
Total 11,91 17
F
CRIT
= F
5%


A concluso clara: deve-se rejeitar a igualdade de mdias
dos diferentes modelos de carros.
PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


Contudo, se o modelo for novamente examinado, pode-se
verificar que este pode ser aperfeioado, j que de se
esperar que existam diferenas entre motoristas quanto ao
modo de dirigir e estas, de certa forma, tendem a mascarar
eventuais diferenas entre os modelos de carro testados.

Assim, se houvesse um meio de eliminar ou, ento,
descontar as diferenas entre motoristas, a avaliao seria
feita com muito mais confiana nos resultados obtidos.

Esta possibilidade existe e chamada de experimentos em
blocos.

a) Unidades experimentais heterogneas

.


b) Formao de blocos

.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



Voltando-se tabela de dados original, pode-se verificar que:

Motorista
Carro 1 2 3 4 5 6
x
i.

A 15,1 14,7 16,0 14,3 13,9 14,2 14,7
B 13,9 13,7 14,4 13,3 13,6 14,5 13,9
C 16,0 15,4 15,8 14,4 14,2 15,4 15,2
x
.j

15,0 14,6 15,4 14,0 13,9 14,7



Com base nas mdias dos carros tem-se:

58 , 2
2
) 6 , 14 2 , 15 ( ) 6 , 14 9 , 13 ( ) 6 , 14 7 , 14 (
. 6
1 k
) x x (
. n s
2 2 2
2
. i
2
CARROS

+ +




Por outro lado, com base nas mdias dos motoristas:

996 , 0
5
) 6 , 14 7 , 14 ( ... ) 6 , 14 0 , 15 (
. 3
1 n
) x x (
. k s
2 2
2
J .
2
MOTOR

+ +




Utilizando-se todos os elementos, obtm-se

699 , 0
17
... ) 6 , 14 7 , 14 ( ) 6 , 14 1 , 15 (
1 nk
) x x (
s
2 2
2
ij 2
T

+ +




PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



Ou, na forma de tabela da Anlise de Varincia

Fonte SQ GL QM F
CALC

Carros SQC=n.


2
. i ) x x ( k-1
2
CARROS
s
2
R
2
CARROS
s / s

Motoristas SQM=k.


2
J . ) x x ( n-1
2
MOTOR
s
2
R
2
MOTOR
s / s

Residual SQR=SQT-SQC-SQM (k-1)(n-1)
2
R
s

Total SQT=


2
ij
) x x ( nk-1


ou, ainda, numericamente

Fonte SQ GL QM F
CALC
F
CRIT

Carros 5,16 2 2,58 14,83 4,10
Motoristas 4,98 5 0,996 5,72 3,33
Residual 1,74 10 0,174
Total 11,880 17
Com F
CRIT
= F
5%



Comentrios:

O modelo dito aditivo, ou seja, a frmula genrica

x
ij
= +
i
+
j
+
ij


onde:
- i a quantidade de nveis do fator A (i = 1, 2, ..., n)
- j a quantidade de nveis do fator B (j = 1, 2, ..., k)
-?
i
o efeito do nvel i do fator A
-?
j
o efeito do nvel j do fator B


PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS





EXPERIMENTOS COM REPETIO

Quando h mais de um fator (ou classificao) em avaliao,
a anlise de varincia ligeiramente diferente do caso
anterior. Por exemplo, para dois fatores:

B
0
B
1


A
0

x
111

x
112

x
113

x
121

x
122

x
123


A
1

x
211

x
212

x
213

x
221

x
222

x
223



Neste caso, a frmula genrica

x
ijt
= +
i
+
j
+ ()
ij
+
ijt


onde:
- i a quantidade de nveis do fator A (i = 1, 2, ..., n)
- j a quantidade de nveis do fator B (j = 1, 2, ..., k)
- k a quantidade de rplicas por tratamento (t= 1, 2, ..., n)
-?
i
o efeito do nvel i do fator A
-?
j
o efeito do nvel j do fator B
-? ??
ij
o efeito da interao entre os fatores A e B

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS







INTERAO ENTRE FATORES


Quando existe mais do que um fator em avaliao, pode
surgir um fenmeno chamado de interao. Isto significa que
quando os fatores esto presentes o resultado combinado
destes no aditivo, mas sim multiplicativo.

Modelo aditivo:

x
ijk
= +
i
+
j
+
ijk


Modelo multiplicativo:

x
ijk
= +
i
+
j
+ ()
ij
+
ijk



Alguns exemplos desta a situao so: mistura de drogas
com lcool, sinergia entre crianas brincado em um grupo,
potencializao entre teores ativos em medicamentos, etc.

O aparecimento de interao entre fatores na anlise de
varincia no exceo, mas regra.

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS



EXEMPLO

Certa operao pode ser executada em uma de duas
mquinas (A
0
ou A
1
), com um certo operador (B
0
ou B
1
).
Existe influncia das mquinas ou operadores com relao
aos tempos de execuo mdios obtidos (em segundos)?

B
0
B
1


A
0


(1)
20
22
(3)
40
37

A
1


(2)
50
46
(4)
12
15

Como tanto as mquinas como os operadores podem ter
influncia (efeito) sobre a resposta (tempo), ento pode-se
adotar como estimativa para o erro
ijk
a estimativa residual
da amostra (ou tratamento), ou seja,
2
i
s :


Tratamento x-barra
2
i
s
1 A
0
B
0
21,0 2,00
2 A
1
B
0
48,0 8,00
3 A
0
B
1
38,5 4,50
4 A
1
B
1
13,5 4,50


A mdia geral dos tempos

25 , 30
4
5 , 13 5 , 38 0 , 48 0 , 21
x
+ + +

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS


Admitindo-se que os tratamentos tm iguais varincias, mas
esta desconhecida, ento pode-se estim-la mediante:

75 , 4
4
50 , 4 50 , 4 00 , 8 00 , 2
s
2
R

+ + +


As outras estimativas da varincia, obtidas atravs da
diferena entre as mdias dos nveis das mquinas e dos
operadores, so:

Mquina x-barra Operador x-barra
A
0
29,75 B
0
34,5
A
1
30,75 B
1
26,0


00 , 2
1 2
) 25 , 30 75 , 30 ( ) 25 , 30 75 , 29 (
x 4 s
2 2
2
A

+



50 , 144
1 2
) 25 , 30 0 , 26 ( ) 25 , 30 5 , 34 (
x 4 s
2 2
2
B

+



A estimativa total da varincia, por sua vez:

79 , 216
1 8
) 25 , 30 15 ( ... ) 25 , 30 22 ( ) 25 , 30 20 (
s
2 2 2
2
T

+ + +



A ltima forma de obteno de estimativas, que a com
base na interao, ser feita mediante a interao,
lembrando-se que:
R AB B A T
SQ SQ SQ SQ SQ + + +

PRO 2711 ESTATSTICA II Prof. Alberto W. Ramos
ALBERTO W. RAMOS




Colocando-se estes resultados, na forma da tabela da anlise
de varincia, resulta em


Fonte SQ GL QM F
Efeito




A


2,00

1

2,00

0,42

B


144,50

1

144,50


30,42
Interao

AxB

1352,00


1

1352,00

284,63
Resdual 19,00 4 4,75


Total


1517,50

7




Adotando-se = 5%, resulta em:

F
crit
= F
1;4: 5%
= 7,71



Qual sua interpretao dos resultados?



ESTATSTICA II 188

ALBERTO W. RAMOS






Fonte SQ GL QM F
Efeito


A


i
2
i
A
) x x ( bn SQ


a-1
1 a
SQ
s
A 2
A


2
R
2
A
A
s
s
F


B


j
2
j
B
) x x ( an SQ


b-1
1 b
SQ
s
B 2
B


2
R
2
B
B
s
s
F

Interao




AxB

R B A T AB
SQ SQ SQ SQ SQ

(a-1)(b-1)
) 1 b )( 1 a (
SQ
s
AB 2
AB


2
R
2
AB
AB
s
s
F

Resdual


i
2
ij
ijk
j k
R
) x x ( SQ


ab(n-1)
) 1 n ( ab
SQ
s
E 2
R




Total
2
i
ijk
j k
T
) x x ( SQ




abn-1


ESTATSTICA II 189

ALBERTO W. RAMOS




INTERPRETAO DOS RESULTADOS


Quando h a presena de interao, o efeito de cada fator
no pode ser considerado individualmente. Em outras
palavras, a interao demanda que o efeito combinado dos
nveis dos fatores seja avaliado, por exemplo, atravs de um
grfico como o abaixo.

0
10
20
30
40
50
60
A0 A1
B0
B1


A considerao do melhor nvel de um fator depende do nvel
do outro fator.

Por outro lado, quando houver evidncias estatsticas de que
no h interao entre os fatores, a sua soma de quadrados
da interao (SQI) poder ser acrescida residual (SQR).


ESTATSTICA II 190
ALBERTO W. RAMOS



MODELO FIXO E MODELO ALEATRIO


Exemplo 1

Uma indstria de parafusos adquiriu 5 mquinas e est
interessada em realizar um experimento para verificar se
estas so idnticas com relao ao dimetro mdio das
peas por elas produzidas.


Exemplo 2

Uma indstria est interessada em realizar um experimento
para verificar se as mquinas so idnticas com relao ao
dimetro mdio das peas por elas produzidas. Contudo, a
quantidade de mquinas muito grande, optou-se por
selecionar ao acaso uma amostra de 5 mquinas.




No 1
o
exemplo o fator mquina fixo, enquanto que
no 2
o
modelo, este aleatrio. No modelo fixo, as
concluses referem-se somente aos nveis testados
mas, no aleatrio, as concluses devem ser estendidas
para toda populao de nveis.

ESTATSTICA II 191
ALBERTO W. RAMOS






Conseqncias:

No caso de anlise de varincia com uma classificao, ou
com duas classificaes, mas sem repetio (blocos), o
fato do modelo ser fixo ou aleatrio no afeta a forma em
que a anlise foi apresentada anteriormente;
Contudo, quando h duas classificaes com repetio, a
anlise para o caso de modelo aleatrio conduzida de
maneira ligeiramente diferente da anteriormente vista (que
somente valida para modelo fixo).

Quando ambos os fatores so fixos as hipteses:

H
01
:
11
=
12
=
13
= ....

H
02
:
21
=
22
=
23
= ....

Equivalem a:

H
01
:
1
=
2
=
3
= ....=
a
= 0 (no existe efeito do fator A)

H
02
:
1
=
2
=
3
= ....=
b
= 0 (no existe efeito do fator B)

ESTATSTICA II 192
ALBERTO W. RAMOS



Entretanto, quando os fatores so aleatrios, tem-se que os
parmetros:

) ; 0 ( NID ~
2
i



) ; 0 ( NID ~
2
j



) ; 0 ( NID ~
2
ij



) ; 0 ( NID ~
2
jki



Conseqentemente:

2 2 2 2 2
TOTAL
+ + +


Portanto, as hipteses adequadas so:

H
01
:
2
A
= 0 (no existe efeito do fator A)

H
02
:
2
B
= 0 (no existe efeito do fator B)

Logo, se houver interao (ou no), o teste de significncia
do fator A e B (teste F) deve ser feito com
2
AB
s
no
denominador e no com
2
R
s
.
ESTATSTICA II 193

ALBERTO W. RAMOS





Fonte SQ GL QM F
Efeito


A


i
2
i
A
) x x ( bn SQ


a-1
1 a
SQ
s
A 2
A


2
AB
2
A
A
s
s
F


B


j
2
j
B
) x x ( an SQ


b-1
1 b
SQ
s
B 2
B


2
AB
2
B
B
s
s
F

Interao




AxB

R B A T AB
SQ SQ SQ SQ SQ

(a-1)(b-1)
) 1 b )( 1 a (
SQ
s
AB 2
AB


2
R
2
AB
AB
s
s
F

Resdual


i
2
ij
ijk
j k
R
) x x ( SQ


ab(n-1)
) 1 n ( ab
SQ
s
E 2
R




Total
2
i
ijk
j k
T
) x x ( SQ




abn-1





ESTATSTICA II 194

ALBERTO W. RAMOS







ANLISE DE RESDUOS


Similarmente ao visto na anlise de varincia com um fator,
tambm recomendada aqui uma anlise dos resduos para
se detectar algum eventual problema nos dados.

Nesta situao (dois fatores), os resduos so definidos como
sendo a diferena entre os valores obtidos
experimentalmente e as mdias de cada tratamento:

B
0
B
1


A
0


(1)
-1
+1
(3)
+1,5
-1,5

A
1


(2)
+2
-2
(4)
-1,5
+1,5


As mesmas ferramentas podem ser adotadas na anlise de
resduos, ou seja, papel de probabilidade normal, grfico
linear, etc.

ESTATSTICA II 195
ALBERTO W. RAMOS

Residuo
P
o
r
c
e
n
t
a
g
e
m
4 3 2 1 0 -1 -2 -3 -4
99
95
90
80
70
60
50
40
30
20
10
5
1


Observao
R
e
s
i
d
u
o
8 7 6 5 4 3 2 1
2
1
0
-1
-2


Mdia
R
e
s
i
d
u
o
50 40 30 20 10
2
1
0
-1
-2


ESTATSTICA II 196
ALBERTO W. RAMOS











Regresso
ESTATSTICA II 197
ALBERTO W. RAMOS



REGRESSO


O objetivo fundamental da regresso descobrir a equao
que relaciona duas (ou mais) variveis, ou seja:



y = f(x
1
, x
2
, ... , x
k
) +



onde:

x
1
, x
2
, ... , x
k
so chamadas de fatores;

f(x
1
, x
2
, ... , x
k
) indica uma funo de vrias variveis;

chamado de erro.


As hipteses bsicas assumidas na regresso so:

x
1
, x
2
, ... , x
k
so admitidos sem erro

y admitido com erro

admitido ~ N(0,
2
R

)


2
R

admitido constante


ESTATSTICA II 198
ALBERTO W. RAMOS


REGRESSO LINEAR SIMPLES

Admite que uma equao do primeiro grau representa
satisfatoriamente o modelo:


y =
0
+
1
.x


como as constantes
0
e
1
so desconhecidas, ento a
equao da reta ser estimada atravs de:

x . b b y
1 0
+

onde:
b
0
- o intercepto da reta

b
1
- a coeficiente angular da reta


x
y
b
0
tg = b
1
y =b
0
+b
1
x
^


ESTATSTICA II 199
ALBERTO W. RAMOS





EXEMPLO

Foi feito um levantamento de diversos modelos de
automveis quanto a potncia do motor (Hp) e o
consumo mdio (km/l).



Carro Potncia Consumo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
130
81
93
113
90
63
55
102
92
81
103
90
74
73
102
78
100
100
10,1
10,5
11,3
10,5
11,6
12,4
15,0
11,3
12,4
12,0
10,9
11,6
12,4
13,1
10,9
12,0
10,5
10,5

ESTATSTICA II 200
ALBERTO W. RAMOS

DETERMINAO DA EQUAO DA RETA

A equao da reta determinada a partir dos dados da
tabela anterior, atravs do mtodo dos mnimos quadrados:

e
i
2
y
x





2
1 0 i
2
i i
2
i
) x b b y ( min ) y y ( min e min

Para se obter o mnimo, faz-se

0 e
b
e 0 e
b
2
i
1
2
i
0




que resulta em

0 ) x . b b y ( x 2
0 ) x . b b y ( 2
1 0 i i
1 0 i


ESTATSTICA II 201
ALBERTO W. RAMOS





que resulta no seguintes sistema de equaes

(2) x b x b y x
(1) x b nb y
2
i 1 i 0 i i
i 1 0 i


+
+



de (1), dividindo-se tudo por n, resulta

x b y
n
x
b
n
y
b
1
i
1
i
0




de (2), pode-se demonstrar que

XX
XY
1
S
S
b

onde:

( )



n
y . x
y x S
i i
i i XY


e

( )
n
x
x S
2
i 2
i XX




ESTATSTICA II 202
ALBERTO W. RAMOS

Voltando-se ao exemplo, usa-se uma tabela auxiliar:

Carro Potncia
(x
i
)
Consumo
(y
i
)
x
i
2
y
i
2
x
i
y
i

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
130
81
93
113
90
63
55
102
92
81
103
90
74
73
102
78
100
100
10,1
10,5
11,3
10,5
11,6
12,4
15,0
11,3
12,4
12,0
10,9
11,6
12,4
13,1
10,9
12,0
10,5
10,5
16900
6561
8649
12769
8100
3969
3025
10404
8464
6561
10609
8100
5476
5329
10404
6084
10000
10000
102,01
110,25
106,09
110,25
134,56
153,76
225,00
127,69
153,76
144,00
118,81
134,56
153,76
171,61
118,81
144,00
110,25
110,25
1313,0
850,5
957,9
1186,5
1044,0
781,2
825,0
1152,6
1140,8
972,0
1122,7
1044,0
917,6
956,3
1111,8
936,0
1050,0
1050,0
TOTAL 1620 209,0 151404 2451,02 18504,9

1 , 305
18
209 x 1620
9 , 18504 S
XY


( )
5604
18
1620
151404 S
2
XX


0544 , 0
5604
1 , 305
b
1
507 , 16
18
1620
0544 , 0
18
209
b
0
+


y = 16,507 - 0,0544.x


ESTATSTICA II 203
ALBERTO W. RAMOS










COMENTRIOS:

o mtodo dos mnimos quadrados busca traar a melhor
reta atravs dos pontos, ou seja, aquela que torna
mnima a distncia destes reta;

sempre possvel obter a equao de uma reta que
passa por um conjunto de pontos, mas isto no significa
que o modelo seja necessariamente adequado;

para se verificar a adequao do modelo, emprega-se a
anlise de varincia (ANOVA).

recomendvel tambm fazer uma anlise de resduos
para completar a anlise de adequao do modelo.


ESTATSTICA II 204
ALBERTO W. RAMOS



ANLISE DE VARINCIA APLICADA
REGRESSO

Para verificar se a regresso linear estatisticamente
significativa, deve-se testar o seguinte conjunto de hipteses:


H
0
:
1
= 0 (no h regresso)

H
1
:
1
0 (h regresso)


Este teste pode ser feito mediante a aplicao do mtodo da
anlise de varincia. Pode-se identificar dois tipos de
varincia diferentes: a total e a residual.

A varincia total estimada atravs de:

1 n
S
1 n
) y y (
s
YY
n
1 i
2
i
2
T




A varincia residual (ou em torno da reta de regresso)
estimada atravs de:

2 n
S b S
2 n
) y y (
s
XX
2
1 YY
n
1 i
2
i i
2
R


ESTATSTICA II 205
ALBERTO W. RAMOS


Lembrando que

SQ
TOTAL
= SQ
REGRESSO
+ SQ
ERRO


ento, a varincia devido ao modelo de regresso estimada
atravs de:

1
S b
s
XX
2
1
2
M


Se a regresso for significativa, ento a varincia residual (ou
devida ao erro) deve ser pequena quando comparada com a
varincia devida a regresso. Conseqentemente, o
quociente das duas varincias (regresso/erro) pode ser
testado mediante um F-Snedecor. Em termos de tabela, este
teste fica:

Fonte GL SQ QM F
calc


Regresso

1

b
1
2
S
XX



2
M
s 2
R
2
M
s
s


Residual

n-2

S
YY
b
1
2
S
XX


2
R
s



Total


n-1

S
YY




F
calc
ser comparado contra F
crit
= F
1; n-2;
e se F
calc
> F
crit


rejeita-se H
0

ESTATSTICA II 206
ALBERTO W. RAMOS




COEFICIENTE DE DETERMINAO


Se dividirmos a soma de quadrados devido regresso
(SQ
REGRESSO
) pela soma de quadrados total (SQ
TOTAL
), a
este ndice chamamos de coeficiente de determinao
(R
2
). Numericamente:

YY
XY 1
YY
XX
2
1
2
S
S . b
S
S . b
R


O coeficiente de determinao informa que % da variao
de Y explicada pela variao de X. Logo, quanto maior o
valor de R
2
, maior chance de que a regresso seja vlida
estatisticamente falando.

Perceba que R
2
nada mais do que o coeficiente de
correlao (R) elevado ao quadrado, ou seja:

YY XX
2
XY
YY
XY 1
YY
XX
2
2
S . S
S
S
S . b
S
S . b
R
1








ESTATSTICA II 207
ALBERTO W. RAMOS


INTERVALOS DE CONFIANA


a) Para a reta de regresso

Seja x um valor que no foi utilizado para o clculo da reta.
Nesta circunstncia, tem-se:

XX
2
R
1 0
S
) x ' x (
n
1
) ' y (
' x ) ' y (

+
+



Ento, o IC para a reta de regresso

XX
2
R 2 / ; 2 n
S
) x ' x (
n
1
s . t ' y


+ t





b) Para Futuras Observaes

Neste caso, o intervalo (de previso) fica:

XX
2
R 2 / ; 2 n
S
) x ' x (
n
1
1 s . t ' y

+ + t




ESTATSTICA II 208
ALBERTO W. RAMOS



ANLISE DE RESDUOS
O erro do modelo estimado mediante o resduo e, definido
como sendo a diferena entre o valor observado (y) e o valor
previsto pela equao obtida (y-chapu). Assim, no exemplo:


Amostra x y y e = y - y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
130
81
93
113
90
63
55
102
92
81
103
90
74
73
102
78
100
100
10,1
10,5
11,3
10,5
11,6
12,4
15,0
11,3
12,4
12,0
10,9
11,6
12,4
13,1
10,9
12,0
10,5
10,5
9,4
12,0
11,4
10,3
11,6
13,0
13,5
10,9
11,4
12,0
10,8
11,6
12,4
12,5
10,9
12,2
11,0
11,0
0,7
-1,5
-1,1
0,2
0
-0,6
1,5
0,4
1,0
0
0,1
0
0
0,6
0
-0,2
-0,5
-0,5

ESTATSTICA II 209
ALBERTO W. RAMOS




Se o modelo (linear) ajustado aos dados for adequado, ento
os resduos devem se apresentar distribudos aleatoriamente
em torno do valor zero, quando marcados num grfico
cartesiano como o abaixo.

x
R
E
S

D
U
O
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
9.5 10.5 11.5 12.5 13.5 14.5 15.5


Padres estranhos observados na forma em que os resduos
se distribuem neste grfico podem indicar problemas.



ESTATSTICA II 210
ALBERTO W. RAMOS




REGRESSO POLINOMIAL

Muitas vezes, ao analisar o diagrama de disperso, fica
evidente que o modelo linear no o mais adequado para a
representao de:

y = f(x) +

Neste caso, o modelo a ser adotado pode ser do tipo
polinomial, ou seja


y =
0
+
1
.x +
2
x
2
+
3
x
3
+
4
x
4
+ ...



De particular interesse o caso em que o polinmio de 2
o

grau, ou seja

y =
0
+
1.
x +
2
.x
2


que ser estimado mediante

2
2 1 0 P
x b x b b y + +



ESTATSTICA II 211
ALBERTO W. RAMOS












Aplicando-se o mtodo dos mnimos quadrados, similarmen-
te ao feito no caso linear, chega-se ao seguinte conjunto de
equaes




+ +
+ +
+ +
4
i 2
3
i 1
2
i 0 i
2
i
3
i 2
2
i 1 i 0 i i
2
i 2 i 1 0 i
x b x b x b y x
x b x b x b y x
x b x b nb y



cuja soluo fornece os valores de b
0
, b
1
e b
2.



ESTATSTICA II 212
ALBERTO W. RAMOS


EXEMPLO


y x x
2
x
3
x
4
xy x
2
y
1 1 1 1 1 1 1
1,2 2 4 8 16 2,4 4,8
1,8 3 9 27 81 5,4 16,2
2,5 4 16 64 256 10 40
3,6 5 25 125 625 18 90
4,7 6 36 216 1296 28,2 169
6,6 7 49 343 2401 46,2 323
9,1 8 64 512 4096 72,8 582

30,5 36 204 1296 8772 184 1227


30,5 = 8b
0
+ 36b
1
+ 204b
2


184 = 36b
0
+ 204b
1
+ 1296b
2


1227 = 204b
0
+ 1296b
1
+ 8772b
2



A soluo deste sistema fornece

b
0
= 1,348 b
1
= -0,414 b
2
= 0,170

Logo, a parbola estimativa ser


2
P
x 170 , 0 x 414 , 0 348 , 1 y +


ESTATSTICA II 213
ALBERTO W. RAMOS



ANLISE DE VARINCIA APLICADA
REGRESSO

Para verificar se a regresso polinomial estatisticamente
significativa, deve-se testar o seguinte conjunto de hipteses:


H
0
:
1
=
2
= 0 (no h regresso)

H
1
: pelo menos um
i
0 (h regresso)


Novamente, a varincia total pode ser estimada atravs de:

1 n
) y y (
s
2
i
2
T





A varincia residual (ou em torno da parbola de regresso)
estimada atravs de:

3 n
e
3 n
) y y (
s
2
i
2
i P i 2
R




Lembrando a propriedade da anlise de varincia que

SQ
TOTAL
= SQ
REGRESSO
+ SQ
ERRO

ESTATSTICA II 214
ALBERTO W. RAMOS










ento, a tabela da anlise de varincia fica


Fonte GL SQ QM F
calc


Regresso

2

por diferena


2
M
s 2
R
2
M
s
s


Residual

n-3

2
i
e

2
R
s



Total


n-1


2
i
) y y (



F
calc
ser comparado contra F
crit
= F
2; n-3;
e se F
calc
> F
crit


rejeita-se H
0
, ou seja, a regresso significativa.

ESTATSTICA II 215
ALBERTO W. RAMOS

EXEMPLO

Empregando-se os dados do exemplo anterior, tem-se que

y x
p
y


e e
2

1 1 1,104 -0,104 0,011
1,2 2 1,2 0 0,000
1,8 3 1,636 0,164 0,027
2,5 4 2,412 0,088 0,008
3,6 5 3,528 0,072 0,005
4,7 6 4,984 -0,284 0,081
6,6 7 6,78 -0,18 0,032
9,1 8 8,916 0,184 0,034

30,5 36 0,198

Ento:

1796 , 8
7
2572 , 57
1 n
) y y (
s
2
i 2
T




0396 , 0
5
198 , 0
3 n
e
3 n
) y y (
s
2
i
2
i P i 2
R





Fonte GL SQ QM F
calc

Regresso 2 57,0592 28,5296 720,444
Residual 5 0,198 0,0396
Total 7 57,2572

Como F
CRIT
= F
2; 5; 5%
= 5,79 A regresso significativa


ESTATSTICA II 216
ALBERTO W. RAMOS


ANLISE DE MELHORIA

Comparando-se o modelo linear com o quadrtico, verifica-se
a seguinte decomposio dos componentes da variao:

Variao
Residual
sobre a
Reta
Variao
Explicada
pela Reta
Variao
Total
Melhoria
do Ajuste
Variao
Residual sobre
a Parbola
Variao
Explicada
pela
Parbola
.



Em outras palavras, pode-se decompor a variao residual
sobre a reta em duas parcelas: variao residual sobre a
parbola e melhoria de ajuste.

O teste de hipteses ser conduzido para avaliar:

H
0
: no h melhoria

H
1
: h melhoria
ESTATSTICA II 217
ALBERTO W. RAMOS








Conseqentemente:


+
2
Pi i
2
i Pi
2
i i
) y

y ( ) y

( ) y

y (


A verificao de que se h melhoria significativa de ajuste
pode ser feita mediante a anlise de varincia

Fonte GL SQ QM F
calc

Melhoria
do
Ajuste

1


2
i Pi
) y y (


2
Melhoria
s 2
P
2
Melhoria
s
s

Residual
sobre a
parbola

n-3


2
Pi i
) y y (

2
P
s


Residual
sobre a
reta

n-2


2
i i
) y y (


F
calc
ser comparado contra F
crit
= F
1; n-3;
e se F
calc
> F
crit


rejeita-se H
0
, ou seja, a melhoria no modelo quadrtico

significativa.

ESTATSTICA II 218
ALBERTO W. RAMOS

EXEMPLO


Com os mesmos dados dos exemplos anteriores, ajustando-
se uma reta por estes, obtm-se:


y = -1,196 + 1,113 x



y x
P
y
2
i i P
) y

(

2
Pi i
) y y (
2
i i
) y y (
1 1 1,104 1,409 0,011 1,173
1,2 2 1,2 0,029 0,000 0,029
1,8 3 1,636 0,257 0,027 0,118
2,5 4 2,412 0,712 0,008 0,572
3,6 5 3,528 0,707 0,005 0,591
4,7 6 4,984 0,248 0,081 0,612
6,6 7 6,78 0,034 0,032 0,000
9,1 8 8,916 1,459 0,034 1,938


30,5 36 4,856 0,198 5,032

Ento

Fonte GL SQ QM F
calc

Melhoria do Ajuste 1 4,856 4,856 122,626
Residual sobre a parbola 5 0,198 0,0396
Residual sobre a reta 6 5,032

Como F
CRIT
= F
1; 5; 5%
= 6,61 H melhoria de ajuste com o
modelo quadrtico.

ESTATSTICA II 219
ALBERTO W. RAMOS



8 7 6 5 4 3 2 1
9
8
7
6
5
4
3
2
1
x
y
S = 0,198356 R-Sq = 99,7 % R-Sq(adj) = 99,5 %
+ 0,169643 x**2
y = 1,34821 - 0,413690 x
Regression Plot





8 7 6 5 4 3 2 1
9
8
7
6
5
4
3
2
1
0
x
y
S = 0,915746 R-Sq = 91,2 % R-Sq(adj) = 89,7 %
y = -1,19643 + 1,11310 x
Regression Plot
ESTATSTICA II 220
ALBERTO W. RAMOS









REGRESSO LINEAR MLTIPLA

Neste caso, a resposta funo de mais de uma varivel e
admite-se que esta funo seja do tipo:


y =
0
+
1
.x
1
+
2
.x
2
+ ... +
k
.x
k
+


que ser estimada mediante

y = b
0
+ b
1
.x
1
+ b
2
.x
2
+ b
3
.x
3
+ ... + b
k
.x
k







ESTATSTICA II 221
ALBERTO W. RAMOS




Se possuirmos dados de y
i
e x
ij


y x
1
x
2
... x
k

y
1
x
11
x
12
... x
1k

y
2
x
21
x
22
... x
2k

.
.
.
.
.
.
.
.
.

...
.
.
.
y
n
x
n1
x
n2
... x
nk


atravs da notao matricial pode-se escrever

y = X. +

onde:


1
1
1
1
1
1
]
1

n
3
2
1
y
.
.
.
y
y
y
y

1
1
1
1
1
]
1

nk n2 n1
2k 22 21
1k 12 11
x ... x x 1
.
.
.
x ... x x 1
x ... x x 1
X

1
1
1
1
1
1
]
1


k
2
1
0
.
.
.

1
1
1
1
1
1
]
1


n
3
2
1
.
.
.


Pelo mtodo dos mnimos quadrados, quer se encontrar o
vetor tal que minimize:

) ( )' ( MQ
n
i
i
X y X y e e' e
1
2


ESTATSTICA II 222
ALBERTO W. RAMOS






que pode ser re-escrita como:


X X' ' y X' ' 2 y y' X X' ' X y' y X' ' y y' + + MQ



como
y X' '
uma matriz 1X1 a sua transposta igual, ou
seja,
X y' y X' ' )' (
. Assim:


0 Xb 2X' y 2X' +

b
MQ



ou


XXb=Xy


ou ainda


b= (XX)
-1
Xy


ESTATSTICA II 223
ALBERTO W. RAMOS



EXEMPLO


y x
1
x
2

1,5 0 0
6,5 1 2
10,0 1 4
11,0 2 2
11,5 2 4
16,5 3 6


Para facilitar os clculos, pode-se utilizar variveis centradas,
ou seja, subtrai-se de x
1
e x
2
as suas respectivas mdias:

y x
1
x
2

1,5 -1,5 -3
6,5 -0,5 -1
10,0 -0,5 1
11,0 0,5 -1
11,5 0,5 1
16,5 1,5 3


Assim, resulta

6 0 0

57
X'X = 0 5,5 9

X'y = 25,5
0 9 22

49

ESTATSTICA II 224
ALBERTO W. RAMOS

Logo:

1/6 0 0

57 9,5
b = (X'X)
-1
X'y = 0 11/20 -9/40 x 25,5 = 3
0 -9/40 11/80

49 1


A equao obtida da forma:

2 1
' x ' x 3 5 , 9 y

+ +


Como

5 , 1 x ' x
1 1

e

resulta em

2 1
x x 3 2 y

+ +


que gera o seguinte plano

ESTATSTICA II 225
ALBERTO W. RAMOS

COMENTRIOS


quando h duas variveis no modelo, obtm-se um plano;

quando h mais do que duas variveis no modelo, obtm-
se um hiperplano, que infelizmente no possvel
representar graficamente;

para se verificar a adequao do modelo, emprega-se a
anlise de varincia, similar regresso polinomial:

Fonte g.l. SQ QM Fcalc
Regresso
Residual
Total
2
3
5
125,5
3,0
128,5
62,75
1,0

62,75

genericamente, o modelo de anlise de varincia

Fonte GL SQ QM F
calc


Regresso

k

por diferena


2
M
s 2
R
2
M
s
s


Residual

n-k-1

2
i
e

2
R
s



Total


n-1


2
i
) y y (


assim como no caso das demais regresses, tambm
recomendvel fazer uma anlise de resduos para
completar a anlise de adequao do modelo;

para k > 2 recomenda-se o emprego de algum software
estatstico na anlise de regresso.
ESTATSTICA II 226
ALBERTO W. RAMOS




COEFICIENTE DE DETERMINAO
MLTIPLO

A idia do coeficiente de determinao anteriormente vista
pode ser adaptada para o caso da regresso mltipla. Neste
caso faz-se:



2
i
2 2
i
TOTAL
REGRESSO 2
) y y (
e ) y y (
SQ
SQ
R
i


Entretanto, quando se lida com modelos de regresso
mltipla, comum tambm calcular o coeficiente de
determinao ajustado. Matematicamente:

( )
1
]
1


1 k n
1 n
R 1 1 R
2 2
AJ

onde:
n a quantidade de pontos (amostras) disponvel;
k a quantidade de variveis independentes (Xs).

Este coeficiente mais adequado a comparaes entre duas
ou mais regresses sobre uma mesma varivel dependente
(Y), quando o nmero de variveis independentes diferente.
A incluso de um novo X faz sempre com que R
2
aumente,
mas no necessariamente R
2
aj
.
ESTATSTICA II 227
ALBERTO W. RAMOS













EXEMPLO

No exemplo da regresso linear mltipla tem-se:

962 , 0
1 2 6
1 6
) 977 , 0 1 ( 1 R
977 , 0
5 , 128
5 , 125
SQ
SQ
R
2
AJ
TOTAL
REGRESSO 2

1
]
1







ESTATSTICA II 228
ALBERTO W. RAMOS






MULTICOLINEARIDADE

Na regresso mltipla, admite-se que as variveis Xs sejam
independentes entre si, ou seja, que no exista correlao
entre elas. Quando isto ocorre, fica impossvel separar o
efeito individual de cada uma das variveis. A este tipo de
problema chama-se de multicolinearidade.

Uma sada para esta questo considerar na equao
somente os Xs com maior R
2
, retirando os demais


Um mtodo para avaliar se existe multicolinearidade entre as
variveis Xs mediante o clculo do VIF (Variation Inflation
Factor), definido como:

2
i
i
R 1
1
VIF



onde
2
i
R
o coeficiente de determinao de X
i
com todos os
demais Xs. Se VIF > 5, ento h problema de
multicolinearidade.
ESTATSTICA II 229
ALBERTO W. RAMOS


EXEMPLO


No exerccio anterior, podemos calcular R
2
de x
1
com x
2
. Este
simplesmente o coeficiente de correlao elevado ao
quadrado.

x
1
x
2
x
2
1
x
2
2
x
1
.x
2

0 0 0 0 0
1 2 1 4 2
1 4 1 16 4
2 2 4 4 4
2 4 4 16 8
3 6 9 36 18
Total 9 18 19 76 36

818 , 0
22 . 5 , 5
9
R
22
6
18
76 S
5 , 5
6
9
19 S
9
6
18 . 9
36 S
2
2 X 2 X
2
1 X 1 X
2 X 1 X







02 , 3
) 818 , 0 ( 1
1
VIF VIF
2
2 1




Conclui-se que no h problema com multicolinearidade.
ESTATSTICA II 230
ALBERTO W. RAMOS






CORRELAO PARCIAL

Estudos de correlao indicam se duas (ou mais) variveis
esto associadas, ou seja, se quando uma destas varia a
outra (ou outras) tambm varia(m).

Quando se tem, por exemplo, trs variveis X
1
, X
2
e X
3
,
pode-se querer estudar a correlao existente entre elas
tomando-se duas a duas variveis. Assim, r
12
seria o
coeficiente de correlao entre X
1
e X
2
, r
13
, entre X
1
e X
3
, etc.

Contudo, estes ndices medem a correlao total entre as
variveis, ou seja, no descontam o efeito da terceira varivel
presente no estudo.

Conseqentemente, se desejado o clculo da correlao
parcial de X
1
e X
2
, esta deve ser calculada mediante o ndice:

) r 1 )( r 1 (
r r r
r
2
23
2
13
23 13 12
3 , 12



ESTATSTICA II 231
ALBERTO W. RAMOS




EXEMPLO


x
1
x
2
x
3

0 0 1
1 2 2
1 4 3
2 2 4
2 4 5
3 6 6


866 , 0 r
968 , 0 r
818 , 0 r
23
13
12



Logo,

162 , 0
) 866 , 0 1 )( 968 , 0 1 (
866 , 0 . 968 , 0 818 , 0
r
2 2
3 , 12





EXERCCIO

Calcular r
23,1
e r
13,2
com os dados anteriores.


ESTATSTICA II 232
ALBERTO W. RAMOS
















Teste Qui-
quadrado


ESTATSTICA II 233
ALBERTO W. RAMOS




TESTE QUI-QUADRADO

O teste Qui-quadrado serve para avaliar se duas variveis
qualitativas (tambm chamadas de categricas) so ou no
independentes entre si.

Variveis
Quantita-
tivas
Qualita-
tivas
Contnuas
Discretas
Ordinal
Nominal
.



Logo, o conjunto de hipteses que est sendo testado :

H
0
: as variveis so independentes
H
1
: as variveis so dependentes
ESTATSTICA II 234
ALBERTO W. RAMOS












EXEMPLO

Uma amostra de 300 estudantes de uma universidade foi
obtida, e estes foram classificados quanto a :

rea de concentrao : Exatas ; Humanas
Jornal preferido : A, B, C, Outros

Obtendo-se os seguintes resultados.


O
ij
Jornal A Jornal B Jornal C Outros Total
Exatas 60 20 90 20 190
Humanas 30 40 30 10 110
Total 90 60 120 30 300



Existem evidncias de que rea de Concentrao e Jornal
Preferido estejam relacionados (dependncia) ?

ESTATSTICA II 235
ALBERTO W. RAMOS

As hipteses testadas, neste caso, so:

H
o
: rea e Jornal Preferido so independentes
H
1
: rea e Jornal Preferido no so independentes


Na amostra havia 190 alunos de Exatas, num total de 300, ou
seja, 190/300 = 0,633 ou 63,3% e, conseqentemente, havia
110/300 = 0,366 ou 36,6% de alunos de Humanas.


Na coluna do Jornal A obteve-se um total de 90 alunos. Se
no houver dependncia entre rea e jornal, espera-se que:

Proporo de Exatas
57 90 x
300
190



Proporo de Humanas
33 90 x
300
110



Analogamente, para as demais colunas, obtm-se os valores
entre parnteses da tabela abaixo.


O
ij
(E
ij
) Jornal A Jornal B Jornal C Outros Total
Exatas 60(57) 20(38) 90(76) 20(19) 190
Humanas 30(33) 40(22) 30(44) 10(11) 110
Total 90 60 120 30 300

Ou, genericamente:

E
L C
n
ij
i j




L
i
= Total da linha i C
j
= Total da coluna j
ESTATSTICA II 236
ALBERTO W. RAMOS




Assim, pode-se obter as diferenas entre o observado (O
ij
) e
o esperado (E
ij
) na tabela, conforme abaixo:


O
ij
- E
ij
Jornal A Jornal B Jornal C Outros Total
Exatas +3 -18 +14 +1 0
Humanas -3 +18 -14 -1 0
Total 0 0 0 0 0


Define-se como Qui-quadrado, estatstica:



ij
2
ij ij 2
calc
E
) E O (



2

Jornal A Jornal B Jornal C Outros Total
Exatas 0,158 8,526 2,579 0,053 11,316
Humanas 0,273 14,727 4,455 0,091 19,545
Total 0,431 23,254 7,033 0,144 30,861


que, para a deciso, ser comparado contra

815 , 7
2
% 5 ; 3
2
); 1 C )( 1 L (
2
crtico





como
2
calc

>
2
crtico

Rejeito H
o



ESTATSTICA II 237
ALBERTO W. RAMOS












TABELA DE VALORES CRTICOS QUI-QUADRADO


= 0,10 = 0,05 = 0,01
1 2,706 3,841 6,635
2 4,605 5,991 9,210
3 6,251 7,815 11,345
4 7,779 9,488 13,277
5 9,236 11,070 15,086
6 10,645 12,592 16,812
7 12,017 14,067 18,475
8 13,362 15,507 20,090
9 14,684 16,919 21,666
10 15,987 18,307 23,209
11 17,275 19,675 24,725
12 18,549 21,026 26,217
13 19,812 22,362 27,688
14 21,064 23,685 29,141
15 22,307 24,996 30,578

Das könnte Ihnen auch gefallen