Beruflich Dokumente
Kultur Dokumente
e a XP Investimentos! Procure a
Secretaria.
Estatística
Turma Preparatória
BNDES/Economia
A distribuição de frequências é
uma tabela que agrupa os dados
em classes (intervalos), indicando o
número ou a proporção de observações
que pertencem a cada uma das classes.
Frequências
10
8
6
4
2
0
Classes
2-|5 5-|8 8-|11 11-|14 14-|17 17-|20
Ogiva
• Gráfico de Pizza ou de Setores
xx 1 x 2 ... x n
i
i 1
.
n n
no de i-ésima
observações observação
No exemplo 1.1, o faturamento médio
é = 307,7/30 = 10,3 milhões.
Nenhum problema!
A média de um conjunto de dados não
precisa ser um dos valores observados.
Exemplo 1.5:
Se n for par:
Md = média das duas observações centrais.
Exemplo 1.5 (cont.):
Salários ordenados:
2,6; 2,8; 3,0; 3,1; 6,0.
Md = 3,0.
5 ganham R$ 2.500,00;
2 ganham R$ 3.000,00;
3 ganham R$ 4.000,00;
2 ganham R$ 4.500,00.
x 1 x 1 2 x 2 ... n x n
i i
p i 1
.
1 2 ... n
n
i i 1
0 | 50 KWh 8%
50 | 100 KWh 12%
100 | 150 KWh 32%
150 | 300 KWh 40%
300 | 500 KWh 8%
Total: 100%
0 | 50 KWh 8%
50 | 100 KWh 20%
100 | 150 KWh 52%
150 | 300 KWh 92%
300 | 500 KWh 100%
A figura a seguir posiciona a mediana
(= 100+h) na distribuição acumulada:
h é calculado por meio da seguinte regra de três:
150 100 52 20
.
h 50 20
n ( x )
i
( x i ) ou i 1
.
i 1 n
Solução:
Problema: trabalhar com
os quadrados
n dos desvios!
(x ) 0, sempre!
i 1
i
Variância 2
( )
(x i ) 2
2 i 1
.
n
n n
x 2
i n 2
x 2
i
2 i 1
i 1
.
2
n n
Exemplo 1.9 (cont.):
Interpretação?
A variância apresenta um sério problema: ela
é expressa no quadrado da unidade original,
em geral uma unidade que sequer faz sentido.
. 2
99,72%
• Variância Amostral (s2)
média amostral.
n n
(x i x) 2
x 2
i nx 2
s
2 i 1
i 1
.
n 1 n 1
j1
2
.
n
Exercício 1.4 - Calcule a variância dos pesos
na população do exercício 1.2, com base
apenas na distribuição de frequências:
Classe Frequência
40 | 50 Kg 2
50 | 60 Kg 5
60 | 70 Kg 7
70 | 80 Kg 8
80 | 90 Kg 3
R: 128.
Coeficiente de Variação (CV)
CV .
0 | 50 KWh 8%
50 | 100 KWh 20%
100 | 150 KWh 52%
150 | 300 KWh 92%
300 | 500 KWh 100%
A figura a seguir posiciona Q1 (= 100+h)
na distribuição de frequências acumuladas:
h é calculado por meio da seguinte regra de três:
150 100 52 20
.
h 25 20
300 150 92 52
.
h 75 52
Q = Q3 – Q1.
Solução:
• Diagrama de Dispersão
Um diagrama de dispersão é um
gráfico de pontos {(xi,yi); i = 1,2,...,n}
que indica se parece ou não existir
alguma relação entre 2 variáveis X e Y,
e identificar o tipo de relação existente.
n n
( x i X )( y i Y ) x i yi X Y
XY i 1
i 1
.
n n
Coeficiente de Correlação
O coeficiente de correlação é um
número entre -1 e 1, que mede a força
da associação linear entre X e Y.
Fórmula:
XY
XY .
XY
Interpretação do
Coeficiente de Correlação:
- Se a relação linear entre X e Y for
positiva, a correlação está entre 0 e 1.
Quanto mais forte, mais próxima de 1.
- Se a relação linear entre X e Y for
negativa, a correlação está entre -1 e 0.
Quanto mais forte, mais próxima de -1.
- Se não houver relação linear: o valor
do coeficiente de correlação é zero.
Obs - Correlação x Independência!
1 - Experimento Aleatório
2 - Espaço Amostral
3 - Evento.
Exemplos:
2.1 - Lançar um dado e observar a
face que fica voltada para cima.
2.2 - Selecionar uma bolinha de uma urna com
bolinhas vermelhas e azuis e verificar sua cor.
Embora o resultado de um experimento
aleatório não possa ser pré-determinado,
é possível descrever o conjunto dos
resultados que podem ocorrer.
Notação: S.
No exemplo 2.1 – S = {1,2,3,4,5,6}.
No exemplo 2.2 – S = {´azul`,´vermelha`}.
Evento
Um evento é um
subconjunto do espaço amostral.
AB = {2,4,5,6}.
AB = {4,6}.
Notas de Aula - Professor Eduardo
Lima Campos.
Probabilidade – Definição
casos favoráveis
#A
P( A) ao evento A
#S casos possíveis
Exemplo 2.3 - Seja o experimento: lançar 3
moedas e observar as faces voltadas para cima.
Solução:
A = {(CA,CA,CO);(CA,CO,CA);(CO,CA,CA)}
#A = 3 casos favoráveis.
#A 3
P( A) .
#S 8
Lei da Adição
(Probabilidade do ´OU`)
Sejam A e B dois eventos, com interseção
AB. Qual a probabilidade de AB?
(ou seja, de que A ou B ocorram)
A Lei da Adição fornece a solução deste
problema, por meio da seguinte fórmula:
a) A = {(3,4),(4,3),(2,5),(5,2),(1,6),(6,1)}
e B = {(5,6),(6,5)} e AB = . Portanto:
A e B são mutuamente exclusivos.
b) A ={(3,6),(6,3),(4,5),(5,4),(4,6),(6,4),
(5,6),(6,5),(5,5),(6,6)}, B =
{(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}
e AB = {(5,5),(6,6)}. Portanto:
A e B não são mutuamente exclusivos.
Exemplo 2.6 - Distribuição por sexo dos
funcionários promovidos em uma empresa:
Sejam 2 eventos A e B,
tais que P(B)>0.
A probabilidade de A dado B é:
P(A|B) = P(AB)/P(B)
a) Calcule P(A|B).
R: 2/3.
Eventos Independentes
Ou seja, se:
P(A|B) = P(A)
Notas de Aula - Professor Eduardo
Lima Campos.
Exemplo 2.7 (cont.) - b) A: ´face par` e
B: ´face > 3` são eventos independentes?
P(A|B) = P(AB)/P(B).
P(AB) = P(A|B)P(B)
P(AB) = P(A|B)P(B)
Solução do exemplo 2.9, item a:
Assim:
P(AB) = 8/33.
P(A|B) A
P(B) B
P(Ac|B) Ac
P(A|Bc) A
P(Bc)
Bc
P(Ac|Bc) Ac
Notas de Aula - Professor Eduardo
Lima Campos.
• Forma-Produto para Independência
Considere novamente:
A = segunda bolinha azul e
B = primeira bolinha vermelha.
P(A|B) A
P(B) B
P(Ac|B) Ac
P(A|Bc) A
P(Bc)
Bc
P(Ac|Bc) Ac
Notas de Aula - Professor Eduardo
Lima Campos.
Lei da Probabilidade Total
Assim:
P(A) = 2/3.
Notas de Aula - Professor Eduardo
Lima Campos.
Exemplo 2.10 - A empresa X lança um
serviço inédito de envio de mensagens
pelo celular. Ela calcula que este novo
serviço gera lucro no primeiro ano com
probabilidade 0,6, caso o concorrente
não introduza um serviço semelhante.
Caso contrário, a probabilidade de lucro
é 0,3. Suponha ainda que exista 50% de
chances de que o concorrente introduza
um serviço semelhante naquele ano.
Este é um padrão de problema clássico de
probabilidade, cujas variantes costumam
ser cobradas em provas de concurso. Para
solucioná-lo, é fundamental identificar:
a) Qual a probabilidade de
que ele seja defeituoso?
Pede-se P(A)
P(B|A) = P(AB)/P(A)
= P(A|B)P(B)/P(A)
= 0,01*0,6/0,014 = 0,429.
A = ´passar no concurso`
B = ´ter cursado o DSc`.
Pede-se P(A).
Pede-se P(B|A)
P(B|A) = P(A|B)P(B)/P(A)
= 0,9*0,7/0,72 = 0,875.
Solução do Item b:
P(B2|A) = P(A|B2)P(B2)/P(A)
= 0,02*0,3/0,023 = 0,2609.
Lei da Adição para 3 Eventos:
P(ABC) = P(A) + P(B) + P(C) -
P(AB) - P(AC) - P(BC) + P(ABC).
3 eventos A, B e C são
independentes se, e somente se:
P(ABC) = P(A)P(B)P(C),
P(AB) = P(A)P(B),
P(AC) = P(A)P(C),
e
P(BC) = P(B)P(C).
3. VARIÁVEIS
ALEATÓRIAS
Variável Aleatória (V.A.)
x P(X=x)
0 1/8
1 3/8
2 3/8
3 1/8
Distribuição de Probabilidade
Contínua (Função de Densidade)
Uma distribuição contínua f(x) é
uma função que permite calcular
a probabilidade de que uma v.a.
contínua pertença a um intervalo.
f ( x )dx
6.000
x
A figura mostra: P(6.000X8.000).
Propriedades de uma função de densidade:
b) Calcule P(X>1).
R: a) 3/8 b) 7/8.
Valor Esperado
Solução:
E(X) = 0*1/2 + 1*1/3 + 2*1/6 = 2/3.
Observações:
E(X) x f (x)dx.
Exemplo 3.6 - Calcule E(X),
sendo X a v.a. definida no exemplo 3.4.
f(x)
2
3 2
E(X) x x dx
0 8
2 4 2
3 3 3x 3
x dx .
80 8 4 0
2
• Mediana de uma V.A.
Solução:
k3 2 3k 2
x dx 0,5 x dx 0,5
08 80
3
k
0,5 k 4 k 4.
3 3
8
Variância de uma V.A.
x
A variância pode ser
calculada da seguinte forma equivalente:
Sendo:
E(X ) x P(X x ), no caso discreto
2 2
e
E(X ) x f(x) dx, no caso contínuo.
2 2
Exemplo 3.7 (cont.) - Recalcule V(X),
usando a forma equivalente do slide anterior.
Solução:
0 8
5 2
32 4 3x 12
x dx .
80 8 5 0
5
2
12 3 3
V(X) E(X ) E (X) .
2 2
5 2 20
• Desvio Padrão de uma V.A.
DP(X) V(X)
DP(X)
CV(X) .
E ( X)
• Algumas Propriedades Importantes
do Valor Esperado e da Variância
E(Z) = 0 e V(Z) = 1.
Solução:
Para 0 x < 1:
x x
F( x ) P(X x ) f ( x )dx 2xdx x .
2
0 0
Para x 1, F(x) = 1.
Propriedades da F.D.A.:
1. Lim F(x) 0 e Lim F(x) 1.
x x
Se Cov(X,Y) = 0:
E(XY) –E(X)E(Y) =0
E(XY) = E(X)E(Y).
E(X2Y2) = E(X2)E(Y2)
E(XY2) = E(X)E(Y2)
E(X2Y) = E(X2)E(Y)
E(X3Y3) = E(X3)E(Y3)
Etc.
• Combinações Lineares de V.A.`s
n
C a i Xi .
i 1
Valor Esperado:
1
P(X x ) , x 1, 2, ..., k.
k
Experimento de Bernoulli é um
experimento aleatório que possui
apenas dois resultados possíveis.
Exemplos:
4.2 - Lançar uma moeda e
observar a face voltada para cima.
4.3 - Observar se um atirador acerta o alvo.
Um dos resultados é chamado
“sucesso”, e o outro, “fracasso”.
A probabilidade de sucesso
é designada por p.
Como consequência, a
probabilidade de fracasso é 1-p.
.
Seja agora uma v.a. X que assume valor
0, se ocorre um fracasso, e 1, se ocorre
um sucesso. A distribuição desta v.a. é:
x P(X=x)
0 1-p
1 p
Façamos:
{CA} = sucesso e {CO} = fracasso.
n (número de realizações) e p
(probabilidade de sucesso) são
os parâmetros da distribuição.
Fórmula da Distribuição Binomial:
n p x (1 p) n x
P(X x) , x 0,1,..., n; 0 p 1.
x
probabilidade de
n! obter x sucessos
. em n realizações
x!(n x )!
independentes
Notação usual: X ~ Bin(n,p).
(“~” significa “segue distribuição”)
Solução do Exemplo 4.4:
3 1
2 1
1 3
P(X 2) .
2 2 2 8
Exemplo 4.5 - Qual a probabilidade de
que um atirador acerte o alvo 3 vezes em 5
tentativas, se a probabilidade dele acertar
um tiro em uma tentativa qualquer é 2/3?
Solução:
A v.a. de interesse é:
X = número de acertos.
Se considerarmos que as tentativas são
independentes, então: X ~ Bin(5,2/3).
Daí:
5 2
3 2
1
P(X 3) 0,3292.
3 3 3
Valor Esperado e Variância da Binomial:
E(X) = np
V(X) = np(1-p)
20
P(X 6) 0,2 0,8 0,1091.
6 14
6
N
.
n
O número de casos favoráveis é dado
pelo número de formas de extrair x
sucessos dentre os r possíveis e (n-x)
fracassos dentre os N-r possíveis:
r N r
.
x n x
Fórmula da Distribuição Hipergeométrica:
r N r
x n x
P(X x ) .
N
n
probabilidade de que ocorram x sucessos, em
uma amostra sem reposição de tamanho n
8 13 8 8 5
3 4 3 3 1
P(X 3) 0,3916.
13 13
4 4
Exemplo 4.8
4 6
P(X 2) 2 3
0,4762.
10
5
Valor Esperado e Variância
da Hipergeométrica:
r
E( X ) n
N
r r N n
V(X) n 1
N N N 1
• Aproximação da
Hipergeométrica pela Binomial
300 700
P(X 5) 5 5
.
1000
10
10
P(X 5) (0,3) (0,7) 0,1029.
5 5
5
x 1
P(X x) (1 p) p, x 1,2,...; 0 p 1.
Parâmetro: p.
Notação: X ~ Geom(p).
Exemplo 4.10 - A probabilidade de um
indivíduo acertar um alvo é 2/3. Se ele
deve atirar até que acerte o alvo pela
primeira vez, qual a probabilidade de
que sejam necessários exatamente 5 tiros?
E(X) = 1/p
V(X) = (1-p)/p2
Pede-se P(X=1).
5
P(X 1) (0,1) (0,9) 0,32805.
1 4
1
b) Seja X o número de cobranças até que
o jogador acerte a primeira. Então:
X ~ Geom(0,1).
Pede-se:
1) P(Y=1) = n*P(X=n)
2) P(X>n) = P(Y = 0)
• Distribuição Binomial Negativa
Considere novamente realizações
independentes de experimentos de
Bernoulli com probabilidade de sucesso p.
A v.a. que representa o número de realizações
necessárias até que ocorra o r-ésimo sucesso
(r = 1, 2, ...) segue uma distribuição chamada
binomial negativa, com parâmetros r e p.
Se r = 1, caímos na distribuição
geométrica (caso particular).
• Distribuição de Poisson
x
e
P( X x ) , x 0,1,...; 0.
x!
Parâmetro: .
Notação usual: X ~ Poi().
Valor Esperado e Variância da Poisson:
E(X) =
V(X) =
32 e 3 3
a ) P(X 2) 4,5e .
2!
É a distribuição contínua
mais simples que existe.
Parâmetros: e .
Notação: X ~ Unif(,).
Cálculo de Probabilidades
Utilizando a Uniforme:
P(aXb) = (b-a)/(-)
Valor Esperado e Variância da Uniforme:
E(X) = (+)/2
V(X) = (-)2/12
Exemplo 5.1 - As notas de uma turma
apresentam média 5 e variância 3. A
nota mínima para aprovação é 7.
R: 1/6.
• Distribuição Exponencial
Fórmula da Exponencial:
f (x) e , x 0; 0.
x
Parâmetro: .
Notação: X ~ Expo().
E(X) = 1/
V(X) = 1/2
Função Distribuição
Acumulada da Exponencial:
Para x>0:
x
F( x ) P(X x ) e dx x
0
x
1 e x
e dx
x
1 e . x
0
Exemplo 5.2 - O tempo de espera em
uma fila segue distribuição exponencial.
Se um cliente espera, em média, 10 minutos
para ser atendido, qual a probabilidade:
a) De que demore menos do que 12 minutos
para ele ser atendido? R: 1-e-1,2.
b) De que demore menos do que 7 minutos
para ele ser atendido? R: 1-e-0,7.
c) E entre 7 e 12 minutos? R: e-0,7-e-1,2.
d) De que ele espere mais do que 10 minutos
(isto é, mais do que a média E(X))? R: e-1.
• Falta de Memória
P(X>x+s|X>x) = P(X>s).
Interpretação: se uma lâmpada já durou x
horas, a probabilidade dela durar mais s
horas a partir dali é a mesma que ela teria
de durar s horas a partir da sua fabricação.
P(X>x+s|X>x) =
P[(X>x+s)(X>x)]/P(X>x) =
P(X>x+s)/P(X>x) =
e-(x+s)/e-x = e-s
= P(X>s), C.Q.D.
• Relação entre a Exponencial e a Poisson
Se o número X de ocorrências de um
evento por unidade de tempo segue
distribuição de Poisson com parâmetro :
X ~ Poisson (),
então o intervalo de tempo T (medido
na mesma unidade de tempo) entre duas
ocorrências sucessivas segue distribuição
exponencial com parâmetro , ou seja:
T ~ Expo().
Exemplo 5.3 - O número de navios que
chega a um porto cujo estaleiro comporta
4 navios segue distribuição de Poisson.
A cada 24 horas, aportam, em média, 12
navios. Com base nestes dados, calcule:
a) A probabilidade de que, no intervalo de
uma hora, nenhum navio venha a aportar.
b) A probabilidade de que o tempo decorrido
entre dois navios seja superior a uma hora.
R: a) e-0,5 b) e-0,5.
• Distribuição Normal
( x ) 2
1
f (x) e 2 2
; x ; , 0.
2
2
( x 170) 2
1
172, 3
P(170 X 172,3) e 50
dx
170 5 2
Problema:
( x ) 2
1
A integral de f ( x ) e 2 2
2
não possui solução analítica!
Para calcular a probabilidade
solicitada, usaremos a tabela Normal.
Z = (X-)/,
que possui média zero e variância 1
(como demonstrado no capítulo 3).
P(170 X 172,3)
170 X 172,3
P
170 170 172,3 170
P Z
5 5
P(0 Z 0,46).
P(170 X 175)
170 X 175
P
170 170 175 170
P Z
5 5
P(0 Z 1).
Ilustrando na Tabela Normal:
Resposta final do item b): 0,34134.
Solução:
99,72%
Considerando =
E(X) e = DP(X).
e) Qual a probabilidade de que a altura
do aluno esteja entre 170 e 180 cm?
?
Interpolando: z0,005 = 2,575.
Resumo - valores importantes
envolvendo a distribuição Normal:
z0,025 = 1,96
z0,05 = 1,645
z0,005 = 2,575.
n
E(S) E(Xi ).
i 1
• Variância da Soma de n
V.A.`s Descorrelacionadas:
n
V(S) V(Xi ).
i 1
Exemplo 5.6 (cont.) - No exemplo do
elevador, suponha que os pesos das
pessoas tenham média = 70 e
variância 2 = 100. Neste caso:
n
E(S) E(X i ) n 7 * 70 490.
i 1
n
V(S) V(X i ) n 7 *100 700.
2
i 1
• Soma de Normais Independentes
com Médias e Variâncias Iguais
Considere a soma S de n v.a.`s Xi, i =
1,2,...,n, Normais e independentes,
c/ médias e variâncias 2. Então:
S ~ N(n, n ).2
P(X 502)
X 502
P
502 500
P Z
4
P( Z 0,5) 0,30854.
Se selecionarmos 100 pacotes (considere
os pesos dos pacotes independentes):
i 1
49.960 50.000
P(S 49.960) P Z
40
PZ 1 P(1 Z 0) 0,5
P(0 Z 1) 0,5 0,84134.
• Média de V.A.`s
n
Xi
X i 1
.
n
2
X ~ N(, ).
n
1 n 1 n
E( X ) E( X i ) E( X i )
n i1 n i1
1 n 1
E(X i ) n .
n i1 n
Variância de x:
2
1 n 1 n
V( X ) V( X i ) V( X i )
n i1 n i1
1 2
2
1
2
n
V(X i ) 2 n .
n i1 n n
v.a.`s descorrelacionadas
Exemplo 5.7 (cont.) - c) Qual a
probabilidade do peso médio dos 100
pacotes ser menor do que 500,7 g?
Solução: peso médio = X ~ N(, ).
2
X
o chapéu significa média da
que estamos i amostra
estimando ˆ X i 1
. ou média
amostral
n
• Estimador x Estimativa
Quando substituímos no estimador os
valores observados de X1, X2, ..., Xn,
obtemos uma estimativa do parâmetro.
P( X )
Se a população é Normal, a
distribuição de x é Normal.
E(ˆ ) .
Resultado importante (visto no capítulo 5):
B(ˆ ) E(ˆ ) .
Do inglês: bias = vício.
Embora a ausência de vício seja uma
propriedade importante, ela não garante
que um estimador seja adequado.
distribuiç ão de ˆ 1
distribuiç ão de ˆ 2
- +
Quanto menor a
variância, maior será:
P( ˆ ),
X1 X 2 X 3
ˆ 1 X
3
X1 X 3
e ˆ 2 .
2
ˆ ˆ ˆ
V() E[ E()] ,
2
ˆ
E( ) .
2
ˆ ˆ 2 ˆ
EQM() V() B ().
2
e assim: EP ( X )
V( X ) .
n n
• Estimação de 2
n n
(X i X) 2
X 2
i nX 2
S
2 i 1
i 1
.
n 1 n 1
Um estimador ̂ é consistente se à
medida que o tamanho n da amostra
aumenta, a distribuição amostral de ̂ vai se
concentrando cada vez mais em torno de .
Exemplo 6.3
X é um estimador consistent e para a média
de uma população. Este importante resultado
é conhecido como Lei dos Grandes Números.
Um estimador é consistente se ele
satisfaz a uma das seguintes condições:
1) É não viciado e:
Lim V(ˆ ) 0.
n
assintoticamente
não viciado. ou 2) É viciado, mas:
f (ˆ )
f (ˆ )
f (ˆ )
f (ˆ )
• Estimação Pontual x Intervalar
Possivelmente haverá o
chamado erro de estimação:
x .
IC100(1 )% () x z ; x z .
2 n 2 n
grau de confiança do IC
(90, 95 ou 99 %).
Solução:
6 6
IC95% () 180 1,96 ;180 1,96
5 5
= [174,74;185,26].
• Grau de Confiança x Probabilidade
IC95% () x 1,96 ; x 1,96 ,
5 5
z
2
2
n 2
.
2
Se 2 é desconhecida, a distribuição usada
no IC não é a Normal, e sim a t de Student:
não é mais Normal, e s
t de Student com n-1 graus de liberdade!
• IC p/ a Média de uma População Normal
(considerando desconhecido e estimado)
s s
IC100(1 )% () x t ;x t .
n 1;
2 n n 1;
2 n
n
i
( x x ) 2
s2 i 1
n 1
(174 180) 2 (186 180) 2 (186 180) 2 (180 180) 2 (174 180) 2
4
36 s 36 6.
O valor na tabela t deve ser procurado
para 4 graus de liberdade e = 0,05:
t 4;0,025 2,7764.
Substituindo na fórmula do IC, temos:
6 4
IC95% () 180 2,7764 ;180 2,7764
5 5
= [172,55;187,45].
2 2
s s
IC100(1α)% (σ ) (n 1) 2 ; (n 1) 2
2
.
χ α χ α
n 1,
2
n 1, 1
2
132,7 132,7
IC95% (σ ) 29
2
;29 [84,21;240 ,52].
45,7 16
7. TESTES DE
HIPÓTESES
• Testes de Hipóteses
nível de significância.
• Nível de Significância
Porque isto aumentaria muito a exposição
ao erro oposto, ou seja, o de não rejeitar H0
quando ela é falsa, chamado erro tipo II.
O erro tipo II é o erro que consiste em
não rejeitar H0, quando ela é falsa.
H0 Verdadeira H0 Falsa
90% 0,1
95% 0,05
99% 0,01
Exemplo 7.1 (cont.)
H0: = 175
x
H1: 175,
Xk
Z .
/ n
Quando H0 é verdadeira
( = k), sabemos que:
Xk
Z ~ N(0,1).
/ n
xk
z0 .
/ n
RC = (-,-z/2][z/2,).
este valor é chamado valor crítico.
• Por Que Rejeitar H0 Quando z0 RC?
P(ZRC) = P[(Z-z/2)(Zz/2)] = ,
que é um valor pré-especificado e baixo.
Xk
T .
S/ n
xk
t0 .
s/ n
E a região crítica é:
RC = (-,-tn-1;/2][tn-1;/2,).
No exemplo 7.1, vamos agora considerar
desconhecido e testar as mesmas hipóteses:
H0: = 175
x
H1: 175,
RC = (-,-2,7764][2,7764,).
O correto seria:
3 - Cálculo de t0:
H 0: p = k
H1: p k,
p̂ p
Z N(0,1).
p(1 p)
n
p̂ k
Z .
k (1 k )
n
O teste consiste em calcular o valor da
estatística Z para a amostra observada:
p̂ k
z0 ,
k (1 k )
n
H0: p = 0,3
H1: p 0,3,
RC = (-,-1,645][1,645,).
0,3125 0,3
z0 0,2182.
0,3(1 0,3)
64
R: IC95%(p) = [0,5927;0,8073].
Rejeita-se H0 ao nível 0,05.
Exemplo 7.5 - Uma emissora de TV
afirma que o índice de audiência de seu
programa “carro chefe”, em determinada
localidade e horário, é de 60%. Um
instituto de pesquisa entrevista 400
pessoas naquela localidade. Se 220
entrevistados assistem ao programa no
horário em questão, existe evidência
estatística contra a afirmativa feita pela
emissora, ao nível de significância 0,05?
Solução:
H0: p = 0,6
H1: p < 0,6,
0,55 0,6
z0 2,04.
0,6(1 0,6)
400
se p-valor rejeitamos H0
se p-valor > não rejeitamos H0
Exemplo 7.6 - O p-valor obtido para um
teste foi 0,07. Qual a conclusão do teste
para os 3 níveis de significância usuais?
Solução:
Se z0 = z, o p-valor é
igual a , e H0 é rejeitada.
Exemplo 7.7 - Calcule o p-valor do teste
do exemplo 7.3, e utilize-o para formular
sua conclusão aos três níveis usuais.
Solução :
conclusão?
p - valor PH 0 (Z 2,5) 0,5 0,49379 0,00621.
R: 0,02068.
Poder de um Teste
O poder de um teste de
hipóteses é a probabilidade de
rejeitar H0 quando ela é falsa.
H0 Verdadeira H0 Falsa
= 1-.
• Cálculo do Poder de um Teste
O poder de um teste é
calculado da seguinte forma:
X - 30
Z 1,645 1,645
3 / 25
X 1,645 * 0,6 30 X 30,99.
Passo 2 Aplicar a definição de :
PH1 ( Z RC ) PH1 ( X 30,99).
Passo 3 Padronizar X :
30,99
() PH1 ( Z ).
0,6
30,99 32 1,01
(32) P( Z ) P( Z )
3 / 25 0,6
P( Z 1,68) 0,95352.
x y 0 1
0 0,1 0,2
1 0,1 0,3
2 0,2 0,1
• Distribuições Marginais
P ( X x ) P ( X x , Y y)
y
P ( Y y) P ( X x , Y y)
x
Distribuições marginais no exemplo 8.1:
P(X=x) = 0,3, se x = 0
P(X1=x1) = 0,4, se x = 1
0,3, se x = 2.
P(Y=y) = 0,4, se y = 0
P(X1=x1) = 0,6, se y = 1.
Distribuição Conjunta
(caso contínuo)
f(x,y) y
x
Exemplo 8.3 - Normal Bivariada:
1 ( x X ) 2 ( y Y ) 2 ( x X )( y Y )
2
2
2 (1 ) X2
Y2
e X Y
f ( x , y) , ( x , y) R 2
2X Y 1 2
f(x,y)
y x
Propriedades:
1) f(x1,x2,...,xn) 0, para
toda n-upla (x1,x2,...,xn).
2) A integral de f(x1,x2,...,xn) no
domínio de X1, X2, ..., Xn é 1.
xy
f ( x, y) x ,0 x 1,0 y 2.
2
Ache P(Y<X).
R: 7/24.
As marginais de X e Y são obtidas
integrando a conjunta na “outra” variável:
f (x) f ( x, y)dy
f ( y) f ( x, y)dx
Exemplo 8.5 - Considere duas variáveis
aleatórias X e Y com distribuição conjunta:
f (x, y) e
2 ( xy)
; x, y 0; 0.
f (x) e 2 ( x y )
dy e
2 x
e
y
dy
0 0
1
e 2 x
e , x 0.
x
f ( y) e 2 ( x y )
dx e
2 y
e
x
dx
0 0
1
e 2 y
e , y 0.
y
• Independência de V.A.`s
Respostas:
1 ( x X ) 2 ( y Y ) 2 ( x X )( y Y )
2
2
2 (1 ) X2
Y2
e X Y
f ( x , y) , ( x , y) R 2
2X Y 1 2
• Distribuições Condicionais
f ( x , y)
f ( x | y) , f ( y) 0
f ( y)
f ( x , y)
f ( y | x) , f (x) 0
f (x)
Exemplo 8.6 - Determine as densidades
marginais e condicionais associadas às
v.a.`s X eY, cuja distribuição conjunta é:
3x 0 y x 1
f (x, y)
0 caso contrário
Respostas:
f ( x ) 3x , 0 x 1
2
3
f ( y) (1 y ), 0 y 1.
2
2 Y|x ~ Unif(0,x)
1
f ( y | x ) , 0 y x; para 0 x 1.
x
2x
f ( x | y) , y x 1; para 0 y 1.
1 y 2
Importante frisar que, na definição da
condicional f(y|x), a variável aleatória
envolvida é Y, e não X, pois X foi fixado.
E(X | y) xf (x | y)dx
Respostas:
x
E(Y | x ) ; para 0 x 1.
2
2(1 y )
3
E ( X | y) ; para 0 y 1.
3(1 y )
2
• Independência em Termos das
Distribuições e Momentos Condicionais
EY[E(X|Y)] = E(X)
• Teorema da Identidade
da Variância Condicional
R: 1/4.
9. MÉTODOS
DE ESTIMAÇÃO
Nada foi dito até agora sobre como obter
bons estimadores para um parâmetro. Ou
seja, sobre métodos de estimação.
Ache o EMV de .
Solução - se X ~ Poisson():
x λ
λ e
P(X x ) ; x 0,1,2,...; λ 0.
x!
Se fosse um problema de probabilidade,
você calcularia P(X=2) para um dado valor
de (usando a fórmula do slide anterior).
2 λ
λe
P(X 2) .
2!
0,1
0,2
0,3
0
0,01
0,64
1,27
1,9
2,53
3,16
3,79
4,42
5,05
5,68
6,31
6,94
7,57
8,2
8,83
9,46
10,1
10,7
P(X = 2) como função de :
11,4
12
12,6
13,2
13,9
14,5
• Função de Verossimilhança
0,1
0,2
0,3
0
0,01
0,64
1,27
1,9
2,53
3,16
3,79
4,42
5,05
5,68
6,31
6,94
7,57
8,2
8,83
máximo da função
9,46
10,1
ponto de máximo
10,7
11,4
12
12,6
Resolvendo o problema graficamente:
13,2
13,9
14,5
E no caso de uma AAS de tamanho n>1?
x i n
i1 e
L( ) n
.
x !
i 1
i
n xi
i1
e n
n
l() ln x i ln n c
n i 1
x i!
i 1
Maximizando a Função
de Log-Verossimilhança:
n
xi
l`() i 1
n
n
Assim, temos que xi
resolver a equação: l`() i 1 n 0,
n
xi
cuja solução é: i 1
x.
n
Logo, o estimador de máxima
verossimilhança (EMV) é:
ˆ MV X.
Método da Máxima Verossimilhança:
n
f ( x1 , x 2 ,..., x n ) f ( x i ),
i 1
(x1,x2,...,xn).
L(), caso
contínuo
Exemplo 9.2 - Seja uma AAS
de tamanho n de uma população
exponencial com parâmetro .
Obtenha o EMV de .
Solução:
A função de verossimilhança é:
n
L( ) f ( x i )
i 1
n
n xi
e e
x i n i 1
.
i 1
A função de log-verossimilhança é:
x i x i
n n
n i1
l() ln e ln n
ln
e i1
n ln x i .
n
i 1
1
ˆ MV .
X
Exercício 9.1 - Seja uma AAS de tamanho
n de uma população Bernoulli(p).
Obtenha o EMV de p.
R:
p̂ MV X.
Solução Resumida do Exercício 9.1:
n n
n xi (1 x i )
L(p) p (1 p) xi 1 x i
p i 1
(1 - p) i 1
i 1
n n
xi n xi
l(p) x i ln(p) n x i ln(1 - p).
n n
i 1 i 1
p (1 - p)
i 1 i1
n
n
n n
xi n xi x i np xi
l`( p) i 1
i 1 (1) i1 0 p i1 .
p (1 p) p(1 p) n
Exemplo 9.3 - Seja uma AAS de
tamanho n de uma população N(,2).
n
L(, ) f ( x i )
2
i 1
( x i ) 2
n
( x )
2
n
1
i
n
(2) e (2) e
2 2
2 2 i 1
.
i 1
A função de log-verossimilhança é:
n
( x i ) 2
n
2
l(, ) ln (2) 2 e i 1
n
n (x i ) 2
ln( 2) i 1
.
2 2
Derivando em relação à :
n
l(, ) ( x )
i
i 1
.
Igualando a zero:
n
(x
i 1
i ) 0 x ˆ MV X.
Derivando em relação à :
n
( x i )
2
l(, ) n i 1
2 2 2
(x i x) 2
i 1
.
n
Assim, os EMV`s de e 2 da Normal são:
ˆ MV X.
n
(X i X) 2
ˆ 2
MV i 1
.
n
Bernoulli : p̂ MV X.
Poisson : ˆ X.
MV
ˆ 1
Exponencia l : MV .
X
1
Geométrica : p̂ MV .
X
n
i
( X X ) 2
Normal : ˆ MV X e 2MV i 1
.
n
• Propriedades dos EMV
q̂ MV 1 p̂ MV 1 X.
Exemplo 9.5 - Considere que queiramos
estimar a probabilidade de uma mulher
não ter filhos, em uma população Poisson.
ˆ MV X
R : P̂MV (X 0) e e .
Exercício 9.2 - Seja uma AAS de
tamanho n da população referenciada
pela distribuição: f(x) = x-1, 0<x<1, >0.
Obtenha o EMV de .
n
R : ˆ MV n
.
ln(Xi )
i 1
Solução Resumida do Exercício 9.2:
n n
L ( ) x 1
i n
x 1
i .
i 1 i 1
n
l() nln( ) ( 1) ln( x i ).
i 1
n
n n
l`() ln( x i ) 0 .
i1 n
ln( x )
i 1
i
• Método dos Momentos
Momentos populacionais:
E(X), E(X2), ..., E(Xk).
Momentos amostrais:
n n n
Xi X 2
i X k
i
i 1 i 1 i 1
, ,..., .
n n n
Método dos Momentos para
Distribuições com 1 Parâmetro
E(X) X.
Estimadores de momentos para os casos
mais importantes envolvendo 1 parâmetro:
Bernoulli : p̂ MM X.
Poisson : ˆ
MM X.
ˆ 1
exponencial : MM .
X
1
geométrica : p̂ MM .
X
Método dos Momentos para
Distribuições com 2 Parâmetros
Obtenha os estimadores de
momentos de e 2.
n
(X i X ) 2
R : MM X e MM
ˆ ˆ 2 i 1
.
n
Dica para a solução do exercício 9.3:
X 2
i X 2
i
X
2 2 i 1
ˆ 2
MM i 1
X 2
n n
n n
X 2
i nX 2
(X i X) 2
i 1
i 1
.
n n
Exercício 9.4 - Seja uma AAS de tamanho
n de uma população referenciada pela
distribuição: f(x) = x-1, 0<x<1, >0.
Y = 0 + 1X,
Y = 0 + 1X +
Y é a variável dependente
X é a variável explicativa
0 e 1 são os parâmetros do modelo
é o erro (supõe-se: ~ N(0,2) )
Interpretação do Termo de Erro:
O erro representa todos os demais fatores
que poderiam influenciar Y, além de X.
E(Y|X) = 0 + 1X
E(Y|X=0) = 0
Y =
[0 + 1(X+1) + 2] - (0 + 1X + 1) =
0 + 1X + 1+ 2 - 0 - 1X - 1 =
1 + 2 - 1 = 1 + .
Agora lembre-se que:
E(Y) = 1.
.
1 é a variação esperada em Y
quando X varia uma unidade.
• Reta de Regressão Estimada/Ajustada
Ŷ ˆ 0 ˆ 1X
n
SQR ˆ 2
i
i 1
A minimização da função anterior em relação
a 0 e 1 resulta nas seguintes equações:
n
(I) ˆ i 0
i 1
n
(II) ˆ i X i 0
i 1
n
(Xi X)(Yi Y) SXY ˆ
ˆ 1 i 1
n
2 , 0 Y ˆ 1X.
SX
(X i X ) 2
i 1
ANOVA
gl SQ MQ F F de significação
Regressão 1 6394,37439 6394,374 276,3343605 5,02495E-19
Resíduo 38 879,319628 23,13999
Total 39 7273,69402
i 1
i 1
i 1 i 1
Pode-se demonstrar que:
SQT = SQE + SQR
Daí:
n
(Ŷ Y )
i
2
SQE SQR
R
2 i 1
n 1 .
i
( Y
i 1
Y ) 2 SQT SQT
Estatística de regressão
R múltiplo 0,937608458 R2
R-Quadrado 0,879109621
R-quadrado ajustado 0,875928295 O modelo consegue
Erro padrão 4,81040437 explicar 87,91% da
Observações 40
variação de Y (bastante).
ANOVA
gl SQ MQ F F de significação
Regressão 1 6394,37439 6394,374 276,3343605 5,02495E-19
Resíduo 38 879,319628 23,13999
2
Total
O R é igual ao quadrado da correlação
39 7273,69402
SQR
ˆ
2
n2
2 - são consistentes
i
( X X ) 2
i
( X X ) 2
i 1 i 1
n
M as, da estatística básica : (X i X ) 0. Assim :
i 1
n
(X i X )Yi n
(X i X )
ˆ 1 i 1
n
i Yi , sendo i n
.
i
( X X ) 2 i 1
i
( X X ) 2
i 1 i 1
• Estimadores de Máxima Verossimilhança
O EMV de 2 é viciado,
com n no denominador.
ˆ 0 0 ˆ 1 1
~ t n 2 e ~ t n 2 .
EP (ˆ 0 ) EP (ˆ 1 )
erros padrão estimados
Estas distribuições são utilizadas para fazer
inferências estatísticas a respeito de 0 e 1.
• Intervalos de Confiança para 0 e 1
ˆ
IC100(1 )% (0 ) 0 t EP (ˆ 0 ); ˆ 0 t EP (ˆ 0 )
n 2; n 2;
2 2
ˆ
IC100(1 )% (1 ) 1 t EP (ˆ 1 ); ˆ 1 t EP (ˆ 1 )
n 2; n 2;
2 2
• Teste de Significância Estatística
O teste da significância
da estimativa de 1 é:
H0: 1 = 0 x H1: 1 0.
ˆ 1
t0
EP (ˆ 1 )
RC = (-,-tn-2;/2][tn-2;/2,).
No exemplo 10.1:
Estatística de regressão
p-valor do teste de H0: 1 = 0 x
R múltiplo 0,937608458 H1: 1 0. Como o p-valor é
(bem) menor do que = 0,01,
R-Quadrado 0,879109621
R-quadrado ajustado 0,875928295
Erro padrão 4,81040437
Observações 40 rejeitamos H0 aos níveis usuais.
ANOVA
gl SQ MQ F F de significação
Regressão 1 6394,37439 6394,374 276,3343605 5,02495E-19
Resíduo 38 879,319628 23,13999
Total 39 7273,69402
ANOVA
gl SQ MQ F F de significação
Regressão 1 6394,37439 6394,374 276,3343605 5,02495E-19
Resíduo 38 879,319628 23,13999
Total 39 7273,69402
H0: 1 = 2 = ... = k = 0
x
H1: ao menos um j é diferente de zero.
O valor da estatística do teste (estatística F) é:
SQE / k
f0
SQR /[ n (k 1)]
2
R /k
ou : f 0 .
(1 R ) /[ n (k 1)]
2
Estatística de regressão
R múltiplo 0,937608458
R-Quadrado 0,879109621
R-quadrado ajustado 0,875928295
Erro padrão 4,81040437
Estatística de regressão
Observações 40 16,623312 = 276,3343605
R múltiplo
ANOVA
gl SQ MQ F 0,937608458
F de significação
Regressão 1 6394,37439 6394,374 276,3343605 5,02495E-19
R-Quadrado
Resíduo 38 879,319628 23,13999
Total 39 7273,69402
0,879109621
R-quadradoCoeficientes
ajustado Erro padrão Stat t valor-P 95% inferiores 95% superiores
Interseção -13,3248381 4,45111079 -2,993598 0,004827374 -22,33564114 -4,314035109
Variável X 1 0,515720938 0,03102397 16,62331 5,02495E-19 0,875928295
0,452916199 0,578525676
Erro padrão
p-valores iguais!
Estimativa de 2 na Tabela ANOVA:
Estatística de regressão
R múltiplo 0,972032693
R-Quadrado 0,944847557
R-quadrado ajustado
0,941866343
Erro padrão 3,292752067
Observações 40
ANOVA
gl SQ MQ F F de significação
Regressão 2 6872,532024 3436,266012 316,9339143 5,23538E-24
Resíduo 37 401,1619984 10,84221617
Total 39 7273,694022
SQR/(n - (k 1))
R 1-
2
SQT/(n - 1)
n -1
1 - (1 - R )
2
.
n - (k 1)
2 2
Obs - o R é sempre menor que o R .
Modelo 1 - só com X1
Estatística de regressão
R múltiplo 0,937608458
R-Quadrado 0,879109621
R-quadrado ajustado 0,875928295
Erro padrão 4,81040437
Observações 40
ANOVA
gl SQ MQ F F de significação
Regressão 1 6394,37439 6394,374 276,3343605 5,02495E-19
Resíduo 38 879,319628 23,13999
Total 39 7273,69402
ANOVA
gl SQ MQ F F de significação
Regressão 2 6872,532024 3436,266012 316,9339143 5,23538E-24
Resíduo 37 401,1619984 10,84221617
Total 39 7273,694022
Um padrão comum de
heterocedasticidade é:
V() X
2 V() proporcional à X.
̂
X
• Autocorrelação
Corr(i,j) 0, ij.
X êˆ t 1
X êˆ t 1
• Consequências das Violações
A multicolinearidade é um problema da
amostra, e indica que ela não fornece
informação suficiente para estimar com
precisão os efeitos individuais das variáveis.
Consequência da Multicolinearidade:
Um processo estocástico é um
conjunto de v.a.`s {Yt, t = 1,2,...,T}.
Uma série temporal é um conjunto
{yt, t = 1,2,...,T}, em que cada yt é tratado
como se fosse uma observação de uma v.a.
Yt que compõe um processo estocástico.
Formalmente, uma série temporal é uma
realização de um processo estocástico.
• Modelo de Séries Temporais
E( t ) 0 e V( t ) , t
2
Corr (i , j ) 0, i j.
Yt Yt 1 t , sendo t um RB.
Yt 0 Yt 1 t .
Propriedades do Passeio Aleatório:
Y2 0 Y1 2
0 0 1 2
20 1 2
Y3 0 Y2 3
30 1 2 3
A fórmula geral para um instante t genérico é:
t
Yt t0 i ,
i 1
t
t
V(Yt ) V t0 i V( t0 ) V i
i 1 i 1
t
t
V i V ( i ) t .
2
i 1 i 1
Para o caso sem constante, basta fazer 0 = 0.
Yt 0,8BYt t
Yt 0,8BYt t
(1 0,8B)Yt t
(1-0,8B) é chamado polinômio característico
do modelo. E a equação (1-0,8B) = 0 é
chamada equação característica do modelo.
• Modelo Autoregressivo ou AR
O modelo:
Yt 1Yt 1 t ,
Por exemplo:
B2Yt = Yt-2,
B3Yt = Yt-3,
e assim por diante.
O modelo AR(p) é definido da seguinte forma:
Yt 1Yt 1 2 Yt 2 ... p Yt p t
Yt 1BYt 2 B Yt ... p B Yt t
2 p
Yt 1BYt 2 B Yt ... p B Yt t
2 p
Isolando Yt:
polinômio característico
b b 4ac
2
x .
2a
a ) Yt 0,8Yt 1 0,5Yt 2 t .
b) Yt 0,3Yt 1 0,6Yt 2 t .
A equação característica
do modelo em a) é:
1 0,8B 0,5B 0
2
ou :
0,5B 0,8B 1 0
2
1 0,3B 0,6B 0
2
ou :
0,6B 0,3B 1 0
2
|2| < 1
1 + 2 < 1
2 - 1 < 1
Yt t 1 t 1.
Obs - Pode haver uma constante 0
no modelo, embora seja pouco usual.
• Inversibilidade (Modelo MA)
Yt t 0,8 t 1.
Solução:
Yt t 0,8 t 1
t 0,8B t (1 0,8B) t
1
Yt t .
1 0,8B
Obs - fórmula da soma de uma p.g. infinita,
com primeiro termo a1 e razão q tal que |q|<1:
a1
S .
1 q
1 0,8B
E assim:
(1 B1 B 2 ... B q ) t .
2 q
ou B q ... B 2 B1 1 0
q 2
As condições de inversibilidade para o
MA(q) são exatamente as mesmas que as
condições de estacionariedade para o AR(p).
|2| < 1
1 + 2 < 1
2 - 1 < 1
Exercício 11.3 - Verifique se os
seguintes modelos são inversíveis:
a ) Yt t - 1,4 t 1
b) Yt t - 1,4 t 1 0,5 t 2
R: a) não. b) sim.
• Inversibilidade (Modelo AR)
Yt 0 1Yt 1 2 Yt 2 ... p Yt p
t 1 t 1 2 t 2 ... q t q .
Yt Yt 1 t .
Yt Yt Yt 1.
= 1-B
Zt Yt t .
• Ordem de Integração
Z t 0 1Z t 1 2 Z t 2 ... p Z t p t
1 t 1 2 t 2 ... q t q , com Z t Yt .
d
• Propriedades Estatísticas dos Modelos
0
E(Yt ) p .
1 j
j1
0
E(Yt ) (mesma média do AR(1)).
1 1
V(Yt ) (1 ) .
2 2
1
2 2
1
2
j1
Modelo ARMA(1,1):
Yt = 0 + 1Yt-1 + t - 1t-1, |1|<1, |1|<1.
V( t 1 ) 211Cov(Yt 1 , t 1 ).
2
1
V( t 1 ) 211Cov(Yt 1 , t 1 ).
2
1
A covariânci a é calculada a seguir :
Cov(Yt 1 , t 1 )
Cov(1Yt 2 t 1 1 t 2 , t 1 )
Cov( t 1 , t 1 ) V( t 1 ) . 2
1 211 2 2
211 V(Yt )
2
.1
1 1
2
Exercício 11.4
Sobre o processo Yt = 0,8Yt-1 + 0,2Yt-2
+ t – 0,8t-1, julgue as seguintes proposições:
(1) Yt segue um ARMA(1,2) ( )
(2) Se o coeficiente de t-1 fosse 1,1,
ao invés de 0,8, o processo Zt =
(1-B)Yt seria não estacionário ( )
(3) Se 2 = 1, a variância do processo
Wt = (1-B)(1+0,2B)Yt é igual a 1,64 ( )
(R: FFV)
Metodologia de Box & Jenkins:
Identificação
Estimação
Diagnóstico
Previsão
• Identificação
2
k 1
, k 1, 2, ...
2
1 1
2
A FAC do modelo AR(1) é :
k
k 1 , k 1, 2, ...
k
0
1 Cov(Yt , Yt 1 )
Cov( t 1 t 1 , t 1 1 t 2 )
1Cov( t 1 , t 1 ) 1 . 2
k 0, k 2, 3, ....
A FAC do modelo M A(1)é :
1
1 .
(1 1 )
2
k 0, k 2, 3, ...
1
1
(1 2 )
2
2 1
2
(1 2 )
etc.
FAC do MA(2): Yt = t - 1t-1 - 2t-2.
1 ( 2 1)
1
1 1 2
2 2
2
2
1 1 2
2 2
A FAC do MA(2) é
“truncada” no lag 2.
k 0, k 3,4,....
A FAC de um modelo MA(1) é truncada em 1.
Se o correlograma apresenta um
comportamento similar àquele que
corresponde ao modelo MA(q), então
identificamos este modelo para a série.
• Estimação da FAC
T
(Yt Y)(Yt k Y)
ˆ k t k 1
T
, k 0, 1, 2, ...
t
( Y Y ) 2
t 1
Notação: kk.
Resposta: Yt = t – 0,5t-1.
1
IC100(1- )% ( j ) [ˆ j z V̂(ˆ j ) ], sendo V̂(ˆ j ) .
2 T
K ˆ 2
Q n (n 2)
j
.
j1 (n j)
Sob H0 , Q ~ 2
.
K -(número de parâmetros estimados)
Re spostas:
0
Ŷt k|t k
1 1
Conclusão importante:
A previsão de longo prazo do modelo AR(1)
é igual à sua média incondicional E(Yt).
• Amortecimento Exponencial
(1-B)(1-BS)Yt = (1-B)(1-BS)t
(1-B)(1-BS)(1-B)(1-BS)Yt = (1-B)(1-BS)t
12. RAÍZ UNITÁRIA
E REGRESSÃO DE
SÉRIES TEMPORAIS
• Testes de Raiz Unitária
Yt = + Yt-1 + t
ˆ mesma estatística
. T usual, agora
V̂(ˆ ) chamada de .
1% 5% 10%
DF -3,43 -2,86 -2,57
Yt = 0 + 1Xt + ut.
û t û t û t 1.
Passo 3.2 - rodar a regressão
necessária para o teste DF/ADF:
û t û t 1 t ou
p
û t û t 1 jû t j t
j1