Sie sind auf Seite 1von 57

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados

Profs. Alexandre Lima e Moraes Junior


Profs. Alexandre Lima e Moraes Junior 1

Raciocnio Lgico-Quantitativo para Traumatizados
Aula 21
Regresso Linear Simples

21 Regresso Linear Simples ................................................................................................. 9
21.1 A Reta de Regresso ................................................................................................... 9
21.2 Valores Esperados dos Estimadores ................................................................... 10
21.3 Varincias e Covarincias dos Estimadores ..................................................... 10
21.4 Distribuies Amostrais ........................................................................................... 12
21.5 O Teorema de Gauss-Markov ................................................................................ 14
21.6 O Coeficiente de Determinao ............................................................................ 14
21.7 Relaxamento dos Pressupostos do Modelo ...................................................... 19
21.8 Regresso sem o Intercepto .................................................................................. 20
21.9 Intervalos de Confiana ........................................................................................... 24
21.10 Testes de Hipteses ................................................................................................ 29
21.11 Anlise de Varincia ............................................................................................... 32
21.12 Memorize para a prova .......................................................................................... 38
21.11 Exerccios de Fixao ............................................................................................. 40
21.12 Gabarito ....................................................................................................................... 45
21.13 Resoluo dos Exerccios de Fixao ............................................................... 46

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
2

E a pessoal, tudo bem? Esta a ltima aula do mdulo de Estatstica Bsica e
Avanada. Reconhecemos que pegamos pesado com vocs. Mas a inteno
a melhor possvel: a sua aprovao! Procure digerir o contedo apresentado,
porque tudo que ensinamos poder cair na prova.

Erratas

J caiu em prova! (AFPS/2002/ESAF), pg. 16 da Aula 18

Corrija o incio da segunda linha da soluo para

Primeiramente, devemos descartar a opo C, pois absurda.

Ou seja, a opo absurda a C e no a D.

Resoluo da questo 13 da Aula 18

Corrija parte da terceira linha da soluo para

2
(nX ) = n
2

2
(X ) = n
2

2
n
= n
2
= n 1 = n

Note que havia um n sobrando na varincia da mdia amostral.

Antes de iniciarmos a aula de hoje, daremos resolues detalhadas (e mais
didticas!) das questes 1 e 14 da Aula 17 e uma outra soluo para a questo
1 da Aula 18.

Resolues Detalhadas das Questes 1 e 14 da Aula 17

1. (ICMS-RJ/2007/FGV) A probabilidade de um candidato acertar esta
questo de mltipla escolha, (Y = 1), funo da proficincia em matemtica,
, do candidato e pode ser calculada por meio de:

,
1
) | 1 (
2 , 0 5 , 0
2 , 0 5 , 0

+
+
+
= =
e
e
Y P

sendo um nmero real que representa a medida de proficincia em
matemtica do candidato. Pode-se, ento, afirmar que:

A) a cada acrscimo de uma unidade na medida de proficincia matemtica,
a probabilidade de o candidato acertar a questo aumenta em 20%.
B) a probabilidade de acertar a questo (Y=1) maior do que a probabilidade
de errar a questo (Y=0), para todos os candidatos com > 0.
C) essa funo de probabilidade tem mximo em =0.
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
3
D) candidatos com = 2,5 de proficincia tm probabilidade 0,5 de acertar a
questo.
E) a razo entre a probabilidade de acertar e a de errar uma funo linear
em , e expressa por -0,5 + 0,2.

Resoluo

Anlise da alternativas

(A) a cada acrscimo de uma unidade na medida de proficincia
matemtica, a probabilidade de o candidato acertar a questo aumenta em
20%.

A probabilidade de um candidato acertar esta questo de mltipla escolha, (Y
= 1), funo da proficincia em matemtica, , do candidato, e dada por:

.
1
) | 1 (
2 , 0 5 , 0
2 , 0 5 , 0

+
+
+
= =
e
e
Y P

Ento, P(Y=1|) denota a probabilidade de que Y = 1 para um dado . A
probabilidade P(Y=1|) NO representa que, a cada acrscimo de uma
unidade na medida de proficincia matemtica, a probabilidade de o
candidato acertar a questo aumenta em 20%. Ademais, a funo P(Y=1|)
no linear, ou seja, no do tipo y = a + b (equao que descreve uma
reta), em que y a varivel dependente (eixo vertical), a denota o intercepto,
b a declividade da reta e a varivel independente (eixo horizontal). Logo
a alternativa INCORRETA.

(B) a probabilidade de acertar a questo (Y=1) maior do que a
probabilidade de errar a questo (Y=0), para todos os candidatos com > 0.

Para resolver este item, preciso responder seguinte pergunta:

Ser que a razo

P(Y =1| )
P(Y = 0 | )
=
e
0,5+0,2
1+e
0,5+0,2
1
e
0,5+0,2
1+e
0,5+0,2


maior do que 1 para todo > 0?

Repare que mais fcil analisar o comportamento do logaritmo de uma razo
entre funes exponenciais do que a razo propriamente dita. Tal
procedimento bastante usual em matemtica. o que faremos a partir deste
ponto.
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
4

Tomando o logaritmo neperiano da razo entre P(Y =1| ) e P(Y = 0 | ) , obtemos

W = ln
P(Y =1| )
P(Y = 0 | )






= ln
e
0,5+0,2
1+e
0,5+0,2
1
e
0,5+0,2
1+e
0,5+0,2










= ln
e
0,5+0,2
1+e
0,5+0,2
1+e
0,5+0,2
e
0,5+0,2
1+e
0,5+0,2












W = ln
e
0,5+0,2
1+e
0,5+0,2
1
1+e
0,5+0,2










= ln
e
0,5+0,2
1+e
0,5+0,2

1+e
0,5+0,2
1






= ln e
0,5+0,2
( )


Lembrando que ln e
n
= n ln e = n, pois ln e = 1, temos que

W = (0,5 +0,2) lne = (0,5 +0,2) 1 = 0,5 +0,2 .

Observe que a relao W = -0,5 + 0,2 a equao de uma reta. Ou seja, W
uma funo linear de . O grfico de W em funo de est representado na
figura a seguir.





A funo W igual a zero para = 2,50 ( a raiz da equao -0,5 + 0,2 = 0)
e W = -0,5 para = 0.

Analisemos o comportamento da funo W no intervalo 0< <2,5. Considere,
por exemplo, o valor = 1 para a varivel independente. Neste caso, W = -0,5
+ 0,2 x 1 = -0,5 + 0,2 = -0,3. Ento (*)

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
5

W = ln
P(Y =1| =1)
P(Y = 0 | =1)






= 0, 3
P(Y =1| =1)
P(Y = 0 | =1)
= e
0,3
= 0, 74 menor que 1!

(*) ln a = b a = e
b


Como foi obtido P(Y =1| ) / P(Y = 0 | ) <1 para um valor positivo de , ento
falso afirmar que a probabilidade de acertar a questo (Y=1) maior do que a
probabilidade de errar a questo (Y=0), para todos os candidatos com > 0.
Alternativa INCORRETA.

(C) essa funo de probabilidade tem mximo em =0.

O grfico da funo

2 , 0 5 , 0
2 , 0 5 , 0
1
) | 1 (
+
+
+
= =
e
e
Y P

tem o seguinte comportamento assinttico: 1 ) / 1 ( = Y P para e
0 ) / 1 ( = Y P para . Portanto, no h um mximo da funo quando
0 = afirmao INCORRETA.

(D) candidatos com = 2,5 de proficincia tm probabilidade 0,5 de acertar a
questo.

P(Y=1|=2,5) = 5 , 0
1 1
1
1 1
0
0
5 , 2 2 , 0 5 , 0
5 , 2 2 , 0 5 , 0
=
+
=
+
=
+
+
+
e
e
e
e
afirmao CORRETA.

(E) a razo entre a probabilidade de acertar e a de errar uma funo linear
em , e expressa por -0,5 + 0,2.

o logaritmo neperiano da razo entre a probabilidade de acertar e a de
errar que uma funo linear em , expressa por -0,5 + 0,2 afirmao
INCORRETA.

GABARITO: D

14. (ICMS-RJ/2009/FGV) Utilizando uma anlise de regresso linear
simples, um pesquisador obteve um ajuste Y = a
1
X + b
1
e um coeficiente de
determinao
2
1
R . Um segundo pesquisador analisou os mesmos dados, mas
antes aplicou a cada observao de Y a transformao Y = 10Y + 100, obtendo
um outro ajuste Y=a
2
X+b
2
, com um coeficiente de determinao
2
2
R . Considere
as afirmativas abaixo, relativas comparao entre os valores obtidos nas
duas anlises:

I. a
2
=10a
1
;
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
6
II. b
2
=b
1
+100;
III.
2
1
2
2
R R = .

Assinale:

A) se somente a afirmativa I for verdadeira.
B) se somente as afirmativas I e II forem verdadeiras.
C) se somente as afirmativas I e III forem verdadeiras.
D) se somente as afirmativas II e II forem verdadeiras.
E) se todas as afirmativas forem verdadeiras.

Resoluo

1 1
b X a Y + = Y' =10Y +100 =10(a
1
X +b
1
) +100 = (10a
1
)X +(10b
1
+100) = a
2
X +b
2


Logo,
1 2
10a a = e 100 10
1 2
+ = b b .

Anlise das afirmativas:

(I) VERDADEIRA, pois
1 2
10a a = , conforme demonstrado acima.

(II) FALSA, dado que 100 10
1 2
+ = b b .

(III) Dados:

- ajuste y=a
1
x+b
1
implica um coeficiente de determinao
2
1
R ;

- aplicao da transformao linear y
,
= 10y + 100 resulta no coeficiente de
determinao
2
2
R .

Vimos que a correlao amostral R dada por

R =
s
xy
s
x
s
y
= cov. amostral/(desvio padro amostral de X . desvio padro amostral de Y)

Ento,

R
1
=
s
xy
s
x
s
y
=
1
n
(x
i
x )(y
i
y )

1
n
(x
i
x )
2

1
n
(y
i
y )
2

=
1
n
(x
i
x )(y
i
y )

1
n






2
(x
i
x )
2
( )
(y
i
y )
2
( )


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
7

R
1
=
1
n
(x
i
x )(y
i
y )

1
n
(x
i
x )
2

( )
(y
i
y )
2

( )
=
(x
i
x )(y
i
y )

(x
i
x )
2
( )
(y
i
y )
2
( )


e

R
2
=
(x
i
x )(y
i
,
E[y
,
])

(x
i
x )
2

( )
(y
i
,
E[y
,
])
2

( )


em que E[y
,
] = E[10y +100] = E[10y] + E[100] =10E[y] +100 =10y +100. Substituindo
E[y
,
] =10y +100 na expresso acima, obtemos

R
2
=
(x
i
x )(10y
i
+100 10y 100)

(x
i
x )
2

( )
(10y
i
+100 10y 100)
2

( )
=
(x
i
x )(10y
i
10y )

(x
i
x )
2

( )
(10y
i
10y )
2

( )
=

R
2
=
10(x
i
x )(y
i
y )

(x
i
x )
2

( )
100(y
i
y )
2

( )
=
10 (x
i
x )(y
i
y )

100 (x
i
x )
2

( )
(y
i
y )
2

( )
=
10 (x
i
x )(y
i
y )

10 (x
i
x )
2

( )
(y
i
y )
2

( )

R
2
=
(x
i
x )(y
i
y )

(x
i
x )
2
( )
(y
i
y )
2
( )
= R
1
R
2
2
= R
1
2


Conclui-se que a transformao linear Y = 10Y + 100 no altera a qualidade da
regresso original Y=a
1
X+b
1
, uma vez que R
2
2
= R
1
2
. Portanto, a assertiva (III)
VERDADEIRA.

GABARITO: C

Outra soluo para a questo 1 da Aula 18

1. (Analista Tcnico-SUSEP-2006-ESAF) Seja X
1
, X
2
, ... uma sucesso de
variveis aleatrias identicamente distribudas, cada uma com mdia e
varincia
2
, tendo a propriedade de qualquer nmero finito delas so
independentes. Ento, para cada z

), (
...
lim
1
z z
n
n X X
P
n
n
=

<
+ +



onde ) (z uma funo de distribuio:

A) Normal reduzida.
,
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
8
B) Normal.
C) Qui-quadrado.
D) Log-normal.
E) Binomial.

Resoluo

Sejam
n
X X X ,..., ,
2 1
variveis aleatrias independentes e identicamente
distribudas, com mdia e varincia
2
. De acordo com o TCL, se
n n
X X X S + + + = ...
2 1
, ento

n
n S
S Var
S E S
n
n
n n

) (
) (


assintoticamente normal (isto , tende para a normal quando n tende
para infinito) com mdia nula e desvio-padro igual a um (normal padro ou
reduzida).

Ou seja,

lim
n
P
S
n
n
n
< z





= P(Z < z) = (z) ,

em que Z a varivel aleatria N(0,1).

O TCL tambm verdadeiro sob condies mais gerais. Por exemplo, ele vale
quando
n
X X X ,..., ,
2 1
so variveis independentes com a mesma mdia e
varincia, mas no necessariamente identicamente distribudas.

GABARITO: A


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
9

21 Regresso Linear Simples

Esta aula aborda as propriedades dos estimadores de mnimos quadrados, a
inferncia estatstica e a anlise de varincia do modelo de Regresso Linear
Simples (RLS).

21.1 A Reta de Regresso

A anlise de regresso estuda a dependncia de uma varivel, chamada de
independente, em relao outras variveis, chamadas de explanatrias, com o
objetivo de estimar valores da primeira, dados os valores das segundas.

Na aula 17 usamos o modelo

(1) + + = X Y ,

em que o intercepto, a declividade e denota a componente
aleatria da variao de Y ( uma varivel aleatria).

Vimos tambm que os estimadores a (do intercepto ) e b (da declividade so
dados por

(2)

=
=
x b y a
S
S
b
xx
xy


em que

(3) ), )( ( y y x x
n
y x
y x S
i
i
i
i
i
i
i
i
i i xy
=

=




e

(4)

=
i i
i
i
i
i xx
x x
n
x
x S
2
2
2
) (

Interpretao Geomtrica do Intercepto e da Declividade

O intercepto o valor estimado de y quando x = 0, e representa a
variao estimada de y quando x varia uma unidade, conforme ilustrado pela
figura abaixo .


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
10



















21.2 Valores Esperados dos Estimadores

Pode-se demonstrar que os estimadores a e b de (2) tm mdia dadas por

(5)

=
=

) (
) (
b E
a E


(*) As demonstraes no so elementares e tampouco sero cobradas em
prova. Assim, preferimos omitir as demonstraes.

Logo os estimadores de e , a e b (s vezes denotados por e

), so
justos (ou no viesados ou no tendenciosos), pois suas mdias so iguais aos
verdadeiros valores dos parmetros. Isso quer dizer que se coletarmos vrias
amostras de iguais tamanhos, e aplicarmos as equaes de (2), os valores
mdios das estimativas encontradas de a e b tendero a e ,
respectivamente.

O resultado acima verdadeiro somente quando so vlidos os pressupostos
do modelo apresentados na aula 17. O pressuposto 6, da normalidade dos
erros, no necessrio para o resultado (5), mas ser importante para o
estudo da inferncia sobre o modelo de regresso.

21.3 Varincias e Covarincias dos Estimadores

Por definio, temos que

Var(a) = E [a E [a]]
2
= E [a ]
2
,

0
x
y

1


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
11
Var(b) = E [b E [b]]
2
= E [b ]
2
,

Cov(a,b) = E [(a )(b )].

Sendo
2
a varincia do erro aleatrio do modelo, pode-se demonstrar que
(vide nota anterior)

(6)
xx
S
b
2
) var(

= ,

em que

=
2
) ( x x S
i xx
,

(7) var(a) =
2
x
i
2

nS
xx








,

(8) Cov(a,b) =
2
x
S
xx






.

Como o termo
xx
S /
2
aparece em (6), (7) e (8), podemos reescrever (7) e (8)
como

var(a) = var(b)
x
i
2

n


e

Cov(a,b) = x var(b),

respectivamente.

Do exposto, percebe-se que:

Quanto maior a varincia do termo de erro (dada por
2
) maiores
sero as varincias de a e b e a covarincia entre eles.
Quanto mais concentrados os valores de x estiverem em torno de
sua mdia x , menor ser o valor de S
xx
(lembre que S
xx
= (x
i
x )
2

) e
maiores sero as varincias de a e b e a covarincia entre eles. Isso
pode ser visto graficamente na prxima figura.
O sinal da covarincia ) , ( b a Cov oposto ao sinal de x . Note que o
grfico da reta ajustada passa pelo ponto das mdias ) , ( y x . Assim, ainda
na figura, mantendo-se fixo o ponto ) , ( y x , um aumento em b diminui o
intercepto a da reta ajustada.
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
12





21.4 Distribuies Amostrais

Sob a hiptese da normalidade dos erros, a e b tambm so distribudos
normalmente

(9)

xx
S
N b
2
, ~



(10) a ~ N , var(b)
x
i
2

n










(11)
xx
S
x b a Cov
2
) , (

= (repetida por convenincia)



Falta-nos agora apenas definir um estimador para a varincia do erro aleatrio

2
. Prova-se, e apelamos mais uma vez para a sua f nos seus professores,
que


2
=
e
i
2

n 2


um estimador no tendencioso de
2
, ou seja,
2 2
) ( = E , em que
i i i i i
bx a y y y e = =

(*).

(*) O 2 que subtrado do denominador o nmero de parmetros de
regresso ) , ( no modelo, e essa subtrao torna o estimador
2
no
tendencioso.
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
13


Os resultados desta seo so muito importantes para o estudo da inferncia
estatstica.

Exemplo. Voltemos a um dos exemplos da aula 17, em que foi obtida reta
x y 217 , 0 174 , 0 + = ( 42 =
xx
S ). Foi dada a tabela a seguir:

i
x
i
y
i i
y x
2
i
x
2
i
y
1 0,5 0,5 1 0,25
2 0,6 1,2 4 0,36
3 0,9 2,7 9 0,81
4 0,8 3,2 16 0,64
5 1,2 6,0 25 1,44
6 1,5 9,0 36 2,25
7 1,7 11,9 49 2,89
8 2,0 16,0 64 4,00
36 =
i
x 2 , 9 =
i
y 5 , 50 =
i i
y x 204
2
=
i
x 64 , 12
2
=
i
y


Vamos substituir, na tabela acima, as suas trs ltimas colunas,como abaixo:


i
x
i
y
i
y
i i i
y y e =
2
1
e
1 0,5
0,174+0,217x1=0,392
0,108 0,0117
2 0,6
0,174+0,217x2=0,608
-0,008 0,0001
3 0,9
0,174+0,217x3=0,825
0,075 0,0056
4 0,8
0,174+0,217x4=1,042
-0,242 0,0584
5 1,2
0,174+0,217x5=1,258
-0,058 0,0034
6 1,5
0,174+0,217x6=1,475
0,025 0,0006
7 1,7
0,174+0,217x7=1,692
0,008 0,0001
8 2,0
0,174+0,217x8=1,908
0,092 0,0084
36 =
i
x 2 , 9 =
i
y 2 , 9 =
i
y 0 =
i
e 0883 , 0
2
=
i
e


Repare que

(a)

=
i i
y y (demonstrvel);
(b) , consequncia direta de (a).

Estimemos as varincias de a e b , bem como ) , ( b a Cov . A primeira etapa
estimar
2
:

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
14

2
=
e
i
2

n 2
=
0,0833
6
= 0,0147.

Agora, vamos utilizar as frmulas (6), (7) e (8), substituindo
2

(desconhecido) pela sua estimativa
2
:

6
2
10 350
42
0147 , 0
) var(

= = =
xx
S
b

,

var(a) =
x
i
2

n
var(b) =
204
8
350 10
6
= 8,925 10
3
,

cov(a,b) = x var(b) =
36
8
350 10
6
= 1,575 10
3
.

Assim, assumindo a normalidade do erro aleatrio do modelo, obtemos as
seguintes estimativas:

b ~ N(0,217; 350x10
-6
)

a ~ N(0,175; 8,925x10
-3
)

21.5 O Teorema de Gauss-Markov

O teorema Gauss-Markov nos garante que, de todos os estimadores lineares
possveis no viesados para e , os estimadores de mnimos quadrados a e
b , definidos por (2), so os de menor varincia. Ou seja, os estimadores a e b
so os Melhores Estimadores Lineares No Viesados (MELNV).

Uma consequncia lgica do teorema que, se h estimadores de menor
varincia que a e b para e , estes ou so viesados ou so no lineares. Ns
no nos preocuparemos com o seu estudo. A demonstrao deste teorema
foge ao escopo desta aula.

21.6 O Coeficiente de Determinao

Os resduos
i i i
y y e = , embora utilizados para avaliar a aderncia da reta
ajustada de mnimos quadrados aos pontos (x
i,
y
i
), tm o inconveniente de
serem afetados pela unidade utilizada. Para superar esse obstculo,
voltaremos discusso sobre o coeficiente de determinao R
2
visto na aula
17.

Primeiramente, temos que a variao total de y dada por

(12)
2
) ( y y S
i
i yy
=


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
15

Nosso objetivo separar a variao total de y em 2 partes: uma
explicada pela regresso e outra associada ao termo de erro (ou no
explicada pela regresso).





Considere a identidade

(13) ) ( ) ( y y y y y y
i i i i
+ = .

Elevando ambos os membros de (13) ao quadrado e somando as n
observaes, obtemos:

(14) . ) )( ( 2 ) ( ) ( ) (
2 2 2

+ + =
i
i i i
i
i
i
i i
i
i
y y y y y y y y y y

Demonstra-se que o ltimo termo de (14) nulo e segue-se ento que


+ =
i
i
i
i i
i
i
y y y y y y
2 2 2
) ( ) ( ) (


(15) SQT = SQE + SQR

em que:

SQT = Soma dos quadrados total = S
yy
=

i
i
y y
2
) ( (ou variao total)
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
16

SQE = Soma dos quadrados dos erros =

i
i i
y y
2
) ( (ou variao
residual)
SQR = Soma dos quadrados da regresso =

i
i
y y
2
) ( (ou variao
explicada)

Dividindo ambos os membros de (15) por SQT, resulta

(16)
SQT
SQR
SQT
SQE
+ = 1 .

Finalmente, definimos o coeficiente de determinao por

(17)
SQT
SQE
SQT
SQR
R = = 1
2
.

Da definio, tem-se que 0 R
2
1. O coeficiente R
2
mede a proporo ou
a porcentagem da variao total em y explicada por x dentro do
modelo de regresso. O R
2
quantifica o grau de ajuste de um conjunto de
dados reta de regresso estimada. Quanto mais prximo de 1 estiver R
2

melhor ter sido nosso trabalho para explicar a variao em y, com bx a y + = , e
maior ser a capacidade de previso de nosso modelo sobre todas as
observaes amostrais, ou seja, R
2
nos diz o quo prximos os valores
estimados (ou previstos) de Y esto de seus valores observados.

O coeficiente R
2
uma medida descritiva. , s vezes, chamado medida de
aderncia. Por si mesmo, no mede a qualidade do modelo de regresso.
No se pode julgar o mrito de um modelo com base somente no valor de seu
R
2
. Os parmetros estimados podem conter informaes teis mesmo quando
esse nmero baixo (como R
2
=0,32). Isto pode ocorrer, por exemplo, quando
aplicamos a regresso linear simples no contexto de variveis econmicas
1
.

H outras formas de apresentar R
2
. Sabemos que
i i
bx a y + = e y = a + bx .
Subtraindo a segunda equao da primeira, obtemos


y
i
y = b(x
i
x ) ( y
i
y )
2
= b
2
(x
i
x )
2
.

Fazendo o somatrio de ambos os membros da equao,

(

y
i
y )
2
i

= b
2
(x
i
x )
2
i

= b
2
(x
i
x )
2
i

,

obtemos,


1
GUJARATI, Damodar N. Econometria Bsica, 3 Edio. So Paulo: Pearson Makron Books, 2000.
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
17

(18)
xx
S b SQR
2
= ,

logo,
(19)
yy xx
xy
yy
xx
S S
S
S
S
b R
2
2 2
=

=

Vimos que o coeficiente de correlao linear de Pearson R dado por

yy xx
xy
S S
S
R =

Ento,

(20)
2
| | R R + = .

Repare que, no ajuste perfeito, ou seja, quando todas as observaes se
encontram na reta ajustada, todos os resduos so nulos e R
2
=1, assim como
o mdulo do coeficiente de correlao linear de Pearson (veja a figura abaixo).





Voltando ao exemplo anterior (item 21.4),

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
18

SQT =

i
i
y y
2
) ( = y
i
2

y
i
i







2
n
i

2,06 (calculado anteriormente)



SQE = 0883 , 0 ) (
2
=

i
i i
y y

SQR = 972 , 1 42 217 , 0
2 2
= =
xx
S b

O coeficiente R
2
dado por

957 , 0
06 , 2
42
217 , 0
2 2 2
=

=
yy
xx
S
S
b R

O resultado acima nos diz que 95,7% da variao de y explicada pelo modelo
de regresso (veja a figura abaixo). Podemos dizer que a reta ajustada tem
uma boa aderncia aos pontos (x
i
,y
i
).





Exemplo. O coeficiente de determinao de um modelo de regresso linear
uma ferramenta de avaliao do grau de ajustamento do modelo aos dados.

A respeito desse coeficiente, assinale a afirmativa incorreta.

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
19
A) Seu valor varia entre 0 e 1.
B) invariante a uma mudana de escala das variveis independentes.
C) No diz o quo prximos os valores estimados de Y esto de seus valores
efetivos.
D) uma quantidade no negativa.
E) Representa a participao relativa da soma dos quadrados da regresso
sobre a soma dos quadrados total.

Resoluo

Anlise das alternativas:

A) Vimos que 0R
2
1, portanto esta afirmativa CORRETA.
B) A qualidade de uma regresso no muda se multiplicarmos as variveis
independentes por um valor constante (= mudana de escala), portanto esta
afirmativa CORRETA.
C) A afirmao correta a contrria, ou seja, R
2
diz o quo prximos os
valores estimados (ou previstos) de Y esto de seus valores efetivos opo
INCORRETA.
D) Opo correta, pois 0R
2
1.
E) Vimos que R
2
= SQR/SQT. Deste modo, representa a participao relativa
da soma dos quadrados da regresso sobre a soma dos quadrados total
CORRETA.

GABARITO: C

21.7 Relaxamento dos Pressupostos do Modelo

Heterocedasticidade

Lembremos da seguinte premissa do modelo de regresso linear clssico:

A varincia do termo de erro sempre constante, ou seja, Var(e
i
) =
E[e
i
2
] =
2


Quando a varincia dos erros constante, dizemos que os erros so
homocedsticos. Todo o estudo que fizemos at o momento est baseado
nesta premissa.

Entretanto, muitas vezes no mundo real os erros so heterocedsticos, ou
seja, suas varincias no so constantes. Posto em equao,

Var(e
i
) = E[e
i
2
] =
2
(i).

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
20

A heterocedasticidade pode ser causada por vrias fatores. Por exemplo, o
aperfeioamento da coleta de dados pode levar a uma diminuio na varincia
dos erros das observaes mais recentes.

Autocorrelao

A Autocorrelao ocorre quando no se observa o seguinte pressuposto:

Os termos de erro so estatisticamente independentes. Isso implica
que Cov(e
i
,e
j
) = E[e
i
e
j
] = 0, para i j.

Simbolicamente, quando h autocorrelao,

Cov(e
i
,e
j
) = E[e
i
e
j
] 0 para i j.

A autocorrelao dos erros muito comum em sries temporais (por exemplo,
o grfico do ndice BOVESPA ao longo dos ltimos 10 anos uma srie
temporal).

H modelos de regresso linear que corrigem os problemas de
heterocedasticidade e autocorrelao. Entretanto, julgamos desnecessrio, at
mesmo prejudicial (a menos que voc tenha tempo de sobra - concurseiro com
tempo de sobra??), estud-los para a prova, pois acreditamos ser desprezvel
a probabilidade de serem cobrados.

21.8 Regresso sem o Intercepto

Em certas situaes da vida prtica, sabemos que a reta de regresso dos
dados deve passar pela origem. Considere, por exemplo, um estudante de
engenharia eltrica que est fazendo o levantamento experimental da famosa
Lei de Ohm, dada por V = RI, em que R o valor de uma resistncia, V a
tenso aplicada em um resistor e I a corrente que atravessa o resistor. Note
que a equao V = RI passa pela origem do grfico da tenso (eixo vertical)
versus corrente (eixo horizontal). O valor da resistncia d a declividade da
reta.

A regresso sem o intercepto tambm chamada regresso sem termo
constante ou regresso que passa pela origem. Neste caso nosso modelo
passa a ser

+ = X Y

e a condio imposta passa a ser

min e
i
2
=
i

min (y
i


y
i
)
2
= min (y
i
bx
i
)
2
i



Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
21

Aplicando ento o mtodo de mnimos quadrados, obtemos as seguintes
frmulas para b e sua varincia (*)

(21)

=
2
i
i i
x
y x
b

(22)

=
2
2
) var(
i
x
b

,

em que
2
estimado por

(23)
1

2
2

n
e
i


(*) a prova pode ser encontrada no apndice do captulo 6 da referncia
GUJARATI, Damodar N. Econometria Bsica, 3 Edio. So Paulo: Pearson
Makron Books, 2000.

interessante comparar tais frmulas com as que se obtm quando o termo
de intercepto est includo no modelo:

b =
S
xy
S
xx
=
(x
i
x )(y
i
y )

(x
i
x )
2

=
2
2
) (
) var(
x x
b
i




2
=
e
i
2

n 2


As diferenas entre os dois conjuntos de frmulas so evidentes: no modelo
com intercepto usamos somas de quadrados e produtos cruzados (isto ,
produtos entre X e Y) ajustados em relao mdia. Alm disso, o nmero de
graus de liberdade para calcular
2
(n-1) na regresso sem o intercepto e
(n-2) na regresso com intercepto. A estatstica
2
tem (n-1) graus de
liberdade na regresso sem o intercepto porque a obteno dos
i
y necessita
da estimativa de somente um parmetro do modelo.

Aprendemos, quando estudamos o modelo de regresso linear com intercepto,
que

=
2 2

i
e = SQE = SQT SQR. Vimos que SQR = b
2
S
xx
= b
2

2
) ( x x
i
, por
conseguinte


=
2 2 2 2
) ( ) ( x x b y y e
i i i
(regresso com intercepto).
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
22


Para o modelo com intercepto zero, pode-se mostrar analogamente que


=
2 2 2 2
i i i
x b y e .

Note que as somas dos quadrados de Y e X no so ajustadas pela
mdia na frmula acima.

Se o exerccio no mencionar qual o modelo, sempre resolva a questo
usando o modelo com intercepto.

J caiu em prova! (Especialista em Regulao de Aviao
Civil/ANAC/2009/UnB-CESPE). Um estudo sobre a duraco de uma
operaco de carregamento mostrou haver relaco linear na forma Y
k
= X
k
+

k
, em que Y
k
o tempo (horas) do carregamento k; X
k
o volume total (em
toneladas) do carregamento k; o coeficiente angular; e
k
representa um
erro aleatrio com mdia zero e variancia
2
.

De uma amostra aleatria de 341 operaces de carregamento,
observam-se os seguintes resultados:

=
=
341
1
988
k
k k
Y X ;

=
=
341
1
2
704 . 1
k
k
X ;

=
=
341
1
682
k
k
X ;

=
=
341
1
2
681
k
k
Y ;

=
=
341
1
341
k
k
Y .

Com base nessas informaces, julgue os itens a seguir.

O coeficiente R
2
(ou coeficiente de determinaco ou explicaco) do modelo
apresentado igual a 0,81, o que indica que 81% da variaco total do tempo
de carregamento so explicadas pelo volume total do carregamento.

Resoluo

Note que a regresso passa pela origem, pois o modelo especificado Y
k
= X
k

+
k
.

O coeficiente R
2
mede a proporo da variao total em Y (tempo em horas do
carregamento) explicada por X (volume total em toneladas do carregamento)
dentro do modelo de regresso. No precisamos calcular o valor de R
2
para
resolver o item, pois o mesmo afirma que 81% da variaco total do tempo de
carregamento so explicadas pelo volume total do carregamento. Ora, quem
explica o modelo de regresso e no a varivel independente X. Logo o item
est errado.

Determinemos o valor de R
2
. Aprendemos que a correlao linear entre Y e X,
dada por R, pode ser calculada pela frmula

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
23

yy xx
xy
S S
S
R =

S
xy
= X
k
Y
k

X
k
( )
Y
k
( )
n

= 988
682 341
341
= 306
S
xx
= X
k
2

X
k

( )
2
n

=1.704
682 682
341
= 340
S
yy
= Y
k
2

Y
k
( )
2
n

= 681
341 341
341
= 340

Logo, R =
306
340 340
=
306
340
= 0,9 R
2
= 0,81.

Voc percebeu a pegadinha para os desatentos? O coeficiente de
determinao , de fato, igual a 81%. Mas o problema que a definio de R
2

est errada. Moral da histria: leia os itens com todo a ateno, pois a sua
futura carreira no servio pblico depende disso!

GABARITO: E

A correlaco linear entre o tempo de carregamento e o volume total do
carregamento superior a 0,85.

Resoluo

O item est certo, pois vimos que R = 0,9. Calcular o R no item anterior no
foi uma perda de tempo!

GABARITO: C

Sendo os erros aleatrios distribudos segundo uma normal, ento a estimativa
de mxima verossimilhanca para o coeficiente inferior a 0,60 e superior a
0,55.

Resoluo

A banca pegou pesado neste item, pois assumiu que o candidato soubesse a
seguinte propriedade (memorize para a prova!):

Se admitirmos os erros aleatrios do modelo de regresso distribudos
normalmente, os estimadores de mnimos quadrados e de mxima
verossimilhana dos coeficientes da regresso so idnticos (GUJARATI, D. N.
Econometria Bsica, 3 Ed., Pearson Makron Books, 2000).

Trata-se de uma regresso sem o intercepto. Logo,
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
24


b =
X
k
Y
k

X
k
2

=
988
1.704
= 0,58.

Note que 0,55 < b = 0,58 < 0,60 item certo.

GABARITO: C

Sendo y , x e

, respectivamente, a mdia dos tempos de carregamento, a


mdia dos volumes totais do carregamento e a estimativa de mnimos
quadrados do coeficiente angulardo modelo, ento x y

= .

Resoluo

O modelo Y
k
= X
k
+
k
. Logo,

E(Y
k
) = E(X
k
+
k
) = E(X
k
) + E(
k
) = E(X
k
) + E(
k
) = E(X
k
), pois E(
k
) = 0.

Note que E(Y
k
) = E(X
k
)

E(X
k
). Item errado.

Nota: mais uma pegadinha da banca. Errou a questo quem confundiu a
estimativa do coeficiente angular, dada por

, com o prprio coeficiente


angular .

GABARITO: E

21.9 Intervalos de Confiana

A partir deste ponto, abandonaremos a notao e para os parmetros do
modelo + + = X Y de RLS e adotaremos em seus lugares
1
e
2
,
respectivamente. A razo disso que empregaremos o termo daqui para
frente para designar o nvel de significncia do teste, como logo veremos.

O modelo de RLS fica ento na forma

(24) Y =
1
+
2
X +

em que
1

e
2

denotam as estimativas de
1
e
2
, respectivamente.

Se os pressupostos do modelo (24) se verificam, inclusive o da normalidade
dos erros, pode-se provar que

(25)
2
2 2
2

n
t
s


)

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
25

segue distribuio t de Student com n2 graus de liberdade, em que
xx
S s /
2 2

= a varincia amostral de
2

(lembre que
2
denota a varincia
amostral dos resduos do modelo).

O nmero de graus de liberdade (GL) o nmero de observaes subtrado do
nmero de parmetros do modelo. No modelo de RLS, GL = n-2.

Da tabela auxiliar da t de Student encontramos valores crticos t
c
tais que
P{t
c
t t
c
} =1. Segue-se que

= 1 } / )

( {
2
2 c c
t s t P
)
, e, rearranjando
a inequao anterior, obtemos

(26)

= + 1 } {
2 2
2 2 2
) )
) )
s t s t P
c c


Exemplo. Considere o nvel de significncia = 0,05 = 5% e a estatstica t
com 30 graus de liberdade. Podemos ver na figura abaixo que 1 = 0,95 =
95% a rea sob a densidade t (curva azul) no intervalo -2,042 t 2,042
(t
c
= 2,042 para = 5%, confira!) e 2 = 0,025 = 2,5% a rea de cada
uma das caudas da distribuio.


-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Distribuio da estatstica t, N=30
t
D
e
n
s
i
d
a
d
e
Prob =0.025
t>2.042
Prob =0.025
t<-2.042
Area =0,95
-2.042<t<2.042



O intervalo observado

)

2
t
c
s
)

2
denominado intervalo com )% 1 ( 100 de
confiana para o parmetro
2
. A interpretao de um intervalo de confiana
que se um nmero infinito de amostras aleatrias for coletado e um intervalo
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
26
com )% 1 ( 100 de confiana para
2
for calculado a partir de cada amostra,
ento )% 1 ( 100 desses intervalos contero o valor verdadeiro de
2
.

Na prtica, obtemos somente uma amostra aleatria e calculamos uma
estimativa do intervalo de confiana. Uma vez que esse intervalo conter ou
no o valor verdadeiro de
2
, no razovel fixar um nvel de probabilidade
para essa realizao. A afirmao apropriada a seguinte: o intervalo
observado contm o valor verdadeiro de , com )% 1 ( 100 de confiana. Essa
afirmao tem uma interpretao de freqncia; ou seja, no sabemos se a
afirmao verdadeira para essa amostra especfica, mas o mtodo usado
para obter o intervalo
2
2

)
)
s t
c
resulta em afirmaes corretas em )% 1 ( 100
do tempo

Para o intercepto
1
, a estimao dos intervalos de confiana (IC) funciona
rigorosamente da mesma maneira que para
2
. Assim, podemos reescrever
(26) como

(27)

= + 1 } {
1 1
1 1 1
) )
) )
s t s t P
c c


em que

(28)

s
s
)

1
=

2
x
i
2

nS
xx


Exemplo. Retornemos ao exemplo de RLS que temos utilizado ao longo desta
aula. A reta estimada x y 217 , 0 174 , 0 + = e as distribuies estimadas de
1
e
2

so:

) 008938 , 0 ; 174 , 0 ( :
) 0003505 , 0 ; 217 , 0 ( :
1
2
N
N



Se quisermos calcular os intervalos de confiana de 95% para
1
e
2
, temos
de escolher corretamente o valor crtico t
c.
Lembre que n=8 observaes.
Logo, t
6
= 2,447, o que implica 2,5% de rea para cada cauda.


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
27
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Distribuio da estatstica t, N=30
t
D
e
n
s
i
d
a
d
e
Prob =0.025
t>2.447
Prob =0.025
t<-2.447



O IC de
2
no nvel de 95% de confiana dado por

046 , 0 217 , 0 0003505 , 0 447 , 2 217 , 0
2
2
= =

)
)
s t
c
.

O IC de
1
no nvel de 95% de confiana dado por

231 , 0 174 , 0 008938 , 0 447 , 2 174 , 0
1
1
= =

)
)
s t
c
.

J caiu em prova! (TCNICO DE DEFESA AREA E CONTROLE DE
TRFEGO AREO DECEA/2009/CESGRANRIO) Uma determinada
empresa resolveu estudar a relao do ativo total (em bilhes de reais) e a
receita lquida (em milhes de reais) das 17 maiores instituies financeiras do
pas. O estudo forneceu os seguintes resultados:

Estatstica de regresso
R
2
0,55
R
2
Ajustado 0,52
Erro padro 2,86
Observaes 17



Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
28
Coeficientes Erro padro T valor-P
Interseo 4,5 1,43 3,1 0,007
Receita
lquida
0,1 0,02 4,3 0,001

Com base nos resultados, o intervalo de confiana de 95%, bilateral, para a
inclinao da reta, , , aproximadamente,
(A) 0,1 1,64 x 0,02
(B) 0,1 1,75 x 0,02
(C) 0,1 1,96 x 0,02
(D) 0,1 2,13 x 0,02
(E) 0,1 4,30 x 0,02

Resoluo

Seja o modelo de RLS Y =
1
+
2
X + , em que a inclinao da reta
2
o
mencionado pelo enunciado, X a varivel independente (ativo) e Y a
varivel dependente (receita lquida).

Pede-se o intervalo de confiana (IC) de
2
. Vimos ele dado por

02 , 0 3 , 4 1 , 0
2
2
=

)
)
s t
c
opo correta (E), certo? ERRADO! Voc caiu numa
pegadinha da banca.

O valor T da tabela a estatstica de teste da Hiptese nula H
o
:
2
=0.
O IC dado por
2
2

)
)
s t
c
, onde t
c
o valor crtico de t extrado da tabela
auxiliar t de Student.

No modelo de RLS, para n=17 observaes, temos n2 = 15 graus de
liberdade (GL). Para o IC bilateral 95% de confiana e 15 GL, t
c
=2,131 2,13.
Como 1 , 0
2
=
)
e 02 , 0
2
=

)
s , temos que:

IC: 02 , 0 13 , 2 1 , 0
2
2
=

)
)
s t
c
.

Nota: a estatstica R
2
Ajustado definida no estudo da regresso linear
mltipla, que est fora do escopo desta aula. Essa estatstica no usada na
RLS. Na prova, voc teria condies de resolver esta questo mesmo sem
saber a definio de R
2
Ajustado.

GABARITO: D

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
29

21.10 Testes de Hipteses

A hiptese nula H
0


A hiptese nula geralmente o oposto do que queremos provar. Por exemplo,
no modelo de RLS + + = X Y
2 1
, ao calcularmos
2

estamos supondo que


existe uma relao entre as variveis X e Y. Assim, uma hiptese nula (H
0
)
usualmente adotada H
0
:
2
=0.

A hiptese alternativa H
1


A hiptese alternativa contradiz a hiptese nula. Por exemplo, quando a
hiptese nula H
0
:
2
= 0 a hiptese alternativa pode ser H
1
:
2
0 ou H
1
:
2
<0 ou ainda H
1
:
2
>0.

A preocupao de definir as hipteses do examinador, ns s teremos de
test-las. E para isso precisaremos de uma estatstica de teste.

Vimos que
2
2 2
/ )

s segue distribuio t com n-2 graus de liberdade. Se a


hiptese nula H
0
:
2
= k, em que k uma constante, for aceita, ento
2
2 2
/ )

s k t
n
=

tambm possui distribuio t com n-2 graus de liberdade. Esta


ser a estatstica usada no teste. Ressaltamos que, na maioria dos exames, a
hiptese nula H
0
:
2
=0 e t
n2
=


2
/ s

2
, embora isso nem sempre ocorra.

A Regio de Rejeio

Se a estatstica t
n2
= (


2
k) / s

2
for muito grande em mdulo (valor absoluto),
rejeitamos H
0
. A lgica est no fato de, se
2

ficar muito distante de k,


provavelmente H
0
est errada.

Mas o quo grande tem de ser a estatstica acima para rejeitarmos H
0
em
favor de H
1
:
2
0? A resposta a essa pergunta a escolha de um nvel de
significncia . A regio de rejeio composta por valores t tais que P{t
t
c
} = P{t -t
c
} = /2, conforme ilustrado pela figura abaixo.


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
30

-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Distribuio da estatstica t, N=30
t
D
e
n
s
i
d
a
d
e
Prob = /2
t>t
c
Prob = /2
t<-t
c
P(-t
c
<t<t
c
) = 1-
NO REJEITAR H
0
REJEITAR H
0
REJEITAR H
0



Tipos de erro (reviso!)

Sempre que aplicamos um teste de hipteses corremos o risco de errar. H
dois tipos de erro.

Erro tipo I: rejeitar H
0
sendo ela verdadeira. Neste caso, H
0
verdadeira
e P{t
c
(


2
k) / s

2
t
c
} =1, pois (


2
k) / s

2
segue a distribuio t
n-2
. Assim, a
probabilidade de cometer um erro tipo I .

Erro tipo II: aceitar a hiptese H
0
sendo ela falsa. Entretanto, essa
probabilidade no pode ser calculada, pois no sabemos o verdadeiro valor do
parmetro. Mas podemos dizer que a probabilidade de um erro nvel II
aumenta medida que diminui a probabilidade de um erro nvel I, quando se
escolhe um menor nvel de significncia .

Exemplo. Com os dados do exemplo do exemplo anterior, teste a hiptese H
0
:

1
=0 em favor da hiptese alternativa H
1
:
1
0 nos nveis de 10% e 20% de
significncia.

As mesmas frmulas enunciadas para
2
se aplicam para
1
. A estatstica de
teste

t
n2
= (


1
k) / s


1
= 0,174 / 0,008938 =1,84.

a) = 0,10
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
31


P{t t
c
} = P{t -t
c
} = /2= 0,05

Como n=8, temos n2 = 6 GL. Da tabela auxiliar, t
c
=1,94. Como t
c
< t
n2
< t
c
,
t
n-2
se encontra na regio de aceitao. Portanto, no rejeitamos a hiptese
nula no nvel de significncia de 10%.


b) = 0,20

P{t t
c
} = P{t -t
c
} = /2= 0,10

Da tabela auxiliar, t
c
= 1,44. Como t
n-2
>t
c
, t
n-2
encontra-se na regio de
rejeio. Portanto, a hiptese nula rejeitada no nvel de significncia
de 20%.


Testes unilaterais (unicaudais)

At agora estudamos os testes bilaterais ou bicaudais, que se caracterizam
pela hiptese nula H
0
:
i
=0 (i=1,2), contra a alternativa H
1
:
i
0.

Se rejeitarmos H
0
em favor da alternativa H
1
:
i
0, estaremos considerando
que
i
pode assumir qualquer valor negativo ou positivo, menos o zero.
Ocorre s vezes, pela natureza das variveis, que
i
no pode ser negativo e,
dessa forma, estabelecemos a hiptese alternativa H
1
:
i
>0. O que voc
precisa saber para a prova est explicado na sequncia.

Em um teste bilateral, a regio de rejeio composta por valores t tais que
P{t t
c
} = P{t -t
c
} = /2. Em um teste unilateral direita, a regio de
rejeio composta por valores t tais que P(tt
c
) = . Na prxima figura,
temos = 5% e t
c
= 1,697 (30 graus de liberdade).


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
32
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
Distribuio da estatstica t
t
D
e
n
s
i
d
a
d
e
Rejeitar se t > 1.697
Prob = 0.05



O restante do procedimento idntico ao j estudado.

21.11 Anlise de Varincia

Seja o modelo de RLS dado por + + = X Y
2 1
e sua reta estimativa
x y
2 1

+ = . Vimos no item 21.6 que SQT = SQR + SQE, ou seja,


+ =
2 2 2
) ( ) ( ) (
i i i i
y y y y y y .

A expresso acima a equao bsica da anlise de varincia ou ANOVA
(ANalysis Of VAriance). Veremos que a anlise de varincia pode ser usada
para testar a significncia da regresso. J aprendemos que os
componentes

2
) ( y y
i
(SQR) e

2
) (
i i
y y (SQE) medem, respectivamente, a
variao em y devida reta de regresso e a variao residual deixada sem
explicao pela reta de regresso.

A ideia usar a equao da ANOVA para testar a hiptese de no haver
regresso (
2
=0). Se no h regresso,
1

= y e y =
1

(pois
y x y x y = = = . 0

2 1
). Portanto, 0 ) ( )

( ) (
2 2
1
2

= = = y y y y y
i
(SQR
nula). Neste caso, SQT = SQE e isto quer dizer que a varincia total de Y (
y
2
)
igual a varincia residual
2
(varincia do erro aleatrio do modelo), ou
seja,
y
2
=
2
.

Vamos agora dividir os termos dos lados esquerdo e direito da equao da
ANOVA pela varincia residual
2
:

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
33
(y
i
y )
2

2
=
(

y
i
y )
2

2
+
(y
i


y
i
)
2

2
.

Observe que a diviso de SQT por
2
(lado esquerdo da expresso acima),

1

2
(y
i
y )
2

=
y
i
y







2
=

n1
2
,

resulta numa varivel aleatria qui-quadrado com n-1 graus de liberdade, pois
assumimos que
y
2
=
2
(lembre que a mdia amostral y causa a subtrao de
1 grau de liberdade na estatstica).

Seguindo a mesma linha de raciocnio, temos que a estatstica

1

2
(y
i


y
i
)
2

=
y
i


y
i







2
=

n2
2


uma varivel aleatria qui-quadrado com n-2 graus de liberdade (a
diminuio de 2 graus de liberdade causada pela estimao dos parmetrods
1

e
2

).

Ainda falta analisar a estatstica
(

y
i
y )
2

2
=


2
2
S
xx

2
(lembre que
xx
S SQR
2
2

= ). A
varivel aleatria
2

normal. Sendo 0
2
= por hiptese, temos que

xx
S
N
2
2
, 0 ~

. Considere a varivel normal reduzida



z =


2
0
/ S
xx
=


2
S
xx

.

Elevando ao quadrado ambos os membros da expresso acima, obtemos,

z
2
=


2
0
/ S
xx








2
=


2
2
S
xx

2
=
SQR

2
,

e conclumos que a diviso de SQR por
2
resulta numa varivel aleatria qui-
quadrado com 1 grau de liberdade.

Assim, a equao

(y
i
y )
2

2
=
(

y
i
y )
2

2
+
(y
i


y
i
)
2

2


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
34
pode ser reescrita como

2
2
2
1
2
1
+ =
n n
,

se, de fato, vlida a hiptese 0
2
= .

Aprendemos na aula 18 que uma varivel resultante da soma de duas outras
variveis independentes
2
1
n
e
2
2
n
uma varivel
2
2 1
n n

+
. Uma consequncia da
propriedade de aditividade da qui-quadrado a seguinte: se trs variveis
2
n
,
2
1
n
e
2
2
n
so tais que
2
n
=
2
1
n
+
2
2
n
, ento a condio necessria e suficiente
para que
2
1
n
e
2
2
n
sejam independentes que n = n
1
+ n
2
.

(*) o termo tcnico seria corolrio.

Conclumos que
2
1
= (SQR/
2
) e
2
2 n
= (SQE/
2
) so variveis qui-quadrado
independentes, pois o nmero de graus de liberdade de SQT/
2
n-1, caso a
premissa 0
2
= seja vlida.

Considere a estatstica F

(29) F =
SQR/
2
1
SQE /
2
n 2
=

1
2
/1

n2
2
/(n 2)
=
SQR/1
SQE /(n 2)
=


2
2
S
xx


2
,

em que
2
denota a varincia residual amostral. Note que F tem 1 grau de
liberdade no numerador e n-2 graus de liberdade no denominador. Ento (29)
pode ser usada para se testar, pela ANOVA, a hiptese H
0
de no haver
regresso. O teste ser unilateral, uma vez que, sendo falsa H
0
, o numerador
tender a crescer. A varivel (29) dever ser comparada com o valor crtico
F
1,n2,
em que o nvel de significncia do teste de hipteses. Daremos um
exemplo de teste pela ANOVA mais adiante.

O teste acima descrito equivalente ao teste bilateral da hiptese nula 0
2
= ,
porque demonstra-se que o F de (29) o quadrado do t
n-2
quando 0
2
= , ou
seja, F
1,n-2
= t
2
n-2
.

Podemos resumir tudo o que foi visto neste item na tabela de ANOVA abaixo
(memorize para a prova!).





Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
35
Fonte de
Variao
Soma de
Quadrados
Graus de
Liberdade
Quadrado
Mdio
F F


Regresso SQR 1 SQR/1
) 2 /(
1 /
n SQE
SQR

F
1,n-2,

Residual SQE n-2 SQE/(n-2)
Total SQT n-1



Pelo que foi visto at o momento, tanto faz usar t ou F no modelo de RLS. Na
verdade, F muito til para a inferncia do modelo de regresso linear
mltipla, cujo estudo est fora do escopo desta aula. por isso que demos
maior nfase ao estudo dos testes com a estatstica t.

Nota: cuidado com a notao. Alguns autores no adotam as mesmas
abreviaturas que so usadas neste curso. Vimos que

SQR = Soma dos quadrados da regresso = (

y
i
y )
2
i

(variao explicada).

Alguns autores a chamam de Soma dos Quadrados Explicada (SQE) pela
regresso.

Vimos tambm que

SQE = Soma dos quadrados dos erros = (y
i


y
i
)
2
i

(variao residual).

Alguns autores a chamam de Soma dos Quadrados dos Resduos (SQR).

Neste caso inverte-se a notao. Na prova, o examinador ter de explicar a
qual soma estar se referindo. Voc tem apenas de estar bem atento.

Exemplo. Testar pela ANOVA a existncia de regresso linear para os dados
do exemplo do item 21.4, ao nvel de 10% de significncia. Considere F
1;6;0,1
=
3,776.

Dados: 174 , 0

1
= (intercepto estimado), 217 , 0

2
= (inclinao estimada), S
yy
=
2,06; S
xx
= 2,06, S
xy
= 9,1 e n = 8.

Soluo:

Vamos testar as hipteses

H
0
:
2
= 0,
H
1
:
2
0.

SQR = 978 , 1 42 217 , 0

2 2
2
=
xx
S .
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
36
SQE = SQT SQR = S
yy
SQR = 2,06 1,978 = 0,082.

F = SQR/[SQE/(n2)] = 1,987/(0,082/6) 144,73.

Como F = 144,73 >> 3,776, rejeitamos H
0
e conclumos que h regresso. A
prxima figura ilustra a distribuio amostral de F. A rea azul corresponde a
P(F > f
c
) = 10%, em que o valor crtico f
c
= 3,776.

0 20 40 60 80 100 120 140
0
0.05
0.1
0.15
0.2
0.25
Distribuio da estatstica F
f
D
e
n
s
i
d
a
d
e
P(F > 3.776) = 0,10
curva F
rea =10%


Fonte de
Variao
Soma de
Quadrados
Graus de
Liberdade
Quadrado
Mdio
F F


Regresso 1,978 1 1,978
=
014 , 0
978 , 1

144,73

3,776
Residual 0,082 6 0,014
Total 2,060 7


J caiu em prova! (Analista da SUSEP/Aturia/2010/ESAF). A partir de
uma amostra aleatria (X
1
,Y
1
), (X
2
,Y
2
),..., (X
20
,Y
20
) foram obtidas as
estaststicas:

mdias X = 12,5 e Y = 19, varincias amostrais s
x
2
= 30 e s
y
2
= 54 e
covarincia S
xy
= 36.

Qual a reta de regresso estimada de Y em X?

A)

Y
i
=19 +0,667X
i

B)

Y
i
=12,5 +1,2X
i

C)

Y
i
= 4 +1,2X
i

D)

Y
i
=19 +1,2X
i

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
37
E)

Y
i
= 80 +22,8X
i


Resoluo

A reta a estimar

i i
X Y
2 1

+ = ,

em que o parmetro
2

(estimativa da declividade) dado por





2
=
S
xy
S
xx
=
(X
i
X )(Y
i
Y )
i=1
n

(X
i
X )
2
i=1
n

,

e o parmetro
1

(estimativa do intercepto) por



X Y
2 1

= .

Observe que estamos usando uma notao diferente do enunciado: a
quantidadeS
xy
definida acima no a covarincia entre X e Y.

Podemos calcular b adaptando a frmula dada acima:



2
=
(X
i
X )(Y
i
Y )
i=1
n

n 1
(X
i
X )
2
i=1
n

n 1
=
s
xy
s
x
2
.

Ou seja,
2

pode ser calculado, de forma alternativa, pela razo entre a


covarincia amostral s
xy
(estamos usando uma notao diferente da do
enunciado, mas que est coerente com a desta aula!) e a varincia amostral
s
x
2
. Logo, 2 , 1 30 / 36

2
= = e 0 , 4 5 , 12 2 , 1 19

1
= = . Deste modo, a reta de
regresso estimada de Y em X

Y
i
= 4 +1,2X
i
.

GABARITO: C

J caiu em prova! (Analista da SUSEP/Aturia/2010/ESAF). Com os
dados da questo anterior, determine o valor da estatstica F para testar a
hiptese nula de que o coeficiente angular da reta do modelo de regresso
linear simples de Y em X igual a zero.

A) 144
B) 18
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
38
C) 36
D) 72
E) 48

Resoluo

Sabemos que F =
SQR
SQE /(n 2)
.

80 , 820 ] 30 19 [ 44 , 1 ] ) 1 [( 2 , 1

2 2 2
2
= = = =
x xx
s n S SQR

026 . 1 54 19 ) 1 (
2
= = = =
y yy
s n S SQT

20 , 205 80 , 820 026 . 1 = = = SQR SQT SQE

Assim,

72
18 / 20 , 205
80 , 820
= = F

GABARITO: D

21.12 Memorize para a prova

- Equao do modelo de RLS: + + = X Y , em que o intercepto, a
declividade e denota o erro aleatrio do modelo, suposto N ~(0,
2
), isto ,
normalmente distribudo com mdia nula e varincia
2
.

- S
xx
= x
i
2

x
i

( )
2
n



- S
yy
= y
i
2

y
i

( )
2
n



- S
xy
= x
i
y
i

x
i
( )
y
i
( )
n



- Reta estimativa: bx a y x Y E + = = ) | (

-

=
=
x b y a
S
S
b
xx
xy


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
39
-

xx
S
N b
2
, ~

n
x
b N a
i
2
) var( , ~

- SQT = SQR + SQE (Equao da ANOVA)

-
yy i
S y y SQT = =

2
) (

-

= =
xx i
S b y y SQR
2 2
) (

-

= =
2 2
) (
i i i
e y y SQE , em que os
i
e so os resduos do modelo. Os resduos
so realizaes do erro aleatrio do modelo.

-

= =
2 2 2 2
) ( ) ( x x b y y e SQE
i i i


- varincia dos resduos:
2
=
e
i
2

n 2
=
SQE
n 2
a estimativa da varincia
2
de .

- Coeficiente de determinao:
SQT
SQE
SQT
SQR
R = = 1
2


- Estatstica t para testar se h regresso (H
0
: = 0):
b
s
k b
t

= , em que
xx
S
s
b
2
2

= .

- Intervalo de confiana para :
b c
s t b .

- Estatstica F:
) 2 (
=
n SQE
SQR
F .






- ANOVA:

Fonte de
Variao
Soma de
Quadrados
Graus de
Liberdade
Quadrado
Mdio
F F


D a n i e l a M i t i W a d a , C P F : 2 2 3 5 1 2 7 1 8 5 8
D a n i e l a M i t i W a d a , C P F : 2 2 3 5 1 2 7 1 8 5 8
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
40
Regresso SQR 1 SQR/1
) 2 /(
1 /
n SQE
SQR

F
1,n-2,

Residual SQE n-2 SQE/(n-2)
Total SQT n-1


- Regresso sem o intercepto: + = X Y :

b =
x
i
y
i

x
i
2

=
2
2
) var(
i
x
b

e

2
=
e
i
2

n 1


SQE = e
i
2

= y
i
2
b
2
x
i
2



- Se admitirmos os erros aleatrios do modelo de regresso distribudos
normalmente, os estimadores de mnimos quadrados e de mxima
verossimilhana dos coeficientes da regresso so idnticos.

21.11 Exerccios de Fixao

1. Ajuste o modelo linear simples Y
i
= + X
i
+
i
para os dados da tabela abaixo
e determine o resduo correspondente a X=7 e Y=15.

X 5 6 7 9 11 12
Y 20 19 15 12 12 8

A) 1,08
B) 1,42
C) -0,71
D) -1,42
E) -1,08

2. Seja o modelo Y
i
= + X
i
+
i
. So dados:

60 =
i
x

1260
2
=
i
x

320 =
i
y


16000
2
=
i
y

2400 =
i i
y x


n = 10 observaes

Calcule s
2
. Dica: SQE = SQT SQR = S
yy
b
2
S
xx


A) 5760
B) 720
C) 550,4
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
41
D) 688
E) 60

Julgue o item a seguir.

3. No modelo Y
i
= + X
i
+
i
os estimadores de mnimos quadrados de e so
os de menor varincia possvel.

(Analista BACEN - rea 4/2006/FCC) Considere as informaes a seguir
para resolver as questes de nmeros 4 e 5.

Uma empresa, com a finalidade de determinar a relao entre os gastos anuais
em pesquisa e desenvolvimento (X), em milhares de reais, e o acrscimo anual
nas vendas (Y), tambm em milhares de reais, optou por utilizar o modelo
linear simples Y
i
= + X
i
+
i
, em que Y
i
o acrscimo nas vendas no ano i, X
i

o valor gasto em pesquisa e desenvolvimento no ano i e
i
o erro aleatrio com
as respectivas hipteses consideradas para a regresso linear simples(

e
so parmetros desconhecidos). Considerou para o estudo as seguintes
informaes referentes s observaes nos ltimos 10 anos da empresa:

Y
i
=160
i=1
10


X
i
=100
i=1
10


X
i
Y
i
=1.900
i=1
10



X
i
2
=1.200
i =1
10

Y
i
2
= 3.060
i=1
10



4. Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados,
obteve-se, para um determinado gasto em pesquisa e desenvolvimento, uma
previso de acrscimo nas vendas no valor de 19 mil reais. O valor que se
considerou para o gasto em pesquisa e desenvolvimento, em mil reais, foi

A) 14,0
B) 13,75
C) 13,0
D) 12,4
E) 12,0

5. Montando o quadro de anlise de varincia, tem-se que

A) a variao residual apresenta um valor igual a 100.
B) o valor da estatstica F necessria para o teste de existncia da regresso
igual a nove.
C) o valor do correspondente coeficiente de determinao (R
2
) igual a 90%.
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
42
D) a variao total apresenta um valor igual a 550.
E) a variao explicada, fonte de variao devido regresso, apresenta um
valor igual a 500.

(Analista BACEN 2001/ESAF) As questes 6 e 7 dizem respeito ao
enunciado seguinte.

A Cia. Delta presta servio de manuteno a uma marca de microcomputador.
O gerente da Cia. Delta est interessado em estudar a associao existente
entre o tempo (y) em minutos gasto em um atendimento e o nmero (x) de
micros atendidos.

Neste contexto anota as realizaes y
t
e x
t
dessas variveis em 16 chamadas
de servio. O gerente postula o modelo linear Y
t
= + X
t
+
t
, t=1...16, onde
e so parmetros desconhecidos e os
t
so erros no correlacionados com
mdia zero e varincia constante
2
. Os resultados obtidos com o ajuste pelo
mtodo de quadrados mnimos para esse modelo so apresentados a seguir.

Parmetro Estimativa Desvio-padro


-2,3 2,6


14,7 0,5

2

20 -

Sabe-se que (y
t
m)
2
=14.000
t

, onde m o tempo mdio das 16 chamadas.



6. Assinale a opo que d o valor do coeficiente de determinao do modelo
linear.

A) 0,98
B) 0,90
C) 0,88
D) 0,28
E) 0,20

7. Assinale a opo que d a estimativa do aumento esperado no tempo de
atendimento decorrente do aumento de uma unidade no nmero de micros
atendidos.

A) 17,0
B) 12,4
C) -2,3
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
43
D) 0,2
E) 14,7

8. No

ajuste do modelo linear simples Y
i
= + X
i
+
i
so dados:

196 =
i
x

160 =
i
y

3318 =
i i
y x


a = -11,5 n = 28 observaes

Calcule

2
i
x .

A) 2198
B) 2265,5
C) 2450
D) 3318
E) 893,5

Julgue o item a seguir.

9. Sejam dados a tabela abaixo e o modelo Y = X +

X 10 12 14 16 18
Y 8 11 13 15 19

A estimativa de mnimos quadrados de maior que um.

(Analista BACEN 1997/CESPE) Para as questes de 10 a 14, utilize as
informaes a seguir.

O gerente do setor de compras de uma organizao bancria deseja estudar
um modelo de predio do tempo gasto para o processamento de faturas
relativas importao de equipamentos eletrnicos. Durante trinta dias, foram
coletados dados relativos ao tempo de processamento das faturas (em horas)
e o nmero de faturas processadas. Considerando tratar-se de uma relao
linear, cuja varivel dependente o TEMPO, os dados foram processados e os
resultados preliminares so apresentados nas tabelas a seguir.




ANLISE DE VARINCIA

Fontes Graus de Soma de Quadrado Valor F Prob > f
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
44
Liberdade Quadrado Mdio
Modelo 1 25,94382

25,94382

232,220

0,0001

Erro

28 3,12818

0,11172


Total

29 29,07200




R Quadrado (Coeficiente de
determinao)

C.V. ( Coeficiente de Variao )

0,8924 16,38464

ESTIMATIVAS DOS PARMETROS


Varivel

Graus de
Liberdade
Estimativas

Erro
Padro
T

Prob
>T
INTERCEPTO

1 0,402375

0,12358250

3,256

0,0030

FATURAS

1 0,012607

0,00082729

15,239

0,0001


Representando por Y
i
o tempo gasto e por X
i
o nmero de faturas processadas
no dia i, julgue os itens de 10 a 14.

10. O modelo estimado igual a E (Y
i
) = 0,402375 + 0,012607X
i
+
i
, em que
E (Y
i
) representa o tempo mdio e
i
representa o resduo estimado para o i-
simo dia.

11. O resultado obtido indica que a cada aumento de uma fatura processada
corresponde um aumento de 0,012607 no tempo esperado estimado.

12. Para o modelo proposto, o teste de adequabilidade do modelo
equivalente a testar H
o
:
1
= 0 contra H
a
:
1
0, em que
1
o parmetro
associado varivel que indica o nmero de faturas processadas a cada dia.

13. Para que o analista rejeite a hiptese nula H
o
: INTERCEPTO = 0, o nvel de
significncia usado deve ser inferior a 0,003.

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
45
14. Aproximadamente 16,38% da variao no tempo de processamento so
explicados pela variao no nmero de faturas processadas.

15. So dados para o modelo + + = X Y


36 =
i
x

162
2
=
i
x

0 =
i
y

270 =
i i
y x


50 , 13
2
= 12 = n


Determine a estatstica t para testar a hiptese H
0
: = 0

A) 10
B) 15
C) 20
D) 23,57
E) 28,48


Julgue os prximos itens com base no enunciado abaixo.

Seja o modelo estimado
i i
x y 2 90 = , em que a varincia amostral do intercepto
22, a varincia amostral da declividade 0,06. Foram coletadas 7
observaes.

16. O intervalo de confiana de 90% para a declividade ) 51 , 1 ; 49 , 2 ( .

17. Considere o teste de hipteses H
0
: 100 = contra H
1
: 100 a um nvel de
significncia de 5%. Ento deve-se rejeitar H
0
.

21.12 Gabarito

1 D
2 D
3 ERRADO
4 E
5 C
6 A
7 E
8 B
9 ERRADO
10 ERRADO
11 CERTO
12 - CERTO
13 - ERRADO
14 ERRADO
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
46

15 A
16 - CERTO
17 - ERRADO

21.13 Resoluo dos Exerccios de Fixao

1. Ajuste o modelo linear simples Y
i
= + X
i
+
i
para os dados da tabela abaixo
e determine o resduo correspondente a X=7 e Y=15.

X 5 6 7 9 11 12
Y 20 19 15 12 12 8

A) 1,08
B) 1,42
C) -0,71
D) -1,42
E) -1,08

Resoluo

O problema pede o resduo da 3 observao, ou seja, e
3
= y
3


y
3
.

Estimativas de a e b:

i
x
i
y
i i
y x
2
i
x
5 20 100 25
6 19 114 36
7 15 105 49
9 12 108 81
11 12 132 121
12 8 96 144
50 =
i
x 86 =
i
y 655 =
i i
y x 456
2
=
i
x


S
xy
= x
i
y
i

x
i
i






y
i
i







n
i

= 655
50 86
6
= 61,67

S
xx
= x
i
2

x
i
i







2
n
= 456
50
2
6
= 39, 33
i


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
47

= = =
=

= =
40 , 27
6
50
) 57 , 1 (
6
86
57 , 1
33 , 39
67 , 61
x b y a
S
S
b
xx
xy


Assim, a reta ajustada encontrada foi x y 57 , 1 40 , 27 = .

y
3
= 27, 40 1,57 7 =16, 42

Finalmente, e
3
= y
3
y
3
=15 16, 42 = 1, 42.

GABARITO: D

2. Seja o modelo Y
i
= + X
i
+
i
. So dados:

60 =
i
x

1260
2
=
i
x

320 =
i
y


16000
2
=
i
y

2400 =
i i
y x


n = 10 observaes

Calcule s
2
. Dica: SQE = SQT SQR = S
yy
b
2
S
xx


A) 5760
B) 720
C) 550,4
D) 688
E) 60

Resoluo

Lembre que

s
2
=


2
=
e
i
2
i

n 2
=
SQE
n 2

S
yy
= y
i
2

y
i
i







2
n
=
i

16000
320
2
10
= 5760

S
xx
= x
i
2

x
i
i







2
n
=1260
60
2
10
= 900
i


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
48

S
xy
= x
i
y
i

x
i
i






y
i
i







n
i

= 2400
60 320
10
= 480


Logo,

53 , 0
900
480
= = =
xx
xy
S
S
b e

SQE = SQT SQR = S
yy
b
2
S
xx
= 5760 0,53
2
900 = 5504

s
2
=
e
i
2
i

n 2
=
SQE
n 2
=
5504
8
= 688

GABARITO: D

Julgue o item a seguir.

3. No modelo Y
i
= + X
i
+
i
os estimadores de mnimos quadrados de e so
os de menor varincia possvel.

Resoluo

Os estimadores de mnimos quadrados da RLS so os de menor varincia
possvel dentre os no tendenciosos. o que assegura o Teorema de
Gauss-Markov. Podem existir estimadores lineares tendenciosos cujas
varincias sejam menores que os do modelo de RLS.

GABARITO: ERRADO

(Analista BACEN - rea 4/2006/FCC) Considere as informaes a seguir
para resolver as questes de nmeros 4 e 5.

Uma empresa, com a finalidade de determinar a relao entre os gastos anuais
em pesquisa e desenvolvimento (X), em milhares de reais, e o acrscimo anual
nas vendas (Y), tambm em milhares de reais, optou por utilizar o modelo
linear simples Y
i
= + X
i
+
i
, em que Y
i
o acrscimo nas vendas no ano i, X
i

o valor gasto em pesquisa e desenvolvimento no ano i e
i
o erro aleatrio com
as respectivas hipteses consideradas para a regresso linear simples(

e
so parmetros desconhecidos). Considerou para o estudo as seguintes
informaes referentes s observaes nos ltimos 10 anos da empresa:

Y
i
=160
i=1
10


X
i
=100
i=1
10


X
i
Y
i
=1.900
i=1
10


Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
49


X
i
2
=1.200
i =1
10

Y
i
2
= 3.060
i=1
10



4. Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados,
obteve-se, para um determinado gasto em pesquisa e desenvolvimento, uma
previso de acrscimo nas vendas no valor de 19 mil reais. O valor que se
considerou para o gasto em pesquisa e desenvolvimento, em mil reais, foi

A) 14,0
B) 13,75
C) 13,0
D) 12,4
E) 12,0

Resoluo

S
xx
= x
i
2

x
i
i







2
n
=1200
100
2
10
= 200
i


S
xy
= x
i
y
i

x
i
i






y
i
i







n
i

=1900
160 100
10
= 300


Logo

5 , 1
200
300
= = =
xx
xy
S
S
b
1
10
100
) 5 , 1 (
10
160
= = = x b y a

Assim, encontramos a reta ajustada x y 5 , 1 1 + = .

Do enunciado, 19 = y (lembrar que a unidade R$1.000)

x 5 , 1 1 19 + =

x = 12


Logo, o valor que se considerou para o gasto em pesquisa e desenvolvimento
foi de R$ 12.000,00.

GABARITO: E

5. Montando o quadro de anlise de varincia, tem-se que
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
50


A) a variao residual apresenta um valor igual a 100.
B) o valor da estatstica F necessria para o teste de existncia da regresso
igual a nove.
C) o valor do correspondente coeficiente de determinao (R
2
) igual a 90%.
D) a variao total apresenta um valor igual a 550.
E) a variao explicada, fonte de variao devido regresso, apresenta um
valor igual a 500.

Resoluo

SQT = S
yy
= y
i
2

y
i
i







2
n
=
i

3060
160
2
10
= 500

SQR = b
2
S
xx
=1,5
2
200 = 450

R
2
=
SQR
SQT
=
450
500
= 0,9 = 90%

GABARITO: C


(Analista BACEN 2001/ESAF) As questes 6 e 7 dizem respeito ao
enunciado seguinte.

A Cia. Delta presta servio de manuteno a uma marca de microcomputador.
O gerente da Cia. Delta est interessado em estudar a associao existente
entre o tempo (y) em minutos gasto em um atendimento e o nmero (x) de
micros atendidos.

Neste contexto anota as realizaes y
t
e x
t
dessas variveis em 16 chamadas
de servio. O gerente postula o modelo linear Y
t
= + X
t
+
t
, t=1...16, onde
e so parmetros desconhecidos e os
t
so erros no correlacionados com
mdia zero e varincia constante
2
. Os resultados obtidos com o ajuste pelo
mtodo de quadrados mnimos para esse modelo so apresentados a seguir.

Parmetro Estimativa Desvio-padro


-2,3 2,6


14,7 0,5

2

20 -

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
51
Sabe-se que (y
t
m)
2
=14.000
t

, onde m o tempo mdio


das 16 chamadas.

6. Assinale a opo que d o valor do coeficiente de determinao do modelo
linear.

A) 0,98
B) 0,90
C) 0,88
D) 0,28
E) 0,20

Resoluo

A questo pede o coeficiente de determinao R
2
.

Sendo m a mdia,

SQT = (y
i
y )
2
=14.000
i



s
2
=


2
=
e
i
2
i

n 2
=
SQE
14
= 20SQE = 20 14 = 280


Ento

R
2
=
SQR
SQT
=1
SQE
SQT
=1
280
14.000
= 0,98

GABARITO: A

7. Assinale a opo que d a estimativa do aumento esperado no tempo de
atendimento decorrente do aumento de uma unidade no nmero de micros
atendidos.

A) 17,0
B) 12,4
C) -2,3
D) 0,2
E) 14,7

Resoluo

O enunciado cita a interpretao de para o caso apresentado.
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
52


GABARITO: E

8. No

ajuste do modelo linear simples so dados:

196 =
i
x

160 =
i
y

3318 =
i i
y x


a = -11,5 n = 28 observaes

Calcule

2
i
x .

A) 2198
B) 2265,5
C) 2450
D) 3318
E) 893,5

Resoluo

y = a + bx
160
28
= 11,5 +b
196
28
b = 2, 46

2198
28
160 196
3318 =


i
i
i
i
i
i i xy
n
y x
y x S

b =
S
xy
S
xx
S
xx
=
S
xy
b
=
2.198
2, 46
= 893,5

Mas

= =

=
i
i
i
i
i
i
i
i xx
x x
n
x
x S 5 , 2265
28
196
5 , 893
2
2
2
2
2

GABARITO: B

Julgue o item a seguir.

9. Sejam dados a tabela abaixo e o modelo Y = X +

X 10 12 14 16 18
Y 8 11 13 15 19

A estimativa de mnimos quadrados de maior que um.
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
53

Resoluo

A questo utiliza o modelo de regresso sem intercepto.

=
i
i
x 020 . 1
2

=
i
i i
y x 976

965 , 0
020 . 1
976
2
= = =

i
i
i
i i
x
y x
b


GABARITO: ERRADO

(Analista BACEN 1997/CESPE) Para as questes de 10 a 14, utilize as
informaes a seguir.

O gerente do setor de compras de uma organizao bancria deseja estudar
um modelo de predio do tempo gasto para o processamento de faturas
relativas importao de equipamentos eletrnicos. Durante trinta dias, foram
coletados dados relativos ao tempo de processamento das faturas (em horas)
e o nmero de faturas processadas. Considerando tratar-se de uma relao
linear, cuja varivel dependente o TEMPO, os dados foram processados e os
resultados preliminares so apresentados nas tabelas a seguir.

ANLISE DE VARINCIA

Fontes

Graus de
Liberdade

Soma de
Quadrado

Quadrado
Mdio

Valor F

Prob > f

Modelo 1 25,94382

25,94382

232,220

0,0001

Erro

28 3,12818

0,11172


Total

29 29,07200



R Quadrado (Coeficiente de
determinao)

C.V. ( Coeficiente de Variao )

0,8924 16,38464
Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
54


ESTIMATIVAS DOS PARMETROS


Varivel

Graus de
Liberdade

Estimativas

Erro
Padro

T

Prob
>|T|

INTERCEPTO

1 0,402375

0,12358250

3,256

0,0030

FATURAS

1 0,012607

0,00082729

15,239

0,0001


Representando por Y
i
o tempo gasto e por X
i
o nmero de faturas processadas
no dia i, julgue os itens de 10 a 14.

10. O modelo estimado igual a E(Y
i
) = 0,402375 + 0,012607X
i
+
i
, em que
E(Y
i
) representa o tempo mdio e
i
representa o resduo estimado para o i-
simo dia.

Resoluo

O modelo estimado E(Y
i
) = 0,402375 + 0,012607X
i
, lembrando que E(
i
) =
0.

GABARITO: ERRADO

11. O resultado obtido indica que a cada aumento de uma fatura processada
corresponde um aumento de 0,012607 no tempo esperado estimado.

Resoluo

Segue direto de E (Y
i
) = 0,402375 + 0,012607X
i
.

GABARITO: CERTO

12. Para o modelo proposto, o teste de adequabilidade do modelo
equivalente a testar H
o
:
1
= 0 contra H
a
:
1
0, em que
1
o parmetro
associado varivel que indica o nmero de faturas processadas a cada dia.

Resoluo

Deve-se testar se h regresso, ou seja, se H
o
:
1
= 0 contra H
a
:
1
0, em
que
1
o parmetro associado varivel que indica o nmero de faturas
processadas a cada dia. Afirmao correta.

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
55

GABARITO: CERTO

13. Para que o analista rejeite a hiptese nula H
o
: INTERCEPTO = 0, o nvel de
significncia usado deve ser inferior a 0,003.

Resoluo

Lembrando da regra prtica:

Se p , rejeitamos H
0

Se p > , no rejeitamos H
0


Do enunciado, valor p = 0,003. Assim, para rejeitarmos H
0
tem de ser
superior a 0,003.

GABARITO: ERRADO

14. Aproximadamente 16,38% da variao no tempo de processamento so
explicados pela variao no nmero de faturas processadas.

Resoluo

Porcentagem da variao explicada pelo modelo = R
2
= 89,24%

GABARITO: ERRADO

15. So dados para o modelo Y = + X +


36 =
i
x

162
2
=
i
x

0 =
i
y

270 =
i i
y x


50 , 13
2
= 12 = n


Determine a estatstica t para testar a hiptese H
0
: = 0

A) 10
B) 15
C) 20
D) 23,57
E) 28,48

Resoluo

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
56

270
12
0 36
270 =


i
i
i
i
i
i i xy
n
y x
y x S

= =

=
i
i
i
i xx
n
x
x S 54
12
36
162
2
2
2

5
54
270
= = =
xx
xy
S
S
b
25 , 0
54
50 , 13
2
2
= = =
xx
b
S
s



Lembrando que

10
25 , 0
0 5
10 2
=

t
s
k b
t
b
n


GABARITO: A

Julgue os prximos itens com base no enunciado abaixo.

Seja o modelo estimado
i i
x y 2 90 = , em que a varincia amostral do intercepto
22, a varincia amostral da declividade 0,06. Foram coletadas 7
observaes.

16. O intervalo de confiana de 90% para a declividade ) 51 , 1 ; 49 , 2 (

Resoluo

Cada cauda da distribuio t com n2 = 5 GL deve ter 5% de rea.
Consultando a tabela auxiliar, achamos t
c
= 2,015.

) 506 , 1 ; 494 , 2 ( 494 , 0 2 06 , 0 015 , 2 2 : = = = IC s t b IC
b c
.

GABARITO: CERTO

17. Considere o teste de hipteses H
0
: 100 = contra H
1
: 100 a um nvel de
significncia de 5%. Ento deve-se rejeitar H
0
.

Resoluo

A estatstica do teste

Curso Online - Raciocnio Lgico-Quantitativo para Traumatizados
Profs. Alexandre Lima e Moraes Junior
Profs. Alexandre Lima e Moraes Junior
57
13 , 2
22
100 90
2
=

a
n
s
k a
t

Para acharmos t
c
, repare que para um nvel de significncia de 5% tem de
haver 2,5% em cada cauda. Como GL =5, achamos os valores crticos de
571 , 2 . Como a estatstica teste encontra-se entre esses dois valores, no
podemos rejeitar a hiptese nula H
0
.

GABARITO: ERRADO.

At a prxima aula. Bom estudo!

Alexandre e Moraes Jr.

Das könnte Ihnen auch gefallen