Sie sind auf Seite 1von 23

Paul o Ri c ar do

Bi t t enc our t Gui mar es


Doutorando em Engenharia Florestal com
concentrao em Economia e Poltica Florestal
pela Universidade Federal do Paran (UFPR).
Mestre em Estatstica pela Universidade Esta-
dual de Campinas (Unicamp). Bacharel em Es-
tatstica pela Universidade Federal do Paran
(UFPR). Professor do Departamento de Estats-
tica da Universidade Federal do Paran (UFPR).
Especialista em avaliao do Programa Nacional
de Incluso de Jovens (Projovem) da Secretaria
Geral da Presidncia da Repblica. Consultor em
Bioestatstica e Pesquisa de Mercado.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anl i se de Regr esso
Introduo
Os modelos de regresso so largamente utilizados em diversas reas do
conhecimento tais como: computao, administrao, engenharias, biologia,
agronomia sade, sociologia etc. O principal objetivo dessa tcnica obter
uma equao que explique satisfatoriamente a relao entre uma varivel
resposta e uma ou mais variveis explicativas, possibilitando fazer predio
de valores da varivel de interesse. Este relacionamento pode ser por uma
equao linear ou uma funo no linear, conforme fgura abaixo:

Linear No linear
y y
x x
Figura 1 Formas lineares e no lineares de relao entre pares de variveis.
Regresso linear simples
Se uma relao linear vlida para sumarizar a dependncia observada
entre duas variveis quantitativas, ento a equao que descreve esta rela-
o dada por:
Y = a + b.X
Esta relao linear entre X e Y determinstica, ou seja, ela afrma que
todos os pontos caem exatamente em cima da reta de regresso. No entanto
este fato raramente ocorre, ou seja, os valores observados no caem todos
209
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
210
Anlise de Regresso
exatamente sobre esta linha reta. Existe uma diferena entre o valor obser-
vado e o valor fornecido pela equao. Essa diferena, denominada erro e re-
presentada por , uma varivel aleatria que quantifca a falha do modelo
em ajustar-se aos dados exatamente. Tal erro pode ocorrer devido ao efeito,
entre outros, de variveis no consideradas e de erros de medio. Incorpo-
rando esse erro equao anterior temos:
Y = a + b.X +
que denominado modelo de regresso linear simples. a e b

so os parme-
tros do modelo.
A varivel X, denominada varivel regressora, explicativa ou indepen-
dente, considerada uma varivel controlada pelo pesquisador e medida
com erro desprezvel. J Y, denominada varivel resposta ou dependente,
considerada uma varivel aleatria, isto , existe uma distribuio de proba-
bilidade para Y em cada valor possvel de X. muito frequente, na prtica,
encontrarmos situaes em que Y tenha distribuio normal. Este um dos
principais pressupostos para aplicao desta tcnica.
Exemplo 1: O preo de aluguel de automveis de uma agncia defni-
do pela seguinte equao: Y = 8 + 0,15.X, onde Y = Taxa de aluguel (R$);
X = distncia percorrida (km).
Assim, a taxa de aluguel inicia com o preo de R$8,00 e vai aumentando
medida que a distncia percorrida aumenta. Assim, se fosse percorrida uma
distncia de 100km, a taxa de aluguel seria de 8 + 0,15 x 100 = R$23,00. No
entanto, como essa equao foi obtida baseada em dados de automveis
de diversas marcas, certamente haver uma variao no preo, por causa de
diversos outros fatores. Assim, essa equao ter uma margem de erro, que
devida a esses inmeros fatores que no foram controlados.
Exemplo 2: Um psiclogo investigando a relao entre o tempo que um in-
divduo leva para reagir a um certo estmulo e sua idade obteve os seguintes
resultados:
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
211
Tabela 1 Idade (em anos) e tempo de reao um certo estmulo
(em segundos)
Y Tempo de reao (segundos) X Idade (em anos)
96 20
92 20
106 20
100 20
98 25
104 25
110 25
101 25
116 30
106 30
109 30
100 30
112 35
105 35
118 35
108 35
113 40
112 40
127 40
117 40
Figura 2 Diagrama de disperso entre a idade (X) e o tempo de reao (Y).
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
212
Anlise de Regresso
A partir da representao grfca desses dados, mostrada na fgura 2,
possvel visualizar uma relao linear positiva entre a idade e o tempo de
reao. O coefciente de correlao de Pearson para esses dados resultou
em r = 0,768, bem como seu respectivo teste de signifcncia em t
cal
= 5,09,
que comparado ao valor tabelado t
tab,5%
= 2,1 , fornece evidncias de relao
linear entre essas duas variveis, ou seja, h evidncias de considervel rela-
o linear positiva entre idade e tempo de reao.
Podemos, ento, usar um modelo de regresso linear simples para des-
crever essa relao. Para isso, necessrio estimar, com base na amostra
observada, os parmetros desconhecidos a e b deste modelo. O mtodo de
estimao denominado Mnimos Quadrados Ordinrios (MQO) frequente-
mente utilizado em regresso linear, para essa fnalidade, e ser apresentado
mais adiante.
Continuando a anlise dos dados do exemplo, possvel obter o seguinte
modelo de regresso linear simples ajustado:
Y = 80,5 + 0,9.X
Figura 3 Reta de regresso ajustada aos dados.
Como a variao dos dados em X no inclui x = 0, no h interpretao
prtica do coefciente a = 80,5. Por outro lado, b = 0,9 signifca que a cada au-
mento de 1 ano na idade das pessoas, o tempo de reao mdio (esperado)
aumenta em 0,9 segundos.
Assim, se: X = 20 anos, teremos Y = 98,5 seg.
Para X = 21 anos, Y = 99,4 seg.
X = 22 anos, Y = 100,3 seg.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
213
Dessa maneira, de ano para ano, o aumento no tempo de reao espera-
do de 0,9 segundos.
Exemplo 3: Uma certa pea manufaturada por uma companhia, uma vez
por ms, em lotes, que variam de tamanho de acordo com as futuaes na
demanda. A tabela abaixo contm dados sobre tamanho do lote e nmero
de horas gastas na produo de 10 recentes lotes produzidos sob condies
similares. Esses dados so apresentados grafcamente na Figura 4, tomando-
se horas-homem como varivel dependente ou varivel resposta (Y) e o tama-
nho do lote como varivel independente ou preditora (X).
Tabela 2 Tamanho de lote e nmero de horas gastas na produo
de cada lote
Lote (i) Horas (Y
i
) Tamanho do lote (X
i
)
1 73 30
2 50 20
3 128 60
4 170 80
5 87 40
6 108 50
7 135 60
8 69 30
9 148 70
10 132 60
Figura 4 Relao estatstica entre Y e X, referente aos dados da Tabela 2.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
214
Anlise de Regresso
A fgura 4 sugere claramente que h uma relao linear positiva entre o
tamanho do lote e o nmero de horas, de modo que, maiores lotes tendem
a corresponder a maiores nmeros de horas-homem consumidas. Porm, a
relao no perfeita, ou seja, h uma disperso de pontos sugerindo que
alguma variao no nmero de horas no dependente do tamanho do
lote. Por exemplo, dois lotes de 30 unidades (1 e 8) demandaram quantida-
des um pouco diferentes de horas. Na fgura 4, foi traada uma linha (reta) de
relacionamento descrevendo a relao estatstica entre horas e tamanho do
lote. Ela indica a tendncia geral da variao em horas-homem quando h
trocas no tamanho do lote.
Observa-se que grande parte dos pontos da fgura no cai diretamente sobre
a linha de relacionamento estatstico. A disperso dos pontos em torno da linha
de relacionamento representa a variao em horas que no associada ao ta-
manho do lote, e que usualmente considerada aleatria. Relaes estatsticas
so geralmente teis, mesmo no tendo uma relao funcional exata.
Mtodo dos mnimos quadrados ordinrios (MQO)
Para estimar os parmetros do modelo, necessrio um mtodo de esti-
mao. O mtodo estatstico utilizado e recomendado pela sua preciso o
mtodo dos mnimos quadrados que ajusta a melhor equao possvel aos
dados observados.
Com base nos n pares de observaes (y
1
,x
1
) , (y
2
,x
2
) ,... , ( y
n
, x
n
) , o mtodo
de estimao por MQO consiste em escolher a e b de modo que a soma dos
quadrados dos erros,
i
(i=10 ,..., n), seja mnima.
Para minimizar esta soma, que expressa por:
( ) . =
n n
2
i i i
i=1 I-1
SQ= y a b.x
devemos, inicialmente, diferenciar a expresso com respeito a a e b e, em
seguida, igualar a zero as expresses resultantes. Feito isso, e aps algumas
operaes algbricas, os estimadores resultantes so:


i i
2 2
i
x .y n.y.x
b =
x n.x
a = b. y x
onde
y
a mdia amostral dos y
i
s e x a mdia amostral dos x
i
s.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
215
Logo, E(Y|x) = a + b.x o modelo de regresso linear simples ajustado, em
que E(Y|x), denotado tambm

Y
por simplicidade, o valor mdio predito
de Y para qualquer valor X = x que esteja na variao observada de X.
No exemplo 2, as estimativas dos parmetros resultaram em a = 80,5 e
b = 0,9. Veja como esses valores foram obtidos:

i
X = 2 150
i
Y = 600 n = 20

i i
X Y = 65 400
X = 30 Y =107, 5
2
i
X =19000


i i
2 2 2
x
i
x. y n.y.x 65400 20.107, 5. 30 900
b = = = = 0, 9
n.x 19000 20. (30) 1 000

a = b. =107, 5 0, 9. 30 = 80, 5 y x
No exemplo 3, as estimativas dos parmetros a e b so:


i
X = 500
i
Y =1100 n = 10
i i
X Y = 61 800
X = 50

Y =110

2
i
X = 28 400



i i
2 2 2
i
x .y n.y.x 61 800 10.110. 50 6800
b = = = = 2
x n. 28400 10. (50) 3400 x
Assim, a equao de regresso linear entre X e Y ser dada por:
Y = 10 + 2.X +
Interpretando o modelo acima, poderemos observar que, aumentando o
tamanho do lote em uma unidade, o nmero de horas gastas na produo
ser aumentado em 2 horas.
Obtendo a reta de regresso com ajuda da planilha Excel, teremos
que selecionar a opo REGRESSO no mdulo de Anlise de dados (em
ferramentas):
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
216
Anlise de Regresso
A sada fornecida pela planilha a seguinte:
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
217
Observe que o Excel fornece, alm dos coefcientes de correlao, a Anova
da regresso para testar a sua signifcncia e os coefcientes estimados com
seus respectivos testes de signifcncia.
Anlise de Varincia da Regresso
Para verifcar a adequao do modelo aos dados, algumas tcnicas podem
ser utilizadas. A anlise de varincia da Regresso uma das tcnicas mais
usadas. Assim, podemos analisar a adequao do modelo pela ANOVA da
regresso a qual geralmente apresentada como na tabela a seguir:
Fonte de Variao g.l. S.Q. Q.M. F p-valor
Regresso p-1 SQreg SQreg/p-1
QMreg/QMres
Resduos n-p SQres SQres/n-p
Total n-1 SQtotal Sqtotal/n-1
Onde:
SQreg = soma dos quadrados devido regresso:
SQreg =

n
2
i
i=1
(Y y)

SQres = soma dos quadrados devido aos erros:


SQres = SQtotal Sqreg =


n
2
i i
i=1
(y Y )
SQtotal = soma dos quadrados totais:
SQtotal =
n
2
i
i=1
(y y)
p = nmero de variveis do modelo
n = numero de observaes.
Caso o p-valor seja inferior ao nvel de signifcncia estabelecido, ento
consideramos a regresso como signifcativa.
Uma maneira auxiliar de medir o ganho relativo introduzido pelo modelo
usar o coefciente de determinao o qual defnido por R
2
que calculado
por SQreg/SQtotal.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
218
Anlise de Regresso
Para os exemplos 2 e 3, a tabela da Anova seria construda de seguinte
forma:
Exemplo 2:
SQreg =

n
2
i
i=1
(Y y)


n n
2 2
i i
i=1 i=1
(Y y) = (80, 5+0, 9x 107, 5)

= 810
Para obter a soma de quadrados acima, deveremos substituir em X
i
todos
os valores de idade da Tabela 1.
SQtotal =
n n
2 2
i i
i=1 i=1
(y y) = (y 107, 5) = 1 373
Para obter a soma de quadrados acima, deveremos substituir em Y
i
todos
os valores de tempo de reao da Tabela 1.
SQres = 1 373 810 = 563
Fonte de Variao g.l. S.Q. Q.M. F p-valor
Regresso 1 810 810
25,90 < 0,01
Resduos 18 563 31,27
Total 9 1 373 72,26
O que indica que a regresso entre X e Y signifcativa. O modelo
Y = 80,5 +0,9.X pode ser considerado adequado para realizar predies de Y.
O coefciente r
2
de determinao para esse modelo de 0,59 o que represen-
ta um poder apenas razovel de explicao dos valores de tempo de reao
pela idade. Muito provavelmente outras variveis estejam infuenciando o
tempo de reao.
Exemplo 3:
SQreg =
n n
2 2
i i
i=1 i=1
(Y y) = (10 +2x 110)

Y
i
= 13 600
Para obter a soma de quadrados acima, deveremos substituir em X
i

todos os valores do tamanho do lote da Tabela 2.
SQtotal =
n n
2 2
i i
i=1 i=1
(y y) = (y 107, 5) =13 660
Para obter a soma de quadrados acima, deveremos substituir em Y
i

todos os valores de nmeros de horas gastas da Tabela 2.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
219
SQres = 13 660 13 600 = 60
Fonte de Variao g.l. S.Q. Q.M. F p-valor
Regresso 1 13 600 13 600
1 813,33 < 0,01
Resduos 8 60 7,5
Total 9 13 660 1 517,78
O que indica que a regresso entre X e Y signifcativa. O modelo Y = 10 + 2.X
pode ser considerado de boa qualidade para realizar predies de Y. O coefcien-
te r
2
de determinao para esse modelo de 0,996.
Erro-padro de estimao e intervalos de predio
O erro-padro da estimao um desvio-padro condicional, na medida
em que indica o desvio-padro da varivel dependente Y, dado um valor es-
pecfco da varivel dependente X. O erro-padro baseado em dados amos-
trais dado por:

2
u
(y Y)
=
n 2
Para fns de clculo, mais conveniente uma verso alternativa da
frmula:
( )


2 2
u y
= S . 1 r
onde
( )
2
n
2 i=1
y
y
S =
n
y
O erro-padro pode ser usado para estabelecer um intervalo de pre-
dio para a varivel dependente, dado um valor especfco da varivel
independente.
Uma vez que o erro-padro de estimao est baseado em dados de
amostra, apropriado o uso da distribuio t de Student com n-2 graus de
liberdade. Assim, um intervalo de predio para a varivel dependente Y, em
anlise de regresso simples :


n 2; / 2
Yt .
u
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
220
Anlise de Regresso
Para os dados do exemplo 2, teramos o erro-padro da estimao dado
por:
Dado que
2
y
S =
68,65 e r
2
= 0,59 ento
( ) ( )


2 2
u y
= S . 1 r = 68, 65. 1 0, 59 = 5, 30
E o intervalo de predio, com 95% de confana, para um valor de Y=112
seria:

n 2; /2 u
[ ] = [1122,10 . 5, 30] = [ 100, 87 ; 123,13 ] Y t .


Ou seja, para uma pessoa com 35 anos, o tempo de reao predito estaria
entre 100,87 e 123,13 segundos, com 95% de confana.
Para os dados do exemplo 3 teramos o erro-padro da estimao dado
por:
Dado que
2
y
S =
1 366 e r
2
= 0,996 ento
( ) ( )


2
2 2
y
= S . 1 r = 1366. 1 0, 996 = 2, 34
u

E o intervalo de predio, com 95% de confana, para um valor predito
de Y = 110 seria:
[Y t .
u
] =[110 2, 31.2, 34] = 104, 59; 115, 41
n 2; /2

[ ]
Ou seja, para um lote de tamanho 50, seriam necessrias de 104,59 a
115,41 horas, com 95% de confana.
Anlise de Resduos
Os desvios e
i
= y
i
y
i
^
( i = 1, ..., n) so denominados resduos e so conside-
rados uma amostra aleatria dos erros. Por esse fato, uma anlise grfca dos
resduos , em geral, realizada para verifcar as suposies assumidas para os
erros
i
.
Para verifcao dos pressupostos necessrios para ajuste de um modelo
de regresso necessrio realizar uma Anlise de Resduos. Os trs tipos de
resduos mais comumente utilizados so:
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
221
Resduos brutos;
Resduos padronizados;
Resduos estudentizados.
Ampliando seus conhecimentos
Anlise de Regresso Mltipla
A regresso mltipla envolve trs ou mais variveis, ou seja, uma nica vari-
vel dependente, porm duas ou mais variveis independentes (explicativas).
A fnalidade das variveis independentes adicionais melhorar a capacida-
de de predio em confronto com a regresso linear simples. Mesmo quando
estamos interessados no efeito de apenas uma das variveis, aconselhvel
incluir as outras capazes de afetar Y, efetuando uma anlise de regresso ml-
tipla, por duas razes:
a) Para reduzir os resduos. Reduzindo-se a varincia residual (er-
ro-padro da estimativa), aumenta a fora dos testes de signif-
cncia;
b) Para eliminar a tendenciosidade que poderia resultar se simples-
mente ignorssemos uma varivel que afeta Y substancialmente.
Uma estimativa tendenciosa quando, por exemplo, numa pesquisa em
que se deseja investigar a relao entre a aplicao de fertilizante e o volume
de safra, atribumos erroneamente ao fertilizante os efeitos do fertilizante,
mais a precipitao pluviomtrica.
O ideal obter o mais alto relacionamento explanatrio com o mnimo
de variveis independentes, sobretudo em virtude do custo na obteno de
dados para muitas variveis e tambm pela necessidade de observaes adi-
cionais para compensar a perda de graus de liberdade decorrente da introdu-
o de mais variveis independentes.
A equao da regresso mltipla tem a forma seguinte:
Y = a + b
1
x
1
+ b
2
x
2
++b
k
x
k
+ e
i
, onde:
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
222
Anlise de Regresso
Atividades de aplicao
1. Os encargos dirios com o consumo de gs propano (Y) de uma em-
presa dependem da temperatura ambiente (X). A tabela seguinte apre-
senta o valor desses encargos em funo da temperatura exterior:
Temperatura (C) 5 10 15 20 25
Encargos (dlares) 20 17 13 11 9
Seja Y =
0
+
1
X + o correspondente modelo de regresso linear.
a) Determine, usando o mtodo dos mnimos quadrados, a respecti-
va reta de regresso e represente-a no diagrama de disperso.
b) Quantifque a qualidade do ajuste obtido e interprete.
c) Determine um intervalo de confana a 95% para os encargos m-
dios com gs propano num dia em que a temperatura ambiente
de 17
o
C.
a = intercepto do eixo y;
b
i
= coefciente angular da i-sima varivel;
k = nmero de variveis independentes.
Enquanto uma regresso simples de duas variveis resulta na equao de
uma reta, um problema de trs variveis resulta um plano, e um problema de
k variveis resulta um hiperplano.
Tambm na regresso mltipla, as estimativas dos mnimos quadrados so
obtidas pela escolha dos estimadores que minimizam a soma dos quadrados
dos desvios entre os valores observados Y
i
e os valores ajustados

Y
.
Na regresso simples:
b = aumento em Y, decorrente de um aumento unitrio em X.
Na regresso mltipla:
b
i
= aumento em Y se X
i
for aumentado de 1 unidade, mantendo-se cons-
tantes todas as demais variveis X
j
.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
223
2. Suponha que um analista toma uma amostra aleatria de 9 carrega-
mentos feitos recentemente por caminhes de uma companhia. Para
cada carregamento, registra-se a distncia percorrida em km (X) e o
respectivo tempo de entrega (Y). Obteve-se:

i i
i i i y
2 2
x = 6.405; y = 23, 5; x = 5.628.075; y = 74, 75; x y = 20.295
a) Estime, usando o modelo de regresso linear, o tempo esperado
de entrega para uma distncia de 1 050km.
b) Comente a afrmao o tempo de entrega explicado em aproxi-
madamente 94% pela distncia percorrida.
3. Seja Y o nmero de chamadas telefnicas atendidas num determinado
servio de atendimento a clientes decorridos X minutos aps as 8h30.
Em determinado dia da semana observaram-se os seguintes pares de
valores:
Tempo aps 8h30(min) 1 3 4 5 6
Nmero de chamadas atendidas 2 5 10 11 12
Seja Y =
0
+
1
X + o correspondente modelo de regresso linear.
a) Estime
0
e
1
usando o mtodo dos mnimos quadrados e re-
presente a correspondente reta de regresso no diagrama de
disperso.
b) Determine o correspondente coefciente de determinao,
bem como o coefciente de correlao; como voc interpreta
os valores obtidos?
c) Estime a varincia do erro.
d) Seja E [Y (2)] = E [Y | x = 2]. Estime E [Y (2)]; determine um inter-
valo de confana para E [Y (2)] com 95% de confana.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
224
Anlise de Regresso
Gabarito
1.

i i
1
2 2
i
x .y n.y.x
910 5.14.15
= = = 0,56
1375 5. 225 x n.x



0 1
= y .x =14 ( 0,56).15 = 22,4

Ento
^
Y = 22,4 0,56X.

b) Dado que y=
70
5
=14
SQreg = (Y y) = (22,4 0,65x 14) =78,4
i
2
i=1
n
i
2
i=1
n


SQres = (y Y ) = (y 22,4 0,65x )
i i
2
i=1
n
i i
2
i=1
n

= 1,6
SQtotal = 78,4 + 1,6 = 80

Fonte de
Variao
g.l. S.Q. Q.M. F p-valor
Regresso 1 78,4 78,4 147 < 0,001
Resduos 3 1,6 0,53
Total 4 80 20
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
225
A regresso pode ser considerada altamente signifcativa (p < 0,001).
O coefciente de determinao calculado a partir dos dados da Ano-
va, r
2
= 78,4/80 = 0,98. Pode se considerar bastante satisfatria a
qualidade do ajuste.
c) S
y y
n
y
2
= =
80
5
=16
2
i=1
n

( )

^

= S 1 r = 16 1 0,98 =0,565
y
2 2
. .
( )
( )
Y
^
= 22,4 0,56 . 17 = 12,88

2.
a)
( )

i i
1 2
2 2
i
x .y n.y.x
20 295 9. 2,61.711,67 3 577,87
= = = = 0,00334
106 993,4 5 628 075 9. 711,66 x n.x


Ento
^
Y = 0,234 + 0,00334.X = 0,234 + 0,00334 . 1 050 = 3,741 dias
b) Isto signifca que 94% da variao do tempo de entrega est asso-
ciada distncia a ser percorrida e outras variveis como: regio
urbana ou rural, clima durante o percurso, treinamento do moto-
rista etc., so responsveis pelos demais 6%. No entanto, essas va-
riveis no foram observadas nesse estudo.
3.
a)
( )

i i
1 2
2 2
i
x .y n.y.x
184 5. 8. 3,8
32
= = = =2,16
14,8 87 5. 3,8 x n.x



0 1
=y .x=8 2,16. 3,8= 0,21

Ento
^
Y = 0,21 + 2,16.X
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
226
Anlise de Regresso
b) SQreg =
(Y y) = ( 0,21+2,16x 8) =69,05
i
2
i=1
n
i
2
i=1
n


SQres = (y Y ) = (y +0,21 2,16x )
i i
2
i=1
n
i
i
2
i=1
n

= 4,8109
SQtotal = 69,05 + 4,8109 = 73,8609
Assim r
2
=
SQres
SQtotal
=
69,05
73,86
=0,9349 e r = r =0,9668
2
O coefciente de determinao calculado nos indica que bastante
satisfatria a qualidade do ajuste. A relao entre as duas variveis
pode ser considerada bastante forte, pela anlise do coefciente de
correlao.
c)

2
u
(y Y) 4,8109
= = =1,266
n 2 3

d) E [Y (2)] = 0,21 + 2,16 . 2 = 4,11





^
n 2; /2 u
[ Yt . ] = [4,113,18.1,266] = [0,08; 8,13]

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Ref er nc i as
BUSSAB, W. O.; MORETIN, P. A. Estatstica Bsica. 4. ed. So Paulo: Saraiva, 2003.
BARROS, Emilio. Aplicaes e Simulaes Monte Carlo e Bootstrap. Monografa
(Bacharelado em Estatstica) Universidade Estadual de Maring, Maring, 2005.
Disponvel em: <www.des.uem.br/graduacao/Monografas/Monografa_Emilio.
pdf.>. Acesso em: 23 nov. 2007.
CAMPOS, G. M. Estatstica Prtica para Docentes e Ps-Graduados. Disponvel em:
<www.forp.usp.br/restauradora/gmc/gmc_livro/gmc_livro_cap14.html>. Acesso
em: 23 nov. 2007.
COSTA NETO, P. L. de O. Estatstica Bsica. 2. ed. So Paulo: Edgard Blcher, 2002.
GONALVES, Lren Pinto Ferreira. Avaliao de Ferramentas de Minerao de
Dados como Fonte de Dados Relevantes para a Tomada de Deciso: aplica-
o na Rede Unido de Supermercados. Dissertao (Mestrado Interinstitucio-
nal em Administrao) Universidade da Regio da Campanha (Urcamp), So
Leopoldo, 2001. Disponvel em: <http://volpi.ea.ufrgs.br/teses_e_dissertacoes/
td/000410.pdf>
HOAGLIN, D. C.; MOSTELLER, F.; TUKEY, J. W. Anlise Exploratria de Dados
Tcnicas Robustas. Lisboa: Edies Salamandra, 1983.
HOEL, PORT & STONE. Introduo Teoria da Probabilidade. Rio de Janeiro: Edi-
tora Intercincia ,1981.
KAZMIER, L. J. Estatstica Aplicada Economia e Administrao. 4. ed. So
Paulo: Bookman 2007.
LANDIS JR, Koch GG. The measurement of observer agreement for categorical
data. Biometrics 1977.
LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. et al. Estatstica: Teoria e
Aplicaes Usando Microsoft Excel. 3. ed. Rio de Janeiro: LTC, 2005.
MATTAR, F. N. Pesquisa de Marketing. So Paulo: Atlas, 2001.
______. So Paulo: Atlas, 1996. (Edio compacta).
247
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
248
Referncias
MEYER, P. L. Probabilidade: Aplicaes Estatstica. 2. ed. Rio de Janeiro: LTC,
2000.
SIEGEL, S.; CASTELLAN JR., N. J. Estatstica No Paramtrica para Cincias do
Comportamento. Porto Alegre: Artmed, 2006.
TRIOLA, M. F. Introduo Estatstica. 9. ed. Rio de Janeiro: LTC, 2005.
VIEIRA, S., WADA, R. O que Estatstica? 3. ed. So Paulo: Brasiliense, 1991.
WONNACOT, T. H. WONNACOTT, R. J. Estatstica Aplicada Economia e Admi-
nistrao. Rio de Janeiro: LTC, 1981.
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br

Das könnte Ihnen auch gefallen