Beruflich Dokumente
Kultur Dokumente
Khan Academy
Regresso Linear
Regresso Linear Simples
(Mtodo dos MQO):
1. Assuma uma linha reta: y = mx + b
Relao linear entre duas variveis!
2. Desenhe a linha num grfico e indique por ri
os resduos (ou desvios, ou erros) entre os
pontos observados e a linha
Por exemplo:
r1 = y1 [mx1 + b]
onde
y1 = ordenada do ponto 1
x1 = coordenada do ponto 1
b = intercepto do eixo-y para a linha
m = declividade da linha
80
70
60
55
50 Resduo n
Resduo 2 y = mx + b
3 pontos
40 40
30
20 Resduo 1
10 10
0
0 5 10 15 20 25 30 35 40 45
Objetivo: Encontrar m e b
De forma que se Minimize a Soma dos Quadrados dos Resduos (SQR)
Resduo 1: r1 = y1 [mx1 + b]
Resduo 2: r2 = y2 [mx2 + b]
Resduo n: rn = yn [mxn + b]
Medida geral de ajuste dos pontos reta: Soma
dos Quadrados dos Resduos:
n
SQR=
i=1
ri2
n
SQR= (yi [a +bxi])2
i=1
SQR= (y1 [mx1 + b])2 + (y2 [mx2 + b])2 + + (yn [mxn + b])2
Destacando que:
Min SQR = buscar o melhor ajuste da linha
SQR=(y1 [mx1 + b])2 + (y2 [mx2 + b])2 + + (yn [mxn + b])2
+ .
+ .
+ .
De forma semelhante:
(y1 x1 +y2 x2 + yn xn)/n = yx
y1 x1 +y2 x2 + yn xn = nyx
+ .
SQR = ny 2
2mnxy 2bny + m2nx 2
+ 2mbnx + nb2
SQR = ny 2
2mnxy 2bny + m2nx 2
+ 2mbnx + nb2
mx 2
+ bx = xy mx 2
+ bx = xy
mx + b = y * (x) m(x ) 2 + bx = yx
m(x 2
x 2) = xy y
x
m= ( xy y x )/ (x 2 x
2
)
Finalmente, chega-se ao valor de m que Min o SQR:
xy - y x
m=
x2 - x
Substituindo m na 2a eq do sistema, encontra-se o b
que minb=a SQR:
y mx
utra maneira de representar a mesma soluo:
n n n
1 xi yi
x y
i i - n i=1
m = i=1n i=1
n
1
xi - n i
2
2 x
i=1 i=1
n n
1 x
b= n i
1 y - mn i
i=1 i=1
Nos 2 casos, necessrio determinar estes
n n n n
valores:
xi
i=1
xi2
i=1
yi
i=1
xiyi
i=1
x x y
i i y
m 1 i 1
n
x x
2
i
i 1
Isto :
cov( x, y )
1
var( x)
Exemplo com 3 pontos:
(1,2); (2,1) e (3,3)
Como obter a reta que melhor se ajusta a estes 3
pontos?
(Isto , a reta que min a SQR)
70
60
55
50 Resduo n
Resduo 2 y = mx + b
3 pontos
40 40
y
30
20 Resduo 1
10 10
0
0 5 10 15 20 25 30 35 40 45
Coeficiente de Determinao
Como est o ajuste da linha aos pontos?
% da variao total em y que explicado pela variao em x (pela
linha)?
Variao total em y dividida em 2 partes a dos resduos (no
explicada pela linha) e a explicada pela linha (SQE)
SQT = SQR + SQE
Qual o percentual da variao total no explicada pela regresso
(pela linha)?
% da variao total (SQT) no explicada pela linha = SQR/SQT
% da Variao Total Explicada pela linha = SQE/SQT = 1 SQR/SQT
Assim:
Se SQR pequeno linha tem bom ajuste
r 1
x y
x y Y* = mx+b Erro= (Y-Y*) Erro^2 (Y-Ymdio)^2
1 2
4 3
1 2 0,73809 1,26191 1,592416 3,0625
-1 -1
-2 -3
4 3 3,666662 -0,66666 0,444438 7,5625
R^2 0,879644
Mdias
X 0,5 m 0,97619
Y 0,25 b -0,2381
Regresso
XY 5,25 no Excel, stata, etc
X^2 5,5