Sie sind auf Seite 1von 21

Unidade 3

Regresso Linear

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Ementa
3.1 Reta dos mnimos quadrados
3.2 Ajuste da reta de regresso linear simples

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Na unidade anterior estudamos a medida da
intensidade de correlao entre duas variveis.
Se chegarmos concluso de que h uma grande
correlao linear entre as variveis, devemos
determinar qual relao essa.
A determinao da relao linear entre duas
variveis chamada de regresso linear.

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Dada uma coleo de dados
emparelhados, a equao de regresso

amostrais

y b0 b1 x
descreve a relao entre as duas variveis. O grfico
da equao de regresso chamado de reta de
regresso (ou reta de melhor ajuste, ou reta de
mnimos quadrados).

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Esta equao descreve a relao entre x (chamada
varivel independente ou varivel preditora) e
y (chamada varivel dependente ou varivel
resposta).
Na equao, b0 chamado de intercepto y e b1 o
coeficiente angular.
Para o clculo de b0 e b1, utilizamos as frmulas a
seguir.

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


b0

y b x

b1

n xy x y

n x 2 x

Repare que os dados necessrios para o clculo de b0


e b1 so os mesmos para o clculo do coeficiente de
correlao linear r, o que torna a determinao de
uma reta de regresso muito simples aps o clculo
do coeficiente de correlao.
Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Variao marginal:
Ao trabalharmos com duas variveis relacionadas
por uma equao de regresso, a variao marginal
em uma delas o quanto ela varia quando a outra
varivel sofre uma variao de exatamente uma
unidade. A variao marginal igual ao valor do
coeficiente angular da reta b1.

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Outliers:
Em um diagrama de disperso, um ponto extremo
(outlier) um ponto que est muito afastado dos
demais pontos.
Pontos de influncia:
Os dados amostrais emparelhados podem conter um
ou mais pontos de influncia, que so pontos que
afetam fortemente o grfico da reta de regresso.

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Predies:
As equaes de regresso podem ser teis quando
usadas para predizer o valor de uma varivel, dado
um valor determinado da outra varivel.
Se a reta de regresso se ajusta bem aos dados, ento
tem sentido utilizar uma equao para fazer
predies.

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Na ausncia de correlao linear significativa, no
podemos usar a equao de regresso para projetar
ou predizer.
Em vez disso, a melhor estimativa da segunda
varivel simplesmente a sua mdia.
Devemos tambm lembrar que no podemos
extrapolar os valores da varivel independente, pois
no sabemos o comportamento da varivel
dependente y para valores no determinados de x.

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Exemplo:
Os pesos de ursos machos podem ser determinados
pelo seu comprimento?
Como visto anteriormente, h uma correlao entre o
peso e o comprimento dos ursos.
Determine agora a reta de regresso que relacione o
peso dos ursos com o seu comprimento.
Comprimento em pol (x)

53,0

67,5

72,0

72,0

73,5

68,5

73,0

37,0

Peso em libras (y)

80

344

416

348

262

360

332

34

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Resoluo: Como visto anteriormente, este o
grfico de disperso dos dados.
450
400
350
300
250
200
150
100
50
0
0

10

Estatstica Prof. Ricardo Lus Rocha

20

30

40

50

60

70

80

Unidade 3 Regresso Linear


Calculando agora o valor de b0 e b1:
b1

n xy x y
n

x x
2

8151879 516 ,52176 91128


b1

9,659
2
9433 ,75
834525 ,75 516 ,5

b0

y b x

2176 9,659 516 ,5


b0
351,66
8

Equao da reta: y = 9,659x 351,66


Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


A reta de regresso ser:
450
400
350
300
250
200
150
100
50
0
0

10

Estatstica Prof. Ricardo Lus Rocha

20

30

40

50

60

70

80

Unidade 3 Regresso Linear


Desta forma, podemos agora prever quanto pesar
um urso macho que mea 71,0 polegadas:
y = 9,659x 351,66
y = 9,659.71 351,66
y = 334,13 libras
A variao marginal de 9,659, que diz que para
cada polegada de tamanho que o urso cresa, ele
pesar mais 9,659 libras.

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


- Qualidade do modelo de regresso linear:
Definies:
y = valor observado
y = mdia dos valores observados
y = valor predito pela equao de regresso

Desvio total: distncia vertical y y


Desvio explicado: distncia vertical y y
Desvio no-explicado: distncia vertical y y ,
tambm chamado de resduo.
Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


b: Desvio Explicado: Valor
Predito Mdia

y y

y
b
a
c

a: Desvio Total: Valor Real Mdia

y y

y
c: Desvio No Explicado: Valor Real Predito

y y

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Mais definies:
Variao total: soma dos quadrados dos desvios
totais

(y y )

Variao explicada: soma dos quadrados dos desvios


explicados
2

(
y

y
)

Variao no-explicada: soma dos quadrados dos


desvios no-explicados
2

(y y)

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Relaes entre os desvios:
(d. Total) = (d. explicado) + (d. no-explicado)

y y

y y

y y

De maneira anloga:
(v. total) = (v. explicada) + (v. no-explicada)
2
2
2

(
y

y
)
(
y

y
)
(
y

y
)
+

Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Coeficiente de determinao:
Definio: Valor da variao de y que explicado
pela reta de regresso.
variao explicada
r
variao total
2

ou

r2

(
y

y
)

2
(
y

y
)

Obs.: Podemos calcular r2 tanto pela definio


acima, como simplesmente elevando ao quadrado o
coeficiente de correlao linear r

r2 sempre assumir valores entre 0 e 1


Estatstica Prof. Ricardo Lus Rocha

Unidade 3 Regresso Linear


Exerccio:
Os dados emparelhados abaixo consistem nos pesos
totais (y) de plstico descartados e tamanhos de
residncias (x).
Peso
0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05
Tamanho 2
3
3
6
4
2
1
5

Determine a equao de regresso, a variao


explicada, a variao no explicada, a variao total
e o coeficiente de determinao.

Estatstica Prof. Ricardo Lus Rocha

Das könnte Ihnen auch gefallen