Beruflich Dokumente
Kultur Dokumente
50
0
0 10 20 30 40
Lado do Quadrado
100
95
90 A existência de uma
85
relação estatística entre a
Peso (kg)
80
75 variável dependente Y e a
70 variável independente X
65
60 não implica que Y
55 dependa de X, ou que
50
150 160 170 180 190
exista uma relação de
Altura (cm ) causa-efeito entre X e Y.
Exemplo 1: Um psicólogo está investigando a
relação entre o tempo que um indivíduo leva para reagir
a um estímulo visual (Y) com o sexo (W), idade (X) e
acuidade visual (Z, medida em porcentagem).
130
120
110
Y
100
90
20 30 40
X
Y
Y
Y
r = 0,9 r = 0,3 r=0
X X X
Coeficiente de Correlação (de Pearson)
mede o grau de relação linear entre X e Y
Y
r = - 0,9
X
Coeficiente de Correlação
ΣYY
Y
Y
Y
X X X ΣX
X
Yi = Yi −1 + ∆yi ∆yi ᄈ 0
X i = X i −1 + ∆xi ∆xi ᄈ 0
Coeficiente de Correlação
Y
X
Y
Y
X X
X
Análise de Regressão
Y ξi E(Y) = β0 + β1 X
β1 Coeficiente
angular
β0
X Erro Aleatório
Yi = β 0 + β1 X i + ξ i
Variável Variável
Dependente Independente
Estimação dos parâmetros
∂Q n
= −2∑ [Yi − β 0 − β1 X i ] X i
∂β1 i =1
i =1 ei = Yi − Yˆi (resíduo)
b0 = Y − b1 X
Propriedades da equação de regressão
1) ∑e
i =1
i =0
2) ∑e
i =1
2
i é mínima
n n
3) ∑ Y = ∑ Yˆ
i =1
i
i =1
i
X X
No exemplo:
n=20, Σyi= 2150, Σxi=600, Σxiyi=65400, Σxi2=19000
α
ˆ = 107,50 − 0,90.30 = 80,50
ŷ i = 80,50 + 0,90x i
Interpretação: Para um aumento de 1 ano na idade, o
tempo médio de reação aumenta 0,90.
Podemos prever, por exemplo, o tempo médio de reação
para pessoas de 20 anos ⇒ ŷ ( 20) = 80,50 + 0,90.20 = 98,50
ŷ ( 25) = 103 ŷ( 30) = 107,50 ŷ ( 35) = 112 ŷ(40) = 116,5
⇓
Vantagem: permite estimar o tempo médio de
reação para idades não observadas
⇓
ŷ ( 33) = 80,50 + 0,90.33 = 110,20
Regression Plot
Y = 80,5 + 0,9X
R-Sq = 59,0 %
130
120
110
Y
100
90
20 30 40
X
Diagrama de dispersão
^
Y : valor predito para a taxa de criminalidade
X : taxa de analfabetismo
Interpretação de b:
Para um aumento de uma unidade na taxa do
analfabetismo (X), a taxa de criminalidade (Y)
aumenta, em média, 4,257 unidades.
Graficamente, temos
Y: expectativa de vida
X: taxa de analfabetismo
Diagrama de dispersão
^
Y : valor predito para a expectativa de vida
X : taxa de analfabetismo
Interpretação de b:
Para um aumento de uma unidade na taxa do
analfabetismo (X), a expectativa de vida (Y)
diminui, em média, 1,296 anos.
Graficamente, temos
Resíduos
10 1.5
Y = 0,9983X + 0,1306
8 2 1.0
R = 0,9496
0.5
6
Resíduos
0.0
Y
4
-0.5
2
-1.0
0 -1.5
0 2 4 6 8 10 0 2 4 6 8 10
X X
Resíduo = ei = Yi − Yˆi
Análise de Resíduos
10 2.0
Yˆ == 0,9983X
0,9983 X ++0,1306
0,1306 1.5
8 R =R
2 2
= 0,9496
Resíduos Padronizado
0,9496 1.0
6 0.5
0.0
Y
4 -0.5
-1.0
2
-1.5
0 -2.0
0 2 4 6 8 10 0 2 4 6 8 10
X X
Resíduos Padronizados
Resíduos Padronizados
1.0 1.0 1.0
0.5 0.5 0.5
0.0 0.0 0.0
-0.5 -0.5 -0.5
-1.0 -1.0 -1.0
-1.5 -1.5 -1.5
-2.0 -2.0 -2.0
0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10
X X X
1.0 1.0
0.5 0.5
0.0 0.0
-0.5 -0.5
-1.0 -1.0
-1.5 -1.5
-2.0 -2.0
0 2 4 6 8 10 0 2 4 6 8 10
X
tempo
X