Beruflich Dokumente
Kultur Dokumente
Cap. 09
Correlao e Regresso
Estatstica e Probabilidade
Correlao
Uma correlao uma relao entre duas variveis.
Os dados podem ser representados por pares
ordenados (x,y), onde x a varivel independente ou
varivel explanatria e y a varivel dependente ou
resposta.
*espero...
Estatstica e Probabilidade
Correlao
Uma relao entre duas variveis.
Varivel explanatria
(ou independente)
Varivel resposta
(ou dependente)
Horas de treinamento
Nmero do sapato
Cigarros fumados por dia
Nota no vestibular
Altura
Nmero de acidentes
Altura
Capacidade pulmonar
Mdia de notas na graduao
QI
Estatstica e Probabilidade
Correlao Mapas de Disperso
Mapas de disperso podem ser usados para determinar se
existe uma correlao linear (uma reta, do you know?!) entre
duas variveis.
Exemplo:
x = horas de treinamento
y = nmero de acidentes
60
Acidentes
50
40
30
20
10
0
10
12
14
Horas de treinamento
16
18
20
Estatstica e Probabilidade
Correlao Mapas de Disperso
Mdia de notas
na graduao
Exemplo:
4,00
3,75
3,50
3,25
3,00
2,75
2,50
2,25
2,00
1,75
1,50
300 350 400 450 500 550 600 650 700 750 800
Nota no vestibular
Estatstica e Probabilidade
Correlao Mapas de Disperso
QI
Exemplo:
x = altura
160
150
140
130
120
110
100
90
80
60
64
68
72
Altura
No h correlao linear.
y = QI
76
80
Estatstica e Probabilidade
Coeficiente de correlao - r
O Coeficiente de correlao uma medida do grau e da
relao entre duas variveis. O smbolo r representa o
coeficiente de correlao amostral e dado por:
2
x
significa elevar ao quadrado cada valor e somar os quadrados
( x)
Estatstica e Probabilidade
Coeficiente de correlao - r
O intervalo de r varia de
1 a 1.
1
Se r est prximo
de 1, h uma
forte correlao
negativa.
0
Se r est prximo
de 0, no h
correlao linear.
1
Se r est prximo
de 1, h uma
forte correlao
positiva.
Estatstica e Probabilidade
Coeficiente de correlao - r
Exemplo:
Na tabela abaixo temos os dados do nmero de faltas e da nota final
para a disciplina de Estatstica, do curso de Eng. Alimentos da UFMA l
de Imperatriz Calcule o coeficiente de correlao r .
100
Nota Final
(y)
90
78
80
92
90
12
58
15
43
74
81
Nota Final
Faltas
(x)
70
60
50
40
0
10
Faltas
12
14
16
Estatstica e Probabilidade
Exemplo (cont):
Calculando r...
Dica:
Organize seus
dados em uma
tabela e calcule
o
que
for
necessrio
Soma
xy
x2
y2
78
624
64
6.084
92
184
8.464
90
450
25
8.100
12
58
696
144
3.364
15
43
645
225
1.149
74
666
81
5.476
81
486
36
6.561
57
516
3751
579
39.898
=
3.155
0,975
13.030
7(3.753) (57)(516)
7(579) (57) 2 7(39.898) (516) 2
Estatstica e Probabilidade
Estatstica e Probabilidade
Teste de hipteses para determinar a significncia de um
coeficiente de correlao
O coeficiente de correlao para uma amostra r
O coeficiente de correlao populacional (r).
Estatstica e Probabilidade
Teste de hipteses para determinar a significncia de um
coeficiente de correlao
Neste curso consideraremos apenas testes de hiptese para
que seja bicaudal
(A correlao no significante.)
(A correlao significante.)
Teste bicaudal
Estatstica e Probabilidade
Teste t para um coeficiente de correlao
Acabamos de encontrar a correlao entre o nmero de faltas e a
nota final dos alunos de estatstica da UFMA, r = 0,975. H sete
pares de dados. Teste a significncia dessa correlao r.
Use = 0,01.
(A correlao no significante.)
Ha
(A correlao significante.)
Teste bicaudal
= 0,01
Teste bicaudal
/2=0,005
/2=0,005
Estatstica e Probabilidade
Teste t para um coeficiente de correlao
t
4,032
4,032
0,975
0,975
0,975
9,811
0,049375
0,009875
0,09937
Estatstica e Probabilidade
Teste t para um coeficiente de correlao
t
8. Interprete sua deciso.
4,032
4,032
Estatstica e Probabilidade
Regresso linear
Encontrando a equao da reta
Estatstica e Probabilidade
Regresso linear A reta de regresso
Depois de constatar que existe uma correlao linear
significante, voc pode escrever uma equao que
descreva a relao entre as variveis x e y. Essa equao
chama-se reta de regresso ou reta do ajuste timo.
Pode-se escrever a equao de uma reta como y = mx + b,
onde m a inclinao da reta e b, o intercepto y.
Assim, a reta de regresso :
A inclinao m :
E o intercepto y :
Estatstica e Probabilidade
Regresso linear A reta de regresso
No mapa de disperso abaixo, d representa a diferena entre o valor
observado de y e o valor previsto de y sobre a reta.
Resduo d = (valor y observado) (valor y previsto)
Receita
valor observado
d4
valor previsto
d3
Investimento em publicidade
A reta de regresso aquela para qual a soma
dos quadrados de todos os resduos um mnimo
2
d
um mnimo
Estatstica e Probabilidade
Regresso linear A reta de regresso
Calcule m e b e
escreva a equao da
reta de regresso
x = nmero de faltas
y = nota final.
xy
x2
y2
78
624
64
6.084
92
184
8.464
90
450
25
8.100
12
58
696
144
3.364
15
43
645
225
1.149
74
666
81
5.476
81
486
36
6.561
57
516
3751
579
39.898
(3.751)
73,714
A reta de regresso :
(3,924)(8,143)
105,667
= 3,924x + 105,667
Estatstica e Probabilidade
Regresso linear A reta de regresso
m = 3,924 e b = 105,667
Nota final
A reta de regresso :
3,924
105,667
95
90
85
80
75
70
65
60
55
50
45
40
0
10
12
14
Faltas
Note que o ponto
16
Estatstica e Probabilidade
Prevendo valores y
Com a reta de regresso, possvel prever valores de y
correspondentes aos valores de x que caiam em
determinado intervalo de dados.
A equao de regresso para o nmero de faltas e a nota final :
= 3,924x + 105,667
Use essa equao para prever a nota esperada de um aluno com:
(a) 3 faltas
(b) 12 faltas
(a)
(b)
Estatstica e Probabilidade
Medidas de
regresso e correlao
Estatstica e Probabilidade
Medidas de regresso
O Coeficiente de determinao
O coeficiente de determinao, r2, a razo entre a variao
explicada em y e a variao total em y.
Variao explicada
Variao total
O coeficiente de correlao entre as faltas e a nota final era r = 0,975.
O coeficiente de determinao r2 = (0,975)2 = 0,9506.
Interpretao: cerca de 95% da variao nas notas finais pode ser
explicada pelo nmero de vezes que o aluno falta. Os outros 5% so
inexplicados e podem dever-se a um erro amostral ou outras variveis,
como inteligncia, tempo dedicado aos estudos, etc.
Estatstica e Probabilidade
O erro padro da estimativa
O erro padro da estimativa, se, o desvio padro dos
valores yi observados em torno do valor
previsto para
Estatstica e Probabilidade
O erro padro da estimativa
Exemplo
3,924x
( y y ) 2
x y
8
2
5
12
15
9
6
78
92
90
58
43
74
81
74,275
97,819
86,047
58,579
46,807
70,351
82,123
13,8756
33,8608
15,6262
0,3352
14,4932
13,3152
1,2611
92,767
92,767
= 4,307
Erro padro ou desvio padro
Estatstica e Probabilidade
EEh
TTe hoojjee
e
a
r
r
m
ddaa miin accaab
33. noouu boouu
.aav hho ttuud
vaali ojjee doo
DDa
.
l
a
a
i
.
a
a
t
.
a
.
a
t
m
((002 add
m
oo..
aatt
2//006 aaPP
rriia
6//110 rroov
a
v
0,,O aa
LLi
Okk
isstta
????
add
??!!
eee
exxe
!
!))
errcc
cci
iooss
nnoo
ssiit
tee!!