Sie sind auf Seite 1von 27

Estatstica e Probabilidade

Cap. 09
Correlao e Regresso

Estatstica e Probabilidade

Correlao
Uma correlao uma relao entre duas variveis.
Os dados podem ser representados por pares
ordenados (x,y), onde x a varivel independente ou
varivel explanatria e y a varivel dependente ou
resposta.

*espero...

Nesta aula aprenderemos* a descrever o tipo de


relao ou correlao que h entre duas variveis e a
determinar se a correlao significante.

Estatstica e Probabilidade

Correlao
Uma relao entre duas variveis.

Varivel explanatria
(ou independente)

Varivel resposta
(ou dependente)

Horas de treinamento
Nmero do sapato
Cigarros fumados por dia
Nota no vestibular
Altura

Nmero de acidentes
Altura
Capacidade pulmonar
Mdia de notas na graduao
QI

Que tipo de relao existe entre as duas variveis?


A correlao significante?

Estatstica e Probabilidade
Correlao Mapas de Disperso
Mapas de disperso podem ser usados para determinar se
existe uma correlao linear (uma reta, do you know?!) entre
duas variveis.
Exemplo:
x = horas de treinamento
y = nmero de acidentes

60

Acidentes

50
40
30
20
10
0

10

12

14

Horas de treinamento

16

18

20

Correlao negativa: medida que x cresce, y decresce.

Estatstica e Probabilidade
Correlao Mapas de Disperso

Mdia de notas
na graduao

Exemplo:

4,00
3,75
3,50
3,25
3,00
2,75
2,50
2,25
2,00
1,75
1,50
300 350 400 450 500 550 600 650 700 750 800

Nota no vestibular

Correlao positiva: medida que x cresce, y cresce tambm.

Estatstica e Probabilidade
Correlao Mapas de Disperso

QI

Exemplo:

x = altura

160
150
140
130
120
110
100
90
80
60

64

68

72

Altura
No h correlao linear.

y = QI

76

80

Estatstica e Probabilidade
Coeficiente de correlao - r
O Coeficiente de correlao uma medida do grau e da
relao entre duas variveis. O smbolo r representa o
coeficiente de correlao amostral e dado por:

Na equao acima n o nmero de pares de dados.


O coeficiente de correlao populacional definido por .
Lembre-se que:

2
x
significa elevar ao quadrado cada valor e somar os quadrados

( x)

significa somar os valores e elevar ao quadrado a soma

Estatstica e Probabilidade
Coeficiente de correlao - r
O intervalo de r varia de
1 a 1.
1
Se r est prximo
de 1, h uma
forte correlao
negativa.

0
Se r est prximo
de 0, no h
correlao linear.

1
Se r est prximo
de 1, h uma
forte correlao
positiva.

Estatstica e Probabilidade
Coeficiente de correlao - r
Exemplo:
Na tabela abaixo temos os dados do nmero de faltas e da nota final
para a disciplina de Estatstica, do curso de Eng. Alimentos da UFMA l
de Imperatriz Calcule o coeficiente de correlao r .
100

Nota Final
(y)

90

78

80

92

90

12

58

15

43

74

81

Nota Final

Faltas
(x)

70
60
50
40
0

10

Faltas

12

14

16

Estatstica e Probabilidade
Exemplo (cont):
Calculando r...
Dica:
Organize seus
dados em uma
tabela e calcule
o
que
for
necessrio

Soma

xy

x2

y2

78

624

64

6.084

92

184

8.464

90

450

25

8.100

12

58

696

144

3.364

15

43

645

225

1.149

74

666

81

5.476

81

486

36

6.561

57

516

3751

579

39.898

=
3.155
0,975
13.030

7(3.753) (57)(516)
7(579) (57) 2 7(39.898) (516) 2

Como r est prximo de -1, temos uma


forte correlao linear negativa

Estatstica e Probabilidade

Teste de hipteses para um


coeficiente de correlao
populacional.

Estatstica e Probabilidade
Teste de hipteses para determinar a significncia de um
coeficiente de correlao
O coeficiente de correlao para uma amostra r
O coeficiente de correlao populacional (r).

Um teste de hipteses para pode ser mono ou bicaudal.

(no existe correlao negativa significante.)


(A correlao negativa significante.)
Teste monocaudal esquerdo

(no existe correlao positiva significante.)


(A correlao positiva significante.)
Teste monocaudal direito

Estatstica e Probabilidade
Teste de hipteses para determinar a significncia de um
coeficiente de correlao
Neste curso consideraremos apenas testes de hiptese para
que seja bicaudal

(A correlao no significante.)
(A correlao significante.)
Teste bicaudal

A distribuio amostral de r uma distribuio t com


g.l = n 2
Estatstica teste padronizada:

Estatstica e Probabilidade
Teste t para um coeficiente de correlao
Acabamos de encontrar a correlao entre o nmero de faltas e a
nota final dos alunos de estatstica da UFMA, r = 0,975. H sete
pares de dados. Teste a significncia dessa correlao r.
Use = 0,01.

1. Estabelea as hipteses nula e alternativa.


H0

(A correlao no significante.)

Ha

(A correlao significante.)

Teste bicaudal

2. Estabelea o nvel de significncia.

= 0,01

Teste bicaudal

/2=0,005

3. Identifique a distribuio amostral.


Uma distribuio t com cinco graus de liberdade.
Para 5 g.l. e

/2=0,005

temos tc= 4,032

Estatstica e Probabilidade
Teste t para um coeficiente de correlao

4. Determine o valor crtico.


5. Determine a regio de rejeio.
Regies de rejeio
Valores crticos t0

t
4,032

4,032

6. Determine a estatstica teste.


0,975

0,975

0,975

0,975
9,811

0,049375

0,009875

0,09937

Estatstica e Probabilidade
Teste t para um coeficiente de correlao

7. Tome sua deciso.


t = 9,811 cai na regio de rejeio.
Rejeite a hiptese nula.

t
8. Interprete sua deciso.

4,032

4,032

H, sim, uma correlao significante entre o nmero de


faltas e as notas finais.
Nos testes de hiptese para correlao, rejeitar a hiptese nula sempre
significa que h evidncias suficiente para provar que a
correlao significante.

Estatstica e Probabilidade

Regresso linear
Encontrando a equao da reta

Estatstica e Probabilidade
Regresso linear A reta de regresso
Depois de constatar que existe uma correlao linear
significante, voc pode escrever uma equao que
descreva a relao entre as variveis x e y. Essa equao
chama-se reta de regresso ou reta do ajuste timo.
Pode-se escrever a equao de uma reta como y = mx + b,
onde m a inclinao da reta e b, o intercepto y.
Assim, a reta de regresso :
A inclinao m :
E o intercepto y :

Estatstica e Probabilidade
Regresso linear A reta de regresso
No mapa de disperso abaixo, d representa a diferena entre o valor
observado de y e o valor previsto de y sobre a reta.
Resduo d = (valor y observado) (valor y previsto)

Receita

valor observado

d4

valor previsto

d3
Investimento em publicidade
A reta de regresso aquela para qual a soma
dos quadrados de todos os resduos um mnimo

2
d
um mnimo

Estatstica e Probabilidade
Regresso linear A reta de regresso
Calcule m e b e
escreva a equao da
reta de regresso
x = nmero de faltas
y = nota final.

xy

x2

y2

78

624

64

6.084

92

184

8.464

90

450

25

8.100

12

58

696

144

3.364

15

43

645

225

1.149

74

666

81

5.476

81

486

36

6.561

57

516

3751

579

39.898

(3.751)

73,714

A reta de regresso :

(3,924)(8,143)

105,667

= 3,924x + 105,667

Estatstica e Probabilidade
Regresso linear A reta de regresso
m = 3,924 e b = 105,667

Nota final

A reta de regresso :

3,924

105,667

95
90
85
80
75
70
65
60
55
50
45
40
0

10

12

14

Faltas
Note que o ponto

= (8,143, 73,714) est na reta.

16

Estatstica e Probabilidade
Prevendo valores y
Com a reta de regresso, possvel prever valores de y
correspondentes aos valores de x que caiam em
determinado intervalo de dados.
A equao de regresso para o nmero de faltas e a nota final :

= 3,924x + 105,667
Use essa equao para prever a nota esperada de um aluno com:
(a) 3 faltas

(b) 12 faltas

(a)

= 3,924(3) + 105,667 = 93,895

(b)

= 3,924(12) + 105,667 = 58,579

Estatstica e Probabilidade

Medidas de
regresso e correlao

Estatstica e Probabilidade
Medidas de regresso
O Coeficiente de determinao
O coeficiente de determinao, r2, a razo entre a variao
explicada em y e a variao total em y.
Variao explicada
Variao total
O coeficiente de correlao entre as faltas e a nota final era r = 0,975.
O coeficiente de determinao r2 = (0,975)2 = 0,9506.
Interpretao: cerca de 95% da variao nas notas finais pode ser
explicada pelo nmero de vezes que o aluno falta. Os outros 5% so
inexplicados e podem dever-se a um erro amostral ou outras variveis,
como inteligncia, tempo dedicado aos estudos, etc.

Estatstica e Probabilidade
O erro padro da estimativa
O erro padro da estimativa, se, o desvio padro dos
valores yi observados em torno do valor

previsto para

um dado xi. Ele dado por:

Onde n o nmero de pares ordenados do conjunto dado

Estatstica e Probabilidade
O erro padro da estimativa
Exemplo

Calcule o erro padro da estimativa


Calcule

3,924x

105,667 para cada xi


valor previsto

( y y ) 2

x y
8
2
5
12
15
9
6

78
92
90
58
43
74
81

74,275
97,819
86,047
58,579
46,807
70,351
82,123

13,8756
33,8608
15,6262
0,3352
14,4932
13,3152
1,2611

92,767

92,767

= 4,307
Erro padro ou desvio padro

Estatstica e Probabilidade
EEh
TTe hoojjee
e
a
r
r
m
ddaa miin accaab
33. noouu boouu
.aav hho ttuud
vaali ojjee doo
DDa
.
l
a
a
i
.
a
a
t
.
a

.
a
t
m

((002 add
m

oo..
aatt
2//006 aaPP
rriia
6//110 rroov
a
v
0,,O aa
LLi
Okk
isstta
????
add
??!!
eee
exxe
!
!))
errcc
cci
iooss
nnoo
ssiit
tee!!

Das könnte Ihnen auch gefallen