Sie sind auf Seite 1von 27

Estatstica e Probabilidade

Cap. 09 Correlao e Regresso

Estatstica e Probabilidade

Correlao
Uma correlao uma relao entre duas variveis. Os dados podem ser representados por pares ordenados (x,y), onde x a varivel independente ou varivel explanatria e y a varivel dependente ou resposta. Nesta aula aprenderemos* a descrever o tipo de relao ou correlao que h entre duas variveis e a determinar se a correlao significante.
*espero...

Estatstica e Probabilidade

Correlao
Uma relao entre duas variveis.

Varivel explanatria (ou independente)

Varivel resposta (ou dependente)

x
Horas de treinamento Nmero do sapato Cigarros fumados por dia Nota no vestibular Altura

y
Nmero de acidentes Altura Capacidade pulmonar Mdia de notas na graduao QI

Que tipo de relao existe entre as duas variveis? A correlao significante?

Estatstica e Probabilidade
Correlao Mapas de Disperso
Mapas de disperso podem ser usados para determinar se existe uma correlao linear (uma reta, do you know?!) entre duas variveis.
Exemplo:
60 50

x = horas de treinamento y = nmero de acidentes

Acidentes

40 30 20 10
0

Horas de treinamento

10

12

14

16

18

20

Correlao negativa: medida que x cresce, y decresce.

Estatstica e Probabilidade
Correlao Mapas de Disperso
Exemplo:

4,00 3,75 3,50 3,25 3,00 2,75 2,50 2,25 2,00 1,75 1,50 300 350 400 450 500 550 600 650 700 750 800

Mdia de notas na graduao

Nota no vestibular

Correlao positiva: medida que x cresce, y cresce tambm.

Estatstica e Probabilidade
Correlao Mapas de Disperso
Exemplo:

160 150 140 130 120 110 100 90 80 60 64 68

x = altura

y = QI

QI

72

76

80

Altura No h correlao linear.

Estatstica e Probabilidade Coeficiente de correlao - r


O Coeficiente de correlao uma medida do grau e da relao entre duas variveis. O smbolo r representa o coeficiente de correlao amostral e dado por:

Na equao acima n o nmero de pares de dados. O coeficiente de correlao populacional definido por .
Lembre-se que:

x 2 significa elevar ao quadrado cada valor e somar os quadrados

( x)

significa somar os valores e elevar ao quadrado a soma

Estatstica e Probabilidade Coeficiente de correlao - r O intervalo de r varia de 1 a 1.


1 Se r est prximo de 1, h uma forte correlao negativa. 0 Se r est prximo de 0, no h correlao linear. 1 Se r est prximo de 1, h uma forte correlao positiva.

Estatstica e Probabilidade Coeficiente de correlao - r


Exemplo:
Na tabela abaixo temos os dados do nmero de faltas e da nota final para a disciplina de Estatstica, do curso de Eng. Alimentos da UFMA l de Imperatriz Calcule o coeficiente de correlao r .
100

Faltas (x) 8 2 5 12 15 9 6

Nota Final (y) 78


Nota Final

90 80 70 60 50 40 0 2 4 6 8 10 12 14 16

92 90 58 43 74 81

Faltas

Estatstica e Probabilidade
Exemplo (cont):
Calculando r... Dica: Organize seus dados em uma tabela e calcule o que for necessrio
x 8 2 5 12 15 9 6 y 78 92 90 58 43 74 81 516 xy 624 184 450 696 645 666 486 3751 x2 64 4 25 144 225 81 36 579 y2 6.084 8.464 8.100 3.364 1.149 5.476 6.561 39.898

Soma

57

=
3.155 0,975 13.030

7(3.753) (57)(516) 7(579) (57) 2 7(39.898) (516) 2

Como r est prximo de -1, temos uma forte correlao linear negativa

Estatstica e Probabilidade

Teste de hipteses para um coeficiente de correlao populacional.

Estatstica e Probabilidade
Teste de hipteses para determinar a significncia de um coeficiente de correlao O coeficiente de correlao para uma amostra r
O coeficiente de correlao populacional (r).

Um teste de hipteses para pode ser mono ou bicaudal.

(no existe correlao negativa significante.) (A correlao negativa significante.)


Teste monocaudal esquerdo

(no existe correlao positiva significante.) (A correlao positiva significante.)


Teste monocaudal direito

Estatstica e Probabilidade
Teste de hipteses para determinar a significncia de um coeficiente de correlao
Neste curso consideraremos apenas testes de hiptese para que seja bicaudal

(A correlao no significante.) (A correlao significante.)


Teste bicaudal

A distribuio amostral de r uma distribuio t com g.l = n 2 Estatstica teste padronizada:

Estatstica e Probabilidade
Teste t para um coeficiente de correlao
Acabamos de encontrar a correlao entre o nmero de faltas e a nota final dos alunos de estatstica da UFMA, r = 0,975. H sete pares de dados. Teste a significncia dessa correlao r. Use = 0,01.

1. Estabelea as hipteses nula e alternativa. H0 Ha


(A correlao no significante.) (A correlao significante.)
Teste bicaudal

2. Estabelea o nvel de significncia.

= 0,01

Teste bicaudal

/2=0,005

3. Identifique a distribuio amostral.


Uma distribuio t com cinco graus de liberdade. Para 5 g.l. e

/2=0,005

temos tc= 4,032

Estatstica e Probabilidade
Teste t para um coeficiente de correlao

4. Determine o valor crtico. 5. Determine a regio de rejeio.


Regies de rejeio Valores crticos t0

t
4,032 0 4,032

6. Determine a estatstica teste.


0,975 0,975 0,975 0,009875 0,975 9,811 0,09937

0,049375

Estatstica e Probabilidade
Teste t para um coeficiente de correlao

7. Tome sua deciso.


t = 9,811 cai na regio de rejeio. Rejeite a hiptese nula.

t
8. Interprete sua deciso.
4,032 0 4,032 H, sim, uma correlao significante entre o nmero de faltas e as notas finais.
Nos testes de hiptese para correlao, rejeitar a hiptese nula sempre significa que h evidncias suficiente para provar que a correlao significante.

Estatstica e Probabilidade

Regresso linear
Encontrando a equao da reta

Estatstica e Probabilidade
Regresso linear A reta de regresso
Depois de constatar que existe uma correlao linear significante, voc pode escrever uma equao que descreva a relao entre as variveis x e y. Essa equao chama-se reta de regresso ou reta do ajuste timo. Pode-se escrever a equao de uma reta como y = mx + b, onde m a inclinao da reta e b, o intercepto y. Assim, a reta de regresso : A inclinao m : E o intercepto y :

Estatstica e Probabilidade
Regresso linear A reta de regresso
No mapa de disperso abaixo, d representa a diferena entre o valor observado de y e o valor previsto de y sobre a reta. Resduo d = (valor y observado) (valor y previsto) valor observado Receita

d4 d3

valor previsto

Investimento em publicidade A reta de regresso aquela para qual a soma dos quadrados de todos os resduos um mnimo

d 2 um mnimo

Estatstica e Probabilidade
Regresso linear A reta de regresso
Calcule m e b e escreva a equao da reta de regresso
x = nmero de faltas y = nota final.
x 8 2 5 12 15 9 6 57 y 78 92 90 58 43 74 81 516 xy 624 184 450 696 645 666 486 3751 x2 64 4 25 144 225 81 36 579 y2 6.084 8.464 8.100 3.364 1.149 5.476 6.561 39.898

(3.751)

73,714

(3,924)(8,143)

105,667

A reta de regresso :

= 3,924x + 105,667

Estatstica e Probabilidade
Regresso linear A reta de regresso
m = 3,924 e b = 105,667 A reta de regresso :
95 90 85 80 75 70 65 60 55 50 45 40 0 2 4 6 8 10 12 14 16

3,924

105,667

Nota final

Faltas
Note que o ponto = (8,143, 73,714) est na reta.

Estatstica e Probabilidade Prevendo valores y


Com a reta de regresso, possvel prever valores de y correspondentes aos valores de x que caiam em determinado intervalo de dados.
A equao de regresso para o nmero de faltas e a nota final :

= 3,924x + 105,667
Use essa equao para prever a nota esperada de um aluno com: (a) 3 faltas (b) 12 faltas

(a) (b)

= 3,924(3) + 105,667 = 93,895 = 3,924(12) + 105,667 = 58,579

Estatstica e Probabilidade

Medidas de regresso e correlao

Estatstica e Probabilidade
Medidas de regresso O Coeficiente de determinao
O coeficiente de determinao, r2, a razo entre a variao explicada em y e a variao total em y. Variao explicada Variao total
O coeficiente de correlao entre as faltas e a nota final era r = 0,975. O coeficiente de determinao r2 = (0,975)2 = 0,9506.
Interpretao: cerca de 95% da variao nas notas finais pode ser explicada pelo nmero de vezes que o aluno falta. Os outros 5% so inexplicados e podem dever-se a um erro amostral ou outras variveis, como inteligncia, tempo dedicado aos estudos, etc.

Estatstica e Probabilidade
O erro padro da estimativa
O erro padro da estimativa, se, o desvio padro dos valores yi observados em torno do valor um dado xi. Ele dado por: previsto para

Onde n o nmero de pares ordenados do conjunto dado

Estatstica e Probabilidade
O erro padro da estimativa
Exemplo

Calcule o erro padro da estimativa Calcule


3,924x 105,667 para cada xi valor previsto

x y
8 2 5 12 15 9 6 78 92 90 58 43 74 81 74,275 97,819 86,047 58,579 46,807 70,351 82,123

( y y) 2
13,8756 33,8608 15,6262 0,3352 14,4932 13,3152 1,2611

92,767

= 4,307 Erro padro ou desvio padro

92,767

Estatstica e Probabilidade
Eh Eh Te ojjee Ter o a da rmiin accab da m n abo 3. ou ou 3 . ou av ho uttud ava hoj ud Da alliia jeea o.. Dat a am o .. ((02 ta d o. mat 02/0 a da o. atr aP /06/ Pr riia 6/10 rov a 10, ova Li Lis , Ok a Ok stta ?? ad ??? deee ?!! ! exe !)) xer rccc ciios os n no ossi ittee! !

Das könnte Ihnen auch gefallen