Beruflich Dokumente
Kultur Dokumente
Volume 2 | Nmero 2
A Correlao entre duas variveis de tipo quantitativo Podem-se mostrar as seguintes propriedades do
descreve a associao entre essas variveis. coeficiente de correlao r:
Na presena de um conjunto de dados bivariados o
primeiro passo na anlise desses dados represent- 1. O coeficiente de correlao assume valores entre
los num diagrama de disperso. A forma da nuvem -1 e 1.
de pontos, representada no diagrama, pode mostrar 2. Quanto maior for o valor de r, em mdulo, maior
uma associao linear entre as duas variveis, que ser o grau de associao linear entre as variveis.
pode ser expressa numericamente pelo coeficente de 3. Um valor de r positivo indica uma associao linear
correlao amostral de Pearson ou pelo seu quadrado positiva entre as duas variveis, isto , quando os valores
que se chama coeficiente de determinao. de uma das variveis aumentam, existe tendncia para
O Coeficiciente de correlao amostral de Pearson, que os valores da outra varivel tambm aumentem.
representado por r, uma medida da direo e grau Um valor de r negativo indica uma associao linear
com que duas variveis, de tipo quantitativo, se negativa entre as duas variveis, isto , quando os valores
associam linearmente. de uma das variveis aumentam, existe tendncia para
Se representarmos por (x,y) = {(Xi,Yi)}, com i = 1, ..., que os valores da outra varivel diminuam.
n, uma amostra de dados bivariados, o coeficiente de 4. O coeficiente de correlao no uma medida
correlao amostral de Pearson calcula-se a partir da resistente, isto , pode ser influenciado pela existncia
seguinte frmula: nos dados de alguns valores estranhos ou outliers,
ou seja, valores muito maiores ou menores que os
n
( xi x )( yi y )
n n
restantes, pelo que deve ser interpretado com o
xi yi devido cuidado. A representao prvia dos dados
r= n i=1
onde x = i=1 e y = i=1
n
n n num diagrama de disperso, antes de proceder ao
( xi x ) ( yi y )
2 2
80 80 80
Exame 2A
Exame 2C
Exame 2B
70 70 70
60 60 60
50 50 50
50 60 70 80 90 50 60 70 80 90 50 60 70 80 90
90
80 80
Exame 2D
Exame 2F
Exame 2E
80
70 70
70
60 60
60
50 50 50
50 60 70 80 90 50 60 70 80 90 100 50 60 70 80 90
Classe Correlao 95
85
A 0.71
Exame 2G
75
B 0.47 65
C -0.99 55
D -0.72
45
35
E 0.99 40 50 60 70 80 80 100
Exame 1G
F -0.47 Correlao e relao causa-efeito importante no
confundir associao, medida pelo coeficiente de
Repare-se que apenas nos casos em que | r | muito correlao, com relao causa-efeito. Um diagrama de
elevado faz sentido falar de associao linear forte, disperso e uma correlao no provam a existncia
como observado nos casos C e E em que o grfico de de uma relao causa-efeito. Podem existir outras
disperso aponta para isso. variveis, que no so estudadas, mas influenciam
Num contexto de regresso linear simples, em que a as que esto a ser estudadas e que so conhecidas
varivel explanatria x e a varivel resposta y, o como variveis lurking ou confounding (variveis de
coeficiente de determinao r2 d a percentagem de confundimento).
variabilidade dos ys que fica explicada em funo da O coeficiente de correlao amostral r pode ser usado
variabilidade dos xs. Assim, embora aparentemente para estimar o coeficiente de correlao populacional
um valor de r volta de 0,7 possa parecer elevado, .
na realidade, maior a percentagem de variabilidade
Referncias
1. Murteira, B., Ribeiro, C. S., Silva, J. A., Pimenta, C. (2002) Introduo Estatstica. McGraw-Hill de Portugal, Lda. ISBN: 972-773-
116-3.
2. Rossman, A.J. (1996) - Workshop Statistics: Discovery with data. New York: Springer-Verlag.
3. Pestana, D., Velosa, S. (2010) Introduo Probabilidade e Estatstica, Volume I, 4 edio, Fundao Calouste Gulbenkian. ISBN:
978-972-31-1150-7. Depsito Legal 311132/10.
Autor Editor
Maria Eugnia Graa Martins Jos Francisco Rodrigues
Departamento de Estatstica e Investigao Operacional da Departamento de Matemtica da
Faculdade de Cincias da Universidade de Lisboa Faculdade de Cincias da Universidade de Lisboa