Sie sind auf Seite 1von 2

Revista de Cincia Elementar

Volume 2 | Nmero 2

Coeficiente de correlao amostral


Maria Eugnia Graa Martins
Referncia: Graa Martins, E. (2014), Revista de Cincia Elementar, 2(02):0069

A Correlao entre duas variveis de tipo quantitativo Podem-se mostrar as seguintes propriedades do
descreve a associao entre essas variveis. coeficiente de correlao r:
Na presena de um conjunto de dados bivariados o
primeiro passo na anlise desses dados represent- 1. O coeficiente de correlao assume valores entre
los num diagrama de disperso. A forma da nuvem -1 e 1.
de pontos, representada no diagrama, pode mostrar 2. Quanto maior for o valor de r, em mdulo, maior
uma associao linear entre as duas variveis, que ser o grau de associao linear entre as variveis.
pode ser expressa numericamente pelo coeficente de 3. Um valor de r positivo indica uma associao linear
correlao amostral de Pearson ou pelo seu quadrado positiva entre as duas variveis, isto , quando os valores
que se chama coeficiente de determinao. de uma das variveis aumentam, existe tendncia para
O Coeficiciente de correlao amostral de Pearson, que os valores da outra varivel tambm aumentem.
representado por r, uma medida da direo e grau Um valor de r negativo indica uma associao linear
com que duas variveis, de tipo quantitativo, se negativa entre as duas variveis, isto , quando os valores
associam linearmente. de uma das variveis aumentam, existe tendncia para
Se representarmos por (x,y) = {(Xi,Yi)}, com i = 1, ..., que os valores da outra varivel diminuam.
n, uma amostra de dados bivariados, o coeficiente de 4. O coeficiente de correlao no uma medida
correlao amostral de Pearson calcula-se a partir da resistente, isto , pode ser influenciado pela existncia
seguinte frmula: nos dados de alguns valores estranhos ou outliers,
ou seja, valores muito maiores ou menores que os
n

( xi x )( yi y )
n n
restantes, pelo que deve ser interpretado com o
xi yi devido cuidado. A representao prvia dos dados
r= n i=1
onde x = i=1 e y = i=1
n
n n num diagrama de disperso, antes de proceder ao
( xi x ) ( yi y )
2 2

i=1 i=1 clculo do coeficiente de correlao, permite detetar


ou seja, o coeficiente de correlao r para o par de a existncia de outliers.
variveis (x,y) o quociente entre a covarincia
amostral das variveis x e y e o produto dos desvios Apresentam-se a seguir alguns exemplos de
padres respetivos: representaes grficas de conjuntos de dados relativos
a notas obtidas em dois exames por alunos de 6 classes
Cov ( x, y ) e respetivos coeficientes de correlao (Adaptado de
r=
sx sy Rossman, A. J. (1996)):
90 90 90

80 80 80
Exame 2A

Exame 2C
Exame 2B

70 70 70

60 60 60

50 50 50
50 60 70 80 90 50 60 70 80 90 50 60 70 80 90

Exame 1A Exame 1B Exame 1C


90 100 90

90
80 80
Exame 2D

Exame 2F
Exame 2E

80

70 70
70

60 60
60

50 50 50
50 60 70 80 90 50 60 70 80 90 100 50 60 70 80 90

Exame 1D Exame 1E Exame 1F

Casa das Cincias rce.casadasciencias.org 1


Graa Martins, E. (2014), Revista de Cincia Elementar, 2(02):0069
A visualizao dos grficos anteriores leva-nos a supor que fica por explicar (100-49)% do que a explicada
que entre os dois exames se possa admitir o seguinte (100x0,72)%, pelo que um valor de r naquela ordem
tipo de associao: de grandeza corresponde a um relacionamento
moderado.
Forte Moderada Fraca Mais uma vez se chama a ateno para que o coeficiente
Positiva E A B de correlao s mede a intensidade com que duas
Negativa C D F variveis se associam linearmente. Como se verifica
no exemplo seguinte existe uma forte associao
O clculo do coeficiente de correlao, que se apresenta na entre os dados do Exame1 e os dados do Exame2 e no
tabela seguinte, completa a informao da tabela anterior: entanto o coeficiente de correlao vem igual a 0.
105

Classe Correlao 95

85
A 0.71

Exame 2G
75

B 0.47 65

C -0.99 55

D -0.72
45

35

E 0.99 40 50 60 70 80 80 100

Exame 1G
F -0.47 Correlao e relao causa-efeito importante no
confundir associao, medida pelo coeficiente de
Repare-se que apenas nos casos em que | r | muito correlao, com relao causa-efeito. Um diagrama de
elevado faz sentido falar de associao linear forte, disperso e uma correlao no provam a existncia
como observado nos casos C e E em que o grfico de de uma relao causa-efeito. Podem existir outras
disperso aponta para isso. variveis, que no so estudadas, mas influenciam
Num contexto de regresso linear simples, em que a as que esto a ser estudadas e que so conhecidas
varivel explanatria x e a varivel resposta y, o como variveis lurking ou confounding (variveis de
coeficiente de determinao r2 d a percentagem de confundimento).
variabilidade dos ys que fica explicada em funo da O coeficiente de correlao amostral r pode ser usado
variabilidade dos xs. Assim, embora aparentemente para estimar o coeficiente de correlao populacional
um valor de r volta de 0,7 possa parecer elevado, .
na realidade, maior a percentagem de variabilidade
Referncias
1. Murteira, B., Ribeiro, C. S., Silva, J. A., Pimenta, C. (2002) Introduo Estatstica. McGraw-Hill de Portugal, Lda. ISBN: 972-773-
116-3.
2. Rossman, A.J. (1996) - Workshop Statistics: Discovery with data. New York: Springer-Verlag.
3. Pestana, D., Velosa, S. (2010) Introduo Probabilidade e Estatstica, Volume I, 4 edio, Fundao Calouste Gulbenkian. ISBN:
978-972-31-1150-7. Depsito Legal 311132/10.

Autor Editor
Maria Eugnia Graa Martins Jos Francisco Rodrigues
Departamento de Estatstica e Investigao Operacional da Departamento de Matemtica da
Faculdade de Cincias da Universidade de Lisboa Faculdade de Cincias da Universidade de Lisboa

Casa das Cincias rce.casadasciencias.org 2

Das könnte Ihnen auch gefallen