Sie sind auf Seite 1von 4

Pgina 1 de 4

U.C. Estadstica

Coeficiente de Correlacin de Pearson

Hasta el momento nos hemos preocupado por realizar anlisis a una variable en forma aislada haciendo
observaciones en cada componente del conjunto de datos (muestra o poblacin); pero es importante hacer notar
que en muchas oportunidades es importante examinar la relacin que existen entre dos variables que se asocian,
como en realidad pasa en el campo educativo.

La correlacin es una medida de relacin entre dos o ms variable, la cual nos indica hasta qu punto lo que
sucede en una serie de datos de un grupo de sujetos, ocurre con otra serie de datos al mismo punto. El valor de
relacin se va a representar en forma cuantitativa mediante el clculo del coeficiente de correlacin.

Los coeficientes de correlacin son numerosos, y aunque son semejantes en cuanto a su funcin, se diferencian
por el tipo de variable a las que son aplicables o ms apropiados y por la forma de clculo.

En un coeficiente de correlacin existen, dos componentes: El primero es un componente direccional que
representa la tendencia de la relacin de las posiciones relativas de las dos variables para un conjunto de
individuos u objetos. La correlacin pude ser positiva o negativa. Una correlacin positiva indica que los sujetos
generalmente mantienen la misma posicin relativa para ambas variables, esto quiere decir, que lo que sucede en
una variable tambin ocurre en la otra.


Diagrama de dispersin.
Diagrama de dispersin, grfico estadstico en el que se representan sobre unos ejes cartesianos los puntos de
una distribucin bidimensional.
A cada individuo de la distribucin bidimensional le corresponden dos valores, x
i
, y
i
, que tomados
respectivamente como abscisa y ordenada dan lugar al punto (x
i
, yi). De este modo, a cada individuo le
corresponde un punto y todos ellos dan lugar a una nube de puntos o diagrama de dispersin:


La forma que presenta esta nube de puntos refleja el grado de correlacin entre las dos variables.


Clculo del Coeficiente de Variacin de Pearson.
De los diversos coeficientes de correlacin que existen, el ms utilizado es el de Pearson, cuyo smbolo es r.
Normalmente se encuentra r
xy
donde los subndices indican que la correlacin analizada es entre las variables
X e Y.

A este coeficiente de correlacin se le conoce igualmente como producto-momento de Pearson y se define
como una medida de asociacin de la lnea recta entre X e Y. En la medida que el diagrama de dispersin tenga
una tendencia en lnea recta de sus puntos, entonces r
xy
es el nico procedimiento de correlacin que se deba
usar y el que ms se presentar para los clculos.

El clculo del coeficiente de correlacin de Pearson puede hacerse mediante la tipicacin de las puntuaciones, a
partir de las desviaciones con respecto a la media, mediante al clculo directo a partir de puntuaciones brutas y
Pgina 2 de 4

utilizando el mtodo de las diferencias. Sin embargo el ms directo es el que corresponde al clculo a partir de
Puntuaciones Brutas, cuya frmula correspondiente es la siguiente:


( ) ( )
( ) ( )
(



=
2 2
*
2 2
* *
Y Y N X X N
Y X Y X N
xy
r


cuyo resultado o valor generado una vez de ejecutadas las operaciones aritmticas, vara entre [-1,1], lo que
quiere decir que el mximo valor que puede tomar es 1 y el mnimo valor que puede tomas es -1, por lo tanto
nunca encontraremos un valor de coeficiente mayor que 1 y menor que -1.


Interpretacin del resultado del Coeficiente de Correlacin.

Valor Obtenido Anlisis
0.00 a 0.20 Despreciable
0.21 a 0.40 Existente pero baja
0.41 a 0.70 Sustancial
0.71 a 1.00 Alta
Fuente: Estadstica II
Universidad Simn Rodrguez


Valor Obtenido Anlisis
< 0.20 Insignificativa (muy poca relacin)
0.20 a 0.40 Correlacin baja (Relacin muy dbil)
0.40 a 0.70 Moderada (Relacin significativa)
0.70 a 0.90 Alta (Relacin fuerte)
0.90 a 1.00 Muy alta (Relacin Casi Perfecta)
Fuente: Estadstica General
UPEL-IMPM


Ejemplo:
A continuacin se presenta las puntuaciones alcanzadas por diez alumnos de dos tests diferentes. Calcule el
coeficiente de correlacin de Pearson e interprete los resultados.

Test 1 (x) 8 6 14 8 15 2 9 7 10 9
Test 2 (y) 7 4 14 8 12 4 4 8 9 10

Procedimientos
1.- Realizamos el Diagrama de Dispersin: Para ello ubicamos en el eje de las abscisas (X) al test 1 y en el eje
de las ordenadas (Y) al test 2.






Pgina 3 de 4

1. a.- Ubicamos la primera calificacin en la intercepcin que corresponda entre X y Y. Ejemplo. La primera
calificacin en X es igual a 8, y la de Y es igual a 7, por lo tanto ubicamos a 8 en el eje de las abscisas y subimos
hacia Y en forma paralela hasta estar linealmente en Y=7.

1. b.- Y as sucesivamente para las 10 observaciones.

















2.- Ahora observamos si los puntos del diagrama tienden a tener un comportamiento lineal.
3.- Ahora sumamos todos los puntajes de las variables X y Y, por separado. (X e Y)
4.- Eleva al cuadrado cada uno de los puntajes de la variable X y smalos. (X*X)
5.- Eleva al cuadrado cada uno de los puntajes de la variable y smalos. (Y*Y)
6.- Multiplica los puntajes de la variable X por los puntajes de la variable Y, y smalos. (X*Y)
7.- De esta manera se obtiene el siguiente cuadro.

X Y X*Y X*X Y*Y
8 7 56 64 49
6 4 24 36 16
14 14 196 196 196
8 8 64 64 64
15 12 180 225 144
2 4 8 4 16
9 4 36 81 16
7 8 56 49 64
10 9 90 100 81
9 10 90 81 100
88 80 800 900 746



8.- Ahora sustituimos cada una de las sumatorias en la frmula, y realice las operaciones aritmticas
correspondientes.

La sumatoria de las X = 88
La sumatoria de las Y = 80
La sumatoria de X * Y = 800
La sumatoria de la X
2
= 900
La sumatoria de la Y
2
= 746


Diagrama de Dispersin
0
2
4
6
8
10
12
14
16
0 5 10 15 20
Test 1
T
e
s
t

2
Serie1
Pgina 4 de 4



( ) ( )
( ) ( )
(



=
2 2
*
2 2
* *
Y Y N X X N
Y X Y X N
xy
r
( ) ( ) ( )
( ) ( ) ( )
(

=
2
80 746 10 *
2
88 900 10
80 * 88 800 10
xy
r



( ) ( ) 6400 7460 * 7744 9000
7040 8000

=
xy
r
( ) ( ) 1060 * 1256
960
=
xy
r
1331360
960
=
xy
r



85 , 1153
960
=
xy
r 83 , 0 =
xy
r


Interpretacin: Un coeficiente de correlacin con el valor obtenido nos indica que existe una fuerte correlacin
positiva entre las notas alcanzadas en ambos test. Lo cual se puede interpretar de la siguiente manera: En la
medida en que las puntuaciones de un test, ejemplo test 1 aumentan, las puntuaciones del otro test tambin
aumentarn, en lneas generales esto nos indica que las personas que obtuvieron altas puntuaciones en uno de
los test tambin lo obtuvieron en el otro.