Sie sind auf Seite 1von 16

Universidad autnoma del Carmen

UNIVERSIDAD AUTNOMA DEL CARMEN


Facultad de Ciencias Qumicas y Petrolera
Por la grandeza de Mxico

CORRELACIN DE PEARSON

P R E S E N T AN
Alicia Mariely Bojrquez Hernndez
Ernesto Snchez Soberane

PROGRAMA EDUCATIVO
Licenciatura en Ingeniera Petrolera

CURSO
Probabilidad y estadstica

DOCENTE
M.I.I Elda Noelia Robles

CD. DEL CARMEN, CAMPECHE


30 DE OCTUBRE DEL 2017
Universidad autnoma del Carmen

INTRODUCCIN
Antes de introducirnos en el modelo de regresin lineal, que hace referencia a
la naturaleza de la relacin entre distintas variables, pasaremos a exponer el
estadstico utilizado para medir la magnitud de la relacin (supuestamente
lineal) entre dichas variables. Tiene sentido darle un tratamiento aparte por su
importancia y las continuas referencias que ofreceremos a lo largo de este
texto. Comenzaremos su desarrollo, por razones de simplicidad, para el caso
particular de dos variables.

Uno de los objetivos principales de la ciencia consiste en descubrir


las relaciones entre variables, y la estadstica ha desarrollado instrumentos
para ello. La observacin de relaciones claras y estables entre variables ayuda
a comprender los fenmenos y a encontrar explicaciones de los mismos e
indica las vas probablemente ms eficaces para intervenir sobre las
situaciones.

La correlacin es una tcnica estadstica usada para determinar la relacin


entre dos o ms variables.

Un diagrama de dispersin se emplea cuando existe un variable que est bajo


el control del experimentador.

El primer paso para analizar una serie de tiempo es graficarla, esto permite:
identificar la tendencia, la estacionalidad, las variaciones irregulares
(componente aleatorio).

A diferencia de la covarianza, la correlacin de Pearson es independiente de la


escala de medida de las variables. Esta correlacin mide la relacin lineal entre
dos variables aleatorias cuantitativas.
Universidad autnoma del Carmen

CORRELACIN DE PEARSON
El coeficiente de correlacin de Pearson, pensado para variables cuantitativas
(escala mnima de intervalo), es un ndice que mide el grado de covariacin
entre distintas variables relacionadas linealmente. Advirtase que decimos
"variables relacionadas linealmente". Esto significa que puede haber variables
fuertemente relacionadas, pero no de forma lineal, en cuyo caso no proceder a
aplicarse la correlacin de Pearson. Por ejemplo, la relacin entre la ansiedad y
el rendimiento tiene forma de U invertida; igualmente, si relacionamos
poblacin y tiempo la relacin ser de forma exponencial. En estos casos (y en
otros muchos) no es conveniente utilizar la correlacin de Pearson. Insistimos
en este punto, que parece olvidarse con cierta frecuencia.

El coeficiente de correlacin de Pearson es un ndice de fcil ejecucin e,


igualmente, de fcil interpretacin. Digamos, en primera instancia, que sus
valores absolutos oscilan entre 0 y 1. Esto es, si tenemos dos variables X e Y, y
definimos el coeficiente de correlacin de Pearson entre estas dos variables
como rxy entonces:

Hemos especificado los trminos "valores absolutos" ya que en realidad si se


contempla el signo el coeficiente de correlacin de Pearson oscila entre 1 y
+1. No obstante ha de indicarse que la magnitud de la relacin viene
especificada por el valor numrico del coeficiente, reflejando el signo la
direccin de tal valor. En este sentido, tan fuerte es una relacin de +1 como de
-1. En el primer caso la relacin es perfecta positiva y en el segundo perfecta
negativa. Pasamos a continuacin a desarrollar algo ms estos conceptos.

Como ya se mencion, la relacin puede ser positiva o negativa.


Si el resultado es positivo, se dice que hay una relacin positiva o directa entre
las variables (a mayor x mayor y).

Si el resultado es negativo, se dice que hay una relacin negativa o inversa


entre las variables (a mayor x menor y).

Para interpretar el coeficiente de correlacin se utiliza la siguiente escala.


Universidad autnoma del Carmen

Valor Significado
-1 Correlacin negativa grande y perfecta
-0.9 a -0.99 Correlacin negativa muy alta
-0.7 a -0.89 Correlacin negativa alta
-0.4 a -0.69 Correlacin negativa moderada
-0.2 a -0.39 Correlacin negativa baja
-0.01 a -0.19 Correlacin negativa muy baja
0 Correlacin nula
0.01 a 0.19 Correlacin positiva muy baja
0.2 a 0.39 Correlacin positiva baja
0.4 a 0.69 Correlacin positiva moderada
0.7 a 0.89 Correlacin positiva alta
0.9 a 0.99 Correlacin positiva muy alta
1 Correlacin positiva grande y perfecta

Decimos que la correlacin entre dos variables X e Y es perfecta positiva


cuando exactamente en la medida que aumenta una de ellas aumenta la otra.
Esto sucede cuando la relacin entre ambas variables es funcionalmente
exacta.

Difcilmente ocurrir en psicologa, pero es frecuente en las ciencias fsicas


donde los fenmenos se ajustan a leyes conocidas, Por ejemplo, la relacin
entre espacio y tiempo para un mvil que se desplaza a velocidad constante.
Grficamente la relacin ser del tipo:
Universidad autnoma del Carmen

Se dice que la relacin es perfecta negativa cuando exactamente en la medida


que aumenta una variable disminuye la otra. Igual que en el caso anterior esto
sucede para relaciones funcionales exactas, propio de las ciencias fsicas. Por
ejemplo, la relacin entre presin y volumen se ajusta a este caso. El grfico
que muestra la relacin sera del tipo:
Universidad autnoma del Carmen

DATOS NO AGRUPADOS

El coeficiente de correlacin de Pearson viene definido por la siguiente


expresin para datos no agrupados:

( ) ( )( )
( ( ) ( ) ) ( ( ) ( ) )

Esto es, el coeficiente de correlacin de Pearson hace referencia a la media de


los productos cruzados de las puntuaciones estandarizadas de X y de Y. Esta
frmula rene algunas propiedades que la hacen preferible a otras. A operar
con puntuaciones estandarizadas es un ndice libre de escala de medida. Por
otro lado, su valor oscila, como ya se ha indicado, en trminos absolutos, entre
0 y 1.

Tngase en cuenta que las puntuaciones estandarizadas muestran,


precisamente, la posicin en desviaciones tipo de un individuo respecto a su
media. Reflejan la medida en que dicho individuo se separa de la media. En
este sentido, supongamos que para cada individuo tomamos dos medidas en X
e Y. La correlacin entre estas dos variables ser perfecta positiva cuando
cada individuo manifieste la misma superioridad o inferioridad en cada una de
ellas. Esto se cumple cuando su posicin relativa sea la misma, es decir,
cuando sus puntuaciones tipo sean iguales (Zx = Zy).

Ejemplo de datos no agrupados:

Tengamos las siguientes puntuaciones en las variables X (inteligencia) e Y


(rendimiento acadmico):

X 105 116 103 124 137 126 112 129 118 105
Y 4 8 2 7 9 9 3 10 7 6

Calcular el coeficiente de correlacin de Pearson.

Solucin:

Antes de calcular el coeficiente de correlacin de Pearson hemos de


comprobar si existe una tendencia lineal en la relacin. Aunque ms adelante
ofreceremos procedimientos analticos que permitan verificar con exactitud la
Hiptesis de linealidad, por el momento, recurriremos a procedimientos
grficos, que en una primera instancia, pueden resultar suficientes:
Universidad autnoma del Carmen

12

10

8
Varibale Y

0
0 20 40 60 80 100 120 140 160
Variable x

Se observa la existencia de una cierta tendencia lineal en la relacin. Podemos,


en consecuencia, proceder a calcular el coeficiente de correlacin de Pearson.

Aplicando la formula anteriormente mencionada:

( ) ( )( )
( ( ) ( ) ) ( ( ) ( ) )

Configuremos la siguiente tabla:


Universidad autnoma del Carmen

X Y X2 Y2 XY
105 4 11025 16 420
116 8 13456 64 928
103 2 10609 4 206
124 7 15376 49 868
137 9 18769 81 1233
126 9 15876 81 1134
112 3 12544 9 336
129 10 16641 100 1290
118 7 13924 49 826
105 6 11025 36 630
1175 65 139245 489 7871

Sustituyendo los valores tenemos:

( ) ( )( )
( ( ) ( ) ) ( ( ) ( ) )

Ejercicio para datos no agrupados

Hallar lo que se te pide de los siguientes datos.

X 6 4 8 9 4 8 10 9 5 6
Y 5 5 7 5 3 8 10 8 7 6

a) Hallar la correlacin de Pearson


b) Configurar la tabla
c) Comprobar con una grfica la linealidad del problema
Universidad autnoma del Carmen

Frmula a utilizar:

( ) ( )( )
( ( ) ( ) ) ( ( ) ( ) )

Posteriormente configuraremos la tabla respecto a x, y.

X Y x *fi y *fi Xi*Fi*fi

6 5 36 25 30
4 5 16 25 20
8 7 64 49 56
9 5 81 25 45
4 3 16 9 12
8 8 64 64 64
10 10 100 100 100
9 8 81 64 72
5 7 25 49 35
6 6 36 36 36
Total=69 Total=64 Total=519 Total=446 Total=470

Sustituyendo los datos obtenidos de la tabla a la formula tenemos que:

( ) ( )( )
( ( ) ( ) ) ( ( ) ( ) )
Universidad autnoma del Carmen

Y
12

10

6
Y

0
0 2 4 6 8 10 12
Universidad autnoma del Carmen

DATOS AGRUPADOS
El coeficiente de correlacin de Pearson viene definido por la siguiente
expresin para datos agrupados:
.

( )( )

[( ( ) ) ( ( ) ]

Ejemplo para datos agrupados:

En la siguiente tabla se muestran los siguientes datos, calcule su coeficiente de


Pearson.

X Y f
1 10 2
1 20 3
1 30 3
2 10 3
2 20 5
2 30 6
3 10 2
3 20 7
3 30 8

Solucin:

1.- Se utilizara la siguiente frmula para calcular el coeficiente de Pearson.

( )( )

[( ( ) ) ( ( ) ]

2.- Se calcularan los siguientes datos para posteriormente sustituirlos en la


formula.
Universidad autnoma del Carmen

X Y f X.f X2.f Y.f Y2.f X.Y.f


1 10 2 2 2 20 200 20
1 20 3 3 3 60 1200 60
1 30 3 3 3 90 2700 90
2 10 3 6 12 30 300 60
2 20 5 10 20 100 2000 200
2 30 6 12 24 180 5400 360
3 10 2 6 18 20 200 60
3 20 7 21 63 140 2800 420
3 30 8 24 72 240 7200 720
39 87 217 880 22000 1990

3.- Se sustituirn ciertos valores de la tabla (sumatorias) en la formula.

( ) ( )( )
[( ( ) ( ) ) ( ( ) ( ) )]

( ) ( )

Correlacin positiva muy baja


Universidad autnoma del Carmen

Ejercicio para datos agrupados:

En la siguiente tabla se muestran los siguientes datos, calcule su coeficiente de


Pearson.

X Y f
5 10 2
3 20 2
6 25 8
1 15 4
4 30 5
2 18 6
5 22 7
3 30 7

Solucin:

1.- Se utilizara la siguiente frmula para calcular el coeficiente de Pearson.

( )( )

[( ( ) ) ( ( ) ]

2.- Se calcularan los siguientes datos para posteriormente sustituirlos en la


formula.

X Y f X.f X2.f Y.f Y2.f X.Y.f


5 10 2 10 50 20 200 100
3 20 2 6 18 40 800 120
6 25 8 48 288 200 5000 1200
1 15 4 4 4 60 900 60
4 30 5 20 80 150 4500 600
2 18 6 12 24 108 1944 216
5 22 7 35 175 154 3388 770
3 30 7 21 63 210 6300 630
41 156 702 942 23032 3696
Universidad autnoma del Carmen

3.- Se sustituirn ciertos valores de la tabla (sumatorias) en la formula.

( ) ( )( )
[( ( ) ( ) ) ( ( ) ( ) )]

( ) ( )

Correlacin positiva baja


Universidad autnoma del Carmen

CONCLUSIN
La correlacin es la medicin que existe entre dos variables (cuantitativas).

Para determinar si existe relacin entre dos variables cuantitativas se tiene dos
opciones:

Forma grfica
Forma analtica.

Para la forma grfica se utiliza el diagrama de dispersin o tambin llamada


nube de puntos, pero nuestro tema a investigar fue la correlacin de Pearson.

El coeficiente de correlacin de Pearson se utiliza para saber si hay relacin


entre dos variables (dependiente e independiente) pero siempre y cuando las
variables sean cuantitativas.

Se dice que s hay relacin cuando cambian los valores de las dos variables y
no existe relacin cuando el valor de una cambia mientras que la otra no.

Al momento de calcular la correlacin de Pearson, esta no puede ser mayor a 1


y de igual forma se mencion que la relacin puede ser positiva o negativa.
Si el resultado es positivo, se dice que hay una relacin directa pero si el
resultado es negativo nos indica que la relacin es inversa.

Despus de obtener el coeficiente se procede a interpretar dicho coeficiente


con la escala mencionada anteriormente.
Universidad autnoma del Carmen

BIBLIOGRAFA
https://www.youtube.com/watch?v=sr_IUvCWxis

https://es.slideshare.net/GeraldineRegges/trabajo-de-correlacion

http://webcache.googleusercontent.com/search?q=cache:http://www.ugr.
es/~analisisdedatos/exposiciones/Tema11.ppt&gws_rd=cr&dcr=0&ei=D
HfxWeLKIciqjwOOz6fwAg

http://images.slideplayer.es/20/6141519/slides/slide_7.jpg

https://www.youtube.com/watch?v=FS2xpTq5t38
https://www.youtube.com/watch?v=sHnlliBWUpg

https://personal.us.es/vararey/adatos2/correlacion.pdf

Das könnte Ihnen auch gefallen