Sie sind auf Seite 1von 3

MEDIDAS DE DEPENDENCIA ESTADSTICA.

TEMA 9
ANLISIS DE LA CORRELACIN

9.1 Medidas de dependencia estadstica y de la correlacin

En el tema 8 se ha visto cmo se puede calcular una recta de regresin cuando se


tienen dos variables que tienen una dependencia estadstica.

Esta recta de regresin permite estimar los valores de la variable dependiente


cuando se conocen los de la variable independiente. Sin embargo, la posibilidad de
realizar estimaciones que permite una regresin, no estara completa si no se conoce la
fiabilidad. Dicha fiabilidad va a depender del grado de relacin o correlacin existente
entre las dos variables, de forma que mientras mayor sea la relacin o correlacin entre
variables ms fiable sern las estimaciones que se puedan realizar a travs de la
regresin.
Por tanto, para completar los objetivos vistos en los dos temas anteriores, es
preciso disponer de unos coeficientes que indiquen el grado de representatividad o
bondad del ajuste de la funcin matemtica ajustada a los datos obtenidos
empricamente durante el proceso estadstico

Existen dos medidas para cuantificar la relacin entre dos variables:

1. Coeficiente de correlacin (r)


2. Coeficiente de determinacin (R2)

Coeficiente de correlacin (r): cuantifica la relacin o correlacin existente entre dos


variables y se define como el cociente entre la covarianza y el producto de las
desviaciones tpicas.
Sxy
r=
Sx . Sy

Su resultado est definido en el intervalo [-1 , +1], as si:


r > 0 Existe una correlacin directa entre variables, es decir las variables se comportan
de la misma manera, ya se aumentando o disminuyendo.
r = 0 No existe correlacin entre las dos variables.
r< 0 Existe una correlacin inversa entre variables, es decir las variables tienen
comportamientos diferentes, si una aumenta la otra disminuye.

Yj Yj
ym r>0 . ym . . r<0
. . .
. .
. . y3
. .
y3
y2 . . . Directa
y2
Inversa
.
y1 . y1 .
x1 x2 x3 .. xn Xi x1 x2 x3 .. xn
Si se representa mediante un segmento los valores del coeficiente de correlacin,
resulta evidente que mientras ms se aproxime el resultado a cero (ausencia de
correlacin), menor ser la relacin entre las dos variables estudiadas. Por el contrario, a
medida que el resultado se aproxime a -1 o +1, la relacin entre variable ser ms
fuerte. Por consiguiente se hace necesario establecer unos lmites o niveles de
significacin (estos lmites son establecidos por el test F-Snedecord en +0,65 para
correlacin directa y -0,65 para correlacin inversa).

-1 -0,65 0 +0,65 +1

Coeficiente de determinacin (R2) : cuantifica la relacin o correlacin existente entre


dos variables y se define como el cociente entre la covarianza al cuadrado y el producto
de las varianzas de ambas variables.
2
Sxy2
R =
Sx2 . Sy2

Su resultado est definido en el intervalo [0 , +1], as si:

R2> 0 Existe correlacin directa entre variables.


R2= 0 No existe correlacin entre las dos variables.

Este coeficiente presenta el inconveniente de que no diferencia por tipo de


correlacin, por lo dems, la interpretacin de sus niveles de significacin resulta
similar al dado para el coeficiente de correlacin.

0 +0,65 +1

Ejemplo: Se ha seleccionado una muestra de 40 hoteles de playa en una localidad


costera. Las variables que se han analizado han sido la categora y el precio de la
habitacin estndar. Calcular los coeficientes de correlacin y de determinacin.

Yj 1 2 3 4 5 n.j yj . n.j yj2 . n.j


25 0 - 50 3 2 - - - 5 125 3125
75 50 - 100 - 5 1 - - 6 450 33750
125 100 - 150 - 2 7 1 - 10 1250 156250
175 150 - 200 - 1 3 8 2 14 2450 428750
225 200 - 250 - - 1 2 2 5 1125 253125
ni. 3 10 12 10 4 40 5400 875000
xi . ni. 3 20 36 44 20 123
xi2 . ni. 3 40 108 176 100 427
xi . ni. 123
x = = = 3,075 estrellas
N 40
yj . n.j 5400
y = = = 135 euros
N 40

xi 2. ni . 427
Sx =2
- x 2 = - 3,075 2 = 1,2 estrellas
N 40

yj 2. n .j 875.000
2
Sy = - y 2 = - 135 2 = 3.650
N 40

( xi . yj). nij
Sxy = - x . y
N
( xi . yj). nij 25.3.1 + 25.2.2 + 75.5.2 + 125.2.2 + 175.1.2 + 75.1.3 + 125.7.3 + 175.3.3
=
N 40
+ 225.1.3 + 125.1.4 + 175.8.4 + 225.2.4 + 175.2.5 + 225.2.5 18.775
= = 469,37
40
40

Sxy = 469,37 3,075 . 135 = 54,25

La varianza de la categora hotelera es de 1,2 estrellas, la de la variable precio de


la habitacin es 3.650 y la covarianza de 54.25.

Sxy 54.25
r= = = 0,82
Sx . Sy 1,09 . 60.41

( 1,09 y 60.41 son respectivamente las desviaciones tpicas de X e Y, es decir las races
cuadradas de sus varianzas).

Sxy2 2943,06
R2 = = = 0,67
Sx2 . Sy2 1,2 . 3650

Das könnte Ihnen auch gefallen