Sie sind auf Seite 1von 12

Econometría I –VERANO - 2014-III

EPIES-FIECS – Msc. Magen Infante

IX. COEFICIENTE DE DETERMINACIÓN - SUMAS DE CUADRADOS

La variabilidad de los modelos de regresión lineal se mide a través de las sumas de


cuadrados definidas como sigue:

DEFINICIONES

1.- SUMA DE CUADRADOS DEL TOTAL (SCT)


Es la varianza muestral de la variable endógena multiplicada por n. Es una medida del
tamaño de las fluctuaciones de dicha variable alrededor de su valor medio. La SCT es
la suma que el modelo econométrico pretende explicar.

2.- SUMA DE CUADRADOS DE LA REGRESIÓN (SCR)


Es el grado de fluctuación de la variable estimada Yˆ alrededor del promedio Y , donde
Yˆ es la variable generada por el modelo para representar a Y . Es el nivel de
fluctuación de la variable Y que “el modelo es capaz de explicar”. Llamada también
“Suma de Cuadrados Explicada”.

3.- SUMA DE CUADRADOS DEL RESIDUAL (SCE)


Es un indicador del nivel de error del modelo en su intento de explicar Y .

Ejemplo 6: En el caso biviariado, la suma explicada es el grado de fluctuaciones de la


variable Yi que el modelo pretende explicar.

}
Regresión Muestral

{
Yi
(Yi - Yˆi )
(Yi - Y )

}
Yˆi
(Yˆi - Y )
Y

1 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante
(1) Sumas de Cuadrados para modelos con intercepto
1 X 11  X 1k  0 
 
Para un modelo con intercepto Y  Xβ  μ , 1  X 2 k  y .
β   1
X 21
X 
       
   
1 X n1  X nk   k 
SCT  SCR  SCE

donde
n
 11' 
SCT   Yi - Y   Y' I -
2
 Y (forma cuadrática)
i 1  n 
 11' 
SCR   Yˆi - Y   Y'  X(X' X) -1 X'-
n
2
Y
n 
(forma cuadrática)
i 1 


SCE   Yi - Yˆi   Y' I - X(X' X) -1 X' Y 
n
2
(forma cuadrática)
i 1

  Yˆi - Y    Yi - Yˆi 


n n n

 Y -Y 
2 2 2
i
i 1 i 1 i 1

Interpretación

  Yˆ - Y    Y - Yˆ 
n n n

 Yi - Y 
2 2 2
i i i
i 1 i 1 i 1
Fi j o, no depende del Cuanto mayor, mayor es Cuanto menor,
modelo. Puede v erse la diferencia entre Yˆ  Y más motivos para
como la suma de y Yˆ  ˆ0  ˆ1 X1   ˆk X k usar
cuadrados del resíduo X 1 , X 2 , , X k
del modelo Y ˆ Y Reducción en la suma de
cuadrados del resíduo con
la introducción de
X 1 , X 2 , , X k
en el modelo

2 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante

(2) Sumas de Cuadrados para modelos sin intercepto


 X 11  X 1k   1 
X X 2 k 
Para un modelo sin intercepto Y  Xβ  μ ,
X   21
 y β    
    
    k 
 X n1  X nk 

SCTnc  SCRnc  SCE

donde
n
SCTnc   Yi 2  Y' Y (forma cuadrática)
i 1
n
SCRnc   Yˆi 2  Y
ˆ 'Y
ˆ (forma cuadrática)
i 1

SCE   Yi - Yˆi   Y' I - X(X' X) -1 X' Y 


n
2
(forma cuadrática)
i 1

consecuentemente

  Yˆi 2   Yi - Yˆi 


n n n

Y 2 2
i
i 1 i 1 i 1

2
(3) Coeficiente de determinación R
En el MRLC Yi   0  1 X i1     k X ik  i , en su forma matricial
Y  Xβ  μ , es deseable tener alguna medida de que tan bien el modelo de
Regresión realmente se ajusta a las observaciones.

Se quiere responder:

a) Qué tan bien el modelo propuesto, conteniendo las variables explicativas


realmente explican las variaciones en la variable dependiente.

b) Qué tan bien la línea de regresión estimada se acerca a todas las observaciones
juntas.

Observación:
El paso (b) no es lo mismo que decir que la línea de
regresión estimada se acerca a la línea de regresión
poblacional porque ésta última nunca es conocida.

3 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante

Se define al “estadístico de bondad de ajuste del modelo” ó “coeficiente de


SCR SCE
determinación” como R2  1-
SCT SCT

Y, al “coeficiente de correlación múltiple” entre Y y Yˆ como:


SCR SCE
R  1- .
SCT SCT

2
Valores de R cercanos a 1 indica que el modelo explica cercanamente toda la
variabilidad de la variable dependiente alrededor de su valor.
2
Valores de R cercanos a 0 indica que el modelo se ajusta a los datos pobremente.

Como ilustración graficamos los casos extremos en el modelo divariado:

Y R 2
0
Representado por una
Y R2  1
Cuando todos los puntos de
l í n ea es t i m a d a l l a n a
los datos caen exactamente
(pendiente igual a cero).
en la línea estimada

X
X
2
Propiedades de R

a) R  1
2

b) Si el modelo tiene término independiente (  0  0 ), entonces R se puede


2

escribir como:
ˆ ' X ' Y - nY 2 ˆ ' X ' Xˆ - nY 2 SCR
R  2
 ( )
Y ' Y - nY 2
Y ' Y - nY 2
SCT
c) Si el modelo no tiene término independiente (  0  0 ), entonces
SCRnc SCE
R2   1- y puede tomar valores de - 1  R  1 el
2
SCTnc SCTnc
exponente al cuadrado es considerado simplemente rotacional).
d) Cuando R  0 , entonces no tiene sentido el término
2
R2 .
e) Para R  0 se considera que un modelo se ajusta bien a las observaciones si
2

R 2 es cercano a 1 .

4 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante

2
(4) Problemas al utilizar R como bondad de ajuste
R 2 es simple de calcular, intuitivo de entender y provee una amplia indicación del
ajuste del modelo a los datos.
2
Sin embargo, existen algunos problemas con R al utilizarlo como medida de bondad
de ajuste.

2
a) R es definido en términos de variación acerca de la medida de Y tal que si el
2
modelo es reparametrizado y se cambia la variable dependiente, R cambia
aunque el segundo modelo sólo sea un reordenamiento del primer modelo con
2
idéntica SCR . Por eso, R no es sensible a comparar modelos con diferentes
variables dependientes.
2
b) R nunca decrece si se agregan más regresores al modelo aunque aunque la
variable agregada no sea realmente relevante para el modelo. Esta
2
característica de R hace imposible utilizarlo como un determinante de si es
que, dada una variable, debería o no incluirse en el modelo.
2
c) Para regresiones con series de tiempo, con frecuencia, R toma valores de por
2
lo menos 0.9 y por lo tanto, R no es bueno para discriminar entre éstos
2
modelos, ya que la mayoría de éstos tendrán valores altos de R .

2
(5) Coeficiente de determinanción ajustado R como bondad de ajuste
2
Para resolver el ítem b) de los 3 problemas de R antes mencionados, se suele
tomar en cuenta la falta de grados de libertad asociado con la adición de variables al
modelo.
 n -1 
2 2
El R o “ R ajustado” es: R 2  1-  (1 - R 2 )
n - k 

2
Si se agrega un regresor extra al modelo, k se incrementa y R disminuirá siempre,
2
excepto en casos cuando R crezca compensatoriamente.

Observación: No se pueden hacer pruebas


2 2
estadísticas con R y R porque sus
distribuciones de probabilidad no están disponibles.

5 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante

(6) Coeficiente de correlación lineal r de Pearson


Es una medida de “asociación lineal” entre dos variables.

Poblacional Muestral
n

(X i - X )(Yi - Y )

Cov ( X , Y ) r n
i 1
n
  2
X
2
Y (X i - X) 2
 (Y i - Y )2
i 1 i 1
n -1 n -1

Donde, -1  r  1

Características
a) Si r  1 la relación se dice “perfecta positiva”
b) Si r  -1 la relación se dice “perfecta negativa”
c) Si r  0 la relación se dice “correlación positiva no perfecta”
d) Si r  0 la relación se dice “correlación negativa no perfecta”
e) Si r  0 la relación se dice “correlación nula”, pero no implica independencia
lineal.
f) Es simétrica pues rXY  rYX .
g) A r también se le denomina coeficiente de correlación de orden cero.
h) Si X y Y son “estadísticamente independientes”, el coeficiente de correlación
es cero.

Propiedades:
i) Si r  0 , eso no implica independencia entre las variables.
j) Si X y Y son linealmente independientes, el coeficiente de correlación es
cero.
k) r  R
2
es una medida de asociación lineal, es decir, mide la asociación
lineal entre dos variables.
l) A r también se le denomina coeficiente de correlación de orden cero

Perfecta positiva Perfecta negativa Positiva no perfecta

6 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante

Nula Negativa no perfecta

Significación del coeficiente de correlación

Con el valor del coeficiente de correlación, se debería determinar si tal valor muestra
que las variables X e Y están relacionadas en la realidad o el valor obtenido es sólo
producto del azar o la casualidad. En otras palabras, se debe responder la significación
del coeficiente de correlación.

r es significativo si se puede afirmar con una cierta probabilidad que es distinto de


cero.

Hipótesis:

H0 :  X Y  0
 el coeficiente de correlación de la población es cero

HA : XY  0
 el coeficiente de correlación de la población es cero

Estadístico de prueba:
La distribución muestral de una correlación procedente de una población con
correlación igual a cero es una t-student(n-2), con media cero y varianza igual a
1 - rX2 Y
S 
2

n-2
r

7 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante
De la muestra, se calcula el cuantil muestral bajo el supuesto que la hipótesis nula es
verdadera.
rX Y - 0
t
1 - rX2 Y
n-2

Se compara el valor del estadístico muestral con la distribución que tenga un error de
tipo I igual a un alfa elegido (0.05 es el más usual). En otras palabras, comparar el
t ,n -2
estadístico muestral arriba con el cuantil de la distribución

Decisión:

t  t ,n-2
Si Rechaza la hipótesis nula.
t  t ,n-2
Si Acepta la hipótesis nula.

Interpretación:

t  t ,n-2 XY  0
Si La muestra no pertenece a una población con correlación cero ( ).
t  t ,n-2 XY  0
Si La muestra pertenece a una población con correlación cero ( ).

(7) Coeficiente de correlación de orden m


Por orden se entiende el número de índices secundarios, por ejemplo:
r12.4 
Coeficiente de correlación de orden 1 (ó de primer orden).
r12.34  “ “ “ “ 2
r12.345 
“ “ “ “ 3
r12  “ “ “ “ 0

Así, por ejemplo, algunos coeficientes de orden m:

8 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante
r12.3  coeficiente de correlación entre X 1 y X 2 manteniendo ctes
X3 .

r12.34  coeficiente de correlación entre X 1 y X 2 manteniendo ctes


X3 y X4 .

RY 1.23  coeficiente de correlación entre Y y X 1 controlando X 2 y


X3 .

De forma similar se interpretan los demás coeficientes de orden m .

La correlación con una sola variable independiente se llama simple.

La correlación con más de una sola variable independiente se llama múltiple

(8) Coeficiente de correlación múltiple

Es el coeficiente de determinación R2

(9) Coeficiente de correlación semiparcial

La correlación semiparcial en regresión múltiple, en el proceso de inclusión de


variables, busca ver la contribución de los distintos regresores en la explicación de la
variable dependiente.

Hay que verificar si al variables explicativas en el modelo aportan nueva información o


su aportación es pura redundancia. Además, verificar si añaden variabilidad explicada o
si la misma se encuentra en las variables incluidas anteriormente.

Se busca descubrir el incremento ocurrido en R2 cuando se añade una (o varias)


variables.

Por ejemplo, si en un determinado modelo de regresión hemos incluido la variable X1,


la variable X2 y deseamos saber cuánto aporta la variable X3, simplemente se calcula

la diferencia entre la R2 de estas tres variables y la R2 de las dos primeras


variables.

Incremento en R2 cuando se añade la variable X3 (proporción de variación explicada)


R  R
2 2
Y .123 - RY2.12  RY2 ( 3.12)
Incremento en R2 cuando se añaden las variables X3, X4, X5 y X6

9 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante

R 2  RY2.123456 - RY2.12  RY2 ( 3456.12)


Incremento en R2 cuando se añaden las variables X5 y X6
R 2  RY2.123456 - RY2.1234  RY2 ( 56.12)

La raíz cuadrada RY ( 56.12) = rY ( 56.12) se define como coeficiente de correlación


semiparcial

(9) Coeficiente de correlación parcial

Busca conocer la dependencia directa entre dos variables (correlación) controlando el


efecto de las restantes.

r12.34.... p
correlación parcial entre X1 y X2 dadas las variables X3, X4, …., Xp
o
correlación entre X1 y X2 que está libre del efecto del efecto X3, X4, …., Xp

rX 1 X 2 . X 3 , X 4 , X p
correlación parcial entre X1 y X2 dadas las variables X3, X4, …., Xp
o
correlación entre X1 y X2 que está libre del efecto del efecto X3, X4, …., Xp

En general;

1 - R12.234.... p
1- r 2

1 - R12.34.... p
12.34.... p

Propiedad:

Relación entre el coeficiente de correlación múltiple y los diferentes coeficientes de


correlación parcial,

1 - R12.23  (1 - r12
2
) (1 - r13
2
.2 )

1 - R12.234  (1 - r12
2
) (1 - r13
2
.2 ) (1 - r14.23 )
2

1 - R12.2345  (1 - r12
2
) (1 - r13
2
.2 ) (1 - r14.23 )(1 - r15.234 )
2 2

10 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante
1 - R12.234...k  (1 - r12
2
) (1 - r13
2
.2 ) (1 - r14.23 )... (1 - r1k .234...(k -1) )
2 2

La última es una correlación múltiple de orden k-ésimo

rx1 x2 - rx1 x3 rx2 x3


rx21 x2 . x3 
1 - r 1 - r 
2
x1 x3
2
x 2 x3

r12 - r13r23
r122 .3 
1 - r 1 - r 
2
13
2
23

rx1 x2 . x3 - rx1 x4 . x3 rx2 x4 . x3


2

1 - r 1 - r 
rx1 x2 . x3 x4 2 2
x1 x4 . x3 x 2 x 4 . x3

r12.3 - r14.3r24.3
r122 .34 
1 - r 1 - r 
2
14.3
2
24.3

ry2x1 . x2 . x3 x4 ....x p 
r y x1 . x2 . x3 x4 ....x p - ry x2 . x3 x4 ....x p rx1 x2 . x3 x4 ....x p 
2

(1 - ry2x2 . x3 x4 ....x p )(1 - rx21 x2 . x3 x4 ....x p )


ry x1 . x2 . x3 x4 ....x p - ry x2 . x3 x4 ....x p rx1 x2 . x3 x4 ....x p

(1 - ry2x2 . x3 x4 ....x p )(1 - rx21 x2 . x3 x4 ....x p )

r12.34...k -1 - r1k .34...k -1r2 k .34...k -1


r122 .34...k 
(1 - r12k .34...k -1 )(1 - r22k .34...k -1 )

Recordando que:
r1 2 correlación simple entre X1 y X2 (de orden cero)
rY 1 correlación simple entre Y y X1 (de orden cero)
rY 2 correlación simple entre Y y X2 (de orden cero)
11 Magen Infante
Econometría I –VERANO - 2014-III
EPIES-FIECS – Msc. Magen Infante

12 Magen Infante

Das könnte Ihnen auch gefallen