Sie sind auf Seite 1von 3

Coeficiente de determinacin

Ajuste ordinario por mnimos cuadrados. Mientras los puntos no disten mucho de la lnea de la regresin, el coeficiente de determinacin adoptar valores altos.

En estadstica, el coeficiente de determinacin, denominado R2 y pronunciado R cuadrado, es un estadstico usado en el contexto de un modelo estadstico cuyo principal propsito es predecir futuros resultados o testear una hiptesis. El coeficiente determina la calidad del modelo para replicar los resultados, y la proporcin de variacin de los resultados que puede explicarse por el modelo.1 Hay varias definiciones diferentes para R2 que son algunas veces equivalentes. Las ms comunes se refieren a la regresin lineal. En este caso, el R2 es simplemente el cuadrado del coeficiente de correlacin de Pearson, lo cual es slo cierto para la regresin lineal simple. Si existe varios resultados para una nica variable, es decir, para una X existe una Y, Z... el coeficiente de determinacin resulta del cuadrado del coeficiente de determinacin mltiple. En ambos casos el R2 adquiere valores entre 0 y 1. Existen casos dentro de la definicin computacional de R2 donde este valor puede tomar valores negativos2 .
ndice
[ocultar]

1 Clculo

o o

1.1 Caso general 1.2 Para la regresin lineal

2 Modelo lineal 3 Enlaces externos 4 Referencias

Clculo[editar editar cdigo]

Caso general[editar editar cdigo]


Un modelo estadstico se construye para explicar una variable aleatoria que llamaremos dependiente a travs de otras variables aleatorias a las que llamaremos factores. Dado que podemos predecir una variable aleatoria mediante su media y que, en este caso, el error cuadrtico medio es su varianza, el mximo error cuadrtico medio que podemos aceptar en un modelo para una variable aleatoria que posea los dos primeros momentos es la varianza. Para estimar el modelo haremos varias observaciones de la variable a predecir y de los factores. A la diferencia entre el valor observado de la variable y el valor predicho la llamaremos residuo. La media cuadrtica de los residuos es la varianza residual. Si representamos por la varianza de la variable dependiente y la varianza residual por , el

coeficiente de determinacin viene dado por la siguiente ecuacin:

Se mide en tantos por ciento. Si la varianza residual es cero, el modelo explica el 100% de valor de la variable; si coincide con la varianza de la variable dependiente, el modelo no explica nada y el coeficiente de determinacin es del 0%. En variables econmicas y financieras, suele ser difcil conseguir un coeficiente de determinacin mayor de un 30%.

Para la regresin lineal[editar editar cdigo]


Para la regresin basta con hacer el cuadrado del coeficiente de correlacin de Pearson.

Donde:

es la covarianza de es la desviacin tpica de la variable es la desviacin tpica de la variable

Modelo lineal[editar editar cdigo]

En un modelo lineal, la variable dependiente Si observamos

se explica mediante la ecuacin

veces tanto la variable aleatoria como los factores, podemos ordenar nuestras mientras que colocaremos las de los y

observaciones de la variable dependiente en una matriz factores en la matriz de regresin

. Cada observacin corresponder a una coordenada de

a una fila de

. Cada columna de la matriz de regresin corresponde a las observaciones de un

factor. En cada observacin el modelo cometer un error:

Estos errores se llaman residuos. La varianza residual es la varianza de estos residuos.

es la parte de la variacin de es la parte de la variacin de

explicada por el modelo lineal.

que no explica el modelo lineal. .

Sumando estas dos partes, obtenemos

Problema: El valor del coeficiente de determinacin siempre aumenta cuando incluimos nuevas variables en el modelo, incluso cuando stas son poco significativas o tienen poca correlacin con la variable dependiente. Para resolverlo tenemos el coeficiente de determinacin corregido.

Das könnte Ihnen auch gefallen