Sie sind auf Seite 1von 7

Transformación de modelos en regresión

Introducción

La técnica de realizar transformaciones a las variables cuando se analizan modelos de regresión lineal,
se utiliza cuando se observa que la relación entre la variable dependiente y la variable independiente no
es lineal (implicando que el modelo lineal simple no es adecuado).

Es frecuente que una vez realizada la transformación, el modelo se reduzca a un modelo de regresión
lineal simple, pudiéndose calcular los coeficientes del modelo, la prueba Anova del modelo, y el
coeficiente de determinación R2 . El estudio de los residuos también es idéntico al caso de regresión
lineal simple.

Cuando se desconoce el tipo de relación entre dos variables, es frecuente analizar diferentes modelos y
escoger aquél que ajusta mejor los datos, para su análisis en profundidad.

Las transformaciones de las variables para linealizar la relación entre dos variables (y en tal caso poder
aplicar el modelo de regresión simple) no son una técnica propia de la estadística ya que se utilizan en
diversas áreas de las matemáticas y sus propiedades fueron estudiadas mucho antes de la aparición de
las técnicas de regresión.

Las transformaciones para estabilizar la varianza fueron desarrolladas a mediados del siglo XX, con la
aparición del método delta, hoy en desuso debido a la aparición de técnicas estadísticas adecuadas para
estos casos. Las transformaciones de Box-Cox fueron introducidas por los matemáticos George Edward
Pelham Box (1919 - ) y David Roxbee Cox (1924 - ) en 1964.

David R. Cox George E. P. Box

1
Fórmulas básicas

Se tienen datos experimentales correspondientes a n individuos de los que se ha recogido información


de dos variables cuantitativas: la variable explicativa Exp y la variable respuesta Rta. Si se puede
asumir que la relación entre estas variables es lineal se puede realizar una regresión lineal simple, en
caso contrario la solución habitual es realizar transformaciones en las variables para “linealizar” la
relación. Otro tipo de incumplimientos de las suposiciones del modelo de regresión como distribución
normal o varianza constante de los errores también pueden hallar solución mediante la transformación
de las variables. Por otro lado, es necesario mencionar que la transformación a realizar debe ser
interpretable.
Modelos transformados
Cuando la variable que se intenta explicar muestra inestabilidad en la varianza (los valores grandes
tienen mayor varianza que los valores pequeños) y se desconoce su distribución, es posible aplicar la
transformación de Box-Cox, método diseñado para hallar la mejor transformación mediante una
potencia o logaritmo de la variable dependiente. Las transformaciones más frecuentes son:

Modelo Expresión
Exponencial y = exp (b 0 + b 1x )
Recíproco-y 1
y=
b0 + b1x
Recíproco-x 1
y = b 0 + b1
x
Recíproca-doble 1 1
= b0 + b1
y x
Logaritmo-x y = b 0 + b1 Ln (x )
Multiplicativo y = b 0 x b1
Raíz cuadrada-x y = b 0 + b1 x
Raíz cuadrada-y y = b 0 + b1 x
Curva en S  1
y = exp  b 0 + b1 
 x

Todas ellas tienen una expresión analizable mediante un modelo de regresión simple utilizando las
variables transformadas. De todas las posibles transformaciones es habitual escoger como la más
adecuada, aquella que presenta un coeficiente de determinación R2 mayor, o bien en función de la
representación gráfica de las variables.

Puede que, a pesar de hacer las transformaciones anteriores no se consiga linealidad en la nube de
puntos. En estos casos, se puede recurrir a modelos de regresión polinómica que son un caso particular
de la regresión multivariante, pero donde sólo se utiliza la variable explicativa original y potencias de
ésta. En los modelos de regresión polinómica, de forma análoga a la regresión lineal simple, existen
coeficientes del modelo, significaciones de éstos y coeficiente R2 del modelo.

2
Ejemplos

Se tienen los siguientes datos experimentales, correspondientes a 12 individuos de los que se ha


recogido información de dos variables cuantitativas: la variable explicativa Exp y la variable respuesta
Rta:

Rta Exp
76 72
80 70
92 68
67 86
69 89
70 85
75 70
86 68
87 70
102 70
98 68
67 80
Calcular los coeficientes y el coeficiente de determinación para cada uno de los siguientes modelos
transformados de regresión: exponencial, recíproco-y, recíproco-x, recíproca doble, logaritmo-x,
multiplicativo, raíz cuadrada-x, raíz cuadrada-y y curva en S.

Modelos Transformados
En los modelos siguientes se denota a la variable explicativa Exp por x y a la variable respuesta por y.

Regresión exponencial
La expresión del modelo es:
y = exp (b 0 + b 1x )
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:
y' = Ln (y )
x' = x
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = b0 '
b1 = b1 '
Para los datos del ejemplo se tiene que:
b 0 = 5.4861
b 1 = −0.0148
y que el coeficiente de determinación R2 = 63.20%.

Regresión recíproco-y
La expresión del modelo es:

3
1
y=
b0 + b1x
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:
1
y' =
y
x' = x
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = b0 '
b1 = b1 '
Para los datos del ejemplo se tiene que:
b 0 = −0.0014
b 1 = 0.0002
y que el coeficiente de determinación R2 = 66.99%.

Regresión recíproco-x
La expresión del modelo es:
1
y = b 0 + b1
x
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:
y' = y
1
x'=
x
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = b0 '
b1 = b1 '
Para los datos del ejemplo se tiene que:
b 0 = −15.8215
b 1 = 7141.1880
y que el coeficiente de determinación R2 = 61.37%.

Regresión recíproca-doble
La expresión del modelo es:
1 1
= b0 + b1
y x
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:

4
1
y' =
y
1
x'=
x
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = b0 '
b1 = b1 '
Para los datos del ejemplo se tiene que:
b 0 = 0.0281
b 1 = −1.1417
y que el coeficiente de determinación R2 = 69.48%.

Regresión logaritmo-x
La expresión del modelo es:
y = b 0 + b1 Ln (x )
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:
y' = y
x' = Ln (x )
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = b0 '
b1 = b1 '
Para los datos del ejemplo se tiene que:
b 0 = 476.6591
b 1 = −91.8994
y que el coeficiente de determinación R2 = 60.25%.

Regresión multiplicativa
La expresión del modelo es:
y = b 0 x b y = b 0 x b1
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:
y' = Ln (y )
x' = Ln (x )
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = eb 0 '

5
b 1 = e b1 '
Para los datos del ejemplo se tiene que:
b 0 = 9.3638
b 1 = −1.1566
y que el coeficiente de determinación R2 = 64.44%.

Regresión raíz cuadrada-x


La expresión del modelo es:
y = b 0 + b1 x
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:
y' = y
x' = x
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = b0 '
b1 = b1 '
Para los datos del ejemplo se tiene que:
b 0 = 260.2890
b 1 = −20.8037
y que el coeficiente de determinación R2 = 59.66%.

Regresión raíz cuadrada-y


La expresión del modelo es:
y = b 0 + b1 x
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:
y' = y
x' = x
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = b0 '
b1 = b1 '
Para los datos del ejemplo se tiene que:
b 0 = 13.8812
b 1 = −0.0659
y que el coeficiente de determinación R2 = 61.17%.

Regresión curva en S
La expresión del modelo es:

6
 1
y = exp  b 0 + b1 
 x
que se puede convertir en una expresión lineal del estilo:
y' = b 0 '+b 1 ' x'
creando las nuevas variables:
y' = Ln ( y)
1
x'=
x
con lo que aplicando el modelo de regresión lineal simple se calcula los coeficientes b0 ’ , b1’ y el
coeficiente de determinación del modelo transformado. Para calcular los coeficientes originales se
hace:
b 0 = b0 '
b1 = b1 '
Para los datos del ejemplo se tiene que:
b 0 = 3.1661
b 1 = 89.8526
y que el coeficiente de determinación R2 = 65.61%.

Das könnte Ihnen auch gefallen