Sie sind auf Seite 1von 6

Regresin lineal

Para otros usos de este trmino, vase Funcin lineal (desambiguacin).

Ejemplo de una regresin lineal con una variable dependiente y una variable independiente.

En estadstica la regresin lineal o ajuste lineal es un modelo matemtico usado para


aproximar la relacin de dependencia entre una variable dependiente Y, las variables
independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:
donde:
: variable dependiente, explicada o regresando.
: variables explicativas, independientes o regresores.
: parmetros, miden la influencia que las variables explicativas tienen sobre el
regrediendo.
donde es la interseccin o trmino "constante", las son los parmetros
respectivos a cada variable independiente, y es el nmero de parmetros
independientes a tener en cuenta en la regresin. La regresin lineal puede ser
contrastada con la regresin no lineal.

ndice
[ocultar]

1Historia

2El modelo de regresin lineal

o 2.1Hiptesis del modelo de regresin lineal clsico

o 2.2Supuestos del modelo de regresin lineal

3Tipos de modelos de regresin lineal

o 3.1Regresin lineal simple

o 3.2Regresin lineal mltiple


o 3.3Rectas de Regresin

4Aplicaciones de la regresin lineal

o 4.1Lneas de tendencia

o 4.2Medicina

o 4.3Informtica

5Vase tambin

6Referencias

o 6.1Bibliografa

o 6.2Enlaces externos

Historia[editar]
La primera forma de regresin lineal documentada fue el mtodo de los mnimos
cuadrados que fue publicada por Legendre en 1805, Gauss public un trabajo en
donde desarrollaba de manera ms profunda el mtodo de los mnimos
cuadrados,1 y en dnde se inclua una versin del teorema de Gauss-Mrkov.
El trmino regresin se utiliz por primera vez en el estudio
de variables antropomtricas: al comparar la estatura de padres e hijos, donde
result que los hijos cuyos padres tenan una estatura muy superior al valor
medio, tendan a igualarse a ste, mientras que aquellos cuyos padres eran muy
bajos tendan a reducir su diferencia respecto a la estatura media; es decir,
"regresaban" al promedio.2 La constatacin emprica de esta propiedad se vio
reforzada ms tarde con la justificacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de tcnicas de regresin,
que emplean modelos basados en cualquier clase de funcin matemtica. Los
modelos lineales son una explicacin simplificada de la realidad, mucho ms
giles y con un soporte terico mucho ms extenso por parte de la matemtica y
la estadstica.
Pero bien, como se ha dicho, se puede usar el trmino lineal para distinguir
modelos basados en cualquier clase de aplicacin.

El modelo de regresin lineal[editar]


El modelo lineal relaciona la variable dependiente Y con K variables explcitas (k
= 1,...K), o cualquier transformacin de stas que generen
un hiperplano de parmetros desconocidos:
(2)
donde es la perturbacin aleatoria que recoge todos aquellos factores de la
realidad no controlables u observables y que por tanto se asocian con el azar, y
es la que confiere al modelo su carcter estocstico. En el caso ms sencillo, con
una sola variable explcita, el hiperplano es una recta:
(3)
El problema de la regresin consiste en elegir unos valores determinados para los
parmetros desconocidos , de modo que la ecuacin quede completamente
especificada. Para ello se necesita un conjunto de observaciones. En una
observacin i-sima (i= 1,... I) cualquiera, se registra el comportamiento
simultneo de la variable dependiente y las variables explcitas (las
perturbaciones aleatorias se suponen no observables).
(4)
Los valores escogidos como estimadores de los parmetros , son
los coeficientes de regresin sin que se pueda garantizar que coincida n con
parmetros reales del proceso generador. Por tanto, en
(5)
Los valores son por su parte estimaciones o errores de la perturbacin aleatoria.
Hiptesis del modelo de regresin lineal clsico [editar]

1. Esperanza matemtica nula: . Para cada valor de X la perturbacin


tomar distintos valores de forma aleatoria, pero no tomar
sistemticamente valores positivos o negativos, sino que se supone tomar
algunos valores mayores que cero y otros menores que cero, de tal forma que su
valor esperado sea cero.

1. Homocedasticidad: para todo t. Todos los trminos de la perturbacin


tienen la misma varianza que es desconocida. La dispersin de cada en
torno a su valor esperado es siempre la misma.

2. Incorrelacin o independencia: para todo t,s con t distinto de s. Las


covarianzas entre las distintas pertubaciones son nulas, lo que quiere
decir que no estn correlacionadas. Esto implica que el valor de la
perturbacin para cualquier observacin muestral no viene influenciado
por los valores de las perturbaciones correspondientes a otras
observaciones muestrales.

3. Regresores estocsticos.

4. Independencia lineal. No existen relaciones lineales exactas entre los


regresores.

5. . Suponemos que no existen errores de especificacin en el modelo, ni


errores de medida en las variables explicativas.

6. Normalidad de las perturbaciones:


Supuestos del modelo de regresin lineal[editar]
Para poder crear un modelo de regresin lineal es necesario que se cumpla con
los siguientes supuestos:3

1. Que la relacin entre las variables sea lineal.


2. Que los errores en la medicin de las variables explicativas sean
independientes entre s.

3. Que los errores tengan varianza constante. (Homocedasticidad)

4. Que los errores tengan una esperanza matemtica igual a cero (los
errores de una misma magnitud y distinto signo son equiprobables).

5. Que el error total sea la suma de todos los errores.

Tipos de modelos de regresin lineal[editar]


Existen diferentes tipos de regresin lineal que se clasifican de acuerdo a sus
parmetros:
Regresin lineal simple[editar]
Slo se maneja una variable independiente, por lo que slo cuenta con
dos parmetros. Son de la forma:4
(6)
donde es el error asociado a la medicin del valor y siguen los supuestos de
modo que (media cero, varianza constante e igual a un y con ).
Dado el modelo de regresin simple anterior, si se calcula la esperanza (valor
esperado) del valor Y, se obtiene:5
(7)
Derivando respecto a y e igualando a cero, se obtiene:5
(9)
(10)
Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la
siguiente solucin para ambos parmetros:4
(11)
(12)
La interpretacin del parmetro medio es que un incremento en Xi de una unidad,
Yi incrementar en
Regresin lineal mltiple[editar]
La regresin lineal permite trabajar con una variable a nivel de intervalo o razn.
De la misma manera, es posible analizar la relacin entre dos o ms variables a
travs de ecuaciones, lo que se denomina regresin mltiple o regresin lineal
mltiple.
Constantemente en la prctica de la investigacin estadstica, se encuentran
variables que de alguna manera estn relacionadas entre s, por lo que es posible
que una de las variables puedan relacionarse matemticamente en funcin de
otra u otras variables.
Maneja varias variables independientes. Cuenta con varios parmetros. Se
expresan de la forma:6
(13)
donde es el error asociado a la medicin del valor y siguen los supuestos de
modo que (media cero, varianza constante e igual a un y con ).
Rectas de Regresin[editar]
Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos
(o tambin llamado diagrama de dispersin) generada por una distribucin
binomial. Matemticamente, son posibles dos rectas de mximo ajuste: 7

La recta de regresin de Y sobre X:


(14)

La recta de regresin de X sobre Y:


(15)
La correlacin ("r") de las rectas determinar la calidad del ajuste. Si r es cercano
o igual a 1, el ajuste ser bueno y las predicciones realizadas a partir del modelo
obtenido sern muy fiables (el modelo obtenido resulta verdaderamente
representativo); si r es cercano o igual a 0, se tratar de un ajuste malo en el que
las predicciones que se realicen a partir del modelo obtenido no sern fiables (el
modelo obtenido no resulta representativo de la realidad). Ambas rectas de
regresin se intersecan en un punto llamado centro de gravedad de
la distribucin.

Aplicaciones de la regresin lineal[editar]


Lneas de tendencia[editar]
Vase tambin: Tendencia

Una lnea de tendencia representa una tendencia en una serie de datos obtenidos
a travs de un largo perodo. Este tipo de lneas puede decirnos si un conjunto de
datos en particular (como por ejemplo, el PIB, el precio del petrleo o el valor de
las acciones) han aumentado o decrementado en un determinado perodo.8 Se
puede dibujar una lnea de tendencia a simple vista fcilmente a partir de un
grupo de puntos, pero su posicin y pendiente se calcula de manera ms precisa
utilizando tcnicas estadsticas como las regresiones lineales. Las lneas de
tendencia son generalmente lneas rectas, aunque algunas variaciones utilizan
polinomios de mayor grado dependiendo de la curvatura deseada en la lnea.
Medicina[editar]
En medicina, las primeras evidencias relacionando la mortalidad con
el fumar tabaco9 vinieron de estudios que utilizaban la regresin lineal. Los
investigadores incluyen una gran cantidad de variables en su anlisis de regresin
en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias.
En el caso del tabaquismo, los investigadores incluyeron el estado socio-
econmico para asegurarse que los efectos de mortalidad por tabaquismo no
sean un efecto de su educacin o posicin econmica. No obstante, es imposible
incluir todas las variables posibles en un estudio de regresin. 10 11 En el ejemplo
del tabaquismo, un hipottico gen podra aumentar la mortalidad y aumentar la
propensin a adquirir enfermedades relacionadas con el consumo de tabaco. Por
esta razn, en la actualidad las pruebas controladas aleatorias son consideradas
mucho ms confiables que los anlisis de regresin.

Das könnte Ihnen auch gefallen