Sie sind auf Seite 1von 5

Regresin lineal

de padres e hijos, donde result que los hijos cuyos padres tenan una estatura muy superior al valor medio, tendan a igualarse a ste, mientras que aquellos cuyos padres
eran muy bajos tendan a reducir su diferencia respecto a
la estatura media; es decir, regresaban al promedio.[2]
La constatacin emprica de esta propiedad se vio reforzada ms tarde con la justicacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de
tcnicas de regresin, que emplean modelos basados en
cualquier clase de funcin matemtica. Los modelos lineales son una explicacin simplicada de la realidad,
mucho ms giles y con un soporte terico mucho ms
extenso por parte de la matemtica y la estadstica.

Ejemplo de una regresin lineal con una variable dependiente y


una variable independiente.

Pero bien, como se ha dicho, se puede usar el trmino


En estadstica la regresin lineal o ajuste lineal es un lineal para distinguir modelos basados en cualquier clase
modelo matemtico usado para aproximar la relacin de aplicacin.
de dependencia entre una variable dependiente Y, las
variables independientes Xi y un trmino aleatorio . Este
modelo puede ser expresado como:

2 El modelo de regresin lineal

Yt = 0 +1 X1 +2 X2 + +p Xp +

El modelo lineal relaciona la variable dependiente Y


con K variables explcitas Xk (k = 1,...K), o cualquier
transformacin de stas que generen un hiperplano de
parmetros k desconocidos:

donde:

Yt

(2) Y =

k Xk +

X1 , X2 , , Xp

donde es la perturbacin aleatoria que recoge todos


aquellos factores de la realidad no controlables u obserdonde 0 es la interseccin o trmino constante, las vables y que por tanto se asocian con el azar, y es la que
i (i > 0) son los parmetros respectivos a cada variable conere al modelo su carcter estocstico. En el caso ms
independiente, y p es el nmero de parmetros indepen- sencillo, con una sola variable explcita, el hiperplano es
dientes a tener en cuenta en la regresin. La regresin una recta:
lineal puede ser contrastada con la regresin no lineal.
(3) Y = 1 + 2 X2 +
0 , 1 , 2 , , p

Historia

El problema de la regresin consiste en elegir unos valores


determinados para los parmetros desconocidos k , de
modo que la ecuacin quede completamente especicada.
Para ello se necesita un conjunto de observaciones. En
una observacin i-sima (i= 1,... I) cualquiera, se registra
el comportamiento simultneo de la variable dependiente
y las variables explcitas (las perturbaciones aleatorias se
suponen no observables).

La primera forma de regresin lineal documentada fue


el mtodo de los mnimos cuadrados que fue publicada
por Legendre en 1805, Gauss public un trabajo en donde
desarrollaba de manera ms profunda el mtodo de los
mnimos cuadrados,[1] y en dnde se inclua una versin
del teorema de Gauss-Mrkov.
El trmino regresin se utiliz por primera vez en el estudio de variables antropomtricas: al comparar la estatura

(4) Yi =
1

k Xki + i

3 TIPOS DE MODELOS DE REGRESIN LINEAL

Los valores escogidos como estimadores de los parmetros k , son los coecientes de regresin sin que se pueda
garantizar que coincida n con parmetros reales del proceso generador. Por tanto, en
(5) Yi =

2. Que los errores en la medicin de las variables explicativas sean independientes entre s.
3. Que los errores tengan varianza constante.
(Homocedasticidad)


k Xki + i

4. Que los errores tengan una esperanza matemtica


igual a cero (los errores de una misma magnitud y
distinto signo son equiprobables).

Los valores i son por su parte estimaciones o errores de


la perturbacin aleatoria.

2.1

5. Que el error total sea la suma de todos los errores.

Hiptesis del modelo de regresin li3


neal clsico

Tipos de modelos de regresin lineal

1. Esperanza matemtica nula: E(i ) = 0 . Para cada valor de X la perturbacin tomar distintos valo- Existen diferentes tipos de regresin lineal que se clasires de forma aleatoria, pero no tomar
can de acuerdo a sus parmetros:
sistemticamente valores positivos o negativos, sino que
se supone tomar algunos valores mayores que cero y 3.1 Regresin lineal simple
otros menores que cero, de tal forma que su valor espeSlo se maneja una variable independiente, por lo que
rado sea cero.
slo cuenta con dos parmetros. Son de la forma:[4]
1. Homocedasticidad: Var(t ) = E(t Et )2 =
(6) Yi = 0 + 1 Xi + i
E2t = 2 para todo t. Todos los trminos de la perturbacin tienen la misma varianza que es desconoXi y
cida. La dispersin de cada t en torno a su valor donde i es el error asociado a la medicin del valor
2
siguen
los
supuestos
de
modo
que

N
(0,

)
(media
i
esperado es siempre la misma.
cero, varianza constante e igual a un y i j con
2. Incorrelacin o independencia: Cov(t , s ) = i = j ).
(t Et )(s Es ) = Et s = 0 para todo t,s Dado el modelo de regresin simple anterior, si se calcula
con t distinto de s. Las covarianzas entre las distin- la esperanza (valor esperado) del valor Y, se obtiene:[5]
tas pertubaciones son nulas, lo que quiere decir que
no estn correlacionadas. Esto implica que el valor
(7) E(yi ) = yi = E(0 ) + E(1 xi ) +
de la perturbacin para cualquier observacin muesE(i )
tral no viene inuenciado por los valores de las perturbaciones correspondientes a otras observaciones
Derivando respecto a 0 y 1 e igualando a cero, se
muestrales.
obtiene:[5]
3. Regresores estocsticos.

2
i yi )
(9) (y
=0
0
4. Independencia lineal. No existen relaciones lineales exactas entre los regresores.

2
i yi )
(10) (y
=0
1

5. T > k + 1 . Suponemos que no existen errores de


especicacin en el modelo, ni errores de medida en
Obteniendo dos ecuaciones denominadas ecuaciones norlas variables explicativas.
males que generan la siguiente solucin para ambos
parmetros:[4]
6. Normalidad de las perturbaciones: N (0, 2 )

2.2

Supuestos del modelo de regresin lineal

Para poder crear un modelo de regresin lineal es necesario que se cumpla con los siguientes supuestos:[3]
1. Que la relacin entre las variables sea lineal.

(11) 1

(x
y)
x)(y
(x
x)2

(12) 0 =

y1
n

x
yn
xy

2
( x)2 n
x

= y 1 x

La interpretacin del parmetro medio 1 es que un incremento en Xi de una unidad, Yi incrementar en 1

4.1

3.2

Lneas de tendencia

Regresin lineal mltiple

La regresin lineal permite trabajar con una variable a


nivel de intervalo o razn. De la misma manera, es posible analizar la relacin entre dos o ms variables a travs
de ecuaciones, lo que se denomina regresin mltiple o
regresin lineal mltiple.
Constantemente en la prctica de la investigacin estadstica, se encuentran variables que de alguna manera estn
relacionadas entre s, por lo que es posible que una de las
variables puedan relacionarse matemticamente en funcin de otra u otras variables.
Maneja varias variables independientes. Cuenta con varios parmetros. Se expresan de la forma:[6]
(13) Yi = 0 +

i Xip + i

donde i es el error asociado a la medicin i del valor


Xip y siguen los supuestos de modo que i N (0, 2 )
(media cero, varianza constante e igual a un y i j
con i = j ).

3.3

Rectas de Regresin

Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos (o tambin llamado diagrama
de dispersin) generada por una distribucin binomial.
Matemticamente, son posibles dos rectas de mximo
ajuste:[7]
La recta de regresin de Y sobre X:
(14) y = y +

xy
2 (x
x

x
)

La recta de regresin de X sobre Y:


(15) x = x
+

xy
y2 (y

y)

La correlacin (r) de las rectas determinar la calidad


del ajuste. Si r es cercano o igual a 1, el ajuste ser bueno
y las predicciones realizadas a partir del modelo obtenido sern muy ables (el modelo obtenido resulta verdaderamente representativo); si r es cercano o igual a 0, se
tratar de un ajuste malo en el que las predicciones que
se realicen a partir del modelo obtenido no sern ables
(el modelo obtenido no resulta representativo de la realidad). Ambas rectas de regresin se intersecan en un punto
llamado centro de gravedad de la distribucin.

Aplicaciones de la regresin lineal

4.1 Lneas de tendencia


Una lnea de tendencia representa una tendencia en una
serie de datos obtenidos a travs de un largo perodo. Este
tipo de lneas puede decirnos si un conjunto de datos en
particular (como por ejemplo, el PBI, el precio del petrleo o el valor de las acciones) han aumentado o decrementado en un determinado perodo.[8] Se puede dibujar una
lnea de tendencia a simple vista fcilmente a partir de un
grupo de puntos, pero su posicin y pendiente se calcula de manera ms precisa utilizando tcnicas estadsticas
como las regresiones lineales. Las lneas de tendencia son
generalmente lneas rectas, aunque algunas variaciones
utilizan polinomios de mayor grado dependiendo de la
curvatura deseada en la lnea.

4.2 Medicina
En medicina, las primeras evidencias relacionando la
mortalidad con el fumar tabaco[9] vinieron de estudios
que utilizaban la regresin lineal. Los investigadores incluyen una gran cantidad de variables en su anlisis de
regresin en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias.
En el caso del tabaquismo, los investigadores incluyeron
el estado socio-econmico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de
su educacin o posicin econmica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresin.[10][11] En el ejemplo del tabaquismo, un
hipottico gen podra aumentar la mortalidad y aumentar
la propensin a adquirir enfermedades relacionadas con
el consumo de tabaco. Por esta razn, en la actualidad las
pruebas controladas aleatorias son consideradas mucho
ms conables que los anlisis de regresin.

4.3 Informtica
Ejemplo de una rutina que utiliza una recta de regresin
lineal para proyectar un valor futuro: Cdigo escrito en
PHP
<?php //Licencia: GNU/GPL $xarray=array(1,
2, 3, 4, 5 ); //Dias $yarray=array(5, 5, 5, 6.8,
9); //Porcentaje de ejecucion $pm=100; //Valor futuro $x2=0; $y=0; $x=0; $xy=0; $cantidad=count($xarray);
for($i=0;$i<$cantidad;$i++){
//Tabla de datos print ($xarray[$i]. ---- ".$yarray[$i]."<br>"); //Calculo de terminos $x2 +=
$xarray[$i]*$xarray[$i]; $y += $yarray[$i]; $x +=
$xarray[$i]; $xy += $xarray[$i]*$yarray[$i]; } //Coeciente parcial de regresion $b=($cantidad*$xy$x*$y)/($cantidad*$x2-$x*$x); //Calculo del intercepto $a=($y-$b*$x)/$cantidad; //Recta tendencial
//y=a+bx //Proyeccion en dias para un 100% de
la ejecucion: if ($b!=0) $dias_proyectados=($pm$a)/$b; else $dias_proyectados=999999; //Innitos

REFERENCIAS

$dp=round($dias_proyectados,0); if($dp<=$pm) print [10] Environmental Tobacco Smoke and Adult Asthma Division of Pulmonary and Critical Care Medicine, Divi$dp."---> Culmina antes de los $pm dias <br>"; if($dp
sion of Occupational and Environmental Medicine; De>$pm) print $dp ."---> ALARMA: No culmina antes de
partment of Medicine, Institute for Health Policy Stulos $pm dias <br>"; ?>

dies; and Department of Epidemiology and Biostatistics,


Universidad de California, San Francisco, California. (en
ingls)

Vase tambin
Homoscedasticidad
Regresin logstica
Modelos de regresin mltiple postulados y no postulados
Regresin segmentada
Econometra
Mnimos cuadrados
Regularizacin de Tikhonov
Cuarteto de Anscombe
Capital Asset Pricing Model
Regresin simple

[11] Efecto del tabaquismo, los sntomas respiratorios y el asma sobre la espirometra de adultos de la Ciudad de Mxico, Justino Regalado-Pineda; Alejandro Gmez-Gmez;
Javier Ramrez-Acosta; Juan Carlos Vzquez-Garca

6.1 Bibliografa
Devore, Jay L.; Probabilidad y Estadstica para Ingeniera y Ciencias. International Thomson Editores.
Mxico. ISBN-10: 9706864571.
Walpole, Ronald E.; Raymond H.; Myers, Sharon L.; Probabilidad y Estadstica para Ingenieros. Pretice-Hall Hispanoamericana, S.A. Mxico.
ISBN-10: 9701702646.
Canavos, George C.; Probabilidad y Estadstica.
Aplicaciones y Mtodos. McGraw-Hill. Mxico.
ISBN-10: 9684518560.

6.2 Enlaces externos


Clculo de regresiones lineales en lnea. (en ingls)

Referencias

[1] C.F. Gauss. Theoria combinationis observationum erroribus minimis obnoxiae. (1821/1823)
[2] Introduction to linear regression Curvet.com (en ingls)
[3] Anlisis de regresin lineal, Universidad Complutense
de Madrid
[4] Frmulas, Probabilidad y Estadstica. Cs. Bsicas.
U.D.B. Matemtica. Universidad Tecnolgica Nacional,
Facultad Regional Buenos Aires. Editorial CEIT-FRBA.
(Cdigo BM2BT2)
[5] Modelo de regresin lineal simple. EinsteinNet.
[6] Tcnicas de regresin: Regresin Lineal Mltiple. Prtega
Daz, S., Pita Fernndez, S. Unidad de Epidemiologa Clnica y Bioestadstica. Complejo Hospitalario de La Corua (Espaa)
[7] Apunte sobre Rectas de regresin. Ministerio de Educacin y Ciencia. Gobierno de Espaa.
[8] Utilizacin de las lneas de tendencia, Paritech (en ingls)
[9] Doll R, Peto r, Wheatley K, Gray R et al. Mortality in relation to smoking: 40 years observations on male British
doctors .BMJ 1994;309:901-911 (8 de octubre]

ZunZun.com Ajuste de curvas y supercies en lnea.


(en ingls)
xuru.org Herramientas de regresin lineal en lnea.
(en ingls)
Simulacin de la recta de regresin de una variable
bidimensional continua con R (lenguaje de programacin)

Origen del texto y las imgenes, colaboradores y licencias

7.1

Texto

Regresin lineal Fuente: https://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal?oldid=93067398 Colaboradores: Joseaperez, JorgeGG,


Riviera, Elwikipedista, Tano4595, Felipealvarez, Magister Mathematicae, Alhen, BOT-Superzerocool, Vitamine, Gaeddal, GermanX, Baneld, BOTpolicia, CEM-bot, Daniel De Leon Martinez, Laura Fiorucci, Marianov, Roberpl, Davius, Antur, Gafotas, Ggenellina, Ingenioso
Hidalgo, Thijs!bot, Alvaro qc, Xabier, Diego D E, Yeza, Gusgus, JAnDbot, Kved, Rjgalindo, TXiKiBoT, Juan renombrado, Hlnodovic,
Dhcp, Marvelshine, Alesico, Icchu, Snakeeater, VolkovBot, Technopat, Matdrodes, Muro Bot, PaintBot, Drinibot, Pacomegia, Correogsk,
Tirithel, Dnu72, HUB, Antn Francho, Carro e, Botito777, Alexbot, Juan Mayordomo, Raulshc, Hucknall, UA31, Chomolungma, AVBOT,
MastiBot, HanPritcher, NjardarBot, Diegusjaimes, DrFO.Tn.Bot~eswiki, Andreasmperu, Luckas-bot, Madmaxsrx, Jcoronelf, El Quinche,
FariBOT, Sergiportero, Mcapdevila, SuperBraulio13, Jkbw, Botarel, BOTirithel, TiriBOT, Blinski, TorQue Astur, Rouxfederico, PatruBOT, AldanaN, Humbefa, Ivanpares, EmausBot, Sergio Andres Segovia, ConPermiso, Gecime, Alfonso Aguilar, Fbport, MerlIwBot,
Acratta, Johnbot, Elvisor, Maria Antonia Aguilar C., Balles2601, Daniol, Ks-M9 y Annimos: 132

7.2

Imgenes

Archivo:Artculo_bueno.svg Fuente: https://upload.wikimedia.org/wikipedia/commons/e/e5/Art%C3%ADculo_bueno.svg Licencia:


Public domain Colaboradores: Circle taken from Image:Symbol support vote.svg Artista original: Paintman y Chabacano
Archivo:Linear_regression.svg Fuente: https://upload.wikimedia.org/wikipedia/commons/3/3a/Linear_regression.svg Licencia: Public
domain Colaboradores: Trabajo propio Artista original: Sewaqu

7.3

Licencia del contenido

Creative Commons Attribution-Share Alike 3.0

Das könnte Ihnen auch gefallen