Beruflich Dokumente
Kultur Dokumente
de padres e hijos, donde result que los hijos cuyos padres tenan una estatura muy superior al valor medio, tendan a igualarse a ste, mientras que aquellos cuyos padres
eran muy bajos tendan a reducir su diferencia respecto a
la estatura media; es decir, regresaban al promedio.[2]
La constatacin emprica de esta propiedad se vio reforzada ms tarde con la justicacin terica de ese fenmeno.
El trmino lineal se emplea para distinguirlo del resto de
tcnicas de regresin, que emplean modelos basados en
cualquier clase de funcin matemtica. Los modelos lineales son una explicacin simplicada de la realidad,
mucho ms giles y con un soporte terico mucho ms
extenso por parte de la matemtica y la estadstica.
Yt = 0 +1 X1 +2 X2 + +p Xp +
donde:
Yt
(2) Y =
k Xk +
X1 , X2 , , Xp
Historia
(4) Yi =
1
k Xki + i
Los valores escogidos como estimadores de los parmetros k , son los coecientes de regresin sin que se pueda
garantizar que coincida n con parmetros reales del proceso generador. Por tanto, en
(5) Yi =
2. Que los errores en la medicin de las variables explicativas sean independientes entre s.
3. Que los errores tengan varianza constante.
(Homocedasticidad)
k Xki + i
2.1
1. Esperanza matemtica nula: E(i ) = 0 . Para cada valor de X la perturbacin tomar distintos valo- Existen diferentes tipos de regresin lineal que se clasires de forma aleatoria, pero no tomar
can de acuerdo a sus parmetros:
sistemticamente valores positivos o negativos, sino que
se supone tomar algunos valores mayores que cero y 3.1 Regresin lineal simple
otros menores que cero, de tal forma que su valor espeSlo se maneja una variable independiente, por lo que
rado sea cero.
slo cuenta con dos parmetros. Son de la forma:[4]
1. Homocedasticidad: Var(t ) = E(t Et )2 =
(6) Yi = 0 + 1 Xi + i
E2t = 2 para todo t. Todos los trminos de la perturbacin tienen la misma varianza que es desconoXi y
cida. La dispersin de cada t en torno a su valor donde i es el error asociado a la medicin del valor
2
siguen
los
supuestos
de
modo
que
N
(0,
)
(media
i
esperado es siempre la misma.
cero, varianza constante e igual a un y i j con
2. Incorrelacin o independencia: Cov(t , s ) = i = j ).
(t Et )(s Es ) = Et s = 0 para todo t,s Dado el modelo de regresin simple anterior, si se calcula
con t distinto de s. Las covarianzas entre las distin- la esperanza (valor esperado) del valor Y, se obtiene:[5]
tas pertubaciones son nulas, lo que quiere decir que
no estn correlacionadas. Esto implica que el valor
(7) E(yi ) = yi = E(0 ) + E(1 xi ) +
de la perturbacin para cualquier observacin muesE(i )
tral no viene inuenciado por los valores de las perturbaciones correspondientes a otras observaciones
Derivando respecto a 0 y 1 e igualando a cero, se
muestrales.
obtiene:[5]
3. Regresores estocsticos.
2
i yi )
(9) (y
=0
0
4. Independencia lineal. No existen relaciones lineales exactas entre los regresores.
2
i yi )
(10) (y
=0
1
2.2
Para poder crear un modelo de regresin lineal es necesario que se cumpla con los siguientes supuestos:[3]
1. Que la relacin entre las variables sea lineal.
(11) 1
(x
y)
x)(y
(x
x)2
(12) 0 =
y1
n
x
yn
xy
2
( x)2 n
x
= y 1 x
4.1
3.2
Lneas de tendencia
i Xip + i
3.3
Rectas de Regresin
Las rectas de regresin son las rectas que mejor se ajustan a la nube de puntos (o tambin llamado diagrama
de dispersin) generada por una distribucin binomial.
Matemticamente, son posibles dos rectas de mximo
ajuste:[7]
La recta de regresin de Y sobre X:
(14) y = y +
xy
2 (x
x
x
)
xy
y2 (y
y)
4.2 Medicina
En medicina, las primeras evidencias relacionando la
mortalidad con el fumar tabaco[9] vinieron de estudios
que utilizaban la regresin lineal. Los investigadores incluyen una gran cantidad de variables en su anlisis de
regresin en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias.
En el caso del tabaquismo, los investigadores incluyeron
el estado socio-econmico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de
su educacin o posicin econmica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresin.[10][11] En el ejemplo del tabaquismo, un
hipottico gen podra aumentar la mortalidad y aumentar
la propensin a adquirir enfermedades relacionadas con
el consumo de tabaco. Por esta razn, en la actualidad las
pruebas controladas aleatorias son consideradas mucho
ms conables que los anlisis de regresin.
4.3 Informtica
Ejemplo de una rutina que utiliza una recta de regresin
lineal para proyectar un valor futuro: Cdigo escrito en
PHP
<?php //Licencia: GNU/GPL $xarray=array(1,
2, 3, 4, 5 ); //Dias $yarray=array(5, 5, 5, 6.8,
9); //Porcentaje de ejecucion $pm=100; //Valor futuro $x2=0; $y=0; $x=0; $xy=0; $cantidad=count($xarray);
for($i=0;$i<$cantidad;$i++){
//Tabla de datos print ($xarray[$i]. ---- ".$yarray[$i]."<br>"); //Calculo de terminos $x2 +=
$xarray[$i]*$xarray[$i]; $y += $yarray[$i]; $x +=
$xarray[$i]; $xy += $xarray[$i]*$yarray[$i]; } //Coeciente parcial de regresion $b=($cantidad*$xy$x*$y)/($cantidad*$x2-$x*$x); //Calculo del intercepto $a=($y-$b*$x)/$cantidad; //Recta tendencial
//y=a+bx //Proyeccion en dias para un 100% de
la ejecucion: if ($b!=0) $dias_proyectados=($pm$a)/$b; else $dias_proyectados=999999; //Innitos
REFERENCIAS
$dp=round($dias_proyectados,0); if($dp<=$pm) print [10] Environmental Tobacco Smoke and Adult Asthma Division of Pulmonary and Critical Care Medicine, Divi$dp."---> Culmina antes de los $pm dias <br>"; if($dp
sion of Occupational and Environmental Medicine; De>$pm) print $dp ."---> ALARMA: No culmina antes de
partment of Medicine, Institute for Health Policy Stulos $pm dias <br>"; ?>
Vase tambin
Homoscedasticidad
Regresin logstica
Modelos de regresin mltiple postulados y no postulados
Regresin segmentada
Econometra
Mnimos cuadrados
Regularizacin de Tikhonov
Cuarteto de Anscombe
Capital Asset Pricing Model
Regresin simple
[11] Efecto del tabaquismo, los sntomas respiratorios y el asma sobre la espirometra de adultos de la Ciudad de Mxico, Justino Regalado-Pineda; Alejandro Gmez-Gmez;
Javier Ramrez-Acosta; Juan Carlos Vzquez-Garca
6.1 Bibliografa
Devore, Jay L.; Probabilidad y Estadstica para Ingeniera y Ciencias. International Thomson Editores.
Mxico. ISBN-10: 9706864571.
Walpole, Ronald E.; Raymond H.; Myers, Sharon L.; Probabilidad y Estadstica para Ingenieros. Pretice-Hall Hispanoamericana, S.A. Mxico.
ISBN-10: 9701702646.
Canavos, George C.; Probabilidad y Estadstica.
Aplicaciones y Mtodos. McGraw-Hill. Mxico.
ISBN-10: 9684518560.
Referencias
[1] C.F. Gauss. Theoria combinationis observationum erroribus minimis obnoxiae. (1821/1823)
[2] Introduction to linear regression Curvet.com (en ingls)
[3] Anlisis de regresin lineal, Universidad Complutense
de Madrid
[4] Frmulas, Probabilidad y Estadstica. Cs. Bsicas.
U.D.B. Matemtica. Universidad Tecnolgica Nacional,
Facultad Regional Buenos Aires. Editorial CEIT-FRBA.
(Cdigo BM2BT2)
[5] Modelo de regresin lineal simple. EinsteinNet.
[6] Tcnicas de regresin: Regresin Lineal Mltiple. Prtega
Daz, S., Pita Fernndez, S. Unidad de Epidemiologa Clnica y Bioestadstica. Complejo Hospitalario de La Corua (Espaa)
[7] Apunte sobre Rectas de regresin. Ministerio de Educacin y Ciencia. Gobierno de Espaa.
[8] Utilizacin de las lneas de tendencia, Paritech (en ingls)
[9] Doll R, Peto r, Wheatley K, Gray R et al. Mortality in relation to smoking: 40 years observations on male British
doctors .BMJ 1994;309:901-911 (8 de octubre]
7.1
Texto
7.2
Imgenes
7.3