Sie sind auf Seite 1von 10

Regresin Lineal

El objeto de un anlisis de regresin es investigar la relacin estadstica que existe entre una variable dependiente (Y) y una o ms variables independientes (X1, X2 ...Xn ). Para poder realizar esta investigacin, se debe postular una relacin funcional entre las variables. Debido a su simplicidad analtica, la forma funcional que ms se utiliza en la prctica es la relacin lineal. Cuando solo existe una variable independiente, esto se reduce a una lnea recta:

donde los coeficientes b0 y b1 son parmetros que definen la posicin e inclinacin de la recta. (Ntese que hemos usado el smbolo Especial para representar el valor de Y calculado por la recta. Como veremos, el valor real de Y rara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distincin.)

El parmetro b0, conocido como la ordenada en el origen, nos indica cunto es Y cuando X = 0. El parmetro b1, conocido como la pendiente, nos indica cunto aumenta Y por cada aumento de una unidad en X. Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables Y y X. En el anlisis de regresin, estas estimaciones se obtienen por medio del mtodo de mnimos cuadrados cuadrados.

CUADRO N 1 Operaciones anuales en una Empresa de Transporte de Pasajeros. Costos Millas Totales Vehculo (miles S/.) (miles millas) Ao N Y X 1 213.9 3,147 2 212.6 3160 3 215.3 3197 4 215.3 3173 5 215.4 3292 6 228.2 3561 7 245.6 4013 8 259.9 4244 9 250.9 4159 10 234.5 3776 11 205.9 3232 12 202.7 3141 13 198.5 2928 14 195.6 3063 15 200.4 3096 16 200.1 3096 17 201.5 3158 18 213.2 3338 19 219.5 3492 20 243.7 4019 21 262.3 4394 22 252.3 4251 23 224.4 3844 24 215.3 3276 25 202.5 3184 26 200.7 3037 27 201.8 3142 28 202.1 3159 29 200.4 3139 30 209.3 3203 31 213.9 3307 32 227.0 3585 33 246.4 4073

Para poder visualizar el grado de relacin que existe entre las variables, como primer paso en el anlisis es conveniente elaborar un diagrama de dispersin, que es una representacin en un sistema de coordenadas cartesianas de los datos numricos observados.

Diagrama de Dispersin

Por otro lado, tambin se aprecia por qu este grfico se denomina un diagrama de dispersin : No existe una relacin matemticamente exacta entre las variables, ya que no toda la variacin en el costo de operacin puede ser explicada por la variacin en las millas-vehculo. Si entre estas variables existiera una relacin lineal perfecta, entonces todos los puntos caeran a lo largo de la recta de regresin, que tambin ha sido trazada y que muestra la relacin promedio que existe entre las dos variables. En la prctica, se observa que la mayora de los puntos no caen directamente sobre la recta, sino que estn dispersos en torno a ella. Esta dispersin representa la variacin en Y que no puede atribuirse a la variacin en X.

Estimacin de la recta de regresin y del coeficiente de determinacin

Das könnte Ihnen auch gefallen