Sie sind auf Seite 1von 62
CAPITULO 114. Analisis de regresion con dos variables Esau -1. Visién panorémica de los modelos lineales .2. Modelo de regresién lineal . Estimadores de coeficientes por e! método de minimos cuadrados Caloulo por ordenador de coeficientes de regresion El poder explicativo de una ecuacién de regresién lineal El coeticiente de determinacién, a 118. PITULO Inferencia estadistica: contrastes de hipétesis @ intervalos de confianza Contraste de hipdtesis del coeficiente de la pendiente poblacional utilizando la distribucién F . Prediccién . Analisis de correlacion Contraste de hipstesis de la correlacién Medida beta del riesgo financiero Analisis grafico Introduccién Hasta ahora hemos centrado la atencién en el andlisis y la inferencia relacionados con una unica variable. En este capitulo, extendemos nuestro andlisis a las relaciones entre variables. Nuestro anélisis se basa en las relaciones descriptivas y utiliza los diagramas de puntos dispersos y los coeficientes de covarianza/correlacién desarrollados en el Capitulo 2. Suponemos que el lector es- 1 familiarizado con ese capitulo. En el andlisis de los procesos empresariales y econémicos se utilizan a menudo las relaciones entre variables. Estas relaciones se expresan en términos matematicos de la forma siguiente: y= fay donde la funcién puede adoptar formas lineales y no lineales. En muchas aplicaciones, la forma de la relacién no se conoce exactamente. Aqui presentamos analisis basados en modelos lineales de- sarrollados utilizando la regresién por minimos cuadrados. En muchos casos, las relaciones linea- les constituyen un buen modelo del proceso. En otros casos, nos interesa una parte limitada de una relacion no lineal a la que podemos aproximamos mediante una relacion lineal, En el Apartado 12.7, mostramos que algunas importantes relaciones no lineales también se pueden analizar util zando el andlisis de regresién. Por tanto, los métodos de regresién tienen una amplia variedad de aplicaciones, entre las que se encuentran numerosas aplicaciones en el mundo empresarial y en el andlisis econémico, como indican los siguientes ejemplos: 434 —Estadistica para administracion y economia ‘+ El presidente de Materiales de Construccién, S.A., fabricante do placas de yeso, cree que la cantidad anual media de placas de yeso vendidas, Y, en su regién es una funcién lineal del valor total de los permisos de edificacién expedidos, X, durante el afio anterior. ‘+ Un vendedor de cereales quiere saber cémo afecta la produccién total al precio por tonelada para poder desarrollar un modelo de prediccién utilizando datos histéricos. + Los analistas del departamento de marketing nocesitan saber cémo afecta el precio de la ga- solina, X, a las ventas totales de gasolina, ¥. Utiizando datos semanales sobre los precios y las ventas, planea desarrollar un modelo lineal que muestre cuanto varian las ventas cuando varia el precio. Cada una de estas relaciones se puede expresar como un modelo lineal, Y= Ry + BX donde ji, y 6, son coeficientes numéricos para cada modelo especitico Con la aparicion de muchos y buenos paquetes estadistioos y de hojas de calculo como Excel, hoy es posible para casi todo e! mundo calcular los coeticientes y otros estadisticos de regresién necesarios. Desgraciadamente, no es posible interpretar y utilizar correctamente estos resultados obtenidos por ordenador si no se comprende la metodologia det andiisis de regresién. En este capi- tulo y en los dos siguientes, el lector aprender algunas ideas fundamentales que lo ayudarén a utilizar el andlisis de regresién, 11.1. Visi6n panoramica de los modelos lineales En el Capitulo 2, vimos como se puede describir la relacién entre dos variables utilizando diagramas de Puntos dispersos para tener una imagen de la relacién y coeficientes de correlacién para tener una medida numérica. En muchos problemas econémicos y empresariales, se necesita una relacién funcional especi para obtener resultados numéricos. «A un gerente le gustaria suber qué nivel medio de ventas cabe esperar si el precio se fija en 10 $ por tnidad se emplean 250 trabajadores en una fabrica,zeudmtas unidades se pueden producir en un dia me- dio? im pats en vias de desarollo aumenta su produccin de frilizantes entun mill6n de tonelada, smo cabe esperar que aumente la produceion de cereales? En muchos casos, podemos calcular aproximadamente las relaciones funcionales deseadas mediante una ecuacién lineal: Y= fy+ BX donde Yes la variable dependiente o endégena, X es la variable independiente o exdgena, fy es la ordenada en el origen y fi es la pendiente de ta recta, 0 sea, la variacién que experimenta Y por cada variacién unitaria de X. La Figura 11.1 es un ejemplo de un modelo de regresidn simple representativo que muestra el riimero de mesas producidas, Y, utilizando diferentes cantidades de trabajadores, X. Cuando se desarrolla el método de regresién por minimos cuadrados, se parte del supuesto de que a cada valor de X le corresponde un valor medio de ¥ debido a la retacién lineal subyacente en el proceso estudiado. El modelo lineal calcula la media de ¥ para cada valor de X’y es la base para obtener muchas relaciones econdmicas y empresariales, entre las que se encuentran las funciones de demanda, las funciones de produccién, las funciones de consu- ‘mo y las previsiones de ventas. El coeficiente de la pendiente, f, ¢s extraordinariamente importante para muchas aplicaciones empre- sariales y econémicas, ya que indica la variacién que experimenta la produccién o variable endégena por ‘cada variacién unitaria que experimenta un factor 0 variable exégena, La relacién de la Figura 11.1 = 13,02 + 2,545 Analisis de regresién con dos variables 438, Fitted Line Plot 9 = 1802+ 2.545 « 70 60 g B50 3 3 40 20 20 10 5 20 25 30 Number of Workers Figura 11.1. Funcién lineal y puntos de datos. ‘muestra que cada trabajador adicional, X, aumenta el nimero de mesas producidas, ¥, en 2,545. La ordena- da en el origen, ~13,02, ajusta meramente Ia recta de regresiGn hacia arriba o hacia abajo y no tiene nin- ‘in significado real para este resultado de la aplicacidn. Esta ecuacién solo es valida en el rango de X, de 11 a 30, En algunas situaciones, la direccidin de la empresa puede tener buenas razones —ademés de sim- plemente el modelo de regresién estimado— para creer que la relacién lineal se mantendré por encima 0 por debajo del rango de X (11-30). En esos casos, podria extender el modelo mAs alld del rango de X basin- dose en sus conocimientos adicionales. Utilizando el modelo de regresiGn, la direccién puede averiguar si el valor del aumento de la produe- cidn es mayor que el coste de un trabajador més Utilizamos regresiones para averiguar cudl es la mejor relacién lineal entre Y y X para una aplicacién cespecifica. Para eso es necesario hallar los mejores valores de los coeficientes i y fy. Utilizamos los datos del proceso para calcular «estimaciones» 0 valores numéricos de los coeficientes fy y f. Estas estimacio- nes by y by— generalmente se calculan utilizando una regresién por minimos cuadrados, técnica que Se aplica mucho en paquetes estadisticos como Minitab, SPSS, SAS y STATA, asf como en hojas de célculo como Excel. Se calculan los coeficientes para la recta que mejor Se ajusta, dado un conjunto de puntos de datos, como se muestra en la Figura 11.1 Regresién por minimos cuadrados La recta de regresién por minimos cuadrados basada en datos muestr Fa dyt bye any +6, 85 la pendiente de la recta, 0 sea, la variacién de y por cada variacién unitaria de x, y se calcula de la forma siguiente: Koad «any bp @8 la ordenada en el origen y se calcula de la forma siguiente: dy I de a1)