Sie sind auf Seite 1von 12

TALLER #1 DE REGRESIÓN LINEAL SIMPLE

1) Grafique el costo mensual de producción contra el número de cajas fabricadas mensualmente en


un diagrama de dispersión. ¿Qué se interpreta?

COSTO DE PRODUCCION (CIENTOS DE


MILLONES DE PESOS)
18
COSTO DE PRODUCCION (CIENTOS DE

16
14
MILLONES DE PESOS)

12
10
8
6
4
2
0
0 1 2 3 4 5 6
CANTIDAD DE CAJAS (EN MILLONES)

De acuerdo a la gráfica se puede observar una tendencia con relación creciente, y además unos
puntos atípicos por fuera de dicha tendencia.

2) Suponiendo que existe una relación lineal entre el costo mensual de producción y el número de
cajas fabricadas mensualmente, escriba el modelo de regresión ajustado e interprete la pendiente
estimada.

 0.51205797
1 2.18946182

Ei^=0,51+2,19 Ꝺi

Por cada millón de cajas fabricadas se espera que los costos de producción promedio mensuales se
incrementen en 2.18 cientos de millones pesos.

El 0.5121 cientos de millones de pesos es el costo de producción promedio mensual que no depende de
la cantidad de cajas.

3) ¿Es la constante del modelo estadísticamente significativo?, si no lo es, ¿se debe eliminar del
modelo?

T 0.83873335
t 2.00099538
T<t

como T<t; No se rechaza la hipótesis nula, la constante no es significativa en el modelo.


4) Pruebe a un nivel de significancia del 5% si el número de cajas fabricadas mensualmente no tiene
efecto lineal sobre costo mensual de producción.

T 10.6907568
t 2.00099538

T>t
Como T>t; Se rechaza la hipótesis nula, la constante es significativa en el modelo.

5) Calcule e interprete un intervalo de confianza del 94% para la pendiente.

LI 1.79672768
LS 2.58219596
1^ 2.18946182

LI<1^^<LS
1,80<2,189<2,58
Por cada millón que se incremente en la cantidad de cajas a producir, se espera con una confianza del
94% que el costo de producción en promedio mensual se va a incrementar entre 1,7967 y 2.5821
cientos de millones de pesos.

6) ¿Qué porcentaje de la variación que hay en el costo mensual de producción se explica por la
variación que existe en el número de cajas fabricadas mensualmente?, ¿cuál es la variación no
explicada?

R2 65.38%

La variabilidad que hay en el costo de producción es explicada en un 65,38% por la variabilidad que hay
en la cantidad de cajas producidas
VARIABILIDAD
NO EXPLICADA 34.62%

7) Interprete el coeficiente de correlación.

COEFICIENTE
DE
CORRELACION 81.21%
Relación lineal fuerte entre el costo de producción y la cantidad de cajas producidas.

8) Pruebe si el modelo es significativo. Considere alpha=0.05

F 114.292281
f 4.0039825
F>f
Como F>f, se rechaza la hipótesis nula Ho, el modelo lineal es significativo.

9) Si para determinado mes se necesitan 2600000 cajas, 3180000 cajas y 3800000 cajas calcule e
interprete un intervalo de confianza del 94% para el costo mensual promedio esperado.

X0 2.6 si la X0 3.18 si la X0 3.8 si la


YO producción YO producción YO producción
anual de anual de anual de
AJUSTADO 6.2046587 cajas es de AJUSTADO 7.47454655 cajas es de AJUSTADO 8.83201288 cajas es de
t 1.9176517 2.6 millones, t 1.9176517 3.18 millones, t 1.9176517 3.8 millones,
se espera se espera se espera
S 1.23873609 con una S 1.23873609 con una S 1.23873609 con una
confianza del confianza del confianza del
n 61 94% que el n 61 94% que el n 61 94% que el
costo costo costo
media de X 2.87867818 promedio media de X 2.87867818 promedio media de X 2.87867818 promedio
Sxx 36.5847194 mensual de Sxx 36.5847194 mensual de Sxx 36.5847194 mensual de
producción va producción va producción va
LI 5.88141893 a estar entre LI 7.14818842 a estar entre LI 8.35932942 a estar entre
5,88 y 6.52 7.15 y 7.80 8.36 y 9.30
LS 6.52789847 millones LS 7.80090469 millones LS 9.30469634 millones
0.64647954 0.65271627 0.94536692

10) Verifique si se cumplen los supuestos del modelo de regresión. ¿Es adecuado un modelo de
regresión lineal simple?

promedio de los
residuales
1.16482E-16

El valor del promedio de los residuales es considerado un cero estadístico, por lo cual, el modelo
sigue una regresión lineal simple.

11) Para el modelo estimado en (2), obtenga los residuales estandarizados. ¿Se presentan valores en
valor absoluto mayores que 2,5?, si es así, defina una variable dummy por cada valor atípico y
estime de nuevo el modelo incorporando la(s) variable(s) dummy.

℮i*>2.5
Pronóstico COSTO DE
PRODUCCION
(CIENTOS DE
Residuos VALORES
Observación MILLONES DE PESOS) Residuos estándares ATIPICOS

46 10.1331684 4.16069156 3.38716498 1


61 11.3811617 4.41338832 3.59288213 1

Se presentan dos observaciones con un valor mayor a 2.5 (VALORES ATIPICOS)

12) Verifique si se cumplen los supuestos del modelo de regresión estimado en (11). Si falla alguno
de los supuestos, soluciónelo y estime de nuevo el modelo. Valide de nuevo los supuestos.
SUPUESTO P DECISIÓN
NORMALIDAD 0.004616 NO SE VALIDA EL SUPUESTO
CORRELACION 0.00151472 NO SE VALIDA EL SUPUESTO
HOMOSCEDASTICIDAD 0.92860193 SE VALIDA EL SUPUESTO

El modelo presenta problemas de normalidad y de correlación, por tal motivo se procede a implementar
AR(1) para dar solución.

Modelo con corrección


SUPUESTO P DECISIÓN
NORMALIDAD 0.004616 SE VALIDA EL SUPUESTO
CORRELACION 0.19265369 SE VALIDA EL SUPUESTO
HOMOSCEDASTICIDAD 0.01214824 NO SE VALIDA EL SUPUESTO

Después de implementar AR(1), el modelo presenta problemas de heteroscedasticidad.

13) Estime los modelos LOG-LOG, LOG-LIN y LIN-LOG. Verifique si se cumplen los supuestos de cada
uno de dichos modelos de regresión.

LOG-LOG
SUPUESTO P DECISIÓN
NORMALIDAD 0.974169 SE VALIDA EL SUPUESTO
CORRELACION 0.0721 SE VALIDA EL SUPUESTO
HOMOSCEDASTICIDAD 0.1758 SE VALIDA EL SUPUESTO
LOG-LIN
SUPUESTO P DECISIÓN
NORMALIDAD 0.471595 SE VALIDA EL SUPUESTO
CORRELACION 0.22168458 SE VALIDA EL SUPUESTO
HOMOSCEDASTICIDAD 0.07315492 SE VALIDA EL SUPUESTO

LIN-LOG
SUPUESTO P DECISIÓN
NORMALIDAD 0.434233 SE VALIDA EL SUPUESTO
CORRELACION 0.1341 SE VALIDA EL SUPUESTO
HOMOSCEDASTICIDAD 0.0160144 NO SE VALIDA EL SUPUESTO

14) Considere ahora una transformación de raíz cuadrada para el costo mensual de producción.
Estime el modelo de regresión lineal simple relacionado con, Y*=Raiz(Y) y X. Valide los
supuestos.
SUPUESTO P DECISIÓN
NORMALIDAD 0.976315 SE VALIDA EL SUPUESTO
CORRELACION 0.1803927 SE VALIDA EL SUPUESTO
HOMOSCEDASTICIDAD 0.06234555 SE VALIDA EL SUPUESTO

15) ¿Qué modelo es mejor, el del numeral (2), el estimado en (12), el del numeral (13) o el del (14)?
Justifique su respuesta.

Para la selección del mejor modelo se tuvo en cuenta el valor de R2, para los que tienen igual
variable dependiente que para este caso serían los costos de producción; de acuerdo a esto el
mejor candidato es el del modelo LOG-LOG. Pero si comparamos los modelos con variable
dependiente diferente deberíamos escoger el de mayor correlación conjunto, en este caso el
mejor candidato de este grupo serían el modelo RAIZ.

16) Usando el mejor modelo, calcule e interprete un intervalo de confianza del 94% para el costo
mensual promedio esperado en un mes donde se necesitan fabricar 2600000 cajas, 3180000 cajas
y 3800000 cajas. Compare con los resultados obtenidos en el literal (9).
X0 2.6 si la X0 3.18 si la X0 3.8 si la
producción producción producción
YO anual de
YO anual de
YO anual de
AJUSTADO 6.27903997 cajas es de AJUSTADO 7.11353265 cajas es de AJUSTADO 8.10287171 cajas es de
2.6 millones, 2.6 millones, 2.6 millones,
t 1.91897068 se espera t 1.91897068 se espera t 1.91897068 se espera
S 0.15468664 con una S 0.15468664 con una S 0.15468664 con una
confianza del confianza del confianza del
n 61 94% que el n 61 94% que el n 61 94% que el
costo costo costo
media de X 2.87867818 promedio media de X 2.87867818 promedio media de X 2.87867818 promedio
Sxx 36.5847194 mensual de Sxx 36.5847194 mensual de Sxx 36.5847194 mensual de
producción producción producción
LI 6.23864778 va a estar LI 7.07275079 va a estar LI 8.04380496 va a estar
entre 6.23 y entre 7.07 y entre 8.04 y
LS 6.31943216 6.31 millones LS 7.15431452 7.15 millones LS 8.16193845 8.16 millones
0.08078438 0.08156373 0.11813349

X0 2.6 3.18 3.8


PUNTO 9 16 9 16 9 16
LI 5.88141893 6.23864778 7.14818842 7.07275079 8.35932942 8.04380496
LS 6.52789847 6.31943216 7.80090469 7.15431452 9.30469634 8.16193845
DIFERENCIA 0.64647954 0.08078438 0.65271627 0.08156373 0.94536692 0.11813349

Al realizar las transformaciones en el modelo principal se evidencia una reducción significativa en la


diferencia de los limites inferiores y superiores en comparación al punto 9, lo que nos indica que esta
modelación es más ajustada, generando mayor confianza.

Das könnte Ihnen auch gefallen