Beruflich Dokumente
Kultur Dokumente
1. EJERCICIO 1
La compañía pinter analiza sus gastos de publicidad en miles de euros (X) y sus ventas
en miles de euros (Y) en los últimos años
Gastos en publicidad (X) Ventas en miles de euros (Y)
21 180,2
22 190,5
22 200,0
25 201,9
26 220,2
27 230,5
29 240,4
30 260,3
32 280,8
270
250
230
210
190
170
150
20 22 24 26 28 30 32 34
2. Obtén la recta de regresión que expresa las ventas en términos de los gastos de
publicidad.
Gráfico de Dispersión
290
270
250
230
210
190
170
150
20 22 24 26 28 30 32 34
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 8548,03 1 8548,03 144,98 0,0000
Residuo 412,71 7 58,9586
Total (Corr.) 8960,74 8
Con base en esto, podemos decir que el modelo lineal tiene un alto grado de ajuste con un
Valor P menor de 0,05, no obstante también observamos que la Variable Dependiente
tiene poca significancia para el modelo, esto nos indica que debemos revisar cuál modelo
se ajusta mejor a la distribución de los datos, así:
Así, encontramos que el mejor modelo está determinado por la ecuación: Ŷ =(∝+ β X 2)2
Ŷ =(11,1901+0,00536491 X 2 )2
Con la siguiente información que demuestra mayor correlación, fuerza y significancia en el modelo
predictivo así:
Coeficientes
Mínimos Cuadrados Estándar Estadístico
Parámetro Estimado Error T Valor-P
Intercepto 11,1901 0,265895 42,0845 0,0000
Pendiente 0,00536491 0,000371604 14,4372 0,0000
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 9,53465 1 9,53465 208,43 0,0000
Residuo 0,320213 7 0,0457447
Total (Corr.) 9,85487 8
4. Predice linealmente las ventas si los gastos de publicidad son de 28 y 31 ¿En qué
medida es fiable esta predicción?
Dados los valores r = 0,9767, R2=¿95,3942 y el Valor p < 0,05, sabemos que la predicción
es altamente significativa.
2. EJERCICIO 2
Gráfica de Dispersión
0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
0
0 2 4 6 8 10 12
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
0
0 2 4 6 8 10 12
Coeficientes
Mínimos Cuadrados Estándar Estadístico
Parámetro Estimado Error T Valor-P
Intercepto -0,00144796 0,0055743 -0,259757 0,8016
Pendiente 0,00341629 0,00090427 3,77795 0,0054
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 0,00103172 1 0,00103172 14,27 0,0054
Residuo 0,000578281 8 0,0000722851
Total 0,00161 9
(Corr.)
Ŷ =−0,00144796+0,00341629 X
Con base en esta información, podemos concluir que el modelo, a pesar de tener un buen
coeficiente de correlación r, no es significativo en virtud que el Coeficiente de
Determinación o R – cuadrada, es bajo y el Valor p > 0,05, aunque sea por poco.
Así las cosas procedemos a realizar el comparativo para determinar el mejor modelo así:
Coeficientes
Mínimos Cuadrados Estándar Estadístico
Parámetro Estimado Error T Valor-P
Intercepto 0,00506797 0,00397764 1,27412 0,2384
Pendiente 0,000314001 0,0000791297 3,96818 0,0041
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 0,0010676 1 0,0010676 15,75 0,0041
Residuo 0,000542397 8 0,0000677997
Total 0,00161 9
(Corr.)
Ŷ =−0,00144796+0,00341629 X
Ŷ / X =12 = 0,0395475
Con valores Coeficiente de Correlación = 0,800512 R-cuadrada = 64,082% y Valor P > 0,05,
podemos decir que el modelo es medianamente significativo en virtud que la diferencia
del Valor P con el teórico es muy poca y además que el Coeficiente de Correlación es
bueno.
Tabla ANOVA
3. EJERCICIO 3
Error Estadístico
Parámetro Estimación Estándar T Valor-P
CONSTANTE 25,7115 14,3725 1,78894 0,0989
Temperatura 1,58182 0,320263 4,93912 0,0003
Humedad 1,54245 0,199504 7,73141 0,0000
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 3650,19 2 1825,1 63,75 0,0000
Residuo 343,542 12 28,6285
Total (Corr.) 3993,73 14
Puesto que el valor-P en la tabla ANOVA es menor que 0,05, existe una relación
estadísticamente significativa entre las variables con un nivel de confianza del 95,0%.
El estadístico R-Cuadrada indica que el modelo así ajustado explica 91,398% de la
variabilidad en Recuento de Parásitos. El estadístico R-Cuadrada ajustada, que es más
apropiada para comparar modelos con diferente número de variables independientes, es
89,9643%. El error estándar del estimado muestra que la desviación estándar de los
residuos es 5,35056.
Para determinar si el modelo puede simplificarse, note que el valor-P más alto de las
variables independientes es 0,0003, que corresponde a Temperatura. Puesto que el valor-
P es menor que 0,05, ese término es estadísticamente significativo con un nivel de
confianza del 95,0%. Consecuentemente, probablemente no quisiera eliminar ninguna
variable del modelo.