Sie sind auf Seite 1von 2

Facultad de Ingeniería

Departamento de Ingeniería Industrial


Análisis de Regresión y Diseño de Experimentos
Seguimiento 2 - Regresión lineal múltiple
2019-02

La base de datos que deben analizar corresponde a unos datos recolectados de un estudio observacional
sobre autos y sus características. El objetivo del estudio fue tratar de explicar el rendimiento del
combustible del auto en función de sus características. Los datos están disponibles en el marco de datos
table.b3 del paquete MPV. Puede obtener los datos y visualizar sus primeras 6 filas utilizando las
siguientes líneas de código:

install.packages("MPV")
library(MPV)
head(table.b3)

Quite los datos faltantes (aquellos que tienen NA) de la siguiente manera:

autos <- na.exclude(table.b3)


head(autos)

Una descripción breve de las variables es la siguiente:

 y : Millas/galón (rendimiento)  x 6: Carburador (gargantas)


 x 1: Cilindrada (pulgadas cúbicas)  x 7: Número de velocidades en la transmisión
 x 2: Potencia (HP)  x 8: Longitud total (pulgadas)
 x 3: Par de torsión  x 9: Ancho (pulgadas)
 x 4: Relación de comprensión  x 10: Peso (libras)
 x 5: Relación de eje trasero  x 11: Tipo de transmisión (1=automática, 0=
manual)

Cuando se ajustan modelos de regresión, es común ajustar un modelo y comenzar a depurarlo, hasta que
se obtiene un modelo refinado. Responda el cuestionario de moodle. Además, construya un documento de
word con la siguiente información:

1. Escriba el número de su documento de identidad ___1039475599____.

2. (20%) Realice una exploración de los datos utilizando todas las variables. Reporte los resultados y
haga una breve descripción de los resultados. Nota: Debe reportar mínimo dos gráficos.

3. Ajuste un modelo inicial, llamado modelo1, que explique el rendimiento de combustible en función
de las otras variables, excepto la que coincida con el número de su cédula y reporte el resumen
(summary). Por ejemplo, si su cédula termina en 9, usted ajusta el modelo así:

modelo1 <- lm(y ~ . – x9, data = autos)

a. (10%) Escriba la hipótesis nula para la prueba de significancia del modelo.


b. (20%) Diga si este modelo es adecuado para explicar el rendimiento de combustible, y
justifique su respuesta.
Facultad de Ingeniería
Departamento de Ingeniería Industrial
Análisis de Regresión y Diseño de Experimentos
Seguimiento 2 - Regresión lineal múltiple
2019-02

4. (10%) Ajuste el modelo completo, llamado modelo2, y el modelo vacío, llamado modelo3. Reporte
el resumen de cada uno (summary) y escriba las ecuaciones de dichos modelos. Diga por qué el
modelo3 no es adecuado

5. (10%) Un analista que conoce algunos principios estadísticos hace una propuesta un tanto
arbitraria: propone que ajustar un modelo, llamado modelo4. El modelo4 se forma ajustando el
modelo completo y eliminando las variables que sean significativas con α =40 %. Reporte el
resumen (summary). Compare el modelo2 con el modelo4, y haga una conclusión de sus
observaciones.

6. Ahora, aplique un método de selección de variables para ajustar el modelo5. Revise en la siguiente
tabla cuál método le fue asignado, de acuerdo con su documento de identidad:

1040051472, 1005840002, 1067886168, 1036681906,


Selección backward 1010156825, 1152465726, 1152702981, 1006504767,
1214747739, 1026154534

1026153324, 1033341002, 1039475599, 1214744209,


Selección forward 1152471837, 1035437258, 1040328162, 1193474848,
1020482494, 1007222772

a. (10%) Reporte el resumen del modelo obtenido.


b. (10%) Reporte el resumen del método de selección de variables.
c. (10%) Escriba la expresión para el modelo ajustado en este numeral.

Das könnte Ihnen auch gefallen