Sie sind auf Seite 1von 5

REGRESIN LINEAL MLTIPLE

Introduccin
Es evidente que lo ms econmico y rpido para modelar el comportamiento de una
variable Y es usar una sola variable preeditora y usar un modelo lineal. Pero algunas
veces es bastante obvio de que el comportamiento de Y es imposible que sea
explicada en gran medida por solo una variable.
Por ejemplo, es imposible tratar de explicar el rendimiento de un estudiante en un
examen, teniendo en cuenta solamente el nmero de horas que se prepar para
ella. Claramente, el promedio acadmico del estudiante, la carga acadmica que
lleva, el ao de estudios, son tres de las muchas otras variables que pueden explicar
su rendimiento. Tratar de explicar el comportamiento de Y con ms de una variable
preeditora usando una funcional lineal es el objetivo de regresin lineal mltiple.
Frecuentemente, uno no es muy familiar con las variables que estn en juego y basa
sus conclusiones solamente en clculos obtenidos con los datos tomados.
Es decir, si ocurre que el coeficiente de determinacin R 2 sale bajo (digamos menor de
un 30%) , considerando adems que su valor no se ha visto afectado por datos
anormales, entonces el modelo es pobre y para mejorarlo hay tres alternativas que
frecuentemente se usan:
a) Transformar la variable preeditora, o la variable de respuesta Y, o ambas y usar
luego un modelo lineal.
b) Usar regresin polinmica con una variable preeditora.
c) Conseguir ms variables preeditoras y usar una regresin lineal mltiple.
En el primer caso, se puede perder el tiempo tratando de encontrar la transformacin
ms adecuada y se podra caer en overfitting, es decir, encontrar un modelo
demasiado optimista, que satisface demasiado la tendencia de los datos tomados
pero que es pobre para hacer predicciones debido a que tiene una varianza grande.
En el segundo caso el ajuste es ms rpido, pero es bien fcil caer en overfitting y,
adems se pueden crear muchos problemas de clculo ya que pueden surgir
problemas de colinealidad, es decir relacin lineal entre los trminos del modelo
polinomio.
El tercer caso es tal vez la alternativa ms usada y conveniente. Tiene bastante
analoga con el caso simple, pero requiere el uso de vectores y matrices.
En el siguiente ejemplo se mostrar el uso interactivo de las tres alternativas a
travs de seis modelos de regresin y servir como un ejemplo de motivacin para
introducirnos en regresin lineal mltiple.
El modelo de regresin lineal mltiple
El modelo de regresin lineal mltiple con p variables predictoras y basado en n
observaciones tomadas es de la forma:

para i = 1,2,.n. Escribiendo el modelo para cada una de las observaciones, ste
puede ser considerado como un sistema de ecuaciones lineales de la forma

que puede ser escrita en forma matricial como

Recuperado de: http://pdf.rincondelvago.com/regresion-lineal-multiple.html


APLICACION DE REGRESION MULTIPLE
Mediante el siguiente problema podremos ilustrar la aplicacin de Regresin
Multiple:
En la Facultad de Ingeniera de Sistemas y Computo de la Universidad Inca
Garcilaso de la Vega se quiere entender los factores de aprendizaje de los alumnos
que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15
alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de
Datos y Programacin como se muestran en el siguiente cuadro.
Alumno
1
2
3
4
5
6

PHP
13
13
13
15
16
15

Algoritmos
15
14
16
20
18
16

Base de
Datos
15
13
13
14
18
17

Programacin
13
12
14
16
17
15

7
8
9
10
11
12
13
14
15

12
13
13
13
11
14
15
15
15

13
16
15
14
12
16
17
19
13

15
14
14
13
12
11
16
14
15

11
15
13
10
10
14
15
16
10

Lo que buscamos es construir un modelo para determinar la dependencia que exista de


aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las
asignaturas Algoritmos, Base de Datos y Programacin.
Se presentara la siguiente ecuacin a resolver:

Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de
Calculo de Excel podemos calcular tambin los coeficientes de regresin:

Por lo tanto podemos construir la ecuacin de regresin que buscamos:

El Error Estndar de Regresin Mltiple

(S x,y )

Mediante esta medida de dispersin se hace ms preciso el grado de dispersin


alrededor del plano de regresin, se hace ms pequeo.
Para calcularla se utiliza la formula siguiente:

En los resultados de Excel se llama error tpico y para explicar la relacin del
aprendizaje de PHP que se viene desarrollando es de 0.861
El coeficiente de determinacin mltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las
variables mltiples, utilizando la si siguiente formula:

Das könnte Ihnen auch gefallen