Beruflich Dokumente
Kultur Dokumente
Introduccin
Es evidente que lo ms econmico y rpido para modelar el comportamiento de una
variable Y es usar una sola variable preeditora y usar un modelo lineal. Pero algunas
veces es bastante obvio de que el comportamiento de Y es imposible que sea
explicada en gran medida por solo una variable.
Por ejemplo, es imposible tratar de explicar el rendimiento de un estudiante en un
examen, teniendo en cuenta solamente el nmero de horas que se prepar para
ella. Claramente, el promedio acadmico del estudiante, la carga acadmica que
lleva, el ao de estudios, son tres de las muchas otras variables que pueden explicar
su rendimiento. Tratar de explicar el comportamiento de Y con ms de una variable
preeditora usando una funcional lineal es el objetivo de regresin lineal mltiple.
Frecuentemente, uno no es muy familiar con las variables que estn en juego y basa
sus conclusiones solamente en clculos obtenidos con los datos tomados.
Es decir, si ocurre que el coeficiente de determinacin R 2 sale bajo (digamos menor de
un 30%) , considerando adems que su valor no se ha visto afectado por datos
anormales, entonces el modelo es pobre y para mejorarlo hay tres alternativas que
frecuentemente se usan:
a) Transformar la variable preeditora, o la variable de respuesta Y, o ambas y usar
luego un modelo lineal.
b) Usar regresin polinmica con una variable preeditora.
c) Conseguir ms variables preeditoras y usar una regresin lineal mltiple.
En el primer caso, se puede perder el tiempo tratando de encontrar la transformacin
ms adecuada y se podra caer en overfitting, es decir, encontrar un modelo
demasiado optimista, que satisface demasiado la tendencia de los datos tomados
pero que es pobre para hacer predicciones debido a que tiene una varianza grande.
En el segundo caso el ajuste es ms rpido, pero es bien fcil caer en overfitting y,
adems se pueden crear muchos problemas de clculo ya que pueden surgir
problemas de colinealidad, es decir relacin lineal entre los trminos del modelo
polinomio.
El tercer caso es tal vez la alternativa ms usada y conveniente. Tiene bastante
analoga con el caso simple, pero requiere el uso de vectores y matrices.
En el siguiente ejemplo se mostrar el uso interactivo de las tres alternativas a
travs de seis modelos de regresin y servir como un ejemplo de motivacin para
introducirnos en regresin lineal mltiple.
El modelo de regresin lineal mltiple
El modelo de regresin lineal mltiple con p variables predictoras y basado en n
observaciones tomadas es de la forma:
para i = 1,2,.n. Escribiendo el modelo para cada una de las observaciones, ste
puede ser considerado como un sistema de ecuaciones lineales de la forma
PHP
13
13
13
15
16
15
Algoritmos
15
14
16
20
18
16
Base de
Datos
15
13
13
14
18
17
Programacin
13
12
14
16
17
15
7
8
9
10
11
12
13
14
15
12
13
13
13
11
14
15
15
15
13
16
15
14
12
16
17
19
13
15
14
14
13
12
11
16
14
15
11
15
13
10
10
14
15
16
10
Utilizando las formulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresin o utilizando Regresin de Anlisis de datos, en la Hoja de
Calculo de Excel podemos calcular tambin los coeficientes de regresin:
(S x,y )
En los resultados de Excel se llama error tpico y para explicar la relacin del
aprendizaje de PHP que se viene desarrollando es de 0.861
El coeficiente de determinacin mltiple (r2)
Utilizaremos para determinar la tasa porcentual de Y para ser explicados las
variables mltiples, utilizando la si siguiente formula: