Regresión 3 IMC

MODELOS DE REGRESIN LINEAL
REGRESIN LINEAL
El Anlisis de Regresin se ocupa del estudio de la dependencia de una variable, la variable dependiente, de una o varias variables, las variables explicatorias, con el objeto de estimar o predecir el valor promedio de la primera con base en valores fijos o conocidos de las segundas.
EJEMPLOS

Se quiere estimar o predecir la estatura promedio de los hijos con base en la estatura de los padres. Interesa estudiar la dependencia del gasto de consumo personal con el ingreso personal neto disponible. Un agrnomo puede estar interesado en estudios de la dependencia de una cosecha de un producto especfico, con relacin a la temperatura, la cantidad de lluvia, la cantidad de sol recibida y dos fertilizantes, a travs de este estudio se puede predecir la produccin media de la cosecha. Se quiere explicar la penetracin promedio en el acero al carbono, con base en el tiempo de exposicin.
En el caso de una sola variable que explique a la variable dependiente, se trata de un ANLISIS DE REGRESIN LINEAL SIMPLE, mientras que si existen dos o ms variables explicatorias, sera un ANLISIS DE REGRESIN LINEAL MLTIPLE.
Y A la variable se le llama variable X 1 , X 2 ,variable X k dependiente, explicada o variable respuesta y a las variables ,variables explicativas, independientes, de control o estmulo.
En el Anlisis de Regresin interesa una relacin o dependencia estocstica y no una dependencia funcional determinstica propios de los mecanismos fsicos que relacionan estas variables, tales como la Ley Ohm, la ley de la gravedad de Newton y la ley de los gases de Boyle, entre otras.
MNIMOS CUADRADOS ORDINARIOS
Se trata de estimar los parmetros tal que se haga mnimo y esto se obtiene por el mtodo de mnimos cuadrados ordinarios MCO
MODELO DE REGRESION MULTIPLE

El modelo de regresin lineal mltiple con p variables predictoras y basado en n observaciones tomadas es de la forma
para i=1,2,.n.
ANOVA
Si valor p< entonces rechazo H0
MEDIDAS DE LA ADECUACIN DEL MODELO
El coeficiente de determinacin mltiple R2 mide la proporcin de la variabilidad total explicada por el modelo de regresin planteado .
VALIDACION DE SUPUESTOS DEL MODELO
MULTICOLINEALIDAD
En los modelos de regresin mltiple se espera encontrar dependencias entre la variable respuesta Y y las variables regresoras xs , sin embargo en la prctica se encuentra que tambin hay dependencias entre las variables regresoras xs . La multicolinealidad puede tener efectos sobre las estimaciones de los coeficientes de regresin y sobre la aplicabilidad general del modelo estimado.
Tipos De Multicolinealidad
1.
2.
EXACTA: Cuando un xj es combinacin lineal de alguno o todos los xs APROXIMADA
Los estimadores siguen siendo MELI pero la varianza de los es muy grande, lo que crea intervalos de confianza para los muy grandes
Diagnstico y Causas
Deteccin: La prueba global (ANOVA prueba F) da significativa (valor p tiende a cero) y las pruebas individuales (prueba t) dan no significativas. VIF (factores de inflacin de la varianza) si entrega un valor mayor o igual que 10. 1 VIF j 1 R2 j
Un anlisis entre la matriz de correlacin, muestra relacin entre variables explicatorias con coeficientes mayores a 0.90.
Causas: problemas de muestreo y/o especificacin del modelo (sobre o subespecificacin)
Solucin
Ampliacin
de muestra Reespecificacin del modelo Reduccin de dimensin (Regresin por pasos) Regresin Ridge Otros mtodos
Regresin Por Pasos
Se especifican entry y stay
1. 2. 3.
Paso 1: se corre una regresin para cada variable independiente. Se denomina a la variable con el mayor valor de la estadstica t, x[1]
Si la estadstica t no indica que x[1] sea significante en el nivel entry , el procedimiento termina. Si es
significante, se conserva para usarla en el paso 2.
Regresin Por Pasos

1.
Paso 2: se corre una regresin agregando cada variable independiente al modelo y = 0 + 1x[1] + 2xj + Se denomina a la variable (nueva) con el mayor valor de la estadstica t, x[2] Si la estadstica t no indica que x[2] sea significante en el nivel entry , el procedimiento
1. 2.
termina. Si es significante, se comprueba que la

estadstica t >stay para x[2].
Regresin Por Pasos

1.
Pasos posteriores: se continan agregando variables independientes, una por una, al modelo. En cada paso se suma una variable independiente al modelo si teine la estadstica t ms grande de las variables independientes que no estn en el modelo y si su estadstica t indica que es significante en el nivel Despus de aadir una variable independiente, el procedimiento comprueba que todas las variables independientes ya incluidas tienen t significante en el nivel stay
2.
Eliminacin Hacia Atrs

1. 2.
3.
4.
Se corre una regresin con todas las p variables independientes. Si la estadstica t ms pequea es significante en el nivel stay , se conserva el modelo con todas las variables. Si la estadstica t ms pequea no es significante en el nivel stay , se elimina esa variable del modelo y se corre la regresin de nuevo. Se repite estos pasos hasta conseguir que la estadstica t ms pequea sea significante en el nivel stay .
HETEROSCEDASTICIDAD
Se viola el supuesto de varianza constante
CAUSAS
Caractersticas de las variables Presencia de valores atpicos (lejanos) Mala especificacin del modelo
As bajo heterocedasticidad los estimadores siguen siendo insesgados pero dejan de ser eficientes, es decir que ya no son MELI, por lo tanto las pruebas no son confiables
DETECCIN
Prueba de White:
Si valor p tiende a cero hay presencia de heterocedasticidad
SOLUCIN
Transformaciones de potencia. Mnimos cuadrados generalizados Transformaciones Box-Cox
AUTOCORRELACIN
Los residuales estn correlacionados, es decir:
Los estimadores dejan de ser MELI, las pruebas de hiptesis NO SON CONFIABLES
CAUSAS
Caractersticas de los datos: datos en el tiempo Sesgo en la especificacin del modelo: efectos sistemticos por variables faltantes o por forma funcional incorrecta, lo cual genera una mala especificacin Manipulacin de los datos
DETECCIN
Grficamente: comportamiento sistemtico, forma de embudo en los residuales vs row number Prueba Durbin-Watson
Si DW est cercano a 2 no hay autocorrelacin Si DW est entre 1.5 y 2.5 est en zona de indecisin Si DW est cercano a 0 a 4 hay autocorrelacin
SOLUCIN
Transformaciones de potencia Correccion Cochrane - Orcutt
NORMALIDAD
Se evala la normalidad de los residuales. Se realiza la prueba Jaque Bera, si valor p tiende a 1 entonces los residuales se distribuyen normal Se organiza por medio de transformaciones de potencia

Regresión 3 IMC

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Regresión 3 IMC

Hochgeladen von

Copyright:

Verfügbare Formate

MODELOS DE REGRESIN LINEAL

MNIMOS CUADRADOS ORDINARIOS

MODELO DE REGRESION MULTIPLE

Si valor p< entonces rechazo H0

MEDIDAS DE LA ADECUACIN DEL MODELO

VALIDACION DE SUPUESTOS DEL MODELO

EXACTA: Cuando un xj es combinacin lineal de alguno o todos los xs APROXIMADA

Causas: problemas de muestreo y/o especificacin del modelo (sobre o subespecificacin)

Regresin Por Pasos

Se especifican entry y stay

significante, se conserva para usarla en el paso 2.

Regresin Por Pasos

termina. Si es significante, se comprueba que la

Regresin Por Pasos

Eliminacin Hacia Atrs

Se viola el supuesto de varianza constante

Si valor p tiende a cero hay presencia de heterocedasticidad

Transformaciones de potencia. Mnimos cuadrados generalizados Transformaciones Box-Cox

Los residuales estn correlacionados, es decir:

Das könnte Ihnen auch gefallen