Sie sind auf Seite 1von 9

Algunos Usos del Anlisis de Regresin Lineal:

Restricciones de los coeficientes lineales.- Dentro del contraste de restriccin lineal se


estudia la forma ms comn de realizar los contrastes de significatividad individual y el
contraste de significatividad conjunta sobre los coeficientes que acompaan a las
variables explicativas en un modelo de regresin lineal general. Estos contrastes son los
ms habituales y en general cualquier programa economtrico, como tambin es el caso
de Gretl, muestra por defecto los valores de los estadsticos correspondientes para
contrastar estas restricciones en el mismo output de estimacin.
En ocasiones, adems de estas, tambin podemos estar interesados en contrastar
hiptesis que implican otro tipo de restricciones lineales en los coeficientes
poblacionales del modelo.
En general, podemos denotar la hiptesis nula y la alternativa como:

H 0 : q K K 1 q 1
R

H 1 : R r

Siendo q el nmero de restricciones bajo la hiptesis nula y K el nmero de parmetros


en el modelo no restringido. La hiptesis alternativa implicara que al menos una de las
igualdades no se satisface.
Por ejemplo:
En el modelo sobre el precio de la vivienda como se muestra a continuacin.
Pi 1 2 F 2i 3 BEDRMS i 4 BATHS i i

Podemos expresar de esta forma los siguientes contrastes:


1. Contraste de significacin individual de la variable BEDRM: H 0 : 3 0

1

H 0 : R r 0 0 1 0 2 = 0
3

4
2. Contraste de significacin conjunta: H 0 : 2 3 4 0
0 1 0 0
H 0 : R r 0 0 1 0
0 0 0 1

1
0
2 0
3
0
4

3. Contraste de un subconjunto de coeficientes igual a cero, por ejemplo los que


acompaan a las variables BEDRMS y BATHS: H 0 : 3 4 0

1
0
0 0 1 0 2
H 0 : R r
0

0 0 0 1 3 0

4
Podemos ilustrar el inters de contrastar otro tipo de restricciones lineales en el
siguiente modelo para la inversin agregada de un pas,
Donde las variables implicadas son:
INVERR t 1 2 t 3 PNBRt 4 INTERES t 5 INFLACION t t

INVERR:
t:
PNBR:
INTERES:
INFLACION:

Inversin agregada,, en trminos reales.


Tiempo t = 1, 2, . . . , T
Producto Nacional Bruto, en trminos reales.
Tipo de Inters nominal.
Tasa de Inflacin.

Adems de realizar los contrastes de significatividad individual y conjunta, podramos


estar interesados en contrastar las siguientes restricciones lineales:
1. H 0 : 3 1, la propensin marginal a invertir es igual a 1, esto es, si aumenta el
PNB real en una unidad, la inversin aumentar en la misma proporcin,
manteniendo el valor del resto de variables constante.

1

2
H 0 : R r 0 0 1 0 0 3 1

4
5
2. H 0 : 4 5 0, los inversores tienen en cuenta el tipo de inters real. Esto es
la inversin no variara si un aumento del tipo de inters nominal viene
acompaado por un aumento de la misma magnitud de la tasa de inflacin,
manteniendo el resto de factores constantes.

1

2
H 0 : R r 0 0 0 1 1 3 0

4
5

3. H 0 : 2 0, 3 1, 4 5 0. Contraste conjunto de las dos restricciones


anteriores adems de la restriccin de que la inversin en media no presenta una
tendencia lineal.

0 1 0 0 0
H 0 : R r 0 0 1 0 0
0 0 0 1 1

1
0
2
3 1

4 0
5

El siguiente estadstico, conocido como estadstico F de Wald, se puede utilizar para


contrastar una o ms restricciones lineales en el contexto de un MRLG. Esta forma de
realizar el contraste solamente requiere estimar el modelo sin restringir.
Bajo las hiptesis bsicas la distribucin del estimador MCO del modelo sin restringir
es: ~ N ( , 2 ( X ' X ) 1 ). Por lo tanto, dado por Res una matriz de constantes de rango
q, se tiene que bajo la hiptesis nula.

Supongamos que el modelo


Yt 0 1 X 1t 2 X 2t 3 X 3t t
Una restriccin que puede aplicarse sobre el modelo es
b1 = b2= b3 = 0
Esta restriccin implica suponer que las variables independientes no ejercen ninguna
influencia sobre la variable independiente y puede ser testeada estadsticamente.
Esto es equivalente al test de significancia global.
Formalmente, para k variables explicativas, la prueba es:

H 0 : 1 2 K 0
H 1 : Al menos uno de los k s es diferente decero
El estadstico F se puede construirse a partir del R2 de la regresin estimada
F

n ( K 1)
R2
*
K
1 R2

grados de libertad en el numerado y n ( K 1)


grados de libertad en el denominador.
Tiene una distribucin F con K

Esta prueba es equivalente a comparar el modelo completo (con las k variables


explicativas) versus el modelo restringido. Para el caso del ejemplo, el modelo
restringido sera:
Yt 0 t

Este es un caso particular del problema general de imponer y testear restricciones sobre
los parmetros del modelo.
Por ejemplo, podemos imponer una restriccin alternativa sobre el modelo
b1 + b2 = 1
En este caso, si incorporamos la restriccin al modelo tenemos:
Yt 0 1 X 1t (1 1 ) X 2t 3 X 3t t
(Yt X 2t ) 0 1 ( X 1t X 2t ) 3 X 3t t

Este sera ahora el modelo restringido y con las correspondientes transformaciones en


las variables puede ser estimado por MCO.
Una forma general para testear la validez de restricciones lineales sobre los parmetros
es construir el estadstico F:

F = (SCRR - SCRNR)/q
(SCRNR)/(n k - 1)

Donde
SCRR: Suma de los Cuadrados de los errores de la Regresin Restringida
SCRNR: Suma de los Cuadrados de los errores de la Regresin No Restringida
q: grados de libertad del numerador (g.de lib rest g de lib no rest) (nmero de
restricciones)
k: nmero de variables independientes en el modelo irrestricto
n: nmero de observaciones
n k 1: grados de libertad del denominador (g. de lib no rest)
Dist ~ F (q, n-k-1)
El estadstico se distribuye como una F con (q grados de libertad en el numerador y (nk-1) en el denominador.

Esta versin general del test F puede utilizarse para cualquier restriccin que implique
una combinacin lineal de parmetros.
En el caso particular en el que la variable dependiente no cambia el test F puede
plantearse en trminos de los R2 calculados para las regresiones restringida y no
restringida.

F = (R2NR - R2R)/q
(1 - R2NR)/(n k - 1)

Dist. ~ F (q, n-k-1)


Forma funcional de las variables.- Los modelos economtricos relacionan una
variable dependiente con otras independientes o explicativas. Supone una relacin
exacta y determinista entre las variables.
y=f
Sin embargo, a nivel emprico las relaciones no son deterministas. De hecho, si se
especifica una relacin a travs de una funcin matemtica para una muestra
determinada con total seguridad habra ms de una observacin que no coincidira con
la funcin preestablecida.
Para considerar las relaciones inexactas entre las variables del mundo econmico
surgen los modelos economtricos. stos, adems de relacionar una variable
dependiente con otras independientes o explicativas (relacin de comportamiento),
introducen una componente aleatoria o trmino de error.
sta tiene un comportamiento estocstico y representa factores determinantes del
comportamiento de la variable endgena que los modelos no pueden recoger de
forma explcita. As, el comportamiento de la variable (y) viene explicado por un
modelo o relacin en la que se puede distinguir una parte determinista (integrada por las
variables explicativas) y una parte aleatoria.
Variables Dummy y anlisis de covarianza:
La variable Dummy (tambin conocido como un indicador variable, variable de diseo
indicador booleano, variable categrica, variable binaria o una variable cualitativa), es
uno que toma el valor de 0 o 1 para indicar la ausencia o la presencia de algn efecto
categrico, que se puede esperar para cambiar el resultado. Las variables ficticias se
utilizan como dispositivos para ordenar los datos excluyentes categricos, si el nmero
de submuestras es mayor a dos, se define una variable ficticia para cada una de ellas,
tomando valor de 1 en dicha sudmuestra y el valor de 0 en el resto de las observaciones
mustrales. Las variables ficticias pueden ser nominales y ordinales.

Al incluir variables dummys en un modelo de regresin, estimar sus coeficientes y


llevar a cabo los contrastes de significancia de las variables, es equivalente a estimar los
modelos restringido y no restringido.
Modelo de regresin simple con una sola variable dummy.
La expresin general de este modelo, est dada por:
Dnde:
Es la variable dependiente.
Es la variable explicativa dummy.
Estimamos en este el siguiente modelo:
Dnde:
Es el salario/hora en dlares.
Es la variable dummy que representa el sexo de las personas, y toma los valores de:
Cuando la persona es mujer.
Cuando la persona es hombre.
Es el parmetro que define la diferencia entre el salario/hora de las mujeres y hombres.
Si el coeficiente, las mujeres ganan (dado que la categora base es hombre), en
promedio, menos que los hombres.
NOTA:
Si una variable dummy tiene categoras, se debe introducir en el modelo a estimar,
variables cualitativas. Lo anterior, con el fin de evitar la trampa de la variable dictoma,
es decir, la situacin de multicolinealidad perfecta.
Como ejemplo a utilizar, la variable tendr dos categoras que le asignaremos que son:
Los salarios (hombre o mujer) y, por lo tanto, se introducir solamente una variable
dummy. Teniendo en cuenta lo anterior, siempre se deber tomar una categora como
base, con el fin de comparar las estimaciones realizadas con respecto a esa categora.
Anlisis de Covarianza
Un modelo de regresin que tiene una mescla de ambas variables cualitativas y
cuantitativas se lo conoce como anlisis de covarianza, modelo (ANCOVA). Modelos
de extensin de los modelos de ANOVA, siendo el control estadstico para los efectos

de las variables cuantitativas explicativas (tambin llamados covariables o variables de


control).
El anlisis de covarianza se refiere a los modelos en los que intervienen
simultneamente variables numricas y factores como variables independientes, el
anlisis de covarianza (ANCOVA) el cual es parte de los modelos generales lineales y
utiliza el anlisis de varianza y el de regresin para eliminar la variabilidad que provoca
una covariable (condicin basal o maniobra perifrica), sobre el desenlace (que siempre
es una variable cuantitativa), para estimar el efecto de la maniobra principal.
El ANCOVA fue desarrollado para reducir el error de la varianza en experimentos
aleatorizados, lo cual aumentaba tanto el poder estadstico de la prueba de hiptesis (a
travs de la inclusin de covariables al reducir la variabilidad) como la precisin en la
estimacin de los efectos. En el ANCOVA se consideran tres tipos de variables:
La o las variables independientes o maniobras (con las que se representan las
condiciones experimentales o grupos que se quieren comparar).

Las variables independientes o covariables (que representan las variables que se


quiere controlar).

La variable de desenlace (que es aquella sobre la cual actan los otros dos tipos
de variables).

Esta tcnica involucra un modelo de regresin mltiple en el que el desenlace se


presenta como variable continua, la maniobra (variable cualitativa) es introducida al
modelo como variable dummy o dicotmica y los factores por los que se requiere ajustar
el anlisis (covariables) pueden estar en cualquier tipo de medidas (nominales, ordinales
o continuas). Las maniobras pueden ser ingresadas al modelo como factores o efectos
fijos o factores o efectos aleatorios.
La diferencia entre manejar las maniobras como factor fijo o aleatorio depende del tipo
de informacin que queremos del anlisis de los efectos. En los efectos fijos,
usualmente nos interesa hacer comparaciones explcitas entre un grupo y otro.
Por ejemplo:
Cuando queremos comparar sujetos con distinto ndice de masa corporal (IMC) para ver
su asociacin con la tensin arterial, comparamos el grupo de peso normal, contra el
grupo que conforman los que tienen sobrepeso, obesidad y desnutricin. En este caso
tratamos la maniobra observacional (IMC) como un efecto fijo.
Aun cuando nuestro inters no est especficamente en una variable, existe, sin
embargo, la posibilidad de que esta agregue variacin al modelo; entonces esta variable
debera ser tratada como una variable de efectos aleatorios.

Para aclarar este concepto, imaginemos que queremos estudiar el efecto del gnero
sobre las horas de participacin en un programa de ejercicio en una muestra de 10
estados de la repblica; en este ejemplo, la variable de agrupacin (que sera el estado
de la repblica) debera ser tratada como factor aleatorio, ya que la variable dependiente
o de desenlace es la cantidad de horas de participacin en el programa de ejercicio y la
variable independiente o maniobra es el gnero. Incluir esta variable de efectos
aleatorios puede mejorar la varianza explicada por el gnero.
El ANCOVA separa el efecto de las maniobras del efecto de las covariables, es decir,
corrige la variable de respuesta eliminando la influencia de las covariables por el hecho
de que estas varan conjuntamente con las maniobras o tratamientos, lo cual afecta la
variable de desenlace.
En el anlisis de la covarianza se realiza el siguiente modelo de regresin:
Y

Dnde:
Y = desenlace (peso del recin nacido)
X = covariable (ganancia de peso en el embarazo).
Z = variable dicotmica que representa los grupos que se van a comparar (anmica y
no anmica) (Z = 0 para un grupo y Z = 1 para otro grupo, etctera).
E = error.
De acuerdo con este modelo, las medias ajustadas para los grupos se definen como los
valores predichos obtenidos al evaluar el modelo con Z= 0 y Z = 1, cuando se asume
artificialmente que X tiene el mismo promedio general de la covariable para todos los
grupos, este procedimiento es equivalente a asumir una distribucin comn de las
covariables que est basada en la muestra combinada de todos los grupos.
Los promedios corregidos por las covariables se llaman medias mnimo-cuadrticas
corregidas (LSMEANS, por sus siglas en ingls least-squares means) y se calculan
de la siguiente manera:

Y : Y b yx X i X
Despus de realizar el modelo de regresin y calcular las medias ajustadas, se realiza
una prueba de hiptesis de F ( H 0 : 2 0 ) para determinar si dichas medidas ajustadas
son significativamente diferentes.

La relacin entre la covariable y el desenlace es lineal

Existe homogeneidad de las pendientes.

Se comprueba la independencia entre la covariable y la maniobra o tratamiento.

Supuestos:
La relacin entre X y Y debe ser lineal. Este supuesto se prueba si se hace un anlisis de
regresin lineal simple entre la covariable (X) y la respuesta (Y). La regresin debe ser
significativa, es decir, con p< 0.05.
Homogeneidad de las pendientes. Las pendientes de todos los grupos de tratamiento
deben ser iguales o aproximadamente iguales; es decir, no hay interaccin entre las
variables de estudio y las covariables. Este supuesto se prueba verificando que la
interaccin del tratamiento por la covariable no sea significativa.
Supuesto de independencia entre la covariable (X) y el tratamiento. Este supuesto se
prueba realizando un ANOVA en el que la covariable (X) sea declarada variable
dependiente y los tratamientos sean declarados como variables independientes. La
prueba de F debe resultar no significativa.
Consideraciones:
Tericamente no hay lmites para el nmero de covariables que pueden usarse, pero la
prctica ha demostrado que 4 o 5 son suficientes; ms all de este nmero, se generan
problemas de colinealidad.
Las covariables son variables independientes que afectan la respuesta, pero sobre las
cuales no se ha podido ejercer control por criterios de seleccin o por alguna otra razn.
Las covariables deben ser medidas en escala de razn, intervalar o nominal.
Las covariables no deben estar relacionadas con las maniobras o condiciones
experimentales.
Las covariables deben estar relacionadas con el desenlace (variable dependiente o de
respuesta).
Las covariables deben poseer una relacin lineal con la variable de respuesta. De no ser
as, se debe aplicar una transformacin para convertir la relacin en lineal. Esta
transformacin puede ser logartmica, recproca, arcoseno, exponencial o de raz.

Das könnte Ihnen auch gefallen