Comandos en Stata Xtreg

xtreg Fixed-, between-, and random-effects and population-averaged linear
models.
xtreg - Fijo, entre-, y de efectos aleatorios y los modelos lineales de promedio de la
poblacin.
GLS random-effects (RE) model
Between-effects (BE) model
Fixed-effects (FE) model
ML random-effects (MLE) model
Population-averaged (PA) model
Se debe especificar sus variables como panel. Para xtreg, pa, estructuras de
correlacin que no sean intercambiables e independientes requieren que una
variable de tiempo tambin se especifique.
xtset declara los datos en la memoria para ser un panel. Usted debe convertir sus
datos con xtset antes de usar otros comandos xt. Si guarda sus datos despus
xtset, los datos sern recordados como un grupo especial y no tendr que usar
xtset de nuevo.
Hay dos sintaxis para establecer los datos:
xtset panelvar
xtset panelvar timevar
En la primera sintaxis xtset panelvar-los datos se fijan para ser un panel y el orden
de las observaciones dentro del panel se considera irrelevante. Por ejemplo, el
panel var podra ser un pas y las observaciones en el tiempo podra ser la ciudad.
En la segunda sintaxis - xtset timevar panelvar -los datos han de ser un panel y el
orden de las observaciones dentro del panel se consideran ordenado por timevar.
Por ejemplo, en los datos recogidos de los levantamientos repetidos de las
mismas personas en distintos aos, panelvar podra ser persona y timevar, aos.
Cuando se especifica timevar, usted puede entonces utilizar operadores de series
de tiempo de Stata como L. y F. entre otros comandos.
xtset sin argumentos xtset: muestra cmo son actualmente los datos. Si los datos
se ajustan con un panelvar y un timevar, xtset tambin ordena los datos por
timevar panelvar. Si los datos se establecen con slo un panelvar, el orden de
clasificacin no se cambia.
Ejemplo:
Algunos conjuntos de datos de panel contienen una variable de tiempo. Abdata.dta
conjunto de datos contiene los datos de demanda de trabajo de un grupo de firmas
en el Reino Unido. stos son los datos salariales de las dos primeras firmas en el
conjunto de datos:
id
1
2
3
4
5
6
7
8
9
10
11
12
13
14
year
1
1
1
1
1
1
1
2
2
2
2
2
2
2
1977
1978
1979
1980
1981
1982
1983
1977
1978
1979
1980
1981
1982
1983
wage
131.516
123.018
128.395
138.039
142.897
148.681
137.784
147.909
141.036
149.534
15.491
161.969
161.314
163.051
Comandos:
. list id year wage if id==1 | id==2, sepby(id)
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
+---------------------+
| id
year
wage |
|---------------------|
| 1
1977
131.516 |
| 1
1978
123.018 |
| 1
1979
128.395 |
| 1
1980
138.039 |
| 1
1981
142.897 |
| 1
1982
148.681 |
| 1
1983
137.784 |
|---------------------|
| 2
1977
147.909 |
| 2
1978
141.036 |
| 2
1979
149.534 |
| 2
1980
15.491 |
| 2
1981
161.969 |
| 2
1982
161.314 |
| 2
1983
163.051 |
+---------------------+
To declare this dataset as a panel dataset, you type

xtset id year, yearly
panel variable: id (strongly balanced)
time variable: year, 1977 to 1983
delta: 1 year
. . list id year wage L.wage if id==1 | id==2, sepby(id)
+-------------------------------+
|
L.|
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
| id
year
wage
wage |
|-------------------------------|
| 1
1977
131.516
. |
| 1
1978
123.018
131.516 |
| 1
1979
128.395
123.018 |
| 1
1980
138.039
128.395 |
| 1
1981
142.897
138.039 |
| 1
1982
148.681
142.897 |
| 1
1983
137.784
148.681 |
|-------------------------------|
| 2
1977
147.909
. |
| 2
1978
141.036
147.909 |
| 2
1979
149.534
141.036 |
| 2
1980
15.491
149.534 |
| 2
1981
161.969
15.491 |
| 2
1982
161.314
161.969 |
| 2
1983
163.051
161.314 |
+-------------------------------+
Data Panel
El contexto bsico de un anlisis lineal de datos de panel consiste en un modelo
de regresin de la forma:
yit xit u it
donde el subndice
cruzada,
t 1,2,..., Ti
toma los valores 1,2, , N e indica la unidad de seccin
indica los diferentes periodos de tiempo,
dependientes o explicadas (regresando),
explicativas (regresor),
xit
y it
son las variables
las variables independientes o
es el vector de parmetros a estimar y
u it
el trmino de
error o perturbacin aleatoria, todos ellos componentes del modelo clsico de

regresin lineal.
Si para cada unidad de seccin cruzada existe el mismo nmero de observaciones
temporales, es decir, si
T Ti
para cada
, se dice que el panel de datos est
equilibrado (balanceado).
Es habitual para el estudio de los distintos estimadores disponibles asumir que el
error aleatorio se descompone en dos o tres trminos, a los cuales se les
denomina Modelo de componente de error (Error Component Regression Model).
La mayora de las aplicaciones de datos de panel utilizan un modelo de
componentes de error de un solo sentido de las perturbaciones, con:
Modelo de componente de error I:
Tenga en cuenta que
u it i vit
es invariante en el tiempo y da cuenta de cualquier
efecto-individual especfico que no est incluido en la regresin. En este caso

podramos pensar en ella como la habilidad no observada de la persona. La
restante perturbacin
vit
vara con las personas y el tiempo y puede ser pensado
como la perturbacin habitual en la regresin.
xtreg and associated commands Example
1: Between-effects model
xtreg y asociado comandos
Modelo de Entre-efectos
Usando nlswork.dta vamos a modelar logaritmo natural de salario en trminos de
aos completos de escolaridad (grado), la edad actual y la edad al cuadrado, aos
actuales trabajados (experiencia) y experiencia al cuadrado, aos actuales de la
tenencia en el trabajo y la tenencia actual al cuadrado, ya sea negro (carrera = 2),
tanto si residen en un rea no designada como rea estadstica metropolitana
estndar (AEME), y tanto si residen en el Sur.
. webuse nlswork.dta, clear
(National Longitudinal Survey.
Young Women 14-26 years of age in 1968)
. xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure

2.race not_smsa south, be
Between regression (regression on group means)
Number of obs
28091
Group variable: idcode
Number of groups
4697
R-sq:
= 0.1591
Obs per group: min =
between = 0.4900
avg =
6.0
overall = 0.3695
max =
15
F(10,4686)
450.23
Prob > F
0.0000
within
sd(u_i + avg(e_i.))=
.3036114
------------------------------------------------------------------------------------ln_wage |
Coef.
Std. Err.
P>|t|
[95% Conf. Interval]
--------------------+---------------------------------------------------------------grade |
.0607602
.0020006
30.37
0.000
.0568382
.0646822
age |
.0323158
.0087251
3.70
0.000
.0152105
.0494211
-.0005997
.0001429
-4.20
0.000
-.0008799
-.0003194
.0138853
.0056749
2.45
0.014
.0027598
.0250108
.0007342
.0003267
2.25
0.025
.0000936
.0013747
.0698419
.0060729
11.50
0.000
.0579361
.0817476
-.0028756
.0004098
-7.02
0.000
-.0036789
-.0020722
2.race |
-.0564167
.0105131
-5.37
0.000
-.0770272
-.0358061
not_smsa |
-.1860406
.0112495
-16.54
0.000
-.2080949
-.1639862
|
c.age#c.age |
|
ttl_exp |
|
c.ttl_exp#c.ttl_exp |
|
tenure |
|
c.tenure#c.tenure |
|
south |
-.0993378
.010136
-9.80
0.000
-.1192091
-.0794665
_cons |
.3339113
.1210434
2.76
0.006
.0966093
.5712133
-------------------------------------------------------------------------------------
La regresin entre-efectos se estima en personas-promedios, por lo que la "n = 4697"

nmero es relevante. xtreg, ya sea los informes del "nmero de observaciones" y la
informacin del tamao del grupo, se demuestra que tenemos 28.534 "observaciones"
-person aos, en realidad- de datos. Si tomamos la submuestra que no tiene valores
perdidos en el salario ln, grado, ..., al sur nos deja con 28.091 observaciones sobre
personas-ao, reflejando 4.697 personas, cada observado durante un promedio de 6,0
aos.
Por la bondad de ajuste, el R2 betwen es directamente relevante; nuestra R2 es 0,4900.
Sin embargo, si utilizamos estas estimaciones para predecir within modelo, tenemos un
R2 de 0,1591. Si utilizamos estas estimaciones para ajustar los datos generales, nuestra
R2 es 0.3695.
wls especifica que, para datos desbalanceados, mnimos cuadrados ponderados ser
utilizado en lugar de los OLS predeterminados. Ambos mtodos producen estimaciones
consistentes. La verdadera varianza de los efectos entre-residuales es 2 + Ti2? (ver
xtreg, estar en Mtodos y frmulas abajo). WLS produce una variacin "estabilizado" de
2 / Ti + 2?, Que tambin no es constante. As, la eleccin entre OLS y WLS equivale
a que es ms estable.
Comentario: xtreg,
be rara vez se utiliza, pero entre las estimaciones son un
ingrediente en la estimacin de efectos aleatorios. Nuestra implementacin de xtreg, re

utiliza las estimaciones de MCO para este componente, segn nuestro criterio que 2 es
grande en relacin con (2 e) en la mayora de los modelos. Formalmente, slo se
requiere una estimacin consistente entre las estimaciones.
El anlisis estadstico F que los coeficientes de los regresores grado, edad, ..., al sur son
todos conjuntamente cero. Nuestro modelo es significativo. El error cuadrtico medio de la
regresin ajustada, que es una estimacin de la desviacin estndar de i +ei, es 0.3036.
Para nuestros coeficientes, cada ao de escolaridad aumenta los salarios por hora de
6,1%; la edad aumenta los salarios hasta 26.9 aos y despus de eso disminuye (debido
a que la ecuacin cuadrtica ax2 + bx + c se convierte ms en x = -b / 2a, que para
nuestra edad y c.age # c.age coeficientes es 0,0323158 / (2 x 0,0005997 ) 26.9), aqu b
= age, c.age # c.age = a; la experiencia total aumenta los salarios a un ritmo creciente
(que es sorprendente e inconveniente); antigedad en el empleo actual aumenta los
salarios hasta tener 12,1 aos 0,0698419/ (2 x 0,0028756 ) 12,1), y posteriormente les
disminuye; los salarios de los negros son, estas cosas mantienen constantes,
(aproximadamente) un 5,6% inferior a la de los no negros (aproximadamente porque
2.race es un indicador variable); si reside en un no-SMSA (zona rural) reduce los salarios
en 18,6%; y si residen en el sur reduce los salarios en un 9,9%.
2. Fixed-effects model
El modelo de efectos fijos
Dado
u it i vit
En este caso, los
se supone que son los parmetros fijos a ser estimados y el
resto perturbaciones estocstico con
vit
independientes e idnticamente
distribuidas con media cero y varianza sigma cuadrado.
independientemente de
vit
xit
se supone
para todo i y t. El modelo de efectos fijos es una
especificacin adecuada si nos estamos centrando en un conjunto especfico de N

firmas, es decir, IBM, GE, Westinghouse, etc. y nuestra inferencia se limita a la
conducta de estos conjuntos de firmas. Alternativamente, podra ser un conjunto

de pases de la OCDE o Estados Americanos. La inferencia en este caso est
supeditada a los particulares N firmas, pases o Estados que se observan.
Ejemplo: en STATA
Utilizando nlswork.data, vamos a modelar ln(wage) en trminos de aos completos

de escolaridad (grado), la edad actual y la edad al cuadrado, aos actuales
trabajados (experiencia) y la experiencia al cuadrado, aos en el trabajo actual,
aos en el trabajo actual al cuadrado, si es negro (raza = 2), tanto si residen en un
rea no designada como metropolitana estndar (AEME), y tanto si residen en el
Sur.


2.race not_smsa south, fe
note: grade omitted because of collinearity
note: 2.race omitted because of collinearity
Fixed-effects (within) regression
Number of obs
28091
Number of groups
4697
R-sq:
= 0.1727
between = 0.3505
avg =
6.0
overall = 0.2625
max =
15
F(8,23386)
610.12
Prob > F
0.0000
within
corr(u_i, Xb)
= 0.1936
(The errors ui are correlated with the regressors in the fixed effects model)
------------------------------------------------------------------------------------ln_wage |
Coef.
Std. Err.
P>|t|
--------------------+---------------------------------------------------------------grade |
(omitted)
age |
.0359987
.0033864
10.63
0.000
.0293611
.0426362
-.000723
.0000533
-13.58
0.000
-.0008274
-.0006186
|
c.age#c.age |
|
ttl_exp |
.0334668
.0029653
11.29
0.000
.0276545
.039279
.0002163
.0001277
1.69
0.090
-.0000341
.0004666
.0357539
.0018487
19.34
0.000
.0321303
.0393775
-.0019701
.000125
-15.76
0.000
-.0022151
-.0017251
2.race |
(omitted)
not_smsa |
-.0890108
.0095316
-9.34
0.000
-.1076933
-.0703282
south |
-.0606309
.0109319
-5.55
0.000
-.0820582
-.0392036
_cons |
1.03732
.0485546
21.36
0.000
.9421496
1.13249
|
|
tenure |
|
c.tenure#c.tenure |
|
--------------------+---------------------------------------------------------------sigma_u |
.35562203
sigma_e |
.29068923
rho |
.59946283
(|)
------------------------------------------------------------------------------------F test that all u_i=0:
F(4696, 23386) =
6.65
Prob > F = 0.0000
El R2 within es (0,1727), y la R2 betwen es (0,3505), como se esperaba,

debido a que el estimador betwen maximiza R2 betwen y within de la
estimador R2 within. En trminos de ajuste overall, estas estimaciones son
(0,2625). xtreg, fe puede estimar y e, aunque la forma de interpretar
estas estimaciones depende de si est utilizando xtreg para ajustar un modelo de
efectos fijos o de efectos aleatorios. Para aclarar este punto, en el modelo de
efectos fijos, i se fija -formalmente no tienen distribucin. Si se toma este punto
de vista, se debe pensar en l, como una mera forma aritmtica reportado para
describir el rango de los i estimados por efectos fijos. Sin embargo, si usted est
utilizando el estimador de efectos fijos del modelo de efectos aleatorios, 0.355622
es una estimacin de o sera si no existieran variables omitidas.
Cuando se testea si se estima por efectos fijos o agrupados por medio de la
prueba F, se puede inferir que es preferible estimar por efectos fijos que con datos
agrupados, dado que el p-value indica que se rechaza la hiptesis nula.
Ecuaciones
y it xit i vit
(1)
y i x i i vi
( 2)
y it y i ( xit xi ) (vit vi )
(3)
El R-Cuadrado
y it xit
(1)
y it xi
(2)
~
y it ( y it y i ) ( xit xi )
(3)
xtreg informa "R-cuadrados" correspondientes a estas tres ecuaciones. R-cuadrado estn

entre comillas porque el R-cuadradas reportados no tienen todas las propiedades de la
OLS.
R-sq:
within
= 0.1727
3 ecuacin
between = 0.3505
2 ecuacin
overall = 0.2625
1 ecuacin
En particular, xtreg, be obtiene sus estimaciones mediante la realizacin de MCO de

la ecuacin (2), y por tanto su R2 reportado betwen es un R2 ordinario. Los otros dos R2
reportados no son ms que las correlaciones al cuadrado, o, si lo prefiere, R2s de las
regresiones de segunda ronda.
El xtreg, fe obtiene sus estimaciones mediante la realizacin de MCO de la ecuacin
(3), por lo que su R2 calculado within es un R2 ordinaria. Al igual que con be, los otros
R2s son correlaciones al cuadrado, o, si lo prefiere, R2s del regresiones de segunda
ronda.
El xtreg, re proporciona el estimador de efectos aleatorios y es un (matriz) promedio
ponderado de las estimaciones producidas por el entre y dentro de los estimadores. En
particular, el estimador de efectos aleatorios resulta ser equivalente a la estimacin de
( y it y i ) (1 ) ( xit xi ) 1 i vit vi
Donde est en funcin de la varianza de los errores de
errores de
vi
(4)
y la varianza de los
. Si la primera varianza es cero, esto significa que los primeros
errores son siempre cero, entonces es siempre cero entonces se puede estimar
por la ecuacin (1). El R2 reportado en la salida corresponde a la ecuacin (4) en
ningn caso a las 3 ecuaciones. Los tres R2s son correlaciones al cuadrado, o, si
lo prefiere, R2s de regresiones de segunda ronda.
Las pruebas para la dependencia de la seccin transversal / correlacin
contempornea: el uso de Breusch-Pagan LM de la independencia
Segn Baltagi, la dependencia de la seccin transversal es un problema en los paneles
macro con una larga serie de tiempo (ms de 20-30 aos). Esto no es un gran problema
en los paneles micro (pocos aos y gran nmero de casos). La hiptesis nula en la prueba
de BP / LM de la independencia es que los residuos a travs de entidades no estn

correlacionados. El comando para ejecutar esta prueba es xttest2 (ejecutarlo despus
xtreg, fe):
Ejemplo
xttest2
Las pruebas para la seccin transversal dependencia / correlacin contempornea:

El uso de la prueba de CD Pasaran
Como se mencion en la diapositiva anterior, la dependencia de la seccin transversal es
ms de un problema en los paneles macro con series de tiempo largo (ms de 20 a 30
aos) que en los micro paneles. Prueba de CD Pasaran (dependencia de la seccin
transversal) se utiliza para probar si los residuos estn correlacionados entre entidades *.
La dependencia de la seccin transversal puede llevar a un sesgo en los resultados de
pruebas (tambin llamado correlacin contempornea). La hiptesis nula es que los
residuos no estn correlacionados. El comando de la prueba se xtcsd, tienes que
instalarlo escribiendo ssc install xtcsd
Ejemplo
xtcsd, pesaran abs
Testing for heteroskedasticity

Ejemplo
. xttest3
Modified Wald test for groupwise heteroskedasticity

in fixed effect regression model
H0: sigma(i)^2 = sigma^2 for all i
chi2 (4697)
Prob>chi2 =
2.2e+36
0.0000
Las pruebas de correlacin serial

Las pruebas de correlacin en series se aplican a los paneles de macro con una
larga serie de tiempo (ms de 20 a 30 aos). No es un problema en micro paneles
(con muy pocos aos). Correlacin de serie hace que los errores estndar de los
coeficientes a ser ms pequeas de lo que realmente son y superior R cuadrado.
Una prueba Lagram-Multiplicador de correlacin serial est disponible utilizando el
xtserial comandos. Este es un programa escrito por el usuario, para instalarlo
escriba ssc install xttserial
El modelo de efectos aleatorios

Si hay demasiados parmetros en el modelo de efectos fijos y se presenta prdida de
grados de libertad se pueden evitar si el i puede suponerse al azar. En este caso i ~IID
(0, 2 ), it ~IID (0, 2) y el i son independientes de la it. Adems, el Xit son
independientes de la i y it, para todo i y t. El modelo de efectos aleatorios es una

especificacin adecuada si estamos trabajando con N individuos al azar de una
poblacin grande. Este suele ser el caso de los estudios de panel de los hogares.
Hay que tener cuidado en el diseo del panel para que sea "representativa" de la
poblacin sobre la cual estamos tratando de hacer inferencias. En este caso, N es
generalmente grande y un modelo de efectos fijos dara lugar a una enorme
prdida de grados de libertad. El efecto individual se caracteriza por ser aleatorio y
la inferencia pertenece a la poblacin elegida al azar.
Ejemplo en STATA
. xtset
panel variable:
time variable:
idcode (unbalanced)
year, 68 to 88, but with gaps
delta:
1 unit

2.race not_smsa south
Random-effects GLS regression
Number of obs
28091
Number of groups
4697
R-sq:
= 0.1715
between = 0.4784
avg =
6.0
overall = 0.3708
max =
15
Wald chi2(10)
9244.74
Prob > chi2
0.0000
within
corr(u_i, X)
= 0 (assumed)
------------------------------------------------------------------------------------ln_wage |
Coef.
Std. Err.
P>|z|
--------------------+---------------------------------------------------------------grade |
.0646499
.0017812
36.30
0.000
.0611589
.0681409
age |
.0368059
.0031195
11.80
0.000
.0306918
.0429201
-.0007133
.00005
-14.27
0.000
-.0008113
-.0006153
.0290208
.002422
11.98
0.000
.0242739
.0337678
.0003049
.0001162
2.62
0.009
.000077
.0005327
.0392519
.0017554
22.36
0.000
.0358113
.0426925
-.0020035
.0001193
-16.80
0.000
-.0022373
-.0017697
|
c.age#c.age |
|
ttl_exp |
|
|
tenure |
|
c.tenure#c.tenure |
|
2.race |
-.053053
.0099926
-5.31
0.000
-.0726381
-.0334679
not_smsa |
-.1308252
.0071751
-18.23
0.000
-.1448881
-.1167622
south |
-.0868922
.0073032
-11.90
0.000
-.1012062
-.0725781
_cons |
.2387207
.049469
4.83
0.000
.1417633
.3356781
--------------------+---------------------------------------------------------------sigma_u |
.25790526
sigma_e |
.29068923
rho |
.44045273
(fraction of variance due to u_i)
-------------------------------------------------------------------------------------
Estimamos que la escolaridad tiene una tasa de retorno del 6,5%; que el aumento
de los salarios con la edad gira en torno en 25,8 aos; que la experiencia total
aumenta an ms los salarios cada vez ms; que el efecto de antigedad en la
empresa gira en torno en 9,8 aos; que el ser negro reduce los salarios en un
5,3%; que vivir en el rea reduce los salarios 13,1%; y que vivir en el Sur reduce
los salarios 8,7%.
La interpretacin de los coeficientes es complicada ya que

incluyen
tanto
los
efectos
dentro
de-entidad
entre
entidades. En el caso de los datos TSCS representa el efecto

promedio de X sobre Y cuando los cambios de X a travs del
tiempo y entre pases en una unidad.
La prueba LM le ayuda a decidir entre una regresin de efectos aleatorios y una
simple regresin MCO. La hiptesis nula de la prueba LM es que las diferencias a
travs de organismos son cero. Esto es, no hay una diferencia significativa entre
las unidades (es decir, sin efecto el panel). El comando de Stata es xttest0
escribirla inmediatamente despus de ejecutar el modelo de efectos aleatorios.
. xttest0
Breusch and Pagan Lagrangian multiplier test for random effects
ln_wage[idcode,t] = Xb + u[idcode] + e[idcode,t]
Estimated results:
|
Var
sd = sqrt(Var)
---------+-----------------------------
Test:
ln_wage |
.2283326
.4778416
e |
.0845002
.2906892
u |
.0665151
.2579053
Var(u) = 0
chibar2(01) = 14779.98
Prob > chibar2 =
0.0000
Aqu se rechaza la hiptesis nula y concluir que los efectos aleatorios son apropiados.
Esto es, hay evidencia de diferencias significativas entre los distintos pases, por lo tanto,
puede ejecutarse el data panel.
Otra salidas
Interpretacin del TEST LM
Aqu no pudimos rechazar la hiptesis nula y concluir que los efectos aleatorios no es
apropiado. Esto es, no hay evidencia de diferencias significativas entre los distintos
pases, por lo tanto, puede ejecutar una sencilla regresin MCO.
Las pruebas para la dependencia de la seccin transversal / correlacin contempornea:

el uso de Breusch-Pagan LM de la independencia
Segn Baltagi, la dependencia de la seccin transversal es un problema en los paneles
macro con una larga serie de tiempo (ms de 20-30 aos). Esto no es un gran problema
en los paneles micro (pocos aos y gran nmero de casos). La hiptesis nula en la prueba
de BP/LM de la independencia es que los residuos a travs de organismos no estn
correlacionados. El comando para ejecutar esta prueba es xttest2 (ejecutarlo despus
xtreg, fe):
Fixed or Random: Hausman test

. xtset
panel variable:
time variable:
idcode (unbalanced)
year, 68 to 88, but with gaps
delta:
1 unit

2.race not_smsa south, fe
note: grade omitted because of collinearity
note: 2.race omitted because of collinearity
Fixed-effects (within) regression
Number of obs
28091
Number of groups
4697
R-sq:
within
= 0.1727
between = 0.3505
avg =
6.0
overall = 0.2625
max =
15
F(8,23386)
610.12
Prob > F
0.0000
corr(u_i, Xb)
= 0.1936
------------------------------------------------------------------------------------ln_wage |
Coef.
Std. Err.
P>|t|
--------------------+---------------------------------------------------------------grade |
(omitted)
age |
.0359987
.0033864
10.63
0.000
.0293611
.0426362
-.000723
.0000533
-13.58
0.000
-.0008274
-.0006186
.0334668
.0029653
11.29
0.000
.0276545
.039279
.0002163
.0001277
1.69
0.090
-.0000341
.0004666
.0357539
.0018487
19.34
0.000
.0321303
.0393775
-.0019701
.000125
-15.76
0.000
-.0022151
-.0017251
|
c.age#c.age |
|
ttl_exp |
|
|
tenure |
|
c.tenure#c.tenure |
|
2.race |
(omitted)
not_smsa |
-.0890108
.0095316
-9.34
0.000
-.1076933
-.0703282
south |
-.0606309
.0109319
-5.55
0.000
-.0820582
-.0392036
_cons |
1.03732
.0485546
21.36
0.000
.9421496
1.13249
--------------------+---------------------------------------------------------------sigma_u |
.35562203
sigma_e |
.29068923
rho |
.59946283
-------------------------------------------------------------------------------------
F test that all u_i=0:
F(4696, 23386) =
6.65
Prob > F = 0.0000
. estimates store fixed

2.race not_smsa south, re
Random-effects GLS regression
Number of obs
28091
Number of groups
4697
R-sq:
within
= 0.1715
between = 0.4784
avg =
6.0
overall = 0.3708
max =
15
Wald chi2(10)
9244.74
Prob > chi2
0.0000
corr(u_i, X)
= 0 (assumed)
------------------------------------------------------------------------------------ln_wage |
Coef.
Std. Err.
P>|z|
--------------------+---------------------------------------------------------------grade |
.0646499
.0017812
36.30
0.000
.0611589
.0681409
age |
.0368059
.0031195
11.80
0.000
.0306918
.0429201
-.0007133
.00005
-14.27
0.000
-.0008113
-.0006153
|
c.age#c.age |
|
ttl_exp |
.0290208
.002422 1
11.98
0.000
.0242739
.0337678
|
.0003049
.0001162
2.62
0.009
.000077
.0005327
.0392519
.0017554
22.36
0.000
.0358113
.0426925
-.0020035
.0001193
-16.80
0.000
-.0022373
-.0017697
|
tenure |
|
c.tenure#c.tenure |
|
2.race |
-.053053
.0099926
-5.31
0.000
-.0726381
-.0334679
not_smsa |
-.1308252
.0071751
-18.23
0.000
-.1448881
-.1167622
south |
-.0868922
.0073032
-11.90
0.000
-.1012062
-.0725781
_cons |
.2387207
.049469
4.83
0.000
.1417633
.3356781
--------------------+---------------------------------------------------------------sigma_u |
.25790526
sigma_e |
.29068923
rho |
.44045273
------------------------------------------------------------------------------------. estimates store random

. hausman fixed random
---- Coefficients ---|
(b)
fixed
(B)
random
(b-B)
Difference
sqrt(diag(V_b-V_B))
S.E.
-------------+---------------------------------------------------------------age |
.0359987
.0368059
-.0008073
.0013177
c.age#c.age |
-.000723
-.0007133
-9.68e-06
.0000184
ttl_exp |
.0334668
.0290208
.0044459
.001711
c.ttl_exp#~p |
.0002163
.0003049
-.0000886
.000053
tenure |
.0357539
.0392519
-.003498
.0005797
c.tenure#c~e |
-.0019701
-.0020035
.0000334
.0000373
not_smsa |
-.0890108
-.1308252
.0418144
.0062745
south |
-.0606309
-.0868922
.0262613
.0081345
-----------------------------------------------------------------------------b = consistent under Ho and Ha; obtained from xtreg

B = inconsistent under Ha, efficient under Ho; obtained from xtreg
Test:
Ho:
difference in coefficients not systematic

chi2(8) = (b-B)'[(V_b-V_B)^(-1)](b-B)
=
149.43
Prob>chi2 =
0.0000
If this is < 0.05 (i.e. significant) use fixed effects.

.
Supongamos que disponemos de dos estimadores 1 y 2 y sabemos adems

que uno de ellos, 2 es el ms eficiente (tiene menor varianza). El test calcula con
una formulacin especial, con distribucin chi cuadrado, las diferencias en las
estimaciones comunes a ambos modelos. Si las diferencias, aunque sean altas,
no son sistemticas (no tienen un sesgo definido), entonces ambos estimadores
son consistentes (la estimacin muestral tiende al parmetro poblacional, significa
que a medida que crece el tamao de la muestra las estimaciones que nos
proporciona el estimador se aproximan cada vez ms al valor del parmetro
poblacional) y nos quedaremos con el ms eficiente 2. Si las diferencias son
sistemticas entonces nuestra hiptesis no se cumple, ambos no son consistentes
y ahora tenemos un dilema: pensar que el modelo est mal especificado en ambos
casos o quedarnos con el estimador consistente, que es 1
Si el valor de la prueba es alto (p.e. p-valor menor de 0.05) la hiptesis de

diferencias no sistemticas se rechaza, por lo que: o se reelabora el modelo o se
elige al que se considera consistente en cualquier caso 1.
Si el valor de la prueba es bajo (p.e. p-valor mayor de 0.05) la hiptesis nula, de
diferencias no sistemticas, se cumple y podemos elegir cualquiera de los dos
estimadores, normalmente el que suponemos ms eficiente, 2.
Esta prueba se puede realizar con cualesquiera dos modelos de regresin que
queramos comparar. 1 ser el modelo del que estemos ms seguros, que
suponemos consistente en cualquier caso y 2 ser el modelo que queremos
testar, que es ms eficiente pero no estamos seguros de que sea consistente. Si
los coeficientes de ambos modelos no tienen errores sistemticos podremos
quedarnos con 2 , si, por el contrario, aparecen errores sistemticos entonces 2
no es consistente y debemos quedarnos con 1 . Por ejemplo esta prueba se
puede realizar para saber si es mejor el estimador de efectos fijos o variables en
una base de datos de panel. Para ello se estima el modelo de efectos fijos ( 1 ) y
el de efectos variables ( 2 ) si no existen diferencias o sesgo significativo (p-valor
alto) nos quedamos con el de efectos variables, ms eficiente, pero si se detectan
diferencias sistemticas (p-valor bajo) debemos quedarnos con el de efectos fijos,
que hemos supuesto siempre consistente.
Es importante hacer notar que estamos suponiendo que un modelo es siempre
consistente ( 1 ) y que, en caso de igualdad en las estimaciones, otro es el ms
eficiente ( 2 ), estas suposiciones son difciles de contrastar y, a menudo, se
incumplen. Pero esa es otra historia.

Comandos en Stata Xtreg

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Comandos en Stata Xtreg

Hochgeladen von

Copyright:

Verfügbare Formate

xtreg Fixed-, between-, and random-effects and population-averaged linear

To declare this dataset as a panel dataset, you type

toma los valores 1,2, , N e indica la unidad de seccin

indica los diferentes periodos de tiempo,

dependientes o explicadas (regresando),

son las variables

las variables independientes o

es el vector de parmetros a estimar y

error o perturbacin aleatoria, todos ellos componentes del modelo clsico de

Si para cada unidad de seccin cruzada existe el mismo nmero de observaciones

, se dice que el panel de datos est

Modelo de componente de error I:

Tenga en cuenta que

es invariante en el tiempo y da cuenta de cualquier

efecto-individual especfico que no est incluido en la regresin. En este caso

vara con las personas y el tiempo y puede ser pensado

como la perturbacin habitual en la regresin.

xtreg and associated commands Example

Young Women 14-26 years of age in 1968)

. xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure

Group variable: idcode

Obs per group: min =

[95% Conf. Interval]

La regresin entre-efectos se estima en personas-promedios, por lo que la "n = 4697"

be rara vez se utiliza, pero entre las estimaciones son un

ingrediente en la estimacin de efectos aleatorios. Nuestra implementacin de xtreg, re

El modelo de efectos fijos

En este caso, los

se supone que son los parmetros fijos a ser estimados y el

resto perturbaciones estocstico con

distribuidas con media cero y varianza sigma cuadrado.

para todo i y t. El modelo de efectos fijos es una

especificacin adecuada si nos estamos centrando en un conjunto especfico de N

conducta de estos conjuntos de firmas. Alternativamente, podra ser un conjunto

Utilizando nlswork.data, vamos a modelar ln(wage) en trminos de aos completos

. webuse nlswork.dta, clear

Young Women 14-26 years of age in 1968)

. xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure

Group variable: idcode

Obs per group: min =

[95% Conf. Interval]

------------------------------------------------------------------------------------F test that all u_i=0:

Prob > F = 0.0000

El R2 within es (0,1727), y la R2 betwen es (0,3505), como se esperaba,

xtreg informa "R-cuadrados" correspondientes a estas tres ecuaciones. R-cuadrado estn

En particular, xtreg, be obtiene sus estimaciones mediante la realizacin de MCO de

Donde est en funcin de la varianza de los errores de

. Si la primera varianza es cero, esto significa que los primeros

de BP / LM de la independencia es que los residuos a travs de entidades no estn

Las pruebas para la seccin transversal dependencia / correlacin contempornea:

Testing for heteroskedasticity

Modified Wald test for groupwise heteroskedasticity

Las pruebas de correlacin serial

El modelo de efectos aleatorios

independientes de la i y it, para todo i y t. El modelo de efectos aleatorios es una

Young Women 14-26 years of age in 1968)

. xtreg ln_w grade age c.age#c.age ttl_exp c.ttl_exp#c.ttl_exp tenure c.tenure#c.tenure

Group variable: idcode

Obs per group: min =

Prob > chi2

[95% Conf. Interval]

(fraction of variance due to u_i)

La interpretacin de los coeficientes es complicada ya que