Beruflich Dokumente
Kultur Dokumente
Resumen
Stata es una marca registrada de Stata Corporation. Copyright 19962010 StataCorp LP, 4905
Lakeway Drive, College Station, TX 77845 USA. Las opiniones contenidas en este documento, los errores
u omisiones son de exclusiva responsabilidad del autor.
1 Introduccin
Los economistas jvenes y los que todava estn estudiando sabrn que antes de
tener su grado como profesionales deben pasar por materias de matemticas,
estadsticas y de teora econmica, antes de llegar a la econometra. Y es en esta
ltima donde surge una excelente combinacin de las matemticas, estadsticas y de
teora econmica para alcanzar lo que los economistas podramos llamar la capacidad
de anlisis econmico. Pero sorprende que esta herramienta, considerada como vital
para la formacin de los economistas y de otras disciplinas o profesiones similares, no
cuente en muchos pases en vas de desarrollo con obras que pongan al da a los
usuarios sobre los mtodos que se utilizan hoy y los softwares ms especializado para
interpretar correctamente las realidades econmicas y no pasar el oso, por
quedarse en meras intuiciones o anlisis estadsticos bsicos, o tal vez, por usar un
software desconocido por la comunidad cientfica de la disciplina.
2
contrasta el modelo usando las pruebas de significancia y la bondad de jute del
modelo. En el sexto apartado se muestra como se hacen las proyecciones. En el
sptimo apartado se presenta una seccin de comentarios. El documento termina con
la bibliografa.
2 La econometra
Anton Kittil Frisch recibi el primer premio nobel de economa en el ao 1969, fue
adems el fundador de la Econometric Society, y creador y editor de la prestigiosa
revista cientfica Econometrica. Todo esto justifica pues la amplia aceptacin de su
propuesta a lo largo de la historia.
3
necesidades humanas, es importante tener en cuenta este concepto antes de empezar
a utilizar la econometra como herramienta prctica.
Otro concepto importante es la estadstica, que se puede definir como la ciencia que
tiene como objetivo reunir una informacin cuantitativa concerniente a individuos,
grupos o series de hechos, por ejemplo, y deducir de ella unos significados precisos o
previsiones para el futuro, mediante el anlisis de datos.
Es igualmente importante saber que las matemticas son aquella disciplina que,
mediante el razonamiento deductivo, estudia las propiedades de los entes abstractos,
nmeros, figuras geomtricas, etc., as como las relaciones que se establecen entre
ellos.
Ya teniendo estos conceptos claros, es posible dar paso a lo que es la base del estudio
de la econometra: el anlisis de regresin.
Con base en lo anterior, se puede deducir la funcin de dependencia bsica que por lo
general se establece por la teora econmica:
Y = f (X )
Y = a + bX
4
Donde Y es la variable dependiente, X es la variable independiente o explicativa, a es el
parmetro constante y b es el parmetro dependiente. Esta ecuacin es la ecuacin de
una recta de pendiente b y de ordenada al origen a en un eje cartesiano tradicional.
Y = 0 + 1 X +
i. Correlacin: Mide la fuerza o el grado de asociacin lineal entre dos variables. Hay
que tener en cuenta que una relacin estadstica, por mas fuerte o sugerente que sea,
nunca podr establecer una conexin causal.
5
2.3 Los datos
Las series de tiempo son muestras que recogen observaciones de un mismo individuo,
empresa, familia o pas a lo largo del tiempo. Son variables que tiene un horizonte
temporal un principio y un fin en el tiempo. Por ejemplo, las ventas de una
determinada empresa a lo largo de varios aos representan una muestra de series de
tiempo, tal como se muestra en la tabla 2:
6
Tabla 2. Datos de series de tiempo
Por ltimo, los datos de panel son datos de informacin combinada entre cortes
transversales y series temporales. La informacin sobre el PIB para diferentes
provincias en un rango de tiempo son datos de panel:
7
La etapa de estimacin consta de dos pasos que son la obtencin de los datos y la
estimacin de los parmetros del modelo economtrico.
Ms adelante, se deben hacer las respectivas pruebas de hiptesis como mtodo para
contrastar, dentro de las cuales estn las pruebas de significancia tanto individual
como conjunta y la verificacin de los ajustes del modelo. Tambin en esta etapa se
contrasta la existencia de problemas economtricos como multicolinealidad,
heteroscedasticidad, autocorrelacion, omisin de variables relevantes, errores de
medicin y distribucin normal de los errores, entre otros.
Por ltimo, no se debe olvidar hacer las proyecciones, etapa de suma importancia
dentro del estudio. Este paso se refiere a la realizacin de un pronstico o prediccin
acompaado de un comentario sobre la utilizacin del modelo y su importancia en
fines como el control o la poltica econmica.
Y = f (X )
A partir del modelo econmico, se tiene que el modelo matemtico asociado es:
Y = a + bX
8
error, o variable estocstica, generalmente representada por una letra griega al final
de la ecuacin, tal como se muestra aqu:
Y = 0 + 1 X +
Donde la variable representa el trmino de error del modelo. Es importante recordar
que en este caso se trata de un modelo que representa una relacin lineal entre la
variable X y la variable Y.
Para la especificacin del modelo, debe existir una teora: se hace referencia a la teora
econmica en esta etapa. Para una mayor claridad, se har mencin al ejemplo del
libro de Wooldridge (2002) en el cual se estima la ecuacin bsica minceriana de
salarios, especificada de la siguiente manera:
lwagei = 0 + 1educi + i
1
En este caso se utilizar solamente la primera variable dependiente especificada por la teora debido a
que se est planteando la especificacin de un modelo de regresin lineal simple.
9
del tiempo. Las hiptesis surgen como base para el planteamiento de un problema o
inquietud que se desea confirmar con experiencia.
La estimacin se hace por el mtodo de MCO. Este mtodo tiene ciertos supuestos y
propiedades que es pertinente que sean estudiados para una mejor comprensin de la
tcnica que utiliza la econometra.
La estimacin en econometra trata de encontrar un mtodo para hallar una recta que
ajuste de una manera adecuada la nube de puntos definida por todos los pares de
valores muestrales ( xi ; yi ) tal como se muestra en el siguiente grfico:
1
0
-1
0 5 10 15 20
years of education
10
= (Yi Yi )
2 2
i
= (Yi 1 2 X i ) 2
El criterio considera que la funcin que mejor se ajusta a los datos es la que minimiza
la varianza del error , lo que es equivalente a minimizar:
n n
S ( 0 , 1 , 2 ,..., k ) = i 2 = ( yi ( 1 + 2 x1i ) )
2
i =1 i =1
Dadas las propiedades del modelo clsico de regresin lineal, los estimadores de
mnimos cuadrados ordinarios, dentro de la clase de estimadores lineales insesgados,
tienen varianza mnima, es decir, son MELI (Gujarati (2010))
11
1
- Eficientes, es decir que se cumple que Var ( 2 ) = n
2
(x x )
i =1
i i
2
x
- Consistentes, es decir que se cumpla que Cov( i ; j ) = n
2
(x x )
t =1
i i
2
n
S = (Yt 1 2 X t )2
t =1
n
( X X )(Yi Y ) x y n.x. y
i i
1 = Y 2 X
2 = ni = i =1
n
(Xi X ) x
2 2 2
i =1
i n.x
i =1 i =1
Sin embargo, los clculos son algo tediosos teniendo en cuenta que el econometrista
generalmente se ve enfrentado a bases de datos bastante grandes con las que tiene
que trabajar. Por esto, hay software especializados en realizar este tipo de regresiones:
Stata es uno de ellos.
12
En el caso del ejemplo de Wooldridge (2002), se utilizan datos de corte transversal en
los cuales hay 24 variables diferentes disponibles.
La sintaxis oficial que ofrece Stata al utilizar la herramienta Help en el Men principal
sobre este comando es:
La tabla se divide en tres partes: la primera es la que muestra la tabla ANOVA de las
sumatorias de los residuos; la segunda muestra algunos detalles de la estimacin como
el nmero de observaciones y otra informacin que ms adelante se analizar; y, por
ltimo, la tabla con el resultado del estimado, el error estndar, el valor de la prueba
t, el valor p y el intervalo de confianza.
13
Esta fraccin de la tabla de estimacin que muestra Stata en su ventana de resultados,
es la tabla Anova, en la cual se muestran las diferentes sumatorias que comprenden el
fondo de la estimacin: la suma de los cuadrados totales (SS), la suma de los cuadrados
medios (MS), y los grados de libertad; cada uno tanto para la regresin como para los
residuos.
y = 0 + 1 x1 + i
y
= 1
x1
14
Suponiendo que el modelo es un modelo con logaritmo natural en la variable
explicativa x1 (modelo nivel-log):
y = 0 + 1 ln( x1 ) + i
1
y = 1 x
x1
y.x1
= 1
x1
y
= 1
( x1 / x1 )100 100
ln( y ) = 0 + 1 ln( x1 ) + i
1 1
y = 1 x
y x1
y / y
= 1
x1 / x1
ln( y ) = 0 + 1 x1 + i
1
y = 1.x
y
y 1
= 1
x1 y
( y / y )100 = (100)
1
x1
15
La tabla siguiente resume las interpretaciones de los coeficientes en los distintos tipos
de modelos economtricos:
Una vez estimado el modelo de regresin lineal simple, es importante no olvidar hacer
los contrastes y las validaciones del modelo, con el fin de corroborar que el modelo s
es el apropiado y que se logr encontrar resultados coherentes.
Como primera medida, se deben contrastar los signos esperados a priori con los
obtenidos en el modelo. En este caso, como se trata de un modelo de regresin lineal
simple en el que se estiman dos , cada uno de ellos se compara.
Otro paso importante para el contraste del modelo y su validacin son las pruebas de
significancia. La prueba individual tiene como objetivo probar la validez del coeficiente
dentro del modelo, y se realiza siguiendo la metodologa estadstica de las pruebas de
hiptesis. En este caso, para probar la significancia de los betas por separado, se hace
referencia a las siguientes hiptesis:
H 0 : 1 = 0
H 1 : 1 0
Para realizar la prueba de hiptesis se debe tener en cuenta el valor del estadstico t o
su valor p asociado. El criterio para rechazar la hiptesis nula es que si el valor p es
menor que un de 0.01, 0.05 o 0.10, se rechaza H0 y el coeficiente ser significativo al
99%, 95% o 90%, respectivamente. Se debe tener en cuenta que la hiptesis se debe
16
rechazar al nivel de significancia ms alto y se debe dejar de rechazar al nivel de
significancia ms bajo.
Teniendo en cuenta los valores p del ejemplo, que en este caso son cero para ambos
coeficientes y por tanto inferiores a 0.01, 0.05 y 0.10, es posible rechazar la hiptesis
nula de no significancia. En conclusin, en este caso ambos s son significativos con
un nivel de confianza del 99%.
H 0 : 1 = 2 = 0
H 1 : No H 0
De la misma forma que lo anterior, en este caso la hiptesis nula se rechaza a un 99%
de confianza, mostrando as una significancia conjunta de ambos coeficientes dentro
del modelo.
Por ltimo, para analizar el fit del modelo, se debe analizar su bondad de ajuste. Para
esto, la econometra utiliza el coeficiente de determinacin r2 como medida de la
bondad de ajuste, es decir, como medida de cun bien se ajusta la lnea de regresin a
los datos. Si todos los datos cayeran sobre la lnea de regresin se obtendra un ajuste
perfecto, sin embargo esto rara vez ocurre: por tanto, lo que se busca es la lnea mejor
ajustada a los datos.
17
Lo que muestra se muestra es que el los crculos X e Y representan la variacin en las
variables X e Y respectivamente. La interseccin de los crculos que se muestra
sombreada de color gris, indica la medida en que las variaciones en la variable Y son
explicadas por variaciones en la variable X. Entre mayor sea el rea sombreada, mayor
ser esta relacin entre las dos variables. El coeficiente de determinacin es pues una
medida numrica de esta interseccin. Cuando no hay interseccin entre los crculos,
el r2 es cero, mientras que cuando ambos crculos se superponen perfectamente, el r2
es 1, pues ciento por ciento de la variacin en Y es explicada por variaciones en X.
y i
2
= y i 2 + i 2 + 2 y i 2 i 2
De aqu que: = yi 2 + i 2
= 2 2 xi 2 + i 2
La sumatoria y i
2
tambin llamada Suma de cuadrados totales muestra la variacin
total de los valores reales de Y respecto de su media muestral. La sumatoria 2 x 2 2 i
Ahora, si esta ecuacin se divide a ambos lados por la SCT se obtiene que:
SCR SCE
1= +
SCT SCT
=
(Yi Y )2 +
i
2
(Y Y )
i
2
(Y Y )
i
2
=
SCE
(Y Y )i
2
SCT
El valor del coeficiente se encuentra comprendido entre cero y uno: a medida que el
coeficiente se acerca a cero, el ajuste del modelo es menor, es decir hay menor
nmero de variaciones de la variable dependiente que son explicadas por cambios en
las variables independientes. De la misma manera, a medida que se acerca a uno el
modelo presenta un mejor fit.
18
En la tabla que muestra Stata tras hacer la regresin del modelo lineal simple, se
observa el coeficiente de determinacin ya calculado. En este caso, tiene un valor de
0,1858, nmero suficientemente cercano a cero como para decir que el modelo no
presenta un buen ajuste. Se puede interpretar entonces que el 18,58% de las
variaciones en el salario estn explicadas por variaciones en los aos de educacin del
individuo.
Tambin se puede usar los valores estimados para encontrar el valor medio y la
proyeccin para el valor esperado de la variable dependiente. Es importante saber
que:
E[ yi | X = xi ] = E[ 0 + 1 xi + ]
E[ yi | X = xi ] = 0 + 1 xi + E[ ]
E[ yi | X = xi ] = 0 + 1 xi
Ahora, hay que tener en cuenta que el valor esperado de la variable dependiente
(prediccin media) dado un determinado valor de X, se refiere al promedio esperado
para Y, mientras que la proyeccin de la variable dependiente dado un determinado
valor de X (prediccin individual) se refiere al valor que se espera de Y y no a su valor
medio.
.predict yest, xb
19
Tabla 5. Prediccin de la variable Y
7. Comentarios finales
Sin embargo, debido a que la realidad es mucho ms compleja y por razones que se
explicaran ms adelante, el modelo de regresin simple presenta ciertas limitaciones
cuando se emplea como herramienta de anlisis econmico y por ello no es una
herramienta definitiva.
8. Bibliografa
20
Chiswik, Barry (2003) Jacob Mincer, Experience and the distributions of
earnings. Institute for the study of labor (IZA). IDEAS
Gujarati (2010) Econometra. Mxico. Mc Graw Hill
Gould W., Pitblado J., Sribney W. (2006) Maximum likelihood Estimation with
Stata. Stata Press
Hamilton, L.C. (2009). Statistics with STATA 8. Belmont, CA: Duxbury Press
Kohler, U. y Kreuter, F. (2009). Data Analysis Using Stata. College Station, TX:
Stata Press
Long, J. S. (2009) The Workflow of Data Analysis Using Stata. Stata Press.
Mincer, J. (1974) Schooling, experience and earnings, Columbia University
Press.
Mitchell M. (2008) A visual guide to Stata Graphics. Stata Press
Murray, M. (2006) Econometrics: a modern introduction. Ed. Pearson
Pollock, Ph. H. (2006) A Stata Companion to Political Analysis. Washington, CQ
Press.
Rabe-Hesketh, S. y Everitt, B. (2004). A Handbook of Statistical Analysis Using
STATA, London: Chapman & Hall/CRC Press
Newton J., Cox N. (2003) Seventy-six Stata tips
STATA CORP (2008). Users Guide, Reference Manual Release 10. Stata Press.
Wooldridge, J. (2006) Introduccin a la econometra. Un enfoque moderno. Ed.
Thomson
21