Sie sind auf Seite 1von 21

INTRODUCCIN A LA ECONOMETRA Y EL MRLS EN STATA

Carlos Giovanni Gonzlez Espitia


E-mail: cggonzalez@icesi.edu.co
Departamento de Economa
Universidad Icesi

Resumen

El objetivo de este documento es introducir al lector en el mbito de la econometra y


del Modelo de Regresin Lineal Simple (MRLS), siguiendo una metodologa bsica
sobre la especificacin, estimacin, contrastes y proyecciones del modelo, y realizando
su aplicacin en el programa economtrico Stata.

Palabras Clave: Econometra, software economtrico, Stata


Clasificacin JEL: C01, C87.

Stata es una marca registrada de Stata Corporation. Copyright 19962010 StataCorp LP, 4905
Lakeway Drive, College Station, TX 77845 USA. Las opiniones contenidas en este documento, los errores
u omisiones son de exclusiva responsabilidad del autor.
1 Introduccin

Pocas obligaciones si alguna supera en importancia a la que los economistas


profesionales tienen de conocer y comprender las herramientas bsicas de la
econometra para el desarrollo de su profesin. Un deber cuyo cumplimiento importa
cada da ms a un amplio nmero de agentes y participantes del proceso econmico.
Adems, estos agentes precisan disponer de las conclusiones que esta herramienta les
puede proporcionar en estudios empresariales, consultoras e investigaciones. As por
ejemplo, algunos agentes econmicos a los cuales les debera interesar la econometra
son, los empresarios, cuyas decisiones estn esencialmente afectadas por la
informacin que disponen con respecto a la relacin de las variables del entorno
empresarial y general de la economa en la que desarrollan sus actividades. Los
polticos y servidores pblicos cuyas elecciones tienen que guardar coherencia con las
teoras, los datos, las regularidades empricas y hechos estilizados de la economa.
Finalmente, los ciudadanos como consumidores necesitan una herramienta para
analizar su toma de decisiones.

Los economistas jvenes y los que todava estn estudiando sabrn que antes de
tener su grado como profesionales deben pasar por materias de matemticas,
estadsticas y de teora econmica, antes de llegar a la econometra. Y es en esta
ltima donde surge una excelente combinacin de las matemticas, estadsticas y de
teora econmica para alcanzar lo que los economistas podramos llamar la capacidad
de anlisis econmico. Pero sorprende que esta herramienta, considerada como vital
para la formacin de los economistas y de otras disciplinas o profesiones similares, no
cuente en muchos pases en vas de desarrollo con obras que pongan al da a los
usuarios sobre los mtodos que se utilizan hoy y los softwares ms especializado para
interpretar correctamente las realidades econmicas y no pasar el oso, por
quedarse en meras intuiciones o anlisis estadsticos bsicos, o tal vez, por usar un
software desconocido por la comunidad cientfica de la disciplina.

Esa ausencia de un documento que presente los mtodos economtricos y un


software de calidad para el anlisis econmico, se cubre en esta serie de documentos.
De ah que el objetivo de este tercer documento sea introducir al lector en la
econometra y en el modelo de regresin lineal simple usando un software de frontera
como lo es Stata. A este documento lo preceden otros dos: 1. Aprendiendo a usa Stata
y 2. Describiendo y graficando datos en Stata.

Este documento va dirigido a todos los estudiantes, profesores e investigadores en


economa deseosos de empezar a usar el programa, o profundizar sus conocimientos
en la herramienta. El documento es una herramienta de apoyo y no sustituye los
manuales de Stata, ni a los libros ms rigurosos de econometra.

El documento consta de ocho apartados, el primero de ellos es esta introduccin. En


el segundo apartado se hace una introduccin a la econometra, pasando por su
definicin, algunos conceptos bsicos, los datos y la metodloga de la econometra. En
el tercer apartado se presenta la especificacin del modelo. En el cuarto apartado se
presenta la estimacin del modelo usando el mtodo MCO. En el quinto apartado se

2
contrasta el modelo usando las pruebas de significancia y la bondad de jute del
modelo. En el sexto apartado se muestra como se hacen las proyecciones. En el
sptimo apartado se presenta una seccin de comentarios. El documento termina con
la bibliografa.

2 La econometra

La econometra es una rama de la economa que se basa en la teora econmica


(microeconoma y macroeconoma) y que tiene hoy en da una amplia aplicacin en
diversas actividades del ser humano tales como el anlisis econmico de la toma de
decisiones de los consumidores, empresas y del Estado. Segn Paul Samuelson (1915 -
2009), uno de los economistas ms influyentes que han existido, la economa es una
ciencia social que estudia la asignacin eficiente de los recursos escasos para satisfacer
las necesidades humanas. En esta ciencia social es necesario medir, calcular y estimar
las relaciones de las variables econmicas, cosa de la que se encarga la econometra.

La palabra econometra se deriva del vocablo econo que significa economa, y


metra que quiere decir medicin, es decir, medicin de la economa. Es entonces la
parte de la economa que utiliza mtodos estadsticos y modelos matemticos para
cuantificar y/o medir las relaciones econmicas. Es importante resaltar que debido a la
continua evolucin de la ciencia econmica y de la misma econometra, existen
diversas definiciones de econometra que en su mayora han sido propuestas por los
economistas ms influyentes del siglo pasado.

Una de las definiciones ms aceptadas de econometra es la propuesta por el


economista noruego Ragnar Anton Kittil Frisch (1895-1973):

La econometra es un rea de la economa que se basa en la teora econmica para


analizar y/o estudiar a travs de modelos los fenmenos econmicos utilizando las
herramientas de la estadstica y las matemticas, (adaptado de Frisch, 1927).

Anton Kittil Frisch recibi el primer premio nobel de economa en el ao 1969, fue
adems el fundador de la Econometric Society, y creador y editor de la prestigiosa
revista cientfica Econometrica. Todo esto justifica pues la amplia aceptacin de su
propuesta a lo largo de la historia.

Es importante destacar que la econometra que se muestra en estos documentos es


aplicada y no pretende hacer nfasis en el desarrollo terico ni en la formalizacin de
los mtodos. Mas bien, se muestra como una herramienta de fcil aplicacin y muy
necesaria para los economistas de hoy.

2.1 Conceptos bsicos

Para el estudio de la econometra y antes de continuar, es importante tener claros


algunos conceptos fundamentales. El primero de ellos es el de economa: que es la
ciencia social que estudia la asignacin eficiente de recursos escasos para satisfacer las

3
necesidades humanas, es importante tener en cuenta este concepto antes de empezar
a utilizar la econometra como herramienta prctica.

Igualmente, es importante tener siempre presente que al hablar de teora econmica,


se est haciendo referencia a las dos ramas principales de la misma, que son la
microeconoma y la macroeconoma. La primera se refiere al estudio de los agentes
econmicos individuales y su comportamiento, mientras que la segunda estudia las
variables econmicas agregadas en su conjunto.

Otro concepto importante es la estadstica, que se puede definir como la ciencia que
tiene como objetivo reunir una informacin cuantitativa concerniente a individuos,
grupos o series de hechos, por ejemplo, y deducir de ella unos significados precisos o
previsiones para el futuro, mediante el anlisis de datos.

Es igualmente importante saber que las matemticas son aquella disciplina que,
mediante el razonamiento deductivo, estudia las propiedades de los entes abstractos,
nmeros, figuras geomtricas, etc., as como las relaciones que se establecen entre
ellos.

2.2 Anlisis de regresin

Ya teniendo estos conceptos claros, es posible dar paso a lo que es la base del estudio
de la econometra: el anlisis de regresin.

En la economa como en las ciencias sociales, no es posible hacer experimentos


exactos como en las matemticas, fsica o las ciencias naturales (tambin llamadas
ciencias exactas), principalmente, por no poder acceder a toda la informacin de la
poblacin en estudio. Y por lo tanto, se deben utilizar modelos para estudiar los
fenmenos econmicos y de esta forma aproximarnos a la explicacin de la realidad.
De ah que la simplificacin de la realidad sea necesaria a travs de modelos que son
representaciones de la realidad.

Segn Gujarati (2010), el anlisis de regresin trata del estudio de la dependencia de la


variable dependiente (Y), en una o ms variables, las variables explicativas (X)
utilizando modelos, con el objetivo de estimar y/o predecir la media o valor promedio
poblacional de la primera en trminos de los valores conocidos o fijos (en muestras
repetidas) de las ltimas.

Con base en lo anterior, se puede deducir la funcin de dependencia bsica que por lo
general se establece por la teora econmica:

Y = f (X )

Esta funcin se pude tambin reescribir como modelo matemtico a manera de


funcin lineal de la siguiente manera:

Y = a + bX

4
Donde Y es la variable dependiente, X es la variable independiente o explicativa, a es el
parmetro constante y b es el parmetro dependiente. Esta ecuacin es la ecuacin de
una recta de pendiente b y de ordenada al origen a en un eje cartesiano tradicional.

El modelo matemtico se convierte en modelo economtrico (tambin conocido como


modelo estadstico) en el momento en el que se agrega una variable aleatoria al
modelo: esta variable aleatoria es el trmino de error estocstico:

Y = 0 + 1 X +

Donde la variable representa el trmino de error del modelo. Es importante recordar


que en este caso se trata de un modelo que representa una relacin lineal entre la
variable X y la variable Y.

Una vez estimado el modelo, este se escribe de la siguiente manera: Y = 0 + 1 X


donde cada variable o parmetro acompaado de un acento hace referencia a un valor
estimado.

En econometra, la variable dependiente (Y) es llamada tambin variable endgena,


regresando, variable explicada, predicha o de respuesta. De la misma forma, la variable
independiente (X) se le puede tambin llamar variable exgena, regresor, variable
explicativa, predictor o de control.

Ahora bien, en economa buscamos relaciones determinanticas de las variables


econmicas. Lo cual implica que detrs de los datos y las regresiones debe existir un
marco terico o una prueba estadstica de que la relacin entre la variable
dependiente y las independientes no es una mera correlacin, sino que buscamos una
relacin causal, llamada causalidad. La variable X causa a Y. La asociacin de estos dos
conceptos es fuente de numerosos errores de interpretacin que, en ocasiones, han
tenido graves consecuencias en las decisiones que toman los economistas. Por lo
tanto, es importante entender que es cada uno de estos dos conceptos. Segn Gujarati
(2010):

i. Correlacin: Mide la fuerza o el grado de asociacin lineal entre dos variables. Hay
que tener en cuenta que una relacin estadstica, por mas fuerte o sugerente que sea,
nunca podr establecer una conexin causal.

ii. Causalidad: La relacin de causalidad debe provenir de estadsticas externas y, en


mejor trmino, de una u otra teora. Lo que se debe notar es que una relacin
estadstica por si misma no puede, por lgica, implicar causalidad.

No olviden que lo que buscamos en economa (y en econometra) es un efecto causal y


no una mera correlacin. Para aducir causalidad se debe acudir a consideraciones a
priori o tericas. Y si buscamos o estimamos una correlacin que no est mal es
importante aclararlo.

5
2.3 Los datos

A la hora de hacer una estimacin de un modelo economtrico, es necesario contar


con los datos especficos de las caractersticas representativas del modelo. La muestra
de los datos debe ser una muestra representativa, obtenida bajo los distintos mtodos
estadsticos (muestreo aleatorio, conglomerado, estratificado, etc.)

La estructura de los datos en econometra puede ser de tres tipos:


- Datos de corte transversal
- Datos de Panel
- Series de tiempo

El corte transversal se trata de una muestra de n observaciones de individuos,


empresas, familias o pases, entre otros, recogidas en un momento puntual del
tiempo. Las variables no tienen horizonte temporal. La siguiente tabla muestra un
ejemplo de este tipo de datos haciendo referencia al PIB de diferentes pases en un
mismo periodo de tiempo:

Tabla 1. Datos de corte transversal

Las series de tiempo son muestras que recogen observaciones de un mismo individuo,
empresa, familia o pas a lo largo del tiempo. Son variables que tiene un horizonte
temporal un principio y un fin en el tiempo. Por ejemplo, las ventas de una
determinada empresa a lo largo de varios aos representan una muestra de series de
tiempo, tal como se muestra en la tabla 2:

6
Tabla 2. Datos de series de tiempo

Por ltimo, los datos de panel son datos de informacin combinada entre cortes
transversales y series temporales. La informacin sobre el PIB para diferentes
provincias en un rango de tiempo son datos de panel:

Tabla 3. Datos de panel

2.4 Metodologa de la econometra

La metodologa de la econometra sigue la metodologa convencional de la


investigacin donde existe una hiptesis que se desea probar. Para realizar esto se
plantean cuatro etapas bsicas llamadas: especificacin, estimacin, contrastes y
proyecciones. Segn Gujarati (2010), estas se pueden desagregar as:

Dentro de la especificacin del modelo se deben tener en cuenta pasos como: el


planteamiento de la teora o de la hiptesis, la especificacin del modelo matemtico
de la teora y la especificacin del modelo economtrico de la teora.

7
La etapa de estimacin consta de dos pasos que son la obtencin de los datos y la
estimacin de los parmetros del modelo economtrico.

Ms adelante, se deben hacer las respectivas pruebas de hiptesis como mtodo para
contrastar, dentro de las cuales estn las pruebas de significancia tanto individual
como conjunta y la verificacin de los ajustes del modelo. Tambin en esta etapa se
contrasta la existencia de problemas economtricos como multicolinealidad,
heteroscedasticidad, autocorrelacion, omisin de variables relevantes, errores de
medicin y distribucin normal de los errores, entre otros.

Por ltimo, no se debe olvidar hacer las proyecciones, etapa de suma importancia
dentro del estudio. Este paso se refiere a la realizacin de un pronstico o prediccin
acompaado de un comentario sobre la utilizacin del modelo y su importancia en
fines como el control o la poltica econmica.

3. Especificacin del MRLS

La regresin lineal simple, como ya se mencion dentro de los conceptos bsicos de la


econometra, se habla de regresin lineal en el caso en que hay una relacin de
linealidad entre la variable dependiente y las independientes. Los mtodos de
estimacin ms frecuentes son el de Mnimos Cuadrados Ordinarios (MCO) y el de
Mxima Verosimilitud (MV). El mtodo de MCO es el ms comn por ser mucho ms
intuitivo y matemticamente ms sencillo que el de MV. Adems, en el contexto de la
regresin lineal, ambos proporcionan resultados bastante similares.

3.1 Modelo econmico

El modelo, tal como se mencion anteriormente, se trata de una funcin de


dependencia bsica que plantea la teora econmica:

Y = f (X )

3.2 Modelo matemtico

A partir del modelo econmico, se tiene que el modelo matemtico asociado es:

Y = a + bX

Donde Y es la variable dependiente, X es la variable independiente o explicativa, a es el


parmetro constante y b es el parmetro dependiente. Esta ecuacin es la ecuacin de
una recta de pendiente b y de ordenada al origen a en un eje cartesiano tradicional.

3.3 Modelo economtrico

Ahora, el modelo matemtico se convierte en modelo economtrico en el momento


en el que se agrega una variable aleatoria al modelo: esta variable es el trmino de

8
error, o variable estocstica, generalmente representada por una letra griega al final
de la ecuacin, tal como se muestra aqu:

Y = 0 + 1 X +
Donde la variable representa el trmino de error del modelo. Es importante recordar
que en este caso se trata de un modelo que representa una relacin lineal entre la
variable X y la variable Y.

Para la especificacin del modelo, debe existir una teora: se hace referencia a la teora
econmica en esta etapa. Para una mayor claridad, se har mencin al ejemplo del
libro de Wooldridge (2002) en el cual se estima la ecuacin bsica minceriana de
salarios, especificada de la siguiente manera:

ln( salario)i = 0 + 1educi + i

Donde el subndice i especifica que se trata de una muestra de corte transversal. En la


base de datos WAGE1.RAW, las variables se llaman as:

lwagei = 0 + 1educi + i

Para la especificacin particular de este modelo, es importante conocer la teora del


capital humano desarrollada por Becker (1964) pues esta relaciona el salario percibido
con variables como la educacin y la experiencia. Esta teora establece como variable
dependiente, el logaritmo del salario del individuo, en funcin del nivel de educacin,
la experiencia, la experiencia al cuadrado, y otras variables que explican el nivel salarial
de los individuos1. Becker enfatiza su teora con el supuesto de que las personas son
racionales y hacen sus elecciones teniendo en cuenta costos y beneficios, y que
adems tienen la posibilidad de elegir si educarse o no y si trabajar o no. Sumado esto
al trabajo de Mincer (1974), qued demostrado que tanto la educacin como la
experiencia estn relacionadas positivamente con el logaritmo del salario. De hecho,
tendera a haber una correlacin positiva entre la escolaridad y las inversiones en la
experiencia laboral, no porque estas sean complementarias sino porque generalmente
individuos que invierten en capital humano, lo hacen simultneamente de las dos
formas (Chiswick, 2003).

La teora econmica se debe usar de manera pertinente en a la hora de la


especificacin del modelo pues es a partir de esta que se proporcionan los argumentos
que sustentan los signos esperados de las variables en el modelo economtrico. Es
adems fundamental basarse en una teora que se ajuste a los datos con los que se va
a trabajar.

Las teoras generalmente surgen de una intuicin proveniente de una regularidad


emprica que es corroborada por las estimaciones economtricas cientficas a lo largo

1
En este caso se utilizar solamente la primera variable dependiente especificada por la teora debido a
que se est planteando la especificacin de un modelo de regresin lineal simple.

9
del tiempo. Las hiptesis surgen como base para el planteamiento de un problema o
inquietud que se desea confirmar con experiencia.

4. Estimacin del MRLS

La estimacin se hace por el mtodo de MCO. Este mtodo tiene ciertos supuestos y
propiedades que es pertinente que sean estudiados para una mejor comprensin de la
tcnica que utiliza la econometra.

La estimacin en econometra trata de encontrar un mtodo para hallar una recta que
ajuste de una manera adecuada la nube de puntos definida por todos los pares de
valores muestrales ( xi ; yi ) tal como se muestra en el siguiente grfico:

Grfico 1. Grfico de dispersin de los datos


3
2


1

 
0
-1

0 5 10 15 20
years of education

log(wage) Fitted values

Los puntos de dispersin representan las observaciones obtenidas en la muestra y la


recta representa la estimacin que se busca realizar, tambin llamada Funcin de
Regresin Muestral (FRM) segn Gujarati (2010). Las distancias entre cada
observacin y la recta, es decir la diferencia entre los verdaderos valores de las
observaciones y los valores estimados, representan el trmino de error de la
estimacin, y, teniendo en cuenta que hay tantos puntos por encima como puntos por
debajo de la lnea, la suma de todas estas diferencias ser cero:

     

4.1 Mtodo de MCO

El mtodo de Mnimos Cuadrados Ordinarios (MCO) estima la recta obteniendo el


Mejor Estimador Lineal Insesgado (MELI) el cual minimiza la suma de los cuadrados de
los residuos:

10
= (Yi Yi )
2 2
i

= (Yi 1 2 X i ) 2

El criterio considera que la funcin que mejor se ajusta a los datos es la que minimiza
la varianza del error , lo que es equivalente a minimizar:

n n
S ( 0 , 1 , 2 ,..., k ) = i 2 = ( yi ( 1 + 2 x1i ) )
2

i =1 i =1

Las propiedades y caractersticas del mtodo de MCO son:

- Este mtodo busca la mejor lnea que represente las observaciones


- Busca estimadores insesgados
- La mejor variabilidad del estimador
- Una relacin lineal entre X e Y
- La variable X es no estocstica
- Los estimadores MCO tienen la menor varianza posible
- E[ i ] = 0
- Var[ i ] = 2
- E[ i j ] = 0 donde i j, es decir que los errores son independientes entre s

El teorema de Gauss Markov especifica las propiedades ideales u ptimas de las


estimaciones, el cual plantea que:

Dadas las propiedades del modelo clsico de regresin lineal, los estimadores de
mnimos cuadrados ordinarios, dentro de la clase de estimadores lineales insesgados,
tienen varianza mnima, es decir, son MELI (Gujarati (2010))

Los supuestos de este teorema en los cuales se basa son:

- Existe una relacin lineal entre X y Y


- Las X s son no estocsticas y linealmente independientes entre s
- El trmino de error:
o E[ i ] = 0
o Var[ i ] = 2
o E[ i j ] = 0 donde i j
De acuerdo con esto, por el mtodo de MCO se obtienen estimadores:

- Insesgados, es decir que se cumple que el valor esperado del coeficiente


muestral estimado es igual al poblacional: E ( 1 ) = 1

11
1
- Eficientes, es decir que se cumple que Var ( 2 ) = n
2
(x x )
i =1
i i
2

x
- Consistentes, es decir que se cumpla que Cov( i ; j ) = n
2
(x x )
t =1
i i
2

El objetivo de la estimacin en el caso del mtodo de mnimos cuadrados ordinarios es


minimizar la suma de los errores al cuadrado. Sabemos que los residuos son la
diferencia entre el valor estimado y el valor observado de Y, por tanto, la sumatoria se
expresa como:

Donde, si sustituimos el valor estimado obtenemos:

n
S = (Yt 1 2 X t )2
t =1

De donde, haciendo la derivada parcial de ( 1 2 ) obtenemos que las expresiones


analticas para los estimadores de mnimo cuadrticos de la regresin lineal simple
son:
n

n
( X X )(Yi Y ) x y n.x. y
i i
1 = Y 2 X
2 = ni = i =1
n

(Xi X ) x
2 2 2
i =1
i n.x
i =1 i =1

Mediante las sumatorias anteriormente mostradas, es posible calcular los s del


modelo planteado. Con esto, el lector puede ya entender qu es lo que hace el mtodo
de MCO a la hora de hacer la estimacin de los coeficientes.

Sin embargo, los clculos son algo tediosos teniendo en cuenta que el econometrista
generalmente se ve enfrentado a bases de datos bastante grandes con las que tiene
que trabajar. Por esto, hay software especializados en realizar este tipo de regresiones:
Stata es uno de ellos.

4.2 Anlisis y obtencin de los datos

Para la estimacin de un modelo economtrico, el primer paso de suma importancia es


tener una base de datos con la cual se realizar el trabajo. Igualmente, se deben
conocer bien la estructura de los datos, es decir tener en cuenta la realizacin previa
de las estadsticas descriptivas, con el fin de conocer con qu tipo de variables se va a
trabajar, qu media o desviacin estndar tienen y si se cuenta con valores missing
no. Para esto, se recomienda revisar el documento Describiendo y Graficando en Stata,
captulo anterior a este.

12
En el caso del ejemplo de Wooldridge (2002), se utilizan datos de corte transversal en
los cuales hay 24 variables diferentes disponibles.

4.3 Estimacin del MRLS

Ya habiendo entendido los clculos de fondo de la regresin del modelo de regresin


lineal simple, el usuario de Stata puede ahora realizar la regresin de manera sencilla,
simplemente utilizando el comando regress de la siguiente manera (este comando se
puede utilizar igualmente de manera abreviada introduciendo simplemente reg):

.regress depvar indepvar

La sintaxis oficial que ofrece Stata al utilizar la herramienta Help en el Men principal
sobre este comando es:

.regress depvar [indepvar] [if] [in] [weight] [,options]

Se puede utilizar if o in para limitar la muestra, asignar diferentes pesos a las


observaciones con weight u otras opciones con options.

Tras teclear el comando regress y utilizando el modelo del ejemplo de Wooldridge


(2002), Stata arroja la siguiente tabla:

Tabla 4. Resultados de la estimacin en Stata


Source SS df MS Number of obs = 526
F( 1, 524) = 119.58
Model 27.5606288 1 27.5606288 Prob > F = 0.0000
Residual 120.769123 524 .230475425 R-squared = 0.1858
Adj R-squared = 0.1843
Total 148.329751 525 .28253286 Root MSE = .48008

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .0827444 .0075667 10.94 0.000 .0678796 .0976091


_cons .5837727 .0973358 6.00 0.000 .3925563 .7749891

La tabla se divide en tres partes: la primera es la que muestra la tabla ANOVA de las
sumatorias de los residuos; la segunda muestra algunos detalles de la estimacin como
el nmero de observaciones y otra informacin que ms adelante se analizar; y, por
ltimo, la tabla con el resultado del estimado, el error estndar, el valor de la prueba
t, el valor p y el intervalo de confianza.

13
Esta fraccin de la tabla de estimacin que muestra Stata en su ventana de resultados,
es la tabla Anova, en la cual se muestran las diferentes sumatorias que comprenden el
fondo de la estimacin: la suma de los cuadrados totales (SS), la suma de los cuadrados
medios (MS), y los grados de libertad; cada uno tanto para la regresin como para los
residuos.

Stata tambin muestra detalles de la estructura de datos como el nmero de


observaciones total que se tienen. Calcula adems la probabilidad del estadstico F, el
coeficiente de determinacin r2 y r2 ajustado, que ms adelante se definirn, y el Root,
que es la raz cuadrada de la sumatoria de los cuadrados medios del error.

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .0827444 .0075667 10.94 0.000 .0678796 .0976091


_cons .5837727 .0973358 6.00 0.000 .3925563 .7749891

Esta ltima fraccin de la tabla, es la estimacin del modelo. Se observa la variable


dependiente lwage, la variable independiente educ y el intercepto o constante. Para
cada una, aparece el coeficiente estimado, el error estndar, el valor del estadstico t
junto a su valor p, y el intervalo de confianza.

4.4 Interpretacin de los resultados

Una vez el econometrista tiene frente a l la tabla con la estimacin, su trabajo es


ahora el de interpretar los resultados obtenidos, parte fundamental de su labor.
Las interpretaciones varan de acuerdo con la especificacin del modelo, tal como se
muestra a continuacin:

Suponiendo que el modelo se escribe de la siguiente forma (modelo nivel-nivel):

y = 0 + 1 x1 + i
y
= 1
x1

0 Ser el pronstico de y cuando las x j se anulan, teniendo en cuenta que no


siempre tiene interpretacin econmica. Adems, ante una variacin en una unidad
en x1 se esperara que y variara en 1 unidades, ceteris paribus, es decir, manteniendo
todo lo dems constante.

14
Suponiendo que el modelo es un modelo con logaritmo natural en la variable
explicativa x1 (modelo nivel-log):

y = 0 + 1 ln( x1 ) + i
1
y = 1 x
x1
y.x1
= 1
x1
y
= 1
( x1 / x1 )100 100

Se puede interpretar entonces que ante un cambio en 1 por ciento en x1 se esperara


1
que y variara en unidades, ceteris paribus.
100
En el caso en que el modelo se escriba con logaritmo natural tanto en la variable
dependiente como en la variable explicativa x1 (modelo log-log o de doble logaritmo)
tendramos que:

ln( y ) = 0 + 1 ln( x1 ) + i
1 1
y = 1 x
y x1
y / y
= 1
x1 / x1

En este caso, se puede decir que ante un cambio en 1 porciento en la variable


independiente x1 se esperara que y variara en 1 porciento, ceteris paribus.

En el caso en que el modelo tenga un logaritmo en la variable dependiente solamente


(modelo log-nivel):

ln( y ) = 0 + 1 x1 + i
1
y = 1.x
y
y 1
= 1
x1 y
( y / y )100 = (100)
1
x1

Podemos entonces interpretar que 1 (100) es el cambio porcentual en la variable


dependiente y dado un cambio en una unidad en x , ceteris paribus.

15
La tabla siguiente resume las interpretaciones de los coeficientes en los distintos tipos
de modelos economtricos:

Modelo Variable Variable Interpretacin de 1


dependiente independiente
y
Nivel nivel Y X = 1
x1
y
Nivel log Y Log(x) = 1
( x1 / x1 )100 100
( y / y )100 = (100)
Log nivel Log(y) X 1
x1
y / y
Log log Log(y) Log(x) = 1
x1 / x1

En el ejemplo aqu utilizado y utilizando la Tabla 4 que muestra los resultados de la


estimacin, es posible decir que 2 = 8,274 es el cambio porcentual en la variable
dependiente W dado un cambio en una unidad en educi , ceteris paribus.

5. Contrastes del MRLS

Una vez estimado el modelo de regresin lineal simple, es importante no olvidar hacer
los contrastes y las validaciones del modelo, con el fin de corroborar que el modelo s
es el apropiado y que se logr encontrar resultados coherentes.

Como primera medida, se deben contrastar los signos esperados a priori con los
obtenidos en el modelo. En este caso, como se trata de un modelo de regresin lineal
simple en el que se estiman dos , cada uno de ellos se compara.

5.1 Significancia individual

Otro paso importante para el contraste del modelo y su validacin son las pruebas de
significancia. La prueba individual tiene como objetivo probar la validez del coeficiente
dentro del modelo, y se realiza siguiendo la metodologa estadstica de las pruebas de
hiptesis. En este caso, para probar la significancia de los betas por separado, se hace
referencia a las siguientes hiptesis:

H 0 : 1 = 0
H 1 : 1 0

Para realizar la prueba de hiptesis se debe tener en cuenta el valor del estadstico t o
su valor p asociado. El criterio para rechazar la hiptesis nula es que si el valor p es
menor que un de 0.01, 0.05 o 0.10, se rechaza H0 y el coeficiente ser significativo al
99%, 95% o 90%, respectivamente. Se debe tener en cuenta que la hiptesis se debe

16
rechazar al nivel de significancia ms alto y se debe dejar de rechazar al nivel de
significancia ms bajo.

Teniendo en cuenta los valores p del ejemplo, que en este caso son cero para ambos
coeficientes y por tanto inferiores a 0.01, 0.05 y 0.10, es posible rechazar la hiptesis
nula de no significancia. En conclusin, en este caso ambos s son significativos con
un nivel de confianza del 99%.

5.2 Significancia conjunta

Por otro lado, es importante realizar tambin la prueba de significancia conjunta,


siguiendo el mismo mtodo anterior:

H 0 : 1 = 2 = 0
H 1 : No H 0

La prueba de hiptesis se realiza teniendo en cuenta la probabilidad asociada al


estadstico F que se revela en la tabla en la parte superior derecha. Igualmente para
esta prueba, el criterio se define mediante el valor p asociado y se compara con un
nivel de significancia de 0.01, 0.05 y 0.10.

De la misma forma que lo anterior, en este caso la hiptesis nula se rechaza a un 99%
de confianza, mostrando as una significancia conjunta de ambos coeficientes dentro
del modelo.

5.3 Bondad de ajuste

Por ltimo, para analizar el fit del modelo, se debe analizar su bondad de ajuste. Para
esto, la econometra utiliza el coeficiente de determinacin r2 como medida de la
bondad de ajuste, es decir, como medida de cun bien se ajusta la lnea de regresin a
los datos. Si todos los datos cayeran sobre la lnea de regresin se obtendra un ajuste
perfecto, sin embargo esto rara vez ocurre: por tanto, lo que se busca es la lnea mejor
ajustada a los datos.

Como primera medida, para analizar el coeficiente de determinacin, se debe


entender el Diagrama de Venn siguiente:

Grfico 2. Diagrama de Venn

17
Lo que muestra se muestra es que el los crculos X e Y representan la variacin en las
variables X e Y respectivamente. La interseccin de los crculos que se muestra
sombreada de color gris, indica la medida en que las variaciones en la variable Y son
explicadas por variaciones en la variable X. Entre mayor sea el rea sombreada, mayor
ser esta relacin entre las dos variables. El coeficiente de determinacin es pues una
medida numrica de esta interseccin. Cuando no hay interseccin entre los crculos,
el r2 es cero, mientras que cuando ambos crculos se superponen perfectamente, el r2
es 1, pues ciento por ciento de la variacin en Y es explicada por variaciones en X.

Para calcular el coeficiente, se debe tener presente que: yi = yi + i

y i
2
= y i 2 + i 2 + 2 y i 2 i 2
De aqu que: = yi 2 + i 2
= 2 2 xi 2 + i 2

La sumatoria y i
2
tambin llamada Suma de cuadrados totales muestra la variacin
total de los valores reales de Y respecto de su media muestral. La sumatoria 2 x 2 2 i

es la variacin de los valores de Y estimados alrededor de su media, tambin llamada


Suma de cuadrados de la regresin. Por ltimo, i 2 es la variacin residual o suma
no explicada, tambin llamada Suma de cuadrados de los residuos.

SCT = SCR + SCE

o SST = SSR + SSE por las siglas en ingls.

Ahora, si esta ecuacin se divide a ambos lados por la SCT se obtiene que:

SCR SCE
1= +
SCT SCT

=
(Yi Y )2 +
i
2

(Y Y )
i
2
(Y Y )
i
2

Por tanto, llegamos entonces a la definicin del r : r 2 2


=
(Y Y )
i
2

=
SCE
(Y Y )i
2
SCT

El valor del coeficiente se encuentra comprendido entre cero y uno: a medida que el
coeficiente se acerca a cero, el ajuste del modelo es menor, es decir hay menor
nmero de variaciones de la variable dependiente que son explicadas por cambios en
las variables independientes. De la misma manera, a medida que se acerca a uno el
modelo presenta un mejor fit.

18
En la tabla que muestra Stata tras hacer la regresin del modelo lineal simple, se
observa el coeficiente de determinacin ya calculado. En este caso, tiene un valor de
0,1858, nmero suficientemente cercano a cero como para decir que el modelo no
presenta un buen ajuste. Se puede interpretar entonces que el 18,58% de las
variaciones en el salario estn explicadas por variaciones en los aos de educacin del
individuo.

Por ltimo, hay otros contrastes necesarios como el de heteroscedasticidad,


multicolinealidad, autocorrelacin, especificacin, errores de medicin, normalidad de
los errores, variables omitidas, etc., que se realizaran en el modelo de regresin lineal
mltiple que se explicar ms adelante.

6. Proyecciones del MRLS

Tambin se puede usar los valores estimados para encontrar el valor medio y la
proyeccin para el valor esperado de la variable dependiente. Es importante saber
que:
E[ yi | X = xi ] = E[ 0 + 1 xi + ]
E[ yi | X = xi ] = 0 + 1 xi + E[ ]
E[ yi | X = xi ] = 0 + 1 xi

Ahora, hay que tener en cuenta que el valor esperado de la variable dependiente
(prediccin media) dado un determinado valor de X, se refiere al promedio esperado
para Y, mientras que la proyeccin de la variable dependiente dado un determinado
valor de X (prediccin individual) se refiere al valor que se espera de Y y no a su valor
medio.

Para la realizacin de las proyecciones en el software Stata, el comando que se utiliza


es:

.predict yest, xb

Donde yest es el nombre de la variable estimada que ahora aparecer en el archivo de


datos de ltima en el listado de las variables, y xb estipula que se haga una prediccin
lineal.

En la siguiente tabla se muestra la prediccin de la variable Y del ejemplo de los datos


de Wooldridge que se estn usando en este caso, tras la regresin del modelo
planteado anteriormente:

19
Tabla 5. Prediccin de la variable Y

Para obtener los residuos se utiliza la opcin residuals as:

.predict yest, residuals

7. Comentarios finales

En este documento se present una breve introduccin a la econometra y su


aplicacin en Stata. Se explico la importancia de los conceptos bsicos de la
econometra, del anlisis de regresin y se presento la metodologa de la econometra
teniendo en cuenta nicamente dos variables: dependiente e independiente.

Sin embargo, debido a que la realidad es mucho ms compleja y por razones que se
explicaran ms adelante, el modelo de regresin simple presenta ciertas limitaciones
cuando se emplea como herramienta de anlisis econmico y por ello no es una
herramienta definitiva.

Es necesario ampliar el modelo usando ms de una variable independiente y a este


modelo se le conoce como modelo de regresin lineal mltiple.

8. Bibliografa

Acock, A. C. (2006) A Gentle Introduction to Stata, Third edition. Stata Press


Adkins L.C y Carter R. (2008). Using Stata for Principles of Econometrics. Wiley.
Baum C. F. (2006) An Introduction to Modern Econometrics Using Stata. Stata
Press
Becker, Gary S. (1964) Human Capital: A theorical and empirical analysis, with
special reference to education. New York.
Blossfeld H-P., Golsch K., Rohwer G. (2007) Event History Analysis with Stata.
Cameron A.C y Trivedi P.K (2009). Microeconomtrics using Stata. Stata Press
Cleves M., Gould W., Gutierrez R., Marchenko Y. (2002) An Introduction to
Survival Analysis using Stata. Thrid edition. Stata Press

20
Chiswik, Barry (2003) Jacob Mincer, Experience and the distributions of
earnings. Institute for the study of labor (IZA). IDEAS
Gujarati (2010) Econometra. Mxico. Mc Graw Hill
Gould W., Pitblado J., Sribney W. (2006) Maximum likelihood Estimation with
Stata. Stata Press

Hamilton, L.C. (2009). Statistics with STATA 8. Belmont, CA: Duxbury Press
Kohler, U. y Kreuter, F. (2009). Data Analysis Using Stata. College Station, TX:
Stata Press
Long, J. S. (2009) The Workflow of Data Analysis Using Stata. Stata Press.
Mincer, J. (1974) Schooling, experience and earnings, Columbia University
Press.
Mitchell M. (2008) A visual guide to Stata Graphics. Stata Press
Murray, M. (2006) Econometrics: a modern introduction. Ed. Pearson
Pollock, Ph. H. (2006) A Stata Companion to Political Analysis. Washington, CQ
Press.
Rabe-Hesketh, S. y Everitt, B. (2004). A Handbook of Statistical Analysis Using
STATA, London: Chapman & Hall/CRC Press
Newton J., Cox N. (2003) Seventy-six Stata tips
STATA CORP (2008). Users Guide, Reference Manual Release 10. Stata Press.
Wooldridge, J. (2006) Introduccin a la econometra. Un enfoque moderno. Ed.
Thomson

Algunos recursos en Internet para usuarios Stata:


http://www.ats.ucla.edu/stat/stata/
http://econpapers.hhs.se/paper/bocbocoec/531.htm
http://fmwww.bc.edu/ec/res.info.php
http://ideas.repec.org/s/boc/bocins.html

21

Das könnte Ihnen auch gefallen