Sie sind auf Seite 1von 103

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE ECONOMÍA

Econometría I

Econ. Mariana Cedeño Preciado, Msc.

Enero/2019
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Datos Generales
- Disciplina
- Puntualidad
- Atención
- Celulares
- Conversar
- Fecha de entrega de tareas
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Estructura de calificación

- Actuación en clase
- Investigaciones
- Tareas – Deberes
- Lecciones
- Análisis de artículos del periódico 5 puntos
- Casos de estudio
- Talleres
- Aportes - Test
- Proyecto

- Examen 5 puntos
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Evaluaciones

- Lecciones semanales
- Aportes mensuales
- Proyecto al final de cada parcial
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Bibliografía

- Damodar Gujarati: Econometría - Quinta edición


- Dominick Salvatore: Econometría - Cuarta edición
- Alfonso Novales: Econometría - Segunda edición
- Barbancho: Fundamentos y posibilidades de Econometría –
Cuarta edición
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Distribución de Probabilidad de la perturbación μ
El método de MCO no hace ninguna suposición
concerniente con la naturaleza probabilística de ui, resulta
de poca ayuda para el propósito de deducir inferencias
sobre FRP mediante el FRM, a pesar del teorema de
Gauss-Markov.
Este vacío puede llenarse si se supone que las u siguen
determinada distribución de probabilidad. Por lo general
se supone que las u tienen la distribución de probabilidad
normal. Si a las suposiciones del modelo clásico de
regresión lineal (MCRL) se añade la suposición de
normalidad para ui, obtenemos lo que se conoce como el
modelo clásico de regresión lineal normal (MCRLN).
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Supuesto de Normalidad
La regresión lineal normal clásica supone que cada ui, está
normalmente distribuida con:

Estos supuestos pueden expresarse en forma más compacta


como:
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Se puede observar que para dos variables normalmente
distribuidas, una covarianza o correlación cero significa
independencia entre las dos variables.
Por consiguiente, el supuesto de normalidad, significa que
ui y uj no solamente no están correlacionadas, sino que
también están independientemente distribuidas.
Por consiguiente, podemos decir que:
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
¿Por qué razón debe formularse el supuesto de normalidad?
1. μi representa la influencia combinada (sobre la variable dependiente) de
un gran número de variables independientes que no se han introducido
explícitamente en el modelo de regresión. Esperamos que la influencia de
estas variables omitidas o descartadas sea pequeña y, en el mejor de los
casos, aleatoria.
2. Con el teorema del límite central (TLC) en estadística, se puede demostrar
que si existe un gran número de variables aleatorias independientes e
idénticamente distribuidas entonces, la distribución de su suma tiende a
ser normal a medida que el número de tales variables se incrementa
indefinidamente. Precisamente este teorema del límite central es el que
proporciona una justificación teórica para el supuesto de normalidad de μi.
3. Una variante del teorema del límite central establece que aunque el
número de variables no sea muy grande o si estas variables no son
estrictamente independientes, su suma puede estar aún normalmente
distribuida.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
4. Con el supuesto de normalidad, las distribuciones de probabilidad de
los estimadores MCO pueden derivarse fácilmente ya que, una
propiedad de la distribución normal es que cualquier función lineal
de variables normalmente distribuidas estará también normalmente
distribuida. los estimadores MCO ß1, y ß2 son funciones lineales de
μi. Por consiguiente, si μi está normalmente distribuida, entonces
también lo están ß1, y ß2.
5. La distribución normal es una distribución comparativamente
sencilla e involucra dos parámetros (la media y la varianza).
6. Si estamos trabajando con una muestra finita o pequeña, digamos
con datos de 100 o menos observaciones, la suposición de
normalidad desempeña un papel crítico. No sólo ayuda a derivar las
distribuciones de probabilidad exactas de los estimadores MCO, sino
también permite utilizar las pruebas estadísticas t, F y χ2 para los
modelos de regresión.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
PROPIEDADES DE LOS ESTIMADORES MCO BAJO EL SUPUESTO DE
NORMALIDAD
Si se supone que u, sigue la distribución normal, los estimadores MCO tienen
las propiedades que se mencionan a continuación;
Son insesgados.
Tienen varianza mínima. Esto significa que son insesgados con varianza
mínima, o estimadores eficientes.
Presentan consistencia; esto es, a medida que el tamaño de la muestra
aumenta indefinidamente, los estimadores convergen hacia sus verdaderos
valores poblacionales.
ß1 (al ser una función lineal de ui) está normalmente distribuida con
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
ß2 (al ser una función lineal de ui) está normalmente distribuida con
ß2 ~ N(ß2, σ2ß2)
(n - 2)(σ2 estimada /σ2) está distribuida como la distribución χ2 (ji-
cuadrada), con (n - 2) g de l. Saber esto nos ayuda a colegir inferencias
respecto a la verdadera σ2, a partir de la σ2 estimada.
ß1, y ß2 estimadas se distribuyen de manera independiente respecto a
σ2 estimada .
ß1, y ß2 estimadas tienen varianza mínima entre todas las clases de
estimadores insesgados, lineales o no lineales. Este resultado,
desarrollado por Rao, es muy poderoso porque a diferencia del teorema
de Gauss-Markov no está restringido solamente a la clase de
estimadores lineales. Por consiguiente, se puede decir que los
estimadores de mínimos cuadrados son los mejores estimadores
insesgados (MEI); es decir, tienen una varianza mínima en toda la clase
de los estimadores insesgados.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Prueba de Normalidad de μ
Aunque se han estudiado diversas pruebas de
normalidad en la teoría, solamente se
considerarán tres:
1) histograma de residuos:
2) gráfica de probabilidad normal (GPN), y
3) la prueba Jarque-Bera.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Histograma de residuos: Es un gráfico que se utiliza para
saber algo sobre la forma de la FDP de una variable
aleatoria. En el eje horizontal, dividimos los valores de la
variable de interés (por ejemplo, los residuos MCO) en
intervalos convenientes, y sobre cada intervalo de clase
construimos rectángulos cuya altura sea igual al número
de observaciones (es decir, la frecuencia) para ese
intervalo de clase.
Si mentalmente se coloca la cuna de distribución normal
en forma de campana sobre el histograma, se tendrá
cierta idea si la aproximación normal (FDP) resulta
apropiada o inapropiada.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Gráfica de probabilidad normal Un dispositivo gráfico
comparativamente simple para estudiar la forma de la función
de densidad de probabilidad (FDP) de una variable aleatoria es
la gráfica de probabilidad normal (GPN), la cual utiliza el papel
de probabilidad normal.
Sobre el eje horizontal, o eje X, graficamos los valores de la
variable en estudio (digamos, los residuos MCO, üi), y sobre el
eje vertical, o eje Y, mostramos el valor esperado de esta
variable si estuviera normalmente distribuida. Por tanto, si la
variable de hecho fuese de la población normal, la GPN sería
aproximadamente una recta. Si la recta resultante en la GPN
es aproximadamente una recta, se podría concluir que la
variable en estudio está normalmente distribuida.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Prueba de normalidad de Jarque-Bera (JB). La prueba de
normalidad de JB también está basada en los residuos MCO.
Esta prueba calcula primero la asimetría y la curtosis o
apuntalamiento de los residuos MCO y utiliza el siguiente
estadístico de prueba:

donde n = tamaño de la muestra, S = coeficiente de


asimetría y K = coeficiente de curtosis. Para una variable
normalmente distribuida, S = 0 y K = 3. Por lo tanto, la
prueba JB de normalidad constituye una prueba de la
hipótesis conjunta de que S y K son 0 y 3, respectivamente.
En dicho caso, se espera que el valor del estadístico JB sea
igual a cero.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
De acuerdo con la hipótesis nula, la cual afirma que los
residuos están normalmente distribuidos, Jarque y Bera
mostraron que asintóticamente (es decir, en muestras
grandes) el estadístico JB sigue la distribución ji-cuadrada,
con 2 g de l. Si el valor p calculado del estadístico JB es
suficientemente bajo en una aplicación, lo cual sucederá
si el valor del estadístico difiere en gran medida de cero,
se puede rechazar la hipótesis de que los residuos están
normalmente distribuidos. Pero si el valor p es
razonablemente alto, lo cual pasa cuando el valor del
estadístico está cercano a cero, no se rechaza la
suposición de normalidad.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Multicolinealidad
El término de multicolinealidad significa la existencia de una
relación perfecta o exacta entre las variables explicativas de un
modelo de regresión.
Se supone que en un modelo clásico de regresión lineal no hay
multicolinealidad debido a que:
 Si la multicolinealidad es perfecta los coeficientes de la
regresión de las variables x son indeterminados y sus
errores estándar son infinitos.
 Si la multicolinealidad es menos que perfecta los
coeficientes de regresión poseen grandes errores estándar,
lo que hace que los coeficientes no pueden ser estimados
con gran precisión.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Fuentes de Multicolinealidad
 El método de recolección de información empleado, es
decir muestras obtenidas en un rango limitado de
valores.
 Restricciones sobre el modelo o en la población que es
objeto de muestreo.
 Especificación del modelo.
 Un modelo sobredeterminado. Es decir que posee más
variables explicativas que el número de observaciones
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Estimación en presencia de Multicolinealidad perfecta:
Aquí los coeficientes de regresión permanecen
indeterminados y sus errores estándar son infinitos. Si X3
y X2 son perfectamente colineales, no hay forma que X3 se
mantenga constante, porque a medida que cambia X2 lo
hace X3, esto hace que no se pueda separar la influencia
de las dos variables sobre Y.
En el caso de multicolinealidad perfecta, no se puede
obtener una solución única para los coeficientes de
regresión individual, pero si se pueden obtener para
combinaciones lineales de estos. En el caso de
multicolinealidad perfecta, las varianzas y los errores
estándar de β2 y β3 son infinitos.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Estimación en presencia de Multicolinealidad alta pero
imperfecta:
Por lo general no existe una relación perfecta entre las
variables, pero si puede haber una alta multicolinealidad,
situación en la cual es posible la estimación de los
coeficientes de regresión β2 y β3.
Consecuencias teóricas de la Multicolinealidad:
Si se satisfacen los supuestos del modelo clásico, los
estimadores MCO de los coeficientes de regresión son
MELI, y aún en caso de presentarse una alta
multicolinealidad, los estimadores seguirán siendo MELI.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
...
Primero: El insesgamiento es una propiedad de
muestreo repetido, lo que no nos dice nada respecto
de las propiedades de los estimadores de una
muestra dada.
Segundo: La colinealidad no destruye la propiedad
de varianza mínima. Los estimadores
lineales insesgados tienen varianza mínima, es
decir son eficientes. Pero esto no significa que la
varianza de un estimador MCO sea necesariamente
pequeña.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Consecuencias de la Multicolinealidad:
1. Los estimadores MCO presentan varianzas y covarianzas
grandes que hacen difícil la estimación precisa.
2. Los intervalos de confianza tienden a ser mucho más
amplios, lo que hace más posible aceptar una hipótesis nula
de cero.
3. La razón t de uno o más coeficiente tienden a ser no
significativas.
4. El R 2 puede ser muy alto.
5. Los estimadores MCO y sus errores estándar pueden ser
sensibles a pequeños cambios en la información.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Detección de la Multicolinealidad
Entre las distintas formas de detectar
multicolinealidad están las sgts:
1) La presencia de un R2 elevado y razones t poco
significativas.
2) Altas correlaciones entre parejas de regresores
3) Regresiones auxiliares
4) Factores de tolerancia y de inflación de varianza
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Factores de tolerancia y de inflación de varianza.
Conforme R2j —el coeficiente de determinación en la regresión
de la regresora Xj sobre las regresoras restantes del modelo—
se aproxima a la unidad, es decir, conforme la colinealidad de
Xj con las otras regresoras se incrementa, FIV también
aumenta, y en el límite puede ser infinito.

Entre mayor es el valor del FIV, mayor "problema" o colinealidad


tiene la variable Xj. si el FIV de una variable es superior a 10
(esto sucederá si R2 excede 0.90), se dice que esa variable es
altamente colineal.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Factores de tolerancia y de inflación de varianza.
Podría utilizarse TOL, como una medida de la multicolinealidad, en vista
de su estrecha conexión con FIV. Mientras más cerca esté TOL, de cero,
mayor será el grado de colinealidad de esa variable respecto a las otras
regresoras. Por otra parte, mientras más cerca esté TOL, de 1, mayor
será la evidencia de que X no es colineal con las otras regresoras.

Los diversos métodos para la detección de la multicolinealidad son


esencialmente "expediciones de pesca", ya que no puede decirse
cuáles de ellos funcionan en una aplicación particular. Sin embargo, no
se puede hacer mucho al respecto, puesto que la multicolinealidad es
un problema específico de una muestra dada sobre la cual el
investigador puede no tener mucho control.
1
𝐹𝐼𝑉2 = 1−𝑅2
2

𝑇𝑂𝐿2 = 1 + 𝐹𝐼𝑉2 = (1 − 𝑅22 )


UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Soluciones
En principio, el problema de la multicolinealidad está
relacionado con deficiencias en la información
muestral.
El diseño muestral no experimental es, a menudo, el
responsable de estas deficiencias. Sin embargo, la
aproximación cuantitativa a los conceptos teóricos
puede ser inadecuada, haciendo que en el término
de perturbación se absorban errores de
especificación.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Soluciones
1) Eliminación de variables
2) Aumento del tamaño de la muestra
3) Utilización de información extramuestral
4) Transformación de Variables:
 Forma de Primeras diferencias
 Utilización de ratios (tasas)
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Heterocedasticidad
Se había establecido la hipótesis básica de que la
varianza de las perturbaciones era constante, es decir:
V = Var(u) = σ2
o hipótesis de homocedasticidad. Cuando se verifica su
incumplimiento en varios grupos se dice que existe
heterocedasticidad o que las pertubaciones son
heterocedásticas.
“Se da cuando la varianza de los errores no es constante
en las distintas observaciones ”
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

La heterocedasticidad no es más que una


estructura sistemática en los términos de error
en los que la varianza no se mantiene constante
a lo largo de la muestra. Por ejemplo al medir la
relación entre el consumo y el nivel de ingresos
de las familias.
Homocedasticidad: E ( Ui 2 ) = 2
Heterocedasticidad: E ( Ui 2 ) ≠ 2
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Causas de la presencia de heterocedasticidad
La heterocedastidad se da, fundamentalmente en datos de
corte transversal.
Las principales causas son:
1) Presencia de un grupo de datos atípicos (gran dispersión)
2) Omisión de variables relevantes
3) Presencia de subgrupos en la población con dispersiones
distintas en cada uno de ellos
4) Base de datos agregada en donde cada dato procede de
una muestra realizada en una población que tiene varianzas
distintas
5) Parámetros del modelo estocásticos
6) Incorrecta transformación de los datos o forma funcional
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Estimación MCO con Heterocedasticidad
1) Los estimadores siguen siendo INSESGADOS
2) Los estimadores siguen siendo CONSISTENTES
3) Los estimadores dejan de ser EFICIENTES ya que no son los de minina
varianza.
4) Las varianzas y covarianzas de los estimadores de MCO son SESGADAS e
INCONSISTENTES. Por este motivo los test de hipótesis ya no son válidos.
5) Los contrastes de hipótesis y los intervalos de confianza habituales,
basados en las estimaciones de los errores estándar, no son correctos. La
estimación por MCO de los parámetros de un modelo heterocedástico
podría conducirnos a considerar como significativos parámetros que en
realidad no lo son.
6) Incorrecta estimación de los parámetros
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Detección de la Heterocedasticidad
(métodos informales)

Método grafico:
Consiste en hacer una regresión bajo el supuesto de que no
existe heterocedasticidad y luego examinar los u con las Y, para
ver si hay algún patrón de comportamiento. En caso de que el
gráfico presente algún patrón sistemático entre las dos
variables el modelo tendría problemas de heterocedasticidad.
Se realiza la representación gráfica de los residuos y de los
residuos al cuadrado.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Detección de la Heterocedasticidad
(métodos formales)

1) Test de GOLDFELD-QUANT
2) Test de BREUSH-PAGAN
3) Test de WHITE
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
TEST DE GOLDFELD-QUANT
Se basa en la idea que si la varianza de los errores es igual a
través de todas las observaciones, entonces la varianza para
una parte de la muestra será la misma que la calculada con
otra parte de la misma.
1) Se identifica una variable Z relacionada con la varianza de
los errores. Si suponemos que la relación es POSITIVA,
ordenamos de manera creciente los datos de la muestra.
2) Se omiten “c” observaciones centrales. Generalmente c ≈
n/3
3) Dividimos la muestra en 2 partes omitiendo los valores
centrales (c)
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
1) Estimamos las regresiones por separado. Una para las
primeras n – c/2 observaciones y otra para las segundas.
2) Obtenemos SEC (Suma de Cuadrados del Error/Residuos)
de cada una de las regresiones
3) Calculamos Fcalc = SEC2/n-k SCR2
SEC1/n-k SCR1
7) (n - c)/2 – k grados de libertad tanto en el numerador como
en el denominador
Limitación: El éxito depende de (c) y que se seleccione
correctamente X.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
TEST DE BREUSH-PAGAN
Supone que la varianza de los errores no es una constante
sino que está relacionada con un número de variables Z.
Y1= 1 + 2X2 + .... U1
2 = 1 + 2 Z2 + .... p Zp (p<= k)
Si 1 = 2 = .... p = 0 entonces la varianza de los
errores es constante indicando Homocedasticidad
Estimamos Y1= 1 + 2X2 + .... U1 por MCO y luego
calculamos los residuos (errores) del modelo.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
U2i (estimado) es una estimación de la varianza de los
errores.
Si 1 = 2 = .... p = 0 fuese válida podemos esperar que
U2i (estimado) esté relacionado con las variables Z lo que
sugiere una regresión auxiliar.
U2i (estimado) = 1 + 2 Z2 + .... p Zp
2 (estimado)
El estadístico tiene distribución Chi-cuadrado con p
grados de libertad.
Limitación: Es sensible a cualquier tipo de violación del
supuesto de normalidad de los errores.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
TEST DE WHITE:
También es un test para muestras grandes y es parecido al de Breush-Pagan, pero no
necesita ningún supuesto previo acerca de las causas de la heterocedasticidad.
1) Estimamos el modelo por MCO.
2) Calculamos U2i (estimado)
3) Estimamos un modelo de regresión utilizando U2i (estimado) como variable
dependiente sobre las X originales, las X2 y los productos cruzados.

4) Calculamos R2 para la regresión y n.R2


5) Se obtiene el coeficiente de determinación de la regresión auxiliar y el producto de
éste por el número de observaciones se distribuye, bajo la hipótesis nula de
homocedasticidad, como una ji-cuadrado con p grados de libertad, siendo p el
número de regresores en la regresión auxiliar, excluido el término constante. Si el
producto nR2 es mayor que χ2 p al nivel de confianza fijado, entonces se rechaza
la hipótesis de homocedasticidad y se admite la presencia de heterocedasticidad.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Soluciones a la Heterocedasticidad

Mínimos Cuadrados Generalizados : Consiste en dividir


cada término por  i.
Modelo transformado
Y1/i. = 1X1/i. + 2X2/i. + ....

Este modelo satisface los supuestos de MCO, pero se


puede presentar el inconveniente de no conocer i.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Mínimos Cuadrados Ponderados: es una extensión del MCG.
Definimos W1= 1/i. Y transformando el modelo nos queda
Y1W1 = 1(X1W1) + 2(X2W1). + ….. (UiW1)
En este modelo transformado cada observación de la variable está
ponderada por W1 (inversamente proporcional a i)
Conocemos la estructura de la Heterocedasticidad
Suponemos Var(Ui) = 2. Z2 (se denomina Heterocedasticidad
Multiplicativa)
W = 1/Z .... Nos queda el modelo transformado.
La Var(Ui transformado) = 2.(porque se nos elimina Z2) , de esta
manera nos queda un modelo Homocedastico.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Autocorrelación
El término autocorrelación se puede definir como la
"correlación entre miembros de series de
observaciones ordenadas en el tiempo [como en
datos de series de tiempo] o en el espacio [como en
datos de corte transversal]".
En el contexto de regresión, el modelo clásico de
regresión lineal supone que no existe tal
autocorrelación en las perturbaciones ui.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Causas de la Autocorrelación
• Inercia
• Sesgo de especificación: variables excluidas
• Sesgo de especificación: Forma funcional
incorrecta
• Fenómeno de la telaraña
• Rezagos
• Transformación de los datos
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Estimación MCO con Autocorrelación


1) Los estimadores siguen siendo INSESGADOS
2) Los estimadores siguen siendo CONSISTENTES
3) Los estimadores dejan de ser EFICIENTES ya
que no son los de minina varianza.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Métodos de detección
Gráfico de los residuos
El supuesto de no autocorrelación del modelo clásico se relaciona con las
perturbaciones poblacionales ut las cuales no pueden observarse
directamente. En su lugar, se dispone de sus valores aproximados, los residuos
estimados. Con mucha frecuencia un examen visual de las ü nos da algunas
claves sobre la posible presencia de autocorrelación en las u.
Proporciona ocasionalmente un resumen fácil para entender un problema
complejo, permiten el examen simultáneo de la información, considerada en
su conjunto, mientras que a la vez ilustran claramente el comportamiento de
los casos individuales.
Se puede graficar los residuos a través del tiempo, los residuos
estandarizados o los residuos con los residuos rezagados.
Si la gráfica de los residuos siguen un patrón definido, el modelo presenta
autocorrelación.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Prueba de "las rachas"
Los residuos tienen una característica peculiar: presentan varios
residuos que son negativos, luego se presenta una serie de residuos
positivos y finalmente se observan muchos residuos, nuevamente
negativos, o viceversa. Si los residuos fuesen puramente aleatorios,
¿sería posible observar tal patrón? Intuitivamente parece poco
probable. Esta intuición puede verificarse mediante la llamada prueba
de "las rachas
Para explicar esta prueba, se anotan simplemente los signos (+ o -) de
los residuos de la regresión.
(--------)(+++++++++++++++++++++)(--------)
Una racha es una sucesión ininterrumpida de un símbolo o atributo, tal
como + o -. Se expresa además la longitud de una racha como el
número de elementos en ésta.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Al examinar el comportamiento de las rachas en una sucesión de
observaciones estrictamente aleatoria, es posible derivar una prueba
de aleatoriedad de las rachas. Se hace la siguiente pregunta: ¿las 3
rachas observadas en el ejemplo consistente de 40 observaciones, son
muchas o muy pocas en comparación con el número de rachas
esperadas en una sucesión de 40 observaciones estrictamente
aleatoria? Si hay muchas rachas, significa que los residuos cambian de
signo frecuentemente y se indica con esto una correlación serial
negativa. Si hay muy pocas rachas, esto puede sugerir autocorrelación
serial positiva.
Se puede validar con los valores de las tablas en donde nos da el valor
inferior y el superior del número de rachas. La regla de decisión es si el
número de rachas es menor o igual al valor inferior o mayor o igual que
el número superior se puede rechazar la hipótesis nula.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Durbin Watson
El estadístico d es calculado a partir de los üi, los cuales, por supuesto,
dependen de las X dadas. Por consiguiente, a diferencia de las pruebas t, F o
x2 no hay un valor crítico único que lleve al rechazo o a la aceptación de la
hipótesis nula de que no hay correlación serial en las perturbaciones ui.
Sin embargo, Durbin y Watson tuvieron éxito al encontrar un límite inferior dL y
un límite superior du tales que si el valor d calculado cae por fuera de estos
valores críticos, puede tomarse una decisión con respecto a la presencia de
correlación serial positiva o negativa. Además, estos límites solamente
dependen del número de observaciones n y del número de variables
explicativas y no dependen de los valores que adquieren estas variables
explicativas. Estos límites para n, de 6 a 200 y hasta 20 variables explicativas,
han sido tabulados por Durbin y Watson.
El procedimiento de prueba aplicado puede explicarse mejor con la ayuda de
un gráfico, el cual muestra que los límites de d son 0 y 4.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
El mecanismo de la prueba de Durbin-Watson es el siguiente, suponiendo que
se cumplen los supuestos sobre los cuales se basa la prueba:
Efectuar la regresión MCO y obtener los residuos.
Calcular d.
Para un tamaño de muestra dado y un número de variables explicativas dado,
encuéntrense los valores críticos dL y du.
Síganse ahora las reglas de decisión.
A pesar de ser muy popular, la prueba d tiene una gran desventaja: cuando
cae en la zona de indecisión, no se puede concluir si existe o no la
autocorrelación.
Al hacer la prueba con la tabla Dw tenemos que para 4 variables y 16
observaciones dl = 0.734 y du = 1.935
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Prueba de Breusch-Godfrey

Se basa en maximización con Multiplicadores de Lagrange.

Sigue una distribución Chi-cuadrada.


UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Error de Especificación o Sesgo de Especificación
CRITERIO DE SELECCIÓN DEL MODELO
1. Ser aceptable según los datos.- las predicciones hechas con base en el modelo
deben ser lógicamente adecuadas.
2. Ser consistente con la teoría.- debe tener un sentido económico pertinente.
3. Tener regresoras débilmente exógenas.- las variables explicativas, o regresoras, no
deben estar correlacionadas con el término de error.
4. Mostrar constancia paramétrica.- los valores de los parámetros deben ser estables.
De otra forma, el pronóstico se dificultará.
5. Exhibir coherencia en los datos.- los residuos estimados a partir del modelo deben
ser puramente aleatorios. En otras palabras, si el modelo de regresión resulta
adecuado, los residuos obtenidos de este modelo deben ser de ruido blanco. Si no
es el caso, existe un error de especificación en el modelo.
6. Ser inclusivo.- el modelo debe abarcar o incluir a todos los modelos rivales, en el
sentido que puede explicar sus resultados. En resumen, otros modelos no pueden
significar una mejora del modelo elegido.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Existen tres tipos de errores de especificación:


1. Inadecuada selección de la forma funcional
del modelo
Sea Yt = β1 + β2Xt + Ut
Si el gráfico no sigue una tendencia lineal el
modelo es incorrecto, esto se da cuando
tenemos funciones que son cuadráticas,
exponenciales, etc.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
2. Inclusión de variables no relevantes en el modelo
Considere que el modelo verdadero que explica a Y está dado por:
Yt = β1 + β2X2t + β3X3 + Ut
Sin embargo el modelo que se estima es:
Yt = β1 + β2X2t + β3X3 + β4X4t + β5X5t + Ut
Se aumentó 2 variables que no son significativas al modelo, esto tiene repercusiones:
1. se mantiene la linealidad
2. Se mantiene el insesgamiento
3. Se pierde la eficiencia, esto impacta sobre las varianzas, los errores estándar y
sobre la significancia de los estimadores
Esto es relativamente fácil de solucionar haciendo regresiones bivariantes, es decir la
variable dependiente con una de las independientes y así sucesivamente con cada una
y luego hacer un modelo con las variables más significativas.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
3. Omisión de variables relevantes.
El modelo verdadero está dado por:
Yt = β1 + β2X2t + β3X3 + Ut
Pero se estima:
Yt = β1 + β2X2t + Ut
Esto afecta a los estimadores:
1. siguen siendo lineales
2. Siguen siendo insesgado
3. Deja de ser eficiente
Esto hace que no se haga una buena significancia estadística. Este error es el
que más puede darse. En datos de series de tiempos se puede detectar con R2
y R2A muy bajos.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Métodos de Detección
Gráfico
Graficar la variable regresada con cada una de las
regresoras y verificar la forma funcional que presentan.
4.8 4.8

4.4 4.4

4.0 4.0
LCO

LCO

3.6 3.6

3.2 3.2

2.8 2.8
2.8 3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 7.0 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8
LA LH

4.8 4.8

4.4 4.4

4.0 4.0
O

O
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
- Test de los indicadores
- R2 bajo
- Razones t poco significativas
- d Durbin – Watson bajo
- Prueba Reset de Ramsey
RESET = REgression Specification Error Test
La prueba tiene como propósito detectar la
existencia de error de especificación en un modelo.
Sigue una distribución F.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Formas funcionales de los modelos de regresión
Existen algunos modelos de regresión más comúnmente
utilizados, que pueden ser no lineales en las variables pero que
son lineales en los parámetros o que pueden serlo mediante
transformaciones apropiadas de las variables. En particular, se
presentan los siguientes modelos de regresión:
• El modelo log-lineal
• Modelos semilogarítmicos
• Modelos recíprocos
• El modelo logarítmico recíproco
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Medición de la Elasticidad: Modelo LOG-LINEAL
Considérese el siguiente modelo, conocido como el modelo de
regresión exponencial:
el cual puede ser expresado alternativamente como:

donde ln = logaritmo natural (es decir, logaritmo en base e y donde e =


2.718).

Donde α = lnβ1, este modelo es lineal en los parámetros α y ß2 lineal en


los logaritmos de las variables Y y X y puede ser estimado por regresión
MCO.
Debido a esta linealidad, tales modelos se denominan modelos log-log,
doble-log, o log-lineales.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Una característica importante del modelo log-log, que lo ha hecho muy popular
en el trabajo empírico, es que el coeficiente de la pendiente ß2 mide la
elasticidad de Y con respecto a X, es decir, el cambio porcentual en Y ante un
pequeño cambio porcentual en X dado.
Pueden observarse dos características especiales del modelo log-lineal: el
modelo supone que el coeficiente de la elasticidad entre Y y X, ß2, permanece
constante de aquí su nombre alterno modelo de elasticidad constante. En
otras palabras, el cambio en ln Y por unidad de cambio en ln X (es decir, la
elasticidad, ß2) permanece igual sin importar en cuál lnX medimos la
elasticidad.
Otro aspecto del modelo es que a pesar de que α y ß2 son estimadores
insesgados de α y ß2, ß1 (el parámetro del modelo original) al ser estimado
como , ß1 = antilog (α) es, de por sí, un estimador sesgado.
En el modelo de dos variables, la forma más simple de decidir si el modelo log-
lineal se ajusta a los datos es graficar el diagrama de dispersión de ln Y, frente
a ln X y ver si las observaciones caen aproximadamente sobre una línea recta.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Modelos Semilogarítmicos: LOG-LIN Y LIN-LOG

Cómo medir la tasa de crecimiento: Modelo Log-Lin

Los economistas, la gente de negocios y los gobiernos frecuentemente están interesados en encontrar la
tasa de crecimiento de ciertas variables económicas, tales como población, PNB, oferta monetaria,
empleo, productividad, déficit comercial, etc.

Si se desea saber la tasa de crecimiento del gasto de consumo personal en servicios. Sea Y el gasto real
en servicios en el tiempo t, y Y0 el valor inicial del gasto en servicios. Si utilizamos la fórmula del interés
compuesto:

donde r es tasa de crecimiento compuesta de Y (es decir, a través del tiempo). Aplicando el logaritmo
natural podemos escribir:

Ahora si:

Este modelo es igual a cualquier otro modelo de regresión lineal en el sentido de que los parámetros son
lineales. La única diferencia es que la variable dependiente o regresada es el logaritmo de Y y el regresor
o variable explicativa es el "tiempo", que adquiere valores de 1,2,3, etc.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Estos modelos se denominan modelos semilog porque solamente una variable
(en este caso la regresada) aparece en forma logarítmica. Para fines
descriptivos, un modelo en el cual la variable regresada es logarítmica se
denominará modelo log-lin.
En este modelo el coeficiente de la pendiente mide el cambio proporcional
constante o relativo en Y para un cambio absoluto dado en el valor del regresor
(en este caso la variable t), es decir:

Si se multiplica el cambio relativo en Y por 100, nos dará entonces el cambio


porcentual, o la tasa de crecimiento, en y ocasionada por un cambio absoluto
en X, el regresor. Es decir, 100 por ß2 da como resultado la tasa de crecimiento
en Y; 100 por ß2 se conoce como la semielasticidad de Y respecto a X.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Modelo de tendencia lineal
Los investigadores algunas veces estiman el siguiente modelo:

Es decir, en lugar de hacer la regresión para el log de Y sobre el


tiempo, lo hacen para Y sobre el tiempo. Un modelo de este
tipo se denomina modelo de tendencia lineal y la variable
tiempo t se conoce como la variable de tendencia. Si el
coeficiente de la pendiente es positivo, existe una tendencia
creciente en Y, mientras que si es negativa, existe una
tendencia decreciente en Y.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
El modelo Lin-Log
En este modelo hay interés en encontrar el cambio absoluto en Y debido a un
cambio porcentual en X. Un modelo que puede lograr este propósito puede
escribirse como:

Interprétese el coeficiente de la pendiente ß2. Como es usual:

Esta ecuación plantea que el cambio absoluto en Y (= ΔY) es igual a la


pendiente multiplicada por el cambio relativo en X. Si este último es
multiplicado por 100, entonces esta ecuación da el cambio absoluto en Y
ocasionado por un cambio porcentual en X. Así, si ΔX/X cambia en 0.01
unidades (o 1%), el cambio absoluto en Y es 0.01(ß2). Por tanto, si en una
aplicación se encuentra que (ß2 = 500, entonces el cambio absoluto en Y es
(0.01)(500), o 5.0.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Modelos Recíprocos

Los modelos del siguiente tipo se conocen como modelos


recíprocos.
1
𝑌𝑡 = 𝛽1 + 𝛽2 + 𝜇𝑡
𝑋𝑡

A pesar de que este modelo es no lineal en la variable X porque


entra inversamente o en forma recíproca, el modelo es lineal
en ß1 y ß2, por consiguiente, es un modelo de regresión lineal.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Características
Este modelo tiene las siguientes características:
• A medida que X aumenta indefinidamente, el
término ß2 (1/X) se acerca a cero (nota: ß2 es una
constante) y Y se aproxima al valor límite o
asintótico ß1.
• Contienen un valor asintótico o límite que tomará
la variable dependiente cuando el valor de la
variable X aumente indefinidamente.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Aplicación
Una de las aplicaciones importantes es la conocida curva
de Phillips de macroeconomía. Con base en los datos de
tasa de cambio porcentual de los salarios nominales (Y) y
la tasa porcentual de desempleo (X) para el Reino Unido
durante el periodo 1861 a 1957. Phillips obtuvo una curva
cuya forma general se parece a la figura.
Desde la publicación del artículo de Phillips, se ha llevado
a cabo una muy extensa investigación sobre la curva de
Phillips tanto a nivel teórico como empírico.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Existe asimetría en la respuesta de


los cambios salariales al nivel de
desempleo: si la tasa de desempleo
está por debajo de U (denominada
como tasa natural de desempleo) por
cada unidad de cambio en el
desempleo, los salarios aumentan
con mayor rapidez de lo que caen
debido a un cambio equivalente
cuando la tasa de desempleo está
por encima del nivel natural, ß1,
indicando la base asintótica para el
cambio salarial. Este hecho particular
de la curva de Phillips puede deberse
a factores institucionales, tales como
el poder de negociación de los
sindicatos, los salarios mínimos,
compensaciones por desempleo, etc.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Modelo log hipérbola o recíproco logarítmico


Se concluye este análisis de los modelos
recíprocos, estudiando el modelo recíproco
logarítmico, que toma la siguiente forma:
1
𝑙𝑛𝑌𝑡 = 𝛽1 + 𝛽2 + 𝜇𝑡
𝑋𝑡
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Al principio Y se incrementa a una
tasa creciente (es decir, la curva es
convexa al inicio) y luego aumenta a
una tasa decreciente (la curva se
convierte en cóncava).
Este modelo sería apropiado para
representar una función de
producción a corto plazo.
Recuérdese que si el trabajo y el
capital son insumos en una función
de producción y si se mantiene
constante el insumo capital pero se
incrementa el insumo trabajo, la
relación entre producto y trabajo a
corto plazo se parecerá a esta
figura.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Elección de la forma funcional
La elección de una forma funcional particular puede ser relativamente
fácil para el caso de dos variables, ya que se pueden graficar las
variables y tener así una ligera idea respecto al modelo apropiado. La
elección se vuelve mucho más complicada cuando se considera el
modelo de regresión múltiple que involucra más de una regresora. No
se niega que se requiera una gran destreza y experiencia al escoger un
modelo apropiado para la estimación empírica. No obstante, se pueden
poner a la disposición algunas sugerencias.
1. La teoría subyacente (por ejemplo, la curva de Phillips) tal vez sugiera
una forma funcional particular.
2. Es una buena práctica calcular la tasa de cambio (es decir, la
pendiente) de la regresada, con respecto a la regresora, así como
conocer la elasticidad de la regresada con respecto a la regresora.
3. Los coeficientes del modelo escogido deberán satisfacer
determinadas expectativas a priori.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Elección de la forma funcional
4. Algunas veces tal vez más de un modelo se ajuste razonablemente bien a
un determinado conjunto de datos dados. Puede darse que un modelo
lineal y otro recíproco se ajusten a los datos. En ambos casos, los
coeficientes pueden ser adecuados para las expectativas previas y esta-
dísticamente significativos. En ese cado se preferiría el modelo con r2 más
alto. Pero se debe asegurar de que al comparar dos valores de r2 la
variable dependiente (o regresada) de los dos modelos sea la misma; la(s)
regresor(as) pueden tomar cualquier forma.
5. En general no se debe sobrevaluar la medición de r2 en el sentido de creer
que mientras más alta sea r2 mejor será el modelo, ya que r2 se
incrementa conforme se añaden más regresoras al modelo. Lo que reviste
mayor importancia es la justificación teórica del modelo elegido, los signos
de los coeficientes estimados y su importancia estadística. Si un modelo
es bueno bajo estos criterios, entonces quizá resulte aceptable un modelo
con una r2 menor.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Pruebas adicionales
• Prueba MWD
• Prueba de Chow
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Prueba de la forma funcional de la regresión: Selección
entre Modelos LINEAL Y LOG-LINEAL
La selección entre un modelo de regresión lineal (la
regresada es una función lineal de las regresoras) o un
modelo de regresión log-lineal (el logaritmo de la
regresada es función de los logaritmos de las regresoras)
es la eterna pregunta en el análisis empírico.
Se puede utilizar una prueba propuesta por MacKinnon,
White y Davidson, que se denominará, por brevedad, la
prueba MWD para escoger entre los dos modelos.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
H0. Modelo lineal: Y es una función lineal de las regresoras, las X
H1: Modelo log-lineal. lnY es función lineal de los logaritmos de las
regresoras, los logaritmos de las X.
La prueba MWD comprende los siguientes pasos:
Paso I: Estímese el modelo lineal y obténganse los valores Y estimados.
Llámelos Yf (es decir, Y estimada).
Paso II: Estímese el modelo log-lineal y obténganse los valores lnY
estimados; denomínense lnf (es decir, lnY estimado).
Paso III: Obténgase Z1 = (ln(Yf) - lnf).
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Paso IV: Efectúese la regresión de Y sobre las X y Z1 obtenida en el paso
III. Rechácese H0 si el coeficiente de Z1 es estadísticamente significativo
mediante la prueba t usual.
Paso V: Obténgase Z2 = (antilog de lnf - Yf). Z2 = exp(lnf) - Yf
Paso VI: Efectúese la regresión del logaritmo de Y sobre los logaritmos
de las X y Z2. Rechácese H1, si el coeficiente de Z2 es estadísticamente
significativo mediante la prueba t usual.

Aun cuando la prueba MWD parece compleja, la lógica de la prueba es


bastante simple. Si el modelo lineal es en realidad el modelo correcto,
la variable construida Z1 no debería ser estadísticamente significativa
en el paso IV ya que en ese caso los valores Y estimados del modelo
lineal y aquellos estimados del modelo log-lineal (después de obtener
sus valores antilog para efectos comparativos) no deberían ser
diferentes. El mismo comentario se aplica a la hipótesis alternativa H1.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Prueba para la estabilidad estructural o paramétrica de los
modelos de regresión: la prueba Chow
Cuando se utiliza un modelo de regresión que involucra series
de tiempo, tal vez suceda que haya un cambio estructural en la
relación entre la regresada Y y las regresoras X. Por cambio
estructural se entiende que los valores de los parámetros del
modelo no permanecen constantes a lo largo de todo el
periodo.
A veces el cambio estructural se pueda deber a fuerzas
externas (por ejemplo, el embargo petrolero impuesto por la
OPEP en 1973 y 1979, o la Guerra del Golfo de 1990-1991), o
debido a cambio en las políticas (como la transformación de un
sistema de tasa de cambio fija por otro sistema flexible) o por
cambios impositivos, o por los cambios en los salarios
mínimos, o por otras causas diversas.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
¿Cómo se sabe que ha ocurrido de hecho un cambio estructural?
El ingreso personal disponible y los ahorros personales, en miles de
millones de dólares, para Estados Unidos durante el periodo 1970-
1995. Supóngase que se desea estimar una sencilla función ahorros
que relacione los ahorros (Y) con el ingreso personal disponible IPD (X).
Puesto que se tienen los datos, se puede calcular una regresión MCO
de Y sobre X. Pero si se hace eso, se está diciendo que la relación entre
ahorros e IPD no cambió mucho durante el lapso de 26 años. Ésta tal
vez sea una suposición débil.
Se sabe muy bien que en 1982 Estados Unidos experimentó su peor
recesión en tiempos de paz. La tasa de desempleo civil alcanzó el 9,7%.
Un suceso como éste pudo haber perturbado la relación entre los
ahorros y el IPD. Para ver si lo anterior sucedió, se dividirá la muestra
en dos periodos: 1970-1981 y 1982-1995, los periodos de antes y
después de la recesión de 1982. Ahora se tienen tres posibles
regresiones:
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Periodo 1970-1981: Yt = λ1 + λ2Xt + u1t
Periodo 1982-1995: Yt = γ1 + γ2Xt + u2t
Periodo 1970-1995: Yt = α1 + α2 Xt + u3t
La tercera regresión supone que no hay diferencia entre los dos
periodos, y por tanto estima la relación entre los ahorros y el IPD
para la totalidad del periodo que consiste en 26 observaciones.
En otras palabras, esta regresión supone que la intersección, así
como el coeficiente de la pendiente permanecen constantes
durante todo el periodo; es decir, no hay cambio estructural. Si
ésta fuera la situación, entonces: λ1 = γ1 = α1, λ2 = γ2= α2
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Las dos primeras regresiones suponen que las
regresiones en ambos periodos son distintas; es
decir, la intersección y los coeficientes de las
pendientes son diferentes, como se indica mediante
los parámetros con subíndice. En las regresiones
anteriores, las u representan los términos de error y
las n el número de observaciones.
Para los datos dados de este ejemplo, las
contrapartes empíricas de las tres regresiones
anteriores son las siguientes:
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Una mirada a las regresiones estimadas sugiere que la
relación entre los ahorros y el IPD no es la misma en los dos
subperiodos. La pendiente en las anteriores regresiones de
ahorro-ingreso representan la propensión marginal al ahorro
(PMA); es decir, el cambio (medio) en los ahorros, como
resultado de un incremento de un dólar en el ingreso personal
disponible. En el periodo 1970-1981 la PMA fue de casi 0,08,
en tanto que para el periodo 1982-1995 fue de casi 0.02.
Resulta difícil decir si este cambio se debió a las políticas
económicas tomadas por el presidente Reagan. Lo anterior
además sugiere que la regresión agrupada —es decir, la que
agrupa a 26 observaciones y efectúa una regresión común—
quizá no sea apropiada, sin tener en cuenta las posibles dife-
rencias entre los dos subperiodos. Por supuesto, las
afirmaciones anteriores necesitan estar justificadas por una(s)
prueba(s) estadística(s) apropiada(s).
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Prueba de Chow
La prueba supone que:
1. U1t ~ N(0, σ2) y u2t ~ N(0, σ2). Es decir, los
términos de error en las regresiones de los
subperiodos están normalmente distribuidos
con la misma varianza (homoscedástica) σ2.
2. Los dos términos de error (u1t y u2t) están
independientemente distribuidos
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Los mecanismos de la prueba Chow son los siguientes:
1. Se estima la regresión total, que resulta apropiada si no hay inestabilidad en los
parámetros, y se obtiene SRC3 con g de l = (n1 + n2 - k), donde k es el número de
parámetros estimado, 2 para este caso. Para el ejemplo, SRC3 = 23 248,30. Se
llama a SRC3 la suma de residuos al cuadrado restringida (SRCR), ya que se
obtiene al imponer las restricciones de que λ1 = γ1 = α1, λ2 = γ2= α2; es decir, las
regresiones de los subperiodos no son diferentes.
2. Estímese la primera regresión y obténgase su suma de residuos al cuadrado,
SRC1, con g de l (n1 - k). En el ejemplo SRC1 = 1 785,032 y g de l = 10.
3. Estímese la segunda regresión y obténgase su suma de residuos al cuadrado,
SRC2, con g de l = (n2 - k). En el ejemplo SRC2 = 10 005,22 y g de l = 12.
4. Puesto que los dos conjuntos de muestras se consideran independientes, se
pueden sumar SRC1 y SRC2 para obtener lo que se podría llamar suma de residuos
al cuadrado no restringida (SRCNR); es decir, se obtiene:
SRCNR = SRC1 + SRC2 con g de 1 = (N1 + n2 - 2k)
Para el caso presente,
SRCNR = (1 785,032 + 10 005,22) = 11 790,252
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
5. La idea detrás de la prueba Chow es que si de hecho no existe un cambio
estructural [es decir, las regresiones parciales son esencialmente las
mismas], entonces SRCR y SRCNR no deberían ser estadísticamente
diferentes.
Chow demostró que bajo la hipótesis nula las dos regresiones parciales
son (estadísticamente) la misma (es decir, no hay cambios estructurales ni
rupturas), así que la razón F dada antes sigue una distribución F con k y
(n1+ n2 - 2k) g de l en el numerador y denominador, respectivamente.

6. Por tanto, no se rechaza la hipótesis nula de la estabilidad paramétrica


(es decir, no hay cambio estructural) si el valor F calculado en la
aplicación no excede el valor crítico F al nivel elegido de significancia (o el
valor p).
Por el contrario, si el valor F calculado excede el valor crítico F, se rechaza
la hipótesis de la estabilidad paramétrica y se concluye que las
regresiones parciales son diferentes, en cuyo caso la regresión agrupada
es de dudoso valor, para decir lo menos.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

F = (23 248,30 -11 790,252) / 2


(11 790,252)/22
= 10,69
De las tablas F se ve que para 2 y 22 g de l el valor crítico F al 1% es de 7,72. Por
tanto, la probabilidad de obtener un valor F igual o mayor que 10,69 es mucho
menor que 1%; en verdad, el valor p es sólo de 0.00057.

La prueba Chow, por tanto, parece apoyar la anterior conjetura de que la relación
ahorros-ingreso sufrió un cambio estructural en Estados Unidos en el periodo
1970-1995, dando por hecho que se satisfacen las suposiciones subyacentes en
la prueba.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Los Mínimos Cuadrados Ordinarios y el tratamiento de las variables
ficticias
Variables: de escala de razón(proporción), de escala de intervalo, de
escala ordinal y de escala nominal.
Los tipos de variables que se han encontrado hasta ahora, fueron en
esencia de escala de razón. Pero esto no debe dar la impresión de que
los modelos de regresión pueden sólo tratar con variables de escala de
razón. Los modelos de regresión también pueden trabajar con los otros
tipos de variables que se acaban de mencionar.
Existen modelos que tal vez no sólo tengan variables de escala de
razón, sino también variable de escala nominal, variables categóricas,
variables cualitativas, o variables dicótomas.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Naturaleza de las variables Dicótomas
En el análisis de regresión, la variable dependiente o
regresada, está influida frecuentemente no sólo por variables
de razón de escala, sino también por variables que son
esencialmente cualitativas por naturaleza, o de escala nominal
Por ejemplo, manteniendo los demás factores constantes, se
ha encontrado que las trabajadoras ganan menos que sus
colegas masculinos y que las personas de color ganan menos
que las blancas. Este patrón puede resultar de la
discriminación sexual o racial, pero cualquiera que sea la
razón, las variables cualitativas tales como sexo y raza sí
influyen sobre la variable dependiente y es claro que deben ser
incluidas dentro de las explicativas, o regresoras.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Puesto que tales variables usualmente indican la presencia o ausencia de una
"cualidad'' o atributo, tal como femenino o masculino, negro o blanco, católico
o no católico, son variables de escala nominal esencialmente. Se podrían
"cuantificar" tales atributos mediante la elaboración de variables artificiales
que tomaran los valores 0 y 1, donde 1 indicara la presencia (o la posesión) de
ese atributo y 0 la ausencia de tal atributo.
Las variables que adquieren tales valores 0 y 1 se llaman variables dicótomas.
Tales variables son, por tanto, esencialmente un recurso para clasificar datos
en categorías mutuamente excluyentes, como masculino o femenino.
Las variables dicótomas pueden utilizarse en los modelos de regresión en
forma tan fácil como las variables cuantitativas. De hecho, un modelo de regre-
sión puede contener variables explicativas que son exclusivamente dicótomas,
o cualitativas, por naturaleza. Tales modelos se denominan modelos de
análisis de varianza (ANOVA).
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Modelos ANOVA
Supóngase que se desea averiguar si el salario promedio anual (SPA) de
los maestros de escuelas públicas difieren entre las tres áreas
geográficas Costa, Sierra y Oriente. Si se toma el promedio aritmético
simple de los salarios promedio de los maestros de las tres regiones,
esos promedios pueden se diferentes entre sí, pero, ¿son
estadísticamente distintos entre sí? Existen varias técnicas estadísticas
para comparar dos o más valores medios, lo cual por lo general se
conoce como análisis de varianza. Pero se puede lograr el mismo
objetivo dentro del ámbito del análisis de regresión.
Para realizar la regresión se deben añadir variables dicótomas que
representen a cada una de las categorías de la variable (región para el
presente ejemplo).
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
𝑌𝑡 = 𝛽1 + 𝛽2 𝐷2𝑡 + 𝛽3 𝐷3𝑡 + 𝜇𝑡

donde Y = salario (promedio) de los maestros de escuelas públicas


D2i = 1 si es de la Costa
= 0 para otra región del país
D3l = 1 si es del Oriente
= 0 para otra región del país
El salario medio de los maestros de escuelas públicas de la Sierra está
dado por la intersección, en la regresión múltiple; además, los
coeficientes de la "pendiente" indican la cantidad de los salarios
promedio de los maestros de la Costa así como los del Oriente, difieren
respecto a los salarios medios de los profesores de la Sierra.
Pero, ¿cómo saber si estas diferencias son estadísticamente
significativas?
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Esto es muy fácil de saberlo. Todo lo que se tiene que hacer es
averiguar si cada uno de los coeficientes de "pendiente" es
estadísticamente significativo.
Hay que tener cuidado al interpretar tales diferencias. Las variables
dicótomas simplemente señalarán las diferencias, si es que existen,
pero no sugieren las razones por las que éstas se presentan.
Las diferencias en los niveles educativos, los índices del costo de vida,
el sexo y la raza quizá ejerzan algún efecto sobre las diferencias
observadas. Por tanto, a menos que se tome en cuenta todas las
demás variables que pudiesen afectar el salario de un maestro, no se
podrá(n) aclarar la(s) causa(s) de las diferencias.
Del anterior análisis, resulta claro que todo lo que se tiene que hacer es
observar si los coeficientes anexos a las diferentes variables dicótomas
son estadísticamente significativos en lo individual.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
Precaución en el uso de las variables dicótomas
Aunque son fáciles de añadir a los modelos de regresión, las variables dicótomas se
deben utilizar con cuidado. En particular, considérense los siguientes aspectos:
1. Para diferenciar las tres regiones, se utilizaron sólo dos variables dicótomas, D2 y
D3. Si se tiene una variable dicótoma para cada una de las tres regiones
geográficas, si se fuese a hacer la regresión, la computadora "se negaría" a llevarla
a cabo. La razón estriba en que cuando se definió la regresión se tiene una variable
dicótoma para cada categoría o grupo, así como una intersección— se presenta un
caso de colinealidad perfecta; es decir, existe una relación lineal exacta entre las
variables. El mensajes es: si una variable cualitativa tiene m categorías, sólo hay
que agregar (m - 1) variables dicótomas. Si no se respeta esta regla, se provocará lo
que se conoce como trampa de la variable dicótoma; es decir, se tendrá una
situación de perfecta colinealidad o perfecta multicolinealidad, si hay más de una
relación exacta entre las variables. Esta regla también se aplica si se tiene más de
una variable cualitativa en el modelo. Así pues, se tiene que volver a enunciar la
regla anterior como: para cada regresora cualitativa, el número de variables
dicótomas introducidas debe ser una menos que las categorías de esa variable.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA

Precaución en el uso de las variables dicótomas


2. La categoría a la cual no se asigna variable
dicótoma se conoce como categoría base, de
comparación, de control, de referencia u omitida.
Además, todas las comparaciones se hacen
respecto a la categoría de comparación.
3. El valor de la intersección (ß1) representa el
valor medio de la categoría de comparación.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
4. Los coeficientes anexos a las variables dicótomas
se conocen como coeficientes de la intersección
diferencial, debido a que indican en qué medida el
valor de la intersección que se le asigna 1 varía del
coeficiente de intersección de la categoría de
comparación.
5. Si una variable cualitativa tiene más de una
categoría, la elección de la categoría de
comparación se deja al criterio estricto del
investigador. A veces dicha elección está dictada por
el problema particular que se está trabajando.
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
6. Se hizo una advertencia respecto a la trampa de la variable
dicótoma. Existe una forma de eludirla al introducir tantas
variables dicótomas como número de categorías tenga dicha
variable, siempre y cuando no se introduzca la intersección en
el modelo:
𝑌𝑡 = 𝛽1 𝐷1𝑡 + 𝛽2 𝐷2𝑡 + 𝛽3 𝐷3𝑡 + 𝜇𝑡
no se caerá en la trampa de la variable dicótoma, ya que no
existe colinealidad perfecta. los coeficientes de las variables
dicótomas proporcionan de manera directa los valores medios
de la categoría que representan
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE ECONOMÍA
7. ¿Cuál de los siguientes métodos es el mejor para introducir
una variable dicótoma:
1) agregar una variable dicótoma para cada categoría y omitir el término de
intersección,
2) incluir el término de intersección y añadir sólo (m - 1) variables, donde m es
el número de categorías de la variable dicótoma? La mayoría de los
investigadores piensan que es más conveniente la ecuación con una
intersección porque les permite enfrentar de manera más sencilla las
cuestiones que a menudo les interesan más; a saber, si la categorización es
importante o no lo es, y si lo fuera en qué medida sería.
Si la categorización fuese importante, a qué grado los estimados de los
coeficientes de las variables dicótomas la miden directamente. Probar si la
categorización es o no es relevante puede llevarse a cabo mediante la prueba t
de un coeficiente de variable dicótoma, respecto a cero (o, para hacerlo de
forma más general, una prueba F sobre el conjunto apropiado de los
coeficientes estimados de las variables dicótomas).

Das könnte Ihnen auch gefallen