Sie sind auf Seite 1von 14

UNIVERSIDAD NACIONAL DE INGENIERÍA

FACULTAD DE INGENIERÍA ECONÓMICA, ESTADÍSTICA Y CIENCIAS


SOCIALES

ANÁLISIS DE LOS SUPUESTOS ECONOMETRICOS CON R

ALUMNOS
Barzola Rafael, Nathan
Sepulveda Carrión, Ronny
Suarez Peña, Raúl
Sumire Cuzcano, Joseph
Paitampoma Mamani, Michell
Zuta Zelada, Diana

PROFESOR
Caparó Coronado, Rafael

Econometrı́a II MARZO 2018


Índice general

Índice de Figuras III

1. Introducción 1

1.1. Descripción del uso de R . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Supuestos del Modelo Econométrico . . . . . . . . . . . . . . . . . . . 2

1.2.1. Normalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.2. Homocedasticidad . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.3. No autocorrelación . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.4. No multicolinealidad . . . . . . . . . . . . . . . . . . . . . . . 3

1.2.5. Estabilidad estructural . . . . . . . . . . . . . . . . . . . . . . 3

2. Aplicación de R para analizar los supuestos de un modelo eco-


nométrico 4

2.1. Presentación del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.1.1. Supuesto de estabilidad estructural . . . . . . . . . . . . . . . 5

2.1.2. Supuesto de no autocorrelación . . . . . . . . . . . . . . . . . 6

2.1.3. Supuesto de multicolinealidad . . . . . . . . . . . . . . . . . . 7

2.1.4. Supuesto de normalidad . . . . . . . . . . . . . . . . . . . . . 8

2.1.5. Supuesto de homocedasticidad . . . . . . . . . . . . . . . . . . 11

ii
Índice de figuras

2.1. Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2. Tes de Chow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.3. Tes de Durbin-Watson . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.4. Matriz de Correlaciones . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.5. Factor de inflación de varianza . . . . . . . . . . . . . . . . . . . . . . 8

2.6. Tes de Jarque Vera . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.7. Histograma de los residuales . . . . . . . . . . . . . . . . . . . . . . . 9

2.8. Caja de residuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.9. Caja de residuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.10. Tes de Breush Pagan . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

iii
Capı́tulo 1

Introducción

1.1. Descripción del uso de R

Para saber cómo poder utilizar el programa R, primero tenemos que saber que R
es un lenguaje de programación orientado a objetos. Esto significa que las variables,
datos, funciones, resultados y todo lo demás se guardan en la memoria activa del
computador en forma de objetos con un nombre especı́fico. Lo que se quiere dar a
entender con esto es que es un lenguaje interpretado y no compilado.

La forma de usar R es sencilla e intuitiva, basta con digitar correctamente el co-


mando de una función deseada para que este funcione; sin embargo, no se debe de
olvidar que para que una función de R sea ejecutada, siempre debe de estar acom-
pañada de paréntesis, sin importa que no haya contenido dentro de ellos. En el caso
de objetos (mencionado en la primera parte), estos se pueden recuperar fácilmente
con tan solo volver a escribir el nombre asignado al objeto en la consola o en un
scrip y “correr” el comando. Por todo esto se dice que el uso y el funcionamiento del
programa R es relativamente intuitivo, solo se tiene que saber qué es lo que se desea
hacer, construir o demás, y el resto es solo buscar la función indicada para llevar a
cabo la idea concebida y “correr” lo hecho (ejecutar el comando escrito).

El “para qué” del uso del R se puede resumir con una frase: evitar grandes y
complejos cálculos, y obtenerlos en un corto periodo de tiempo. Con R podemos
realizar cálculos estadı́sticos, econométricos, entre muchos otros, de una manera fácil,
y, considerando que es un software libre, no requiere costo alguno el poder tenerlo
y usarlo. Otro beneficio es, dado que es software libre, que tiene la colaboración de
diversas personas de alrededor del mundo, se implementan nuevas funciones, para
ası́ poder tener un programa de gran utilidad para todo aquel que desee realizar un
trabajo de investigación, entre otras cosas.
1.2. Supuestos del Modelo Econométrico

1.2.1. Normalidad

En esta ocasión, al estar trabajando con un modelo de regresión lineal normal


clásica, se conoce que los supuestos que se dan al estar trabajando con este modelo
son los siguientes (con respecto al error no observado “ui ” generado por el modelo):

Media: E(ui ) = 0
Varianza: E(u2i ) = σ 2
Cov(ui , uj ): E(ui , uj ) = 0, i 6= j

Sin embargo, existe una forma de poder expresar todo lo anterior mencionado de una
manera más compacta:

ui ∼ N (0, σ 2 )

Con este supuesto sobre el error generado (ui) por el modelo (presenta una distribución
normal), se busca evitar mencionar y comprobar cada supuesto mencionado en un
inicio, y solo llegar a comprobar el supuesto de normalidad para poder estar conforme
con el modelo generado.

En el programa R se pueden encontrar algunos paquetes estadı́sticos, creados por


algunos de los tantos colaboradores que existen a nivel mundial de este programa,
para poder comprobar si se cumple el “supuesto de normalidad”. Un paquete que
usaremos para esta ocasión es el paquete “tseries”, el cual contiene (entre las tantas
pruebas que posee) el test de Jarque Bera (“jarque.bera.test”).

1.2.2. Homocedasticidad

El supuesto de homocedasticidad consiste en que la variación de los residuos no


observados creados por el modelo de regresión lineal normal clásico sea uniforme, es
decir, que presente un valor constante. Sin embargo, en la realidad este supuesto no
suele cumplirse al pie de la letra, es por ello que debe de tomarse con un poco más
de flexibilidad el cumplimiento de este supuesto.

E(u2i ) = σu2 , i = 1,2,3,...,n

Para poder llegar a comprobar este supuesto, con la ayuda del programa R, se uti-
liza un paquete previamente descargado llamado “lmtest”, el cual contiene el Test
de Breusch Pagan. Con este test se puede comprobar si el error no observado es
homocedastico (hipótesis nula: H0 ) o vendrı́a a ser heterocedástico (hipótesis 1: H1 ).

2
1.2.3. No autocorrelación

Este supuesto indica que no debe existir relación entre las variables perturbado-
ras.Esto quiere decir que no hay corridas largas de residuos positivos o negativos. La
correlación se presenta cuando los datos se colectan durante un periodo

Cov (εi , εj ) = 0, ∀i 6= j

Para analizar la posible autocorrelación en el modelo se puede recurrir a un analisis


gráfico de los residuos y a los contrastes de hipótesis especı́ficas (desde Durbin-Watson,
Breush Godfrey, etc)

1.2.4. No multicolinealidad

Este supuesto indica que las variables explicativas deben ser linealmente indepen-
dientes.

Las columnas de la matriz informativa son linealmente independientes.


No existe relación lineal exacta entre dos o más variables explicativas (ortogo-
nales entre si).
Las variables explicativas no están altamente correlacionadas,

Cov (x1 , x2 ) = 0

Se habla de multicolinealidad cuando una o varias variables explicativas son una com-
binación lineal de otras y también dan lugar a estimaciones imprecisas, varianza,etc.

1.2.5. Estabilidad estructural

Este supuesto indica que los parámetros permanecen fijos en el modelo para toda
la muestra en todo periodo de tiempo

β̄1 = β̄2 = ... = β̄n

Para probar la estabilidad estructural se usa habitualmente el test de Chow,el objetivo


de este es probar si la variación sospechada en el transcurso de la muestra es lo
suficientemente importante como para generar cambios en los coeficientes del modelo,
pero también existen otros métodos como el de residuos recursivos, el test de Pagan
y Nicholls, etc.

3
Capı́tulo 2

Aplicación de R para analizar los


supuestos de un modelo
econométrico

2.1. Presentación del Modelo

Se utilizará un modelo generado a partir de variables aleatorias, de 500 datos cada


uno, que seguirán una distribución normal.
Primero declaramos las variables que vamos a usar, estas son las variables explicativas:

x1=rnorm(500)
x2=rnorm(500)
x3=rnorm(500)
x4=rnorm(500)

Luego declaramos nuestra variable explicada, que estará compuesta por las variables
explicadas y además por una perturbación que se expresa en rnorm(500).

y=2+3*x1+4*x2+5*x3+6*x4+rnorm(500)

Para estimar el modelo usaremos las variables x1,x2, x3 y x4 que explicaran el “y”, a
este modelo lo llamaremos modelo1, de este modo se está utiliza la función lm(fórmu-
la) que se usa para llevar a cabo la regresión lineal.

modelo1=lm(y x1+x2+x3+x4)

Luego observaremos un resumen del modelo con la función summary(nombre del


modelo) para ver los valores de los parámetros y otros datos más.

4
summary(modelo1)

Figura 2.1: Summary

2.1.1. Supuesto de estabilidad estructural

Existen diversas formas para determinar si un modelo presenta problemas de quie-


bre estructural, puede hacerse de una manera manual, creando modelos donde parti-
cionamos la data o excluimos datos que provoquen choques ; o utilizando paquetes y
test, como el test de chow que nos brinda una prueba de hipótesis para contrastar si
existe o no el quiebre estructural.
Prueba de Hipótesis del Test de Chow:

H0 : βur1 = βur2
H1 : βur1 6= βur2

Prueba de Hipótesis del Test de Chow:

install.packages(‘strucchange’)

Para poder cargar el paquete en memoria, lo llamamos a través del comando li-
brary(nombre del paquete). En este caso serı́a de la siguiente manera:

library(strucchange)

Luego de eso usamos el siguiente comando para hacer uso del test, donde los argu-
mentos son el modelo y el tipo, que en este caso es chow.

5
sctest(modelo1,type=çhow”)

De esta manera obtenemos los siguientes resultados en R :

Figura 2.2: Tes de Chow

El test de chow nos arroja un p-value mayor a 0.05, por tanto aceptamos H0 y en
consecuencia se puede afirmar que el modelo no presenta un quiebre estructural.

2.1.2. Supuesto de no autocorrelación

Una de las maneras de encontrar la existencia, o no, de autocorrelación de los


residuales de nuestro modelo modelos es utilizar la prueba estadı́stica conocida como
el test de Durbin-Watson. Este test tiene las siguientes hipótesis:

H0: No existe Autocorrelación


H1: Existe Autocorrelación

Para utilizar este test en el programa R, descargamos la el paquete “lmtest” a través


del comando:

install.packages(‘lmtest’)

Luego llamamos la librerı́a para poder usar sus funciones:

library(‘lmtest’)

Y por último usamos aplicamos el test de Durbin-Watson a nuestro modelo llamado:


“modelo1”

dwtest(modelo1)

Esto nos resulta de la siguiente manera:

Como el p-value resultante es mayor a 0.05 (siendo este nuestro grado de confianza)
aceptamos la hipótesis nula y por ende concluimos que nuestro modelo no presenta
problemas de autocorrelación.

6
Figura 2.3: Tes de Durbin-Watson

2.1.3. Supuesto de multicolinealidad

Para analizar la multicolinealiadad de un modelo econométrico tenemos varios


métodos, en este caso usaremos el análisis de la matriz de correlaciones y además, el
análisis del Factor de Inflacion de Varianza (VIF por sus siglas en ingles).

Primero analicemos la matriz de correlaciones, para esto formamos la matriz res-


pectiva de nombre “x” con todas las variables exógenas del modelo, teniendo como
columnas a las variables: x1, x2, x3, x4 en el orden respectivo y como filas a todos los
datos aleatorios que se generaron por cada variable. Esto lo logramos de la siguiente
manera:

X<- cbind(x1 , x2 , x3 , x4 )

A continuación presentamos los 6 primeros datos de dicha matriz:

A partir de esto formamos la matriz de correlaciones con el comando: “cor(x)”

Figura 2.4: Matriz de Correlaciones

De esta matriz podemos observar que las correlaciones de las variables exógenas del
modelo dos a dos, son casi cero; por ende, por este método podemos decir que en
muestro modelo no hay presencia de multicolinealidad.
Ahora veamos el análisis con el VIF, el cual nos dice que si el VIF de una de las varia-
bles de nuestro modelo es 1 entonces no hay presencia de multicolinealidad provocada
por esa variable en especı́fico; para ello instalamos el paquete “car”.

7
install.packages(‘car’)

Y llamamos a la librerı́a del mismo nombre

library(‘car’)

Finalmente aplicamos el análisis del VIF a nuestro modelo con el comando “vif”

vif(modelo1)

Esto nos da como resultado:

Figura 2.5: Factor de inflación de varianza

Como los VIF de cada variable son cercanos a 1, concluiremos que ninguna de las
variables exógenas de nuestro modelo provoca multicolinealidad en el mismo; por lo
cual, decimos que no hay presencia de multicolinealidad en nuestro modelo.

2.1.4. Supuesto de normalidad

Existe más de una forma de analizar la normalidad de los residuos en R, una de


las maneras es usando el Test de Jarque Bera , el cual nos presenta las siguientes
hipótesis:

H0: La distribución de los residuos es aproximadamente normal.


H1: La distribución de los residuos no es normal.

Para poder usar el Test de Jarque Bera es necesario en primer lugar instalar el paquete
‘tseries’.Para ello usamos el siguiente comando:

install.packages (‘tseries’)

Para poder cargar el paquete en memoria, lo llamamos a través del comando li-
brary(nombre del paquete). En este caso sseria de la siguiente manera:

library(tseries)

8
Luego de eso usamos el siguiente comando para hacer uso del test

jarque.bera.test(residuos)

De esta manera obtenemos los siguientes resultados en R :


Si el p-value obtenido es mayor que 0.05, se acepta H0, en consecuencia se afirma

Figura 2.6: Tes de Jarque Vera

que los residuos están distribuidos normalmente. A continuación puede observarse la


normalidad de los residuos a través de los siguientes gráficos:

a) Histograma de residuales
Para ello usamos el siguiente comando:

hist(residuos,main=”HISTOGRAMA DE RESIDUALES”,col=”green”)

Figura 2.7: Histograma de los residuales

b) Diagrama de Cajas
Para ello usamos el siguiente comando:

9
Figura 2.8: Caja de residuales

boxplot(residuos,main=çajas de residuos”,col= ellow”)


2

c) Grafica Q-Q
Para ello usamos el siguiente comando:

qqnorm(residuos,main=”QQNORM DE RESIDUOS”,col=”pink”)
qqline(residuos,col=red”)

Figura 2.9: Caja de residuales

10
2.1.5. Supuesto de homocedasticidad

Uno de los test que se puede aplicar en R para poder comprobar la homocedasti-
cidad de un modelo es usando es Test de Breusch Pagan. En dicho test se presencia
dos hipótesis, los cuales son los siguientes:

H0: Presencia de Homocedasticidad


H1: Presencia de Heterocedasticidad

En primer lugar, es necesario descargar el paquete ‘lmtest’. Para ello usamos el si-
guiente comando:

install.packages(’lmtest’)

Para poder cargar el paquete en memoria, lo llamamos a través del comando li-
brary(nombre del paquete). En este caso serı́a de la siguiente manera:

library(lmtest)

Solo entonces aplicamos el siguiente comando usado por el test de Breusch Pagan:

bptest(modelo1)

Donde los resultados obtenidos en R son los presentados a continuación:

Figura 2.10: Tes de Breush Pagan

Si el p-value obtenido es mayor que 0.05, se acepta H0. Como puede observarse,
el p-value obtenido es mayor que 0.05, en consecuencia se afirma que el modelo es
Homocedastico.

11