Sie sind auf Seite 1von 27

STATA 12 para Economistas

UNIDAD 1: STATA Y SUS RECURSOS

Pontificia Universidad Catlica del Per

Jorge Valdivia

Contenido
UNIDAD 1: STATA Y SUS RECURSOS ................................................................................ 1
Tema 1: STATA 2012 ........................................................................................................ 3
1.1

Qu puedo hacer con STATA 12? ......................................................................... 3

1.1.1

Imputacin mltiple (MI).................................................................................... 3

1.1.2

Series de tiempo multivariadas ......................................................................... 5

1.1.3

Datos de panel y modelos mixtos ..................................................................... 5

1.1.4

ARFIMA ............................................................................................................ 5

1.1.5

Nueva interfaz .................................................................................................. 5

1.1.6

Filtros para series de tiempo ............................................................................. 6

1.1.7

Mtodo de los momentos generalizado (GMM)................................................. 6

1.1.8

Documentacin PDF. ........................................................................................ 6

1.1.9

Anlisis marginales ........................................................................................... 7

1.1.10

Fuentes en grficos .......................................................................................... 7

1.1.11

Regresin para riesgos en competencia ........................................................... 7

1.1.12

Variables factoriales ......................................................................................... 7

1.1.13

Estadsticas exactas ......................................................................................... 8

1.1.14

Otras funciones................................................................................................. 8

1.2

Presentaciones de STATA ....................................................................................... 8

1.3

Entorno de trabajo ................................................................................................... 9

1.4

Recursos del STATA ............................................................................................. 17

1.5

Ayuda en STATA: comandos help, search y findit ................................................. 18

Tema 2: Manejo de datos ............................................................................................... 20


2.1

Iniciando una sesin de STATA ............................................................................. 20

2.1.1

Creando un Log file ........................................................................................ 20

2.1.2

Abrir y guardar una base de datos .................................................................. 21

2.1.3

Comandos principales .................................................................................... 21

2.1.4

Estructura de comandos ................................................................................. 25

2.1.5

Ingresando nuevos datos a STATA ................................................................ 26

INFOPUC

STATA 12 para Economistas

Tema 1: STATA 2012

1.1 Qu puedo hacer con STATA 12?


STATA es un software de anlisis estadstico y economtrico que sirve de herramienta
para el anlisis de informacin en diversas disciplinas tales como las ciencias sociales,
la medicina y otras. STATA es un paquete de tratamiento de datos de apariencia
similar a otros softwares estadsticos, en el sentido de que se ejecutan de manera
secuencial comandos digitados por el usuario dentro de una sesin. Inicialmente se
cre con la finalidad de analizar los datos de seccin cruzada. Sin embargo, en los
ltimos aos ha alcanzado notoriedad y potencialidad, y ha abarcado campos de la
micro y macroeconometra. A travs de la permanente difusin (como en el foro no
oficial Statalist) de nuevos comandos que incorporan complejas tcnicas estadsticas y
economtricas, ha cautivado a muchos usuarios por su versatilidad y constante
actualizacin. Entre las potencialidades del STATA, destaca la facilidad para manipular
y describir con grandes bases de datos, donde la principal restriccin es el tamao de
la memoria de la computadora. Posee diversas aplicaciones predefinidas: regresiones
por mco, datos de panel, logit, probit, etc. Asimismo, posee una excelente herramienta
para realizar grficos.

En la versin 13 destacan las siguientes funcionalidades:

1.1.1

Imputacin mltiple (MI)

Proporciona una serie de mtodos que permiten realizar anlisis de datos


incompletos, datos en los que faltan algunos valores, y brindan funcionalidades
para las etapas de imputacin y estimacin.

Entre dichas funcionalidades estn las siguientes:

Imputacin univariada

Imputacin multivariada

Pontificia Universidad Catlica del Per

Jorge Valdivia

Panel de control para MI.- Permite unificar las funcionalidades del


comando MI y gua al usuario desde que inicia el anlisis hasta el trmino
de este; es decir, desde la etapa de examinacin de los valores faltantes
hasta la realizacin de estimaciones e inferencias sobre imputaciones
mltiples.

Examine.- Se utiliza para chequear los patrones de valores incompletos y


determinar el mtodo de imputacin adecuado.

Setup.- Se utiliza para establecer las caractersticas de los valores que se


desean imputar. Si los datos ya han sido imputados, se debe obviar esta
etapa.

Impute.- Se utiliza para crear imputaciones. Se pueden imputar una o ms


variables simultneamente mediante la seleccin o combinacin de los
mtodos regresin, ajuste de medias predictivas, regresiones logstica, ordinal
logstica y multinomial logstica y MVN.

Import.- Se utiliza para poder importar.


Manage.- Se utiliza para realizar el manejo de los datos.
Estimate.- Se utiliza para ajustar el modelo y combinar los resultados.
Test.- Se utiliza para realizar test de hiptesis.
Predict.- Se utiliza para hacer predicciones de los modelos.

INFOPUC

STATA 12 para Economistas

1.1.2

Series de tiempo multivariadas

Representa o estima un amplio rango de procesos de series de tiempo


multivariable. STATA 12, a diferencia de otros programas, no necesita que el
usuario especifique si el modelo es estacional o no, pues es automtico.

Entre dichos modelos estn


los siguientes:

Modelos de espacio de
estados

Modelos

de

factor

dinmico

Modelos

GARCH

multivariados donde los


usuarios

pueden

analizar

las

interacciones de varias
series a la vez

1.1.3

Datos de panel y modelos mixtos

Estructuras de error en covarianzas

Test de races unitarias

Errores estndar y BLUP

1.1.4

ARFIMA

Procesos de memoria de largo plazo

Integracin fraccional

Prediccin esttica y dinmica

Estimacin de varianza robusta

1.1.5

Nueva interfaz
Manejo de memoria automtica

Pontificia Universidad Catlica del Per

Jorge Valdivia

Hasta 1 terabyte de memoria

Nueva interfaz para el sistema operativo Macintosh

Manejador de variables

Vista activa de los datos

Filtros de datos y de variables

Vista con tabs

Plegado de cdigo

Marcadores

Importacin/exportacin de bases de datos a Excel

Exportacin a PDF

1.1.6

Filtros para series de tiempo

Tendencia y ciclo

Filtro

Christiano-

Fitzgerald

Filtro Baxter-King

Filtro Hodrick-Prescott

Filtro Butterworth

1.1.7

Mtodo de los momentos generalizado (GMM)

Modelos lineares y no lineares

Estimadores en una etapa, en dos etapas e iterativos

Datos de seccin cruzada, series de tiempo y datos de panel

Variables instrumentales para datos de panel

1.1.8

Documentacin PDF.- Donde los manuales estn integrados con el


sistema de ayuda de STATA.

Distribuida con cada copia de STATA

INFOPUC

STATA 12 para Economistas

Contiene todos los manuales

Integrada con los archivos de ayuda

1.1.9

Anlisis marginales
Estimacin

de

medias marginales

Mrgenes predictivos

Efectos

marginales

promedio

1.1.10 Fuentes en grficos

Itlica y negrita

Letras griegas

Smbolos matemticos

Subndices y superndices

Fuentes mltiples

1.1.11 Regresin para riesgos en competencia.- Permite manejar


modelos de duracin o supervivencia cuando los individuos se enfrentan a ms
de un tipo de riesgo.

Variables que varan en el tiempo

Grficos de incidencia acumulativa

Razn de subrriesgo

1.1.12 Variables factoriales

Interacciones

Trminos polinomiales

Pontificia Universidad Catlica del Per

Jorge Valdivia

Creacin automtica de indicadores

1.1.13 Estadsticas exactas

Regresin logstica para variable dependiente binaria

Regresin de Poisson para datos de conteo

Pruebas exactas y pruebas conjuntas

Predicciones con intervalos de confianza exactos

1.1.14 Otras funciones

Diez generadores de nmeros aleatorios

Ms funciones de distribucin y de densidad

DIFBETA, valores de desplazamiento de verosimilitud y estadsticos LMAX


para regresin de Cox

Errores normales, GED y t de Student en ARCH

Tests multivariados

Derivadas numricas

Arreglos asociativos

Funciones para cdigos Soundex

Programacin orientada a objetos

1.2 Presentaciones de STATA


Las diferentes presentaciones de STATA se caracterizan segn el tipo de usuario y
recursos del computador. Las versiones Stata/SE, Intercooled Stata y Small Stata
varan segn el tamao de la base de datos de anlisis. As tenemos:

Stata/MP - Stata: para computadoras multiprocesador y de ncleo dual.

Stata/SE - Stata: para grandes bases de datos.

Intercooled Stata: versin estndar de Stata.

Small Stata: comnmente utilizada por estudiantes.

Es indiferente la interfaz para todas las presentaciones de STATA.

INFOPUC

STATA 12 para Economistas

1.3 Entorno de trabajo

El despliegue de STATA 12 presenta cuatro ventanas diferentes:


Ventanas de STATA
Review

Aqu aparecen los comandos que han sido utilizados durante la sesin.
Solo los resultados ms recientes son visibles en esta pantalla.

Command

Sirve para utilizar STATA de forma interactiva; es decir, se emplea para


crear las lneas de comandos y llevar a cabo las aplicaciones disponibles
en el software.

Variables

Nos informa sobre las variables que estn disponibles en nuestra base
de datos para realizar las diversas aplicaciones.

Results

Esta nos permite visualizar los resultados (outputs) de los estadsticos


que pedimos calcular o de los modelos que solicitamos estimar.

Properties

Esta ventana nos permite editar las propiedades de las variables y de la


base de datos, as como ver las propiedades generales.

Pontificia Universidad Catlica del Per

Jorge Valdivia

Entorno/Ventanas de STATA

Review

Variables

Resultados

Comandos

Propiedades

El tamao y la posicin de las ventanas pueden configurarse segn las preferencias


del usuario. Estas configuraciones se pueden realizar siguiendo los siguientes pasos:
1.

Se selecciona el men Edit; en la opcin Preferences, se elige General


Preferences.

2.

10

En la pestaa Windowing se configuran e ingresan los valores que se desean.

INFOPUC

STATA 12 para Economistas

Tambin podemos modificar el color de fondo o las fuentes de la ventana Stata


Results siguiendo los siguientes pasos:
1.

En el men Edit se selecciona la opcin Preferences.

2.

Se elige la opcin General Preferences.

3.

Se elige la pestaa Result Colors y se personaliza el color que se desea en la


casilla de Color Scheme.

Pontificia Universidad Catlica del Per

11

Jorge Valdivia

Otras ventanas importantes son:

Stata Editor permite navegar y modificar los datos como si fuese una hoja de
Excel.

12

Stata Editor (Browser) permite visualizar los datos, mas no modificarlos.

Stata Viewer permite acceder a informacin en lnea, as como a la ayuda del


programa.

INFOPUC

STATA 12 para Economistas

Stata Graphs presenta el ltimo grfico realizado.

Pontificia Universidad Catlica del Per

13

Jorge Valdivia

Stata Variables Manager es una ventana que funciona como un editor de las
variables y en donde se puede modificar el nombre, la etiqueta, el formato, las
notas, etc.

Stata Do-file Editor es una ventana separada en Windows y funciona como un


editor de textos que permite ejecutar una lista de comandos.

14

INFOPUC

STATA 12 para Economistas

Desde la versin 8 de STATA, todos los comandos (excepto los de programacin) han
sido implementados con cuadros de dilogo, y se puede acceder a ellos desde el
men principal, el cual est organizado por tpicos:

Men de comandos de STATA

Seleccionamos una opcin desde los mens Data, Graphics o Statistics y llenamos
la caja o cuadro de dilogo correspondiente.

Por ejemplo, para acceder al cuadro de dilogo siguiente, el cual se encuentra en los
mens desplegables, seguimos estos pasos:
1.

Seleccionar el men Statistics y elegir la opcin Linear models and related.

2.

Seleccionar la opcin Linear regression.

Anlisis estadstico a travs del men desplegable:

Pontificia Universidad Catlica del Per

15

Jorge Valdivia

Esta forma de trabajar con el programa de manera interactiva es lo que STATA llama
GUI (Graphic User Interface), lo cual es una mejora con respecto a las versiones
anteriores (versiones anteriores a STATA 8). STATA permite trabajar de manera
interactiva y por medio de comandos (al igual que RATS 6, Eviews, SPSS, etc.) debido
a que cada ventana se encuentra asociada a un comando.
La barra de herramientas
Adems, STATA presenta una barra de herramientas que permite realizar operaciones
usuales como abrir un archivo, grabarlo, imprimir o ver alguna ventana en particular.

16

INFOPUC

STATA 12 para Economistas

1.4 Recursos del STATA


STATA permite la actualizacin constante de sus comandos a travs de programas
escritos en un lenguaje llamado ado-file. Los propios usuarios realizan dichos
comandos y las nuevas tcnicas, y estos se presentan a travs de StataList, la lista de
STATA, de suscripcin gratuita.

Desde el siguiente enlace http://www.stata.com/statalist/, se discuten las ltimas


tcnicas y rutinas programadas en STATA. Dicha informacin mantiene una base de
datos desde 1997 con todos los tems posteados en StataList, los cuales han sido
ubicados en el Boston College Statistical Software Components (SSC).
Algunos otros recursos en la red:
http://www.stata.com/
http://www.stata.com/support/faqs/
Portal del STATALIST

Pontificia Universidad Catlica del Per

17

Jorge Valdivia

1.5 Ayuda en STATA: comandos help, search y findit


Comando help
Este es uno de los comandos ms importantes de STATA, pues presenta la sintaxis de
los comandos, as como ejemplos de cmo se usan. Para pedirle ayuda a STATA
sobre un comando, se escribe en la ventana de comandos help seguido del nombre
del comando que queramos conocer. Tambin se puede acceder directamente a la
ayuda.
A continuacin se muestran los siguientes ejemplos:

help if

help summarize

help regression

help tabulate

La ayuda en STATA se visualiza en el viewer. Sin embargo, todas las copias del
producto cuentan con la documentacin PDF, a la cual se puede acceder de la
siguiente manera:
En el men Help, hacer clic en el botn PDF Documentation.

18

INFOPUC

STATA 12 para Economistas

Dentro de la ayuda del comando, se observa que a veces las primeras letras del
nombre del comando estn subrayadas; esto indica que en lugar de escribir el
comando completo, como summarize, se puede escribir solamente su (o cualquier
forma intermedia).

Programando y ejecutando comandos en STATA


Para poder trabajar en el entorno de STATA, se va a utilizar la ventana de comandos.
En cuanto a la sintaxis, se va a utilizar la siguiente forma de ejecutar los comandos:

Notemos que todo lo que va entre corchetes es opcional, y que en la sintaxis de los
comandos primero se ponen los comandos seguidos de una explicacin (normalmente
las variables que queremos ejecutar o alguna explicacin relativa a cmo ejecutar el
comando), luego el peso (weigths), los condicionales (if) preceden a los rangos (in) y
les siguen las opciones despus de un coma:
[varlist] Es la lista de variables.
[if] Debe estar seguida de una expresin lgica para que solo los datos que cumplan
con la condicin puedan incluirse en dicho anlisis.
[in] permite indicar el rango de los datos que se desea analizar.
[weight] Son los pesos o ponderaciones.
[options] Son las opciones de cada comando que se est utilizando. Siempre se
antepone una coma antes de las opciones.

Pontificia Universidad Catlica del Per

19

Jorge Valdivia

Tema 2: Manejo de datos

2.1 Iniciando una sesin de STATA


2.1.1

Creando un Log file

STATA permite guardar un registro de los comandos y los resultados que van
apareciendo en la ventana de resultados. Para crear un archivo de bitcora se
usa el comando log using: log using bitcora.
Por defecto, se guarda en el directorio en uso y en formato SMCL (que es el que
usa STATA) para presentar los resultados.
Para parar momentneamente el registro de

log off

la bitcora:
Para reanudar el registro de la bitcora:

log on

Este comando ser registrado:

sysuse auto
tab rep78

Para detener la bitcora:

log close

Para reanudar una bitcora:

log using bitcora, append

Para sobrescribir una bitcora:

log using bitacora, replace

Para ver una bitcora:

type bitacora.smcl

Nota: Si se quiere guardar los resultados en un archivo


de texto, se debe escribir la siguiente sintaxis:
log using bitcora, text

Esta se guardara automticamente en este formato y se podr abrir con el bloc


de notas.

20

INFOPUC

STATA 12 para Economistas

2.1.2 Abrir y guardar una base de datos


La forma como STATA carga los datos a la memoria es similar a la de un
procesador de textos o a la de una hoja de clculo. No se realizan los cambios
hasta que el usuario los guarda explcitamente.
Cuando se emplea el comando use, los datos se cargan a la memoria del
ordenador. Para guardar los datos se debe emplear el comando save. Es
recomendable no sobrescribir los datos y trabajar en un directorio diferente de
donde se encuentran los datos originales. Los datos pueden cargarse al
programa utilizando el comando use seguido por la ruta en donde se encuentra
la base de datos.
sysuse auto
save "auto.dta

2.1.3 Comandos principales


COMANDO

DESCRIPCIN

help

Ayuda de programa STATA para comandos

log

Uso de archivos de bitcora

use

Abrir una base de datos en STATA (extensin .dta)

edit

Ingreso de datos por medio de la ventana de Stata Editor

codebook

Muestra variables con estadsticos descriptivos

describe

Describe contenido de datos en memoria o sobre el disco

save

Guarda los datos en disco con extensin *.dta

list

Lista de valores de variable

if

Selecciona observaciones cumpliendo cierta condicin para la


ejecucin del comando

drop

Borra variable o dato en memoria

keep

Borra variables o datos no seleccionados

label variable

Comando de etiqueta de variables

label define

Primer paso para etiquetar valores de una variable

label values

Segundo paso para etiquetar valores de una variable

Pontificia Universidad Catlica del Per

21

Jorge Valdivia

Ejemplo:
El ejercicio consiste en abrir una base de datos de nombre auto, la cual se
puede abrir con el comando sysuse para luego guardarla en una ruta especfica
y volver a abrirla. En la ventana de comandos, se debe escribir lo siguiente:
sysuse auto

1. En primer lugar, se indica la ruta del directorio de trabajo a travs del comando
cd:1
cd C:\Users\jvaldiviar\Desktop\STATA 12
2. Una vez que se ha definido la carpeta de trabajo, se guardar la base de
datos a travs del comando save:
save auto.dta

3. Finalmente, cuando se tenga el archivo guardado, se invocar a la base de


datos utilizando el comando use:
use auto.dta

Es necesario indicar en el disco una ruta a STATA donde se van a almacenar y ubicar los archivos
con los que se trabaje. Esto es necesario para poder abrir, guardar o utilizar archivos, grficos, bases
de datos, etc.

22

INFOPUC

STATA 12 para Economistas

Al abrir la base de datos se cargar la ventana de variables. Para pedir ayuda


sobre el comando se deber invocar la ayuda de STATA:
help use

Uso del comando use a travs del help

Pontificia Universidad Catlica del Per

23

Jorge Valdivia

4. Para conocer el contenido de la base, se emplearn los comandos describe y codebook:


El comando describe se emplea

Comando describe

para describir el contenido de


datos

en

la

memoria

del

computador. Brinda la siguiente


informacin:

Contenido de la data de: (ruta


del archivo)

Nmero

de

observaciones,

variables

Fecha

tamao

de

la

memoria empleada

Nombre de la variable,
tipo de almacenaje (string
o numrica), y la etiqueta
de la variable

Comando codebook

El comando codebook se
emplea

para

describir

el

contenido de las variables de


manera detallada, brindando
informacin
mximo,

como

rango,

mnimo,

media,

varianza, missings, etc. El


contenido mostrado depende
de cada variable.
5. Otras formas de abrir una base de datos:
Al digitar en la lnea de comandos la siguiente sintaxis:
use auto.dta in 1/10

se le indica al STATA la apertura de los 10 primeros registros de la base de datos.


Este tipo de rdenes se aplicar cuando se desee realizar una exploracin a la base
de datos, sin necesidad de cargar la base completa.

24

INFOPUC

STATA 12 para Economistas

De la misma manera, es posible aplicar filtros que indiquen qu parte de la base


de datos se utilizar. En la base auto, la variable price representa el total de
miembros del hogar. Por ello, si est interesado en conocer solo los precios
mayores a 3000, se aplicar el siguiente condicional:

use auto if price>3000

En muchas ocasiones, solo sern de nuestro inters algunas de las variables


contenidas en la base de datos. Para ello se emplear la siguiente sintaxis:

use make price mpg rep78 using auto


Donde los comandos empleados son use y using; mientras que las variables de
inters son make, price, mpg y rep78. Como en los casos anteriores, la base de
datos se denomina auto. Cabe mencionar que no ha sido necesario incorporar el
nombre del directorio, debido a que eso fue establecido lneas arriba a travs del
comando cd.

2.1.4

Estructura de comandos

En funcin al anlisis de datos que se desee realizar, la estructura de la sintaxis


cambiar con la finalidad de elaborar reportes segn las necesidades del
investigador.
Por ejemplo, el comando summarize brinda reportes de los principales
estadsticos de la base de datos. Dicho comando se emplea de las siguientes
maneras:

summarize price if price>3500

Pontificia Universidad Catlica del Per

25

Jorge Valdivia

by foreign: summarize price if price>3500

summarize price,detail

2.1.5

Ingresando nuevos datos a STATA

Para crear o introducir datos en STATA y generar nuevas variables, se debe


utilizar el comando edit. Se puede acceder a la ventana emergente del comando
en el men Dara Data Editor Data Editor (Edit), o haciendo clic en el
botn edit:

Una vez abierto, aparece la ventada Stata Editor, la que permite ingresar
informacin libremente. Si se escriben nmeros, se va generar una variable

26

INFOPUC

STATA 12 para Economistas

numrica que va a aparecer de color negro; si se escriben palabras, la data va a


aparecer en color rojo. A este tipo de datos se les llaman variables string. Los
espacios en blanco van a estar representados por un punto (missing data).

Pontificia Universidad Catlica del Per

27

Das könnte Ihnen auch gefallen