Sie sind auf Seite 1von 25

Bases de STATA, tipos de

archivos, sintaxis y comandos


básicos
(Referencia Seminario de Stata – Universidad Nacional de La Plata)
Camilo F. Gómez

Mayo 17 de 2019

Econometría I - Camilo F. Gómez 1


Hoja de Ruta
Introducción a STATA
• Detalles sobre versiones
• Manuales y guías de aprendizaje
• Entorno de trabajo – Interface
• Sintaxis
• Comandos básicos
• Memoria
• Abreviaturas

Econometría I - Camilo F. Gómez 2


Introducción a STATA
• STATA es un sistema que permite la gestión y manejo de datos para
poder realizar estimaciones econométricas y estadísticas.
• La ventaja de STATA es que basa su lenguaje en programación a través
de una sintaxis.
• Posee comandos predefinidos que permite realizar trabajos
complejos.
• Admite la creación de nuevos comandos por parte del usuario,
generando posibilidades de expansión.

Econometría I - Camilo F. Gómez 3


Detalle sobre versiones
Existen varias versiones de STATA las más importantes son:
• Windows (32 - bit), Windows (64 - bit)
• Mac (32 – bit Intel), Mac (64 – bit Intel)
• Linux (32 – bit), Linux (64 – bit x 86 – 64)
Hasta la versión 10 del programa existían dos tipos: SE (special edition) y el
IC (standard).
A partir de la versión 11 existen versiones optimizadas.
Para saber la versión de STATA instalada ejecutar el comando

about
Econometría I - Camilo F. Gómez 4
Manuales y guías de aprendizaje
Las fuentes oficiales para aprender STATA son los manuales originales.
• Para dar una base es suficiente con la guía de usuario.
• Para usuarios avanzados, existen libros y manuales detallados por
comando.
• STATA posee una ayuda en línea que permite acceder a información
con respecto a inquietudes concretas, esta se puede obtener de dos
maneras:
• Utilizando man comando
• Se utiliza desde el menú o la línea de comando la opción help.

Econometría I - Camilo F. Gómez 5


Entorno de trabajo - Interface
La interface en STATA corresponde al entorno de trabajo. A continuación se
trabajará en interface en las siguientes clases se realizará la interface a través
de archivos do y log.

Estas son las ventajas que hacen parte del entorno de trabajo.
• Ventana “Review”. Muestra el historial de comandos utilizados.
• Ventana “Variables”. Determina las variables de la base de datos.
• Ventana “Results”. Es la ventana que expone los resultados (ventana de
color negro) después de tulizar los comandos.
• Ventana “Command”. En esta ventana se introducen los comandos a
utilizar.
Econometría I - Camilo F. Gómez 6
Sintaxis
El programa STATA trabaja mediante ordenes por parte del usuario a
través de comandos. Los comandos conforman un lenguaje de
comunicación del programa, por lo que existe una determinada sintaxis
que se debe respetar.

comando [varlist] [=exp] [if exp] [in range] [weight] [,opciones]

Los corchetes indican elementos opcionales, todos los elementos que


pueden acompañar un comando.

Econometría I - Camilo F. Gómez 7


Comandos básicos
Para ver los diferentes comandos simples y que permita entender la estructura de la sintaxis. Para ello
utilizaremos la base de datos auto.dta. Esta base de datos contiene 74 observaciones de vehículos incluye las
variables precio, largo, marca, consumo, etc.

Base integrada a STATA.


ssc install estout
sysuse auto

Comando para cargar la base de datos

use “c:\clase 4\auto.dta”

• No se puede utilizar dos bases de datos simultáneamente, o abrir una base con una que ya esta siendo
utilizada para ello se puede utilizar

use “c\clase 4\auto.dta”, clear


Econometría I - Camilo F. Gómez 8
Comandos básicos
• Utilizando el comando “cd c:\clase 4\auto.dta” para indicarle a STATA
donde esta la carpeta que esta trabajando. Luego se utiliza el
comando “use auto.dta”
• La otra alternativa es abrir la base a través del menú “open”.

Una vez cargada la base de datos, se puede observar “Review”,


“Variables” y “Results” que cambiaron.

Econometría I - Camilo F. Gómez 9


Comandos básicos
Sintaxis: Comando sin opciones

El comando summarize permite obtener una descripción estadística de


cualquier variable que componen la base de datos.

summarize

Se puede usar para obtener la descripción estadística de una variable.

summarize price
Econometría I - Camilo F. Gómez 10
Comandos básicos
Más variables

summarize price weigth length

Lista de variables (todas las variables que están entre Price y trunk)

summarize price-trunk

Variables que inician con la letra l (en este caso length)

summarize l*

Econometría I - Camilo F. Gómez 11


Comandos básicos
Sintaxis [if exp]

La aplicación de comandos a veces se debe realizar para variables que


debe cumplir ciertas restricciones, esto se hace utilizando el “si
condicional” (if en ingles).

summarize length if price > 4500

Calcula el resumen estadístico de la variable largo de aquellos autos


con un precio mayor a 4.500.
Econometría I - Camilo F. Gómez 12
Comandos básicos
Para construir una sentencia se debe utilizar los siguientes componentes:

• Operadores de comparación

== igual
!= no igual (similar a ~=)
>, <, >=, <= los usuales mayor, menor, mayor igual y menor igual.

• Operadores lógicos

& y
|o
! No

Econometría I - Camilo F. Gómez 13


Comandos básicos
• Operadores jerárquicos. El paréntesis determina el orden de la aplicación de las condiciones.

summarize length if (price > 4500) & (length < 180)


summarize length if (price > 4500 & length < 180) | weight > 3400
summarize length if !(price > 4500) & (length < 180) | weight > 3400)

Sintaxis [in range]

Permite aplicar el comando a un rango de observaciones.

summarize price in 1/10

Obtiene la descripción estadística de las 10 primeras observaciones.

Econometría I - Camilo F. Gómez 14


Comandos básicos
summarize price in 7/12

Obtiene la descripción estadística de la 7 a la 12 observación.

summarize price in -10/-1

El comando se aplica a las ultimas 10 observaciones.

Debemos tener claro que la aplicación de [in range] a su vez depende de como esta ordenada la base de datos.
Los comandos para ordenar son:

sort price

Permite ordenar de manera ascendente según la variables especificada.

Econometría I - Camilo F. Gómez 15


Comandos básicos
gsort-price

Ordena de manera descendente, según el precio del auto.

gsort+price

Ordena de manera ascendente, según el precio del auto.

Sintaxis [=exp]

Para generar se utiliza solo dos comandos: generate y replace.

Econometría I - Camilo F. Gómez 16


Comandos básicos
generate eleccion = 0

Este comando permite crear una nueva variable en la base de datos. Para ello, se debe indicar que valores
puede tomar esta variable, en este caso la variable se llama elección y tiene un valor de cero.

Se puede generar una nueva variable combinándola con otras existentes.

generate price2 = price*2


generate lnprice = ln(price)

Así mismo, se puede verificar los valores con el siguiente comando:

list price price lnprice

Econometría I - Camilo F. Gómez 17


Comandos básicos
Se puede crear un variable con valor nulo, en STATA se identifica con un
punto (.)

generate nulo = .

El otro comando que se usa es el replace, este comando permite reemplazar


valores de la variable creada.

replace price2 = 0 if price < 4500

¿ Que hizo este comando?

Econometría I - Camilo F. Gómez 18


Comandos básicos
Sintaxis [by varlist]

Permite aplicar el comando a un grupo de observaciones definidos por los distintos valores de la variables
indicada. Para saber cuantos autos nacionales y extranjeros existen.

sort foreign
By foreign: summarize price

Se puede utilizar el siguiente método

summarize price if foreign==0


summarize price if foreign==1

¿Cuál es la diferencia entre ambos métodos?

Econometría I - Camilo F. Gómez 19


Comandos básicos
Sintaxis [, opciones]

Existen comandos que pueden aceptar opciones adicionales, estas se especifican en la sintaxis luego
de la coma.

summarize price, detail

¿Qué cambio?

Sintaxis[weight]

Esta indica a una variable como ponderador de las observaciones. Cuando estemos trabajando
Encuestas de Hogares la utilizaremos como parte del sintaxis.

Econometría I - Camilo F. Gómez 20


Otros comandos
Para tabular cantidades de observaciones para distintos valores de una
variables tenemos:

tabulate foreign

Así mismo, puede ser combinado con el comando summarize

tabulate foreign, summarize (price)

De esta manera se obtiene la media, el desvió estándar y la frecuencia, del


precio para los autos nacionales y extranjeros.

Econometría I - Camilo F. Gómez 21


Otros comandos
Se puede combinar con más variables

tabulate foreign price

Por su parte el comando tabstat es más avanzado para generar estadísticas descriptivas.

tabstat price, statistics(mean)

De igual manera se pueden obtener otros.

tabstat price, statistics(mean sum count max min range sd variance cv median p10)

Para más variables

tabstat price length, statistics(mean sum count max min range sd variance cv median p10)

Econometría I - Camilo F. Gómez 22


Memoria
STATA trabaja de una manera en donde la base de datos es almacenada en la
memoria RAM del PC. Esto trae ventajas y desventajas.

• La ejecución de comandos es más rápida, ya que no accede al disco.


• El tamaño de la base de datos procesada depende de la cantidad de
memoria RAM del PC.

El comando para conocer el uso de la memoria es:

memory

Econometría I - Camilo F. Gómez 23


Memoria
El programa comienza la sesión con una capacidad de memoria
asignada. Dado que este espacio puede no ser suficiente, se puede
ampliar la memoria.

set memory 100m

Este comando asigna 100 mega bytes de memoria para el uso de STATA,
sin embargo para las ediciones posteriores a STATA 11 no es necesario,
ya que se asigna la cantidad automáticamente.

Econometría I - Camilo F. Gómez 24


Abreviatura
Es interesante que los comandos que se explicaron pueden ser abreviados, es decir,
pensaron que se tenían que escribir siempre summarize.

La regla es sencilla se puede realizar la abreviatura siempre y cuando no se confunda con


otro comando.

• Los comando destructivos no se abrevian drop, clear


• Existe el comando describe que se abrevia con d, a pesar de confundirse con otros.

Ejemplo

sum price foreign

Econometría I - Camilo F. Gómez 25

Das könnte Ihnen auch gefallen