Beruflich Dokumente
Kultur Dokumente
INTRODUCCION A
A STATA
STATA
www.daxrox.com
Statistical Services Group
Mayo 2011
SSGC
Introduccin
Qu es Stata?
Introduccin
Stata.
Stata es una herramienta de anlisis
estadstico poderosa, existente tanto para
Windows como para MacOs, con diferentes
versiones segn su capacidad de variables,
memoria, optimizacin de recursos y uso de
los procesadores (Stata IC/SE/MP).
Mata.
Lenguaje de programacin matricial, utilizado
por Stata, que incluye una gran librera de
funciones para trabajar con matrices, y su
sintaxis es parecida a Java o a C++.
SSGC
Introduccin
Qu es Mata?
Introduccin
Stata.
Stata es una herramienta de anlisis
estadstico poderosa, existente tanto para
Windows como para MacOs, con diferentes
versiones segn su capacidad de variables,
memoria, optimizacin de recursos y uso de
los procesadores (Stata IC/SE/MP).
Mata.
Lenguaje de programacin matricial, utilizado
por Stata, que incluye una gran librera de
funciones para trabajar con matrices, y su
sintaxis es parecida a Java o a C++.
SSGC
Introduccin
Ventajas de Stata
Ventajas
-
Portabilidad
Facilidad
Versatilidad
Programacin
Uso eficiente del hardware
Fortalezas
- Manipulacin de datos
- Anlisis estadstico
- Grficos.
SSGC
Introduccin
Fortalezas de Stata
Ventajas
- Portabilidad
- Facilidad
- Versatilidad
- Programacin
- Uso eficiente del hardware
Fortalezas
- Manipulacin de datos
- Anlisis estadstico
- Grficos.
SSGC
Introduccin
Anlisis estadstico
Anlisis estadstico
-
Estadsticos descriptivos
Pruebas de hiptesis
Anlisis multivariado
ANOVA
Regresin
Anlisis de Series Temporales.
SSGC
Introduccin
Grficos
Grficos
- Grficos personalizables 2D de alta
calidad.
- Schemas.
- Programacin.
- Concepto de capas
SSGC
Instalacin
Configuracin Memoria
Instalacin
- Versiones: IC, SE, MP.
- Personalizacin Entorno Trabajo.
- Configuracin Memoria y
Procesador.
SSGC
Instalacin
Configuracin Memoria
Instalacin
- Versiones: IC, SE, MP.
- Personalizacin Entorno Trabajo.
- Configuracin Memoria y
Procesador.
set mem 3g
set mem 3g, perm
set maxvar 2000, perm
set
SSGC
Soporte y
actualizaciones
Instalacin
Soporte
- findit
- Statlist
- Documentacin en PDF
Actualizaciones
-
SSGC
Iniciando en Stata
Pantalla Inicial
Pantalla Inicial
Ventana de comandos
Ventana de resultados
Visualizador de datos
Editor de datos.
Ventana de variables.
Ventana de Revisin
SSGC
Iniciando en Stata
Ayuda
Uso de la ayuda
Para obtener la ayuda sobre cualquier tpico
podemos acceder directamente desde el
men o escribir la palabra help delante de
cualquier comando en la ventana de
comandos:
help <comando>
help regress
SSGC
Iniciando en Stata
Guardando el trabajo.
Archivos Logs
Creacin de archivos. Para ir grabando todos
los comandos y resultados utilizamos el
comando log, por ejemplo:
log using cursoST
genera un archivo en el directorio de trabajo
llamado tema3, que se puede abrir tanto en
Stata como en cualquier editor de texto.
Cuando hemos terminado nuestra sesin de
trabajo utilizamos
log close
SSGC
Iniciando en Stata
Configurando
directorios
Configuracin de directorio de
trabajo.
El directorio de trabajo (donde se guardan los
archivos logs) se muestra en la parte inferior
izquierda de la pantalla de Stata. Si por
alguna razn queremos cambiarlo utilizamos
cdcomando
c:\
el
cd. Por ejemplo
SSGC
Iniciando en Stata
Abriendo archivos
Abriendo un archivo
SSGC
Iniciando en Stata
Guardando archivos
Guardando un archivo
SSGC
Iniciando en Stata
Guardando archivos
Guardando un archivo
Iniciando en Stata
Por qu comandos?
Extensibilidad.
-
Programacin
- Infinitamente til.
SSGC
Iniciando en Stata
Por qu comandos?
Extensibilidad.
-
Programacin
- Infinitamente til.
SSGC
Iniciando en Stata
Por qu comandos?
Extensibilidad.
-
Programacin
- Infinitamente til.
SSGC
Iniciando en Stata
Mi primer programa
Ejemplo:
Iniciando en Stata
Mi primer programa
Ejemplo:
Iniciando en Stata
Mi primer programa
Ejemplo:
Iniciando en Stata
Sintaxis de los
comandos
Sintaxis en Stata:
- Los comandos siguen una plantilla.
- Sensible a las maysculas.
Sintaxis General de los
comandos:
[prefijo_cmd:] cmdnombre[varlist]
[=exp]
[if exp] [in rango]
[peso] [usando...] [,optiones]
Ej:
count
SSGC
Iniciando en Stata
Sintaxis de los
comandos
Componentes
- varlist: lista de variables sobre la
cual el comando opera:
Ejemplos:
summarize var1
drop var1-var10
keep var*
SSGC
Iniciando en Stata
Sintaxis de los
comandos
Componentes
- varlist: lista de variables sobre la
cual el comando opera:
Ejemplos (con wildcards):
summarize var1
drop var1-var10
keep var*
list mes_?_dia_1
SSGC
Iniciando en Stata
Sintaxis de los
comandos
Iniciando en Stata
Sintaxis de los
comandos
Iniciando en Stata
Sintaxis de los
comandos
SSGC
Iniciando en Stata
Sintaxis de los
comandos
SSGC
Iniciando en Stata
Sintaxis de los
comandos
Iniciando en Stata
Sintaxis de los
comandos
Iniciando en Stata
Sintaxis de los
comandos
Ejemplo 2:Insertando y
reemplazando observaciones.
SSGC
Iniciando en Stata
Sintaxis de los
comandos
Ejemplo 2:Insertando y
reemplazando observaciones.
Iniciando en Stata
Sintaxis de los
comandos
Iniciando en Stata
Sintaxis de los
comandos
Iniciando en Stata
Sintaxis de los
comandos
Iniciando en Stata
Prefijo by
Iniciando en Stata
Prefijo by
Iniciando en Stata
Sintaxis de los
comandos
Prefijo by
- Se utiliza tambin para evitar
realizar ciclos sobre las
observaciones
bysort agno trimestre: sum ventas
SSGC
Iniciando en Stata
Valores Faltantes
Valores faltantes
Se codifican como (.) para valores
numricos y como para literales.
Toma el valor positivo ms grande.
Por ejemplo (Creando Variables
Dummy):
generate venta_alta=(ventas>15)
No
esventa_alta_corr=(ventas>15
lo mismo que:
gen
&
ventas<.)
Introduccin a Stata, Mayo
SSGC
Iniciando en Stata
Formato de Pantalla
Formato de pantalla
Cada variable puede tener su
formato para presentar en la
pantalla. No cambia su valor, pero s
la forma en que se muestra.
SSGC
Iniciando en Stata
Formato de Pantalla
Formato de pantalla
Cada variable puede tener su
formato para presentar en la
pantalla. No cambia su valor, pero s
la formaventas
en que%9.2f
se muestra.
format
Muestra
las ventas
format tiempo
%tmen el formato por
defecto,
Introduccin a Stata, Mayo
muestra
SSGC la variable tiempo como
Iniciando en Stata
Etiquetando
variables
Etiquetando variables
Cada variable puede tener su
etiqueta, que es un literal de no ms
80 caracteres que describe la
variable
con latiempo"Tiempo
cual est asociada.
label
variable
en
aos"
SSGC
Iniciando en Stata
Value labels
Value labels
Asocia cada valor numrico de una
variable a un literal.
label define Trimestre 1 primero 2
segundo 3 tercero 4 cuarto
label values trimestre Trimestre
tab trimestre
SSGC
Iniciando en Stata
Codificando variables
Codificando variables
Si queremos
codificar alguna variable categrica en valores
numricos, utilizamos el comando encode:
use d:\SSGC\Ejemplos\tabulaciones.dta,
clear
encode pobreza,
generate(pobre_numerica)
sum pobre_numerica
Iniciando en Stata
Codificando variables
Codificando variables
Si queremos
codificar alguna variable categrica en valores
numricos, utilizamos el comando encode:
use d:\SSGC\Ejemplos\tabulaciones.dta,
clear
encode pobreza,
generate(pobre_numerica)
sum pobre_numerica
Iniciando en Stata
Combinando archivos
Combinando Archivos
merge
Si queremos combinarlos a travs de una
variable de enlace (match variable), como por
ejemplo un ID, para que los valores de las
variables en alguna columna (variable) de la
primera tabla se correspondan con las dems
variables de la segunda tabla
append
Si queremos aadir las observaciones de dos
o ms archivos
SSGC
Iniciando en Stata
Combinando archivos
Combinando Archivos
merge
Si queremos combinarlos a travs de una
variable de enlace (match variable), como por
ejemplo un ID, para que los valores de las
variables en alguna columna (variable) de la
primera tabla se correspondan con las dems
variables de la segunda tabla
append
Si queremos aadir las observaciones de dos
o ms archivos
SSGC
Iniciando en Stata
Combinando archivos
Combinando Archivos
Merge
Supongamos que tenemos un archivo dta
[archivo1] que contiene dos variables: agno,
trimestre, ventas, y otro archivo [archivo2]
con las variables agno, trimestre, compras.
Ejecutamos
use "D:\SSG\archivo1.dta, clear
merge 1:1 agno trimestre using
"D:\SSG\archivo2.dta
SSGC
Iniciando en Stata
Combinando archivos
Combinando Archivos
Append
Suponga que tenemos los datos de dos aos
para las ventas separados en dos archivos
[primero.dta], y [segundo.dta], con las
mismas variables.
Para combinarlos utilizamos:
use segundo.dta, clear
append using "C:\primero.dta"
SSGC
Iniciando en Stata
Generando nuevas
varibles
Iniciando en Stata
Generando nuevas
varibles
Iniciando en Stata
Generando nuevas
varibles
SSGC
Iniciando en Stata
Eliminando variables
Eliminando variables
Para eliminar variables utilizamos el
comando drop <nombre variable>. Si
deseamos eliminar la variable tiempo del
ejemplo
anterior:
drop
tiempo
Tambin podemos utilizar el comando keep
que elimina todas las variables no incluidas
en la
lista deagno
variables
keep
ventas
mes
SSGC
Iniciando en Stata
Eliminando variables
Eliminando variables
Para eliminar variables utilizamos el
comando drop <nombre variable>. Si
deseamos eliminar la variable tiempo del
ejemplo
anterior:
drop
tiempo
Tambin podemos utilizar el comando keep
que elimina todas las variables no incluidas
en la
lista deagno
variables
keep
ventas
mes
SSGC
Iniciando en Stata
Renombrando
variables
Renombrando variables
SSGC
Iniciando en Stata
Mostrando
observaciones.
Mostrando observaciones y
variables.
SSGC
Iniciando en Stata
Mostrando
observaciones.
Mostrando observaciones y
variables.
Iniciando en Stata
Mostrando
observaciones.
Mostrando observaciones y
variables.
Iniciando en Stata
Describiendo
variables
Iniciando en Stata
Ordenando datos
SSGC
Iniciando en Stata
Reconfigurando
datos
Colapsando datos
SSGC
Iniciando en Stata
Reconfigurando
datos
Transformando tabla
SSGC
Iniciando en Stata
Comando Reshape:
Ejemplos
Transformando tabla
Convertir de long a wide
SSGC
ESTADISTICA
ESTADISTICA DESCRIPTIVA
DESCRIPTIVA EN
EN STATA
STATA
Juan Amlcar Prez
Statistical Services Group
Mayo 2011
SSGC
Estadstica Descriptiva
Tablas de frecuencia
Estadstica Descriptiva
Tablas de doble
entrada
Tabulaciones cruzadas
Estadstica Descriptiva
Resumen estadstico
INTRODUCCION
INTRODUCCION A
A LA
LA
PROGRAMACION
PROGRAMACION EN
EN STATA
STATA
Juan Amlcar Prez
Statistical Services Group
Mayo 2011
SSGC
Programacin en Stata
Introduccin
Programacin bsica
Stata permite resolver cualquier tipo de
problema que requiera incluso algoritmos
complejos, uso de multiprocesadores,
compatibilidad con otros componentes
(APIs) de Windows, interfaz grfica,
funciones matriciales y paquetes de
funciones externos.
SSGC
Programacin en Stata
Introduccin
Programacin bsica
Stata permite resolver cualquier tipo de
problema que requiera incluso algoritmos
complejos, uso de multiprocesadores,
compatibilidad con otros componentes
(APIs) de Windows, interfaz grfica,
funciones matriciales y paquetes de
funciones externos.
SSGC
Programacin en Stata
Macros y escalares
Programacin en Stata
SSGC
Programacin en Stata
Comentarios.
Utilizando
comentarios
SSGC
Programacin en Stata
Comentarios.
Utilizando
comentarios
Programacin en Stata
Ciclos
Ciclos.
Permiten repetir comandos, bloques de
cdigo, instrucciones individuales,
operaciones matriciales, etc.
forvalues
Permite ejecutar bloques de cdigo para los
valores que tome una variable, con
incrementos (negativos o positivos)
arbitrarios.
SSGC
Programacin en Stata
Ciclos: forvalues
forvalues
Imagine que queremos crear una variable
con las ventas acumuladas al trimestre t.
use d:\SSGC\Ejemplos\Ventas.dta, clear
count
gen ventas_acumuladas=ventas
forvalues i=2/`r(N){
replace ventas_acumuladas=ventas[`i]+
ventas_acumuladas[`i-1] in `i
}
list ventas_acumuladas
SSGC
Programacin en Stata
Ciclos: foreach
foreach
foreach permite repetir comandos para
cada valor de una variable o lista de
variables o tems. Por ejemplo, para
renombrar cada una de las variables
aadindole un sufijio _1 utilizamos:
use d:\SSGC\Ejemplos\Ventas.dta,
clear
foreach var of varlist year-ventas{
rename `var' `var'_1
}
Note el guin entre year-ventas. Esto indica todas las variables que
se encuentren entre year y ventas.
SSGC
Programacin en Stata
Bifurcaciones
Bifurcaciones.
As como podemos seleccionar un
subconjunto de observaciones o variables
con la opcin if, podemos incluirlo en
cualquier bloque de cdigo para ejecutarlo
condicionalmente, o desviar el curso del
programa a otro bloque.
Por ejemplo, si queremos imprimir en
pantalla un mensaje que indique acumule
en una variable la suma de las ventas de
los trimestres impares y lo muestre en
pantalla
Introduccin a Stata, Mayo
SSGC
Programacin en Stata
Bifurcaciones
Bifurcaciones.
As como podemos seleccionar un
subconjunto de observaciones o variables
con la opcin if, podemos incluirlo en
cualquier bloque de cdigo para ejecutarlo
condicionalmente, o desviar el curso del
programa a otro bloque.
Por ejemplo, si queremos imprimir en
pantalla un mensaje que indique acumule
en una variable la suma de las ventas de
los trimestres impares y lo muestre en
pantalla
Introduccin a Stata, Mayo
SSGC
Programacin en Stata
Bifurcaciones: if
Bifurcaciones.
Utilizando IF en archivos ado y do
count
local impares=0
forvalues i=1/`r(N)'{
if(trimestre[`i']/2!=0 & ventas[`i']!
=.){
local impares=`impares'+
ventas[`i']
}
}
display "La suma de los trimestres
impares es " `impares'
Introduccin a Stata, Mayo
SSGC
Programacin en Stata
Bifurcaciones.
Bifurcaciones if:
ejemplos.
Programacin en Stata
Ejercicios I
Ejercicios.
1. Encuentre la suma de las ventas de los
trimestres impares sin utilizar ciclos
(foreach, forvalues)
SSGC
Programacin en Stata
Bifurcaciones: if
else
Bifurcaciones (ifelse).
SSGC
Programacin en Stata
Bifurcaciones: if
else
Bifurcaciones (ifelse).
SSGC
Programacin en Stata
Ejercicios II
Ejercicios II.
1. Encuentre una forma de resolver el
problema anterior sin utilizar else.
2. Encuentre una forma de resolver el
problema anterior sin utilizar ciclos
(foreach, forvalues).
3. Qu podemos concluir respecto a los
ejercicios anteriores, la forma ptima para
resolverlos y por qu?
SSGC
Programacin en Stata
Ejercicios II
Ejercicios II.
1. Encuentre una forma de resolver el
problema anterior sin utilizar else.
2. Encuentre una forma de resolver el
problema anterior sin utilizar ciclos
(foreach, forvalues).
3. Qu podemos concluir respecto a los
ejercicios anteriores, la forma ptima para
resolverlos y por qu?
SSGC
Programacin en Stata
Ejercicios II
Ejercicios II.
1. Encuentre una forma de resolver el
problema anterior sin utilizar else.
2. Encuentre una forma de resolver el
problema anterior sin utilizar ciclos
(foreach, forvalues).
3. Qu podemos concluir respecto a los
ejercicios anteriores, la forma ptima para
resolverlos y por qu?
SSGC
Programacin en Stata
Manipulando
resultados
e-class. (regress)
regress ventas tiempo
disp "El R2 fue " e(r2)
SSGC
Programacin en Stata
Mata
SSGC
Programacin en Stata
Programacin en Stata
Programacin en Stata
Eigenvalues/Eigenve
ctors
Programacin en Stata
Traza y Diagonal de
matrices
SSGC
Programacin en Stata
Traza y Diagonal de
matrices
SSGC
Programacin en Stata
Traza y Diagonal de
matrices
SSGC
Programacin en Stata
Determiante y rango
SSGC
Programacin en Stata
Determiante y rango
SSGC
Programacin en Stata
Transpuesta y
races .
SSGC
Programacin en Stata
Transpuesta y
races .
SSGC
Programacin en Stata
Hallando inversas
SSGC
Programacin en Stata
Suma de matrices
SSGC
Programacin en Stata
Sistema de
ecuaciones
SSGC
Programacin en Stata
Sistema de
ecuaciones
SSGC
Programacin en Stata
Polinomios
Manipulacin de polinomios
Hallando las races de un polinomio
(polyroots).
Suponga que queremos hallar las races de
3+5x+x2 = 0
clear
mata
polyroots((3,5,1))
end
Evaluacin de
polinomios(polyeval).
Suponga que queremos sustituir por x=1 en
3+5x+x2 = 0
SSGC
Programacin en Stata
Polinomios
Manipulacin de polinomios
Hallando las races de un polinomio
(polyroots).
Suponga que queremos hallar las races de
3+5x+x2 = 0
clear
mata
polyroots((3,5,1))
end
Evaluacin de
polinomios(polyeval).
clear
Suponga
que queremos sustituir por x=1 en
mata
3+5x+x
= 0
polyeval 2((3,5,1),1)
end
SSGC
APENDICE:
APENDICE: Algunos
Algunos comandos
comandos
importantes
importantes
Juan Amlcar Prez
Statistical Services Group
Mayo 2011
SSGC
Manipulacin de
Comandos importantes
datos
generate : crea nueva variable
replace : modifica una variable existente
rename : renombra una variable.
renvars : renombra un conjunto de variables
sort : cambia el orden de ordenacin de los
datos
drop : elimina observaciones o variables
keep : mantiene las observaciones o
variables.
append : combina conjuntos de datos.
merge : combina conjunto de datos.
encode : genera variable numrica a partir de
categrica
Introduccin
a Stata, Mayo
recode
:
recodifica
variables
categricas
SSGC
Manipulacin de
Comandos importantes
datos
describe : describe el dataset en memoria
use : carga un archivo
save : guarda un archivo.
insheet : carga un archivo txt, o delimitado
por tab.
outfile : exporta un archivo txt o delimitado
por tab.
contract : crea un archivo con frecuencias.
collapse : crea un archivo con resumen
estadstico
tab : genera tabulaciones de 1 y 2 vas.
table : genera tabla de resumen estadstico
SSGC
Comandos
Comandos importantes
estadsticos
Comandos tiles:
Comandos series
Comandos importantes
temporales
SSGC