Beruflich Dokumente
Kultur Dokumente
@prof_sidinei
Professor
Graduado em Economia pela Universidade Estadual de Maring (UEM), Especialista em Consultoria Econmico-Financeira de Empresas (UEM). Mestrando em Economia Regional pela Universidade Estadual de Londrina (UEL), professor e pesquisador na Faculdade Cidade Verde (FCV).
Aquele que quer aprender gosta que lhe digam quando est errado; s o tolo no gosta de ser corrigido. (Provrbios, 12. 1)
Sobre o Stata
Mtodos estatsticos para anlise de dados so utilizados por pesquisadores de diversas reas: economia, sociologia, cincias polticas, marketing, epidemiologia, nutrio, sade pblica. Para o processo de anlise dos dados, os pesquisadores necessitam de pacotes que sejam de fcil manejo (amigveis) e tenham uma ampla gama de tcnicas estatsticas. o caso do software Stata, que oferece uma variedade de tcnicas estatsticas das mais elementares s mais sofisticadas, tem uma sintaxe simples e usado por meio de linha de comandos de fcil execuo. Foi desenvolvido no Texas (EUA), em 1984, e j distribudo para 132 pases. Periodicamente, o grupo que desenvolve este programa (StataCorp) disponibiliza atualizaes via internet e tem lanado novas verses a cada trs anos, em mdia. O StataCorp tambm mantm a publicao de um peridico (Stata Journal) e uma lista de discusso virtual.
Sobre o Stata
Stata [Estata ou Esteita] - Stata Corporation Intercooled Stata Verso resumida - Short Stata Verso simplificada StataQuest Existem verses do programa para 3 sistemas: Windows, Unix e Macintosh. Atualmente est na verso 11. Este curso: Intercooled Stata verso 9.1 para sistema Windows. Informaes sobre o Stata, bem como atualizaes, realizao de cursos via Internet e lista das dvidas mais freqentes podem ser obtidas no site: http://www.stata.com O Stata possui lista de discusso sobre dvidas. Endereo: statalist@hsphsun2.havard.edu
Proposta do Curso
O intuito oferecer uma introduo ao campo da estatstica e econometria aplicada utilizando o programa Stata. Didaticamente, o curso dividido em cinco mdulos: Mdulo I Noes bsicas sobre Econometria e o Stata Mdulo II Manipulao de microdados Mdulo III Anlises descritivas de dados Mdulo IV Testes de hipteses: testes de comparao de mdias/propores e testes de independncia Mdulo V Anlises de regresso
Mdulo I
Noes bsicas Sobre Econometria e o Stata
O que Econometria?
A econometria consiste na aplicao de procedimentos matemticos e estatsticos a problemas de economia. Gujarati (2000) cita que o mtodo da pesquisa economtrica visa essencialmente, a uma conjuno da teoria econmica com medidas concretas, usando como ponte teoria e as tcnicas de inferncia estatstica. Teoria Econmica (micro e macro) + Economia Matemtica + Estatstica Econmica = Econometria (que literalmente significa medida econmica)
Metodologias Economtricas
Na metodologia da pesquisa economtrica, o critrio de avaliao do modelo pode ser especificado da seguinte forma: (1) Anlise Estrutural: Verificar a Teoria Econmica Entender o Fenmeno em Estudo Avaliar os Parmetros do Modelo (efeito marginal e elasticidade, por exemplo)
(2) Anlise de Poltica: - Avaliar Alternativas de Tributao, elaborar simulaes. (3) Previses: - Prever Valores Futuros da Oferta e Demanda de soja, por exemplo.
Metodologias Economtricas
O sucessoda anlise economtrica depende, evidentemente, do grau em que o modelo estimado satisfaz os objetivos de explicar e/ou prever o comportamento das variveis sob anlise. A palavra modelo pode ser interpretada como uma representao simplificada da realidade, estruturada de forma tal que permita compreender de forma total ou parcial um determinado fenmeno. A racionalizao dos modelos permite a investigao das consequncias lgicas das hipteses. Desta forma possvel o conhecimento melhor da realidade e o desenvolvimento de aes que tenham maior eficcia.
Modelo Economtrico
Os modelos economtricos so aqueles que necessariamente contm as especificaes (forma matemtica, definio das variveis e nmero de equaes) para aplicao emprica, alm de incorporar um termo residual com a finalidade de levar em contar variveis ou outros elementos, que, por alguma razo, no puderam ser considerados explicitamente. Exemplo - Funo Consumo: Y = 1 + 2 X + u Onde: 1 + 2 = parmetros do modelo Y = varivel dependente X = varivel independente u = termo de perturbao ou erro
Modelo Economtrico
O modelo economtrico determinado para examinar relaes entre variveis econmicas. Toda relao matemtica pode ser classificada como determinstica ou como estocstica, que apresenta-se da seguinte forma: (a) DETERMINSTICA: se cada elemento do domnio (X) se associa com apenas um elemento da imagem (Y). Ou seja, em uma funo Y = f (X) se para cada valor de X houver um valor de Y. Este o caso de Modelo Estritamente Matemtico.
Modelo Economtrico
(b) ESTOCSTICA: para cada valor do domnio (X) existe uma distribuio de probabilidade total dos valores da imagem (Y). Assim, para cada valor de X a varivel Y pode assumir um intervalo especfico. (c) A IMPORTNCIA DO TERMO ERRO: a reta ajustada de regresso gerada por um conjunto de dados que leva em considerao um termo chamado de erro aleatrio (ou perturbao aleatria).
Modelo Economtrico
Para cada observao (Y, X) h um termo de erro associado. Estes termos erros so iguais a distncia vertical entre os pontos observados e os pontos correspondentes sobre a reta de regresso. Representam que h vrias possibilidades (probabilidades) de ocorrncia de Y para determinado X (resduos aleatrios). A utilizao de testes estatsticos faz com que as relaes em econometria, sejam estocsticas. Isto , em econometria trataremos exclusivamente com relaes estocsticas. A natureza estocstica do modelo de regresso implica que para cada valor de X haja uma distribuio de probabilidades total dos valores de Y. Isto significa que o valor de Y no pode ser previsto exatamente. A incerteza relativa de Y surge por causa da presena de erro aleatrio, que provoca causalidade em Y.
Base de Dados
Trs tipos de dados podem estar disponveis para a anlise emprica: dados de srie temporal, de corte e combinados (srie temporais e corte). (1) Dados de Srie Temporal Uma srie temporal um conjunto de observaes dos valores que uma varivel assume em diferentes momentos. Em outras palavras, uma srie temporal um conjunto de dados sequenciais observados em intervalos de tempo. Por exemplo: Retornos dirios do IBOVESPA Taxa de desemprego mensal
Base de Dados
(2) Dados de Corte (Cross-Section) So dados de uma ou mais variveis coletadas no mesmo ponto do tempo. Por exemplo: - Altura de indivduos selecionados aleatoriamente (amostra aleatria) em um determinado instante de tempo - PIB dos pases emergentes no primeiro trimestre de 2001 Assim como os dados das sries temporais do origens a problemas especficos (por causa da estacionariedade), os dados de corte tambm tem seus problemas, de heterogeneidade. Alguns pontos so demasiadamente grandes enquanto outros apresentam demasiadamente pequenos. Quando inclumos unidades heterogneas em uma anlise estatstica, o tamanho ou o efeito escala deve ser levado em considerao para evitar problemas de estimao.
Base de Dados
(3) Dados de Painel Nos dados combinados h elementos tanto de sries temporais como de dados de corte. Um tipo de dados combinados, os dados de painel, representam uma mesma unidade cross-sectional (uma famlia ou uma firma) pesquisada durante um perodo de tempo. Por exemplo, uma pesquisa periodicamente sobre a trajetria de uma pessoa com renda mdia em um determinado Estado. Em cada pesquisa considerada a mesma pessoa. Exemplos: PIB trimestral dos pases emergentes nos ltimos 10 anos Inflao mensal dos pases da Amrica Latina Vendas semanais de refrigerante em cada regio do Brasil Demanda de energia eltrica mensal em cada Estado do Brasil
Recomendaes Gerais
Estrutura de um modelo economtrico: 1 Especificao pesquisador) 2 Estimao 3 Verificao (junto com especificao so as partes mais importantes do modelo) 4 Aplicaes (srie temporal [previso], testes causalidade [microeconomia]) de (parte relevante/complexa/papel do
Recomendaes Gerais
Varivel Y Varivel X
Endgena
Dependente
Independente
Explicada
Explicativa
Varivel de Controle
Recomendaes Gerais
Sentido da causalidade = sinal Base de dados = Pnad (por exemplo) Banco de dados = o que eu fiz/modelei Testes de hipteses: H0: 1 = 0 HA: 1 0 Possibilidades: - teste bilateral H0: Y1-Y0 = 0 HA = Y1-Y0 0 - teste unilateral a direita HA = Y1-Y0 > 0 - teste unilateral a esquerda HA= Y1-Y0 < 0
Recomendaes Gerais
Teste Teste Teste T (para pequenas amostras) F SQR Z (distribuio normal padronizada)
Pr = nvel de significncia estatstica do teste Se o valor de qui-quadrado for prximo de zero no h associao linerar. Quanto maior o valor de qui-quadrado maior a correlao entre as variaes. Quanto maior o GL (grau de liberdade) maior a significncia do teste.
Recomendaes Gerais
O relevante e primrio determinar o problema. Depois verificar qual o mtodo mais adequado. Em microdados o R2 o ltimo parmetro a ser usado. As estatsticas amostrais convergem para as estatsticas populacionais. Toda estimativa viesada, porque toda estimativa por definio viesada para mais ou menos. O estimador no pode ser viesado. Logaritmo = transformao monotnica crescente, o log diminui a variabilidade, mantendo as caractersticas.
Recomendaes Gerais
A heterocedasticidade no causa vis no estimador, apenas diminui a sua fora. Assimetria numa normal = 0 Grau de curtose numa normal = 3 Log normal = tpica de mercado financeiro
Referncias
GUJARATI, D. N. Econometria Bsica. So Paulo: MAKRON Books, 2000. GREENE, W. H. Econometric Analysis. Prentice Hall, 5. edition. HOFFMAN, R. e VIEIRA, S. Anlise de Regresso: uma introduo econometria. So Paulo: Hucitec, 1983. KMENTA, J. Elementos de econometria. So Paulo: Atlas, 1988. SALVATORE, D. Estatstica e econometria. So Paulo: McGraw-Hill, 1983. WOOLDRIGDE, J. Introductory Econometrics: A Modern Approach. South-Western College Pub, 2. edition.
Introduo ao STATA
O STATA diferencia letras maisculas das minsculas. Use sempre letras minsculas quando digitar comandos, e recomendamos que voc tambm use letras minsculas para os nomes de suas variveis. O STATA aceita abreviaes para comandos e nomes de variveis, desde que estas abreviaes no sejam ambguas. Iniciando o STATA O programa STATA, iniciado clicando duas vezes no cone localizado no desktop do Windows.
Na segunda linha encontra-se a Barra de Ferramentas com os cones: (1) Open (use): Carrega ou abre um banco de dados no formato do STATA (dta). (2) Save: Salva um arquivo no formato do STATA (dta). (3) Print Results: Imprime a janela de resultados. (4) Begin Log: Carrega, abre ou cria um arquivo do tipo ".log" ou ".smcl". (5) Start Viewer: Exibe a tela de ajuda (Help) em primeiro plano.
Nota:
Tipos de Arquivos
O programa STATA, utiliza os arquivos: .dta .ado .dct .do .gph .log ou .smcl .out .raw .sum arquivos de dados (bancos de dados) arquivos programa "do-files arquivos ASCII , arquivo dicionrio do-file arquivos de comandos arquivos grficos arquivos textos com os resultados arquivos para impresso arquivos ASCII arquivos de dados arquivos controle de rede
Tipos de Variveis
(1) Variveis Numricas As variveis numricas assumem os formatos abaixo por definio byte int long float double %8.0g %8.0g %12.0g %9.0g %10.og (g = geral)
Os formatos podem ser alterados com o comando format Exemplo: variveis peso e altura nos formatos float ou byte gen imc = peso/(altura^2) decimais ) format imc %9.3f decimais fixas) (imc formato 9.0g 5 casas (imc formato 9.3f 3 casas
Tipos de Variveis
(2) Variveis Texto Armazena textos, tamanho mximo 80 caracteres, simbologia str1, str2, str3, ... , str80. Exemplos : sexo str1 sexo str9 ( 1 ou 2 ; f ou m ; F ou M ) ( feminino ou masculino)
Tipos de Variveis
(3) Variveis Data Armazena as datas como nmeros a partir de 01Jan1960. Exemplos: varivel dtn formato long %d gen xdtn = dtn (xdtn formato 9.0g numrico) format xdtn %d (xdtn formato %d dd/mmm/aa)
Expresses Lgicas
Expresses lgicas atribuem 1 (verdadeiro) ou 0 (falso) e utiliza os operadores:
Expresses Algbricas
Expresses algbricas utilizam os operadores:
Iniciando o Stata
Execute os seguintes comandos: set more off [esse comando utilizado para que todo os resultados sejam apresentado na janela de resultados] set matsize 200 [para definir o nmero mximo de variveis que podem ser includas em qualquer comando de estimao] set mem 500 [para aumentar a capacidade de memria para a realizao dos procedimentos que sero realizados] log using "C:\cursostata\arqlog\mod1.smcl [cria um arquivo log]
Variveis
Utilize o comando describe para investigar as variveis que compem o banco de dados.
Variveis
Utilize o comando codebook para descrever as variveis.
Variveis
O nome de uma varivel pode ser alterado. Por exemplo, podemos alterar o nome da varivel gen para sexo usado o comando: rename gen sexo ou simplesmente ren gen sexo
Variveis
O rtulo de uma varivel tambm pode ser alterado. Por exemplo, podemos alterar o rtulo da varivel id de nome para identificao. Para isso escreve o seguinte comando: label variable id identificao
O salvamento do banco pode ser realizado selecionando-se Save ou Save As na opo File.
Outra opo via linha de comando - para fechar o banco de dados e salvar as modificaes utilize: save, replace
Encerrando as Atividades
exit
Reiniciando as Atividades
Como dito, sempre aconselhvel abrir um arquivo log para armazenar todos os comandos e resultados da execuo destes. Se desejar armazenar num arquivo j existente, voc dever escolher uma das duas ltimas opes na janela Stata Log Options. A segunda opo nesta janela far com o contedo seja anexado no arquivo anterior, e a ltima far com que o novo contedo seja salvo sobre o contedo do arquivo anterior.
Reiniciando as Atividades
Reiniciando as Atividades
Reiniciando as Atividades
Com linha de comando: 1. set more off 2. set mem 500 3. set matsize 200 4. log using c:\cursostata\arqlog\mod1.smcl", append 5. use c:\cursostata\dados\dados1.dta", clear
Reiniciando as Atividades
O comando executado aparecer na janela Review e pode ser reutilizado e corrigido, se necessrio, posicionando-se o cursor sobre ele e pressionando-se Enter (para retornar na linha de comando para correo) e mais um Enter para ser executado; ou utilizando-se as teclas PgUp e PgDown.
Listando Variveis
Os comandos tm uma forma geral do tipo command varlist. Por exemplo, para listar as variveis [ id, idade, estciv, sexo ] do banco de dados dados1.dta execute o comando:
list
id
idade
estciv
sexo
Listando Variveis
Listando Variveis
Outros componentes podem ser adicionados. Por exemplo, if idade>=44 far com que sejam listados somente os registros em que os valores de idade so maiores ou iguais a 44 . As opes so includas aps o comando. As opes so includas aps o comando.
list
id
if
idade>=44
Listando Variveis
Criando Variveis
Por exemplo, podemos criar a varivel [ idoso ] com a idade igual ou maior que 50 anos.
gen idoso=idade>=50
Comando Sum
O comando sum utilizado para obter um sumrio dos dados da varivel. Exemplos: 1. sum idade
Comando Sum
Comando Tab
O comando tab utilizado para obter a distribuio de freqncia dos dados da varivel.
Exemplo:
tab idade
Comando Rename
Renomeando a varivel id para nome: Exemplo:
rename id nome
Tabulao Cruzada
Qual o percentual de indivduos que so homens e casados? Utilize: tab2 sexo estciv, cell tab2 sexo estciv, row tab2 sexo estciv, col
Estatsticas Condicionais
tabstat idade, by(estciv) columns(variables)
Gerando Grficos
graph7 idade
Gerando Grficos
graph bar idade idoso
Gerando Grficos
Para melhorar a apresentao visual do histograma, utilize o opo xlabel e ylabel. O nmero de retngulos do histograma pode ser modificado pela opo bin(x). Para sobrepor ao seu histograma uma curva normal com mdia e desvio padro, adicione a opo normal.
gr7 idade, hist xlabel ylabel bin(10) normal freq
Encerrando o Mdulo
save, replace exit
Na elaborao deste material, utilizei tambm algumas notas de aulas dos seguintes professores: - Prof. Srgio Ricardo de Gadelha Escola de Administrao Fazendria do Ministrio da Fazenda - Prof. Marcelo Justus dos Santos Universidade Estadual de Ponta Grossa - UEPG
Humor