Apostila - Econometria Espacial

_____________________________________________________________________________
CURSO
DE
ECONOMETRIA ESPACIAL
APLICADA

PROF. DR. EDUARDO SIMES DE ALMEIDA
ESALQ-USP

Piracicaba, 2004

Curso de Econometria Espacial Aplicada
_____________________________________________________________________________

SOBRE O AUTOR

O professor Eduardo Simes de Almeida economista, mestre e doutor em
Economia pela Faculdade de Economia e Administrao da Universidade de So Paulo
(FEA-USP). Conquistou o 21 Prmio BNDES de Economia, com a sua dissertao de
mestrado em 1997. O ttulo de sua tese de doutorado "Um Modelo de Equilbrio Geral
Aplicado Espacial para Planejamento e Anlise de Polticas de Transporte". Recebeu
recentemente o Prmio CNT de Produo Acadmica 2003 pelo artigo cientfico "Quanto
Custa o Descaso com as Nossas Estradas", extrado da sua tese de doutorado.

Foi pesquisador visitante, por meio de uma bolsa "sandwich" concedida pela CAPES,
no Regional Economics Applications Laboratory (REAL), da Universidade de Illinois (EUA)
em 2001-02. Na Universidade de Illinois, desenvolveu a sua tese de doutorado e realizou
estudos sobre Econometria Espacial. Foi aluno do Prof. Luc Anselin, da Universidade de
Illinois, assistindo aos cursos "Spatial Analysis" e "Spatial Econometrics".

Foi durante dez anos pesquisador cientfico da Fundao Instituto de Pesquisas
Econmicas (Fipe), desenvolvendo vrios projetos nas reas de transportes, logstica,
modelagem econmica, desenvolvimento regional e ndices econmicos. Auxiliou no
desenvolvimento do modelo economtrico espacial para projeo consistente de culturas
agropecurias (MEECA).

Publicou dezenas de artigos cientficos em revistas e apresentou diversos trabalhos
em congressos nacionais e internacionais na rea de modelos de equilbrio geral computvel,
econometria espacial e anlise espacial.

Copyright Eduardo Simes de Almeida 1
_____________________________________________________________________________
Tem uma larga experincia de docncia. Foi professor de Estatstica Econmica da
Universidade Mackenzie. Ministrou um minicurso Econometria Espacial Aplicada, na
disciplina "Economia Regional", do curso de Ps-graduao do Instituto de Pesquisas
Econmicas da Universidade de So Paulo em 2002. Foi Professor da disciplina Mtodos
Quantitativos e Anlise de Dados, do MBA - Gesto de Operaes, da Fundao Carlos
Alberto Vanzolini, da Escola Politcnica da Universidade de So Paulo, em 2003.

Atualmente, pesquisador e professor visitante no Departamento de Economia,
Adminstrao e Sociologia da Escola Superior de Agricultura Luiz de Queiroz, da
Universidade de So Paulo (ESALQ-USP), no campus em Piracicaba.

CONTATOS DO AUTOR

Endereo comercial:
Departamento de Economia, Administrao e Sociologia, da ESALQ-USP
Av. Pdua Dias, 11 Cx. Postal 9
CEP 13418-900
Piracicaba SP
Tel.: (019) 3417-8726
(011) 9932-6377
Fax.: (019) 3434-5186

E-mails: ealmeida@esalq.usp.br
edu_simoes@hotmail.com

_____________________________________________________________________________
CAPTULO 1
INTRODUO

preciso medir tudo o que mensurvel, e tornar mensurvel o que no ...
Galilei Galileu

1.1. Por que Estudar Econometria Espacial?
Suponha que um pesquisador esteja interessado em estimar uma funo de produo
agrcola agregada em nvel microrregional, ou seja, uma cross-section de microrregies. Como a
teoria da produo recomenda, ele pretende regredir a quantidade agrcola produzida contra
insumos, tais como a quantidade de trabalho, capital, terra utilizada etc. A sua primeira idia
adotar o modelo clssico de regresso linear.
Vamos comear especificando o modelo clssico de regresso linear:

+ = X y (1.1) ) , 0 ( ~ I N

em que y a varivel dependente com n linhas, X uma matriz de variveis explicativas com n
linhas e k colunas, um vetor com k coeficientes de regresso e um vector com n termos
aleatrios de erro, seguindo uma distribuio normal. Os pressupostos subjacentes para esse
modelo clssico so os seguintes:
a) Uma funo linear de um conjunto especfico de variveis independentes relevantes, com
coeficientes fixos;
b) Termos aleatrios de erro tm mdia zero;
c) Todos os termos de erro tm a mesma varincia e no so correlacionados entre si (em
outros termos, os termos de erro so esfricos);
d) As observaes sobre as variveis independents podem ser fixas em amostras repetidas;
e) A matriz X tem pleno posto.
O pesquisador pode se considerar muito sortudo se o fenmeno estudado comportar-se
conforme os pressupostos do modelo clssico de anlise de regresso linear. O mundo real
_____________________________________________________________________________
muito mais complexo, impondo desafios ao pesquisador que deseja compreend-lo e quantific-
lo. O desenvolvimento histrico da econometria explicado pela tentativa de superar as
violaes dos pressupostos do modelo clssico, tais como a multicolinearidade, a correlao de X
com o termo de erro , a heterocedasticidade etc.
Existem uma srie de livros em nvel de graduao ou ps-graduao que fornece as
diretrizes para resolver esses problemas. Contudo, uma classe de problemas relacionadas
dificuldade de estudar fenmenos que ocorrem no espao no contemplada por esses livros e
pela econometria convencional.
Vamos voltar necessidade de estimar a funo de produo agrcola. Agora considere
que o pesquisador verificou que a produo agrcola dependente da distribuio de recursos
naturais, tais como qualidade do solo, regime pluviomtrico, e cuja resposta aos insumos
trabalho, capital e terra no uniforme atravs dos municpios. Isso pode acarretar que os
coeficientes tenham estimativas diferentes para certos subconjuntos dos seus dados (para
algumas regies). Ou a varincia do erro no constante em todos os municpios. Ou, ainda, a
forma funcional, pressuposta ser linear, para alguns grupos de municpios vizinhos entre si pode
ser no-linear.
O que fazer?, pergunta o pesquisador.

Vamos mais adiante no azar do pesquisador e supor que existem interaes entre os
produtores agrcolas, fornecendo uma dinmica diferente. Vamos supor que exista um conjunto
de produtores que introduz uma inovao agrcola por exemplo, um novo sistema de irrigao
proposto por um rgo do governo como a Embrapa que ajuda a elevar a produtividade das
culturas beneficiadas. Os agricultores vizinhos observam esse efeito sobre a produo e
comeam a imitar essa inovao, difundindo-a. Os vizinhos desses agricultores vizinhos tambm
vem os resultados positivos e tambm imitam. Essa inovao na agricultura, que teve um
epicentro num municpio (ou num conjunto de municpios), comea a passar por um processo de
difuso, transcendendo as fronteiras de um municpio isolado. Essa interao pode acarretar que
o nvel de produo agrcola de um determinado municpio dependa dos nveis de produo de
seus municpios vizinhos.
Diante desse fato, o que fazer?, pergunta novamente o pesquisador.
_____________________________________________________________________________
Estudar econometria espacial urgentemente, respondo eu, pois desconsider-la, levar a
resultados viesados, inconsistente e/ou ineficientes. Isso porque os efeitos apresentados de forma
intuitiva nos pargrafos passados no esto sendo levados em considerao. Portanto, o prejuzo
para a anlise pode ser muito elevado. Chegamos, assim, ao ponto de apresentar um ramo
emergente da Econometria com inmeras aplicaes que fornecer as solues que voc est
procurando.

1.2. O que Econometria Espacial?
A econometria espacial difere da econometria convencional porque leva em considerao
os chamados efeitos espaciais na especificao, na estimao e no teste de hiptese e previso de
modelos, com dados do tipo cross-section ou com um painel de dados. Ao no reservar ateno a
esses efeitos espaciais, os resultados proporcionados pela anlise economtrica convencional
tornam-se invlidos.
1

A diferena entre a econometria espacial e a econometria tradicional concentra-se na
preocupao de se incorporar na modelagem o padro da interao scio-econmica entre os
agentes num sistema, assim como as caractersticas da estrutura desse sistema no espao. Essas
interaes e as caractersticas estruturais que podem ser instveis no espao geram efeitos
espaciais em vrios processos econmicos (Anselin, 2003; Anselin, 1988; Anselin e Bera, 1998).
No entanto, talvez uma diferena mais profunda possa ser delineada em termos de ponto
de partida metodolgico. Metodologicamente falando, a econometria convencional procura tratar
quantitativamente o comportamento do agente segundo um ponto de partida puramente
atomstico, sem se preocupar com o contexto espacial. Em contraste, a econometria espacial
busca tratar quantitativamente o comportamento do agente tanto do ponto de vista atomstico
(quais so os fatores exgenos independentes do espao que interferem em sua tomada de
decises) quanto da sua interao com outros agentes heterogneos ao longo do espao, este
igualmente heterogneo. Um modelo economtrico de regresso linear tradicional tem a
limitao de no ser capaz de controlar para esses efeitos espaciais.

1
De acordo com Anselin (2001b, p. 113), econometria espacial um subcampo da econometria que lida com as
complicaes causadas pela interao espacial (autocorrelao espacial) e pela estrutura espacial
(heterogeneidade espacial) em modelos de regresso para dados na forma de cross-section e painel de dados.
_____________________________________________________________________________
O primeiro efeito espacial diz respeito dependncia espacial dada pela interao dos
agentes no espao. De modo geral, todo processo que se d no espao est sujeito chamada Lei
de Tobler, tambm conhecida como a Primeira Lei da Geografia, cujo enunciado pode ser
estabelecido da seguinte forma: tudo depende de todo o restante, porm o que est mais
prximo depende mais. A Lei de Tobler destaca, com isso, o papel da proximidade para o
estabelecimento da interao espacial entre os fenmenos.
Note a particularidade da noo de proximidade nessa lei. Proximidade pressupe a
noo de distncia relativa entre as unidades espaciais (municpios, distritos, bairros, pases,
estados, microrregies etc.) e seus efeitos, discutidos acima. Todavia, vale ressaltar que o efeito
da distncia deve ser tomado de modo amplo, no apenas geogrfico, porm mais no sentido
dado por Isard, ou seja, a distncia relativa de renda, espao de poltica, correspondendo fora
da interao verificada pelas unidades espaciais.
A dependncia espacial significa, por sua vez, que o valor de uma varivel de interesse
numa certa regio i depende do valor dessa varivel nas regies vizinhas j. Generica e
formalmente, tal conceito pode ser expresso como:

) (
j i
y f y = e j i (1.2) n i , , 1 K =

Podemos representar a dependncia espacial, usando um esquema grfico simplificado
para capturar a intuio que est por trs da interao:

Figura 1.1: Representao Grfica da Interao Espacial

y
j
y
i

Nesse esquema, existe uma interao entre a varivel de interesse y da unidade espacial i
com a mesma varivel localizada na unidade espacial contgua a ela, denominada j.
Cabe aqui uma palavra de alerta. Dependncia espacial uma propriedade de funes de
densidade conjunta. Conseqentemente, difcil de se observar na prtica. Assim, procura-se
_____________________________________________________________________________
avaliar a dependncia espacial pelo momento dessa funo de densidade conjunta, ou seja, pela
autocorrelao espacial, que pode ser estimada e testada. Portanto, toda a anlise a respeito da
dependncia espacial ser feita por intermdio do conceito de autocorrelao espacial. Usaremos
os termos autocorrelao espacial e dependncia espacial como sinnimos.
possvel destacar algumas fontes de dependncia espacial, relacionadas a uma
variedade de processos de interao social. De acordo com Haining (1990, pp. 24-25), existem
basicamente quatro processos espaciais. O primeiro refere-se ao processo de difuso que se
caracteriza pela adoo de um atributo de interesse por parte dos elementos de uma populao
fixa. A qualquer momento, pode-se descobrir qual a proporo da populao que j adotou
determinado atributo. Nesse aspecto, a distribuio espacial da populao pode desempenhar um
relevante papel para o desenvolvimento do padro de difuso do atributo em estudo. Um
exemplo clssico a difuso tecnolgica.
O segundo processo espacial envolve a troca de mercadorias e a transferncia de renda
entre unidades espaciais. Segundo o autor, a renda auferida numa regio pode ser despendida em
outra. O efeito multiplicador regional da renda desempenha importante papel.
No terceiro processo, destacado o comportamento estratgico como uma caracterstica
fundamental, no sentido em que envolve a interao em que eventos em uma regio
influenciam e so influenciados por eventos em outras regies, envolvendo competio e/ou
cooperao. Por exemplo, a determinao de preos no varejo depende das condies de
mercado e da localizao dos vendedores, alm de suas aes e reaes.
O quarto processo trata da disperso ou do espraiamento de um atributo. Em contrate
com o processo de difuso, aqui a prpria populao que se dispersa. A natureza de tal
disperso gera dependncia espacial no atributo (ou atributos) estudado ao longo do processo. No
campo das cincias sociais, um bom exemplo seria a migrao populacional, ao passo que no
campo das cincias naturais seria a disperso de sementes.

_____________________________________________________________________________
O outro efeito refere-se heterogeneidade espacial. Fenmenos que ocorrem no espao
no apresentam estabilidade estrutural.
2
Em termos intuitivos, a heterogeneidade espacial
manifesta-se quando ocorre instabilidade estrutural no espao, fazendo com que haja diferentes
respostas, dependendo da localidade ou da escala espacial. Tal instabilidade pode ser detectada
na forma de coeficientes variveis, de varincia no constante ou, ainda, de formas funcionais
diferentes para determinados subconjuntos de dados. Nesse caso, a conseqncia prtica a
inadequao de se ajustar um mesmo modelo terico para todo o conjunto de dados.
Ao no trat-la convenientemente no modelo, paga-se um preo alto. O problema da
heterogeneidade pode provocar a instabilidade estrutural sobre os resultados da regresso,
causando a perda da eficincia. Em alguns casos, como veremos abaixo, possvel acarretar em
estimativas viesadas.
Como j dissemos, a econometria espacial um ramo emergente com diversas aplicaes
prticas em vrios campos do saber, tais como economia agrcola, finanas pblicas locais,
organizao industrial, economia regional e urbana, economia internacional, cincias ambientais
etc.

1.3. Desafios da Econometria Espacial
Como possvel de se perceber, desconsiderar os efeitos espaciais pode acarretar em
estimativas viesadas, inconsistentes e/ou ineficientes. Porm, ao incorporar os efeitos espaciais, a
tcnica economtrica, concomitantemente, sofistica-se e torna-se muito mais complexa.
Em contraste com as sries de tempo cuja direo da interao e a dependncia no tempo
ocorre unidirecionalmente, do passado para o presente e do presente para o futuro, a dependncia
no espao bidirecional, expressa pelo seguinte enunciado: sou vizinho do meu prprio
vizinho.
conveniente no se deixar influenciar pela singeleza do enunciado. Ele condensa uma
dificuldade inerente quando se tenta modelar processos espaciais com esse grau de

2
Segundo Boller et al. (2001, p. 566), heterogeneidade espacial refere-se situao em que coeficientes ou os
padres de erro variam sistematicamente atravs das reas geogrficas. De acordo com Le Sage,
heterogeneidade espacial refere-se variao em relaes atravs do espao.
_____________________________________________________________________________
interdependncia. S para que se possa enxergar a profundidade da interdependncia, observe
que o meu vizinho, alm de ser vizinho meu, tambm vizinho dos vizinhos dele que, por sua
vez, so meus vizinhos de segunda ordem, e assim por diante. Esse aspecto envolver a
simultaneidade da interao que complicar sobremaneira a estimao, como ser visto
posteriormente.
De modo prtico, diversas ferramentas, como, por exemplo, o correlograma, que so teis
em sries de tempo perdem seu sentido prtico. No se pode adotar o correlograma espacial a
no ser em situaes extremamente estilizadas e raramente verificadas no mundo real.
Outro aspecto intrigante que existem modelos espaciais no qual o termo de erro
aleatrio e bem comportado, ou como se costuma dizer, esfrico. E mesmo assim, por influncia
da interdependncia e a interao entre os vizinhos surgir heterocedasticidade junto da
dependncia espacial.
Intuitivamente, a fonte desse imbricamento pode ser encontrada na prpria motivao
metodolgica do campo da econometria espacial apresentada no incio de nossa exposio e aqui
relembrada: a econometria espacial busca tratar quantitativamente o comportamento do agente
tanto do ponto de vista atomstico (quais so os fatores exgenos independentes do espao que
interferem em sua tomada de decises) quanto da sua interao com outros agentes
heterogneos ao longo do espao, igualmente heterogneo. Note como as idias de dependncia
e a heterogeneidade convivem nesse enunciado.
Esse um dos maiores problemas neste ramo da econometria: o assim chamado
imbricamento da heterogeneidade espacial com a dependncia espacial, conduzindo a uma
extrema dificuldade na correta identificao dos modelos economtricos relevantes para o
fenmeno em estudo. Isso implicar uma srie de procedimentos para contornar tal dificuldade.
Um deles realizar uma anlise exploratria de dados espaciais para ter um
conhecimento mais preciso da natureza da estrutura e da interao do processo espacial. Um
exemplo claro disso que a especificao de modelos economtricos espaciais envolve
dificuldades em identificar o modelo apropriado. Por isso, de bom alvitre fazer uma anlise
exploratria de dados espaciais a fim de que se possa sugerir padres e prover indicaes para
auxiliar posteriormente na seleo do modelo mais apropriado.
_____________________________________________________________________________
O outro modo a realizao de testes para detectar esses efeitos espaciais, como ser
visto no captulo 6.

1.4. Um Pouco de Histria
Em termos quantitativos, o interesse e a preocupao a respeito da influncia do espao
em diversos fenmenos de longa data. Existem relatos indicando que, em 1914, Student j se
preocupava com a questo da influncia dos efeitos espaciais na estimao de modelos (Antonio,
1999).
Todavia, apenas no final dos anos quarenta, mais precisamente em 1948, com o trabalho
de Moran, introduziu-se o primeiro estimador formal da dependncia espacial, o chamado teste I,
permitindo que a estimao da fora da interao espacial pudesse ser realizada. O teste I de
Moran, como veremos no captulo quatro, do tipo de uma medida de correlao segundo um
certo critrio de associao de variveis.
Em 1954, a vez de Geary desenvolver um outro teste, chamado de teste C, para detectar
a dependncia espacial, tambm uma medida de correlao, usando um critrio distinto de
associao entre variveis.
Ainda em 1954, Whittle publica um artigo discutindo a particularidade de processo
estocstico no espao, enfocando a bidirecionalidade da interao. Alm disso, o autor prope o
modelo economtrico do erro auto-regressivo espacial, que ser visto no quarto captulo desta
apostila.
Em 1973, Cliff e Ord escreveram um livro, cuja segunda edio foi lanada em 1981, que
aprofundou a anlise dos processos espaciais numa abordagem eminentemente estatstica,
enfocando sobretudo a dependncia espacial. De qualquer forma, esse livro expandiu a
possibilidade de aplicao de um conjunto de tcnicas em vrios campos, inclusive na economia.
Outro marco no desenvolvimento desse ramo da econometria foi o livro de Jean Paelinck
e Klaassen em 1979, intitulado Spatial Econometrics. Alis, Paelinck considerado at hoje o
pai da Econometria Espacial, talvez muito pelo fato de ter cunhado o termo.
Segundo Florax e Vlist (2003, p. 225), a partir da a econometria foi alvo do estudo de
dois grupos de pesquisadores: de um lado, os holandeses cujos principais nomes so Bartels,
_____________________________________________________________________________
Brandsma, Hordjik, Ketellapper e Nijkamp; de outro, os britnicos, despontando nomes como
Fingleton, Haining, Ord e Upton.
Em 1988, Anselin publica o livro Spatial Econometrics: Models and Methods, que teve
o mrito de sistematizar uma srie de conceitos e terminologias nesse campo do saber, at ento
sem um amarramento e uma unidade. possvel afirmar que em algum momento dos anos
oitenta o grande centro de desenvolvimento da econometria espacial passou a ser os EUA, com
nomes como o prprio Anselin, Keilejian, Prucha e Cressie.
O grande desenvolvimento, no entanto, ocorreu mesmo nos anos noventa com a
confluncia de trs fatores que impulsionaram a econometria espacial. Em primeiro lugar, o
desenvolvimento da capacidade computacional que permitiu estimar modelos economtricos
espaciais, adotando metdos de estimao complexos. Em segundo lugar, a disponibilidade de
uma profuso de dados georeferenciados, em grande parte em decorrncia da revoluo do
computador, mais especificamente o surgimento de sistemas de informaes geogrficas na
forma de softwares. Vamos discutir isso na prxima seo.
O avano das tcnicas economtricas espaciais apresenta dois ramos distintos: o
paramtrico e Bayesiano. O ramo bayesiano foi desenvolvido principalmente por Alan Gelfand.
Outro nome de destaque Le Sage. Por esse material cobrir exclusivamente o ramo paramtrico
da econometria espacial, no dedicaremos ateno ao ramo Bayesiano.

1.5. A Natureza dos Dados Espaciais
No campo da econometria espacial, no so apenas os modelos que so diferentes, mas
tambm os dados so diferenciados. Para serem incorporados nos modelos, os dados precisam
ser espaciais.
Uma primeira questo de uma pessoa que esteja aprendendo econometria espacial saber
qual a diferena entre dados no-espaciais (ou a-espaciais) e dados espaciais. Dados a-espaciais
denotam a variao de algum fenmeno sem se preocupar com a determinao em saber onde
ocorre tal variao. Dados espaciais denotam a variao de algum fenmeno tendo a
preocupao em determinar onde ocorre tal variao. Portanto, dados espaciais apresentam dois
componentes. Um primeiro componente referente ao atributo do fenmeno em estudo; e um
_____________________________________________________________________________
outro, de natureza espacial, que fornece a referncia em termos da localizao geogrfica desse
atributo.
Nos ltimos quinze anos, o mundo vivenciou a emergncia de uma pletora de dados
espaciais, sobretudo de cunho scio-econmico. Anselin (1999, p. 6) menciona uma exploso da
disponibilidade de bases de dados scio-econmicos georeferenciados. Isso ocorreu devido ao
avano tecnolgico, especialmente vinculado informtica, tanto no que se refere ao hardware
quanto ao software, no que tange coleta de dados. Houve a chamada Revoluo do Sistemas
de Informao Georeferenciada (SIG), ou seja, o desenvolvimento de programas de computador
que permitiram a estocagem, organizao, descrio e anlise de dados espaciais ou
georeferenciados. O SIG disponibilizou uma grande quantidade de dados espaciais, levando a
necessidade do desenvolvimento de tcnicas tanto de anlise exploratria como de anlise
confirmatria de dados espaciais.
A coleta de dados beneficiou-se tambm do avano tecnolgico do sensoreamento
remoto e da rede de satlites em torno da terra que permitiram o desenvolvimento do Global
Positioning System (GPS), primeiro para fins militares, e posteriomente, para fins comerciais.
Essa pletora de dados georeferenciados contribui para a interpretao de que o campo da
econometria espacial guiada por essa disponibilidade de dados (data-driven). Em terceiro
lugar, o avano da teoria econmica, preocupada em estudar a interao entre os agentes num
contexto espacial em modelos como a Nova Geografia Econmica. A grande quantidade de
novos avanos da teoria econmica que pressupe a interao dos agentes no espao visto por
alguns como a responsvel pelo impulso das tcnicas economtricas espaciais, guiadas, assim,
pelos modelos tericos (model-driven).
Os dados geogrficos podem ser representados por trs tipos de objetos espaciais
Fotheringham et al. (2000, p. 17):
a) pontos;
b) linhas;
c) polgonos.

_____________________________________________________________________________
No mapa 1.1, esto representados os trs objetos espaciais na forma da rede ferroviria,
hidroviria e aeroporturia. Nesse mapa, os pontos denotam os aeroportos, enquanto as linhas
representam as ferrovias. J os polgonos, extremamente irregulares, simbolizam as hidrovias.

#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
# #
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
#
# Mg_aero_point.shp
Mg_hidro_region.shp
Mg_ferro_polyline.shp
200 0 200 400 Miles
N
E W
S
Mapa 1.1: Rede Ferroviria, Hidroviria e Aeroporturia de MG

1.6. Processo Estocstico Espacial
Convm destacar um aspecto curioso a respeito dos dados espaciais coletados. Os dados
espaciais so uma nica realizao de um processo estocstico do tipo espacial. Veja o mapa 1.2,
mostrando a rea colhida per capita para o Estado de Minas Gerais. Pode-se considerar que esse
mapa com dados espaciais uma realizao, dentre inmeras possveis, de um processo
estocstico espacial. Ou seja, o mapa com a rea colhida per capita para Minas Gerais a nica
_____________________________________________________________________________
amostra que se dispe de uma populao de mapas com a rea colhida per capita para Minas
Gerais que poderiam ter sido realizados.
Mapa 1.2: Distribuio da rea Colhida per Capita em Minas Gerais
rea Colhida per Capita
0.005 - 0.135
0.135 - 0.293
0.293 - 0.485
0.485 - 0.726
0.726 - 1.501
200 0 200 400 Miles
N
E W
S

O cerne da questo repousa na representatividade desse nico mapa. O que garante que
esse mapa representativo da populao de mapas que poderiam ter sido gerado? Perceba que
esse um problema parecido enfrentado tambm pela econometria de sries de tempo. Quais so
os pressupostos necessrios para se fazer a fim de poder considerar um nico mapa como
representativo de toda uma populao de mapas? Por essa caracterstica prpria do mecanismo
estocstico gerador de dados espaciais, isso coloca um problema de como fazer inferncia
estatstica.
A soluo encontra-se em considerar que o mecanismo estocstico gerador de dados
opera com uniformidade atravs do espao. Como a discusso envolver, portanto, mecanismos
geradores de dados que esto vinculados a processos estocsticos, vale a pena definir esse ltimo
conceito.
_____________________________________________________________________________
Um processo estocstico uma seqncia de variveis aleatrias ordenadas de acordo
com um critrio. possvel definir formalmente processo estocstico espacial da seguinte forma
(Cressie, 1993; Anselin, 1988):

{ D i y
i
: } (1.3)

em que y uma varivel de interesse associada varivel-ndice i que designa uma unidade
espacial, ou seja, uma locao no espao pertencente a um subconjunto fixo e finito D que, por
sua vez, pertence a .
d
Para contornar esse problema e poder fazer inferncia estatstica, preciso impor certas
condies de estabilidade aos dados do mapa, restringindo o grau de dependncia e
heterogeneidade do processo estocstico espacial. Em outros termos, necessrio estabelecer a
noo de estacionariedade. A importncia disso repousa no fato de que, ao impor essa noo,
possvel considerar, no caso em tela, como se houvesse mltiplos mapas com a rea colhida per
capita para Minas Gerais. Na ausncia da estacionariedade, o nico mapa (a nica realizao do
processo estocstico espacial) seria considerado uma amostra no representativa da populao,
tornando invlida a anlise confirmatria implementada a posteriori.
A noo de estacionariedade permite expressar essas condies de regularidade em
termos do primeiro e segundo momentos da distribuio de probabilidades. Ela envolve a
imposio das seguintes restries variao dos dados extrados de um processo estocstico
espacial.
a) mdia constante: E(y
i
)=;
b) varincia constante: Var(y
i
)=
y
2

c) covarincia: Cov(y
i
, y
j
)=
y
2
c().

Convm tecer alguns comentrios a respeito da noo de estacionariedade, condensada
nos trs itens acima. As duas primeiras condies so triviais e semelhantes a que se admite em
sries de tempo para se obter estacionariedade.
_____________________________________________________________________________
O aspecto interessante reside na terceira condio, que trata da covarincia. A funo
geral c() refere-se posio relativa, determinada pela distncia entre as unidades espaciais,
bem como da sua orientao relativa (angulao). O problema que, ao se levar em conta a
orientao, para uma mesma distncia separadora de duas unidades espaciais, a covarincia pode
assumir vrios valores. A soluo implica impor a noo de isotropia. Incorporando a isotropia a
ltima condio pode ser reescrita como:

c) covarincia como funo apenas da distncia relativa de duas regies Cov(y
i
, y
j
)=
y
2
c(d
ij
).

Note que agora, na definio da covarincia, aparece a funo c(.) que relaciona as
distncias das regies i e j, respectivamente d
ij
. Tal noo de estacionariedade implica um
processo isotrpico, ou seja, a funo c(.) somente depende da distncia entre as regies e no da
direo de separao das duas regies. Para entender melhor esse conceito de isotropia,
considere a figura 2 abaixo.

Figura 2: O Conceito da Isotropia

C

100 Km
A B

D
100 Km

Por exemplo, admitindo a propriedade da isotropia, se duas cidades, digamos A e B, esto
distantes (d
AB
) entre si por 100 quilmetros no Sul na direo leste-oeste e se houver duas
cidades, digamos C e D, cuja distncia que as separa (d
CD
) tambm de 100 quilmetros na
_____________________________________________________________________________
direo norte-sul, a covarincia deveria ser igual (ver figura 1.2). Nesse caso, o nico elemento
que importa a distncia entre as unidades espaciais, no sendo importante a orientao relativa.
Essa a propriedade da isotropia. Para processos isotrpicos, a funo de covarincia depende da
distncia e no da direo, isto , a orientao relativa entre as unidades espaciais irrelevante.

1.7. Problemas Especiais com os Dados Espaciais
A inferncia a partir de dados espaciais pode ser enganosa e induzir ao erro, se no forem
tomados os cuidados necessrios. Para introduzir esses problemas com os dados espaciais,
vamos supor que um pesquisador esteja interessado em estimar uma funo de produo Cobb-
Douglas para o Brasil para diferentes escalas espaciais, a saber, em nvel estadual,
macrorregional, microrregional ou municipal:

y
i
= A.K
i
.L
i
(1-)
(1.3)

em que y o nvel de produo, K o estoque de capital, L a quantidade de trabalho, A o
parmetro de eficincia e a participao do capital na produo. O ndice i denota o nvel de
escala espacial.
provvel que as participaes do capital () e trabalho (1-) sejam diferentes para cada
nvel de escala espacial. Ou seja, se forem usados dados municipais (uma escala) as
participaes de e (1 - ) sero distintas das participaes se os dados em nvel microrregional
(outra escala) e assim por diante.
Esse o problema de escala. Trata-se do problema mais bvio e que exibe a maior
aplicao prtica. A denominao do primeiro problema concernente escala espacial e
refere-se sensibilidade dos resultados devido a diferentes nveis de escala. Isto , os resultados
modificam medida que o nmero de unidades espaciais (escala) se eleva num determinado
agrupamento.

_____________________________________________________________________________
Figura 3: O Problema de Escala

n=9

n=36

O segundo problema uma sofisticao do primeiro: mesmo mantendo constante a escala
espacial, existem diversas formas de agreg-las em zonas, ou seja, h vrias maneiras de fazer
combinaes das unidades espaciais contguas. Tais combinaes so chamadas de zoneamento.
O problema do zoneamento ou agregao refere-se sensibilidade dos resultados obtidos em
funo das vrias alternativas de combinaes, dada uma mesma escala.

Figura 4: O Problema de Agregao (ou Zoneamento)

Esses dois problemas compem o que conhecido na literatura como problema da
unidade areal (espacial) modificvel, doravante denominado MAUP.
3


3
Do ingls, modifiable areal unit problem (MAUP).
_____________________________________________________________________________
Uma observao deve ser registrada quanto estranheza do conceito de unidade areal
modificvel. Ele existe em contraposio a unidades areais no-modificveis, que seriam
indivisveis. Segundo Openshaw, tal unidade areal indivisvel, muitas vezes, arbitrria, em
outras, pode ser determinada com base numa teoria subjacente. O que vale destacar que, na
maioria dos casos, tal unidade areal no-modificvel no pode ser identificada com preciso.
Portanto, o MAUP manifesta-se na situao em que os resultados da anlise so sensveis
forma que os dados espaciais so organizados, sobretudo com relao ao nvel da escala
espacial e com respeito ao arranjo (configurao) espacial em zonas (combinao de unidades
espaciais contguas).
O problema do MAUP manifesta-se tanto na anlise univariada quanto multivariada
(Fotheringham e Wong, 1991). No contexto multivariado, o MAUP cria incerteza sobre a
validade dos resultados derivados da anlise economtrica. Alm disso, o MAUP estreita a
possibilidade de replicao de um modelo a uma outra regio de estudo, se a agregao e o
zoneamento forem distintos daqueles da aplicao inicial.
De acordo com Anselin (1988, pp. 26-27), a metodologia economtrica espacial pode dar
um tratamento apropriado aos problemas do zoneamento e de escala, uma vez que cada um deles
corresponde a um dos efeitos espaciais.
O MAUP est relacionado a um problema economtrico da agregao que se refere ao
efeito da heterogeneidade espacial. Suponha agora o contrrio que o espao fosse absolutamente
homogneo. Nesse caso, qualquer combinao (arranjo) de unidades espaciais forneceria os
mesmos resultados. Ou seja, a homogeneidade espacial implica as mesmas respostas em
qualquer parte do espao, logo, sendo vlida essa condio, o problema da agregao (ou
zoneamento) no afloraria.
J o problema da escala vincula-se ao efeito da dependncia espacial. Como vimos
acima, uma das fontes da dependncia so os erros de medida relacionados escala. Alm disso,
esse ramo da econometria enfrenta um grave problema de identificao da estrutura da
dependncia espacial. Nesse ltimo, assoma a importncia da matriz W.
Segundo Openshaw e Taylor (1979), o problema de escala (ou seja, a variao da
correlao de unidades espaciais espacialmente agrupadas) est relacionado com a
_____________________________________________________________________________
autocorrelao espacial. Por isso, o efeito de escala no aparece em dados espacialmente
aleatrios.

1.8. Organizao dos Captulos
Alm deste captulo de cunho introdutrio, esta apostila est assim organizada. No
prximo captulo, apresentada a matriz de pesos espaciais que fornece um arranjo espacial
definido para que a interao dos agentes ocorra. No terceito captulo, a anlise exploratria de
dados espaciais (AEDE) desenvolvida com o intuito de comear a contornar o problema do
imbricamento da dependncia com a heterogeneidade espacial na etapa de identificao dos
modelos. O quarto captulo discorre sobre a tipologia de modelos economtricos que levam em
considerao a autocorrelao espacial. O quinto captulo trata da estimao da autocorrelao
espacial na modelagem economtrica. O sexto captulo apresenta um conjunto de testes tanto
para a identificao quanto para o diagnstico dos modelos. No stimo captulo, so expostos e
discutidos os modelos que incorporam o outro efeito espacial, a saber, a hetorogeneidade
espacial. No oitavo e ltimo captulo, desenvolve-se uma aplicao agricultura.

_____________________________________________________________________________
CAPTULO 2
MATRIZES DE PESOS ESPACIAIS

2.1. Introduo
Vimos no primeiro captulo que a dependncia ou a autocorrelao espacial significa que
o valor de uma varivel de interesse numa certa regio i depende do valor dessa varivel nas
regies vizinhas j. Isso pode ser expresso pela seguinte equao, medindo a covarincia dessas
variveis em regies distintas:

0 ) ( ) ( ) ( ) , ( =
j i j i j i
y E y E y y E y y Cov e i (2.1) n i , , 1 K = j

Como a covarincia de (2.1) diferente de zero, existe uma dependncia que se d no
espao. Representar a dependncia espacial dessa forma correto, porm, no se mostra
operacionalizvel na prtica.
Considerando que existam n regies em nossa anlise, haver n*(n-1)/2 interaes entre
essas regies. Esse um nmero grande de interaes para que o pesquisador possa levar em
conta, pois so muitos parmetros a serem estimados (um para cada interao). Por exemplo,
usando uma cross-section com os municpios brasileiros, posto que o seu tamanho da amostra
ser de aproximadamente n=5.500, haver 15.122.250 interaes!
Assim, para resolver esse problema, preciso impor um arranjo para a ocorrncia das
interaes espaciais entre as regies a fim de se tornar operacionalizvel e implementvel na
prtica. Havendo tal arranjo, o objetivo reduzir a quantidade de parmetros a serem estimados.
Na verdade, o que se deseja ter de estimar um parmetro que d a idia do grau de interao.
Com tal intuito, especifica-se uma matriz de pesos espaciais que procura condensar um
determinado arranjo espacial das interaes resultantes do fenmeno a ser estudado. Note que a
determinao de tal arranjo no precisa seguir uma abordagem apenas geogrfica, podendo ser
determinada segundo uma abordagem scio-econmica. Vamos ver mais detalhadamente abaixo
como se constri tal matriz.
_____________________________________________________________________________
O conceito de matriz de pesos espaciais baseado na contiguidade, que, por sua vez,
pode ser definida de acordo com a vizinhana, a distncia tanto geogrfica quanto scio-
econmica, bem como uma combinao disso.
1

Vrios resultados em econometria espacial so sensveis escolha da matriz de pesos
espaciais. Portanto, a discusso a respeito da tipologia das matrizes uma questo importante e
espinhosa na literatura.

2.2. Tipologia de Matrizes

2.2.1. Binria
A matriz binria de pesos espaciais pode ser construda segundo a idia da contiguidade,
cuja definio que duas regies so vizinhas, caso elas partilhem de uma fronteira fsica
comum. Com base nesse conceito de contiguidade, atribudo um valor unitrio na matriz a duas
regies vizinhas; caso contrrio, atribue-se um valor nulo.
Talvez a forma mais simples para definir uma matriz de pesos espaciais seja uma matriz
binria de vizinhana: se duas regies so vizinhas, ou seja, partilham de uma fronteira, atribue-
se o valor unitrio; caso contrrio, atribue-se o valor nulo. Formalmente:

1 se i e j so contguos
w
ij
= (2.2)
0 se i e j no so contguos

Por conveno, w
ii
=0, ou seja, nenhuma regio i pode ser vizinha dela mesma. Por que
convencionalmente os termos da diagonal principal da matriz W so nulos? Em resposta a isso,
alude-se facilidade computacional: uma vez que se calcula freqentemente o trao da matriz de
pesos espaciais, e como o trao definido como a somatria dos elementos da diagonal principal
da matriz, se esses forem nulos, o trao assumir, conseqentemente, o valor nulo tambm,
facilitando uma srie de contas.

1
Em vista disso, matriz de pesos espaciais e matriz de contiguidade so sinnimos.
_____________________________________________________________________________
Apesar da aparente simplicidade desse conceito, escondem-se vrias possibilidades para
definir vizinhana, conforme distintas convenes de contiguidade.
O problema reside em como se define o conceito de fronteira geogrfica por intermdio
da observao de um mapa. O mapa uma mera representao abstrata da real configurao
geogrfica. Por isso, contm erros de medida. Levando em conta esses erros de medida, e em
aluso ao movimento de peas num tabuleiro de xadrez, a conveno de contiguidade dita ser
rainha (queen), caso, alm das fronteiras com extenso diferente de zero, puderem ser
considerados os vrtices (ns), na visualizao de um mapa, como contguos. Caso apenas as
fronteiras fsicas com extenso diferente de zero entre as regies sejam levadas em conta, a
conveno de contiguidade considerada como torre (rook).
2
Essas duas convenes so as mais
utilizadas na literatura. As diferentes convenes para a matriz binria de pesos espaciais so
mostradas na figura 2.1 abaixo.

Figura 2.1: Conveno Rainha de Contiguidade

A


2
Na situao em que apenas os vrtices so considerados como vizinhos, a conveno chamada de bispo (bishop).
_____________________________________________________________________________
Figura 2.2: Conveno Torre de Contiguidade

B

A tabela abaixo mostra a matriz binria de pesos espaciais do Brasil segundo a conveno
rainha:

Tabela 2.1: Matriz Binria de Pesos Espaciais para as Regies Brasileiras (Conveno
Rainha)

N NE CO SE S
N 0 1 1 0 0
NE 1 0 1 1 0
CO 1 1 0 1 0
SE 0 1 1 0 1
S 0 0 0 1 0

A desvantagem da matriz binria de pesos espaciais reside no fato de que no garantida
uma conectividade balanceada, uma vez que haja regies com grande rea com muitos vizinhos,
ao passo que existiro regies com pouca rea e com poucos vizinhos.
Para superar esse problema, adota-se a matriz dos k vizinhos mais prximos. Trata-se de
uma matriz binria de contiguidade cuja conveno de vizinhana baseada na distncia
geogrfica. Formalmente:

_____________________________________________________________________________

1 se d d
ij
w
ij
= (2.3)
0 se d d >
ij

em que d um valor de distncia crtico.
A vantagem dessa conveno combater o desbalanceamento da conectividade de uma
matriz, pois todas as unidades espaciais tero o mesmo nmero de vizinhos cada uma.

Uma vantagem comum a todas matrizes de pesos espaciais do tipo binrio a
possibilidade de definir vizinhanas de ordens superiores. Uma matriz de vizinhana de primeira
ordem composta dos vizinhos das unidades espaciais. Uma matriz de vizinhana de segunda
ordem composta dos vizinhos dos vizinhos das unidades espaciais (os vizinhos de segunda
ordem) e assim por diante.
Para entender o conceito de vizinho de segunda ordem, considere a matriz binria de
pesos espaciais conforme a conveno rainha dos estados do Brasil. Os vizinhos de primeira
ordem do estado de So Paulo so Minas Gerais, Rio de Janeiro, Paran e Mato Grosso do Sul.
Os vizinhos de segunda ordem do estado de So Paulo so Santa Catarina (vizinho do Paran),
Bahia (vizinho de Minas Gerais), Esprito Santo (vizinho do Rio de Janeiro e Minas Gerais) e
Gois (vizinho de Minas Gerais).
A importncia de se definir matrizes de pesos espaciais de ordens superiores repousa em
capturar processos espaciais que apresentam interaes que se amortecem com o seu
alastramento.
Outro conceito de suma importncia a matriz de pesos espaciais padronizada pela linha.
A padronizao da matriz de pesos espaciais pode ser formulada em termos formais como:

=
j
ij
ij s
ij
w
w
w (2.4)

_____________________________________________________________________________
=
j
s
ij
w 1 (2.5)

A padronizao da matriz de pesos espaciais torna a matriz assimtrica, porm, sua
relevncia reside basicamente dar a interpretao de mdia dos valores da varivel nos vizinhos
para a defasagem espacial. A interpretao de mdia dos valores vizinhos a chave para se
definir posteriormente o conceito de defasagem espacial tanto para a varivel de interesse (y
i
)
quanto para as variveis explicativas (X) e o termo de erro (u).

Tabela 2.2.: Matriz Binria Padronizada de Pesos Espaciais para as Regies
Brasileiras
N NE CO SE S
N 0,000 0,500 0,500 0,000 0,000
NE 0,333 0,000 0,333 0,333 0,000
CO 0,333 0,333 0,000 0,333 0,000
SE 0,000 0,333 0,333 0,000 0,333
S 0,000 0,000 0,000 1,000 0,000

2.2.2. Distncia Inversa
Um outro tipo de matriz geogrfica aquela baseada na distncia inversa. A idia
intuitiva que se encontra por trs pode ser estabelecida como o seguinte: quanto mais distante
duas regies estiverem, menor ser a interao entre elas. Genrica e formalmente:

) (
ij ij
d f w = (2.6)

Os pesos espaciais so uma funo da distncia entre as regies i e j. Vale destacar que a
funo f pode assumir vrias especificaes, tais como:

_____________________________________________________________________________
a) funo de distncia inversa:

b
ij ij
d w

= (2.7)

b) funo de distncia exponencial:

) exp(
ij ij
bd w = (2.8)

c) funo distncia linear:

ij ij
bd w = (2.9)

Um problema com esse tipo de matriz que o parmetro b , muitas vezes, determinado
arbitrariamente. Todavia, o principal problema com a conveno da distncia surge quando d
ij

aproxima-se de zero, w
ij
torna-se muito grande, aproximando-se do infinito.
Uma alternativa estim-los junto do modelo. Todavia, isso impe uma dificuldade
representada pelo problema de identificao quando os pesos so no-lineares como na funo
de distncia inversa e na distncia exponencial. Como na especificao dos modelos os
parmetros espaciais multiplicam os pesos, os parmetros podem no ser identificados
separadamente, pois a sua interao multiplicativa.

2.2.3. Matriz de Pesos Espaciais Gerais de Cliff e Ord
Intuitivamente, razovel supor que regies que compartilham maior extenso de
fronteira entre si tenham uma interao maior. Do mesmo modo, quanto mais prximas duas
regies se encontram, maior a interao entre si. Essas duas foras geogrficas indutoras de
interao esto condensadas na matriz de pesos espaciais gerais de Cliff e Ord (1981).
_____________________________________________________________________________
Os pesos espaciais gerais ou pesos Cliff-Ord consistem no comprimento relativo da
fronteira comum, ajustado pela distncia inversa entre as duas observaes. Formalmente, os
pesos Cliff-Ord podem ser expressos como:

ij
ij
ij
d
b
w = (2.10)

em que b
ij
a parcela da fronteira comum entre as observaes i e j no permetro de i, e e so
parmetros. Convm notar que b
ij
no necessariamente igual a b
ji
, como pode ser observado na
figura abaixo:

Figura 2.3: Representao dos Pesos Espaciais Gerais

b

R

S

Claramente, temos que b
RS
< b
SR
. Isto , a proporo da fronteira comum entre as
unidades espaciais A e B com relao ao permetro de A (b
RS
) menor que a proporo dessa
fronteira comum no permetro de B (b
SR
). Isso obviamente acarreta que a matriz W com os
pesos Cliff-Ord no simtrica. Se no forem vizinhos, tem-se que b
ij
=0 e, portanto, w
ij
=0.
Uma desvantagem dessa matriz que necessrio obter valores para dois parmetros a e
b, e no apenas um. Ademais, os valores desses parmetros so, freqentemente, determinados
arbitrariamente. Se forem estimados, o problema da identificao, discutido acima, retorna.

_____________________________________________________________________________
2.2.4. Matriz de Distncia Scio-Econmica
Nesse outro tipo de matriz, os pesos espaciais so definidos conforme a interao baseada
na distncia scio-econmica. Formalmente:

j i
ij
y y
w
=
1
(2.11)

Usa-se o mdulo da diferena a fim de garantir que os pesos no sejam negativos.
Podem-se citar alguns exemplos de interao espacial baseada na distncia scio-
econmica, tais como a renda per capita, taxa de desemprego, a proporo de pobres, a
proporo de brancos na populao.
Apesar do grande apelo de se considerar como medida da fora da interao algum
critrio que no seja a distncia geogrfica, preciso ter pleno conhecimento dos problemas que
podem surgir desta abordagem.
Em primeiro lugar, importante evitar o problema da endogeneidade, isto , a situao
em que a mesma varivel que define a distncia scio-econmica na matriz de pesos espaciais
seja inserida no modelo economtrico. Anselin destaca o problema com a endogeneidade,
sobretudo com a distncia scio-econmica, que ocorre quando o pesquisador pe na definio
da distncia a mesma varivel que est sendo introduzida no modelo da regresso. preciso
garantir que a matriz de pesos espaciais seja exgena.
Outro problema a distncia zero, quando y
i
= y
j
. Por exemplo, se o critrio de distncia
for a proporo de pobres, pode ocorrer que tanto a regio i quanto a regio j tenha a mesma
proporo de pobres. Logo, nesta casela, temos 1/0, que no definido matematicamente.

2.3. Propriedades das Matrizes de Pesos Espaciais
Qualquer matriz de pesos espaciais precisa atender s condies de regularidade impostas
pela necessidade de invocar as propriedades assintticas dos estimadores e dos testes. Segundo
Anselin (1997, p. 244), isso significa que os pesos precisam ser no-negativos e finitos e que
correspondam a uma determinada mtrica.
_____________________________________________________________________________
Por exemplo, os trabalhos pioneiros de Moran e Geary na elaborao de estatsticas de
dependncia espacial baseavam-se em matrizes binrias de vizinhana que, alm de exibirem as
propriedades acima, so simtricas.
Um outro aspecto a se considerar durante a construo de uma matriz de pesos espaciais
a respeito do problema das ilhas. Nesse caso, ilhas so as regies que ficam isoladas, ou
seja, que no so contguas a nenhuma outra. Na matriz, essa situao representada por alguma
linha que contenha apenas zeros. Isso mais freqente ocorrer com matrizes binrias de
vizinhana de acordo com as convenes rainha e torre. A conseqncia da existncia de ilhas na
base de dados a perda de graus de liberdade, pois essas regies isoladas (ilhas) so
eliminadas na estimao e no teste de modelos economtricos espaciais.

2.4. Que matriz de pesos espaciais usar?
A sugesto da escolha da matriz a ser usada deve vir, em primeiro lugar, das
caractersticas do fenmeno em estudo. Segundo a matriz precisa atender s propriedades
apresentadas na seo anterior.
Mesmo assim, possvel que o pesquisador fica na dvida entre duas ou mais matrizes
espaciais. Nesse sentido, a seguir apresentado um procedimento simples para auxiliar na
definio da matriz de pesos espaciais baseado no valor da funo de mxima verossimilhana.
O procedimento compreende quatro passos simples:

1
o
passo: mesma especificao do modelo;
2
o
passo: usar um conjunto de matrizes de pesos espaciais;
3
o
passo: estimar as regresses;
4
o
passo: selecionar a matriz de pesos espaciais que participou da regresso com o mais alto
valor da funo de mxima verossimilhana.

_____________________________________________________________________________
De qualquer modo, s vezes, til estimar os modelos economtricos usando mais de uma
matriz de pesos espaciais e comparar os resultados, a fim de detectar discrepncias significativas
nos resultados.

2.5. Defasagem Espacial
No tocante ao operador de defasagem espacial, valido traar uma comparao com o
conceito de defasagem temporal, encontrado na literatura de sries de tempo. Autocorrelao em
sries de tempo significa correlao entre o valor de uma varivel no perodo t e o perodo t-h,
em que h a defasagem temporal. Por exemplo, em sries de tempo, se y
2003
o PIB em 2003,
B
2
y
2003
o PIB dois perodos para trs, ou seja, o PIB em 2001.
No domnio do espao, o significado do operador de defasagem muito diferente. Isso
acontece porque no se tem uma clara definio, sem incorrer em ambiguidades, do operador de
defasagem espacial que desloca h regies no espao a varivel de interesse na anlise (digamos,
y). Na verdade, o significado do operador de defasagem espacial de uma varivel y, formalmente
Wy, a mdia do valor dessa varivel nas regies vizinhas. Para ver isso, vamos computar a
defasagem espacial do PIB macro-regional (Wy).

4 , 636
0 , 138
0 , 277
5 , 254
3 , 110
5 , 193
4 , 636
5 , 76
1 , 144
6 , 50
000 , 0 000 , 1 000 , 0 000 , 0 000 , 0
333 , 0 000 , 0 333 , 0 333 , 0 000 , 0
000 , 0 333 , 0 000 , 0 333 , 0 333 , 0
000 , 0 333 , 0 333 , 0 000 , 0 333 , 0
000 , 0 000 , 0 500 , 0 500 , 0 000 , 0
(2.12)

A primeira matriz diz respeito matriz padronizada de pesos espaciais W da tabela 2.2. O
vetor refere-se ao PIB das regies Norte, Nordeste, Centro-Oeste, Sudeste e Sul. O ltimo vetor
apresenta a defasagem espacial do PIB macrorregional, isto , o PIB mdio das regies vizinhas.
A utilidade desse conceito para definir defasagens tanto na varivel dependente (Wy),
quanto na varivel independente (WX) e defasagem no termo de erro (Wu). A interpretao
sempre continua sendo a mdia nos vizinhos.
_____________________________________________________________________________
O conceito de operador de defasagem espacial no to simples e direto como o
operador de defasagem em sries de tempo devido natureza bidirecional do processo de
interao no espao.

2.6. Concluses
A necessidade de se construir uma matriz de pesos espaciais surge a fim de pr uma
configurao na interao espacial. Existem vrios tipos de matrizes baseadas na contiguidade
geogrfica, tais como as matrizes binrias de vizinhana nas convenes rainha, torre e k
vizinhos mais prximos ou nas matrizes de distncia inversa.
As matrizes de pesos espaciais tambm podem ser construdas com base no conceito de
contiguidade scio-econmica. Com relao a esse tipo de matriz, preciso cuidado a respeito
do problema de endogeneidade e da distncia zero.
A escolha da matriz mais adequada deve respeitar certas propriedades desejveis e certas
particularidades do estudo em questo. Um procedimento simples apresentado neste captulo
pode auxiliar na seleo da matriz mais apropriada.

_____________________________________________________________________________
CAPTULO 3
ANLISE EXPLORATRIA DE DADOS ESPACIAIS

3.1. Introduo
Como j vimos no primeiro captulo, a interao no espao tem uma natureza
bidimensional, gerando efeitos espaciais que violam o vital pressuposto de que os erros so
esfricos. Alm do mais, desde que a heterocedasticidade resistente a vrios procedimentos
para corrigi-la, muito provvel que as suas fontes venham da intricada relao com a
dependncia espacial. Conforme destacado por Anselin e Bera (1998), em processos espaciais,
existe um imbricamento entre esses dois efeitos: heterogeneidade gera dependncia espacial e,
por sua vez, dependncia espacial pode tambm induzir heterogeneidade.
Essas caractersticas provocam srias dificuldades para identificar modelos
economtricos espaciais de forma apropriada. Em conseqncia, o trabalho de identificao pode
consumir muito tempo, transformando-se em tedioso, ou pior ainda, pode conduzir a modelos
inadequados.
Em vista disso, uma anlise exploratria de dados espaciais (AEDE) pode auxiliar a
superar tal problema de identificao, provendo claras dicas e indicaes sobre a existncia de
padres de associao espacial tanto em mbito global quanto local ou sobre a presena de
clusters nos dados, ou, ainda, sobre a influncia de observaes discrepantes (outliers). Assim,
fazer uma anlise exploratria precede uma boa modelagem economtrica espacial.
A AEDE uma coleo de tcnicas para a anlise estatstica de informao geogrfica,
com o intuito de descobrir padres espaciais nos dados e para sugerir hipteses, mas impondo a
menor estrutura possvel. A AEDE procura descrever distribuies espaciais, identificar
observaes discrepantes no espao, descobrir padres de associao espacial e sugerir clusters
espaciais. Assim, o objetivo primordial deixar os dados espaciais falarem por eles prprios.
Um ponto a se destacar que essa anlise mais apropriada para investigar variveis
espacialmente densas ou intensivas variveis que so divididas por algum indicador de
intensidade. Encontram-se na literatura diversas maneiras de definir um indicador de intensidade.
As formas mais comuns seriam variveis per capita, ou por rea, ou variveis divididas pela
_____________________________________________________________________________
quantidade de trabalho ou de capital. possvel achar ainda variveis divididas por uma
combinao linear de populao, rea, trabalho e capital (Preudhomme, 1996). A sua
importncia reside no fato de que essas variveis estariam levando em conta externalidade
relevantes na considerao do fenmeno em anlise, tais como efeitos de aglomerao, efeitos de
vizinhana e/ou congesto. O uso de AEDE para variveis extensivas pode levar a resultados
enganosos.

3.2. Associao Espacial Global Univariada
O primeiro passo num estudo de AEDE testar a hiptese de que os dados espaciais so
distribudos aleatoriamente. Intuitivamente, aleatoriedade espacial significa que os valores de um
atributo numa regio no dependem dos valores desse atributo nas regies vizinhas.
Mapa 3.1: Distribuio da rea Colhida per Capita em Minas Gerais
rea Colhida per Capita
0.005 - 0.135
0.135 - 0.293
0.293 - 0.485
0.485 - 0.726
0.726 - 1.501
200 0 200 400 Miles
N
E W
S

_____________________________________________________________________________
Observando o mapa 3.1 acima, um pesquisador poderia estar tentado em tirar concluses
sobre a existncia de padres de associao no espao com base apenas na visualizao. Cabe
alertar que o olho humano treinado para buscar padres e estruturas em todos os aspectos da
realidade. Portanto, o olho acaba sendo um instrumento viesado e, por isso, talvez no seja um
bom conselheiro nessas horas de se extrair informao dos dados espaciais. Para isso,
necessrio usar alguma estatstica que mea a associao espacial de forma global.
Existe um conjunto de estatsticas na literatura que averiguam por meio de testes formais
a presena de autocorrelao espacial, ou seja, a existncia de coincidncia de similaridade de
valores de um atributo com a similaridade de localizao desse atributo. Como se trata de
estatsticas de teste, essas medidas apresentam como hiptese nula a aleatoriedade espacial, ou
seja, os valores observados da varivel de interesse (atributo) y no dependem da sua localizao.
Em outros termos, y parece que distribuda aleatoriamente ao longo do espao.

3.2.1. Estatstica I de Moran
O coeficiente de correlao espacial I de Moran foi proposto pioneiramente em 1948.
Formalmente, essa estatstica dada por:

2
) (
) )( (
y y
y y y y w
w
n
I
i
j i ij
ij

= (3.1)

em que n o nmero de unidades espaciais, y
i
a varivel de interesse, w
ij
o peso espacial para
o par de unidades espaciais i e j , medindo o grau de interao entre elas.
A estatstica de I de Moran um coeficiente de associao linear do tipo produto cruzado,
padronizado por dois termos (Odland, 1988, p. 10). O primeiro termo refere-se varincia dos
dados de interesse [(y
i
- y )
2
], ao passo que o segundo fornece a idia da configurao espacial
dos dados n/w
ij
. Note ainda que somatria dupla significa que todos os elementos da matriz de
pesos espaciais W devem ser somados, denotando a densidade dessa matriz. Assim, a estatstica I
de Moran baseada nas somas de produtos cruzados de y
i
para regies vizinhas, segundo um
critrio de vizinhana dado pela matriz de pesos espaciais W.
_____________________________________________________________________________
A estatstica I de Moran tem um valor esperado de [1/(n-1)], isto , o valor que seria
obtido se no houvesse padro espacial nos dados. O valor calculado de I deveria ser igual a seu
valor esperado, dentro dos limites da significncia estatstica, se y
i
independente dos valores de
y
i
nas regies vizinhas. Valores de I que excedem [1/(n-1)] indicam autocorrelao espacial
positiva. Valores de I abaixo do valor esperado sinalizam uma autocorrelao negativa.
Note que, ao contrrio de um coeficiente de correlao ordinrio, essa estatstica no
centrada em zero. medida que o nmero de regies aumenta, o valor esperado da estatstica I
de Moran aproxima-se de zero. Como um coeficiente de correlao ordinrio, tal estatstica varia
entre 1 e +1. Dessa forma, a estatstica I assemelha-se a um coeficiente de correlao, porm,
no idntico a ele.
Uma vez que se trata de uma estatstica de correlao linear do tipo produto cruzado, h a
necessidade de se ter cuidado na sua interpretao. Uma indicao de autocorrelao espacial
positiva revela que h uma similaridade entre os valores do atributo estudado (por exemplo, rea
colhida per capita) e da localizao espacial do atributo (por exemplo, microrregio). Ou seja, a
autocorrelao espacial positiva indica que, no geral, alta rea colhida per capita de uma
microrregio tende a ser rodeada por rea colhida per capita tambm alta das microrregies
vizinhas e/ou uma pequena rea colhida per capita de uma microrregio tende a ser rodeada por
rea colhida per capita tambm baixa das microrregies vizinhas.
Uma indicao de autocorrelao espacial negativa revela, por sua vez, que existe uma
dissimilaridade entre os valores do atributo estudado e da localizao espacial do atributo. A
autocorrelao espacial negativa indica que, por exemplo, no geral, uma elevada rea colhida per
capita de uma microrregio tende a ser rodeada por pequena rea colhida per capita das
microrregies vizinhas e/ou uma baixa rea colhida per capita de uma microrregio tende a ser
rodeada por alta rea colhida per capita das microrregies vizinhas. O caso extremo de
autocorrelao negativa igual unidade (I = -1) pode ser representado por uma configurao de
tabuleiro de xadrez.
Existem duas estratgias de verificar a significncia estatstica deste teste por intermdio
da computao do desvio padro de I. O pressuposto da normalidade assume que a varivel
_____________________________________________________________________________
padronizada, z(I), tem uma distribuio amostral que segue uma distribuio normal com mdia
0 e varincia unitria.
Uma segunda interpretao, conhecida como o pressuposto da aleatorizao, assume que
o mecanismo estocstico gerador dos dados aleatrio e o padro dos dados observados
simplesmente um de muitas possveis realocaes das n observaes em n locaes. A inferncia
com base no pressuposto da aleatorizao envolve as seguintes etapas. Primeiramente, os valores
observados para uma varivel so aleatoriamente realocados (embaralhados) para as diversas
regies. Em segundo lugar, a estatstica do teste calculada para uma dessas realocaes
(embaralhamentos). Conseqentemente, obtm-se uma distribuio de referncia emprica a
partir dos clculos da estatstica para as realocaes. Finalmente, possvel comparar a
estatstica do teste computada com os dados observados com a distribuio de referncia
emprica e verificar se est dentro ou fora de uma regio crtica especificada pelo pesquisador.
A distribuio de I assintoticamente normal sob qualquer dos pressupostos acima
citados (Fortheringham et al., 2000; Levine, 1999).
guisa de exemplo, vamos calcular a estatstica I de Moran para a rea colhida per capita
em Minas Gerais. De posse das evidncias estatsticas exibidas pela tabela 1, possvel rejeitar a
hiptese de ausncia de autocorrelao espacial num nvel de significncia de 0,001%. Esses
resultados so invariantes com respeito conveno de contiguidade usada na construo das
matrizes de pesos espaciais (rainha ou torre). Alm disso, como o valor computado (0,36)
maior que o valor esperado (-0,015) a estatstica I fornece clara indicao de que a rea colhida
per capita autocorrelacionada no espao atravs das microrregies mineiras.
Pelo valor computado de I, h evidncias de autocorrelao espacial positiva, ou seja,
microrregies com rea colhida per capita acima da mdia so tambm adjacentes a
microrregies com elevada rea colhida per capita; ou microrregies com rea colhida per capita
abaixo da mdia so vizinhas de microrregies com reduzida rea colhida per capita.

_____________________________________________________________________________
Tabela 3.1: Estatstica I de Moran para rea Colhida per Capita em Minas Gerais
Nota: a pseudo-significncia emprica baseada em 999 permutaes aleatrias.
Conveno I Probabilidade I Probabilidade I Probabilidade
Rainha 0,359 0,000 0,359 0,000 0,359 0,001
Torre 0,361 0,000 0,361 0,000 0,361 0,001
Normalidade Aleatorizao Permutao

Por fim, a frmula de clculo da estatstica I de Moran para autocorrelao espacial
semelhante formula da estatstica de Durbin-Watson para detectar autocorrelao temporal.
1

Conseqentemente, conclui-se que a estatstica I uma medida para capturar principalmente a
autocorrelao espacial de primeira ordem.

3.2.2. Estatstica c de Geary
Uma outra medida global de autocorrelao espacial foi proposta por Geary em 1954.
construda conforme uma diferente medida de covarincia, a saber, a soma de diferenas ao
quadrado entre pares dos valores do atributo em estudo. Mais uma vez, o pressuposto subjacente
a aleatoriedade espacial, isto , a ausncia de dependncia espacial nos dados. A frmula dessa
estatstica dada por:

2
2
) (
) (
2
1
y y
y y w
w
n
c
i
j i ij
ij
= (3.2)

Note que tambm tal medida assume uma forma de qualquer coeficiente de
autocorrelao: o numerador uma medida de covarincia entre y
i
, ao passo que o denominador
uma medida de varincia.
Posto que essa estatstica assume uma medida diferente de covarincia, a sua
interpretao muito distinta do coeficiente I de Moran. O valor de c de Geary situa-se entre 0 e
2, ao passo que o seu valor esperado (terico) 1. Valores menores que o seu valor esperado de

1
Para ver formalmente essa semelhana entre as duas frmulas, consulte Anselin (1988) e Anselin e Bera (1998).
_____________________________________________________________________________
1 (i.e., entre 0 e 1) indicam autocorrelao espacial positiva, enquanto que valores maiores que 1
(i.e., entre 1 e 2) indicam autocorrelao espacial negativa.
Calculamos a estatstica c para a varivel rea colhida per capita para as microrregies de
Minas Gerais. A tabela 3.2 apresenta os resultados.
medida que n eleva-se, a estatstica c distribuda assintoticamente de acordo com uma
normal. Analogamente medida de I de Moran, a significncia estatstica do c de Geary pode ser
avaliada conforme os pressupostos da normalidade, aleatorizao e permutao, j explicados
acima.

Tabela 3.2: Estatstica c de Geary para rea Colhida per Capita em Minas Gerais

Nota: a pseudo-significncia emprica baseada em 999 permutaes aleatrias.
Conveno c Probabilidade c Probabilidade c Probabilidade
Rainha 0,566 0,000 0,566 0,000 0,566 0,001
Torre 0,569 0,000 0,569 0,000 0,569 0,001
Normal Aleatorizao Permutao

O valor de c de Geary para rea colhida per capita 0,57, altamente significante do ponto
de vista estatstico, tanto pela conveno rainha quanto torre. Como a estatstica c menor que o
valor esperado de 1, isso sugere evidncias de que a rea colhida per capita esteja positivamente
autocorrelacionada no espao. Esse resultado refora a evidncia de autocorrelao espacial
encontrada por meio da estatstica I de Moran.

3.3. Associao Espacial Global Multivariada
Poderamos estar interessados em saber se a rea colhida per capita numa microrregio
mineira est associada disponibilidade de infraestrutura rodoviria nas microrregies vizinhas.
A existncia de boas estradas pode facilitar o envio de insumos e as possibilidades de
escoamento da produo, incentivando, assim, o crescimento da rea colhida per capita. Na
verdade, estamos interessados na verificao da existncia de um padro de associao espacial
global entre duas variveis. Para fazer isso, precisamos avanar a anlise para incluir a
associao espacial global multivariada.
_____________________________________________________________________________
A autocorrelao espacial global pode ser averiguada num contexto multivariado
(Anselin et al. 2003). A idia intuitiva descobrir se os valores de uma varivel observada numa
dada regio guarda uma relao sistemtica com os valores de uma outra varivel observada em
regies vizinhas. Em termos formais, possvel calcular-se a estatstica I de Moran para duas
variveis diferentes:

k k
l k
kl
z z
Wz z
I
'
'
= (3.3)

Como z
k
e z
l
so variveis padronizadas,
2
a soma dos quadrados tanto de z
k
quanto de z
l

iguala-se a n:

n
Wz z
I
l k
kl
'
= (3.4)

Essa medida identifica o grau de associao sistemtica de uma varivel padronizada z
k

com uma outra (diferente) varivel padronizada vizinha z
l
.
Essa estatstica tem dois componentes distintos. Como se trata da verso multivariada da
estatstica I de Moran, o numerador refere-se a uma medida de associao linear do tipo produto-
cruzado. O denominador diz respeito a um reescalonamento por dividir tal medida pela soma dos
quadrados da primeira varivel, que se iguala ao tamanho da amostra n.
A interpretao intuitiva para o I de Moran multivariado positivo a seguinte: as
microrregies que apresentam uma rea colhida per capita alta tendem a estar rodeadas por
microrregies vizinhas com elevada densidade de infraestrutura rodoviria, bem como
microrregies com pequena rea colhida per capita so circunvizinhas de microrregies com
baixa densidade rodoviria. Analogamente, um I multivariado negativo significa que
microrregies com elevada rea colhida per capita so circundadas por microrregies com baixa

2
Logo, temos que:
k k k
y y z / ) ( = .
_____________________________________________________________________________
densidade rodoviria, ao passo que microrregies com reduzida rea colhida so vizinhas de
microrregies com boa infraestrutura de estradas.
Vamos exemplificar I de Moran multivariado, usando as variveis densidade rodoviria
pavimentada (z
k
) e rea colhida per capita (z
l
) em Minas Gerais em nvel microrregional.
Veremos se existe relao entre a densidade rodoviria pavimentada e a rea colhida per capita
taxa de crime nas microrregies vizinhas.
3
A tabela exibe os resultados do clculo da estatstica.

Tabela 3.3: Estatstica I Multivariada para Densidade Rodoviria e rea Colhida per
Capita
Estatstica I E(I) Desvio-padro Probabilidade
0,1804 -0,0154 0,0607 0,008

Os resultados da inferncia indicam que existe uma pequena associao linear espacial
positiva (0,18) entre a densidade rodoviria pavimentada e a rea colhida per capita em nvel
microrregional, porm altamente significante do ponto de vista estatstico.

3.4. Associao Espacial Local Univariada
A indicao de padres globais de associao espacial pode estar tambm em
consonncia com padres locais, embora no seja necessariamente o caso que prevalece. Na
verdade, existem dois casos distintos. O primeiro caso acontece quando uma indicao de
ausncia de autocorrelao global oculta padres de associao local. O caso oposto ocorre
quando uma forte indicao de autocorrelao global pode camuflar padres locais de associao
(clusters ou outliers espaciais). Conseqentemente, as estatsticas de autocorrelao global no
tm capacidade de identificar a ocorrncia de autocorrelao local, estatisticamente significantes
(Anselin, 1995, p. 97). Vamos ver como alguns autores propuseram solues para equacionar tal
problema.

3
Os resultados desse exemplo foram obtidos usando o programa GeoDa.
_____________________________________________________________________________
3.4.1. I de Moran local
A fim de superar esse obstculo, um novo indicador foi sugerido na literatura por Anselin
(1995), com a capacidade de capturar padres locais de associao linear, estatisticamente
significantes. Segundo Anselin (1995), o indicador de I de Moran local faz uma decomposio
do indicador global de autocorrelao na contribuio local de cada observao em quatro
categorias, cada uma individualmente correspondendo a um quadrante no diagrama de disperso
de Moran.
A interpretao intuitiva que o I local prov uma indicao do grau de agrupamento dos
valores similares em torno de uma determinada observao, identificando clusters espaciais,
estatisticamente significantes.
De acordo com Anselin (1995), a estatstica I local de Moran para uma observao i pode
ser estabelecida como:

( ) ( )
( )

=
i
i
j
j ij i
i
n y y
y y w y y
I
/
2
(3.5)

ou

=
j
j ij i i
z w z I (3.6)

em que z
i
e z
j
so variveis padronizadas e a somatria sobre j tal que somente os valores dos
vizinhos jJi so includos. O conjunto Ji abrange os vizinhos da observao i.
Sob o pressuposto da aleatorizao, o valor esperado da estatstica I
i
dado por:

) 1 ( ] [
.
= n w I E
i i
(3.7)

em que w
i
a soma dos elementos da linha. A varincia dada por:

_____________________________________________________________________________
( ) V w I Var
i i
2
.
= (3.8)

em que V a varincia de I sob o pressuposto da aleatorizao (Fotheringham et al., 2000, p.
102).

3.5. Associao Espacial Local Multivariada
Assim como se pde obter uma estatstica de autocorrelao espacial global num
contexto multivariado, tambm possvel conseguir uma medida de autocorrelao espacial
local multivariada. Vamos readaptar a frmula do I de Moran local como:

=
j
i
l ij
i
k
i
kl
z w z I (3.9)

Essa estatstica d uma indicao do grau de associao linear (positiva ou negativa)
entre o valor para uma varivel em uma dada locao i e a mdia de uma outra varivel nas
locaes vizinhas (Anselin et al., 2003, p. 7).

3.6. Anlise de Clusters Espaciais
Uma abordagem alternativa para visualizar diagramaticamente a associao espacial
baseada no diagrama de disperso de Moran, que mostra a defasagem espacial da varivel de
interesse (ou seja, a mdia do atributo nos vizinhos) no eixo vertical e o valor da varivel de
interesse no eixo horizontal. Convm observar que tanto a varivel de interesse (y) quanto a sua
defasagem espacial (Wy) so padronizadas quando apresentadas no diagrama.
Assim sendo, a estatstica I de Moran pode ser interpretada como o coeficiente angular da
regresso da defasagem espacial (Wy) contra a varivel de interesse (y):

_____________________________________________________________________________
y y
Wy y
b
'
'
= (3.10)

Se o coeficiente angular positivo, h evidncias de que a autocorrelao espacial
positiva. Se o coeficiente angular for negativo, existem evidncias de que a autocorrelao
espacial negativa.
Construmos o diagrama de disperso de Moran para a rea colhida per capita em Minas
Gerais, conforme pode ser apreciado na figura 3.1. Note que o coeficiente angular positivo,
como era esperado, luz das evidncias obtidas na seo anterior.
Contudo, alm da medida global de associao linear espacial, esse diagrama fornece
muitas outras informaes interessantes, tais como agrupamentos (clusters) representando quatro
tipos de associao linear espacial, a saber, Alto-Alto (AA), Baixo-Baixo (BB), Alto-Baixo (AB)
e Baixo-Alto (BA).
Um agrupamento Alto-Alto (AA) significa que as unidades espaciais pertencentes a esse
agrupamento exibem valores altos da varivel de interesse rodeados por unidades espaciais que
apresentam valores tambm altos, representado pelo primeiro quadrante do diagrama.
Um agrupamento Baixo-Baixo (BB) refere-se a um agrupamento cujas unidades espaciais
mostram valores baixos circundados por unidades espaciais que ostentam valores tambm
baixos, representado pelo terceiro quadrante.
Um agrupamento Alto-Baixo (AB) diz respeito a um cluster no qual uma unidade
espacial qualquer com um alto valor da varivel de interesse circunvizinha de unidades
espaciais com um baixo valor. Isso representado pelo quarto quadrante.
Um agrupamente Baixo-Alto (BA) concerne a um cluster no qual uma unidade espacial
qualquer com um baixo valor da varivel de interesse circundada por unidades espaciais com
alto valor. Isso representado no segundo quadrante.

_____________________________________________________________________________
Figure 3.1: Diagrama de Disperso de Moran para rea Colhida per Capita em MG

interessante mapear os resultados apresentados no diagrama de disperso de Moran.
D-se o nome de mapa de disperso de Moran. Construmos esse mapa para os dados de rea
colhida per capita em Minas Gerais (ver mapa 3.2 abaixo).

_____________________________________________________________________________
Mapa 3.2: Mapa de Disperso de Moran para rea Colhida per Capita
Tipo de Associao
Alto-Alto
Baixo-Baixo
Alto-Baixo
Baixo-Alto
N
E W
S

possvel tambm construir um diagrama de disperso de Moran multivariado,
colocando no eixo das ordenadas a rea colhida per capita dos vizinhos e no eixo das abscissas a
densidade rodoviria per capita, conforme o mapa abaixo. O diagrama de disperso de Moran
multivariado plota, no eixo das abcissas, os valores de uma varivel, observados numa
determinada regio, com o valor mdio de uma outra varivel, observado nas regies vizinhas,
no eixo das ordenadas.
Note que a inclinao da reta do diagrama de disperso de moran multivariado pode ser
interpretado como o coeficiente da regresso linear de Wy contra X, estimado por minimos
quadrados ordinrios:

X X
Wy X
b
'
'
= (3.11)

_____________________________________________________________________________

Figura 3.2: Diagrama de Disperso de Moran Multivariado para Densidade Rodoviria e
rea Colhida per Capita em Minas Gerais

O problema com o diagrama e o mapa de disperso de Moran que eles exibem clusters
tanto estatsticamente significantes quanto no. No h sentido levar em conta na anlise clusters
que no sejam estatisticamente significantes.
Como j vimos, podemos avaliar a associao linear espacial localizada pelo I de Moran
local, que pode ser avaliado sua significncia estatstica. Para cada observao computada um
I
i
. Assim, temos n I
i
e seus nveis de significncia. Tamanha quantidade de informao pode
confundir o pesquisador, se colocada em tabelas. Uma forma mais eficiente de apresentar esse
conjunto de estatsticas mape-las. O mapa de significncia 3.3 exibe as unidades espaciais
com estatsticas I local de Moran significantes para rea colhida per capita em Minas Gerais.

_____________________________________________________________________________

Mapa 3.3: Mapa de Significncia para a rea Colhida per Capita
Nveis de Significncia
no significante
p = 0.05
p = 0.01
N
E W
S

Adaptando a mesma idia, pode-se mapear a medida , estatisticamente significantes,
gerando o chamado mapa de significncia do Moran local (Anselin, 2003). Construmos esse
mapa para a densidade rodoviria e rea colhida per capita abaixo.
i
kl
I

_____________________________________________________________________________
Mapa 3.4: Mapa de Significncia Bivariada para Densidade Rodoviria e rea Colhida per
Capita

No mapa 3.4, a colorao verde escuro representa o nvel de significncia de 1%,
enquanto que a colorao verde claro denota o nvel de significncia de 5%.
O mapa de clusters combina a informao do mapa de disperso de Moran e a
informao do mapa de significncia das medidas de associao local I
i
. Ele ilustra a
classificao em quatro categorias de associao espacial que so estatisticamente significantes.
O mapa 3.5 apresenta os clusters que passaram no teste de significncia estatstica do I de Moran
local.

_____________________________________________________________________________
Mapa 3.5: Mapa de Clusters para rea Colhida per Capita
Clusters
No significante
Alto-Alto
Baixo-Baixo
Alto-Baixo
N
E W
S

Note que existem dois principais clusters a respeito de rea colhida per capita em Minas
Gerais. O primeiro envolve oito microrregies localizadas no Tringulo ou no Noroeste (Arax,
Uberlndia, Uberaba, Paracatu, Passos, Patos de Minas, Patrocnio e Pium-), representando uma
regio caracterizada por uma agricultura moderna de grande propriedade, cujo destino so os
mercados externos. Era esperado que haja um agrupamento (cluster) do tipo Alto-Alto (AA) com
relao rea colhida nesta parte de Minas Gerais.
O outro agrupamento composto por seis microrregies (Belo Horizonte, Conceio do
Mato Dentro, Guanhes, Ipatinga, Itabira e Sete Lagoas) numa das partes mais urbanizadas do
Estado de Minas Gerais, onde a rea agricultvel muito reduzida. O destaque agrcola desta
parte a produo de alimentos (sobretudo, produtos hortifrutigranjeiros) para serem
consumidos pelos grandes centros urbanos e industriais que dominam o espao. Em
_____________________________________________________________________________
conseqencia, esperado que surgisse um cluster do tipo Baixo-Baixo (BB) para a rea colhida
nesta parte.
Itaguara est assinalada como um cluster Alto-Baixo (AB), pois apresenta uma elevada
rea colhida per capita vizinha do cluster anterior BB. Todavia, rigorosamente no possvel
consider-la uma agrupamento.

Mapa 3.6: Mapa de Clusters Multivariado para rea Colhida per Capita e Densidade
Rodoviria

No mapa 3.6, as coloraes definindo os clusters AA, BB, AB ou BA so as mesmas que
as utilizadas no mapa 3.5.

_____________________________________________________________________________
3.7. Deteco de Outliers Espaciais
Outliers so observaes que no seguem o mesmo processo de dependncia espacial
como a maioria dos dados. importante identificar outliers que exercem uma influncia espria
sobre a medida global de autocorrelao espacial.
Em dados espaciais, existem outliers de duas naturezas: outlier global e outlier espacial.
O outlier global pode ser definido como sendo um uma observao que foge muito do restante
das outras observaes tanto para cima (superior) quanto para baixo (inferior). Ele pode ser
identificado por meio de tcnicas conhecidas tais como box plot.
O box map uma ferramenta para detectar outliers globais superiores. Para ser
considerado um outlier global superior, uma observao precisa cair acima da fronteira superior
do intervalo interquartlico do box plot por um montante que , no mnimo 1,5 vezes o valor do
intervalo interquartlico.
Mapa 3.5: Box Map da rea Colhida per Capita
Quartis
1o quartil
2o quartil
3o quartil
4o quartil
outliers superiores
N
E W
S

_____________________________________________________________________________

Um procedimento que permite identificar outliers de forma ampla foi proposto por
Almeida et al. (2004), usando o diagrama de disperso de Moran adaptado. De fato, como vimos,
o diagrama de disperso de Moran capaz de identificar quatro tipos de associaes espaciais, a
saber, AA, BB, AB e BA, dependendo do quadrante. Um outlier espacial definido como aquele
apresentando uma associao espacial extrema.
Outliers espaciais so determinados em termos de suas observaes vizinhas. Um outlier
AA uma observao cujo valor extremamente alto (maior que dois desvios-padres) em
comparao com os valores vizinhos que so altos tambm.
Um outlier BB uma observao cujo valor extremamente baixo com referncia a seus
valores vizinhos, que so tambm baixos. Um outlier AB uma observao cujo valor
extremamente alta com respeito a seus vizinhos, que so baixos. Finalmente, um outlier BA
uma observao cujo valor extremamente baixo com relao s observaes vizinhas, que so
altas.
As questes fundamentais so as seguintes: quo alto necessrio que um outlier seja a
fim de possa detectado? E como os outliers detectados influenciam a medida global de
autocorrelao espacial I de Moran?
Para detectar um outlier necessrio usar o diagrama de disperso de Moran adaptado. A
natureza da adaptao reside em desenhar linhas representando 2 desvios-padres nos quatro
quadrantes. Qualquer observao que cai fora da linha de dois desvios-padres horizontal e
vertical identificada como um outlier. O seu tipo ser determinada pela localizao do
quadrante em que ele se encontra. No primeiro quadrante, os outliers detectados so do tipo AA;
no segundo quadrante, os outliers identificados so do tipo BA; no terceiro quadrante, os outliers
so classificados como sendo BB; e finalmente, no quarto quadrante, os outliers detectados so
do tipo BA.
Na figura 3.3, ilustrado a deteco de um outlier do tipo AA, pois ele encontra-se no
primeiro quadrante.

_____________________________________________________________________________

LH HH
LL HL

A estatstica I de Moran sensvel a esse outlier detectado? A fim de avaliar o grau de
sensibilidade, calculamos uma nova estatstica I de Moran, excluindo o outlier detectado.
Fazendo isso, o nova linha de regresso empurrada para baixo um pouco, gerando um novo
valor de I (0,2960), indicando ainda uma autocorrelao espacial positiva, corrigida agora para a
presena de outliers. Neste particular caso, a concluso que o outlier AA detectado no to grave
que acabe exercendo uma influncia na computao da medida global de autocorrelao
espacial, deturpando-a.

3.8. Concluses
No campo da econometria espacial, freqentemente encontra-se uma dificuldade de
identificao de modelos mais apropriados. A anlise exploratria de dados espaciais (AEDE)
pode ser um instrumental relevante a fim de contornar tal dificuldade.
A fim de se evitar concluses enganosas, aconselhvel que se faa AEDE para variveis
intensivas e no para variveis extensivas. Algumas variveis intensivas podem ser construdas
dividindo a varivel de interesse pela rea ou pela populao.
_____________________________________________________________________________
A primeira tarefa descobrir se os dados so aleatoriamente distribudos atravs do
espao, isto , se eles esto autocorrelacionados espacialmente. Para isso adota-se algumas
estatsticas globais de associao linear espacial, entre elas, o I de Moran e o C de Geary.
No entanto, no devemos confiar apenas em estatsticas globais, pois elas podem
camuflar padres locais de associao espacial linear. Para detectar tais padres locais, usa-se
estatsticas LISA, sendo que a principal o I local. Se os resultados estatisticamente significantes
forem mapeados, obtm-se o mapa de LISA.
Quanto tendncia dos dados se agruparem no espao, o diagrama de disperso de
Moran pode identificar quatro padres de associao linear: alto-alto, baixo-baixo, alto-baixo e
baixo-alto. O problema com essa ferramenta que ela no verifica o nvel de significncia desses
clusters.
O mapa de clusters fornece os agrupamentos de dados na forma de associaes alto-alto,
baixo-baixo, alto-baixo, baixo-alto estatisticamente significantes. O mapa de clusters resultante
da combinao da informao de dois outros mapas: o mapa de disperso de Moran e o mapa
LISA. Esse instrumental pode ser usado para uma anlise tanto num contexto univariado quanto
multivariado.
Os outliers espaciais podem causar efeitos daninhos sobre os resultados da autocorrelao
espacial. Os outliers espaciais so de quatro tipos: AA, BB, AB e BA e funcionam como
variveis influentes no cmputo da estatstica I de Moran. Essa estatstica identificada como
sendo o coeficiente angular da regresso de Wy contra y. Com o uso do diagrama de disperso de
Moran adaptado, possvel identificar se existem outliers espaciais e qual a sua influncia sobre
o valor da estatstica I.

_____________________________________________________________________________
CAPTULO 4
MODELANDO A AUTOCORRELAO ESPACIAL

4.1. Introduo
O modelo economtrico espacial que deve ser estimado depende dos aspectos que
envolvem o processo espacial subjacente ao fenmeno em estudo. Para compreender isso, vamos
voltar ao nosso exemplo da funo de produo agrcola em nvel microrregional para Minas
Gerais. Caso haja difuso de uma nova tcnica de cultivo, isso corresponde a um determinado
modelo. Se existir um espraiamento de longo alcance de uma populao de pragas para a qual
no permitido medir, corresponde a um outro modelo e assim por diante.
De qualquer modo, os componentes espaciais que sero incorporados no modelo a fim de
capturar esses aspectos do processo consubstanciam em termos de defasagem espacial como Wy,
WX e Wu. Isoladamente ou em conjunto num mesmo modelo, so esses componentes que daro
conta de representar o processo espacial subjacente. A ordem da matriz W inserida no modelo
pode representar caractersticas particulares do processo espacial em estudo.
Por propsitos didticos, comearemos nossa exposio pelo modelo que representa o
processo a-espacial, ou seja, em que no se leva em conta a influncia do espao em nenhuma de
suas dimenses.
Vamos considerar o modelo clssico de anlise de regresso linear, portanto, um processo
a-espacial, por excelncia. Formalmente:

+ = X y (4.1)

Esquematicamente, poderamos representar esse processo a-espacial como:

_____________________________________________________________________________
X
i
X
j

i

j

y
j
y
i

Neste esquema, as unidades espaciais vizinhas i e j so denotadas por apenas dois
retngulos contguos. Note que, nesta representao esquemtica, no existe interao alguma
entre as unidades espaciais.
O modelo economtrico espacial envolve a incorporao de componentes espaciais. Os
componentes relacionados aos processos espaciais aludidos acima podem tomar a forma de
defasagens na varivel dependente (Wy), defasagens nas variveis independentes (WX) e/ou
defasagen no termo de erro (Wu).

4.2. Modelos Economtricos Espaciais
vlido ainda ressaltar que a apresentao dos modelos dar um destaque ao alcance
global ou local da autocorrelao espacial, bem como a associao intrincada entre tal
autocorrelao e a heterocedasticidade.

4.2.1. Modelo de Defasagem Espacial
Vamos supor que uma inovao tecnolgica (por exemplo, uma nova tcnica de cultivo)
que afeta a produo agrcola esteja se difundindo atravs do espao por meio da imitao. Os
agricultores que no adotavam a inovao vem seus vizinhos adotarem e obterem bons
resultados, estimulando-os a imitarem. Nesse sentido, o desempenho da produo agrcola dos
vizinhos influencia a produo agrcola de um certo fazendeiro. preciso incluir no modelo um
termo para capturar tal efeito de vizinhana contido na imitao de uma inovao.

_____________________________________________________________________________
Este modelo pode ser expresso na sua verso pura do seguinte modo:

+ = Wy y (4.2)

Se incluirmos o conjunto de variveis explicativas exgenas X em (2), temos:

+ + = X Wy y (4.3)

em que y um vetor N por 1 de observaes sobre a varivel dependente, Wy um vetor N por 1
de defasagens espaciais para a varivel dependente, o coeficiente auto-regressivo espacial
(um escalar)
1
, X uma matriz N por k de observaes sobre as variveis explicativas exgenas
com um vetor associado K por 1 de coeficientes de regresso e um vetor N por 1 de termos
de erro aleatrio distribudo aleatoriamente . ) , 0 ( ~ I
Esquematicamente, teramos:

X
i
X
j

u
i
u
j

y
j
y
i

Aps algumas manipulaes algbricas simples, possvel representar a expresso
anterior na forma reduzida:

W I X W I y
1 1
) ( ) (

+ = (4.4)

1
A restrio sobre o coeficiente de defasagem espacial a seguinte: -(1/
max
)< < +1, em que
max
o maior
autovalor de W (em valor absoluto). Para maiores detalhes, veja Anselin, 1988.
_____________________________________________________________________________

Note que (I - W) precisa ser no-singular para ser invertvel. No espao, Wy est, neste
caso, correlacionada com todos os
i
em todas as regies. Na expresso, (I - W)
-1
representa
uma srie infinita que envolve os erros em todas as regies:

) ( ) (
3 3 2 2 1
L + + + + =
W W W I W I (4.5)

Essa srie infinita pode ser considerada uma expanso de Leontief, que desempenha o
papel de um multiplicador espacial, ou seja, a funo dependente dos vizinhos de primeira,
segunda, terceira ordens etc. A conseqncia disso que a matriz (I-W)
-1
plena, implicando
que cada regio correlacionada com todas as outras, mas de forma que a intensidade da
correlao decresce com a ordem da contiguidade (Anselin and Bera, 1998, p. 246). Portanto, o
alcance de um choque inovacional global no sentido de que ele propaga-se por todo o espao.
No epicentro de ocorrncia do choque, a sua intensidade maior e, medida que se distancia, tal
intensidade perde fora.
Vamos analisar mais detidamente a estrutura de varincia do modelo de defasagem
espacial:

1 2
)] ( )' [( ) ' (
= W I W I yy E (4.6)

A condio de matriz plena implica uma simultaneidade da interao espacial que traz
uma clara implicao no momento da estimao. Como ser visto no prximo captulo, esse tipo
de modelo precisa ser estimado por mxima verossimilhana (MV) ou pelo mtodo de variveis
instrumentais (VI).
A implicao direta quando no se insere Wy no modelo de defasagem espacial,
incorrendo-se numa falha de especificao da mesma natureza da omisso de varivel relevante.
O mtodo dos mnimos quadrados (MQO) no apropriado nesse caso, pois caso o modelo
economtrico de defasagem espacial for estimado por ele, as estimativas dos coeficientes sero
viesadas e inconsistentes (Anselin, 1988).
_____________________________________________________________________________

4.2.2. Modelo com Erro Auto-regressivo Espacial
Suponha agora que surja uma praga que afete as lavouras numa determinada regio (um
choque de oferta, u), espalhando-se por todas as outras regies (Wu, W
2
u, W
3
u etc.). Claramente,
a praga um efeito no modelado que se manifesta no termo de erro inovacional. Comumente,
depois de identificada pelos rgos competentes, a tendncia de se combater a praga, fazendo
com que o seu espraiamento perca fora, exibindo um decaimento em seu efeito, em decorrncia
do fato de que 1 < .
Vamos comear com o modelo de erro espacial auto-regressivo de primeira ordem,
sugerido inicialmente por Whittle (1954):

u X y + =

+ = Wu u (4.7)

no qual o coeficiente o parmetro do erro auto-regressivo espacial.
Por meio da nossa representao esquemtica:

X
i
X
j

u
i
u
j

y
j
y
i

Aps algumas manipulaes algbricas, a forma reduzida do modelo pode ser expressa
por:

_____________________________________________________________________________

1
) (
+ = W I X y (4.8)

Desde que 1 < , e assumindo matrizes de pesos espaciais padronizados,
2
uma outra
expanso de Leontief aparece na expresso (8) na seguinte forma:

K + + + =
2 2 1
] [ W W I W I (4.9)

Como a expanso de Leontief denota uma espcie de multiplicador espacial, o alcance de
um choque inovacional global, fazendo com que haja uma propagao do efeito ao longo do
sistema, atingindo todas as regies, todavia, com uma intensidade decrescente medida que se
afasta do epicentro da ocorrncia da inovao.
No nosso exemplo, a praga atingindo a produo agrcola nociva e com uma alta
capacidade de espraiamento atravs do espao que tem potencial de impactar todo o sistema.
Vamos definir a estrutura de varincia-covarincia desse modelo:

1 2
)] ( )' [( ) ' (
= W I W I uu E (4.10)

Note que Wu chamado de erros defasados espacialmente. Semelhantemente ao modelo
anterior, a matriz de varincia-covarincia plena e exibe um decaimento, ou seja, todas os
locais so correlacionados entre si, contudo, os que esto mais prximos, esto correlacionados
mais intensamente. A complexa estrutura da equao (10) produz elementos da diagonal
principal que no so constantes (heterocedasticidade em u), a despeito da homocedasticidade de
, uma vez que a expresso (10) diferente de
2
I. Somente no caso trivial em que seja nulo,
os erros no sero autocorrelacionados no espao.
O significado intuitivo desse modelo que o padro espacial manifestado no termo de
erro dado por efeitos no modelados por conta da falta de adequada medida, que, por sua vez,

2
Como definido no segundo captulo, uma matriz de pesos espaciais padronizados implica que a soma dos pesos de
uma linha tem de perfazer o valor unitrio. Formalmente: .
=
j
ij ij ij
w w w /
*
_____________________________________________________________________________
no so distribudos aleatoriamente no espao, mas, ao contrrio, esto espacialmente
autocorrelacionadas.
O impacto espacial do modelo ser manifestado somente no termo de erro da regresso.
As implicaes para os coeficientes estimados so claras. Embora as estimativas por MQO no
so viesadas e consistentes, os erros no so mais esfricos, e conseqentemente, as estimativas
no so eficientes.
Com relao ao modelo de erro auto-regressivo espacial, Kelejian e Robinson (1995)
identificam uma possvel singularidade da matriz (I-W) para certos valores de como um
problema que impossibilitaria a sua estimao.
Para superar tal problema, Kelejian e Robinson (1995) propuseram uma variao do
modelo de erro de mdia mvel espacial. Na variante do modelo, h dois choques estocsticos
dentro de cada regio. Um deles especfico regio e no gera efeito de transbordamento, ao
passo que o outro no especfico regio e gera efeitos de transbordamento. O termo de erro da
regresso considerado a soma desses dois componentes: um choque especfico da regio e o
outro uma combinao linear dos choques que transbordam para outras regies:

+ = W u (4.11)

Assumindo que E(u) = E() = 0, o que implica uma nova estrutura de varincia-
covarincia:

I WW uu E
2 2
' ) ' (

+ = (4.12)

Uma vez que o segundo termo do lado direito definido positivamente e o primeiro
termo , no mnimo, semidefinido positivamente, a matriz de varincia-covarincia definida
positivamente e, portanto, invertvel. Assim sendo, concluem Kelejian e Robinson (1995, p. 88),
problemas de singularidade na matriz de varincia-covarincia no afloram nessa variante do
modelo de erro auto-regressivo espacial.

_____________________________________________________________________________
5.2.3. Modelo com Erro de Mdia Mvel Espacial
Voltando ao nosso exemplo com base numa funo de produo agrcola, suponha agora
que uma fbrica, localizada numa regio, jogue poluentes no ar ou despeje efluentes no rio,
prejudicando a produo agrcola no apenas da regio onde se localiza a planta industrial, mas
tambm das regies vizinhas prximas, mas note bem - no de todas as regies. Como a
poluio um efeito no modelado na regresso por falta de uma medida adequada, isso se
manifesta no termo de erro. Pelo alcance localizado do choque inovacional, tal modelo
apresenta-se mais apropriado que o anterior.
O segundo modelo de erro espacial segue um processo de mdia mvel de primeira
ordem, especificado da seguinte maneira:

+ = W u (4.13)

em que o coeficiente de mdia mvel espacial, sendo que os termos restantes so como
definido antes. A interpretao para o coeficiente de mdia mvel espacial de que a influncia
de efeitos no modelados, por falta de dados medidos precisamente, tm um impacto localizado
sobre a vizinhana.
Convm observar que o erro composto pela inovao no local () e pela mdia dos
choques inovacionais dos locais vizinhos (W). A forma reduzida desse modelo a seguinte:

) ( W I X y + = (4.14)

interessante ressaltar que agora no aparece na forma reduzida nenhum termo que
denote a expanso de Leontief. Conseqentemente, o alcance do choque inovacional, neste
modelo, local, no tendo impacto sobre todo o sistema, como nos dois modelos anteriores. Para
se observar at onde vai o impacto localizado necessrio analisar a matriz de varincia-
covarincia do erro deste modelo, que assume a seguinte forma:

)] )( [( ] ' [
2
W I W I u u E + + =
_____________________________________________________________________________
= (4.15) ] ' ) ' ( [
2 2
WW W W I + + +

Note que a matriz de varincia-covarincia no plena, neste caso, desde que os
elementos no-nulos fora da diagonal principal so apenas os correspondentes aos elementos de
W e WW. Ou seja, tais elementos no-nulos consistem de pares de locais que so somente
vizinhos de primeira e segunda ordem, denotando os erros correlacionados espacialmente. Cabe
notar que, neste modelo novamente, a autocorrelao espacial induz heterocedasticidade, uma
vez que os termos diagonais em WW no sero constantes, a despeito da homocedasticidade do
termo de erro . Cabe reforar essa descoberta: o termo de erro pode ser homocedstico por
natureza e, mesmo assim, a matriz de varincia-covarincia ser heterocedstica.

4.2.4. Modelo Regressivo Cruzado Espacial
Suponha agora que todas as variveis contidas na matriz X transbordassem, alm de
conter uma defasagem espacial da varivel dependente. No caso de uma funo produo, a
suposio seria de que algumas (ou todas, no limite) das variveis explicativas especificadas,
apresentassem um efeito de transbordamento para as regies vizinhas. Por exemplo, se na funo
de produo agrcola fosse inserida uma medida de infra-estrutura rodoviria como uma varivel
explicativa, seria interessante descobrir se ocorre transbordamento da infra-estrutura rodoviria
de um municpio auxiliando na produo agrcola de um outro municpio. Para captar isso,
teramos que incluir tambm um componente WX:

+ + = WX X y (4.16)

Note que a especificao desse modelo envolve uma srie de transbordamentos espaciais.
Convm ainda observar que um vetor e no um escalar. Agora alguns elementos de podem
ser nulos de forma que algumas variveis X defasadas espacialmente no precisam ser includas
no modelo. A forma estrutural do modelo coincide com a forma reduzida e, na ausncia da
expanso de Leontief, os impactos de transbordamentos das regies vizinhas so localizados, no
afetando todo o sistema.
_____________________________________________________________________________
Esquematicamente:

X
i
X
j

u
i
u
j

y
j
y
i

Conforme destacado por Rey e Mantouri (1998), tal modelo pode ser estimado por MQO
sem incorrer em problemas para as estimativas. O aspecto importante a incluso do termo de
transbordamentos, quando houver justificativa terica, pois a sua ausncia provoca um vis nas
estimativas dos coeficientes da mesma natureza que o provocado pela varivel relevante omitida
na regresso.
Caso haja sugestes da teoria de que o fenmeno a ser estudado exerce um impacto alm
dos vizinhos diretos (de primeira ordem), possvel incluir efeito de transbordamento de ordens
superiores. A implementao dessa idia feita com a incluso de termos, como W
2
X, W
3
X, W
4
X,
etc. Intuitivamente, seria o caso da influncia de uma grande infraestrutura de transportes, por
exemplo, a construo de um porto de grande dimenso, que tenha um impacto global sobre toda
uma regio e no apenas localizado (como uma estrada vicinal).
Com efeito, uma extenso bvia desse modelo a seguinte:

+ + + + + =
l
l
X W X W X W X y K
2
2
1
1
(4.17)

sendo que W
l
a matriz de pesos espaciais de l-sima ordem. Obviamente, espera-se que os
coeficientes dos efeitos
1
,
2
etc. tenham um amortecimento medida que a ordem do efeito de
transbordamento se eleve.

_____________________________________________________________________________
4.2.5. Modelo de Durbin Espacial (ou do Fator Comum)
Esse modelo derivado do modelo de erro auto-regressivo espacial de primeira ordem.
Alm de incorporar a idia do transbordamento por meio da defasagem das variveis
independentes (WX), ele incorpora a suposio de que estaria existindo um processo de difuso
tcnica que impactasse a produo, ou algum outro fenmeno que justificasse a incluso da
varivel endgena defasada espacialmente (Wy).
Considere a expresso para a forma reduzida (8) e multiplique os dois lados por (I-W),
obtendo:

1
) )( ( ) ( ) (
+ = W I W I X W I y W I (4.18)

Depois de algumas manipulaes algbricas e reagrupando os termos, obtemos:

+ + = WX X Wy y (4.19)

Reescrevendo essa expresso:

+ + =
3 2 1
WX X Wy y (4.20)

Esse modelo contm k restries no-lineares, conhecidas como restries de fator
comum. Como esse modelo equivalente ao modelo com erro de mdia mvel espacial de
primeira ordem, o produto do coeficiente de Wy com os coeficientes de X deveria igualar-se ao
negativo dos coeficientes do termo WX. Na literatura, isso tratado como sendo a hiptese do
fator comum. Formalmente, para satisfazer tal hiptese, tem-se que:

3 2 1
=

Uma vez que a forma reduzida no envolve nenhuma expanso de Leontief, o alcance do
impacto desse modelo local, ou seja, restrito aos vizinhos de primeira ordem. Posto que um
_____________________________________________________________________________
modelo derivado do modelo de erro auto-regressivo espacial, a nica implicao para a
estimao dos coeficientes a ineficincia, embora continuem consistentes.
Esquematicamente:

X
i
X
j

u
i
u
j

y
j
y
i

4.2.6. Modelo Misto com Defasagem Espacial e Erro Auto-regressivo Espacial
Vamos supor o caso em que houvesse um processo de difuso de uma nova tcnica
agrcola (efeito modelado), concomitantemente com o avano de uma praga da lavoura (efeito
no modelado) que se espalhe por todas as regies, porm, com uma intensidade de contgio
decrescente.
Seja o modelo:

u X y W y + + =
1
(4.21)

+ = u W u
2

Esquematicamente:

_____________________________________________________________________________
Xi Xj

u
i
u
j

yj yi

Cabe notar que W
1
e W
2
podem ser matrizes diferentes, constituindo um caso mais geral.
Naturalmente, o caso em que W
1
=W
2
particular. A forma reduzida revela que:

1
2
1
1
1
1
) ( ) ( ) (

+ = W I W I X W I y

ou

+ + + = X W X y W W y W y W y
2 1 2 2 1
(4.22)

Por envolver claramente expanses de Leontief, o alcance dos efeitos global, afetando
todo o sistema. Pela expresso (4.22), possvel observar que esse modelo mais complexo em
sua especificao, engendrando srios problemas na identificao dos parmetros e . Por ter
uma natureza mista, a sua estimao por MQO implica em estimativas inconsistentes e
ineficientes.

4.2.7. Modelo Misto com defasagem e erro de mdia mvel de primeira ordem
Suponha agora que haja uma difuso de uma nova tcnica de produo,
concomitantemente com um efeito no modelado como a poluio na regio, afetando as regies
vizinhas mais prximas, mas no todo o sistema.
Um modelo sobre isso o que envolve uma defasagem espacial com um erro de mdia
mvel espacial, assim especificado:
_____________________________________________________________________________

u X y W y + + =
1

+ =
2
W u (4.23)

A forma reduzida transforma-se em:

) ( ) (
2
1
1
W I X W I y + =
(4.24)

Neste modelo, os efeitos no modelados nos erros so localizados, ao passo que os efeitos
modelados nas variveis explicativas apresentam um efeito global no sistema econmico. A sua
implicao para o processo de estimao o mesmo que o modelo anterior, ou seja, os
coeficientes estimados por MQO so ao mesmo tempo inconsistentes e ineficientes.

4.2.8. Modelo Economtrico Espacial Geral
Com o conhecimento adquirido at aqui, j podemos inferir um modelo geral,
representando um processo espacial altamente complexo e de elevada ordem de interao:

u X W X W WX y W y W Wy y
t t r
r
+ + + + + + + + = L L
2
2
1
2
2 1

+ + + + = u W u W Wu u
l
l
L
2
2 1

ou
+ + + + =
g
g
W W W u L
2
2 1
(4.25)

A prtica ensina que modelos economtricos espaciais parcimoniosos tm a capacidade
de capturar a dependncia espacial, no havendo a necessidade de tentar estimar modelos
complexos, que, como visto, envolvem potenciais problemas de identificao de parmetros.
_____________________________________________________________________________
No conhecida uma estimao de um modelo to parametrizado como esse. Na
realidade, a maioria dos processos espaciais pode ser estimada por meio de modelos pouco
parametrizados, tais como os modelos das sees 4.2.1, 4.2.2.

4.4. Concluses
Em suma, possvel ressaltar os principais aspectos de todos esses modelos
economtricos que tratam da autocorrelao espacial. O Quadro 1 fornece um resumo com os
principais aspectos abordados na exposio da tipologia dos modelos economtricos espaciais.

Quadro 4.1: Resumo das Propriedades dos Modelos Economtricos Espaciais
Modelo Componente Alcance Implicao
Defasagem Wy Global Inconsistncia
Erro autorregressivo Wu Global Ineficincia
Erro de mdia mvel Wu Local Ineficincia
Durbin Wy e WX Local Inconsistncia
Regressivo cruzado WX Local Inconsistncia
Misto 1 Wy e Wu Global Inconsistncia e ineficincia
Misto 2 Wy e Wu Global e local Inconsistncia e ineficincia
Fonte: elaborao do autor.
Notas: o modelo misto 1 o descrito na sub-seo 4.2.6, ao passo que o modelo misto 2 o apresentado na
sub-seo 4.2.7.

A demonstrao formal das implicaes isto , o vis e a ineficincia ficaro para o
prximo captulo.
Note que a tipologia dos modelos difere pela incluso de algum dos trs componentes de
interao espacial Wy, WX e Wu ou de uma combinao deles. Outro aspecto distinto o
alcance da interao: global ou local.

_____________________________________________________________________________
CAPTULO 5
ESTIMANDO A AUTOCORRELAO ESPACIAL

5.1. Introduo
Vamos supor que voc j identificou um modelo economtrico espacial para a sua funo
de produo agrcola em nvel municipal que voc deseja estimar. Vamos supor que o modelo
identificado tenha sido o modelo de defasagem espacial de primeira ordem ou um modelo de
erro espacial (autorregressivo ou de mdias mveis).
O problema agora como estim-lo? Uma idia inicial seria estimar por Mnimos
Quadrados Ordinrios (MQO), o mais adotado e consagrado estimador na econometria. Mas ser
que seria uma boa idia? Podemos adiantar que no. E por que no? Quais so as opes de
estimadores? Esse o assunto deste captulo.

5.2. Os Problemas de Estimar por MQO
Digamos que voc identificou um modelo de defasagem espacial de 1
a
ordem para a sua
funo de produo agrcola em nvel municipal. Vamos verificar quais so os problemas
envolvidos na estimao por MQO.
Vamos mostrar que a estimativa MQO para do modelo economtrico de defasagem
espacial de 1
a
ordem viesada.
Para ver isso, considere a verso pura desse modelo:

+ = Wy y (5.1)

A estimativa MQO para o parmetro autorregressivo espacial dada por:

y Wy Wy Wy r ' ) (
1 '
= (5.2)

Substituindo (6.1) em (6.2):

_____________________________________________________________________________
' ) ' ( ' ) ' (
1 1
Wy Wy Wy Wy Wy Wy Wy r

+ =

' ) ' (
1
Wy Wy Wy r

+ = (5.3)

O valor esperado do segundo termo do lado direito da expresso (6.3) no se anula,
fazendo com que a estimativa MQO para seja viesada.
Vamos demonstrar agora que a estimativa MQO para tampouco goza da propriedade da
consistncia, que, neste caso, depende de duas condies:

Q Wy Wy n p =
) ' ( lim
1

( ) 0 ' lim
1
=
Wy n p (5.4)

em que Q uma matriz finita e no singular.
Segundo Anselin (1988), com as devidas restries sobre o valor de e de W, a primeira
condio pode ser satisfeita. O problema reside na segunda condio, pois:

( )
1 1 1
) ( ' lim ' lim

= W I W n p Wy n p (5.5)

Essa expresso ser zero, apenas se for zero, mas, nesse caso, no se trata mais de um
processo espacial. Qualquer outro valor assumido por a expresso acima ser diferente de zero,
significando que o estimador MQO para ser inconsistente.

E se o processo de identificao apontou para o modelo de erro espacial, tanto
autorregressivo quanto de mdias mveis. O que acontece se estim-lo por MQO?
Nesses dois casos, as estimativas MQO so no-viesadas e consistentes, porm so
ineficientes. Considerando a estrutura de varincia-covarincia do modelo de erro autoregressivo
espacial, apresentado no captulo quatro:
_____________________________________________________________________________

1 2
)] ( )' [( ) ' (

= W I W I uu E (4.10)

Percebe-se com clareza que a varincia muito diferente da varincia estimada por MQO
[E(uu) =
2
I].
No caso do modelo de erro de mdia mvel espacial, relembrando o captulo anterior, a
estrutura de varincia-covarincia dada por:

)] )( [( ] ' [
2
W I W I u u E + + =
= (4.15) ] ' ) ' ( [
2 2
WW W W I + + +

A natureza bidimensional da dependncia no espao implica numa matriz plena,
denotando a simultaneidade da interao. Cabe aqui fazer um paralelo com as sries de tempo
em que a natureza unidirecional no tempo conduz a uma matriz triangular. O mtodo MQO
inadequado para estimar modelos economtricos espaciais incluindo termos como Wy e/ou Wu
porque desconsidera o jacobiano da transformao.
A condio de matriz plena implica uma simultaneidade da interao espacial que traz
uma clara implicao no momento da estimao: essa classe de modelos precisa ser estimada por
mxima verossimilhana (MV) ou pelo mtodo de variveis instrumentais (VI).

5.3. Estimando o Modelo de Defasagem Espacial

5.3.1. Mxima Verossimilhana
Define-se o estimador de mxima verossimilhana como sendo o parmetro estimado que
gerou, com a maior probabilidade, a amostra observada. Esse parmetro determinado pela
maximixao da funo de mxima verossimilhana. A densidade conjunta de n observaes a
funo de verossimilhana, definida para como sendo uma funo de um parmetro ou um
conjunto de parmetros (Greene, 1997, p. 130).
_____________________________________________________________________________
Ainda de acordo com Greene (1997, pp. 133-134), dadas certas condies de
regularidade, o estimador de mxima verossimilhana desfruta das propriedades assintticas
desejveis de consistncia, eficincia assinttica, normalidade assinttica e invarincia.
A primeira condio de regularidade que precisa ser satisfeita a existncia das derivadas
parciais da funo de verossimilhana com respeito ao conjunto de parmetros a ser estimado.
Alm disso, essas derivadas precisam ser ainda limitadas. A segunda condio de regularidade
envolve que os parmetros encontrem-se no interior do espao de parmetros.
A questo em processos espaciais mais complexa, pois os dados so dependentes
espacialmente, violando a condio iid em que se apia o estimador de mxima verossimilhana
na sua verso clssica. Isso implica um problema, pois uma amostra dependente contm menos
informao, causando perda de propriedades para os estimadores e para os testes.
Essa menor quantidade de informao exibida por uma amostra dependente precisa ser
compensada de alguma forma. Uma soluo para isso invocar uma abordagem assinttica para
os processos espaciais. Assim, as propriedades dos estimadores e dos testes sero baseados em
aproximaes vlidas quando o tamanho da amostra cresce ao infinito (Anselin, 1988). Nesse
caso, necessria aplicar a teoria assinttica moderna.
Antes disso, note que se estivssemos trabalhando com um gride regular de unidades
espaciais, poderamos consider-lo como uma amostra representativa e aleatria de uma
populao infinita de grides regulares de unidades espaciais. O problema que, no trabalho
aplicado e na prtica, trabalhamos com uma amostra de unidades espaciais irregulares no sentido
de que as suas reas so distintas e suas fronteiras diferentes.
Na teoria assinttica, a Lei dos Grandes Nmeros importante porque garante a
consistncia do estimador. Formalmente, quando o tamanho da amostra aproxima-se do infinito,
temos que:

( ) ( ) ( |
|
.
|
\
|
i
i i
x g E x g
n
, ,
1
)| (5.6)

_____________________________________________________________________________
em que uma parmetro qualquer e g uma funo dos dados de uma amostra e desse
parmetro. Em outros termos, o desvio mdio dessa funo dos dados da amostra e desse
parmetro do seu valor esperado converge a zero, quando o tamanho da amostra cresce ao
infinito.
O Teorema Central do Limite estabelece que o desvio entre o estimador e a estimativa
obtida de uma amostra converge em distribuio para uma varivel aleatria normal.
Formalmente:

( ) ) , 0 ( V N q n (5.7)

em que q a estimativa de .
Com o Teorema Central do Limite obtm-se a propriedade da normalidade assinttica,
que permite que construa testes para identificar e validar os modelos economtricos espaciais.
O problema da estimao de modelos economtricos espaciais envolve a otimizao de
uma funo log-verossimilhana altamente no-linear.
Seja o modelo de defasagem espacial misto:

+ + = X Wy y (5.8) ) , 0 ( ~
2
I N

Sob o pressuposto da normalidade conjunta dos termos de erro, a funo log-
verossimilhana para o modelo de defasagem espacial assume a seguinte forma:

+ =
2
2
2
'
) det( ln ) ln(
2
) 2 ln(
2
ln

W I
n n
L (5.9)

Convm observar que:

X Wy y = (5.10)

_____________________________________________________________________________
Substituindo essa expresso na funo log-verossimilhana:

+ =
2
2
2
) ( )' (
) det( ln ) ln(
2
) 2 ln(
2
ln

X Wy y X Wy y
W I
n n
L (5.11)

Vale a pena tecer alguns comentrios a respeito dos elementos da funo de mxima
verossimilhana. A funo de log-verossimilhana composta por trs elementos. O primeiro
elemento so as constantes n e . O segundo elemento a forma quadrtica nos termos de erro
(). Esses dois elementos so comuns em modelos economtricos a-espaciais.
O terceiro elemento o mais interessante e distintivo dos modelos economtricos
espaciais em comparao com modelos a-espaciais. Esse terceiro elemento refere-se ao
surgimento do determinante do jacobiano da transformao de dimenso igual ao tamanho da
amostra.
O Jacobiano uma relao entre y, que observado, e , que no observado. No
modelo de defasagem espacial, o termo aleatrio definido como:

X y W I = ) ( (5.12)

Note que pode ser expresso como uma funo de y:

) ( y f = (5.13)

O Jacobiano de transformao requerido em virtude da simultaneidade, expressa pela
srie infinita, representada pelo multiplicador de Leontief, que aparece em alguns modelos
economtricos espaciais. Devido a essa simultaneidade, o Jacobiano da transformao espacial
uma matriz plena. Essa caracterstica eleva o peso computacional na etapa de estimao desses
modelos.
Conceitualmente, o Jacobiano da transformao definido como o determinante da
derivada de f com relao a y:
_____________________________________________________________________________

) det( det W I
y
f
=
|
|
.
|
\
|
(5.14)

Cabe notar que, em modelos a-espaciais, o Jacobiano da transformao assume o valor
unitrio e, por conseqncia no aparece na funo de log-verossimilhana como uma matriz.
Baseado nesses elementos, com o intuito de conseguir a otimizao no-linear dos parmetros,
preciso impor duas condies de regularidade para a funo log-verossimilhana. A primeira
condio estabelece que o Jacobiano da transformao seja definido positivo. A segunda
condio impe que a matriz de varincia-covarincia precisa ser positiva.
Uma vez que o mtodo MQO de estimao no leva em considerao o termo do
Jacobiano da transformao, ele mostra-se inapropriado para a estimao de diversos modelos
economtricos espaciais.
Para mostrar a limitao do mtodo MQO, necessrio entender que o princpio desse
mtodo repousa em minimizar os resduos ao quadrado. Assim, dado um vetor de resduos e:

X Wy y = (5.15)

A soma dos resduos ao quadrado representada como:

( ) ( X Wy y X Wy y = ' ' ) (5.16)

Observe que a estimativa MQO necessita da minimizao da soma dos quadrados dos
resduos com relao a . Todavia, a otimizao tem por referncia apenas o ltimo termo da
funo de log-verossimilhana (ver equao 5.11). Mais uma vez, percebe-se claramente que o
mtodo MQO no considera o jacobiano da transformao no seu procedimento de estimao.
Temos condies agora de mostrar que o vis do parmetro estimado b. Para isso, vamos
derivar as condies de primeira ordem:

_____________________________________________________________________________
y W I X X X b ) ( ' ) ' (
1
=

Wy X X X y X X X b ' ) ' ( ' ) ' (
1 1
= (5.17)

n
X Wy y X Wy y
s
) ( )' (
2

=

(5.18)

Note que b viesado quando se desconsidera no modelo a defasagem espacial Wy. O
tamanho do vis de omisso de varivel relevante dado pelo segundo termo do lado direito da
expresso. Note que a direo do vis , a priori, indeterminado. Isto , b pode ser subestimado
ou sobrestimado, dependendo do sinal de , positivo ou negativo, respectivamente. Perceba
ainda que a nica possibilidade de que b no seja viesado se assumir o valor nulo. Contudo,
esse o caso trivial no qual a expresso (6.8) transforma-se no modelo clssico no-espacial.

5.3.2. Mtodo de Variveis Instrumentais (VI)
Na econometria convencional, s vezes, ocorre a situao em que uma ou mais variveis
explicativas (a matriz X) estarem correlacionadas com o termo de erro, engendrando um
problema de endogeneidade. Intuitivamente, a endogeneidade pode ser entendida como a
varivel explicativa determinando a varivel dependente, mas, por sua vez, esta tambm
determinando a varivel explicativa por meio de um mecanismo retroalimentador, gerando
simultaneidade. Essa violao dos pressupostos do modelo de regresso linear clssico acarreta
conseqncias graves, a saber, as estimativas por MQO so viesadas e inconsistentes.
Para se contornar tal problema, nessa situao, costuma-se estimar o modelo usando o
mtodo de variveis instrumentais. A idia usar um conjunto de instrumentos que apresentem
duas propriedades. Primeiro, esses instrumentos precisam estar correlacionados com as variveis
explicativas. Segundo, tal conjunto de instrumentos no pode estar correlacionado com o termo
de erro. Cabe destacar que essa ltima a condio fundamental para se obter a consistncia das
estimativas.
_____________________________________________________________________________
Alm disso, ao contrrio da estimao de mxima verossimilhana, o mtodo das
variveis instrumentais no exigem o requisito da propriedade da normalidade.
Vamos trazer essa discusso para o contexto espacial. Vamos considerar o modelo de
defasagem espacial de primeira ordem misto:

+ + = X Wy y (5.8) ) , 0 ( ~
2
I

Observe que agora o termo de erro aleatrio no precisa seguir uma distribuio normal.
Na situao em que h endogeneidade, temos que:

0 ) , ( Wy E (5.19)

Vamos reescrever o modelo da seguinte forma:

+ = Z y (5.20)

Com as seguintes definies: Z=[X, Wy] e =[, ]. Note que a dimenso de Z n x l,
sendo que l k. O mtodo de estimao baseado em variveis instrumentais necessita
evidentemente de um conjunto de instrumentos. Todas as variveis exgenas podem ser
instrumentos delas prprias.
A questo repousa em saber quais sero os instrumentos para Wy. Kelejian e Robinson
(1993) demonstraram que as defasagens espaciais das variveis exgenas de diversas ordens
(WX, W
2
X, W
3
X,...) so consideradas como instrumentos ideais, pois, de um lado, no so
correlacionados com o termo de erro e, por outro, so muito correlacionados com X. Para se
obter a consistncia, basta incluir WX como instrumentos. Todavia, com vistas de se conseguir
estimativas mais eficientes, aconselhvel incluir W
2
X, W
3
X etc. Assim, formalmente, o
conjunto de instrumentos pode ser expresso como Q=[X, WX, W
2
X, W
3
X,...].
Como um requisito para a consistncia; as variveis em Q so correlacionadas com
aquelas em Z que, no limite (Anselin, 1988):
_____________________________________________________________________________

QZ
H
n
Z Q
p =
'
lim (5.21)

sendo que H
QZ
uma matriz finita e com pleno posto.

QQ
H
n
Q Q
p =
'
lim (5.22)

A outra condio que as variveis em Q no sejam, no limite, correlacionadas com o
termo de erro aleatrio:

0
'
lim =
n
Q
p

(5.23)

sendo que H
QQ
uma matriz finita e no-singular.
Para derivar o estimador de VI, vamos pr-multiplicar o modelo de defasagem espacial
por Q:

' ' ' Q Z Q y Q + = (5.24)

O estimador dado por:

y Q Q Q Q Z Z Q Q Q Q Z
VI
' ) ' ( ' ] ' ) ' ( ' [
1 1 1
= (5.25)

Vamos definir que como sendo a projeo de Z nas variveis de Q e
substituir na relao acima:
' ) ' (
1
Q Q Q Q Z
p

=

y Z Z Z Z Z
p p VI
' ' ] ' ' [
1
= (5.26)
_____________________________________________________________________________

Seguindo Johnston (1997), vamos agora mostrar que o estimador de VI idntico ao
estimador de Mnimos Quadrados em 2 Estgios (MQ2E). O primeiro estgio a regresso das
variveis em Z para obter uma matriz de valores ajustados ( ): Z

Z Q Q Q Q Z ' ) ' (
1
= (5.27)

ou

Z Z Z
p
'
= (5.28)

No segundo estgio, faz-se a regresso de y contra para obter o vetor estimado: Z

y Z Z Z Z Z
p p E MQ
' ' ] ' ' [
1
2

= (5.29)

Comparando a expresso (5.29) com a expresso (5.26), note que .
VI E MQ
=
2

5.4. Estimando o Modelo de Erro Espacial

5.4.1. Mxima Verossimilhana
Sob o pressuposto da normalidade, a funo de log-verossimilhana para o modelo de
erro autorregressivo espacial:

) )( ( )' ( )' (
2
1
) det( ln ln
2
ln
2
ln
2
2

X y W I W I X y W I
n n
L + + =
(5.30)
_____________________________________________________________________________
Novamente aqui vemos o aparecimento do determinante do Jacobiano da transformao
[det(I W)] na funo de log-verossimilhana.
Estabelecendo as condies de primeira ordem:

| | ) ( )' ( ) ( )' (
1
Wy y WX X WX X WX X b =

(5.31)

n
We e We e ) ( )' (
2

= (5.32)

5.4.2. Estimao pelo Mtodo Generalizado do Modelo de Erro SAR
Na situao em que no h a normalidade dos erros, as estimativas por MV tornam-se
invlidas. necessrio achar um mtodo de estimao que no tenha esse pressuposto. Kelejian
e Prucha (1999) propuseram um mtodo que prescinde da normalidade.
Seja o modelo:

u X y + =

+ = Wu u com (5.33) ) , 0 ( ~
2

Note que a normalidade do termo de erro no requerida. Vamos estabelecer as
condies de momento sobre :

Wu u = (5.34)

2
] / ' [ = n E (5.35)

) ' ( ) / 1 ( ] / ' ' [
2
W W tr n n W W E = (5.36)

_____________________________________________________________________________
0 ] / ' [ = n W E (5.37)

Esse ltimo resultado decorrncia do fato de que tr(W)=0, por construo.
As condies de momentos operacionais, que convertem condies sobre em condies
sobre u (resduos), so estabelecidas como:

) ( )' ( ' Wu u Wu u =
Wu W u Wu u u u ' ' ' 2 '
2
+ = (5.38)

) ( ' )' ( ' ' Wu u W W Wu u W W =
WWu W W u WWu W u Wu W u ' ' ' ' ' 2 ' '
2
+ = (5.39)

) ( )' ( ' Wu u W Wu u W =
WWu W u WWu W u Wu u ' ' ' ' 2 '
2
+ = (5.40)

Substituindo as equaes (5.38)-(5.40) em (5.35)-(5.37), obtemos:

2 2
) ' ' (
1
) ' (
2
) ' (
1
=
)
`
+
)
`
Wu W u E
n
Wu u E
n
E
n
(5.41)

2 2
) ' ' ' (
1
) ' ' (
2
) ' ' (
1
) ' ' (
1
=
)
`
+
)
`
= WWu W W u E
n
WWu W u E
n
Wu W u E
n
W W E
n
(5.42)

)
`
+
)
`
= ) ' ' (
1
) ' (
2
) ' (
1
) ' (
1
2
WWu W u E
n
WWu u E
n
Wu u E
n
W E
n
(5.43)

_____________________________________________________________________________
Note que temos 3 equaes em duas incgnitas, a saber, e
2
. A soluo das equaes
de momento envolve usar o mtodo dos mnimos quadrados generalizados factveis (MQGF)
para estimar consistentemente :

( ) ( ) | | ( ) ( Wy y WX X WX X WX X b =

' '
1
)
)|
(5.44)

( ) ( |
1
2
' ) (

= WX X WX X b Var (5.45)

sendo que:

( ) ( )
n
u W u u W u '
2

X y u =

5.5. Concluses
Para estimar vrios modelos economtricos espaciais, o mtodo MQO pode no ser
apropriado. Para o modelo de defasagem espacial de primeira ordem, o coeficiente espacial
viesado e no consistente se estimado por MQO. J com relao ao modelo de erro
autorregressivo espacial, as estimativas MQO so no-viesadas e consistentes, porm so
ineficientes.
Como os dados so dependentes espacialmente, a teoria assinttica moderna desempenha
importante papel por intermdio da Lei dos Grandes Nmeros e do Teorema Central do Limite.
Uma soluo estimar usando o mtodo da mxima verossimilhana, desde que
garantida a propriedade da normalidade. O problema da estimao de modelos economtricos
espaciais envolve um problema computacional que no trivial: a otimizao de uma funo
_____________________________________________________________________________
log-verossimilhana altamente no-linear com a incluso de um termo Jacobiano de dimenso
igual ao tamanho da amostra.
Para o modelo de defasagem espacial, quando a normalidade no garantida, possvel
estimar usando o mtodo das variveis instrumentais. J para o modelo do erro auto-regressivo
espacial, quando a normalidade no pode ser assumida, Kelejian e Prucha desenvolveram um
mtodo baseado nos Momentos Generalizados para estimar esse tipo de modelo.

_____________________________________________________________________________
CAPTULO 6
TESTANDO A AUTOCORRELAO ESPACIAL

6.1. Introduo
O teste de hipteses enfrenta o desafio de discriminar a autocorrelao espacial da
heterocedasticidade. Como vimos no captulo passado, esses dois efeitos, muitas vezes, esto
imbricados num nico processo estocstico espacial.
1

O conjunto de testes para averiguar a presena de autocorrelao espacial til tanto para
servir de auxlio no momento de identificao do modelo economtrico espacial mais apropriado
quanto para a tarefa de validao ou diagnstico desse modelo. O problema do imbricamento
interfere nessas duas etapas, a identificao e a validao.
Os testes para detectar a autocorrelao espacial podem ser divididos em duas categorias:
testes gerais e testes especficos.
De um lado, os testes gerais so aqueles em que nenhuma indicao fornecida no
sentido de se detectar o tipo de autocorrelao espacial predominante na regresso, pois no so
baseados numa especificao explcita do processo estocstico gerador do erro. Desse modo, tal
categoria diz respeito aos testes cuja hiptese alternativa no refere-se a um modelo
economtrico espacial especfico.
De outro, existem os testes especficos, no quais fornecida uma indicao do tipo
predominante da autocorrelao remanescente na regresso, posto que se faz uma especificao
explcita do processo estocstico gerador do erro. Essa especificao uma tentativa de formular
a fonte da autocorrelao espacial. Ademais, essa categoria de teste pressupe a ausncia de
heterocedasticidade. Assim sendo, essa outra categoria refere-se a testes cuja hiptese alternativa
trata-se de um modelo economtrico espacial especfico.
Como ser visto posteriormente, o poder de um teste para detectar autocorrelao
espacial depende de uma srie de fatores, tais como o tamanho da amostra, a intensidade da

1
De acordo com Boller et al. (2001, p. 466), de um ponto de vista prtico, difcil distinguir dependncia espacial
da heterogeneidade espacial baseado nos resduos da regresso porque todos os diagnsticos tm poder contra
ambas as formas de m-especificao.
_____________________________________________________________________________
autocorrelao espacial, o grau de intensidade da heterocedasticidade, a escolha da matriz de
pesos espaciais (W), a funo de distribuio do erro etc.

6.2. Testes Gerais

6.2.1. Estatstica I de Moran
O primeiro teste geral para identificao de autocorrelao espacial uma adaptao do
teste I de Moran para o contexto da anlise de regresso linear, sugerido por Cliff e Ord (1981).
Trata-se de um teste simples sobre a autocorrelao espacial entre os vizinhos mais prximos.
Esse teste guarda similaridade com o teste de Durbin-Watson para a dependncia serial de
primeira ordem no tempo (Anselin, 1988; Anselin e Bera, 1998). O teste de I de Moran assume a
seguinte forma:

|
.
|
\
|
=
e e
We e
S
n
I
'
'
0
(6.1)

em que e = y - Xb, sendo que b o estimador MQO para e S
0

i
j
w
ij
, representando um fator
de normalizao.
No caso em que a matriz W padronizada pela linha, S
0
iguala-se a n. Dessa forma, o
teste I de Moran pode ser reescrito como:

e e
We e
I
'
'
= (6.2)

Pela expresso, percebe-se que a estatstica I baseada nas somas de produtos cruzados
de resduos para regies vizinhas. A hiptese nula do teste assume que os resduos da regresso
estimada por MQO so distribudos aleatoriamente ao longo do espao. O critrio do teste que
_____________________________________________________________________________
se H
0
rejeitada, os resduos so autocorrelacionados espacialmente. A inferncia do teste
baseada numa varivel z(I) padronizada que segue assintoticamente uma distribuio normal:

) (
) (
) (
I Var
I E I
I z

= (6.3)

em que a mdia dada por:

) /( ) ( ) ( k n MW tr I E = (6.4)

em que a matriz projeo definida como M = I X(XX)
-1
X.
A varincia da estatstica dada por:

{ }
{ }
| |
2
2 2
) (
) 2 )( (
)] ( [ ) ( ) ' (
) ( I E
k n k n
MW tr MW tr MWMW tr
I Var
+
+ +
= (6.5)

A principal vantagem desse teste a sua simplicidade computacional, uma vez que
apenas os resduos da regresso estimada por MQO so necessrios (Anselin, 2001, p. 114).
O teste I de Moran apresenta um alto poder contra a presena de autocorrelao espacial.
Existe, entretanto, um problema com esse teste referente ao seu poder. Isso porque, alm da
autocorrelao espacial nos resduos, o teste captura uma srie de problemas na regresso, tais
como a m especificao do modelo, a heterocedasticidade e a ausncia de normalidade nos
resduos.
A isso pode ser adicionado mais um problema. Para ser vlido, o teste I de Moran requer
que os resduos da regresso sejam normais. Porm, de acordo com Kelejian e Robinson (1998,
p. 391), na ausncia de heterocedasticidade, o teste I de Moran um teste que apresenta bom
_____________________________________________________________________________
desempenho para detectar autocorrelao espacial, mesmo que os erros no sejam distribudos
normalmente.
2

Porcausa de sua natureza geral, o principal problema que o teste, uma vez significativo
em termos estatsticos, no aponta para qual tipo de autocorrelao espacial predominante, ou
seja, se do tipo defasagem espacial ou de erro espacial. Na tarefa de prover subsdios para a
seleo do mais apropriado modelo com autocorrelao espacial na forma de defasagem ou de
erro, o I de Moran tem poder contra as duas alternativas e, assim, no pode ser usado para
discriminar entre as duas (Anselin e Rey, 1991, p. 130). Conseqentemente, no se deve basear
a deciso apenas nesse teste, pois pode induzir a erro.

6.2.2. Teste de Kelejian-Robinson (KR)
Esse outro teste geral proposto por Kelejian e Robinson (1992), mas, ao contrrio do teste
I de Moran, o teste KR no pressupe a normalidade dos resduos da regresso, representando,
nesse sentido, um avano. O teste KR apresenta similaridade com o famoso teste White.
3

A estatstica do teste KR obtida da seguinte regresso auxiliar:

h kh h
Z C + = (6.6)

em que C
h
= e
i
e
j
, ou seja, um vetor 1 x hn de produtos cruzados dos resduos (
ij
), para os quais
no so zero para i < j (i e j so observaes contguas), enquanto que Z
kh
=X
ki
.X
kj
o produto
cruzado das variveis explicativas; h o ndice para cada produto-cruzado. Os produtos-
cruzados so para todos os pares de observaes para os quais uma correlao no-nula
pressuposta, assim, perfazendo h
n
pares (Anselin, 1992). Formalmente:

ij ij j i
Z u u Cov = = ) , ( (6.7)

2
Segundo Anselin e Rey (1991, p. 124), o I de Moran sensvel escolha da matriz de pesos espaciais e presena
de no-normalidade nos erros.
3
Na apresentao do teste KR, vamos seguir a notao de Anselin (1992) e Anselin e Bera (1998).
_____________________________________________________________________________
A hiptese nula que os resduos so distribudos aleatoriamente ao longo do espao, isto
, no h autocorrelao espacial nos resduos. Com esse teste, a hiptese nula de ausncia da
autocorrelao espacial averiguada da seguinte forma:

H
0
: = 0

Baseada nessas consideraes, a estatstica do teste KR dada por:

n
h
Z Z
KR

'
' '
= (6.8)

Sob a hiptese nula, essa estatstica converge em distribuio para uma qui-quadrado
com k graus de liberdade, sendo que k o nmero de variveis explicativas (ou o nmero de
colunas) contidas na matriz Z.
As vantagens desse teste global residem no fato de que no requerido o pressuposto de
normalidade dos resduos, ao contrrio do teste I de Moran. Ademais, o teste KR aplicvel a
regresses lineares e no-lineares. Cabe notar que, na frmula do teste, no necessrio
especificar nenhuma matriz de pesos espaciais, prescidindo deste tipo de informao.
Uma desvantagem do teste KR repousa no fato de que, uma vez que exibe caractersticas
assintticas, ele mais apropriado para grandes amostras. preciso cercar-se de extrema cautela
quando se usa para averiguar a presena de autocorrelao dos resduos para pequenas e mdias
amostras, pois seu poder baixo, como prvios estudos comprovaram.
Alm disso, esse teste perde poder pela alta quantidade de graus de liberdade (k), em
comparao com o teste I que segue tambm um qui-quadrado, contudo com apenas um grau de
liberdade.
Todavia, a principal desvantagem do teste KR aquela compartilhada com o teste I de
Moran: na condio de teste do tipo geral, quando estatisticamente significantes, ambos no
fornecem indicaes sobre a forma da autocorrelao espacial presente (defasagem ou erro).
_____________________________________________________________________________

6.3. Testes Especficos
Como vimos at aqui, o problema comum dos testes gerais a sua incapacidade de
indicar como a autocorrelao toma forma, quando a hiptese nula rejeitada. A soluo o
desenvolvimento de testes chamados de especficos. Essa denominao decorrncia da
capacidade desse tipo de teste de especificar a forma assumida pela autocorrelao espacial.
A maioria dos testes especficos do tipo Multiplicador de Lagrange. Por isso, vale a
pena apresentar o princpio desses testes. Para construir um teste do tipo multiplicador de
Lagrange preciso cumprir trs passos.
O primeiro passo conseguir o vetor escore, derivado da funo de log-verossimilhana.
O vetor escore definido como:

=
L
d (6.9)

em que um parmetro qualquer.
O segundo passo obter a matriz de informao, definida como:

( )
|
|
.
|
\
|

=
'
ln
2

L
E Inf (6.10)

O ltimo passo avaliar o vetor escore e a matriz de informao para = 0. Por fim, a
estatstica de um teste de multiplicador de Lagrange dado por:

d Inf d ML =
1
(6.11)

_____________________________________________________________________________
6.3.1. Teste ML

Trata-se de um teste do tipo multiplicador de Lagrange contra a defasagem espacial. Esse
teste especfico dito ser unidirecional, porque uma hiptese alternativa estabelecida a respeito
do processo estocstico gerador do erro, contendo somente um nico parmetro espacial. Ele
verifica uma nica especificao, assumindo que o restante do modelo especificado
corretamente (Anselin e Bera, 1998).
Como um teste do tipo multiplicador de Lagrange, ele baseado no vetor escore e na
matriz de informao sob a hiptese nula, que, no caso em tela, estabelecida como H
0
: = 0,
assumindo que = 0.
As hipteses nula e alternativa so estabelecidas como:

H
0
: = 0
H
1
: 0

Para se obter o vetor escore e a matriz de informao, necessrio calcular o logaritmo da
mxima verossimilhana, obtido do modelo de defasagem espacial no captulo anterior. Vamos
repetir aqui a expresso:

+ =
2
2
2
) ( )' (
) det( ln ) ln(
2
) 2 ln(
2
ln

X Wy y X Wy y
W I
n n
L

O prximo passo derivar o vetor escore dessa funo log-verossimilhana e avali-lo
para = 0. Desse modo, derivando a funo de log-verossimilhana (lnL) com relao ao
parmetro espacial , temos que:

( )
2
1
'
Wy e
W W I tr d + =

(6.12)

_____________________________________________________________________________
Avaliando em =0, o primeiro termo da expresso zero, pois tr(W)=0, por conveno.
Assim,

2
'
Wy e
d = (6.13)

Numa etapa posterior, deriva-se o escore, ou seja, a derivada parcial dessa funo com
relao ao parmetro de defasagem espacial . Em seguida, avalia-se o escore sob a hiptese
nula (ou seja, para = 0). Alm disso, necessrio obter a matriz de informao.

| |
| | | | ( )
( ) ( )
(
(
(
(
(
+ +
=
2 2
2 2
2
' ' '
' ' '
'

X X WX X
WX X WX WX
W W W tr
Inf (6.14)

A frmula do teste dada por:

)
`
+ +
|
.
|
\
|
=
] ' [
)' (
'
2
2
2
2
W W W tr
s
MWXb WXb
s
Wy e
ML
(6.15)

em que s
2
a estimativa para a varincia do erro e b um vetor k x 1 com as estimativas dos
coeficientes MQO. O teste ML
segue a distribuio qui-quadrado com um grau de liberdade.

Como se trata de um teste assinttico, a estatstica ML
mais apropriada para grandes

amostras. Uma vez que se refere a um teste unidirecional, convm observar que, caso
ocorra, o teste invlido mesmo que se trabalhe com grandes amostras.
0
_____________________________________________________________________________
No que tange ao poder do teste, sobretudo para pequenas amostras, Anselin e Rey (1991, p.
124) descobriram que a estatstica ML
menos afetada contra erros no-normais, em especial

para erros exponenciais e erros lognormais.
Uma outra vantagem desse teste a facilidade computacional, j que, sob a nula, pode ser
calculada com base nos resduos de uma regresso estimada por MQO. Assim sendo, tal teste
compartilha dessa vantagem com o I de Moran. A outra vantagem a discriminao do tipo de
autocorrelao espacial presente nos dados na forma de defasagem (Wy) ou de erro (Wu).
A grande desvantagem do teste representada pela falta de poder que acarreta a freqente
rejeio da hiptese nula.

6.3.2. Teste ML

O outro teste especfico unidirecional, proposto originalmente por Burridge (1980), um
teste do tipo Multiplicador de Lagrange contra a autocorrelao espacial na forma do modelo de
erro autorregressivo espacial. A forma de calcul-lo segue os mesmos passos do anterior. Em
primeiro lugar, constri-se o logaritmo da funo de mxima verossimilhana para o modelo de
erro espacial. Em segundo lugar, deriva-se o vetor escore sob a hiptese nula que, nesse caso,
estabelecida como H
0
: = 0, assumindo que = 0.
Para esse teste especfico, As hipteses nula e alternativa so estabelecidas como:

H
0
: = 0

H
1
: 0

O escore d
, avaliado em = 0, expresso como:

( )
2
1
'
We e
W W I tr d + =

(6.16)

_____________________________________________________________________________
Avaliando esse vetor escore para = 0, como o primeiro termo torna-se nulo, pois tr(W)=0,
vem que:

2
'
We e
d = (6.17)

Em terceiro lugar, obtm-se a matriz de informao:

( ) ( )
( ) ( )
( ) ( ) | | ( ) | | ( ) | | { }
(
(
(
(
1 1 1
2
1
2
1
4
'
2 /
W I W W I W tr W I W tr
W I W tr
W I W tr
n
Inf

(6.18)

Note que, para = 0, os elementos fora da diagonal dessa matriz igualam-se a zero,
enquanto o elemento diagonal reduz-se a tr[WW + W
2
].
Neste caso, a estatstica assume:

| |
2
2
2
'
'
W W W tr
s
We e
ML
+
)
`
(6.19)

Esse teste segue uma distribuio qui-quadrado com um grau de liberdade.
Novamente, a principal vantagem desse teste a sua simplicidade computacional, uma
vez que, para implement-lo, necessrio apenas os resduos da regresso do modelo clssico
estimado por MQO.
Mais uma vez, a principal desvantagem do teste a tendncia de rejeitar com muita
freqncia a hiptese nula.

_____________________________________________________________________________
6.3.3. Teste SARMA (ML
)
Esse um teste para ordens superiores de dependncia, proposto num artigo por Anselin
(1988). Como se trata de um teste especfico, a hiptese alternativa estabelecida como um
modelo com defasagem e erro (autorregressivo ou de mdia mvel) espaciais:

+ + + = Wu X Wy y

+ + = W X Wy y + (6.20)

O procedimento de obteno da estatstica do teste ML anlogo aos dois anteriores.
A funo de log-verossimilhana dada por:

( )
( ) ( ) ( )( )
2
2
2
' '
ln ln ln
2
2 ln
2
ln

X Wy y W I W I X Wy y
W I W I
n n
L

+ + =

(6.21)

O teste LM
expresso por:

( ) ( )
( ) W W WW tr
We e
WXb M WXb
We e Wy e
LM
'
'
'
' '
2
2
2
2
2 2
+
|
.
|
\
|
+
|
.
|
\
|

=

(6.22)

Esse teste segue uma distribuio qui-quadrado com dois graus de liberdade. Nesse ponto
surge o primeiro problema com tal teste, ou seja, esses dois graus de liberdade implicam um
perda de poder. O segundo problema refere-se prpria natureza especfica do teste, isto ,
quando a nula rejeitada, existe uma indefinio da fonte de erro espacial, fazendo com que o
pesquisador no fique sabendo se a fonte da autocorrelao no erro na forma autorregressivo
ou de mdia mvel.
_____________________________________________________________________________

6.4. Testes Robustos de Multiplicador de Lagrange

6.4.1. Teste ML*
robusto
Conforme destacado anteriormente, os testes do tipo multiplicador de Lagrange tanto
contra a defasagem quanto contra o erro espacial no apresentam muito poder. O problema
reside no fato de que ML
segue uma distribuio qui-quadrado com 1 grau de liberdade, se =

0. No caso em que houver m especificao local, ou seja, 0, o teste LM
transforma-se em
uma qui-quadrado no centralizada, o que far com que o teste rejeite a nula com muita
freqncia.
Para contornar esse problema, foram desenvolvidas algumas extenses desses testes a fim
de aumentar o seu poder. As verses robustas desses testes procuram lidar com as situaes em
que h m especificao local. Do ponto de vista tcnico, os testes robustos so similares aos
dois testes vistos anteriormente, porm, incorporam um fator de correo para levar em conta a
m especificao local (Florax et al., 2002).
O primeiro teste ML um teste para autocorrelao na forma de erro espacial robusto
para a presena de uma varivel dependente espacialmente defasada, assumindo a seguinte
forma:
4

( )] 1 [
] [
2
2 1 2
*
C T T
d C T d
ML
=

(6.23)

2
) ( )' ( T WXb M WXb C + = (6.24)

) ' ( W W WW tr T + = (6.25)

4
Assume-se que o processo estocstico espacial representado por uma nica matriz de pesos espaciais W (W
1
=W
2
).
_____________________________________________________________________________
em que d
e d
so, respectivamente, os escores para o erro e a defasagem.

Esse teste segue uma distribuio qui-quadrado com um grau de liberdade. Na frmula do
teste includo um fator de correo da no-centralidade da distribuio qui-quadrado. Observe
que o teste ML
*
corrige o teste ML
para a presena de 0 por meio de d
e da incorporao
da covarincia entre d
e d
na frmula.
Quanto propriedade de pequena amostra, de acordo com Anselin e Florax (1995), ML
*

robusto poderoso, sobretudo quando realmente se est na presena de . Conforme
Anselin e Bera (1998, p. 277), no caso em que realmente no existe autocorrelao na forma de
defasagem, mas somente autocorrelao na forma de erro, o poder do teste robusto ML
0
*

menor que teste ML
. Isso chamado de custo da robustificao, ou seja, o preo a ser pago

para tornar o teste ML robusto.

6.4.2. Teste ML*
robusto
Tecnicamente, tal teste similar ao teste ML
, no qual testado = 0, porm, agora

incorporando um fator de correo com o intuito de lidar com a m especificao local do
modelo, ou seja, neste caso, . O teste ML para uma varivel dependente defasada
espacialmente na presena de um processo de erro espacial autorregressivo assume a seguinte
forma:
0

(
=
T
C
d d
ML
2
2
*
] [
(6.26)

em que toda a notao permanece a mesma que no teste anterior. Tal teste distribudo conforme
um qui-quadrado com um grau de liberdade. O fator de correo do teste ML*r para a m
especificao local envolve o vetor escore d
e a covarincia entre entre d
e d
na frmula.
Quanto a propriedades para pequenas amostras, segundo Anselin e Florax (1995), ML*

robusto tem um bom desempenho em termos de poder do teste. Anselin e Rey (1991)
encontraram que os testes para defasagem espacial so mais poderosos que os testes para erro
_____________________________________________________________________________
espacial, o que interessante, pois as conseqncias de ignorar a autocorrelao espacial na
forma de defasagem mais sria que na forma de erro. Isso porque, conforme vimos no quinto
captulo, desconsiderar a defasagem espacial no modelo acarreta estimativas viesada e
inconsistente, ao passo que desconsiderar o erro espacial no modelo provoca a ineficincia nas
estimativas, porm estas permanecem no-viesadas e consistentes.

6.5. Outros Testes

6.5.1. Teste Wald
O teste assinttico do tipo Wald pode tambm ser usado para averiguar a dependncia
espacial tanto na forma de defasagem quanto na forma de erro. A frmula da estatstica do teste
para a defasagem dada por:

| | ( )
) 1 , 0 ( ~ N
Var asy
Wald
= (6.27)

J o teste Wald para o erro espacial dado pela frmula:

| | ( )
) 1 , 0 ( ~ N
Var asy
Wald
= (6.28)

Note as estatsticas do teste seguem uma normal padronizada. Se a estatstica de Wald for
elevada ao quadrado segue uma distribuio qui-quadrado com um grau de liberdade.

6.5.2. Teste do tipo Razo de Verossimilhana (RV)
Trata-se de um teste do tipo Razo de Verossimilhana especfico unidirecional. Assim
como o teste Wald, o teste do tipo RV pode ser utilizado para verificar a autocorrelao espacial
tanto na forma de defasagem quanto de erro. As estatsticas do teste so dadas por:
_____________________________________________________________________________

| | (
+ =
i
i defasagem MQO
n RV
1 ln 2 ln ln
2 2
) (6.29)

| | (
+ =
i
i erro MQO
n RV
1 ln 2 ln ln
2 2
) (6.30)

em que
i
so autovalores da matriz de pesos espaciais W.
Ambos as estatsticas seguem uma qui-quadrado com um grau de liberdade.

6.6. Procedimento de Identificao de Modelos
Florax et al. (2002) propuseram uma estratgia de identificao hbrida, abrangendo os
testes clssicos e robustos para a autocorrelao com os seguintes passos:

1
o
passo: estime o modelo clssico de anlise de regresso linear por meio de MQO.

2
o
passo: teste a hiptese de ausncia de autocorrelao espacial devido a uma defasagem ou a
um erro por meio das estatsticas ML
e ML
.

3
o
passo: caso ambos os testes no sejam significantes, use o modelo clssico como o modelo
mais apropriado. Caso contrrio, siga para o prximo passo.

4
o
passo: caso ambos sejam significantes, estime o modelo apontado como o mais significante
pelas verses robustas desses testes ML
*
e ML
*
. Por exemplo, se ML
*
> ML
*
, use o modelo
com a defasagem como o mais apropriado. Caso ML
*
> ML
*
, use o modelo de erro

autorregressivo espacial como o mais apropriado. Caso contrrio, siga para o prximo passo.

5
o
passo: se o teste ML
*
significante e o ML
*
no, adote o modelo de defasagem espacial.

Caso contrrio, v para o prximo passo.
_____________________________________________________________________________

6
o
passo: se o teste ML
*
significante e o ML
*
no, adote o modelo de erro espacial.

6.7. Concluses
O desenvolvimento dos testes seguiu uma trajetria de problema-soluo comum na
cincia. Os primeiro testes eram gerais que tinham como problema principal a incapacidade de
identificar a forma da autocorrelao espacial (defasagem ou erro), quando a hiptese nula era
rejeitada.
A soluo envolveu a construo de testes especficos que tinham a vantagem de
especificar a forma da autocorrelao espacial. O problema era a freqncia com que os testes de
multiplicador de Lagrange rejeitavam a hiptese nula. Quando tanto ML
e ML
rejeitavam com
tanta freqncia, o pesquisador fica sem indicaes para identificar o modelo. A soluo foi o
desenvolvimento dos testes de ML robustos com elevado poder.
Ao contrrio do que o senso comum poderia sugerir, o teste bidirecional MLlr no a
composio de ML
e ML
. O teste bidirecional pode ser decomposto pelo

ML
= ML*
+ ML
= ML
+ ML*

Assim, o teste ML bidirecional para e pode ser decomposto na soma da verso
robusta do teste para uma alternativa ( ou ) e o teste ML no-robusto para a outra alternativa.
Por fim, vale destacar que os testes do tipo ML, RV e Wald so assintoticamente
equivalentes. Porm, para pequenas amostras, respeitam o seguinte ordenamento:

W > RV > ML

Caso esse ordenamento no seja respeitado, isso pode ser interpretado como uma
evidncia de problemas de m especificao do modelo.
_____________________________________________________________________________
CAPTULO 7
MODELANDO A HETEROGENEIDADE ESPACIAL

7.1. Introduo
Na economia aplicada, segundo Anselin (1990, p. 185), comum assumir que a relao
de interesse estvel atravs do espao. A bem da verdade, a hiptese da homogeneidade
espacial, entendida como um processo no qual h as mesmas respostas, independente da
localizao ou da escala espacial, , sem dvida, herica no mundo real.
Para ver esse grau de herosmo, vamos voltar nossa funo de produo agrcola para
Minas Gerais. Um aspecto interessante a abordar a diversidade das caractersticas rurais das
regies de Minas Gerais, mesmo que de uma forma estilizada. A agropecuria feita em grandes
propriedades com direcionamento para o mercado, em especial para exportao, concentra-se no
Tringulo Mineiro/Alto Paranaba, Noroeste e Norte, com destaques na plantao de gros com a
ampla utilizao de insumos modernos. Essas duas regies tm o solo de cerrado e representam
uma explorao agrcola mais recente em comparao com as outras regies, em virtude do
avano da fronteira agrcola do Estado. J a agricultura das regies do Sul/Sudoeste e Oeste
caracterizada pela pequena propriedade e produo para o mercado, sobretudo interno.
Um conjunto de regies Zona da Mata, Campo das Vertentes, Vale do Mucuri e Vale
do Jequitinhonha tem por caracterstica a agricultura de subsistncia por meio de pequenas
propriedades. A regio do Vale do Rio Doce tambm ostenta uma agricultura de subsistncia,
porm ao lado de uma pecuria de mercado. As regies Central e Metropolitana de Belo
Horizonte tm uma taxa elevada de urbanizao, limitando o espao para a realizao de
atividades agrcolas. A despeito disso, sua vocao para a produo de hortifrutigranjeiros para
abastecer os seus mercados. Todavia, essas duas regies desempenham principalmente o papel
de serem o grande mercado consumidor para a produo agropecuria das outras regies do
Estado.
_____________________________________________________________________________
Como se pode observar do relato acima, a tnica a heterogeneidade das caractersticas e
das condies agrcolas e rurais do Estado de Minas Gerais e no a sua homogeneidade ao longo
do espao.
Conceitualmente, heterogeneidade espacial significa que existem respostas distintas aos
estmulos proporcionados por um fenmeno em estudo, dependendo do lugar onde ocorrem. Em
outros termos, a heterogeneidade espacial est associada falta de estabilidade estrutural.
Ao no trat-la convenientemente no modelo, paga-se um preo alto. Em alguns casos,
como veremos abaixo, possvel acarretar em estimativas viesadas. Conseqncias: estimativas
viesadas e inconsistentes, perda de eficincia e previses sub-timas. Essa instabilidade
estrutural pode ser manifestada de vrias maneiras tais como coeficientes variveis, varincia
no-constante ou mesmo formas funcionais diferentes para cada sub-conjunto dos dados.
Formal e genericamente, podemos representar todas as possibilidades de manifestao da
heterogeneidade espacial como:

) (
i i i i
u X f y + =

) , 0 ( ~
i
u (7.1)

em que uma matriz de varincia-covarincia diagonal.

=
2
2
2
2
0 0
0 0
0 0
0 0
i
i
i
i
L
M
M
L
(7.2)

Convm notar que nessa matriz de varincia-covarincia diagonal, no est sendo
representada autocorrelao espacial. Na prtica, em virtude do imbricamento entre os efeitos
espaciais, pode-se verificar o aparecimento conjunto de heterocedasticidade e autocorrelao
espacial.
_____________________________________________________________________________
Essa equao destaca os trs aspectos da questo da heterogeneidade espacial. O primeiro
aspecto diz respeito instabilidade estrutural expressa na forma de coeficientes (ou parmetros)
variveis no espao (
i
). Isso denominado como mudana estrutural. Fenmenos scio-
econmicos podem levar mudana estrutural.
Um caso extremo seria um modelo no qual cada observao fosse diferente,
correspondendo a um particular coeficiente. Teramos n coeficientes para serem estimados. Caso
tentssemos inserir uma dummy para cada observao, incorreramos num problema de
estimao, denominado problema do parmetro incidental, no qual o nmero de parmetros a ser
estimado cresce com o tamanho da amostra.
O segundo aspecto refere-se heterocedasticidade (u
i
e ), cuja fonte a omisso de
variveis no-medidas no modelo que levam no constncia da varincia do erro. O problema
da heterocedasticidade provoca instabilidade estrutural nos resultados da regresso, causando a
perda de eficincia.
O terceiro aspecto da heterogeneidade espacial trata da forma funcional distinta (f
i
). O
tratamento da heterogeneidade na forma funcional pela literatura rara. No trataremos da
heterogeneidade na forma funcional nesta apostila.
Vamos analisar cada um desses aspectos mais detidamente abaixo.

7.2. Heterogeneidade Espacial nos Coeficientes (
i
)
Alguns processos espaciais podem acarretar distintas respostas na forma de diferentes
interceptos ou inclinaes.

7.2.1. No intercepto
7.2.1.1.SANOVA
A tcnica ANOVA espacial tem por objetivo averiguar a existncia de diferena
significativa da mdia de uma varivel de interesse atravs de subconjuntos dos dados. Isso
consiste em regredir a varivel de interesse y contra variveis dummies (ou indicadores de
tratamento geogrfico), referentes a clusters, e um termo constante. Formalmente:

_____________________________________________________________________________
+ = REG y
i
+ (7.3)

em que a mdia geral da regressso, um parmetro a ser estimado e REG uma dummy
ou um indicador de tratamento geogrfico, um termo de erro bem comportado.
Um valor altamente significante para o coeficiente REG indica que existe uma
discrepncia considervel entre a mdia de cada cluster com relao mdia geral representada
pela constante da regresso a. Se esse valor for positivo significa que a discrepncia para cima
da mdia geral; se for negativa, h uma discrepncia para baixo.

7.2.1.2.Anlise de Tendncia Espacial
Uma superfcie pode ser decomposta em dois principais componentes, a saber, uma
tendncia global determinstica e uma variao aleatria de curto alcance. A anlise de tendncia
espacial tem por objetivo encontrar e identificar tendncias espaciais globais nos dados.
O modelo simples, pois trata-se de uma regresso polinomial nas coordenadas das
unidades espaciais, l
1i
e l
2i
. Para uma especificao quadrtica, temos que:

+ + + + + + =
i i i i i i i
l l l l l l y
2 1 5
2
2
2
1 3 2 2 1 1
(7.4)

Uma extenso do modelo incluir na regresso um conjunto de variveis explicativas (X)
e seus respectivos parmetros. Em funo da quantidade de variveis de coordenada
multiplicadas entre si e elevadas ao quadrado, um problema muito comum a forte
multicolinearidade que aflora com esse tipo de modelo.
Um modelo de superfcie de tendncia pode ser til para limpar os dados das tendncias
espaciais, significando uma forma de suavizar os dados. Alm disso, um modelo desse tipo pode
ser usado para fazer interpolao espacial, ou seja, fazer previso para regies que no tem
informao ou o dado est ausente. Todavia, esse tipo de modelo recebe a crtica de que sofre de
determinismo geogrfico.
_____________________________________________________________________________
Vamos exemplificar esse tipo de regresso com as taxas de crime de Minas Gerais em
nvel municipal como funo das coordenadas, l
1i
, l
2i
, os quadrados de l
1i
e l
2i
, componente de
interao, l
1i
*l
2i
. Os resultados dessa regresso so apresentados na tabela 7.1.
Todos os coeficientes negativos para l
2i
so significantes, indicando uma tendncia
quadrtica Oeste-Leste na forma de um U invertido. Por outro lado, parece no haver uma
tendncia espacial quadrtica na direo Norte-Sul.

Tabela 7.1: Modelo de Tendncia Espacial para Taxas de Crime em MG
.01.

.2.2. Na inclinao
e Regimes Espaciais
variveis independentes
Constante -255,46
(-2,10)**
l
1i
-6,37
(-1,30)
l
2i
-10,17
(-2,54)**
l
1i
2
-0,07
(-1,26)
l
2i
2
-0,34
(-4,45)***
l
1i
.l
2i
0,07
(0,75)
R
2
ajust. 0,15
Nota: estatstica t em parnteses; * p<=0.1; ** p<=0.05 ; ***p<=0

7
7.2.2.1. Modelo d
_____________________________________________________________________________
R es espaciais afloram por causa d egim a heterogeneidade ou instabilidade na estrutura do
fenme
regimes espaciais compreender que existem respostas
distinta
(7.5)

Note que o conjunto de dados foi dividido em m partes. Para isso, usa-se uma varivel
indicad
o seja diferente em cada regime. Formalmente,
temos q
(7.6)

no estudado ao longo do espao. Regimes espaciais significam que um modelo de
regresso no pode ser ajustado para todos os dados, mas apenas para alguns subconjuntos da
base de dados. Esses subconjuntos so definidos por algum critrio geogrfico. A conseqncia
prtica que os coeficientes da regresso no so mais invariantes para todo o conjunto de
dados, mas o intercepto ou as inclinaes do modelo variam conforme o regime espacial. Num
grau mais intenso, os regimes espaciais nos dados podem levar heterocedasticidade, isto ,
no-constncia das varincias do erro.
A idia por trs do modelo de
s dependendo dos subconjuntos dos dados. Cada regime espacial representaria uma parte
do banco de dados que exibe uma determinada resposta a um fenmeno. Tal tipo de
heterogeneidade manifesta-se tanto no intercepto quanto na inclinao da regresso, mas na
forma de variao discreta. Formalmente, para o caso com m regimes espaciais:

m m m m
u
u
X
X
y
y
M
M
M
M
L
O M
M O
L
M
M
1 1 1 1
0 0
0 0
0 0
0 0

ora discreta. Assim, n=n
1
+ n
2
+ ... +n
m
.
Uma alternativa que a varincia do err
ue:

=
m m
I
I
2
1
2
1
0 0
0 0
0 0
0 0
L
O M
M O
L
_____________________________________________________________________________
importante avaliar a estabilidade estrutural do modelo por intermdio de testes. Existe
um con
ado na comparao da soma dos resduos ao quadrado
de uma

Outro teste adotado o teste Wald. Levando em considerao a mesma hiptese nula do
rimeir
(7.6)

m que g uma matriz k por 2k [I
k
I
k
], com I
k
sendo uma matriz identidade de k por k.
raus de
liberda
.2.2.2. Modelo de expanso espacial
hete a regresso pode se manifestar na forma de uma
varia

(7.7)

Suponha que cada coeficiente de regresso dependa de uma funo linear de um conjunto
de m va
junto de testes com tal propsito.
Adota-se o teste Chow, que base
regresso usando todo o conjuntos de dados com a soma dos resduos ao quadrado
obtidos quando todo o conjunto de dados dividido em sub-amostras. Esse teste verifica a
estabilidade dos coeficientes da regresso atravs dos regimes espaciais. Formalmente:

H
m
= = = L
2 1 0
:

p o modelo, o teste Wald para a estabilidade estrutural assume a forma:

[ ] { } ) ' ( ) var( ' ) ' (
1
1
b g g b g b g ald

= W
e
O teste Wald distribudo como uma qui-quadrado (
2
) com (m - 1)*k g
de.

7
A rogeneidade nos coeficientes d
o contnua e no discreta, como o caso do modelo de regimes espaciais. Um modelo que
comporta isso aquele apresentado por Casseti (1972), adaptado para o contexto espacial.
Considere o seguinte modelo bsico:
y
i ik k i i
x x + + + + = K
1 1
riveis de expanso:

_____________________________________________________________________________
m m
l l l
1 2 21 1 11 01 1
+ + + = K + (7.8)

m que l so variveis de expanso.

(7.9)

Substituindo (7.9) em (7.7), vem que:

(7.10)

Vale a pena tecer alguns comentrios. No contexto espacial, as variveis de expanso so
latitude
leatria. Para torn-la aleatria, muito
simples
(7.11)

O interessante nesse caso que com a especificao aleatria acarreta que ao problema

(7.12)

Analisando a varincia desse modelo:
e
Mais especificadamente:
2 2 1 1 0 1
l l + = +
y + + + + = x l x l x
2 2 1 1 0
(l
1
) ou longitude (l
2
). Originalmente, as variveis de expanso podem ser inclusive
algumas variveis da matriz X ou variveis como renda.
Note que a especificao determinstica e no a
, bastando adicionar um componente de erro aleatrio:

+ + =
2 2 1 1 0 1
l l +

dos coeficientes variveis adicionada a heterocedasticidade no erro. Para ver isso, basta
substituir:

y
i i i i i i i
u x l x l x + + + + =
2 2 1 1 0

u
i i i i
x + =

_____________________________________________________________________________

[ ] [ ] [ ]
i i i i
Var x Var u ar
2
+ = V (7.13)

Claramente a varincia no constante, pois varia com x
i
. Caso sejam relevantes, a
iss
(7.14)

m que M = I L(LL)
-1
L; X=[ x] e L=[l
1
*x l
2
*x]
tes de regresso, testa-se a significncia
conjun

Esse teste segue uma distribuio F com m.(k-1), n - m.(k-1) graus de liberdade para
regress
.3. Heterogeneidade no Erro
.3.1. Modelos
seguinte modelo de erro heterocedstico:

(7.15)

om o das variveis de interao no modelo resulta em vis nas estimativas.

My X MX X ' ) ' (
1
= b
e
Para averiguar a estabilidade dos coeficien
ta dos coeficientes expandidos. A hiptese nula assume a forma:

H
mk k k
l l l = = = K
2 1 0
:
es estimadas por MQO. Para outros mtodos de estimao, adota-se o teste Wald
assinttico, seguindo uma qui-quadrado com m.(k-1) graus de liberdade.

7

7
Considere o
y u X + =
[ ] = ' uu E
_____________________________________________________________________________
A matriz de covarincia com a diagonal com a varincia e valores nulos nas outras
caselas
(7.16)

m que Z uma matriz N por P com as variveis heterocedsticas como colunas e um vetor
rs variantes do modelo de erro heterocedstico, a saber, em grupos (ou
gime
lema com o modelo de erro heterocedstico, em qualquer de suas variantes,
os nesta apostila, a
es) de natureza claramente
discret
sticas que compem a matriz Z so o indicador categrico discriminador
bservar que esse modelo no inclui constante, logo o teste Wald verifica a
igualda
a de que a varincia do erro distingue atravs
dos reg
elo de erro heterocedstico em grupos, o teste Wald verifica a igualdade das
varincia em cada grupo (supondo g grupos):
2
i
. preciso especificar uma forma definida para a varincia no constante. Vamos sugerir
uma especificao aditiva:

Z
i
=
2
e
de coeficientes.
Existem t
re s), genrico e com coeficiente aleatrios. A diferena entre eles reside na especificao da
matriz Z e na natureza contnua ou discreta da heterocedasticidade. Veremos cada um deles nas
prximas subsees.
O grande prob
que a varincia estimada pode no ser positiva, como requerida pela teoria.
Vamos analisar os trs modelos de erro heterocedstico que estudarem
saber, em grupos, genrica e de coeficientes aleatrios.
O modelo do erro heterocedstico em grupos (ou regim
a. H a necessidade de se especificar um indicador categrico para discriminar os grupos
ou regimes nos dados.
As variveis heteroced
dos grupos ou regimes espaciais. Note que, pelo menos, uma varivel heterocedstica precisa ser
especificada.
Cabe o
de da varincia em cada regime ou grupo.
A heterocedasticidade manifesta-se na form
imes, porm, constante dentro do regime. A varincia estimada por meio dos resduos
para cada regime.
Para o mod
_____________________________________________________________________________

de erro heterocedstico genrico qualquer varivel do conjunto de dados,
mada ao quadrado, pode ser includa na matriz de variveis heterocedsticas Z. Convm
observa
espao. Para o modelo genrico, o teste
Wald a
Na especificao da matriz Z do modelo de erro heterocedstico com coeficientes
aleatrios, so includos os quadrados de todas as variveis explicativas. Formalmente, o modelo
pode se
(7.17)
Ou
aptura o efeito mdio () e um termo de variao aleatria
i
.
(7.18)
H
0
:
2
1
= ... =
2
g

No modelo
to
r que, mesmo a varivel heterocedstica sendo tomada ao quadrado, isso no garante que
a varincia do erro estimada seja negativa. Evidentemente, uma varincia negativa no faz
sentido algum e representa, na realidade, um problema.
Na especificao da varincia de erro heterocedstico includa uma constante, que pode
ser interpretada como a varincia constante atravs do
verigua a significncia conjunta dos outros coeficientes na especificao heterocedstica.
Outro teste a razo de verossimilhana (RV) que consiste em computar duas vezes a
diferena entre o log-verossimilhana no modelo de erro heterocedstico e o log da
verossimilhana no modelo de regresso convencional com o mesmo conjunto de variveis (p.
223)

r expresso como:

i i i i
u x y + + =

i i
+ =
seja, o parmetro varivel espacialmente pode ser decomposto em um termo que
c
Substituindo :

i i
y + =
i i i
x u x + +
_____________________________________________________________________________

Analisando a va
(7.19)
Claramente a varinc
Segundo Anselin (1988, p. 130), esse modelo pode ser estimado usando a abordagem da
mxim
eriguao da significncia conjunta dos coeficientes na especificao
heteroc
do Modelo de Erro Heterocedstico
Para estimar o modelo de erro heterocedstico, existem dois mtodos: os mnimos
s passos e os mnimos quadrados
genera
, no primeiro
passo,
(7.20)
No segun
e
1
. Com base nessas varincias do erro estimadas computada a segunda estimativa de
2
,
conforme a expresso:

rincia desse modelo:

[
i
u Var
ia no constante, pois altera-se com cada x
i
.
]
2 2 2
i u i i
x x

+ = +

a verossimilhana.
Assim como para o modelo genrico, no modelo com coeficientes aleatrios, o teste
Wald pode ser usado na av
edstica.

7.3.2. Estimao
quadrados generalizados factveis (MQGF) em tr
lizados factveis iterativo (MQGFI). O mtodo MQGF em trs passos usado para estimar
o modelo de erro heterocedstico genrico e com coeficientes aleatrios. J o mtodo MQGFI
pode ser utilizado para estimar as trs variantes do modelo de erro heterocedstico.
O mtodo dos mnimos quadrados generalizados factveis (MQGF) em trs passos foi
proposto por Amemiya (1985). O procedimento de estimao tem seu incio quando
os quadrados dos resduos da regresso estimada por MQO so regredidos contra as
variveis heterocedsticas da matriz Z para gerar a primeira estimativa de .

( )
2 1
1
' '
e Z Z Z

=

do passo, as varincias do erro so estimadas por meio do vetor de estimativas
d
_____________________________________________________________________________
(
2
Z = )
2 2
1
2
' ' e D Z Z D

(7.21)

em que D uma matriz diagonal cujos elementos so Z
1
.
No terceiro passo, a estimativa
3
calculada como:

(7.22)

em que uma matriz diagonal cujos elementos so Z
3
.
O outro mtodo de estimao o MQGF de forma iterativa. A iterao do mtodo
melhora a eficincia e
erossimilhana (MV).
7.3.3.
ultiplicador de Lagrange (ML) sobre a remanescente
ependncia espacial na forma do erro e dependncia espacial na forma de defasagem num

( )
2 1
1
1
3
' ' e Z Z Z

=
, caso os erros sejam normais, equivalente estimao de mxima

v

Testes contra o Erro Heterocedstico
Para o mtodo MQGF iterativo, temos os teste Wald e de razo de verossimilhana (RV)
sobre a heterogeneidade e o teste de m
d
modelo heterocedstico.
( )
2
2
1
'
'
W W W tr
We e
erro
+

( )
ML = (7.23)
m que e so os erros da estimao MQGF iterativa (equivalente MV).

e
( )
( ) [ ]
2
2
1
'
'
W W W tr D
Wy e
ML
defasagem
+ +

=

(7.24)
m que .

( ) ( ) ( ) ( ) ( ) WXb X X X X WXb WXb WXb D
1
1
1 1 1
' ' ' '

= e
_____________________________________________________________________________
Uma vez que existe o imbricamento entre os efeitos espaciais, interessante ver um teste
do tipo ML num modelo afligido pela conseqncia desse imbricamento, ou seja, um teste para
utocorrelao espacial com heterocedasticidade. A estatstica do teste pode ser expressa por: a

( )
T
We e
Erro Het
2
1
_
'

= ML (7.25)

( )
1
+ = W W WW tr T ' (7.26)
em que uma matriz consistente de varincia-covarincia.

_____________________________________________________________________________
CAPTULO 8
APLICAO AGRICULTURA

8.1. Introduo
Ao longo de nossa exposio um exemplo recorrente foi a construo de uma funo de
produo agrcola para Minas Gerais. Pudemos ilustrar vrias ferramentas de anlise, conceitos e
modelos com esse exemplo.
Chegou o momento de aplicarmos a anlise economtrica espacial para identificar e
estimar a funo de produo agrcola, bem como fazer o diagnstico dos resultados da
estimao.

8.2. Dados
A base de dados para a aplicao ilustrativa da funo de produo oriunda de vrias
fontes. Em primeiro lugar, como a teoria neoclssica da produo recomenda, todas as variveis
so medidas de quantum.
A varivel dependente a rea plantada de todas as culturas agrcolas, temporrias ou
permanentes, cuja fonte de dados a Pesquisa Agrcola Municipal do IBGE para o ano de 1996.
A explicao para se usar essa varivel aproximada deve-se que, em qualquer processo de
produo, mas principalmente na agricultura, a deciso sobre o uso dos insumos primrios e
intermedirios realizada antes que o bem seja efetivamente produzido. Quando os produtores
decidem adquirir uma certa quantidade de insumos, tal deciso embute um nvel planejado de
produo. Contudo, isso envolve um problema terico e prtico, pois o nvel planejado de
produo existe apenas na cabea dos produtores e no pode ser observado. Nesse sentido, na
agricultura, a rea plantada considerada a melhor proxy para o nvel planejado de produo.
As variveis independentes que compem a funo de produo so trabalho, capital e o
estoque de infraestrutura de transportes, a saber, a densidade rodoviria e a densidade ferroviria.
Vamos comear descrevendo a fonte de dados para os insumos primrios, trabalho e
capital. Convm notar que, de propsito, escolheu-se um perodo imediatamente anterior ao
_____________________________________________________________________________
perodo da rea plantada, pois, como j anteriormente comentado, adquire-se capital e trabalho
para posteriormente plantar a rea da lavoura. Assim sendo, as quantidades de trabalho e de
capital vm da Base de Informaes Municipais (BIM), tambm do IBGE, e apresentam os
nveis para dezembro de 1995. Alm disso, no h problemas de endogeneidade de trabalho e
capital, como se observa em algumas estimaes de funo de produo. Essa propriedade
decorre do fato de termos escolhido as quantidades desses fatores no comeo do perodo do
processo de produo agrcola, ao passo que a varivel dependente, ou seja, um indicador de
produo, rea plantada posteriormente.
Os dados para as variveis de densidade rodoviria pavimentada e no-pavimentada,
assim como a densidade ferroviria, so extrados da Pesquisa Multimodal de Transportes
(PMT), realizada pela Secretaria de Planejamento para o ano de 1992. Conseqentemente,
assume-se que tanto as densidades rodoviria e a ferroviria no se alteraram significativamente
at 1996, que representa o ano em que a varivel dependente est medida. Tal pressuposto
muito razovel para a densidade ferroviria, j que no foram realizados investimentos de
ampliao da malha ferroviria para Minas Gerais durante o perodo entre 1992 e 1996. Esse
pressuposto para a densidade rodoviria tampouco apresenta problemas, porque mesmo
considerando que uma determinada quantidade de estradas foi construda no Estado de Minas
Gerais, nada que seja significativo para que influsse substancialmente na densidade.
O conjunto de dados tem a natureza de cross-section para as micro-regies de Minas
Gerais, assim, o tamanho da amostra composto por 66 observaes. A escolha da desagregao
regional por micro-regio deve-se ao fato de que os dados de infraestrutura de transporte esto
disponibilizados para esse nvel geogrfico, fazendo com que toda a base de dados fosse
determinada para tal desagregao regional. Cabe observar que todas as variveis so definidas
em termos per capita.
O Mapa 8.1 exibe a distribuio espacial da rea plantada pelas micro-regies de Minas
Gerais em 1996.
_____________________________________________________________________________
Mapa 1. Distribuio da rea plantada em Minas Gerais (1996)
5.170 a 20.737
20.738 a 37.539
37.540 a 60.132
60.133 a 113.253
113.254 a 197.202
200 0 200 400 Miles
N
E W
S
rea plantada (he)

Definidas as variveis e suas fontes, a forma funcional escolhida recai na especificao
de uma funo Cobb-Douglas. A principal limitao da funo Cobb-Douglas so as
elasticidades de substituio unitrias entre os insumos. Essa limitao poderia ser contornada
com a adoo de uma forma funcional mais flexvel como a funo translogartmica (translog).
Porm, essa ltima forma tampouco est isenta de limitaes, tais como o crescimento do
nmero de parmetros a ser estimado em funo dos termos quadrticos e cruzados, que podem
produzir multicolinearidade na regresso. Alm disso, a interpretao desses termos, muitas
vezes, tortuosa.

8.3. Resultados da Estimao
Como a autocorrelao espacial e a heterocedasticade so processos intimamente
associados, e cuja separao constitui-se numa difcil tarefa, a estratgia de identificao do
melhor modelo economtrico espacial basear-se- em tratar inicialmente a autocorrelao
_____________________________________________________________________________
espacial e testar, a posteriori, para heterocedasticidade e a remanescente autocorrelao nos
resduos.
As regresses (1) a (6) foram estimadas por MQO. Para se fazer a estimao, a funo
Cobb-Douglas precisa ser linearizada, tomando o logaritmo de todas as variveis que a
compem. Antes de analisar especificadamente cada uma, vale tecer comentrios gerais a
respeito dos resultados gerais das estimaes, ou seja, as caractersticas que so comuns
maioria das regresses. Com esse propsito, h um conjunto de propriedades apreciveis que
partilhado por todas elas. O poder de explicao das regresses estimadas por MQO alto,
conforme medido pelo valor do coeficiente de determinao (R
2
), todos acima de 86%.
possvel detectar uma estabilidade dos coeficientes estimados ao longo das regresses, dando
uma indicao de sua robustez, alm de todos os sinais estarem teoricamente corretos.
Na primeira regresso, a quantidade planejada especificada como funo de trabalho
per capita (l), capital per capita (k), densidade de rodovias pavimentadas (rp) e no-pavimentadas
(rnp) e a densidade ferroviria (f).
A constante numa funo de produo do tipo Cobb-Douglas tem o significado de ser o
parmetro de eficincia comum a todas as regies. Em todas as regresses, tal parmetro
mostrou-se significante e positivo. Outra regularidade compartilhada por todas as regresses o
fato de que o capital revela-se o insumo que mais contribui para o nvel de produo agrcola.
Sua elasticidade superior ao do fator trabalho, fornecendo indicaes do intenso processo de
mecanizao das lavouras em Minas Gerais.
No tocante influncia da infraestrutura, no h evidncias de que a densidade
ferroviria tenha uma contribuio relevante para a produo agrcola. em Minas Gerais, como
isso pode ser apreciado na regresso (1). O coeficiente estimado para essa varivel no se mostra
significante estatisticamente nos nveis de significncia convencionais.
Os outros elementos da infraestrutura de transportes, as rodovias pavimentadas e no
pavimentadas apresentam-se estatisticamente significantes para todas as regresses da Tabela
8.1. Duas observaes merecem registro. Em primeiro lugar, a elasticidade-rodovia pavimentada
sempre superior elasticidade-rodovia no-pavimentada em todas as regresses estimadas. Em
segundo lugar, a varivel rodovia pavimentada exibiu sempre um maior nvel de significncia.
_____________________________________________________________________________
Convm lembrar que a rede de rodovias no-pavimentadas , na sua maioria, constituda por
estradas vicinais, presentes no meio rural. Pelos resultados aqui apresentados, h evidncias de
tais estradas cumprem um papel relevante para a produo agrcola, apesar de que a maior parte
das estradas vicinais apresentem precrias condies de pavimento.
Os efeitos de transbordamento da infraestrutura de transportes so tambm avaliados em
vrias regresses. Na regresso (2) da Tabela 8.1, especificou-se um modelo de
transbordamentos de todos os elementos da infraestrutura de transportes, ao passo que nas
regresses (3), (4) e (5), continuou-se testando a significncia dos efeitos de transbordamento,
contudo, eliminando progressivamente os efeitos que no haviam sido significantes do ponto de
vista estatstico.
Na verdade, nenhum deles foi significativamente diferente de zero, tanto para as rodovias
pavimentadas (Wrp) quanto para as no-pavimentadas (Wrnp). Tampouco o efeito de
transbordamento das ferrovias (Wf), vale dizer, a densidade ferroviria dos vizinhos tem impacto
positivo sobre a produo agrcola, como pode ser observado pelos resultados da regresso (2). A
concluso que no h evidncias de efeito de transbordamento dos transportes dos vizinhos
para a produo agrcola.
Uma vez que nenhum efeito de transbordamento de primeira ordem mostrou-se
estatisticamente diferente de zero, no houve motivo para testar a existncia de efeitos de
transbordamento de segunda ordem para nenhum elemento da infraestrutura de transporte.

Tabela 8.1: Resultados da Estimao das Regresses
_____________________________________________________________________________

Coeficientes
(1) (2) (3) (4) (5) (6) (7) (8)
Const. 4,419 6,029 5,523 5,555 4,653 4,371 4,093 4,376
(9,403) (5,348) (5,153) (5,219) (8,755) (9,860) (10,450) (10,908)
[0,000] [0,000] [0,000] [0,000] [0,000] [0,000] [0,000] [0,000]
l 0,367 0,399 0,379 0,381 0,363 0,361 0,394 0,362
(6,906) (7,096) (7,179) (7,284) (7,261) (7,232) (7,045) (7,983)
[0,000] [0,000] [0,000] [0,000] [0,000] [0,000] [0,000] [0,000]
k 0,598 0,558 0,566 0,549 0,612 0,600 0,552 0,488
(10,381) (7,295) (7,413) (7,832) (10,494) (10,540) (8,017) (7,670)
[0,000] [0,000] [0,000] [0,000] [0,000] [0,000] [0,000] [0,000]
rp 0,171 0,196 0,188 0,192 0,174 0,176 0,160 0,198
(2,100) (2,370) (2,309) (2,386) (2,176) (2,209) (2,453) (2,733)
[0,040] [0,021] [0,025] [0,020] [0,033] [0,031] [0,014] [0,006]
rnp 0,103 0,086 0,088 0,099 0,083 0,102 0,093 0,100
(4,500) (2,889) (2,942) (4,428) (2,828) (4,542) (3,988) (4,927)
[0,000] [0,005] [0,005] [0,000] [0,006] [0,000] [0,000] [0,000]
f 0,006 -0,005
(0,330) (-0,239)
[0,742] [0,812]
Wrp 0,114 0,153 0,186
(0,683) (0,936) (1,223)
[0,497] [0,353] [0,223]
Wrnp 0,054 0,030 0,047
(1,005) (0,568) (0,963)
[0,319] [0,572] [0,339]
Wf 0,058
(1,513)
[0,136]
0,540
(4,157)
[0,000]
0,250
(3,007)
[0,003]
R
2
ajust. 0,867 0,869 0,867 0,869 0,868 0,868 - -
MV -18,290 -15,867 -17,358 -17,538 -17,844 -18,350 -12,967 -14,781
AIC 48,581 49,735 48,716 47,076 47,688 46,700 35,935 41,562
SC 61,719 69,442 64,043 60,214 60,826 57,649 46,883 54,700
N 66 66 66 66 66 66 66 66
MQO MV
Notas: Em parnteses, encontram-se as estatsticas t para as regresses de (1) a (6); ou z para as regresses (7) e (8).
_____________________________________________________________________________
Em colchetes, esto as probabilidades associadas s estatsticas t ou z. Para as regresses (7) e (8), mostrado o R
2

Buse.

A Tabela 8.2 revela o diagnstico para todas as regresses estimadas por MQO. Sem
entrar em mincias, podem-se extrair certas regularidades presentes em todas as regresses. O
diagnstico revela que os erros so normais, o que nos permitir estimar posteriormente os
modelos espaciais pelo mtodo de Mxima Verossimilhana. Pelo teste de White, no h
evidncias de m especificao das diversas regresses. Pelos testes globais para detectar
dependncia espacial (teste I de Moran e o teste KR),
1
h claras evidncias de que os erros esto
autocorrelacionados no espao. Pelos testes especficos do tipo da dependncia espacial (testes
do tipo multiplicador de Lagrange para defasagens e para o erro espacial, bem como suas verses
robustas),
2
h indicaes de que a autocorrelao espacial assume a forma de erro auto-
regressivo.
Em termos de qualidade de ajuste, a melhor regresso estimada por MQO foi a de
nmero (6). Isso foi avaliado com base nos critrios de informao Akaike (AIC) e Schwartz
(SC). Os diagnsticos do modelo (6) indicam que no h problemas graves de
multicolinearidade, conforme isso pode ser apreciado pelo valor assumido do condition number.
Por indicao do teste Jarque-Bera, os erros so normais. Pelo teste Breusch-Pagan, no h
evidncias de erros heterocedsticos.
Quanto autocorrelao espacial, h claros sinais de que este problema est presente na
regresso. Os testes globais I de Moran e o teste de Kelejian-Robinson (KR) mostram
evidncias de que os erros esto autocorrelacionados espacialmente, apesar desses testes serem
incapazes de irem alm disso, isto , fornecendo subsdios de qual modelo economtrico espacial
seria mais apropriado para modelar tal latente autocorrelao. Podemos conseguir mais auxlio
com os testes especficos do tipo multiplicador de lagrange (ML). Com base neles, possvel
notar a alta significncia do teste ML
(erro)
, indicando que os resduos da regresso seguem um
processo estocstico de erro auto-regressivo de primeira ordem. Essa evidncia reforada pela

1
Para uma descrio desses testes, veja Anselin (1988) e Kelejian e Robinson (1998).
2
Para uma descrio desses testes, consulte Anselin (1988) e Florax et al. (2002).
_____________________________________________________________________________
verso robusta desse teste. Em contraste, o teste ML
(defasagem)
no indica que a autocorrelao
existente nos resduos siga um padro de defasagem espacial de primeira ordem.

Tabela 8.2: Diagnsticos das Regresses Estimadas por MQO
Nota: Em colchetes, encontra-se a probabilidade.
Diagnsticos
(1) (2) (3) (4) (5) (6)
Condition number 39,861 112,087 97,477 87,788 97,477 36,506
Jarque-Bera 3,575 3,128 1,037 1,982 1,037 3,428
[0,167] [0,209] [0,595] [0,371] [0,595] [0,180]
Breusch-Pagan 16,440 26,819 19,176 10,877 19,176 12,488
[0,006] [0,001] [0,004] [0,054] [0,004] [0,014]
White 30,652 52,043 35,466 29,348 35,466 23,573
[0,060] [0,189] [0,127] [0,081] [0,127] [0,052]
Moran's I 4,253 4,609 4,870 4,791 4,870 4,210
[0,000] [0,000] [0,000] [0,000] [0,000] [0,000]
Kelejian-Robinson 28,576 42,578 39,311 29,281 39,311 25,454
[0,020] [0,000] [0,000] [0,000] [0,000] [0,000]
ML(erro) 10,968 12,336 15,282 14,923 15,282 11,396
[0,001] [0,000] [0,000] [0,000] [0,000] [0,001]
ML(erro) robusto 5,431 5,963 9,727 9,318 9,727 5,958
[0,020] [0,015] [0,002] [0,002] [0,002] [0,015]
ML(defasagem) 6,714 6,525 5,580 5,618 5,580 6,435
[0,010] [0,011] [0,018] [0,018] [0,018] [0,011]
ML(defasagem) robusto 1,178 0,152 0,025 0,013 0,025 1,000
[0,278] [0,696] [0,874] [0,908] [0,874] [0,318]
MQO

Tendo em mos esse diagnstico, decidiu-se estimar um modelo economtrico espacial
de erros auto-regressivo de primeira ordem para a funo de produo agrcola de Minas Gerais,
conforme pode ser visto pela regresso (7).
Todas as estimativas da regresso (7) tm o sinal esperado e mostram-se estatisticamente
diferentes de zero. O capital e o trabalho desempenham o principal papel na contribuio
produo. Pela especificao da funo log-log, os coeficientes tm uma interpretao de
_____________________________________________________________________________
elasticidade. Assim sendo, um aumento de 10% na quantidade do fator capital provoca um
acrscimo de quase 5,5% na produo. J um aumento de 10% do fator trabalho ocasiona uma
elevao de 3,8% na produo agrcola. A infraestrutura de transporte tambm cumpre a sua
parte. A densidade rodoviria pavimentada, significante em 5%, responde, aps os fatores capital
e trabalho, pela terceira maior contribuio: um acrscimo de 10% nesta varivel engendra uma
elevao de 1,6% na produo agrcola planejada. A densidade rodoviria no-pavimentada,
significante no nvel de 0,01%, vem logo depois, porm, com um efeito menor: um aumento na
sua quantidade de 10% cria as condies para uma subida de quase 1% na produo. O
coeficiente do erro auto-regressivo espacial () altamente significante e positivo, indicando que
os efeitos no modelados apresentam uma autocorrelao espacial positiva, quer dizer, altos
valores desses efeitos so vizinhos de altos valores, ao passo que baixos valores so vizinhos de
baixos valores.

Tabela 8.3: Diagnsticos das Regresses Estimadas por MV
Diagnsticos
(7) (8)
1.Breusch-Pagan 10,597 6,441
[0,031] [0,169]
2. LR 10,765 7,139
[0,001] [0,007]
3. Hiptese do Fator Comum
a) LR 3,807 -
[0,433] -
b) Wald 3,535 -
[0,473] -
4. ML 2,793 7,850
[0,095] [0,005]
MV
Nota: em colchetes, encontra-se a probabilidade.

_____________________________________________________________________________
Como pode ser observada pela Tabela 8.3, a alta qualidade do ajuste dessa regresso
atestada pelo maior valor assumido pela funo de mxima verossimilhana (-12,97) e pelo
menor valor, comparativamente a todas as outras regresses, dos dois critrios de informao
reportados: AIC (35,93) e SC (46,88).
O diagnstico do modelo de erro auto-regressivo espacial no mostra nenhuma anomalia
que merea ateno. Por exemplo, no h evidncias de heterocedasticidade nos resduos no
nvel de 1%, como certificado pelo teste de Breusch-Pagan.
Os testes RV e Wald verificam a hiptese do fator comum. Se tais testes mostrarem-se
significantes, a hiptese de fator comum rejeitada e, por conseqncia, representa que existem
evidncias de m especificao do modelo. Como nem o teste RV nem o teste Wald so
significantes, no h indicaes de que haja inconsistncia na especificao do modelo de erro
auto-regressivo espacial.
Aps a estimao de um modelo economtrico espacial, importante testar se toda a
autocorrelao espacial presente foi incorporada apropriadamente no modelo, no remanescendo
erros dependentes espacialmente. Isso realizado pela aplicao do teste do tipo multiplicador de
lagrange aos resduos da regresso. Pelo resultado reportado na Tabela 8.3, no h evidncias de
existncia remanescente de autocorrelao espacial nos resduos, certificando, assim, que toda a
dependncia espacial dos erros foi apropriadamente modelada.
Todos os testes e as evidncias conduzem concluso de que a estimao do modelo
economtrico do erro auto-regressivo espacial a melhor opo para a funo de produo
agrcola de Minas Gerais. A despeito disso, e ainda devido ao fato de que a identificao um
processo intrincado, uma vez que a autocorrelao espacial e a heterocedasticidade esto
intimamente imbricadas, interessante estimar o modelo economtrico de defasagem espacial de
primeira ordem e comparar os seus resultados com o do modelo de erro auto-regressivo espacial,
previamente estimado. Portanto, esse procedimento pode ser considerado como mais uma
checagem adicional da convenincia da especificao adotada. Isso feito na regresso (8),
conforme pode ser visto nas Tabelas 8.1 e 8.3. A qualidade do ajuste da regresso (8) muito
inferior ao da regresso (7), como atestado pelo valor assumido da funo de verossimilhana,
pelo valor do critrio AIC e pelo valor do critrio SC. Todavia, o grande defeito da regresso (8)
_____________________________________________________________________________
manifesta-se na permanncia de autocorrelao espacial nos resduos, embora tenha-se
incorporado o termo Wy no modelo com o objetivo de trat-la, e estimado o seu coeficiente
associado, . Apesar desse coeficiente ser significante, tal tratamento da autocorrelao espacial
no foi suficiente para elimin-la. Erros autocorrelacionados espacialmente remanescentes na
regresso so uma prova cabal da m especificao do modelo estimado. Por conseqncia, luz
desses resultados nossa confiana sobre a adequao do modelo economtrico de erro auto-
regressivo espacial ficou reforada.

8.4. Concluses
guisa de ilustrao do potencial da anlise economtrica espacial, foi feita uma
aplicao para a agricultura. A construo da funo de produo espacial agrcola para o Estado
de Minas Gerais envolveu a utilizao de todos os componentes discutidos anteriormente, a
saber, a desagregao regional, a incorporao de variveis intensivas, a especificao de
elementos de infraestrutura de transportes, a incluso de efeitos de transbordamento e a
estimao dos parmetros controlando para efeitos espaciais.
Os principais resultados desta aplicao apontaram que a densidade ferroviria no
apresenta efeito sobre a produo agrcola de Minas Gerais, apesar deste Estado apresentar a
maior rede ferroviria do pas. Alm de ser estatisticamente significante, a densidade rodoviria
pavimentada exibe um impacto sobre o desempenho produtivo maior que a densidade rodoviria
no-pavimentada. Nenhum efeito de transbordamento mostrou relevante na explicao da
produo agrcola. Como esperado, o fator capital apresenta a maior contribuio entre os
insumos, seguido pelo fator trabalho. Tal evidncia emprica um indicador do avano histrico
da mecanizao na agricultura mineira.
REFERNCIAS
Almeida, E. S. , Haddad, E. A. e Hewings, G. J. D. (2004). The spatial patterning of
crime in Minas Gerais): an exploratory analysis. Economia Aplicada (prximo
nmero).
Anselin, L. (1992) SpaceStat Tutorial. Mimeo., University of Illinois.
Anselin, L. (1995), Local Indicators of Spatial Association LISA. Geographical
Analysis, 27, n.2, pp. 93-115.
Anselin, L., Syabri, I. E Smirnov, O. Visualizing multivariate spatial correlation with
dynamically linked windows. Mimeo., University of Illinois, 2003.
Anselin, L. GeoDa 0.9 Users Guide. Mimeo, University of Illinois, 2003.
Anselin, L. (2003). Spatial externalities, spatial multipliers, and spatial econometrics.
International Regional Science Review, vol. 26, n. 2, pp. 153-166.
Anselin, L. (1988). Spatial Econometrics. Boston: Kluwer Academic, 1988.
Anselin, L. e Bera, A. (1998). Spatial dependence in linear regression models with an
introduction to spatial econometrics. In: Ullah A. and Giles D. E. (eds.) Handbook
of Applied Economic Statistics, Marcel Dekker, New York, pp. 237-289.
Anselin, L. Spatial Data Analysis with SpaceStat and ArcView. Mimeo, University of
Illinois, 3
rd
. edition, 1999.
Anselin, L. The Moran Scatterplot as an ESDA tool to assess Local Instability in Spatial
Association. Pp. 111-125 in Spatial Analytical Perspectives on GIS in
Environmental and Socio-Economic Sciences. London: Taylor and Francis, 1996.
Anselin, L. Spatial dependence and spatial structural instability in applied regression
analisys. Journal of Regional Science, 30:185-207, 1990.
Anselin, L. Interactive Techniques and Exploratory Spatial Data Analysis. In Geographic
Information System: Principles, Techniques, Manegement and Applications,
edited by P. A. Longley, M.F. Goodchild, D. J. Maguire and D. W. Rhind. New
York: John Wiley, pp. 251-264, 1999a.
Anselin, L. Spatial Data Analysis with SpaceStat and ArcView. Mimeo, University of
Illinois, 3
rd
. edition, 1999b.
Anselin, L. The Moran Scatterplot as an ESDA tool to assess Local Instability in Spatial
Association. In Spatial Analytical Perspectives on GIS in Environmental and
Socio-Economic Sciences. London: Taylor and Francis, pp. 111-125, 1996.
Anselin, L. and Florax, J. G. M. Small Sample of Tests for Spatial Dependence in
Regression Models: Some Further Results. In: Anselin, L. and Florax, R. J. G. M.
(eds) New Direction in Spatial Econometrics, Springer, New York, 1995.
Anselin, L. e Kelejian, H. Testing for spatial error autocorrelation in the presence of
endogenous regressors. International Regional Science Review, 20, pp. 153-182,
1997.
Anselin, L e Rey, S. Properties of tests for spatial dependence in linear regression
models. Geographical Analysis, 23, pp. 112-131, 1991.
Baller, R. D., Anselin, L., Messner, S. F., Deane, G. and Hawkins, D. F. Structural
covariates of U.S. county homicide rates: incorporating spatial effects.
Criminology, 39(3):561- 590.
Burridge, P. On the Cliff-Ord test for spatial correlation. Journal of the Royal Statistical
Society B, 42, pp. 107-8, 1980.
Casetti, E. Generating models by the expansion method: applications to the investigation
of fertility development relations. Modeling and Simulation, 13, pp. 961-966,
1972.
Cliff, A. e Ord, J. Spatial Processes, Models and Applications. London: Pion, 1981.
Cressie, N. Statistical for spatial data. Nova Iorque: Wiley, 1993.
Florax, R., Folmer, H. e Rey, S. (2002). Specification searches in spatial econometrics:
the relevance of Hendry's methodology. Working Paper, Department of Spatial
Economics, Free University Amsterdam.
Fotheringham, A. S., Brundsdon, C. e Charlton, M.. Quantitative Geography:
perspectives on spatial data analysis. Londres: Sage publications, 2000.
Fotheringham, A. S. e Wong, D. The modifiable areal unit problem in multivariate
statistical analysis. Environment and Planning A, 23, pp. 1025-1044.
Getis, A. e Ord, J. K. (1992). The analysis of spatial association by use of distance
statistics. Geographical Analysis, 24, pp. 189-206.
Haining, R. Spatial Data Analysis in the Social and Environment Sciences. Cambridge:
Cambridge University Press, 1990.
Holtz-Eakin, D. (1994). Public-sector capital and the productivity puzzle. The Review of
Economics and Statistics, vol. 76, pp. 12-21.
Huang, J. S. (1984). The autoregressive moving average model for spatial analysis.
Australian Journal of Statistics, vol. 26, pp. 169-178.
Kelejian, H. H. e Robinson, D. (1998). A suggested test for spatial autocorrelation and/or
heteroskedasticity and corresponding Monte Carlo results. Regional Science and
Urban Economics, vol. 28, pp. 389-417.
Kelejian, H. H. e Robinson, D. P. (1997). Infrastructure productivity estimation and its
underlying econometric specifications: a sensitivity analysis. The Journal of the
Regional Science Association International, vol. 76, n.1, pp. 115-131.
Kelejian, H. H. e Robinson, D. P. (1995). Spatial correlation: a suggested alternative to
the autorregressive model. In Anselin, L. E Florax, R. (eds.), New Directions in
Spatial Econometrics. Springer-Verlag, Berlim, pp. 75-95.
Kelejian, H. H. e Prucha, I. R. (1999). A Generalized Moments Estimator for the
Autoregressive Parameter in a Spatial model. International Economic Review,
vol. 40, n. 2.
Levine, N. CrimeStat: a spatial statistical program for the analysis of crime incident
locations. Ned Levine & associates Annandale, VA and the National Institute
of Justice, Washington, DC. August, 2002.

Messner, S. F. , Anselin, L, Baller, R. D., Hawkins, D. F., Deane, G., and Tolnay, S. E.
The Spatial Patterning of County Homicide Rates: an application of exploratory
spatial data analysis. Journal of Quantitative Criminology, 15(4): 423-450, 1999.
Messner, S. F. and Anselin, L. Spatial Analyses homicide with areal data. Mimeo,
University of Illinois, 2001.
Moran, P. The interpretation of statistical maps. Journal of the Royal Statistical Society
B, 10, pp. 243-251, 1948.
Paelinck, J. e Klaassen, L. Spatial Econometrics. Farnborough: Saxon House, 1979.
Tukey, J. W. Exploratory Data Analysis. Reading: Addison-Wesley, 1977.
Whittle, P. (1954). On stationary processes in the plane. Biometrika, vol. 41, pp. 434-449.

Apostila - Econometria Espacial

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Apostila - Econometria Espacial

Hochgeladen von

Copyright:

Verfügbare Formate

_____________________________________________________________________________

O que fazer?, pergunta o pesquisador.

segue a distribuio qui-quadrado com um grau de liberdade.

mais apropriada para grandes

menos afetada contra erros no-normais, em especial

, avaliado em = 0, expresso como:

segue uma distribuio qui-quadrado com 1 grau de liberdade, se =

so, respectivamente, os escores para o erro e a defasagem.

para a presena de 0 por meio de d

. Isso chamado de custo da robustificao, ou seja, o preo a ser pago

, no qual testado = 0, porm, agora

e a covarincia entre entre d

, use o modelo de erro

no, adote o modelo de defasagem espacial.

no, adote o modelo de erro espacial.

. O teste bidirecional pode ser decomposto pelo

Das könnte Ihnen auch gefallen