Sie sind auf Seite 1von 82

UNIVERSIDADE ESTADUAL DO OESTE DO PARAN - UNIOESTE

CENTRO DE CINCIAS EXATAS E TECNOLGICAS


PROGRAMA DE PS-GRADUAO EM ENGENHARIA AGRCOLA

ESTATSTICA ESPACIAL APLICADA AGRICULTURA DE


PRECISO

GUSTAVO HENRIQUE DALPOSSO

CASCAVEL - PR
Janeiro 2010

GUSTAVO HENRIQUE DALPOSSO

ESTATSTICA ESPACIAL APLICADA AGRICULTURA DE


PRECISO

Dissertao apresentada ao Programa de PsGraduao

em

Engenharia

Agrcola,

em

cumprimento parcial aos requisitos para obteno


do ttulo de Mestre em Engenharia Agrcola, pela
UNIOESTE/Campus
concentrao

de

Cascavel,

Engenharia

de

rea

de

Sistemas

Agroindustriais.

Orientador: Professor Dr. Miguel Angel Uribe


Opazo
Co-orientador: Professor Dr. Erivelto Mercante

CASCAVEL
Janeiro - 2010

D149

Dalposso, Gustavo Henrique


Estatstica espacial aplicada agricultura de preciso. /
Gustavo Henrique Dalposso. Cascavel, 2010.
66 f.
Orientador: Prof. Dr. Miguel Angel Uribe Opazo.
Dissertao(Mestrado) Universidade Estadual do Oeste do
Paran.
1. Estatstica Aplicada - Agricultura. 2. Geoestatistica . 3.
Estatstica Espacial. 4. ndice de Moran. I. Opazo, Miguel
Angel Uribe. II. Ttulo.
CDD 519.5

Ficha Catalogrfica Biblioteca do Campus Cascavel

DEDICO

A Henrique Luis

AGRADECIMENTOS

Ao meu orientador Dr. Miguel Angel Uribe Opazo que me conduziu neste trabalho e
proporcionou o meu desenvolvimento no Programa de Ps-graduao e por ser um grande amigo e
profissional.

Ao meu co-orientador Dr. Erivelto Mercante pela parceria firmada, pois esta alm de render
diversos trabalhos, rendeu uma grande amizade.

Ao meu amigo professor Jerry Adriani Johann, pelos trabalhos desenvolvidos no LEA, pois
estes fizeram parte de minha formao.

A todos os pesquisadores do grupo GGEA, pela oportunidade oferecida.

Ao Programa de Ps-graduao em Engenharia Agrcola e a todos os professores do curso.

CAPES pela bolsa concedida.

SUMRIO

LISTA DE TABELAS .........................................................................

viii

LISTA DE FIGURAS ..........................................................................

ix

LISTA DE SMBOLOS .......................................................................

RESUMO .............................................................................................

xii

ABSTRACT .........................................................................................

xiii

INTRODUO ..................................................................................

GEOESTATSTICA APLICADA AGRICULTURA


2

DE

PRECISO .........................................................................................

2.1

INTRODUO ....................................................................................

2.2

REVISO BIBLIOGRFICA .............................................................

2.2.1

Evoluo da geoestatstica ....................................................................

2.2.2

Hipteses e caractersticas importantes ................................................

2.2.3

Modelo geoestatstico ...........................................................................

2.2.4

Parmetros da estrutura de dependncia espacial .................................

2.2.5

Modelagem da estrutura de dependncia espacial ................................

10

2.2.6

Estimao de parmetros ......................................................................

13

2.2.7

Estimador linear geoestatstico: Krigagem ...........................................

15

2.2.8

Validao cruzada ................................................................................

16

2.2.9

Influncia local .....................................................................................

18

2.2.10

Acurcia em mapas temticos ..............................................................

19

2.2.11

Modelagem cartogrfica .......................................................................

24

2.3

MATERIAL E MTODOS ..................................................................

25

2.3.1

Material .................................................................................................

25

2.3.2

Metodologia ..........................................................................................

25

2.4

RESULTADOS E DISCUSSO .........................................................

29

2.5

CONCLUSO ......................................................................................

42

2.6

REFERNCIAS ...................................................................................

43

ESTATSTICA DE REAS APLICADA AGRCULTURA


3

DE PRECISO ...................................................................................

46

3.1

INTRODUO ....................................................................................

46

3.2

ANLISE DE DADOS DE REAS ...................................................

47

3.2.1

Anlise exploratria ..............................................................................

47

3.2.2

Elementos bsicos ................................................................................

47

3.2.3

Indicador global de autocorrelao espacial .........................................

49

3.2.4

Diagrama de espalhamento de Moran ..................................................

50

3.2.5

Mapa de espalhamento de Moran .........................................................

51

3.2.6

ndice local de associao espacial (LISA) ...........................................

52

3.2.7

Lisa map ...............................................................................................

52

3.2.8

Moran map ............................................................................................

53

3.3

MATERIAL E MTODOS ..................................................................

54

3.3.1

Material .................................................................................................

54

3.3.2

Metodologia ..........................................................................................

55

3.4

RESULTADOS E DISCUSSO .........................................................

56

3.5

CONCLUSO ......................................................................................

65

3.6

REFERNCIAS ...................................................................................

66

LISTA DE TABELAS
Tabela 1

Matriz dos erros genrica de ordem k x k .............................................

18

Tabela 2

Matriz de confuso da k-sima classe ..................................................

20

Tabela 3

Mtricas derivadas da matriz de confuso por classe ...........................

21

Tabela 4

Matriz de confuso total .......................................................................

21

Tabela 5

Mtricas derivadas da matriz de confuso total ...................................

22

Tabela 6

Parmetros do semivariograma omnidirecional ...................................

30

Tabela 7

31

Tabela 11

Modelos ajustados e parmetros obtidos do conjunto amostral


completo da produtividade de trigo [t ha-1] ..........................................
Validao cruzada para a produtividade de trigo [t ha-1] relativa a
todo o conjunto amostral ......................................................................
Modelos ajustados e parmetros do conjunto amostral da
produtividade de trigo [t ha-1] sem as amostras influentes ...................
Validao cruzada para a produtividade de trigo [t ha-1] sem as
amostras influentes ...............................................................................
Matriz dos erros dos pixels mapas de produtividade de trigo ..............

36

Tabela 12

Produo estimada em cada classe da legenda .....................................

36

Tabela 13

ndices de acurcia de usurio (AU) e produtor (AP) ..........................

37

Tabela 14

Estatsticas do ndice Kappa ( K ) ...................................................

37

Tabela 15

Elementos (pixels) da matriz de confuso da classe Ck .......................

37

Tabela 16

Mtricas obtidas das matrizes de confuso de cada classe ...................

38

Tabela 17

Matriz de confuso total da produtividade de trigo ..............................

38

Tabela 18

ndice I de Moran dos ndices NDVI e GVI .........................................

55

Tabela 8
Tabela 9
Tabela 10

Tabela 20

Porcentagens de municpios em cada quadrante do grfico de


espalhamento de Moran dos ndices NDVI e GVI ...............................
ndice local de associao espacial (LISA) do ndice NDVI ...............

Tabela 21

ndice local de associao espacial (LISA) do ndice GVI ..................

Tabela 19

31
33
34

57
58
59

LISTA DE FIGURAS
Figura 1

Funes covarincia e variograma .......................................................

Figura 2

23

Figura 3

(A) Localizao dos 50 pontos amostrais e (B) Diviso da rea em


talhes ...................................................................................................
Roteiro da anlise geoestatstica ...........................................................

Figura 4

Grfico boxcox da produtividade de trigo ............................................

27

Figura 5

Grfico espacial da produtividade de trigo .................................

27

Figura 6

Grfico boxplot da produtividade de soja ...................................

28

Figura 7

Grfico das coordenada versus produtividade de trigo ...............

28

Figura 8

Semivariogramas direcionais da produtividade de trigo .............

29

Figura 9

Semivariograma experimental da produtividade de trigo ....................

29

Figura 10

Envelopes simulados ............................................................................

30

Figura 11

(A) Grfico de diagnstico |Lmax|; (B) Localizao dos pontos


influentes na rea monitorada ...............................................................
Semivariograma experimental construdo sem os pontos influentes ...

32

Figura 12
Figura 13
Figura 14
Figura 15

Semivariogramas ajustado: (A) completo e (B) sem os pontos


influentes ..............................................................................................
(A) Mapa temtico da produtividade de trigo utilizando 50 elementos
amostrais na interpolao e (B) Mapa temtico da produtividade de
trigo utilizando 48 elementos amostrais na interpolao......................
Mapa da diferena de produtividade em mdulo entre os dois mapas .

26

33
34
35
35
47

Figura 17

Representao dos tipos de contiguidade entre reas. (A)


Contiguidade Queen rainha, (B) Contiguidade Rook torre e (C)
Contiguidade Bishop bispo................................................................
Construo do grfico de disperso do ndice I de Moran ...................

Figura 18

Legenda do mapa de espalhamento de Moran .....................................

50

Figura 19

Shapefile dos 36 municpios estudados na Regio Oeste do

52

Figura 20

Roteiro de anlise que ser trabalhado com ndices de vegetao .......

53

Figura 21

Evoluo temporal do ndice NDVI .....................................................

54

Figura 22

Evoluo temporal do ndice GVI ........................................................

55

Figura 23
Figura 24

Diagrama de espalhamento de Moran (Moran Scatterplot) para os


ndices NDVI e GVI em 23/11/2004, 25/12/2004 e 11/02/2005 ..........
Mapa de significncia LISA do ndice de vegetao NDVI da soja ....

Figura 25

Mapa de significncia LISA do ndice de vegetao GVI da soja .......

61

Figura 26

LISA cluster map do ndice NDVI da soja na safra 2004/2005............

61

Figura 16

Paran ..........................................................................................

49

56
60

LISTA DE SMBOLOS
Captulo 2

Z (s )

Valor do atributo na localizao s

Z ( s + h)

Valor do atributo na localizao s + h

C(h)

Funo de covarincia

Mdia

Espao euclidiano d-dimensional (d 1)

Matriz de covarincia

(s)

Modelo espacial linear

Parmetros desconhecidos a serem estimados

Efeito pepita ou erro de varincia

Contribuio ou varincia de disperso

Alcance ou raio de dependncia espacial

Funo do alcance

Matriz que funo de 3

In

( h)

Matriz identidade de ordem n


Funo semivarincia

Patamar

Vetor de parmetros.

OLS

Mnimos quadrados ordinrios

WLS1

Mnimos quadrados ponderados

ML

Mxima verossimilhana

RML

Mxima verossimilhana restrita

L( )

Funo de verossimilhana

l ( )

Funo log-verossimilhana

EM

Erro mdio

Z (s (i ) )

Representa o valor predito por krigagem ordinria no ponto si , sem considerar


a observao Z ( si ) .

ER

Erro mdio reduzido

(s (i ) )

Desvio padro da krigagem no ponto si , sem considerar a observao Z ( si )

DPEM

Desvio padro do erro mdio

SER

Desvio padro dos erros reduzidos

EA

Erro absoluto

Vetor de perturbao das respostas

Ponto de no perturbao

LD()

Afastamento da verossimilhana

EG

Exatido global

Ck

Classe k do mapa temtico

AU

Acurcia de usurio

AP

Acurcia de produtor

ndice Kappa

Varincia

ndice Tau

ndice de sensibilidade

ndice de especificidade

TFPk

Taxa de falso positivo

TFNk

Taxa de falso negativo

CCM

Coeficiente de correlao de Matthews

Efeito pepita relativo


Captulo 3

Matriz de proximidade espacial

Vetor dos desvios

Wz

Vetor de mdias ponderadas

ndice de Moran Global

Mdia dos atributos

Ii

ndice LISA

varincia da distribuio dos valores dos desvios

RESUMO

As metodologias fornecidas pela estatstica espacial so de grande importncia para estudos


envolvendo dados relacionados agricultura, pois permitem conhecer a variabilidade espacial dos
atributos estudados e identificar regies que apresentam caractersticas semelhantes, o que permite
realizar tratamentos localizados, maximizando as produtividades e minimizando os impactos causados
pela aplicao de insumos em excesso.
Um dos ramos da estatstica espacial a geoestatstica, que utiliza um conjunto de variveis
regionalizadas para modelar a estrutura de dependncia espacial, possibilitando a elaborao de mapas
temticos. Atualmente os estudos geoestatsticos no terminam com a elaborao dos mapas, pois
alm de estimar o atributo monitorado em locais no amostrados se faz necessrio investigar a
qualidade destes mapas, investigando pontos influentes e utilizando medidas que permitam comparar
mapas e realizar estimaes de reas.
Outra forma de investigao conhecida como estatstica espacial de reas, em que os objetos
de anlise so polgonos que representam talhes, bairros, municpios, estados entre outros. Neste tipo
de anlise, procura-se identificar autocorrelaes espaciais em nvel global e local, e a forma usual de
apresentao dos resultados feita utilizando mapas temticos.
Neste trabalho utilizou-se a geoestatstica para investigar a produtividade de trigo em uma rea
agrcola de 13,7 hectares no municpio de Salto do Lontra Pr. Das 50 amostras coletadas,
identificou-se duas como influentes e, com isso, optou-se por construir dois mapas temticos e
compar-los utilizando mtricas derivadas da matriz dos erros. Os resultados mostraram que os mapas
so diferentes e a retirada dos pontos influentes foi de fundamental importncia para melhorar a
qualidade do mapa temtico, visto que a diferena entre a produtividade estimada e a produtividade
real foi de apenas 40 quilos.
Para apresentar os recursos fornecidos pela estatstica espacial de reas comparou-se os
ndices de vegetao NDVI e GVI da produtividade de soja de 36 municpios da regio Oeste do
Paran no ano agrcola 2004/2005. Os resultados permitiram identificar regies com caractersticas
semelhantes e que a soja cultivada em perodos distintos na regio.
Palavras-chave: matriz dos erros, ndice I de Moran, matriz de contiguidade

SPATIAL STATISTICS APPLIED TO PRECISION AGRICULTURE

ABSTRACT

The methods provided by the spatial statistics are of great importance for studies involving
data related to agriculture, for they allow one to know the space variability of the study and identify
regions that have similar characteristics, which allows completely localized treatment, maximizing
productivity and minimizing the impacts of excessive input application.
One of the branches of spatial statistics is geostatistics, which uses a set of regionalized
variables to model the structure of spatial dependence, allowing the preparation of thematic maps.
Currently, geostatistical studies do not end with the preparation of maps, but also estimates monitored
the attribute in non-sampled locations. It is necessary to investigate the quality of these maps,
investigating influential points and using measurements to compare maps and area estimations.
Another form of research is known as spatial statistics of areas where the objects of analysis
are polygons representing blocks, neighborhoods, cities, states and others. This type of analysis seeks
to identify spatial autocorrelation in global and local levels, and the usual form of reporting is through
thematic maps.
In this work we used geostatistics to investigate the productivity of wheat in an agricultural
area of 13.7 hectares in the municipality of Salto do Lontra PR. Out of the 50 samples, two were
identified as influential, and thus, we chose to build two thematic maps and to compare them using
metrics derived from the matrix of errors. The results showed that the maps are different and the
removal of influential points was essential to improve the quality of thematic map, since the difference
between the estimated yield and actual yield was only 40 Kilos.
In order to display the resources provided by the spatial statistics of areas we compared to the
vegetation rates NDVI and GVI's of soybean yield from 36 cities in Western Paran in the agricultural
year of 2004/2005. The results showed regions with similar characteristics and that soybeans grow at
different times in the region.

Keywords: error matrix, Morans I Index, contiguity matrix

INTRODUO
A constante evoluo da informtica, no que diz respeito ao desenvolvimento de

softwares e hardwares, aliada ao crescimento da cincia, em relao criao de novos


mtodos de pesquisa, est mudando a forma como o homem investiga a agricultura, e isso
implica em melhores condies de trabalho para o profissional do campo, que em
contrapartida, consegue oferecer produtos com melhor qualidade, proporcionando uma
melhor condio de vida para todos, e principalmente, utilizando os recursos do meio
ambiente racionalmente.
Esta prtica de investigao, que visa estabelecer condies ideais as espcies
cultivadas na agricultura, sejam elas qumicas, fsicas ou biolgicas conhecida como
agricultura de preciso (AP). Segundo MOLIN (1997), a agricultura de preciso surge como
uma nova demanda de informtica na agricultura, pois implica na coleta e manipulao de
uma grande quantidade de dados que s podem ser gerenciados por mtodos
computacionais. Todo o embasamento dessa nova tecnologia est na anlise da
variabilidade espacial dos fatores de produo, especialmente o solo. A partir dessa anlise
as decises devem ser tomadas para que se faa ento a aplicao dos insumos de uma
forma localizada e com dosagens precisas.
Entre os diversos mtodos utilizados para monitorar a agricultura, destaca-se a
estatstica espacial, termo este referente aos mtodos estatsticos que incorporam nas
anlises informaes sobre a localizao, como as coordenadas geogrficas do ponto em
que a amostra foi coletada ou a localizao do polgono que representa a regio em estudo.
Dentro da estatstica espacial encontram-se diferentes abordagens para anlise de dados
georreferenciados, como por exemplo, a geoestatstica e a estatstica espacial de reas.
A teoria das variveis regionalizadas, ou geoestatstica como mais conhecida,
uma cincia que teve seu inicio em investigaes realizadas em minas de ouro na frica do
Sul. Por meio de uma anlise geoestatstica possvel estimar dados em locais no
amostrados analisando o comportamento espacial do fenmeno e minimizando o erro da
estimao.
O conjunto de recursos proporcionado pela anlise espacial em unidades de reas
muito importante dentro do universo de possibilidades j disponibilizados em diversos
Sistemas de Informao Geogrfica. A apresentao dos resultados geralmente feita
atravs de mapas, que visam identificar regies com caractersticas semelhantes, formando
os conhecidos clusters.

Nestes mapas, a variao do atributo no espao no

representada por uma superfcie contnua, como o caso da geoestatstica, e sim por
variaes abruptas de valores. Apesar de limitadas s caractersticas de cada rea, muitas
inferncias sobre padres ou comportamentos espaciais dos diversos atributos podem ser
realizadas.

Neste contexto, o objetivo geral deste trabalho utilizar recursos da estatstica


espacial para investigar variveis vinculadas agricultura.

GEOESTATSTICA APLICADA AGRICULTURA DE PRECISO

2.1

INTRODUO
O conjunto de atividades agrcolas, compreendendo a produo de alimentos, fibras

e energia, pode ser encarado como a alavanca da economia brasileira, e isto de grande
importncia, visto que muitos pases desenvolvidos tm excesso de produo agrcola,
sendo esta uma das condies para se terem tornado ricos, pois o fato de serem autosuficientes na produo agrcola tem sido determinante para os elevados nveis de
prosperidade.
Um fato que de certa forma barra o crescimento da agricultura no Brasil que muitas
reas agrcolas comerciais, por trabalharem com produo em larga escala, so tratadas
como homogneas, o que acaba trazendo prejuzos para o produtor e para o meio
ambiente. Um exemplo a aplicao de fertilizantes calculados com base em ndices
mdios de fertilidade. Esta aplicao feita de forma uniforme em toda a rea e, como
conseqncia, reas com maior nvel de fertilidade so adubadas em excesso e reas mais
pobres no so corrigidas. O mesmo ocorre na aplicao de agro qumicos no combate de
pragas e doenas, em que o tratamento uniforme gera problemas de poluio em reas com
baixos nveis de infestao.
Uma soluo eficaz para contornar este problema apresentada pela agricultura de
preciso por meio da geoestatstica, ramo da estatstica espacial que permite estudar
superfcies contnuas. A grande diferena em relao estatstica tradicional que, por
meio desta metodologia, alm do valor do atributo no ponto em estudo, a sua localizao
tambm incorporada na anlise. Esse fato faz com que elementos amostrais prximos
tenham valores mais semelhantes e sejam mais correlacionadas do que elementos
amostrais mais distantes do ponto estudado. Desta maneira, possvel realizar estimaes
em locais no amostrados, permitindo criar mapas temticos que descrevam o
comportamento do atributo que est sendo investigado na rea em estudo.
A geoestatstica fornece uma soluo para este tipo de problema atravs do
interpolador krigagem, nome dado em homenagem ao engenheiro de minas Daniel Krige,
pioneiro que, ao realizar trabalhos com dados de minerao, concluiu que a variao destes
apresentava uma estruturao que dependia da distncia de amostragem e, desta
constatao, surgiram os conceitos bsicos de geoestatstica.

Atualmente a geoestatstica encontra-se consolidada como cincia, porm, sua


evoluo contnua e dia aps dia surgem novas teorias, mtodos, programas e ndices
que ajudam o pesquisador a melhor entender o comportamento do atributo na rea
estudada.

2.2

REVISO BIBLIOGRFICA

2.2.1 Evoluo da geoestatstica


A geoestatstica tem por objetivo a caracterizao da disperso espacial e espaotemporal das grandezas que definem a quantidade e a qualidade de recursos naturais, tais
como florestas, recursos geolgicos, hidrolgicos, ecolgicos ou outros fenmenos
espaciais em que os atributos manifestam uma certa estrutura no espao e/ou no tempo,
como a contaminao de solos e aquferos, temperatura e pluviometria de uma regio. O
seu corpo metodolgico consiste basicamente num conjunto de instrumentos estatsticos
que quantificam a continuidade espacial da grandeza em estudo, em modelos de
interpolao espacial tendo por base a sua variabilidade estrutural (SOARES, 2000).
A teoria das variveis regionalizadas surgiu em meados de 1960 ligada escola
francesa hoje conhecida como Centre de Geoestatistique de Fontainebleau, fundada por
Georges Matheron. Ao estudar dados de concentrao de ouro em 1951 na frica do Sul, o
engenheiro de minas Daniel Krige concluiu que no conseguia encontrar sentido nas
varincias se no levasse em considerao a distncia entre as amostras. Baseado nessa
observao, Matheron desenvolveu a teoria das variveis regionalizadas, que contm os
fundamentos da geoestatstica.
Segundo LADIM (2006), as variveis regionalizadas so constitudas por um duplo
aspecto contraditrio. Pela sua caracterstica aleatria apresenta irregularidades e
variao imprevisvel de um ponto para outro e pela sua caracterstica estrutural apresenta
relaes existentes entre os pontos no espao motivadas pela sua gnese. Em outras
palavras, impossvel estimar com exatido o valor de um atributo - por exemplo, a
produtividade num determinado ponto da rea agrcola (aspecto aleatrio) -, mas provvel
que se encontre produtividade elevada perto de locais com produtividade alta (aspecto
estrutural).

2.2.2 Hipteses e caractersticas importantes


Tem-se que uma varivel regionalizada uma funo numrica com distribuio
espacial, que varia de um ponto a outro com continuidade aparente, mas cujas variaes
no podem ser representadas por uma funo simples, assim, para melhor compreenso
dessa ferramenta, se faz necessrio uma apresentao terica de algumas caractersticas
importantes.
a) Localizao

Os valores de uma varivel regionalizada so dependentes de suas funes


espaciais relativas dentro do campo geomtrico e, alm disso, estes valores so
dependentes do tamanho da amostra, de sua forma e orientao (suporte amostral).
b) Continuidade
A continuidade espacial apresentada pela varivel regionalizada entre amostras
vizinhas reflete o grau de dependncia ou independncia espacial entre as amostras.
Espera-se que as amostras mais prximas apresentem maior dependncia do que as que
esto mais distantes (CRESSIE, 1993). Dada uma caracterstica quantitativa Z (s ) , os
diagramas de representao dos pares de pontos Z ( s) vs Z ( s + h) , so algumas das
estatsticas que contm informao mais rica sobre a continuidade espacial de Z (s ) .
Quando a continuidade espacial no identificada, diz-se que h presena de efeito pepita
puro. Isto indica um tipo extremo de comportamento do variograma prximo origem e
reflete a variao espacial de um fenmeno de transio onde para um dado valor de
patamar a amplitude ter um valor infinitesimalmente menor que as distncias de
observao (JOURNEL & HUIJBREGTS, 1978). Diante da presena do efeito pepita puro
ressalta-se no se deve utilizar o mtodo geoestatstico de interpolao.
c) Anisotropias
A anisotropia uma caracterstica muito frequente nos elementos da natureza, isto ,
a variabilidade ou distribuio espacial de tais elementos ocorre mais intensamente numa
direo e menos intensamente em outra direo. Quando a variabilidade espacial em uma
rea apresenta comportamento semelhante para distintas direes, dizemos que os dados
so isotrpicos. A isotropia de suma importncia para a estimativa de locais noamostrados. utilizada na construo de mapas temticos de variabilidade, pois, por meio
da identificao de que a varivel analisada isotrpica, o estudo da dependncia espacial
pode ser feito por meio de um nico semivariograma, chamado de omnidirecional
(CARVALHO et al., 2008).
d) Estacionaridade
O conjunto de variveis aleatrias Z(si), i = 1,...,n, constituem uma funo aleatria
da qual s se conhece uma realizao z(si), ou seja, o conjunto de dados amostrais.
Para estimar valores em locais no amostrados, deve-se introduzir as restries de
estacionaridade estatstica. A existncia de estacionaridade permite que o experimento

possa ser repetido mesmo que as amostras sejam coletadas em pontos diferentes, pois elas
pertencem mesma populao com os mesmos momentos estatsticos (VIEIRA, 2000).
Uma funo aleatria considerada estacionria quando o valor esperado para sua
realizao o mesmo para todos os pontos da rea em estudo, ou seja, E[Z(s1)] = E[Z(s2)]
=...= E[Z(si)] = .
Este parmetro, que passa a ser independente da localizao de si, pode ser estimado por
uma mdia aritmtica dos valores das realizaes das variveis aleatrias. Concretamente,
a hiptese de estacionaridade da mdia, ou de primeira ordem como conhecida, implica
que possa ser estimada pela mdia aritmtica das observaes. Julgar esta hiptese de
estacionaridade como apropriada julgar a mdia das amostras como representativa da
rea em estudo.
Para a anlise geoestatstica necessrio tambm a estacionaridade de segunda
ordem, que implica que para cada par de uma varivel aleatria, a funo de covarincia

C (h) = Cov[ Z ( s ), Z ( s + h)] existe e seja dependente da distncia h, implicando na


ocorrncia de varincia finita. Usualmente, a aceitao de uma estacionaridade de segunda
ordem no pode ser satisfeita. Necessita-se ento de outro modelo estatstico, menos
limitado, que baseado na hiptese intrnseca, a qual considera apenas que a mdia dos
valores Z (s ) e a varincia dos incrementos Z ( s ) Z (s + h) ocorrem independentemente da
localizao na regio, sendo funo apenas do valor de h . Esta hiptese requer somente a
hiptese de existncia do semivariograma, sem a exigncia da varincia finita. Assim, a
varincia de Z ( s) no finita, mas a varincia do primeiro incremento de Z finita, e este
incremento fracamente estacionrio (VIEIRA et al., 1983). Assumida a estacionaridade,
por meio da hiptese intrnseca, e considerando que a associao das variveis em pontos
distintos maior medida que se reduz a distncia entre eles, o passo seguinte descrever
e modelar estas relaes entre distncias e associao espacial.

2.2.3 Modelo geoestatstico


O fato dos modelos geoestatsticos incorporarem a incerteza na sua formalizao
no significa que o fenmeno em si tenha resultado de um processo aleatrio, mas serve
somente de base metodolgica inferncia espacial ou estimao de grandezas em reas
no amostradas e quantificao da incerteza associada ao estimador (SOARES, 2000).
MARDIA & MARSHALL (1984) consideram um processo estocstico gaussiano

{Z (si ), si S } , em que

S d , sendo d espao euclidiano d-dimensional (d 1). Ou seja,

o processo Z = ( Z ( s1 ),..., Z ( s n )) T , em que si e su (i,u = 1,...,n) so localizaes espaciais


conhecidas, tm distribuio normal n-variada com vetor de mdias 1 e matriz de

covarincia , isto , Z ~ N n ( 1, ) , em que uma constante; 1 um vetor formado


pelo algarismo 1 de ordem nx1 e uma matriz definida positiva, de ordem n, dada por

= [Cov( Z ( s i ), Z ( su ))] . Supondo-se que os dados so descritos pelo modelo da Equao


(1):

Z ( s i ) = ( s i ) + (s i )

(1)

em que os termos determinstico ( s i ) e estocstico ( s i ) podem depender da localizao


espacial em que Z ( s i ) foi obtida. Assume-se que o erro estocstico tem mdia zero,

E [ ( s i ) ] = 0 , e que a variao entre pontos no espao determinada por alguma funo de


covarincia C ( si , s u ) = Cov[ ( s i ), ( su ) ] .
Assume-se que para algumas funes conhecidas de s, como x1(s), x2(s),...,xp(s), a
mdia do processo estocstico dada pelo modelo espacial linear apresentado na Equao
(2):

( s ) = x u ( s) u

(2)

u =1

em que 1 ,..., p so parmetros desconhecidos a serem estimados.


A funo de covarincia C ( s i , su ) tambm especificada por um vetor q-dimensional

= (1 ,..., q ) T . Por simplicidade, pode-se utilizar as seguintes notaes: Z ( si ) = z i ,


Z = ( z1 ,..., z n ) T , xiu = xu ( si ) , xi = ( xi1 ,..., xip ) T , em que X uma matriz nxp com suas linhas
T

xi , = ( 1 ,..., p ) T , i = (s i ) , = ( 1 ,..., n ) T , com i = 1,...,n e u = 1,...,p.


T

Desta forma, ( s i ) = xi , e ento,


T

(3)

z i = xi + i
De forma equivalente, em notao matricial, tem-se:

(4)

Z = X +
Ento,

E ( ) = 0 e a matriz de covarincia de

= [( iu ) ] , em que

iu = C ( si , s u ). Assume-se que no singular e que X tem colunas com posto


completo. Considerando-se de maneira particular a forma paramtrica da matriz de
covarincia,

= 1 I n + 2 R

(5)

em que:

1 : efeito pepita ou erro de varincia;


2 : contribuio ou varincia de disperso;
R: matriz que funo de 3 onde 3 funo do alcance (a) do modelo;
In: matriz identidade de ordem n.
A forma paramtrica da matriz de covarincia, dada na Equao 5, ocorre para
vrios processos isotrpicos, nos quais a covarincia C ( s i , su ) definida segundo a funo
de covarincias C ( hiu ) = 2 riu , em que hiu = s i s u a distncia euclidiana entre si e su.
Nas funes de covarincias C (hiu ) , a varincia do processo estocstico Z

C (0) = 1 + 2 . Assim, a funo variograma pode ser definida como:

( h ) = C (0 ) C ( h )

(6)

Pela Equao (6), pode-se obter a funo covarincia:

C (h) = C (0) (h)

(7)

A covarincia C(h) e o variograma (h) so equivalentes para caracterizar a


dependncia espacial.

2.2.4 Parmetros da estrutura de dependncia espacial


Os parmetros fornecidos pela estrutura de dependncia espacial so de grande
importncia na anlise geoestatstica, pois so utilizados no processo de krigagem, que o
interpolador geoestatstico que cria o mapa temtico do atributo estudado.
i) Efeito pepita ( 1 )
Teoricamente, o valor do variograma nulo: (h) = 0 para h = 0. Na prtica h um
valor mnimo de h entre amostras para o qual pode ser quantificado o valor de (h) .
Quando esse valor de (hmin ) elevado, o que significa que h uma grande variabilidade
pequena escala, isto , referente s menores distncias entre amostras ou observaes,
pode acontecer de (h) no tender para 0 quando h tende para 0. H na realidade uma

inflexo ou descontinuidade no andamento do variograma a uma escala no captada pelas


amostras, isto , entre h = 0 e hmim. Nestas situaes, o variograma modelado por uma
ordenada na origem igual a uma constante 1 denominada por efeito pepita (SOARES,
2000).

ii) Contribuio ( 2 )
tambm conhecida como varincia de disperso e representa as diferenas
espaciais entre os valores de uma varivel tomada em dois pontos separados por distncias
cada vez maiores.
iii) Alcance ( a = g ( 3 ) )
a distncia a partir da qual os elementos amostrais passam a ser no
correlacionados. Em outras palavras, o alcance reflete o grau de homogeneizao entre os
elementos amostrais, ou seja, quanto maior for o alcance maior ser a homogeneidade
entre as amostras. O alcance a distncia que separa o campo estruturado (amostras
correlacionadas) do campo aleatrio (amostras independentes).
iv) Patamar ( C = 1 + 2 )
O Patamar ( 1 + 2 ) corresponde ao ponto onde toda semivarincia da amostra de
influncia aleatria, correspondendo a varincia total (s2) obtida pela estatstica clssica
(TRANGMAR et al., 1985).
A Figura 1 ilustra o andamento tpico das funes variograma (h) e covarincia

C (h) .Como a funo variograma uma medida da varincia das diferenas nos valores da
varivel regionalizada entre pontos separados por uma distncia h, pontos mais prximos,
por estarem correlacionados tero essa varincia pequena, aumentando medida que os
pontos se distanciam.

Figura 1 Funes covarincia e variograma.


O contrrio acontece para a funo covarincia, que grande para distncias
pequenas diminuindo medida que a distncia aumenta, pois esta funo mede a
correlao entre pontos separados por uma distncia h.

2.2.5 Modelagem da estrutura de variabilidade espacial


Os semivariogramas e correlogramas amostrais podem no ser suficientes para
descrever o padro de variabilidade espacial do fenmeno estudado, visto que contm
estimativas apenas para algumas distncias que a malha amostral permite calcular. Um dos
produtos finais da anlise geoestatstica o mapa temtico gerado por krigagem, e este tipo
de interpolao exige medidas para outras distncias.
Os modelos ajustados para o semivariograma experimental, apresentados por
ISAAKS & SRIVASTAVA (1989) e CRESSIE (1993), so divididos em modelos transitivos,
que possuem patamar, e modelos no transitivos, que no possuem patamar. Modelos com
patamar so aqueles em que a semivarincia estabiliza-se em torno de um valor chamado
patamar (C) aps certa distncia, chamada alcance (a). Nestes casos, observaes
separadas por distncias maiores que a so consideradas no correlacionadas. Os modelos
esfricos, exponencial, gaussiano, circular, Matrn e exponencial potncia so exemplos de
funes com patamar.
Modelos sem patamar so aqueles em que no h indicao de estabilizao da
semivarincia. Este comportamento pode ser devido ao fato de que no foram obtidos
elementos amostrais suficientes afastados para que o patamar fosse detectado, ou pode ser
uma indicao de que a hiptese intrnseca no vlida.

a) Modelo esfrico
Trata-se de um dos modelos mais usuais em geoestatstica. Ele apresenta um
crescimento rpido a atinge o patamar a 2/3 do alcance. A funo semivarincia deste
modelo tem a forma:

h=0
0,

3 h 1 h 3

(h) = 1 + 2 ,
2 3 2 3

h > 3
1 + 2 ,

0 < h 3

(8)

A funo covarincia dada por:

h=0
1 + 2 ,

3
3 h 1 h
C (h) = 2 1 + , 0 < h < 3
2 3 2 3

h > 3
0,

(9)

b) Modelo exponencial
Este modelo atinge o patamar assintoticamente, com o alcance prtico definido como
a distncia na qual o valor do modelo 95% do patamar (ISAAKS & SRIVASTAVA, 1989). A
funo semivarincia deste modelo tem a forma:

h=0
0,

(h) = 1 + 2 1 exp
3

+ ,
h > 3
2
1

0 < h 3

(10)

A funo covarincia dada por:

h=0
1 + 2 ,

h
C (h) = 2 exp ,
3
0,
h > 3

0 < h 3

(11)

c) Modelo gaussiano
Os modelos esfrico e exponencial apresentam um crescimento relativamente rpido
junto da origem, denunciando um comportamento tpico de fenmenos relativamente
irregulares. Outros fenmenos, bem mais regulares e contnuos, denunciam um crescimento
lento de ( h) com um comportamento parablico na origem. Este o caso de variogramas
ajustveis por modelos gaussianos. A funo semivarincia deste modelo tem a forma:

h=0
0,

h 2

(h) = 1 + 2 1 exp ,
3

h > 3
1 + 2 ,

0 < h 3

(12)

A funo covarincia dada por:

h=0
1 + 2 ,

2
h

C (h) = 2 exp ,0
3

h > 3
0,

(13)

< h 3

d) Modelo circular
O modelo circular apresenta validez apenas nos planos unidimensionais e
bidimensionais, no podendo ser aplicado a planos tridimensionais, onde aplicado o
modelo esfrico. A funo semivarincia deste modelo tem a forma:

h=0
0,

2
h 2h
h2

1 2
(h) = 1 + 2 1 cos 1 +
3

3 3

h > 3
1 + 2 ,
A funo covarincia dada por:

0 < h 3

(14)

h=0
1 + 2 ,

C (h) = 2 1 h h
h2

cos

,
2
2

3
3

0 < h 3

(15)

e) Famlia Matrn
MATRN (1986) apresentou uma funo chamada famlia Matrn. Esta funo
definida, em termos de modelo terico da funo semivarincia, e dada pela Equao
(16):

h=0
0,

( h) =
k 1
+
(k )

2 1 2
1

k
h
h
K k ,
3
3

h>0

(16)

em que:

1 , 2 , 3 e k so parmetros;
K k a funo de Bessel de terceiro tipo, de ordem k ;
A funo covarincia dada por:

h=0
0,

C (h) = k 1
2 2 (k )

h
h
K k ,
3
3
k

h>0

(17)

2.2.6 Estimao de parmetros


Escolher um modelo adequado implica em obter estimadores do vetor de parmetro

= (1 , 2 , 3 )T com mtodos de estimao tais como: mnimos quadrados ordinrios


(OLS), mnimos quadrados ponderados (WLS1) (CRESSIE, 1985), mxima verossimilhana
(ML) e mxima verossimilhana restrita (RML) (MARDIA & MASHALL, 1984).
O mtodo de estimao de mnimos quadrados ordinrios - OLS, consiste na
obteno de um vetor de parmetros estimador de = (1 , 2 , 3 ) T , que minimiza a
Equao (18), onde k indica o nmero de lags que constituem o semivariograma
experimental, (h j ) o valor estimado da semivarincia experimental, que correspondente

ao j-simo lag, para j =1, 2,..., k e (h j , ) representa o valor estimado que corresponde ao
j-simo lag para j =1, 2,...,k; obtido pelo modelo ajustado ao semivariograma experimental, e
depende do vetor de parmetros .
2

[ (h ) (h , )]

ou

j =1

[C (h ) C (h , )]
j

(18)

j =1

O mtodo de estimao de mnimos quadrados ponderados - WLS1 define pesos


diretamente proporcionais ao nmero de pares de pontos amostrais que contribuem para a
semivarincia estimada a cada lag. Segundo o mtodo, o vetor de parmetros a ser
escolhido o que minimiza a Equao (19):
k

N (h j ) (h j ) (h j , )

j =1

N (h )[C (h
k

ou

) C (h j , )

(19)

j =1

A estimao de parmetros por mxima verossimilhana - ML um mtodo analtico,


muito utilizado na teoria estatstica. A funo de verossimilhana de n variveis aleatrias
Z1,...,Zn definida como a densidade conjunta dada por f Z1 ,..., Zn (z1,...,zn; ), que dever ser
considerada como uma funo do vetor de q-parmetros desconhecidos = (1,..., q)

(espao paramtrico). Seja (Z1,...,Zn) um vetor aleatrio n-dimensional de uma populao


com funo densidade de probabilidade conjunta f Z1 ,..., Zn (z1,...,zn; ), ento a funo de
verossimilhana ser:

L( ) = f Z1 ,...Z n ( z1 ,..., z n ; )

(20)

A funo de verossimilhana pode ser entendida como a intensidade de


contribuies dos parmetros na produo de uma dada amostra. Sob uma distribuio
normal n-variada dos erros, tem-se Z ~ N n ( X , ) e os parmetros desconhecidos do
modelo podem ser estimados maximizando-se a funo de verossimilhana, como
considerado por MARDIA & MARSHALL (1984). Por motivos de simplicidade de clculos,
utiliza-se o logaritmo da funo verossimilhana, chamada de funo log-verossimilhana,
definida por:

l ( ) =

n
1
1
log(2 ) log| ( ) | (Z X)T ( )
2
2
2

-1

(Z X)

(21)

A funo de verossimilhana , basicamente, uma funo do vetor de parmetros

ento, a melhor estimativa para o vetor de parmetros ser aquela que maximiza a
funo de verossimilhana ou de logaritmo da funo verossimilhana.
Outro mtodo, freqentemente utilizado para estimar os parmetros da matriz de
covarincia ( ) o mtodo de mxima verossimilhana restrita RML, que obtm
estimadores menos viciados que os estimadores obtidos por ML. Nos ensaios de campo na
agricultura e nas pesquisas com melhoramento animal, como mtodo de seleo, a
estimao de mxima verossimilhana restrita dos parmetros de covarincia espacial, tem
sido preferida de mxima verossimilhana (CRESSIE & LAHIRI, 1996). Neste caso, o
logaritmo da funo de log-verossimilhana restrita dada pela equao (22):

1
1
1
1 T
n p
T
T 1
l R ( ) =
log(2 ) + log(| X X |) log | | log(| X X |) Z PZ ,
2
2
2
2
2

(22)

em que ,

P = 1 ( I A) , com A = X ( X T 1 X ) 1 X T 1 .
Com o desenvolvimento de recursos computacionais os mtodos ML e RML tm sido
tcnicas de estimao muito utilizadas, pois tm propriedades da teoria das grandes
amostras que torna o seus resultados mais eficientes (DIGGLE & RIBEIRO JR., 2007).

2.2.7 Estimador linear geoestatstico: Krigagem


O estimador geoestatstico denominado por Krigagem, que uma denominao
que foi empregue pela primeira vez por Matheron, em homenagem aos trabalhos pioneiros
de Krige. Krigagem Normal (Ordinary Kriging) a denominao mais usual dos algoritmos
de krigagem, uma famlia que cobre os estimadores no-estacionrios (Krigagem Simples,
Krigagem com modelo de deriva, tambm conhecida por krigagem universal, e krigagem
com deriva externa), o estimador de corregionalizaes (Co-Krigagem), o estimador de
funes de distribuio de probabilidades, o estimador de variveis categricas para a
caracterizao da morfologia de corpos em fenmenos espaciais (Krigagem da Indicatriz) e
os estimadores no-lineares (Krigagem MultiGaussiana e Krigagem Disjuntiva).
A krigagem ordinria interpretada como o valor interpolado de uma varivel
regionalizada Z, em um local s 0 , podendo ser determinada pela Equao (23):

Z ( s 0 ) = i Z ( si )

(23)

i =1

restrito a:
n

=1

i =1

em que:

Z ( s 0 ) : Representa o valor estimado de Z em s 0 ;


n: Representa a quantidade de valores medidos Z ( s i ) ;

i : So os pesos associados aos valores medidos.


A krigagem ordinria para n pontos amostrais constitui-se de n + 1 equaes, com

n + 1 incgnitas, podendo ser representada por meio de uma equao matricial dada em
(24):
(24)

K = L
sendo:

C11 C12 ... C1n 1


C

21 C 22 ... C 2n 1
.
...
. . ,
K = .

C n1 C n 2 ... C nn 1
1
1
... 1 0

1

2
= . ,

n

C10
C
20
L= .

C n 0
1

Nesta equao K uma matriz de semivarincias de ordem ( n + 1) x( n + 1) entre os


pares de pontos amostrados; o vetor de pesos; L um vetor de semivarincias da
amostra em relao ao ponto a ser estimado s0 , e representa o parmetro de Lagrange.
O vetor de parmetros obtido pelo produto do inverso da matriz K pelo vetor L .
No mtodo da krigagem, os pesos so atribudos de acordo com a variabilidade
espacial expressa no semivariograma, no entanto, o que torna a krigagem um interpolador
timo a maneira como os pesos so distribudos, no sendo tendencioso, tendo varincia
mnima e possibilitando que se conhea a varincia da estimativa (WEBSTER & OLIVER,
1990).

2.2.8 Validao cruzada


A validao cruzada, ou cross validation, trata-se da adaptao da estatstica
paramtrica de validao cruzada a um conjunto de dados Z ( s ) . O processo consiste em

retirar-se uma amostra Z ( s 0 ) do conjunto de dados e estimar-se no local da amostra o valor

[ Z ( s 0 )] , por exemplo, utilizando o estimador linear de krigagem. Do conjunto formado por


valores reais e estimados [ Z ( s ), Z ( s )] , calcula-se algumas estatsticas bsicas, como
mdias e varincia dos desvios e mdia dos mdulos dos desvios, com objetivo de aferir a
qualidade do modelo escolhido para o variograma.
CRESSIE (1993) apresenta o erro mdio reduzido ( ER ), o desvio padro dos
erros mdios ( DPEM ) e o desvio padro dos erros reduzidos ( S ER ) como instrumento para
avaliar modelos. O erro mdio definido como:

EM =

1 n
( Z ( si ) Z ( s(i ) ))
n i =1

(25)

em que:

n : representa o nmero de dados;


Z ( si ) : representa o valor observado no ponto si;
Z ( s (i ) ) : representa o valor predito por krigagem ordinria no ponto si , sem considerar a
observao Z ( si ) .
Esse procedimento pode ser visto como um experimento no qual se imita o processo
de estimao, ao supor que nunca se toma uma amostra naquela localizao. Uma vez que
a estimao feita, pode-se compar-la ao valor da amostra que foi inicialmente removida
do conjunto de dados amostrais. Este procedimento, mtodo de deixar um fora, repetido
para todas as amostras disponveis (FARACO et al. 2008).
Segundo McBRATNEY & WEBSTER (1986), o erro mdio reduzido definido como:

ER =

1 n Z ( s i ) Z ( s (i ) )
(s )
n i =1
(i)

(26)

em que:

( s (i ) ) : desvio padro da krigagem no ponto si , sem considerar a observao Z ( si ) .


O desvio padro dos erros reduzidos obtido a partir da seguinte expresso:

S ER =

1 n Z ( s i ) Z ( s (i ) )
(s )
n i =1
(i)

(27)

FARACO et al. (2008) comentam que conhecendo-se o conjunto de valores medidos


e preditos por krigagem ordinria Z ( si ) e Z ( s (i ) ) , respectivamente, possvel definir o erro
absoluto na unidade da varivel da unidade estudada, pela Equao (28):

EA = Z ( si ) Z ( S ( i ) )

(28)

i =1

Segundo McBRATNEY & WEBSTER (1986), aplicando-se a condio de no


tendenciosidade, o valor populacional para o erro mdio reduzido deve ser zero e do desvio
padro do erro reduzido deve ser igual a um. Assim, os valores de EM e ER mais prximos
de zero, o menor valor do DP e o valor de S ER mais prximo de um so os critrios para a
escolha do melhor modelo ajustado.

2.2.9 Influncia local


Em muitas situaes pode-se observar um conjunto de dados com observaes
aberrantes ou discrepantes que podem ser consideradas influentes, isto , mudam algum
tipo de deciso na construo de modelos geoestatsticos (BORSSOI et al., 2009). O
mtodo de influncia local proposto por COOK (1986) avalia o efeito simultneo de
observaes sobre os estimadores de mxima verossimilhana (MV) sem a necessidade de
sua eliminao do conjunto de dados. CHRISTENSEN et al. (1993) estudam mtodos de
diagnsticos baseado em eliminao de casos em modelos lineares espaciais.
Para um conjunto de dados observados seja l() o logaritmo da funo verossimilhana do
modelo postulado, em que = (, 1, 2, 3)T e seja um vetor de perturbaes
pertencente a um espao de perturbaes . Seja l(/) o logaritmo da funo
verossimilhana correspondente ao modelo perturbado por . Assume-se que existe
um 0 tal que l() = l(/0), para todo e que l(/) duas vezes diferencivel em (T,
T)T .
Considere-se o seguinte esquema de perturbao: Z = Z + , com = (1,...,n)T vetor de
perturbao das respostas e 0 = (0,...,0)T o ponto de no perturbao. Com este esquema
de perturbao pretende-se detectar possveis outliers nos dados que afetam o estimador
de mxima verossimilhana de . Logo o logaritmo da funo verossimilhana perturbada
l(/), para o modelo gaussiano est dado por:

l ( / ) =

n
1
1
log( 2 ) log | | ( Z X ) T 1 ( Z X )
2
2
2
.

A influncia da perturbao no estimador de MV do vetor de parmetros pode


ser avaliada pelo afastamento da verossimilhana, definido por LD() = 2(l () l ( )) , em
que, : estimador de MV de do modelo postulado; e : estimador de MV de do modelo
perturbado. COOK (1986) props estudar o comportamento local de LD() em torno de 0,
utilizando a curva normal Cl de LD() em 0 na direo de algum vetor unitrio l, definido Cl
= 2|lTTL-1l|, com ||l|| = 1, em que, L: a matriz de informao observada, avaliada em

= ; : uma matriz de ordem (pq) x n dada por = (T, T)T, avaliada em = e em


= 0, em que,
= XT1 e =

L
L =
L

L
,
L

2 l ( / )
2 l ( / )
1 ,
,
com
= ( Z X ) T 1

T
T

i
em

que,

2 l ( )
1
= X T 1
, j = 1, ..., q ;
j
j

L = -(XT-1X);
L

LT;

L
e

=
L

2 l ( )
,
T
=

2 l ( ) ,
T

com
com

2l ( ) 1 1 1
2 1 T 1 2
1 1 1

= tr


i j 2 i
j i j 2
j j
i
i j i
Seja Lmax o auto-vetor, normalizado, associado ao maior autovalor, em mdulo, da
matriz B = TL-1. O grfico dos elementos |Lmax| versus i (ordem dos dados) pode revelar
qual o tipo de perturbao que tem a maior influncia em LD(), na vizinhana de 0
(COOK, 1986; BORSSOI et al., 2009).

2.2.10 Acurcia em mapas temticos


A elevada quantidade de recursos existentes para elaborao de informaes acaba
levando o pesquisador a confeccionar vrios mapas temticos, sendo necessrio utilizar
tcnicas que possam compar-los, como a quantificao das reas e a determinao da
concordncia entre seus pixels1, informaes estas que so geradas pela matriz dos erros
dos mapas. A Tabela 1 apresenta a forma genrica de uma matriz dos erros. Nesta matriz,
os pixels do mapa real ou de referncia so quantificados nas colunas enquanto que os
pixels do mapa modelo so quantificados nas linhas. Cada elemento da matriz representa a
quantidade de pixels pertencentes classe i do mapa modelo e classe j do mapa de
referncia.
1

Aglutinao das palavras Picture e Element, e representa o menor elemento num dispositivo de exibio ao
qual possvel atribuir-se um valor. Neste trabalho, os pixels sero definidos com os elementos da matriz dos
valores krigados.

Tabela 1: Matriz dos erros genrica de ordem k x k


Mapa de referncia
C1

C2

Mapa modelo

Classe

... Ck

Total por
linha
ni.
n1.
n2.
.
.
.
n k.

C1
n11
n12
... n1k
C2
n21
n22
... n2k
.
.
.
.
.
.
.
.
.
.
.
.
Ck
nk1
nkk
... nkk
Total por
coluna
n.1
n.2
... n.k
n
n.j
k: nmero de classes; nij: nmero de pixels classificados na classe i do mapa
modelo e na classe j do mapa de referncia.

A diagonal principal (quando i = j) representa casos em que os pixels tiveram a


mesma classificao nos dois mapas enquanto que os elementos fora da diagonal principal
representam as classificaes errneas. Observa-se que se os dois mapas forem iguais,
todos os elementos fora da diagonal principal sero nulos.
Uma mtrica utilizada para avaliar a acurcia dos mapas construdos a exatido
global (EG) do mapa modelo, que tem o objetivo de determinar o percentual de acerto da
classificao realizada e pode ser extrada da matriz dos erros pela Equao (29).
k

n
EG =

ii

i =1

(29)

A exatido global uma estatstica de avaliao utilizada para mensurar a


similaridade entre algo real ou controlado e um modelo ajustado, porm, conveniente
apresentar esta medida associada a outras mtricas que levem em considerao os demais
valores contidos na matriz dos erros e no somente os valores da diagonal principal. Os
ndices de acurcia de usurio (AU) e acurcia de produtor (AP) so maneiras de
representar a preciso de uma classe ou categoria individualmente. O ndice de acurcia de
usurio (AUi) representa o quociente entre o nmero de pixels classificados corretamente na
classe i sobre o total de pixels classificados na classe i do mapa modelo. Este ndice pode
ser calculado com os elementos da matriz dos erros e apresentado na Equao (30):

AU i =

nii
;
ni

i = 1,...,k

(30)

O ndice de acurcia de produtor (APi) uma estatstica que fornece a probabilidade


de um pixel ser classificado na classe i se ele realmente pertence a classe i. Este ndice
obtido pela Equao (31):

APi =

nii
;
n.i

i = 1,...,k

(31)

Como GONG & HOWARTH (1990) relatam, o ndice Kappa (COHEN, 1960) uma
estatstica utilizada para mensurar a exatido das classificaes temticas. Este ndice vem
sendo recomendado como uma medida apropriada da exatido por utilizar todos os
elementos da matriz dos erros ao invs de apenas utilizar aqueles que se situam na
diagonal principal da mesma, o que ocorre quando se calcula a exatido global da
classificao. O ndice Kappa fornece uma medida de concordncia entre os valores do
mapa modelo e os valores do mapa de referncia e segundo CONGALTON & GREEN
(1999) pode ser calculado pela Equao (32):
k

K =

n nii ni ni
i =1

i =1

(32)

n 2 n i n i
i =1

A varincia do ndice Kappa, utilizada na construo de intervalos de confiana e


testes de hipteses, pode ser calculada conforme a equao (33):

1 (1 1 )

1
2 ( K ) =

n (1 2 ) 2

2
2(1 1 )(21 2 3 ) (1 1 ) 2 ( 4 4 2 )

(1 2 ) 3
(1 2 ) 4

(33)

em que:

1 =

1 k
1
nii ; 2 = 2

n i =1
n

n i n i ; 3 =
i =1

1
n2

nii (ni + ni ) ; 4 =
i =1

1
n3

ij

(ni + n j ) 2 .

i =1 j =1

Utilizando o ndice Kappa juntamente com sua varincia, possvel construir um


intervalo de confiana de (1 - )% utilizando a Equao (34):

IC ( K ; (1 )%) = K z / 2 2 ( K )

(34)

Alm dos ndices de exatido global e Kappa, que so muito utilizados, MA &
REDMOND (1995) apresentaram o ndice Tau (T), que fornece uma medida quantitativa
relativamente precisa e intuitiva sobre a acurcia da classificao. O ndice Tau similar ao
ndice Kappa, sendo calculado conforme a equao (35), em que pk indica a probabilidades
a priori para cada classe.

ii

i =1

T =

pk
n
1 pk

(35)

Quando as probabilidades a priori para as classes forem iguais, temos pi = 1/k, onde
k representa o nmero de classes da matriz dos erros.
Uma outra forma de comparar mapas temticos pode ser utilizada mediante a criao da
matriz de confuso por classe (FIELDING & BELL, 1997), matriz esta que pode ser obtida
com os elementos da matriz dos erros. A Tabela 2 apresenta a forma genrica da matriz de

Mapa
modelo

confuso da k-sima classe.

Tabela 2: Matriz de confuso da k-sima classe


Mapa de referncia
Verdadeiro (V)
Falso (F)
Verdadeiro (V)
ak
bk
Falso (F)

ck

dk

Em que:
ak = n kk : quantidade de pixels da classe k do mapa real que foram classificados
corretamente como pertencentes a classe k no mapa modelo.
bk = n k nkk : quantidade de pixels que no pertencem a classe k do mapa real e
foram classificados como pertencentes a classe k no mapa modelo.
ck = n k nkk : quantidade de pixels que pertencem a classe k do mapa real e que
pertencem a uma classe diferente no mapa modelo.
dk = n (a k + bk + c k ) : quantidade de pixels que no pertencem a classe k no mapa
real e foram classificados como no pertencente a classe k no mapa modelo.

A Tabela 3 apresenta algumas mtricas, derivadas da matriz de confuso por classe,


e utilizadas na comparao dos mapas temticos. O ndice de sensibilidade (Sk) uma
medida que indica a probabilidade de um pixel no mapa modelo ser classificado como
pertencente classe k se realmente ele pertence classe k no mapa real, sendo assim uma
medida equivalente acurcia de produtor (FIELDING & BELL 1997).

Tabela 3: Mtricas derivadas da matriz de confuso por classe


Mtrica
Equao
ndice de sensibilidade (Sk)
ak /(ak+ck)
ndice de especificidade (Ek)
dk/(bk +dk )
Taxa de falso positivo (TFPk) (Erro de comisso)
bk/(bk +dk )
Taxa de falso negativo (TFNk) (Erro de omisso)
ck/(ak+ck)
O ndice de especificidade (Ek) indica a probabilidade de um pixel no pertencente
classe k do mapa real ser classificado como no pertencente classe k no mapa modelo
(LURZ et al. 2001). Os erros de comisso tambm so conhecidos como erros de
superestimativa, ou seja, indicam a proporo de pixels que no pertencem classe k no
mapa real que so classificados como pertencentes classe k no mapa modelo. Os erros
de omisso so considerados graves, pois indicam a proporo de pixels que pertencem
classe k do mapa real e foram classificados em outras classes no mapa modelo. Com base
nessas mtricas, possvel comparar individualmente as classes do modelo com as classes
do mapa real. Para uma comparao global dos mapas, JENNESS & WYNNE (2005)

Mapa Modelo

apresentam a matriz de confuso total, indicada na Tabela 4.

Tabela 4: Matriz de confuso total


Mapa de referncia
Verdadeiro (V)
Falso (F)
k

Verdadeiro (V)

a=

b=

ii

c=

n
j =1 i j

ij

i =1 j i

i =1

Falso (F)

n
k

ij

d=

ij

i =1 i j j i

A Tabela 5 apresenta algumas mtricas derivadas da matriz de confuso total. Os


ndices de sensibilidade total (S) e especificidade total (E) so anlogos s suas verses por
classe, com a diferena de que agora apresentam medidas para o mapa completo. O
coeficiente de correlao de Matthews (CCM) uma verso discreta do coeficiente de
correlao de Pearson, e seus valores se encontram no intervalo [-1;1], sendo que o valor 1
equivale a uma predio perfeita, 0 equivale a uma predio aleatria e -1 significa uma
predio inversa.

Mtrica
S
E
CCM

Tabela 5 Mtricas derivadas da matriz de confuso total


Equao
a/(a+c)
d/(b+d)
((ad)-(bc))/((a+b)(a+c)(d+b)(d+c))(1/2)

2.2.11 Modelagem cartogrfica


A modelagem cartogrfica um tipo de tcnica de anlise espacial, que consiste
numa coleo de mapas sobre determinados atributos, onde cada mapa uma varivel
sujeita a operaes matemticas tradicionais. A modelagem cartogrfica apresenta-se hoje
como uma importante tcnica de anlise espacial geogrfica. Ela aparece, como definio,
num contexto de utilizao de tecnologias de Geoprocessamento, no incio da dcada de
1990, com TOMLIN (1990), em que ele introduz um conceito novo - lgebra de mapas -,
atualmente muito explorado por pesquisadores e desenvolvido em alguns softwares de
Geoprocessamento.
Segundo BERRY (1993), uma linguagem de modelagem cartogrfica usa uma
sequncia de funes primitivas para realizar uma anlise complexa de mapas. Nesse
sentido, ela semelhante lgebra tradicional, na qual operadores primitivos (adio,
subtrao, exponenciao) so logicamente sequenciados com variveis para que se forme
uma equao. No entanto, na lgebra cartogrfica, mapas inteiros representam as variveis.
A

unidade

bsica

de

processamento

pixel,

que

pode

ser

processado

independentemente, integrado numa vizinhana ou integrado em regio de elementos com o


mesmo atributo.

2.3

MATERIAL E MTODOS

2.3.1 Material
A anlise de um conjunto de dados reais foi efetuada com o propsito de
ilustrar a aplicao das tcnicas geoestatsticas. A rea experimental compreende uma rea
de produo de gros com 13,7 hectares de extenso, localizada no municpio de Salto do
Lontra PR, que foi cultivado com trigo variedade IAPAR 78. Na rea monitorada, foi
definida uma grade amostral regular de 50 x 50 m totalizando 50 posies georreferenciadas
(Figura 2 (A)). Na Figura 2 (B) observa-se que esta rea tambm foi dividida em nove
talhes denominados de A a I, para facilitar a colheita mecnica e com isso poder
determinar a produo real. A pequena rea em cinza na Figura 2 (B) representa uma
regio de pedras que no monitorada no experimento.

Figura 2 (A) Localizao dos 50 pontos amostrais e (B) Diviso da rea em


talhes.
Nos pontos de amostragem, foram coletadas as parcelas de trigo. Estas amostras
foram trilhadas de forma manual, pesadas e posteriormente transformadas em t ha-1.
A anlise geoestatstica foi realizada utilizado os pacotes geoR (RIBEIRO JR &
DIGGLE, 2001) e Splancs ( ROWLINGSON & DIGGLE, 1993) do software R.
2.3.2 Metodologia
Uma anlise geoestatstica composta de diversos procedimentos que devem ser
utilizados com bastante cautela, pois no se tratam de uma simples aplicao de frmulas
para obter resultados. Para uma correta investigao o pesquisador deve sempre estar
refazendo e comparando suas anlises, e isto faz com que o roteiro a ser seguido, bem
como os resultados intermedirios e finais no sejam obtidos de forma nica.

A seguir so descritos os passos da anlise geoestatstica. Inicia-se com uma


anlise exploratria que vem seguida de diversos procedimentos at a confeco de mapas
temticos que detalhem o comportamento do atributo estudado.
a) Anlise descritiva geral
Em uma anlise descritiva geral, a nica informao investigada o conjunto
amostral do atributo estudado - assim, a posio do atributo no considerada. O objetivo
fundamental a identificao inicial do comportamento dos dados, sem nenhuma pretenso
de inferncia. O uso de medidas de posio, tendncia central, variao, assimetria e
curtose, associadas a informaes grficas como o histograma, boxplot e ramo-e-folhas
permite uma primeira viso dos aspectos gerais do conjunto de dados.
b) Anlise descritiva espacial
Embora seja mais detalhada que a anlise descritiva geral, uma vez que leva em
considerao a posio da amostra, a inteno to somente ter um indicativo do
comportamento dos dados agora associando-os s suas posies na regio amostrada.
Um grfico que rico em informao o postplot, que consiste em apresentar a
malha de pontos coletados separados por cores/smbolos identificando os quartis da
distribuio dos dados. A partir deste grfico possvel identificar se existem regies com
concentrao de altos ou baixos valores amostrais. Uma outra opo de anlise um
grfico tridimensional que mostra a superfcie definida pela amostra. A anlise idntica
feita com o grfico postplot e d uma idia visual inicial do comportamento do atributo na
regio estudada.
c) Anlise variogrfica
Para que a interpolao por krigagem possa ser realizada com eficcia, so
necessrias estimativas de semivarincias (covarincias) para distncias alm das
fornecidas pela malha amostral. Um modelo que descreva a semivarincia (covarincia) em
funo da distncia ento ajustado a partir de um conjunto discreto de pontos, estimativas
da semivarincia (covarincia) para os diferentes lags. No presente trabalho foram
avaliados os modelos exponencial, esfrico e gaussiano utilizando os mtodos de estimao
de mnimos quadrados ordinrios (OLS), mnimos quadrados ponderados, mxima
verossimilhana (ML) e mxima verossimilhana restrita (RML).

d) Validao cruzada
A idia central avaliada pela validao cruzada que se o fenmeno foi
satisfatoriamente modelado, possvel reproduzir, com boa aproximao, informaes da
amostra. Desta forma, o procedimento consiste em retirar um ponto do conjunto original das
amostras coletadas e estim-lo utilizando o restante das amostras. Aps realizar a
estimativa de todos os pontos, possvel obter medidas que ajudem a escolher o modelo
que melhor descreva a variabilidade espacial do atributo estudado.
e) Krigagem ordinria
Na maioria das pesquisas relacionadas geoestatstica, o profissional est
interessado em estimar valores em locais no amostrados, seja por um interesse local ou
pela inteno de obter um detalhamento da rea que vai alm do permitido pela amostra.
Nestes casos, o procedimento adotado a interpolao.
A literatura apresenta uma vasta coleo de interpoladores, desde os conhecidos
modelos deterministas, como polgonos de influncia, triangulao e inverso do quadrado
das distncias, at a proposta de predio geoestatstica, conhecida como krigagem. Neste
trabalho ser utilizado a krigagem ordinria, interpolador mais eficaz que os deterministas
por incorporar a estrutura de dependncia espacial do atributo estudado.
f) Anlise de diagnstico
Com o objetivo de investigar a existncia de pontos influentes no conjunto amostral
do atributo estudado, ser analisado o grfico de influncia local L max x i (ordem dos
dados), que prope avaliar a influncia conjunta das observaes sob pequenas
perturbaes no modelo, identificando assim, pontos que possam causar alguma
interferncia ou provoquem grandes desvios nos resultados do ajuste.
g) Comparao de mapas
Para comparar mapas obtidos por diferentes tcnicas, sero utilizadas as mtricas
derivadas da matriz dos erros e tambm ser criando um mapa de diferenas utilizando a
lgebra de mapas.
A Figura 3 apresenta o roteiro desta anlise. Observa-se que dois mapas sero
gerados. O primeiro obtido pelo ajuste de um modelo terico, selecionado por validao
cruzada, utilizando todos os pontos do conjunto de dados amostrais, e o segundo, utilizando

a anlise de diagnsticos para retirar pontos detectados como influentes. Para finalizar o
estudo, os mapas sero comparados utilizando a subtrao em mdulo de um mapa pelo
outro, que evidencia regies que foram diferentes em ambos os mapas e tambm ser
construda a matriz dos erros, considerando o mapa com todos os pontos como o de
referncia e o mapa sem os pontos influentes como modelo. Com esta matriz, ser possvel
calcular as mtricas de acurcia.

Figura 3 Roteiro da anlise geoestatstica.

2.4

RESULTADOS E DISCUSSO
A anlise exploratria dos elementos amostrados apresentou uma produtividade mdia

de trigo de 1,31 t ha-1, sendo a produo mnima de 0,30 t ha-1 e mxima de 2,40 t ha-1 com
desvio padro de 0,54 t ha-1 e coeficiente de variao (CV) de 41,40%. Apesar desta alta
heterogeneidade entre os valores amostrais (CV > 30%), pode-se considerar que o conjunto
apresenta uma distribuio normal de probabilidades, pois pelo teste de normalidade de
Anderson-Darling obteve-se um nvel descritivo (p-valor) de 0,102 o que indica normalidade
dos dados com nvel de 5% de significncia. Analisando o grfico boxcox da produtividade
de trigo na Figura 4, observa-se que no h necessidade de transformar os dados, visto que
o = 1 encontra-se no intervalo de 95 % de confiana.

Figura 4 Grfico boxcox da produtividade de trigo.


A Figura 5 apresenta o grfico espacial da rea em estudo, representando a
produtividade de trigo classificada por quartis.

Figura 5 - Grfico espacial da produtividade de trigo.

Destaca-se nesse grfico a regio norte da rea por apresentar um aglomerado com
produtividade baixa e a regio leste por apresentar um aglomerado com maiores valores de
produtividade. A Figura 6 apresenta o grfico boxplot da produtividade de soja.

Figura 6 Grfico boxplot da produtividade de trigo.


Observando o grfico da Figura 6 observa-se que o conjunto de dados simtrico e
tambm destaca-se a ausncia de pontos discrepantes no conjunto de dados amostrais.
Com finalidade de verificar a existncia de tendncias, heterogeneidades de varincias e
comportamentos isolados foram construdos os grficos da Figura 7. Para cada linha e
coluna foram assinalados os valores encontrados.

Figura 7 Grfico das coordenada versus produtividade de trigo.


Nos dois grficos existem pequenas flutuaes dos valores em relao mdia.
Porm, isto no caracteriza problemas visto que em ambas as direes as disperses so
semelhantes. As anlises exploratrias indicam que o comportamento do conjunto de dados

de produtividade de trigo no mostra problemas que afrontem as hipteses de


estacionaridade.
Para realizar o estudo variogrfico, necessrio conhecer a distncia mxima entre
os pontos amostrais, com intuito de definir o ponto de corte. Para construir o
semivariograma utilizando o conjunto amostral a distncia mxima entre duas amostras de
487,8781 m e como vamos padronizar um corte de 50% (CLARK, 1979), a distncia a ser
considerada ser de 244 m. Para identificar a existncia de anisotropia, construiu-se os
semivariogramas direcionais da Figura 8.

Figura 8 Semivariogramas direcionais da produtividade de trigo.


Observa-se na Figura 8 que os semivariogramas direcionais apresentam um
comportamento semelhante para as direes monitoradas, indicando que os dados so
isotrpicos e assim, podemos considerar um nico semivariograma, conhecido como
semivariograma omnidirecional, apresentado na Figura 9.

Figura 9 Semivariograma experimental da produtividade de trigo.


Observa-se que a primeira semivarincia encontra-se na distncia de 50 m,
indicando que no se tem conhecimento do fenmeno a menores distncias. Este
semivariograma foi gerado utilizando o estimador de Matheron e um ngulo de tolerncia de
22,5 o. Uma forma de investigar a dependncia espacial proporcionada pela construo de

envelopes simulados, apresentados na Figura 10. Na anlise dos envelopes simulados deve
haver ao menos um ponto do semivariograma fora do envelope. Se isso ocorrer rejeita-se a
hiptese nula, de que no h dependncia espacial.

Figura 10 Envelopes simulados.


Nesta simulao encontrou-se um ponto fora dos envelopes, conforme destacado
na Figura 9. Este fato sugere a existncia de correlao espacial da produtividade de trigo
na rea monitorada. Destaca-se que foi estipulado um mnimo de 30 pares de pontos para
cada semivarincia plotada nos grficos das Figuras 8,9 e 10. A Tabela 6 apresenta
informaes mais detalhadas do semivariograma experimental da produtividade de trigo,
como a distncia em que foi computada a semivarincia e o nmero de pares utilizados.
Tabela 6 Parmetros do semivariograma omnidirecional
pares
(h)
h
50,846
82
0,141
69,538
75
0,194
100,692
66
0,240
113,154
123
0,241
144,308
53
0,277
150,538
53
0,265
156,769
97
0,295
181,692
82
0,342
200,385
38
0,382
206,615
71
0,383
212,846
32
0,354
225,308
60
0,342

Observa-se na Tabela 6 que a maior quantidade de pares ocorreu a uma distncia


de 113,15 m, com 123 pares. A menor quantidade de pares ocorreu a uma distncia de
212,84 m, com 32 pares - porm, superior ao limite definido a priori de 30 pares de pontos.
A Tabela 7 apresenta as estimativas dos parmetros referentes aos ajustes dos
modelos tericos de semivariograma, juntamente com os respectivos mtodos de

estimao. Observa-se que o maior raio de dependncia espacial obtido com o modelo
exponencial, com aproximadamente 389 m nos mtodos WLS1, ML e RML.
Tabela 7 - Modelos ajustados e parmetros obtidos do conjunto amostral completo
da produtividade de trigo [t ha-1]
Modelo
Mtodo
1
2
1 + 2
a
E(%)
OLS
359,4886 0,0000 0,4229
0,4229
0,00
WLS1
389,4457 0,0000 0,4373
0,4373
0,00
Exponencial
ML
389,4450 0,0166 0,3518
0,3684
4,51
RML
389,4452 0,0086 0,3848
0,3934
2,19
OLS
310,1955 0,0672 0,3392
0,4064
16,54
WLS1
311,3712 0,0669 0,3405
0,4074
16,42
Esfrico
ML
137,6487 0,0117 0,2611
0,2728
4,29
RML
141,7012 0,0105 0,2759
0,2864
3,67
OLS
276,7686 0,1300 0,2797
0,4097
31,73
WLS1
273,0037 0,1284 0,2787
0,4071
31,54
Gaussiano
ML
269,1884 0,1051 0,2961
0,4012
26,20
RML
302,6388 0,1056 0,4164
0,522
20,23
OLS: mnimos quadrados ordinrios, WLS1: mnimos quadrados ponderados, ML: mxima
verossimilhana, RML: mxima verossimilhana restrita, a: ancance, 1 : efeito pepita, 2 :
contribuio,

1 + 2 : patamar e E: efeito pepita relativo 100.( 1 /( 1 + 2 ))

O efeito pepita relativo (E) na Tabela 7 utilizado para mensurar o grau de


dependncia espacial segundo a classificao proposta por CAMBARDELLA et al. (2004).
Observa-se que os ajustes utilizando modelos exponenciais apresentam os menores valores
para o efeito pepita relativo, indicando uma forte dependncia espacial. Dos quatro ajustes
realizados com o modelo gaussiano, 3 deles apresentam coeficiente de efeito pepita relativo
superior a 25 %, indicando uma moderada dependncia espacial.
Como tem-se vrios modelos e mtodos, necessrio utilizar tcnicas que permitam
escolher o melhor ajuste, como por exemplo, a validao cruzada, apresentada na Tabela 8.
Tabela 8 - Validao cruzada para a produtividade de trigo [t ha-1] relativa a todo o
conjunto amostral
Modelo
Mtodo
DPEM
SER
EA
EM
ER
Exponencial

Esfrico

Gaussiano

OLS
WLS1
ML
RML
OLS
WLS1
ML
RML
OLS
WLS1
ML
RML

-0,002074
-0,002310
-0,001719
-0,002006
-0,002417
-0,002439
0,0005531
0,0002486
-0,001874
-0,001864
-0,002367
-0,003308

-0,002220
-0,0025460
-0,001899
-0,002238
-0,002660
-0,002689
0,0010620
0,0006794
-0,001957
-0,001948
-0,002709
-0,003882

0,3564242
0,3563375
0,3581258
0,3571692
0,3674936
0,3675304
0,3620052
0,3630399
0,3687667
0,3683358
0,3652186
0,3645614

0,9521044
0,9716647
0,9950070
0,9924911
0,9379480
0,9391278
0,9890566
0,9865988
0,9190851
0,9220606
1,0011898
1,0007248

12,78630
12,78598
12,84087
12,79904
13,43437
13,43475
13,10038
13,20557
13,54737
13,52683
13,41738
13,42031

EM : erro mdio, ER : erro mdio reduzido, DPEM :desvio padro do erro mdio, SER: desvio padro
dos erros reduzidos e EA: erro absoluto.

Segundo o critrio de validao cruzada o melhor modelo o que fornece os valores


de EM e ER mais prximos de zero, o valor DPEM menor e o valor de SER mais prximo de
um. Optou-se por escolher o modelo exponencial - ML como o que melhor se ajustou, visto
que das cinco estatsticas investigadas ele apresenta um melhor desempenho em trs.
A Figura 11 (A) apresenta o grfico de diagnstico dos auto-vetores |Lmax|, utilizando
o modelo espacial exponencial ML.

Figura 11 - (A) Grfico de diagnstico |Lmax|; (B) Localizao dos pontos influentes
na rea monitorada.
Verifica-se que as observaes 12 e 18 foram consideradas influentes e podem
mudar algum tipo de deciso na construo de modelos geoestatsticos e/ou na construo
dos mapas temticos. A Figura 11 (B) apresenta a localizao dos pontos influentes na rea
monitorada. A amostra no 12 refere-se a uma produtividade de 2,40 t ha-1 e a amostra no 18
representa um elemento amostral com produtividade de 0,55 t ha-1. Desta forma, optou-se
por fazer uma nova anlise variogrfica retirando os dois pontos considerados influentes e
verificando de que maneira eles afetam a anlise espacial. A Figura 12 apresenta o
semivariograma experimental da produtividade de trigo gerado sem os dois pontos
influentes. Destaca-se um comportamento semelhante quando comparado com o
semivariograma que foi construdo com todos os pontos amostrais na Figura 9.

Figura 12 Semivariograma experimental construdo sem os pontos influentes.

A Tabela 9 apresenta os parmetros ajustados utilizando os mtodos de estimao


de mnimos quadrados ordinrios (OLS), mnimos quadrados ponderados (WLS1), mxima
verossimilhana (ML) e mxima verossimilhana restrita (RML) sem os pontos influentes.
Tabela 9 - Modelos ajustados e parmetros do conjunto amostral da
produtividade de trigo [t ha-1] sem as amostras influentes
Modelo
Mtodo
1
2
1 + 2
a
E(%)
OLS
545,3916 0,0000 0,4836
0,4836
0,00
WLS1 549,0667 0,0000 0,4847
0,4847
0,00
Exponencial
ML
562,9345 0,0000 0,4178
0,4178
0,00
RML
389,4452 0,0000 0,317
0,317
0,00
OLS
246,9547 0,0144 0,3262
0,3406
4,23
WLS1 233,5746 0,0000 0,3332
0,3332
0,00
Esfrico
ML
140,2367 0,0000 0,2173
0,2173
0,00
RML
142,0542 0,0000 0,2243
0,2243
0,00
OLS
225,0066 0,0786 0,2700
0,3486
22,55
WLS1 225,0065 0,0783 0,2695
0,3478
22,51
Gaussiano
ML
121,3996 0,0143 0,2477
0,2620
5,46
RML
125,6102 0,0165 0,2644
0,2809
5,87
Observa-se que os ajustes realizados utilizando o modelo exponencial com os
mtodos OLS, WLS1 e ML apresentaram um raio de dependncia espacial superior
distncia mxima que de 487, 8781 m e portanto, estes modelos sero desconsiderados
da anlise, pois apesar de estarem matematicamente corretos, eles no condizem com a
realidade. A Tabela 10 apresenta as estatsticas da validao cruzada referentes ao
conjunto de dados sem os pontos influentes. Novamente, procura-se por valores de EM e

ER mais prximos de zero, menores valores para o DPEM , valores de SER mais prximo de
um e o menor erro absoluto. Analisando a Tabela 10, optou-se por escolher o gaussiano
RML como o modelo que melhor se ajusta ao semivariograma experimental gerado com o
conjunto de dados composto de 48 elementos amostrais.
Tabela 10 - Validao cruzada para a produtividade de trigo [t ha-1] sem as
amostras influentes
Modelo
Mtodo
DPEM
SER
EA
EM
ER

Exponencial
Esfrico

Gaussiano

RML
OLS
WLS1
ML
RML
OLS
WLS1
ML
RML

0,0009800
0,0010440
0,0011600
0,0037200
0,0036180
0,0007296
0,0007271
0,0026980
0,0019660

0,0017480
0,0018390
0,0021600
0,0057110
0,0055120
0,0015100
0,0015100
0,0048850
0,0036590

0,3053484
0,2974865
0,2918369
0,3017940
0,3026852
0,3222009
0,3221772
0,2720037
0,2723834

0,9413290
0,8996713
0,9390484
0,9260413
0,9203176
0,9596583
0,9614916
1,0011951
0,9993793

10,76085
10,42330
10,26458
10,74068
10,77810
11,35211
11,35204
9,813561
9,73965

EXP: exponencial, ESF: esfrico, GAUSS: gaussiano, EM : erro mdio, ER : erro mdio
reduzido, DP EM :desvio padro do erro mdio, SER: desvio padro dos erros reduzidos e EA: erro
absoluto.

A Figura 13 (A) apresenta o semivariograma experimental do conjunto completo de


dados juntamente com o modelo ajustado (exponencial ML), e a Figura 13 (B) apresenta o
semivariograma experimental gerado sem os pontos influentes juntamente com o modelo
ajustado (gaussiano RML). Conclui-se que os pontos influentes alteram a escolha do
modelo e os valores dos parmetros.

Figura 13 Semivariogramas ajustado: (A) completo e (B) sem os pontos influentes.

A Figura 14 (A) apresenta o mapa da produtividade de trigo gerado por krigagem


ordinria utilizando os parmetros ( 1 = 0,0166; 2 = 0,3518; a = 389,4450) fornecidos pelo
modelo exponencial ML, obtidos do estudo realizado com todo o conjunto amostral e a
Figura 14 (B) apresenta o mapa gerado utilizando os parmetros ( 1 = 0,0165; 2 = 0,2644;
a = 125,6102) fornecidos pelo modelo gaussiano RML, obtidos pelo estudo dos dados sem
as amostras influentes. Para construo destes mapas, foi criado um grid de interpolao
formado por 5423 pixels.
Observa-se que os mapas apresentam um comportamento semelhante. Porm,
possvel identificar diferenas, no somente nos locais dos pontos influentes como tambm
em outras regies.

Figura 14 - (A) Mapa temtico da produtividade de trigo utilizando 50


elementos amostrais na interpolao e (B) Mapa temtico da produtividade de
trigo utilizando 48 elementos amostrais na interpolao.
Destaca-se que os mapas foram construdos utilizando 5 classes, sendo este nmero
definido de tal forma que possibilite tanto uma identificao visual das reas de

produtividade quanto uma praticidade em realizar aplicaes localizadas de insumos, pois


uma grande quantidade de intervalos implica em reas muito pequenas em cada classe, o
que dificulta a demarcao no campo. A diferena entre os mapas melhor visualizada na
Figura 15, que apresenta o mapa temtico da diferena de produtividade em mdulo entre
os dois mapas.

Figura 15 - Mapa da diferena de produtividade em mdulo entre os dois mapas

Observa-se na Figura 15 que as regies de maior diferena so exatamente as


regies dos pontos influentes. Porm, diversas outras regies apresentam diferenas, o que
mostra que a retirada dos pontos influentes afetou o mapa como um todo.
Para melhor comparar estes mapas, conveniente quantificar seus 5423 pixels em
uma matriz, conhecida como matriz dos erros, definindo o mapa gerado com todos os
pontos como o de referncia, visto que ele elaborado por mtodos geoestatsticos mais
conhecidos e o mapa gerado sem os pontos influentes como o mapa modelo, devido
implantao dos estudos de diagnsticos em influncia local. A Tabela 11 apresenta a
matriz dos erros que compara os dois mapas.
Tabela 11 - Matriz dos erros dos pixels dos mapas de produtividade de trigo
Mapa Padro
Mapa
Modelo
C1
C2
C3
C4
C5
TOTAL
C1
485
272
9
0
0
766
C2
45
1202
124
18
0
1389
C3
7
206
1218
99
19
1549
C4
0
0
135
616
241
992
C5
0
0
0
135
592
727
TOTAL
537
1680
1486
868
852
5423
C1: [0,371; 0784), C2:[0,784;1,198), C3:[1,198; 1,611), C4:[1,611; 2,024) e C5:[2,024; 2,437).

Na matriz dos erros, os pixels do mapa padro ou de referncia so quantificados


nas colunas e os pixels do mapa modelo so quantificados nas linhas. Assim, tem-se que
dos 5423 pixels, 537 esto na primeira classe do mapa padro e 766 esto na primeira
classe do mapa modelo.
Esta primeira informao permite realizar uma estimativa da produo de trigo na
rea para ser comparada com a produo de trigo real, colhida e pesada pelo produtor, que
foi de 18,49 toneladas. A rea total monitorada de 13,551 hectares e esta corresponde a
5423 pixels. Realizando uma regra de trs, podemos verificar que os 537 pixels da primeira
classe do mapa gerado com todos os pontos representam uma rea de 1,3419 hectares.
Multiplicando esta rea pelo ponto mdio da primeira classe (0,5778), obtemos a estimativa
de 0,78 toneladas. Seguindo o mesmo procedimento para as outras classes, obtemos as
estimativas da Tabela 12.
Tabela 12 Produo (t) estimada em cada classe
MAPA
C1
C2
C3
C4
C5
Referncia 0,78
4,16
5,21
3,94
4,75
Modelo
1,11
3,44
5,43
4,50
4,05

Total
18,84
18,54

Observa-se na Tabela 12 que a produo total estimada pelo mapa padro foi de
18,84 toneladas, 350 quilos superior produo real, que foi de 18,49 toneladas e a
produo total estimada utilizando o mapa modelo foi de 18,54 toneladas, 50 quilos superior
produo real. Diante desta observao, destaca-se que a retirada dos pontos influentes
foi de grande importncia na anlise, pois permitiu estimar a produo com maior preciso.
A diagonal principal da matriz dos erros da Tabela 11 indica a quantidade de pixels
classificados identicamente nos dois mapas. Estes elementos permitem calcular a exatido
global (EG), uma das primeiras medidas de acurcia que pode ser utilizada na comparao
dos mapas. Da Tabela 11 tem-se que EG = 0,76 ou seja, a exatido global foi de 76 %. Este
valor tambm indica que os mapas temticos apresentam diferenas, pois de acordo com
ANDERSON et al. (1976), o nvel mnimo de preciso aceitvel de 85 %. A acurcia pode
ser investigada para cada classe individualmente por meio da anlise dos ndices de
acurcia de usurio e de produtor, apresentados na Tabela 13.
Tabela 13 ndices de acurcia de usurio (AU) e produtor (AP)
C1:[0,371;0784)

AUi
APi

0,6432
0,9032

C2:[0,784;1,198) C3:[1,198; 1,611) C4:[1,611;2,024) C5:[2,024;2,437)

0,8654
0,7155

0,7863
0,8197

0,6210
0,7097

0,8143
0,6948

Observa-se pela Tabela 8 que a classe C4 do mapa modelo apresentou um ndice de


acurcia de usurio de 0,6210 o que indica que 37,9 % dos pixels que pertencem a esta

classe no mapa modelo pertencem a outras classes no mapa de referncia. Observando o


ndice de acurcia de produtor da classe C4, tem-se que a probabilidade de um pixel ser
classificado nesta classe do mapa modelo se ele realmente pertence a esta classe no mapa
de referncia de 0,7097. A Tabela 14 apresenta o ndice Kappa com sua respectiva
varincia. Analisando a Tabela 14, observa-se que o valor de Kappa 0,69, o que, segundo
classificao de LADIS & KOCK (1997), indica uma semelhana muito boa.
Tabela 14 - Estatsticas do ndice Kappa ( K )
0,69
K

2 ( K )

IC(K, 95%)

0,00084
[0,63; 0,75]

O ndice Tau obtido da matriz dos erros considerando a igualdade das probabilidades
a priori para cada classe foi 0,70, que apesar de ser superior ao ndice Kappa, tambm
indica uma semelhana muito boa entre os mapas temticos da produtividade de trigo. A
Tabela 15 apresenta os elementos das matrizes de confuso da classe Ck, que so
utilizados para calcular mtricas adicionais, proporcionando uma investigao mais
detalhada.
Tabela 15 Elementos (pixels) da matriz de confuso da
classe Ck
Ck
ak
bk
ck
dk
C1
485
281
52
4605
C2
1202
187
478
3556
C3
1218
331
268
3606
C4
616
376
252
4179
C5
592
135
260
4436

Como os elementos ak e dk representam predies corretas e os elementos bk e ck


representam predies errneas, destaca-se a classe C1 com apenas 4% de pixels
classificados erroneamente e a classe C4 com 11% de pixels classificados erroneamente. A
Tabela 16 apresenta as mtricas obtidas das matrizes de confuso de cada classe Ck.
Tabela 16 Mtricas obtidas das matrizes de confuso de cada classe
Classes
Sk
Ek
TFPk
TFNk

C1:[0,371;0,784)
C2:[0,784;1,198)
C3:[1,198;1,611)
C4:[1,611;2,024)
C5:[2,024;2,437]

0,9032
0,7155
0,8197
0,7097
0,6948

0,9425
0,9500
0,9159
0,9175
0,9705

0,0575
0,0500
0,0841
0,0825
0,0295

0,0968
0,2845
0,1803
0,2903
0,3052

S k: Sensibilidade, Ek: Especificidade, TFPk : Taxa de falso positivo e TFNk: Taxa de falso negativo

Destaca-se a classe C5 com o menor ndice se sensibilidade e o maior ndice de


especificidade, assim, a probabilidade de um pixel ser classificado na classe C5 do mapa
modelo se este pixel pertence a classe C5 do mapa de referncia a menor se comparada
com as outras classes e a probabilidade de um pixel do mapa modelo no apresentar
produtividade de trigo no intervalo [2,024; 2,437] dado que o pixel no apresenta
produtividade de trigo no mesmo intervalo no mapa de referncia maior se comparada
com as demais classes. As taxas de falso positivo TFPk representam os erros de
superestimativa e as taxas de falso negativo TFNk representam os erros de omisso.
Observa-se que o maior erro de superestimativa ocorre na classe C3 e o maior erro de
omisso ocorre na classe C5. A Tabela 17 apresenta a matriz de confuso total da
produtividade de trigo, utilizada para calcular mtricas globais de comparao.

Mapa gerado sem os


pontos influentes

Tabela 2 - Matriz de confuso total da produtividade de trigo


Mapa gerado com todos os pontos
verdadeiro

falso

verdadeiro

a = 4113

b = 1310

falso

c = 1310

d = 20382

Utilizando os valores da Tabela 17 obtem-se S = 0,76, E = 0,94 e CCM = 0,70. Uma


caracterstica importante do ndice de sensibilidade total (S) que ele equivale ao ndice de
exatido global (EG). Assim, a capacidade geral do mapa modelo em classificar pixels
corretamente de 0,76. O ndice de especificidade total (E) indica que a capacidade do
mapa modelo em evitar classificaes incorretas de 0,94. O coeficiente de correlao de
Matthews (CCM) obtido foi 0,70 e como este ndice fornece o valor 1 se os mapas forem
idnticos, verifica-se que o mapa gerado sem os pontos influentes apresenta diferenas
quando comparado com o mapa gerado com todos os pontos.
importante destacar que o aumento do nmero de classes tende a diminuir a
similaridade entre os mapas, por exemplo, utilizando 10 classes obtm-se EG = 0,61, K =
0,55 e T = 0,56. Ao utilizarmos 15 classes, estes valores tornam-se EG = 0,50, K = 0,45 e
T= 0,46 e utilizando 20 classes tem-se EG = 0,40, K = 0,36 e T = 0,37. Assim, importante
definir um nmero de classes que esteja de acordo com o objetivo da anlise, pois um
nmero muito elevado tende a dificultar o manejo localizado, sendo assim inconveniente
para o produtor.

CONCLUSO
A anlise geoestatstica permitiu identificar com preciso o comportamento da
produtividade de trigo na regio monitorada e com isso, a estimao da produo de trigo
ficou muito prxima a produo real. Destaca-se a validao cruzada como excelente
tcnica para escolher o modelo que melhor se ajusta ao semivariograma experimental.
Destaca-se que a preciso da estimao da produtividade de trigo deu-se pelo fato
de ter sido retirado dois elementos amostrais detectados como influentes. Assim, conclui-se
que a metodologia dos diagnsticos de fundamental importncia em estudos de
geoestatstica.
Os resultados mostraram que as mtricas derivadas da matriz dos erros so uma
excelente opo para realizar comparao entre mapas temticos, pois fornecem valores
globais e ainda permitem fazer comparaes por classes.

REFERNCIAS
ANDERSON, J. R. et al. A land use and land cover classification system for use with remote
sensor data. Geological Survey Professional Paper 964. Washington: USGS. 1976. 41 p.
BERRY, J. K. Cartographic modeling: the analytical capabilities of GIS. In: Goodchild, M;
Parks, B. O.; STEYAERT, L. T. Environmental modelling with GIS, New York, Oxford
University Press. 1993. 488 p.
BORSSOI, J. A. ; URIBE-OPAZO, M. A ; GALEA, M. Diagnostic techniques applied in
geostatistics for agricultural data analysis. Revista Brasileira de Cincia do Solo, Viosa,
v. 33, n.6, p. 1561-1570, 2009.
CAMBARDELLA, C. A.; MOORMAN, T. B.; NOVAK, J. M.; PARKIN, T. B.; KARLEN, D. L.; TURCO,
R. F.; KONOPKA, A. E. Field-scale variability of soil properties in central Iowa soils. Soil Science
Society America Journal, Madison, v.58, n.5, p.1501-1511, 1994.
CARVALHO, L. P.; URIBE-OPAZO, M. A.; JOHANN, J. A.; SOUZA, E. G. Estudo da
anisotropia na variabilidade espacial em propriedades qumicas do solo. Revista Brasileira
de Cincia do Solo, v.32, n.6, p.2217-2226, 2008.
CHRISTENSEN, R.; JOHNSON, W.; PEARSON, L. Covariance function diagnostics for
spatial linear models. International Association for Mathematical Geology, New York, v.
25, n.2, p.145-160, 1993.
CLARK, I. Pratical geostatistics. England: Applied Science Publishers, 1979. 129 p.
COHEN, J. A. A coefficient of agreement for nominal scales. Educational and
Psychological Measurement, v.20, p.37-46, 1960.
CONGALTON, R. G.; GREEN, K. Assessing the accuracy of remotely sensed data:
principles and practices. New York: Lewis Publishers, 136p., 1999. 136 p.
COOK, R. D. Assessment of local influence (with discussion). Journal of the Royal
Statistical Society, Series B, London, v.48, p.133-169, 1986.
CRESSIE, N. Fitting variogram models by weighted least squares. Mathem. Geol., n.17, p.
563-586, 1985.
CRESSIE, N. Statistics for spatial data. New York: Jonh Wiley. 900p., 1993.
CRESSIE, N.; LAHIRI, S.N. Asymptotics for REML estimation of spatial covariance
parameters. Journal of Statistical Planning and Inference, p.327-341, 1996.
DIGGLE, P. J.; RIBEIRO JR, P. J. Model Based Geostatistics. New York: Springer. 2007.
230 p.

FARACO, M. A. et al . Seleo de modelos de variabilidade espacial para elaborao de


mapas temticos de atributos fsicos do solo e produtividade da soja. Rev. Bras. Cinc.
Solo, Viosa, v.32, n.2, p. 463-476, 2008.
FIELDING, A.H.; BELL, J.F. A review of methods for the assessment of prediction errors in
conservation presence/absence models. Environmental Conservation, n. 24. p. 38-49,
1997.
GONG, P., HOWART, P.J. An assessment of some factors influencing multispectral landcover classification. Photogrammetric Engineering and Remote Sensing. Bethesda,
56(5), p.597-603, 1990.
ISAAKS, E. H.; SRIVASTAVA, R. M. An introduction to applied geostatistics. New York:
Oxford Universit. 1989. 561 p.
JENNESS, J; WYNNE, J. J. Cohens Kappa and classification table metrics 2.0: an
ArcView 3x extension for accuracy assessment of spatially explicit models. U.S. Geological
Survey Open-File Report OF 2005-1363. U. S. Geological Survey, Southwest Biological
Science Center, Flagstaff, AZ. 2005. 86 p.
JOURNEL, A. G.; HUIJBREGTS, C. J. Mining geostatistics. London: Academic Press.
1978. 600 p.
LANDIM, P.M.B. Sobre Geoestatstica e mapas. Terra Didtica, 2(1), p. 19-33, 2006.
LANDIS, J. R., KOCH, G. G. The measurement of observer agreement for categorical data.
Biometrics. n.33, p.159-174, 1977.
LURZ, P.W.W.; RUSHTON, S.P.; WAUTERS, L.A.;BERTOLINO, S.; CURRADO, I.;
MAZZOGLIO, P.; SHIRLEY, M.D.F. Predicting grey squirrel expansion in North Italy: a
spatially explicit modeling approach. Landscape Ecology, n.16, p.407-420, 2001.
MA, Z., REDMOND, R.L. Tau coefficients for accuracy assessment of classification of
remote sensing data. Photogrammetric Engineering and Remote Sensing, Bethesda,
61(4), p. 453-439, 1995.
MARDIA, K.; MARSHALL, R. Maximum likelihood estimation of models for residual
covariance in spatial regression. Biometrika, Alemanha, v.71, n.1., p.135-146. 1984.
MATRN, B. Spatial Variation. Lecture notes in statistics. 2 ed. New York: Springer. 1986.
151 p.
McBRATNEY, A.; WEBSTER, R. Choosing functions for semi-variograms os soil properties
and fitting them to sample estimates. J. Soil Sci., n.37, p.617-639, 1986.
MOLIN, J. P. Agricultura de preciso. Parte 2: diagnstico, aplicao localizada e
consideraes econmicas. Engenharia Agrcola, v.17, n.2, p.108-121, 1997.
RIBEIRO JR., P.J.; DIGGLE, P.J. geoR: A package for geostatistical analysis. R-NEWS, v.1,
n.2 , ISSN 1609-3631. 2001.

ROWLINSON, B.S.; DIGGLE, P. J. Splancs: Spatial Point Pattern Analysis Code in S-Plus.
Technical Report 92/63, Lancaster University, U.K, 1992.
SOARES, A. Geoestatstica para as Cincias da Terra e do Ambiente. Coleo Ensino
da Cincia e Tecnologia, n 9, Lisboa, IST Press. 2000. 206 p.
TOMLIN, C. D. Geographic Information Systems and Cartographic Modelling. PrenticeHall, Inc. New Jersey. 1990. 249 p.
TRANGMAR, B.B.; YOST, R.S.; WADE, M.K.; UEHARA, G. Applications of geostatistics to
spatial studies of soil properties. Advances in Agronomy, v.38, p.45-94, 1985.
VIEIRA, S.R.; HATFIELD, J.L.; NIELSEN, D.R.; BIGGAR, J.W. Geostatistical theory and
application to variability of some agronomical properties. Hilgardia, v.51, n.3, p.1-75, 1983.
VIEIRA, S. R. Geoestatstica em estudos de variabilidade espacial do solo. In: NOVAIS, R.
F.; ALVAREZ V., V. H.; SCHAEFER, C. E. (Ed.) Tpicos em cincia do solo. Viosa:
Sociedade Brasileira de Cincia do Solo, p. 1-54, 2000.
WEBSTER, R.; OLIVER, M.A. Statistical Methods in Soil and Land Resource Survey.
Oxford University Press, Oxford, 1990. 316 p.

ESTATSTICA ESPACIAL DE REAS APLICADA AGRCULTURA DE


PRECISO

3.1

INTRODUO
O avano da informtica proporciona, a cada dia, o acesso a novas tecnologias que

podem ser utilizadas na agricultura, resultando em grande fonte de informao para todos.
Uma destas tecnologias consiste na criao e explorao de mapas que descrevam o
comportamento de um atributo em determinada regio, como, por exemplo, os bairros de
uma cidade, os municpios de um estado ou at mesmo os estados de um pas. Os
Sistemas de Informao Geogrfica ou SIGs como so conhecidos, realizam tais tarefas,
pois so softwares que permitem a criao, manipulao e extrao de informaes de
bases de dados geogrficos.
A utilizao de tcnicas estatsticas que fazem uso explicito da localizao dos
fenmenos um recurso que vem ganhando destaque na comunidade cientfica pela
diversidade de suas aplicaes. Um dos casos pioneiros em que se incorporou a localizao
espacial em uma investigao aconteceu em 1854, em Londres, em que o mdico britnico
Johw Snow, ao marcar em uma mapa a localizao dos casos de clera e das torres de
gua, conseguiu identificar o local contaminado e acabar com a epidemia.
Porm,

mesmo

com

crescente

disponibilidade

de

bases

de

dados

georreferenciados e a expanso de tecnologias eficientes e de baixo custo afirmam


CMARA et al. (2004), grande parte dos usurios de SIGs limita-se ao uso do mesmo
apenas para visualizao de mapas, ignorando que possvel ir muito alm, j que a
combinao de tcnicas estatsticas adaptadas a dados espaciais com funes de
visualizao formam um conjunto de tcnicas de anlise com grande potencial para estudos
urbanos e regionais.
Segundo SERRANO & VALCARCE (2000) quando se trabalha com dados de
natureza espacial, pode aparecer um efeito denominado autocorrelao espacial. A
dependncia ou autocorrelao espacial surge sempre que o valor de uma varivel em um
lugar do espao est relacionado com seu valor em outro ou outros lugares do espao. Este
fenmeno pode ser entendido como uma situao em que observaes prximas no espao
possuam valores similares. Neste caso, o desafio da anlise medir o grau de associao
espacial entre observaes de uma ou mais variveis.
Quando so utilizadas tcnicas de estatstica espacial para anlise de dados de
reas, essas so apresentadas em forma de ndices que medem a associao espacial em
nvel global (ndice de Moran) e nvel local (ndice LISA), grficos de espalhamento (Moran
Scatterplot), que permitem estudar o ndice global em um diagrama de disperso e mapas
da distribuio dos ndices.

3.2

ANLISE DE DADOS DE REAS

3.2.1 Anlise exploratria


A forma mais simples e intuitiva de anlise exploratria a visualizao de valores
extremos nos mapas. Vale ressaltar que o uso de diferentes pontos de corte da varivel
induz a visualizao de diferentes aspectos. Os softwares de anlise espacial dispem
usualmente de trs mtodos de corte de varivel: intervalos iguais, percentis e desviospadro.
No caso de intervalos iguais, em que os valores mximo e mnimo so divididos pelo
nmero de classes, se a varivel tem uma distribuio muito concentrada de um lado,
caracterizando uma assimetria, esse corte deixa apenas um nmero pequeno de reas nas
classes da perna mais longa da distribuio; como resultado, a maior parte das reas ser
alocada a uma ou duas cores. O uso de percentis para definio de classes obriga a
alocao dos polgonos em quantidades iguais pelas cores; isto pode mascarar diferenas
significativas em valores extremos e dificultar a identificao de reas crticas. Finalmente, o
uso de desvios-padro, no qual a distribuio da varivel apresentada em gradaes de
cores diferentes para valores acima e abaixo da mdia, faz a suposio da normalidade da
distribuio da varivel.
Em resumo, parte importante da anlise exploratria experimentar diferentes
pontos de corte da varivel na visualizao dos mapas (CMARA et al., 2004). Os
procedimentos consistem em adaptaes de consagradas tcnicas da estatstica, como
histograma, quartis, desvio padro e pontos discrepantes, sendo que o detalhe que esses
recursos agora so representados em mapas temticos, indicando as localizaes.

3.2.2 Elementos bsicos


Em todas as tcnicas de estatstica espacial de dados de rea empregadas esto
presentes trs elementos bsicos: a matriz de proximidade espacial (W), o vetor de desvios
(Z) e o vetor de mdias ponderadas (Wz).
a) Matriz de proximidade espacial
Para estimar a variabilidade espacial de dados de rea, uma ferramenta bsica a
matriz de proximidade espacial, tambm chamada matriz de vizinhana. A matriz de
proximidade espacial uma ferramenta geral e bastante til para descrever o arranjo

espacial dos objetos (BAILEY & GATRELL, 1995). Dado um conjunto de n reas {A1, A2,...,
An}, constri-se a matriz W de ordem nxn onde cada um dos elementos wij representa uma
medida de proximidade entre Ai e Aj. Essa medida de proximidade pode ser calculada a
partir de um dos seguintes critrios:
i) wij = 1, se o centride de Ai est a uma determinada distncia de Aj; caso contrrio
wij = 0; para i j = 1,...,n.
ii) wij = 1, se Ai compartilha um lado comum com Aj, caso contrrio wij = 0; para i j =
1,...,n.
iii) wij = l ij/l i, onde lij o comprimento da fronteira entre Ai e Aj e li o permetro de Ai;
para i j = 1,...,n.
Ao utilizar matrizes de proximidade espacial que considerem a contiguidade,
importante convencionar as formas de vizinhana. Para tanto, os critrios so baseados em
movimentos de algumas peas do jogo de xadrez, como a rainha, torre e bispo. Por
exemplo, a Figura 16 apresenta os critrios de vizinhana para identificar os vizinhos da
rea J. Na Figura 16 (A) o critrio adotado o rainha Queen, o seja, todas as reas que
tiverem interseo no nula com a rea J sero vizinhas da rea J. Na Figura 16 (B)
apresentado o critrio torre Rook, em que os vizinhos sero apenas aqueles que tiverem
um lado em comum. Para o critrio bispo Bishop, apenas as reas que se localizam nas
diagonais so consideradas vizinhas (Figura 16 (C)).

Figura 16 Representao dos tipos de contiguidade entre reas. (A) Contiguidade Queen
rainha, (B) Contiguidade Rook torre e (C) Contiguidade Bishop bispo.
A idia da matriz de proximidade espacial pode ser generalizada para vizinhos dos
vizinhos, e isso caracteriza a ordem da matriz. Por exemplo, considerando o critrio de
vizinhana Rook e uma matriz de ordem 2, os vizinhos de F, I, N e K tambm seriam
considerados vizinhos de J. Como a matriz de proximidade utilizada em clculos de
indicadores na fase de anlise exploratria, muito til normalizar suas linhas, para que a

soma dos pesos de cada linha seja igual a 1. Isto simplifica os clculos de ndices de
autocorrelao espacial.

b) Vetor dos desvios


Sabe-se que a cada rea i est associado um nmero real (xi), que representa o
valor do atributo na rea i. Para o clculo do vetor de desvios Z calculada, primeiramente,
a mdia () dos valores dos atributos, considerando as n reas. Cada elemento i de Z, zi,
obtido subtraindo-se o valor da mdia, do valor do atributo, ou seja, zi = xi - .

c) Vetor de mdias ponderadas


O terceiro elemento bsico, o vetor de mdias ponderadas (Wz), obtido pela
multiplicao do vetor transposto dos desvios, pela matriz de proximidade espacial com
linhas normalizadas, onde cada elemento de uma linha i qualquer, originariamente com valor
1, dividido pelo nmero de elementos no-nulos da mesma linha. Desta forma, como
resultado, cada elemento wzi, contm um valor correspondente mdia dos desvios dos
vizinhos da rea i, caracterizando uma mdia mvel espacial.
Com a definio do vetor de mdias ponderadas podemos estabelecer outro mapa
em uma anlise exploratria, simplesmente calculando a mdia mvel espacial dos atributos
estudados. Segundo CMARA et al. (2004) o clculo de uma mdia mvel espacial uma
forma de explorar a variao da tendncia espacial dos dados, pois a operao tende a
produzir uma superfcie com menor flutuao que os dados originais.

3.2.3 Indicador global de autocorrelao espacial


Um teste usualmente utilizado para indicar a possibilidade de autocorrelao
espacial global o teste I de Moran, assim batizado em homenagem ao estatstico
australiano Patrick Alfred Pierce Moran que o definiu no artigo MORAN (1950). Segundo
ANSELIN (2005), o ndice I de Moran uma medida cujo resultado indica se os dados se
distribuem ou no de forma aleatria no espao. A estatstica I de Moran calcula uma
medida de autocorrelao espacial global cujo significado pode ser interpretado da seguinte
forma: caso esta autocorrelao seja positiva, ento tem-se que, se uma dada regio
apresentar valores elevados ou (baixos) para uma varivel qualquer, ento seu entorno
deve apresentar valores elevados ou (baixos), o que caracterizaria uma espcie de cluster

no espao. Caso esta estatstica seja negativa, ento pode-se esperar que uma regio
qualquer que apresente um valor elevado ou (baixo) para uma dada varivel, dever estar
cercada de regies cujos valores para esta mesma varivel devem ser baixos ou (elevados).
O ndice global de Moran indicado na Equao (36):

I = ( wij ( xi x )( x j x )) /( ( xi x ) 2 )
i =1 j =1

(36)

i =1

O mesmo clculo feito para matrizes de proximidade de maior ordem permite estimar
a funo de autocorrelao para cada ordem de vizinhana (ou lag). Para testar a
significncia do ndice I de Moran, utiliza-se uma distribuio de referncia aleatorizando os
valores do atributo estudado nas reas e calcula-se um novo valor do ndice para cada
permutao feita, permitindo a realizao do seguinte teste de hipteses: H0: = 0, que
representa a hiptese nula de ausncia de correlao espacial versus a hiptese alternativa
H1: 0. Se o nvel descritivo (p-valor) for menor que o nvel de significncia estipulado
(usualmente 0,05 de probabilidade) rejeita-se a hiptese nula de ausncia de correlao
espacial. Ao contrrio, se o nvel descritivo for maior que o nvel de significncia, no se
rejeita a hiptese nula.
O ndice I de Moran tambm pode ser definido em funo do vetor de desvios e do
vetor de mdias ponderadas, ou seja:

I=

Z t Wz
Zt Z

(37)

3.2.4 Diagrama de espalhamento de Moran


Segundo ANSELIN (1996), o grfico de disperso de Moran uma das formas de
interpretar o ndice I de Moran. Como este ndice indica a inclinao da reta de regresso de
Wz (mdia dos vizinhos dos desvios z normalizada) em Z (desvios normalizados) (NETER e
WASSERMAN, 1974), pode-se construir um dispositivo grfico para visualizar a associao
espacial entre cada elemento zi com a mdia dos valores dos seus vizinhos wzi. A Figura 17
mostra como o grfico de disperso do ndice I de Moran construdo, grfico este
rotineiramente chamado de Moran Scatterplot.
O grfico de disperso de Moran apresentado na Figura 17 dividido em
quadrantes. Esses quadrantes correspondem a quatro padres de associao espacial
entre as regies e seus vizinhos. O primeiro quadrante (localizado na parte superior direita)
mostra as regies que apresentam altos valores para a varivel em anlise cercadas por

regies que apresentam valores semelhantes. A classificao atribuda a esse quadrante


alto-alto (AA). O segundo quadrante (localizado na parte superior esquerda) mostra as
regies com valores baixos cercados por vizinhos que apresentam valores altos.

Figura 17 Construo do grfico de disperso do ndice I de Moran.


Esse quadrante classificado como baixo-alto (BA). O terceiro quadrante (localizado
no canto inferior esquerdo) constitudo pelas regies com valores baixos para as variveis
em anlise cercados por vizinhos que tambm apresentam baixos valores. Esse quadrante
identificado como baixo-baixo (BB). O quarto quadrante (localizado no canto inferior
direito) formado pelas regies com altos valores para as variveis em anlise cercadas por
regies com baixos valores. Tal quadrante classifica-se como alto-baixo (AB). As regies
que esto localizadas nos quadrantes AA e BB apresentam autocorrelao espacial positiva,
ou seja, essas regies formam clusters de valores similares. Por outro lado, os quadrantes
BA e AB apresentam autocorrelao espacial negativa, indicando regies em que seu
comportamento diferente de seus vizinhos.

3.2.5 Mapa de espalhamento de Moran

Para uma melhor compreenso do diagrama de espalhamento de Moran,


conveniente apresent-lo associado com um mapa temtico bidimensional, no qual cada
polgono da regio estudada apresentado segundo seu quadrante no diagrama de
espalhamento de Moran. Este mapa conhecido como Box Map e a sua legenda
construda segundo a Figura 18.

Figura 18 Legenda do mapa de espalhamento de Moran.

3.2.6 ndice local de associao espacial (LISA)


Enquanto o indicador global de correlao espacial I de Moran fornece um nico
valor como medida da associao espacial para todo o conjunto de dados, os indicadores
locais produzem um valor especfico para cada objeto, permitindo assim, a identificao de
agrupamentos de objetos com valores de atributos semelhantes (clusters) e objetos
anmalos (outliers). Segundo ANSELIN (1995), um LISA tem que atender a dois objetivos:
i) permitir a identificao de padres de associao espacial significativos;
ii) ser uma decomposio do ndice global de associao espacial.
O LISA utilizado neste trabalho o ndice local de Moran. Uma das formas de
representao deste ndice, em funo dos elementos bsicos, exposta na Equao 38:

I i = z i Wz i / 2

(38)

em que:

I i : ndice local para o objeto i ; i = 1,...,n.


z i : valor do desvio do objeto i; i = 1,...,n.
Wzi : valor mdio dos desvios dos objetos vizinhos de i;

2 : varincia da distribuio dos valores dos desvios.

3.2.7 Lisa map


A significncia estatstica do uso do ndice de Moran local computada de forma
similar ao caso do ndice global. Para cada rea, calcula-se o ndice local e, depois permutase aleatoriamente o valor das demais reas, at obter-se uma pseudo-distribuio para a

qual possamos computar os parmetros de significncia.Uma vez determinada a


significncia estatstica do ndice local de Moran, til gerar um mapa indicando as regies
que apresentam correlao local significativamente diferente do resto do dados. Estas
regies podem ser vistas como "bolses" de no-estacionariedade, pois so reas com
dinmica espacial prpria e que merecem anlise detalhada.

3.2.8 Moran map


O Moran map uma mapa gerado pela combinao do diagrama de espalhamento
de Moran com o Lisa map. Desta forma, as regies detectadas como significativas no Lisa
map so classificadas conforme sua localizao no diagrama de espalhamento de Moran.

3.3

MATERIAL E MTODOS

3.3.1 Material
A anlise de um conjunto de dados reais ser efetuada com o propsito de ilustrar a
aplicao das tcnicas de estatstica espacial de reas. Para criao do banco de dados
espaciais, ser utilizado um shapefile dos municpios da regio Oeste do Estado do Paran
(Figura 19).

Figura 19 Shapefile dos 36 municpios estudados na Regio Oeste do Paran.


Pretende-se estudar a autocorrelao espacial de ndices de vegetao da soja no
ano agrcola de 2004/2005. Para tanto, ser utilizado um conjunto de ndices NDVI e GVI de
reflectncia de superfcie da safra 2004/2005 obtidos por MERCANTE (2007) nas datas de
23/11/2004, 09/12/2004, 25/12/2004, 26/01/2005 e 11/02/2005.
Entre os diversos ndices de vegetao existentes, o ndice de vegetao por
diferena normalizada (NDVI - Normalized Difference Vegetation Index) (ROUSE et al.,
1973), obtido a partir da razo entre a subtrao e soma das refletncias das bandas da
regio do infravermelho prximo e do vermelho do espectro eletromagntico, o que vem
sendo mais largamente utilizado (KLERING et. al, 2007).
Em estudos de monitoramento, frequentemente buscado o estabelecimento de
relaes entre o padro de evoluo do crescimento das plantas ao longo do tempo com o
padro de evoluo temporal do NDVI. A utilidade do ndice NDVI foi demonstrada em
diversos campos, tais como, agricultura de preciso, estudo da fenologia da vegetao, em
classificaes espectrais e avaliaes primrias de produtividades (SUGAWARA, 2001).
Segundo SONG & WOODCOOCK (2003), a transformao Tasseled Cap um dos
ndices de vegetao mais utilizado para as imagens geradas pelos satlites do projeto

Landsat. Nessa transformao, as resultantes so trs imagens-sntese denominadas


Brightness, Greenness e Wetness (CRIST & CICONE, 1984). A imagem greenness ou
ndice de vegetao GVI (green vegetation index) apresenta altos valores em alvos com alta
densidade de vegetao verde, sendo obtida de acordo com a Equao (39), em que T(i)
representa a banda(i) do sensor Thematic Mapper do satlite Landsat 5.
GVI = -0.2848(T1) -0.2435(T2) -0.5436(T3) +0.7243(T4) +0.0840(T5) -0.1800(T7)

(39)

3.3.2 Metodologia
A Figura 20 mostra o roteiro de anlise que ser trabalhado com ndices de
vegetao. Ser feita uma anlise exploratria dos ndices de vegetao e posteriormente,
ser criada a matriz queen de proximidade espacial referente ao shapefile da Regio Oeste
do Paran. Sero calculados ndices de correlao espacial global e local e confeccionados
diagramas de espalhamento de Moran, Lisa Maps e Moran Maps.

Figura 20 Roteiro de anlise que ser trabalhado com ndices de vegetao.

3.4

RESULTADOS E DISCUSSO
A Figura 21 apresenta a evoluo temporal do ndice NDVI. Os intervalos foram

definidos agrupando os valores de NDVI de todas as datas para obter o mximo (0,8750) o
mnimo (0,2609) e a amplitude geral (0,61403) dos ndices. Posteriormente, dividiu-se a
amplitude geral pelo nmero de classes desejado (5) para obter o intervalo de classe.

Figura 21 Evoluo temporal do ndice NDVI.


Observa-se que a evoluo temporal do ndice NDVI esteve relacionada com as
diferentes fases do ciclo fenolgico da cultura, pois os valores mais baixos dos ndices so
observados em 23/11/04, onde a cultura j est em desenvolvimento. Porm, em perodo
inicial e os valores mais altos se encontram entre 26/01/05 e 11/02/05, perodo esse de
maior desenvolvimento das plantas.

possvel observar uma diferena nas datas de

plantio, visto que alguns municpios tm seus ciclos mais tardios que os outros. A Figura 22
apresenta a evoluo temporal do ndice GVI, em que as classes foram calculadas de
maneira anloga ao ndice NDVI. A evoluo temporal do ndice GVI apresenta um
comportamento semelhante evoluo do ndice NDVI, no que diz respeito relao com o
ciclo fenolgico da cultura da soja, pois nas datas iniciais os valores so baixos e nas finais
os valores so altos. Destaca-se certa insensibilidade do ndice em 23/11/04, pois, como
97,22 % dos municpios encontram-se no primeiro intervalo da legenda, no se pode
identificar quais municpios apresentam um plantio antecipado.
A Tabela 20 apresenta o ndice I de Moran dos ndices de vegetao NDVI e GVI
com seu respectivo nvel descritivo (p-valor) referente hiptese de falta de correlao
espacial. Nesta anlise est sendo considerada que os dados apresentam uma distribuio
normal. Para cada data foram geradas distribuies empricas, por meio de 99 permutaes

escolhidas independentes e com igual probabilidade dentre todas as possveis permutaes


dos ndices entre os municpios estudados.

Figura 22 Evoluo temporal do ndice GVI.


Considerando o NDVI observa-se que, para todas as datas em estudo, o ndice I de
Moran obtido foi maior que zero, assim, existe uma correlao positiva indicando que a
regio estudada apresenta municpios com altos e/ou baixos ndices NDVI cercados por
municpios com a mesma situao.

ndice
NDVI

GVI

Tabela 18 ndice I de Moran dos ndices NDVI e GVI


Data
p-valor
I
23/11/04
0,6368
0,0010*
09/12/04
0,7315
0,0010*
25/12/04
0,4299
0,0010*
26/01/05
0,5694
0,0010*
11/02/05
0,7122
0,0010*
23/11/04
0,5258
0,0010*
09/12/04
0,6814
0,0010*
25/12/04
0,2322
0,0140*
26/01/05
0,6904
0,0010*
11/02/05
0,7317
0,0010*

*Rejeita-se a hiptese de falta de correlao espacial ao nvel de 5% de


probabilidades.

Considerando o ndice GVI, verifica-se que em todas as datas os ndices calculados


foram positivos e significativos, evidenciando a presena de aglomerados de valores
semelhantes. Os nveis descritivos (p-valores) referentes a todas as datas em estudo so
inferiores aos nveis de significncias estipulados (0,05 de probabilidade), mostrando que as

correlaes espaciais positivas dos ndices NDVI e GVI, nas datas monitoradas, so
significativas. Comparando o ndice I de Moran dos ndices de vegetao NDVI e GVI,
destaca-se que o comportamento de ambos semelhante, porm, nas trs primeiras datas
monitoradas os ndices calculados com o NDVI so superiores aos calculados com o GVI,
fato esse que se inverte nas duas ltimas datas, em que o ndice I de Moran do GVI mais
elevado. A Figura 23 apresenta os diagramas de espalhamento de Moran dos ndices NDVI
e GVI em 23/11/2004, 25/12/2004 e 11/02/2005. Primeiramente, destaca-se o coeficiente
angular da reta de regresso de Wz versus Z, que representa o ndice I de Moran.

Figura 23 Diagrama de espalhamento de Moran (Moran Scatterplot) para os


ndices NDVI e GVI em 23/11/2004, 25/12/2004 e 11/02/2005.
Nos diagramas de espalhamento de Moran (Figura 23), cada ponto representa um
municpio da regio estudada - assim, temos uma maneira visual de investigar o ndice I de
Moran. Considerando a data

23/11/2004 observa-se que a maioria dos municpios

encontra-se nos quadrantes AA e BB, tanto para o ndice NDVI quanto para o GVI, o que
evidencia a correlao espacial positiva. Considerando os diagramas em 25/12/04, verificase que os municpios, que anteriormente se localizavam nos quadrantes AA e BB, comeam
a se distribuir nos demais quadrantes, evidenciando um perodo de transio. Este
comportamento devido ao fato que nas regies em que os ndices so altos, alguns
municpios comeam a apresentar ndices menores, em virtude de estarem passando do
pico vegetativo. Em contrapartida, municpios que iniciaram o plantio posteriormente,
comeam a apresentar valores elevados, em virtude de estarem no estgio de maior

biomassa. Para uma investigao mais detalhada, quantificou-se a porcentagem de


municpios alocados em cada quadrante, o que apresentado na Tabela 19.
Tabela 19 Porcentagens de municpios em cada quadrante do grfico
de espalhamento de Moran dos ndices NDVI e GVI
ndice
DATA
AA
AB
BB
BA
23/11/04 44,44 % 02,78 %
50,00 %
02,78 %
09/12/04 30,56 % 05,56 %
55,56 %
08,33 %
25/12/04 41,67 % 13,89 %
30,56 %
13,89 %
NDVI
16,67 %
26/01/05 38,89 % 05,56 %
38,89 %
11/02/05 41,67 % 19,44 %
36,11 %
02,78 %
23/11/04 41,67 % 05,56 % 47,22 %
05,56 %
09/12/04 33,33 % 08,33 % 52,78 %
05,56 %
GVI
25/12/04 36,31 % 16,67 % 30,56 %
16,67 %
26/01/05 50,00 % 05,56 % 33,33 %
11,11 %
11/02/05 38,80 % 13,80 % 44,44 %
02,78 %
Conforme observado, pontos que se enquadram nos quadrantes AB e BA do grfico
de espalhamento de Moran representam municpios com associao espacial negativa, ou
seja, so entendidos como municpios com alto (baixo) ndice de vegetao cercados por
municpios com baixo (alto) ndice de vegetao. Observando o NDVI possvel constatar
que a data que apresenta a maior porcentagem de municpios alocados nos quadrantes AB
e BA 25/12/04 com 27,78 % dos municpios. Para o GVI o mesmo ocorre, porm, a
porcentagem de municpios alocados nos quadrantes que representam correlao inversa
33,34 %. Assim, verifica-se que o ndice GVI foi mais eficaz na deteco do perodo de
transio. Considerando a ltima data monitorada (11/02/2005), observa-se que, para o
ndice NDVI a porcentagem de municpios alocados no quadrante AA superior
porcentagem de municpios alocados no quadrante BB. Desta maneira existe maior
quantidade de municpios com ndice NDVI alto cercados por municpios com ndice NDVI
altos, do que municpios com ndice NDVI baixos cercados por municpios com ndice NDVI
baixos. Este comportamento se inverte quando consideramos o ndice GVI, pois para a
mesma data, a porcentagem de municpios alocados em AA menor do que a porcentagem
de municpios alocados em BB. Este comportamento pode ser explicado pelo fato do ndice
GVI utilizar de mais informaes que so oriundos de maior quantidade de bandas TM,
como por exemplo, a banda 5 (1,55 1,75 m ) que sensvel ao teor de umidade das
plantas e a banda 7 (2,08 2,35 m ) que sensvel morfologia do terreno.
Sabe-se que o ndice I de Moran uma medida de associao espacial para toda a
regio em estudo, e como se investigam 36 municpios, provvel que ocorram diferentes
regimes de associao espacial. Assim,

necessrio complementar a anlise com a

utilizao de um ndice que produza um valor especfico para cada municpio, o que vai
permitir a identificao de agrupamentos. A Tabela 20 apresenta os ndices locais de

associao espacial (LISA) do ndice NDVI para todas as datas monitoradas acompanhados
de sua classificao quanto significncia estatstica.
Tabela 20 ndice local de associao espacial (LISA) do ndice NDVI
Municpios
23/11/04
09/12/04
25/12/04
26/01/05
11/02/05
Anahy
Araruna
Assis Chateaubriand
Boa esperana
Braganey
Cafelndia
Campina da Lagoa
Campo Bonito
Campo Mouro
Cascavel
Corblia
Corumbata do Sul
Farol
Formosa do Oeste
Goioer
Iguatu
Iracema do Oeste
Janipolis
Jesutas
Juranda
Luiziana
Mambor
Marip
Nova Aurora
Nova Cantu
Ouro Verde do Oeste
Palotina
Peabiru
Quarto Centenrio
Rancho Alegre dOeste
Santa Tereza do Oeste
So Pedro do Iguau
Toledo
Tuneiras do Oeste
Tupssi
Ubirat

0,85
1,57
-0,14
1,51
0,79
0,22
0,28
0,12
0,87
1,07
0,53
0,40
1,35
0,35
0,78
0,25
0,54
1,15
0,34
0,29
0,13
0,28
0,85
0,02
-0,05
1,17
0,52
0,82
0,33
0,79
0,91
0,68
1,22
0,77
0,59
0,14

ns
*
*
**
*
ns
ns
*
**
**
*
ns
**
*
*
**
ns
**
ns
ns
ns
ns
*
ns
ns
ns
ns
*
ns
*
*
*
**
**
ns
ns

0,14
1,14
1,06
0,94
0,00
0,02
-0,11
0,03
0,42
0,57
0,05
0,03
0,78
0,02
0,56
0,29
0,09
1,34
-0,03
0,43
0,20
0,26
2,91
-0,01
-0,16
2,76
2,61
0,31
0,06
0,12
1,72
1,59
2,68
1,59
1,13
0,05

ns
*
**
*
ns
ns
ns
ns
*
*
ns
ns
**
ns
ns
ns
ns
**
ns
ns
ns
ns
**
ns
ns
*
*
ns
ns
*
**
**
**
**
*
ns

0,97
0,74
0,06
0,45
-0,01
-0,08
0,08
0,43
0,68
-0,01
0,18
0,84
0,32
1,58
0,86
0,50
1,73
0,01
1,66
0,54
0,08
0,45
-0,02
0,03
-0,36
0,11
-0,06
1,77
0,40
-0,11
1,01
0,47
-0,11
-0,35
-0,14
0,32

ns
ns
ns
ns
ns
ns
ns
ns
**
ns
ns
**
ns
**
ns
*
*
ns
*
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
*
ns
ns
ns
ns
ns

0,93
0,67
-0,01
1,13
1,15
1,39
0,00
0,98
0,56
0,93
1,36
0,27
0,77
0,00
0,64
1,24
0,11
1,42
0,09
0,48
0,36
0,75
0,00
0,24
0,70
-0,26
0,00
-0,42
0,22
0,92
0,85
0,24
-0,20
1,92
0,53
-0,02

*
*
ns
**
**
*
ns
ns
ns
**
**
ns
**
ns
*
**
ns
**
ns
*
*
**
ns
*
ns
ns
ns
*
ns
*
ns
ns
ns
*
ns
ns

-0,02
0,91
1,53
1,39
-0,03
0,62
0,16
-0,02
1,07
0,72
0,13
0,36
1,30
-0,18
-0,57
0,02
-0,09
0,73
0,12
0,69
1,54
1,28
2,70
0,35
0,96
0,10
3,03
0,54
-0,01
0,32
0,32
-0,06
1,80
0,91
2,32
0,00

ns
**
**
**
ns
*
ns
ns
**
*
ns
ns
**
ns
ns
ns
ns
*
ns
**
**
**
**
ns
*
ns
*
ns
ns
ns
*
ns
**
**
**
ns

(ns) no significativo; (*) significativo com 5% de probabilidade e (**) significativo com 1% de


probabilidade

Segundo Anselin (1995), a interpretao do ndice local I i semelhante


interpretao do ndice global, pois valores positivos de I i indicam uma agregao espacial
de valores similares enquanto que valores negativos desta estatstica, indicam uma
agregao espacial de valores dissimilares. Observando a Tabela 20, destaca-se a data
25/12/04 com apenas 7 ndices classificados como significativos, o que pode ser explicado
pelo fato da soja se encontrar em diferentes fases do seu desenvolvimento na regio e este
ser um perodo de transio - visto que nas regies em que inicialmente as plantas
apresentavam as folhas em desenvolvimento, as vagens comeam a apresentar a cor de
vagem madura e, nas regies que iniciaram um plantio posterior, as plantas comeam a

apresentar um pleno enchimento das vagens. A Tabela 21 apresenta os ndices locais de


associao espacial I i referentes aos ndices de vegetao GVI em todas as datas
monitoradas.
Tabela 21 ndice local de associao espacial (LISA) do ndice GVI
Municpios
23/11/04
09/12/04
25/12/04
26/01/05
11/02/05
Anahy
Araruna
Assis Chateaubriand
Boa esperana
Braganey
Cafelndia
Campina da Lagoa
Campo Bonito
Campo Mouro
Cascavel
Corblia
Corumbata do Sul
Farol
Formosa do Oeste
Goioer
Iguatu
Iracema do Oeste
Janipolis
Jesutas
Juranda
Luiziana
Mambor
Marip
Nova Aurora
Nova Cantu
Ouro Verde do Oeste
Palotina
Peabiru
Quarto Centenrio
Rancho Alegre dOeste
Santa Tereza do Oeste
So Pedro do Iguau
Toledo
Tuneiras do Oeste
Tupssi
Ubirat

0,31
0,87
-0,18
1,67
0,66
0,12
0,20
1,90
0,66
0,92
0,25
-1,05
1,31
0,09
0,71
-0,01
0,48
1,11
0,36
0,62
0,38
0,59
0,74
0,07
-0,12
0,84
0,40
0,27
0,45
1,04
0,55
0,50
0,82
0,56
0,30
0,00

ns
*
ns
**
*
ns
ns
*
*
**
ns
ns
**
*
*
ns
ns
**
ns
*
ns
*
*
ns
ns
ns
ns
ns
ns
**
*
ns
*
*
ns
ns

0,11
1,27
1,11
0,44
-0,04
0,06
-0,06
0,10
0,64
0,42
0,01
-0,08
0,43
0,08
0,28
0,11
0,26
0,48
-0,02
0,23
0,65
0,37
4,38
0,00
0,10
1,47
4,51
0,50
0,05
0,04
0,71
0,77
2,36
1,02
1,14
-0,07

ns
*
**
ns
ns
ns
ns
ns
**
ns
ns
ns
**
ns
ns
ns
ns
*
ns
ns
ns
*
**
ns
ns
ns
*
*
ns
ns
*
*
**
*
*
ns

1,06
0,23
0,08
-0,13
-0,04
0,46
0,02
0,33
-0,01
-0,33
0,60
-0,41
0,36
0,64
1,29
0,51
0,38
0,28
0,29
0,15
-0,45
0,01
0,97
0,14
-0,72
0,00
0,94
-0,37
0,07
-0,19
0,30
-0,12
-0,02
0,79
0,46
0,59

*
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
*
**
ns
*
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
ns
*
ns
ns

0,26
3,18
0,50
0,28
0,55
1,11
-0,04
0,41
1,51
0,97
0,96
2,00
1,22
0,02
0,16
0,49
0,50
0,64
0,73
-0,05
0,44
0,28
0,37
0,45
0,46
-0,29
0,59
2,09
-0,04
-0,06
0,86
0,17
-0,11
2,74
0,77
0,03

ns
**
*
ns
*
*
ns
ns
**
**
**
*
**
ns
ns
ns
ns
ns
ns
ns
ns
*
ns
**
ns
ns
ns
**
ns
ns
ns
ns
**
**
*
ns

0,20
0,43
1,96
2,09
-0,06
0,15
0,08
-0,02
0,89
0,39
0,05
-0,12
1,54
0,12
0,10
0,15
-0,08
1,16
0,42
0,74
1,96
1,69
2,55
0,54
0,95
0,06
3,05
0,07
-0,03
0,56
0,01
-0,06
1,45
0,70
1,89
0,01

ns
*
**
**
ns
*
ns
ns
**
ns
ns
ns
**
ns
ns
ns
ns
**
ns
*
**
**
**
*
*
ns
*
ns
ns
*
ns
ns
**
*
**
ns

(ns) no significativo; (*) significativo com 5% de probabilidade e (**) significativo com 1% de


probabilidade

Destaca-se tambm o fato da data 25/12/04 apresentar uma grande quantidade de


ndices no significativos, pois apenas os municpios de Anahy (1), Goioer (15), Iguatu
(16), Janipolis (18) e Tuneiras do Oeste (34) apresentaram ndices de correlao espacial
significativos (p-valor < 0,05).
Para um melhor entendimento do ndice local de associao espacial I i ,
conveniente apresent-lo em um mapa temtico que indique os municpios que apresentam
associao espacial significativa, pois segundo Druck et al. (2004), estas regies podem ser
vistas como "bolses" de no-estacionariedade, pois so reas com dinmica espacial

prpria e que merecem anlise detalhada. A Figura 24 apresenta o mapa de significncia


LISA do ndice de vegetao NDVI da soja na safra 2004/2005 na regio monitorada. A
legenda deste mapa formada por 3 classes, sendo que a primeira indica os municpios em
que o ndice local I i no significativo, a segunda ndica os municpios em que o ndice
local I i significativo ao nvel de 5 % de probabilidade e a ltima classe

indica os

municpios em que o ndice local I i significativo ao nvel de 1 % de probabilidade.

Figura 24 Mapa de significncia LISA do ndice de vegetao NDVI da soja.

Observando a Figura 24 possvel identificar o comportamento do ndice de


vegetao NDVI durante o perodo analisado. Em 23/11/2004, destaca-se a presena de um
agrupamento de municpios que se inicia em torno de Cascavel (10) e se estende pela
regio noroeste at atingir a regio nordeste. Este agrupamento indica os municpios que
apresentam correlao espacial significativa. Observe que este agrupamento vai diminuindo
at quase desaparecer em 25/12/04, perodo em que o desenvolvimento da cultura est em
transio. Na ltima data monitorada (11/02/05), fica evidente a existncia de dois grupos de
municpios onde o ndice de vegetao NDVI correlacionado espacialmente. A Figura 25
apresenta o Mapa de significncia LISA do ndice GVI da soja na safra 2004/2005.

Figura 25 Mapa de significncia LISA do ndice de vegetao GVI da soja.

Destaca-se tambm, na Figura 25, o baixo nmero de municpios com ndices


significantes em 25/12/04 e a presena de dois agrupamentos de municpios com ndices
significantes nas demais datas monitoradas. Na Figura 26 destaca-se o mapa de
significncia LISA do ndice NDVI agora classificado conforme a legenda do diagrama de
espalhamento de Moran. Este mapa conhecido como LISA cluster map e permite
identificar qual tipo de correlao existe entre os municpios identificados como significantes.

Figura 26 LISA cluster map do ndice NDVI da soja na safra 2004/2005.

Observando a data 23/11/04 na Figura 26 verifica-se que o aglomerado de


municpios que apresenta correlao espacial significativa formado por dois grupos com
caractersticas diferentes. O primeiro grupo, localizado na regio de Cascavel (10) e Toledo
(33), indica os municpios em que o ndice de vegetao NDVI alto cercado por municpios
onde o ndice tambm alto, e o outro grupo, na regio de Araruna (2) e Tuneiras do Oeste
(34), indica os municpios

em que o ndice de vegetao NDVI baixo cercado por

municpios com ndice baixo. Este comportamento se inverte na ltima data monitorada, o
que deixa claro que a soja no cultivada no mesmo perodo na regio Oeste do Paran,
pois enquanto na regio de Cascavel (10) o desenvolvimento da cultura encontra-se no
estdio de maturao, a soja na regio Norte ainda est no estdio de enchimento das
vagens, atingindo o seu pico vegetativo. A Figura 27 apresenta o LISA cluster map
elaborado com base no ndice GVI.

Figura 27 LISA cluster map do ndice GVI da soja na safra 2004/2005.

O comportamento do ndice de vegetao GVI semelhante ao comportamento do


ndice de vegetao NDVI, pois observando a Figura 27 destacam-se as duas regies em
que o plantio da soja ocorre em diferentes datas. Em ambos os mapas das Figuras 26 e 27
destaca-se a pouca apario de municpios classificados nas categorias referentes s
correlaes inversas, porm, quando isso ocorre, interessante investigar com mais
detalhes. Por exemplo, considerando a Figura 26 em 26/01/05, verifica-se que apesar da
regio norte apresentar um aglomerado de municpios com valores baixos de NDVI, o
municpio de Peabiru (28) apresenta um valor elevado, indicando que neste municpio a soja
encontra-se em um estgio mais avanado. Um anlise semelhante feita considerando a
Figura 27 na data 26/01/05, pois apesar da regio de Cascavel (10) apresentar altos valores

de GVI, verifica-se que a cidade de Toledo (33) apresenta um valor baixo, indicando que
neste municpio a soja encontra-se em um estdio menos desenvolvido que nos demais.
3.5

CONCLUSO
Os resultados mostraram que a estatstica espacial de reas uma boa alternativa

para estudar o comportamento espectral da cultura da soja, pois ela permite identificar
regies com caractersticas semelhantes, o que por sua vez serve de informao para os
participantes da cadeia produtiva da soja, permitindo que produtores, cooperativas,
consumidores e demais membros da cadeia produtiva da soja fiquem mais informados e
possam traar melhor seus planos para o fortalecimento da cultura.

REFERNCIAS
ANSELIN, L. Local Indicators of Spatial Association--LISA. Geographical Analysis vol. 27,
p. 93-115, 1995.
ANSELIN, L. The Moran scatterplot as ESDA tool to assess local instability in spatial
association. In: Fisher, M.; Scholten, H. J.; Unwin, D. Spatial Analytical Perspectives on
GIS. London: Taylor & Francis, p. 111-126, 1996.
ANSELIN, L. Exploring Spatial Data with GeoDa: a Workbook, Urbana-Champaign, 2005.
244 p.
BAILEY, T. C.; GATRELL, A. C. Interactive Spatial Data Analysis. Essex: Longman. 1995.
432 p.
CMARA, G.; MONTEIRO, A. M.; DRUK, S.; CARVALHO, M. Anlise espacial de dados
geogrficos. Planaltina, DF: Embrapa Cerrados. 2004. 209 p.
CRIST E.P.; CICONE C.C. A Physically-Based transformation of Thematic Mapper data
The TM Tasseled Cap. Transactions on Geosciences and Remote Sensing, v.GE-22,
n.3. p. 256 263. 1984.
KLERING, E. V.; CUSTDIO, M. S.; FONTANA D. C.; BERLATO, M. A. Relao entre os
perfis temporais de NDVI/MODIS da cultura do arroz irrigado, a insolao e o
rendimento na regio da Campanha do Rio Grande do Sul. In: Simpsio Brasileiro de
Sensoriamento Remoto (SBSR), 8, Florianpolis, 2007.
MERCANTE, E. Dinmica Espectral da Cultura da Soja ao Longo do Ciclo Vegetativo e
sua Relao com a Produtividade na Regio Oeste do Paran. Tese de Doutorado.
FEAGRI UNICAMP. Campinas. 2007. 221 p.
MORAN, P.A.P. Notes on continuous stochastic phenomena. Biometrika, v.37, p. 1723,
1950.
NETER, J.; WASSERMAN, W. Applied Linear Statistical Models: regression, analysis of
variance and experimental designs. Ilinois: Richard D.Irwin, Inc. 1974. 842 p.
ROUSE, J. W.; HAAS, R. H.; SCHELL, J. A.; DEERING, D. W. Monitoring vegetation
systems in the great plains with ERTS. In: Earth Resources Technology Satellite 1
Symposium, 3., Washington, D. C., 1973. Proceedings. Washington, D. C.: NASA. Goddart
Space Flight Center, v. 1, p. 309-317. (NASA SP-351).1973.
SERRANO, R. M.; VALCARCE, E. V. Tcnicas economtricas para el tratamiento de
datos espaciales: la econometra espacial. 1 ed. Barcelona: Ediciones de la Universitat de
Barcelona. 2000. 158 p.
SONG, C.; WOODCOCK, C. E. Monitoring Forest Succession with Multitemporal Landsat
Images: Factors of Uncertainty. Transactions on Geosciences and Remote Sensing, v.
41, n.11, nov., p. 2557 2567. 2003.

SUGAWARA, L. M. Avaliao de modelo agrometereolgico e imagens NOOA/AVHRR


no acompanhamento e estimativa de produtividade da soja no estado do Paran.
Dissertao (Mestrado em Sensoriamento Remoto) INPE, So Jos dos Campos, 2001.
181p.

Livros Grtis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administrao
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Cincia da Computao
Baixar livros de Cincia da Informao
Baixar livros de Cincia Poltica
Baixar livros de Cincias da Sade
Baixar livros de Comunicao
Baixar livros do Conselho Nacional de Educao - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Domstica
Baixar livros de Educao
Baixar livros de Educao - Trnsito
Baixar livros de Educao Fsica
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmcia
Baixar livros de Filosofia
Baixar livros de Fsica
Baixar livros de Geocincias
Baixar livros de Geografia
Baixar livros de Histria
Baixar livros de Lnguas

Baixar livros de Literatura


Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemtica
Baixar livros de Medicina
Baixar livros de Medicina Veterinria
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Msica
Baixar livros de Psicologia
Baixar livros de Qumica
Baixar livros de Sade Coletiva
Baixar livros de Servio Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo

Das könnte Ihnen auch gefallen