Sie sind auf Seite 1von 21

ANLISIS EXPLORATORIO DE DATOS ESPACIALES AL SERVICIO DEL

GEOMARKETING1

Coro Chasco Yrigoyen


Instituto Lawrence R. Klein
Universidad Autnoma de Madrid
coro.chasco@uam.es

ABSTRACT:
El anlisis exploratorio de datos espaciales (AEDE) es una disciplina del
anlisis exploratorio de datos, tambin denominado data mining, que ha sido
diseada para el tratamiento especfico de los datos espaciales o geogrficos. Este
anlisis se utiliza para identificar relaciones sistemticas entre variables cuando no
existen expectativas claras sobre la naturaleza de estas relaciones. Esto ltimo
resulta muy habitual en el mbito de los estudios del mercado geogrfico
(geomarketing), donde se suele trabajar con grandes bases datos cuya estructura no
siempre es bien conocida. En esta ponencia se presentan las principales tcnicas
del AEDE, que combinan el anlisis estadstico con el grfico, haciendo posible el
estudio de las distribuciones espaciales y sus valores atpicos, esquemas de
asociacin espacial, agrupamientos espaciales y puntos calientes/fros de negocio
(hot spots). En los ltimos aos, los esfuerzos desarrollados por la investigacin en
este campo se han venido centrando en la conexin de los GIS disponibles en el
mercado con paquetes estadsticos tradicionales o especficos de AEDE.
Actualmente, existe en el mercado un nuevo programa informtico, GeoDa,
concebido como un producto autosuficiente que no requiere de un sistema
especfico de GIS y funciona en cualquiera de los sistemas operativos de Windows y
Mac. GeoDa ha sido desarrollado por el Profesor Luc Anselin de la Universidad de
Illinois, y tiene la ventaja de ser, hasta el momento, un producto opersource, es
decir, de libre acceso en Internet.
Palabras clave: Anlisis exploratorio de datos espaciales, autocorrelacin espacial,
GIS, geomarketing, GeoDa.

Ponencia presentada en el III Seminario sobre Nuevas Tecnologas en la Investigacin, el Marketing y la


Comunicacin. e-Participacin.

1. INTRODUCCIN
Este artculo pretende llamar la atencin de los investigadores sociales sobre
la importancia de llevar a cabo un adecuado anlisis estadstico de los datos
geogrficos. En efecto, aunque la investigacin de mercados suele trabajar con
informacin de carcter espacial (referida a unidades geogrficas), en pocas
ocasiones estos datos suelen ser tratados de forma especfica y diferente del
anlisis de series temporales, utilizando tcnicas adecuadas para el anlisis
estadstico-grfico-cartogrfico. Estas herramientas han sido bautizadas con el
nombre de anlisis exploratorio de datos espaciales (AEDE) y se conciden como una
disciplina dentro del ms general anlisis exploratorio de datos (AED), tambin
denominado data mining, que ha sido diseado para el tratamiento especfico de
los datos espaciales o geogrficos. El AEDE se utiliza para identificar relaciones
sistemticas entre variables cuando no existen expectativas claras sobre la
naturaleza de estas relaciones. Esto ltimo resulta muy habitual en el mbito de los
estudios del mercado geogrfico (geomarketing), donde se suele trabajar con
grandes bases datos cuya estructura no siempre es bien conocida.
Por esto, en este artculo se presentan las principales tcnicas del AEDE, que
es considerado como una tcnica novedosa que supone la unin de dos tecnologas
informticas muy poderosas: los GIS (sistemas de informacin geogrfica) y los
paquetes estadsticos propios del anlisis de datos espaciales. Es decir, las
herramientas del AEDE combinan el anlisis estadstico con el grfico, haciendo
posible el estudio de las distribuciones espaciales y sus valores atpicos, esquemas
de asociacin espacial, agrupamientos espaciales y puntos calientes/fros de
negocio (hot spots).
En los ltimos aos, los esfuerzos desarrollados por la investigacin en este
campo se han venido centrando en la conexin de los GIS disponibles en el
mercado con paquetes estadsticos tradicionales o especficos de AEDE.
Actualmente, existe en el mercado un nuevo programa informtico, GeoDa,
concebido como un producto autosuficiente que no requiere de un sistema
especfico de GIS y funciona en cualquiera de los sistemas operativos de Windows y
Macintosh. GeoDa ha sido desarrollado por el Profesor Luc Anselin de la
Universidad de Illinois y tiene la ventaja de ser, hasta el momento, un producto
opersource, es decir, de libre acceso en Internet.
Tras esta introduccin, en el Apartado 2, se define el concepto ms general
del AED, en concreto, aquellas funcionalidades que mantiene en comn con el
AEDE, que se define ms ampliamente en el Apartado 3. En el Apartado 4, se
presentan algunas de las tcnicas ms importantes del AEDE, ilustradas con
ejemplos que permiten exponer con mayor claridad el inters de estas herramientas
dentro del anlisis socioeconmico y, en particular, de la investigacin de mercados.
Un Apartado 5 de conclusiones y la bibliografa cierran esta exposin.

2. ANLISIS EXPLORATORIO DE DATOS (AED)


El origen del anlisis exploratorio de datos espaciales se encuentra en el
llamado anlisis exploratorio de datos (AED) o minera de datos (data mining). El

clsico AED podra definirse como el conjunto de herramientas grficas y


descriptivas utilizadas para el descubrimiento de patrones de comportamiento en los
datos y el establecimiento de hiptesis con la menor estructura posible. Esta
definicin fue propuesta por Tukey (1977), que hizo posible la extensin de este tipo
de anlisis multivariante y del software estadstico moderno.
De este modo, es posible obtener una estructura explicativa de los datos a
travs de unas tcnicas que combinan herramientas de la estadstica bsica
(descriptivos, correlaciones, tablas de frecuencias o de correlacin cruzada) con
anlisis multivariante avanzado, especialmente diseado para identificar formas en
grandes bases de datos (anlisis cluster, escalas multidimensionales, anlisis logit,
correlacin cannica, anlisis de correspondencias, rboles de clasificacin, etc.).
Las tcnicas de AED suelen estar acompaadas de mtodos de visualizacin
grfica capaces de identificar conexiones, tendencias o sesgos presentes en las
bases de datos inicialmente desestructuradas. Una de las ms conocidas tcnicas
propias del AED es el cepillado o brushing, un mtodo interactivo que permite la
seleccin en pantalla de un determinado nmero de datos para la identificacin de
caractersticas comunes o el examen de efectos o relaciones entre variables
relevantes. Estas relaciones entre variables suelen visualizarse mediante el ajuste
de funciones (lneas, en un plano de dos dimensiones o superficies tridimensionales)
y sus intervalos de confianza, de forma que, por ejemplo, puedan examinarse los
cambios que producen sobre dichas funciones la eliminacin o aadido (temporal)
de un determinado nmero de datos.
Figura 1

Ejemplo de herramientas de AED: matrices de correlacin (izda.) y anlisis


multivariante (dcha.)

Fuente: Elaboracin propia a partir de Statsoft (2000).

Otras tcnicas grficas del AED incluyen el ajuste y representacin grfica de


funciones, alisado de datos, superposicin o fusin de mltiples vistas (views),
aadido de datos en grficos, identificacin y sealizacin de subconjuntos de datos
que cumplen determinadas condiciones, representacin grfica de intervalos o reas
de confianza, tcnicas de reduccin de imgenes, etc. La exploracin de los datos
es slo un primer paso y sus resultados deben ser considerados como una etapa
previa a su confirmacin (modelizacin). Si los resultados de la fase exploratoria
sugieren la utilizacin de un modelo determinado, entonces su validacin puede

verificarse aplicando dicho modelo a un nuevo conjunto de datos y contrastando el


ajuste, es decir, su capacidad predictiva.
Es decir, los modernos mtodos de AED hacen hincapi en la interaccin
existente entre el conocimiento humano y la informtica en forma de grficos
estadsticos dinmicos que permiten al usuario la manipulacin directa de diversas
vistas de los datos. Algunos programas clsicos de AED, como Matlab, SPSS, SAS
han ido incorporando mapas como nuevas vistas integradas de forma dinmica con
el resto de informacin, a travs de sus extensiones Mapping Toolbox, SPSS Mapas
y SAS Bridge for ESRI, respectivamente. Sin embargo, la importancia concedida por
ellos al espacio se reduce prcticamente al tratamiento de la localizacin como un
simple plano de coordenadas X-Y, dado que las herramientas propias del AED no
suelen ser diseadas para el tratamiento especfico de datos geogrficos, ignorando
totalmente los efectos espaciales de dependencia y heterogeneidad. Por este
motivo, surge el anlisis exploratorio de datos espaciales (AEDE), como disciplina
dentro del AED, para el tratamiento especfico de los datos geogrficos.

3. ANLISIS EXPLORATORIO DE DATOS ESPACIALES (AEDE) Y GEODA.

El AEDE puede definirse como el conjunto de tcnicas que describen y


visualizan las distribuciones espaciales, identifican localizaciones atpicas o atpicos
espaciales (spatial outliers), descubren esquemas de asociacin espacial,
agrupamientos (clusters) o puntos calientes (hot spots) y sugieren estructuras
espaciales u otras formas de heterogeneidad espacial (Anselin, 1999). Por tanto, el
AEDE se correspondera con los mtodos de estadstica descriptiva espacial.
De manera particular, cuando no existe un marco formal o teora previa
acerca del fenmeno que se analiza, deben de utilizarse las tcnicas del AEDE. Esta
situacin se plantea muy a menudo en el campo de las ciencias sociales, cuando se
analizan grandes bases de datos geogrficos cuya distribucin no se conoce a priori.
Por ejemplo, parece obvio que la distribucin del nivel de instruccin en las
provincias espaolas sigue una tendencia de norte (mayor nivel) a sur (menor nivel).
Sin embargo, esta distribucin suele ser ms desconocida cuando se analiza este
fenmeno para el mbito de secciones censales en el interior de un municipio. En
los ltimos aos, el AEDE ha sido introducido en algunas aplicaciones de economa
regional (por ejemplo, Moreno y Vay, 2000), as como en los ejercicios de
prediccin-extrapolacin de datos (Chasco, 2003). Sin embargo, son prcticamente
nulas las aplicaciones realizadas en el campo del marketing.
El AEDE combina el anlisis estadstico con el grfico, dando lugar a lo que
podra denominarse una visualizacin cientfica (Haining et al., 2000) que, a los
contrastes estadsticos sobre los efectos espaciales de dependencia y
heterogeneidad, une un amplio marco de grficos o vistas mltiples y dinmicas
sobre la informacin geogrfica (Unwin, 2000). Por eso, estos mtodos de
visualizacin cientfica son mucho ms que simples mapas o grficos estticos de
representacin, como podr apreciarse con mayor detalle en el Apartado siguiente,
siendo fundamental el papel jugado por los paquetes informticos especializados.

En los ltimos aos, los esfuerzos desarrollados por la investigacin en este


campo del AEDE se han venido centrando en la conexin de los GIS disponibles en
el mercado (Grassland, ESRI, MapInfo) con paquetes estadsticos tradicionales (SPLUS, SPSS, Matlab, SAS) o especficos de AEDE. De este modo, a la potente
capacidad de visualizacin y anlisis de los GIS se le une la especializacin propia
del anlisis espacial estadstico y grfico (ver Bao et al., 2000). En el momento
presente, junto a estos mdulos de enlace, existe tambin un esfuerzo creciente por
elaborar programas de AEDE en entornos de opensouce como R, Java y Python,
que se encuentran libremente disponibles en Internet y cuya fuente abierta hace
posible su constante renovacin por parte de todo el que lo desee. Muchos de estos
programas pueden consultarse en la pgina web del Center for Spatially Integrated
Social Science, CSISS: http://www.csiss.org/clearinghouse/.
Segn Cressie (1993), el AEDE puede ser abordado desde dos puntos de
vista, segn que se trate de un anlisis desarrollado por la geoestadstica o por la
econometra espacial. El objeto del anlisis geoestadstico se encuentra, por lo
general, en el entorno de las ciencias medioambientales (fsica, geologa, hidrologa,
etc.) y se centra en una muestra de datos puntuales procedentes de distribuciones
geogrficas continuas (por ejemplo, precipitacin atmosfrica, humedad de la tierra,
altura del ocano, etc.). Por su parte, la econometra espacial analiza localizaciones
geogrficas discretas de puntos o polgonos (provincias, municipios, etc.). Es lo que
se denomina perspectiva de retcula o lattice, y se encuentra mucho ms centrado
en el anlisis de los fenmenos socioeconmicos (distribucin de la renta, clientes,
votantes, etc.). En la Tabla 1, se presentan algunos programas de AEDE reticular
(lattice) en entorno amigable.
Tabla 1: Paquetes informticos de AEDE reticular en entorno amigable
Paquete informtico
cdv, Cartographic Data
Visualizer

Empresa/autor

Pgina web

Jason Dykes

www.geog.le.ac.uk/jad7/cdv/

ClusterSeer

Terraseer

http://www.terraseer.com/products/
clusterseer.html

CrimeStat Spatial
Statistics Program

Ned Levine & Associates

http://www.icpsr.umich.edu/
NACJD/crimestat.html

Flow Mapper
GeoDa
SAS/GIS
STARS, Space Time
Analysis of Regional
Systems
STIS, Space Time
Intelligence System
WinGslib, Geostatistical
Software Library
Fuente: Elaboracin propia.

http://csiss.ncgia.ucsb.edu/

Waldo Tobler & David Jones clearinghouse/FlowMapper/


Luc Anselin, Universidad de http://sal.agecon.uiuc.edu/geoda
main.php
Illinois (USA)
http://www.sas.com/products/gis/
SAS Institute Inc.
Sergio Rey

http://stars-py.sourceforge.net/

Terraseer

http://www.terraseer.com/products/
stis/stis_features.html

Statios, LLC

http://www.statios.com/WinGslib/

Del grupo de programas de AEDE reticular, destaca GeoDa, que incluye


tambin un mdulo dedicado al anlisis de regresin espacial. GeoDa es muy fcil
de utilizar de forma visual e interactiva y su uso no exige un conocimiento previo de
la tecnologa GIS, mucho ms compleja. En este artculo, nos valemos de este
programa, que ha sido desarrollado por el Profesor Luc Anselin, de la Universidad de
Illinois, para presentar la capacidad y posibilidades del AEDE. La versin ms
reciente del programa, 0.9.5-i5, data de Agosto de 2004 y est siendo muy bien
recibida por todo tipo de usuarios, especialmente los dedicados al mundo acadmico
y de la investigacin, en general (en septiembre de 2004, GeoDa tena registrados a
3.500 usuarios, que se incrementan en una tasa de 150 nuevos cada mes. Esta
versin est disponible en Internet, http://sal.agecon.uiuc.edu/geoda_main.php y es
de acceso libre. En esta pgina web, hay diversos materiales de apoyo as como
una pelcula del programa Quicktime en la que se hace una demostracin de las
caractersticas principales de este programa. La versin actual de GeoDa utiliza la
tecnologa MapObjetcts LT2 de ESRI, que permite el acceso a datos geogrficos, su
representacin geogrfica y la obtencin de nuevas variables mediante funciones de
query. Por este motivo, el nico formato aceptado para la cartografa digital es el
proporcionado por ESRI, con la extensin shp (shapefile).
En trminos generales, las diferentes funciones de GeoDa podran ser
clasificadas en 6 cateogorias: tratamiento de datos geogrficos, transformacin de
datos, representacin grfica en mapas, grficos estadsticos, dependencia espacial
y regresin espacial. Como se aprecia en la Figura 2, estas funciones pueden ser
activadas a travs del men superior o directamente, tecleando en los iconos de la
barra de herramientas. En cada una de las secciones principales existen varias subaplicaciones relacionadas.
Figura 2

GeoDa: vista principal con funciones del men y barra de herramientas

Fuente: Elaboracin propia a partir de GeoDa.

En el apartado siguiente, se presentan los principales mtodos de AEDE con


ayuda de GeoDa. Para ello, se proponen algunos ejemplos ilustrativos de las
capacidades de estas tcnicas para el anlisis socioeconmico.

4. MTODOS GRFICOS DEL AEDE


En los ltimos aos, se han propuesto gran cantidad de mtodos grficos
para el AEDE aunque, como ponen de manifiesto Haining et al. (2000), existen
pocos estudios que valoren la utilidad y efectividad de todos ellos. En lnea con Wise
et al. (1999), tal como propone Tukey (1977) para el AED, podra afirmarse que un
buen mtodo grfico de AEDE es aqul capaz de analizar y representar dos
caractersticas fundamentales en toda distribucin espacial: tendencia y puntos
atpicos. En el mbito de las variables geogrficas, la tendencia es de carcter
geogrfico y tiene un sentido global, es decir, referido a todo el mapa (y no a una
parte del mismo). En cuanto a los atpicos espaciales (spatial outliers), se trata de
especiales concentraciones de datos cuyo valor se encuentra a cierta distancia de la
tendencia general (mediana): por ejemplo, bajo/sobre el primer/tercer cuartil de un
diagrama de caja. Esta propiedad tiene un carcter local, pues suele producirse en
determinadas zonas del mapa general, normalmente en forma de agrupaciones (o
clusters) de valores muy altos/bajos comparativamente con el entorno.
En la Tabla 2, se presentan las principales tcnicas del anlisis exploratorio
de datos reticular incluidas en el programa GeoDa agrupadas, segn los dos citados
elementos de tendencia (global) y puntos atpicos (local)2.
Tabla 2: Mtodos de anlisis exploratorio en GeoDa

AED general

AEDE reticular

Tendencia espacial
Histograma de frecuencias
Diagrama de dispersin
Grfico de coordenadas
paralelas
Grfico de dispersin en 3D
Mapas temticos
Mapa dinmico
Grficos condicionales
Diagrama de dispersin de
Moran
Diagrama de dispersin de
Moran multivariante

Atpicos espaciales
Diagrama de caja

Mapa de caja
Mapa de percentiles
Cartograma
Grficos LISA
Grficos LISA multivariantes

Fuente: Elaboracin propia.

4.1. Mtodos de representacin de la tendencia espacial global


Como ya se ha indicado, la tendencia espacial es de carcter geogrfico y tiene
un sentido global, es decir, referido a todo el mapa (y no a una parte del mismo). Por
eso, las tcnicas del AEDE que analizan esta componente son herramientas de
representacin cartogrfica para las que lo fundamental no es tanto el mapa en s
mismo, cuanto la representacin grfica de los estadsticos bsicos. En la primera
columna de la Tabla 2 se exponen los mtodos ms destacados, segn que sean
2

Un anlisis ms detallado de algunas de estas tcnicas se encuentra en Anselin (2003, 2004) y Anselin et al.
(2004A, 2004B).

mtodos generales del AED o mtodos explcitos del AEDE reticular. En ambos
casos, se presentarn no slo tcnicas univariantes, sino tambin multivariantes.
4.1.1. Histograma de frecuencias
El histograma de frecuencias es un grfico estadstico clsico en el AED.
GeoDa calcula histogramas de frecuencias de las variable geogrficas para distintas
clasificaciones, aunque el nmero por defecto es 7. Cada una de las barras del
histograma tiene un color y es posible realizar una seleccin en el histograma para
ver sobre el mapa las observaciones a las que corresponde. Esto es lo que sucede
en la Figura 3, en donde se han seleccionado las 4 barras del histograma de
frecuencias con mayor tasa de extranjera en 2003 (en amarillo), de forma que
quedan destacados en el mapa los barrios de Madrid a los que corresponde (barrios
del interior del municipio, por lo general).
Figura 3

Histograma de frecuencias de la tasa de extranjera en los barrios de Madrid

Fuente: Elaboracin propia a partir de GeoDa.

4.1.2. Diagrama de dispersin


Este grfico forma parte del AED general y tiene un carcter bivariante, dado
que representa sobre los 2 ejes cartesianos la distribucin de 2 variables geogrficas
cuya relacin se desea conocer. GeoDa superimpone la recta de regresin ajustada
por el mtodo de mnimos cuadrados ordinarios y adjunta el valor de la pendiente de
la misma. Este grfico se puede tambin calcular para los valores estandarizados de
las variables, de forma que la pendiente de la recta de regresin se corresponda con
el coeficiente de correlacin de Pearson. Adems, el anlisis de los 4 cuadrantes del
diagrama de dispersin permite identificar las localizaciones con valores superiores
o inferiores a la media en ambas variables o al contrario, valores superiores a la
media en una variable e inferiores a la media en otra.
As, en la Figura 4 se presenta el diagrama de dispersin de la tasa de
instruccin superior (personas con ttulo universitario y de bachiller) y la tasa de
paro, con alta correlacin de signo negativo (r=-0,6). Se han destacado aquellos
barrios con valores superiores a la media en tasa de paro e inferiores a la media en

tasas de instruccin superior y, como puede apreciarse en el mapa, se localizan en


barrios del sur de la capital.
Figura 4

Diagrama de dispersin de la tasa instruccin superior y tasa de paro

Fuente: Elaboracin propia a partir de GeoDa.

4.1.3. Otros grficos de AED multivariante


Entre los muchos grficos propuestos por el AED clsico para el anlisis
multivariante, en general, mencionaremos aqullos que son tiles para el estudio de
distribuciones geogrficas: grfico de coordenadas paralelas y grfico de dispersin
3D (en 3 dimensiones).
Grfico de coordenadas paralelas
Este grfico est especialmente diseado para explorar relaciones entre 2
ms variables. Las variables son representadas como lneas paralelas, sobre las
cuales se representan, a modo de coordenadas, los valores de las variables. Para
cada observacin se unen los puntos correspondientes en cada lnea, de forma que
el resultado final es un conjunto de tantas lneas como observaciones. Este tipo de
grfico resulta til para captar agrupamientos (clusters) entre observaciones
cuando sus correspondientes lneas presenten una forma similar (por ejemplo, estn
agrupadas de forma diferente en el grfico). Adems, es posible tambin detectar
grupos de observaciones con pendientes comunes en las lneas de conexin intervariables, poniendo de relieve una determinado tipo de correlacin entre dichas
variables (positiva, negativa o nula).
As, por ejemplo, en la Figura 5 (izquierda) se han representado los valores de
3 variables (tasa de paro, nivel de instruccin superior y tasa de infancia) para el
total de barrios del municipio de Madrid y, como puede observarse, existe una
tendencia comn de forma que los barrios con menores tasas de infancia suelen
coincidir con aqullos con mayor nivel de instruccin superior y media tasa de paro.

Sobre este grfico es posible seleccionar aquellos barrios con comportamientos y


correlaciones distintas.
Figura 5

Grfico de coordenadas paralelas (izda.) y grfico de dispersin 3D (dcha.)


de la tasa de paro, instruccin superior e ndice de infancia

Fuente: Elaboracin propia a partir de GeoDa.

Grfico de dispersin en 3D
La exploracin de informacin espacial multivariante puede tambin llevarse a
cabo mediante el grfico de dispersin en 3 dimensiones, que permite movimentos
de rotacin, traslacin y acercamiento/alejamiento (zooming). Tambin permite las
habituales funciones de enlace y cepillado (linking y brushing). En la Figura 5, se
han representado los valores de las variables de tasa de paro, tasa de instruccin
superior e ndice de infancia correspondientes a los barrios del municipio de Madrid.

4.1.4. Mapas temticos


Los mapas temticos, en general, consisten en la representacin cartogrfica
de una variable geogrfica. Esta representacin en un mapa de la variable puede
llevarse a cabo mediante smbolos y colores que pongan de manifiesto el valor de
una variable en cada una de las unidades geogrficas consideradas (pases,
regiones, etc.). Puede utilizarse un color/smbolo diferente para cada valor o para
cada intervalo de valores de la variable. Dentro del AEDE reticular, los mapas
temticos ms importantes para la representacin de la tendencia espacial de una
variable son el mapa de cuantiles y el mapa de la desviacin tpica.
Mapa de cuantiles.
En este tipo de mapas, los datos se dividen y agrupan en una serie de
categoras (cuantiles) con igual nmero de observaciones. Por ejemplo, este mapa
ser un mapa de cuartiles si la distribucin se divide en 4 grupos con igual nmero
de unidades territoriales. En el ejemplo de la Figura 6 (izquierda), el nmero de
categoras se ha establecido en 5, para construir un mapa de quintiles de la variable
tasa de personas con ttulo universitario y de bachiller para el conjunto de barrios del

municipio de Madrid. Como puede observarse, en la leyenda se indica, entre


parntesis, el nmero de observaciones de cada categora, 25 26.
Este tipo de mapa no es til en casos en los que la variable en cuestin
contenga un gran nmero de observaciones con valores parecidos (por ejemplo, en
el caso de variables de sucesos raros, cuando muchas observaciones tienen valor
cero). El motivo es obvio: muchos cuantiles no podrn ser definidos al no poder
asignar un mismo nmero de observaciones a los diferentes grupos.
Figura 6

Mapa de quintiles (izda.) y mapa de la desviacin tpica (dcha.)

Fuente: Elaboracin propia a partir de GeoDa.

Mapa de la desviacin tpica


Este mapa agrupa las observaciones segn que sus valores caigan dentro de
un rango estandarizado, entendido ste como un nmero determinado de unidades
de la desviacin tpica a partir de la media. Se trata de un mapa temtico en el que
las categoras en las que se divide la variable se corresponden con mltiplos de las
unidades de la desviacin tpica. En la Figura 6 (derecha) se ha representado el
mapa de la desviacin tpica de la tasa de paro de los barrios de Madrid. GeoDa
divide la variable en 7 intervalos, de forma que el intermedio (n 4) coincide con el
valor de la media y los 6 restantes vienen determinados por 1, 2 y 3 unidades de la
desviacin tpica. Por ejemplo, el intervalo 5 (10,93 a 13,21) est constituido por los
40 barrios cuya tasa de paro se encuentra entre la media (10,93) y una unidad de la
desviacin tpica (2,28=13,21-10,93).
4.1.5. Mapa dinmico
El mapa dinmico (map movie) es una forma de animacin del mapa que
consiste en la iluminacin, sobre el mismo, de las distintas unidades geogrficas
segn su orden respecto del valor que adoptan en una variable (siempre de menor a
mayor). GeoDa permite la visualizacin de este mapa de forma simple (las unidades
se iluminan una vez, cuando les corresponde, y se apagan a continuacin) o
acumulativa (las unidades permanecen iluminadas hasta que el mapa entero queda
iluminado. Por ejemplo, en la Figura 7 puede apreciarse cmo la variable tasa de

instruccin superior adopta los menores valores en los barrios de la periferia de


Madrid.
Figura 7

Mapa dinmico acumulativo: inicio (izda.) y pausa (dcha.)

Fuente: Elaboracin propia a partir de GeoDa.

4.1.6. Grficos condicionales


El principio que subyace este tipo de grficos es la utilizacin de 2 variables
condicionales que dividen a la muestra de datos en diferentes grupos (categoras).
Se trata de dibujar, para una tercera variable, un grfico o mapa diferente para cada
grupo o categora. El programa GeoDa considera, para cada una de las 2 variables
condicionales, 3 grupos o categoras, por lo que se producir un total de 9 grficos o
mapas. Este programa permite variar los intervalos que determinan cada categora.
En concreto, con el programa GeoDa se pueden disear 4 tipos de grficos
condicionales: mapas, diagramas de caja, histogramas condicionales y diagramas
de dispersin condicionales. En el caso del diagrama de dispersin condicional, se
necesitar de un cuarto eje: el 3 ser para la variable dependiente (eje vertical del
diagrama de dispersin) y el 4 ser para la variable explicativa (eje horizontal).
As, por ejemplo, en la Figura 8 se ha representado el mapa condicional del
ndice de infancia, condicionado a la tasa de paro y tasa de instruccin superior.
Como puede observarse, slo hay 1 barrio situado en la categora de bajo valor de
las variables condicionales de paro e instruccin superior (Cuatro Vientos), cuyo
ndice de infancia es de los ms elevados del municipio (color rojo oscuro). Por el
contrario, el barrio de Valdemarn, con tambin alto ndice de infancia, es el nico
situado en la categora de baja tasa de paro y alto nivel de instruccin. En el otro
extremo (alta tasa de paro y baja/alta tasa de instruccin superior) no hay ningn
barrio, por lo que los mapas correspondientes estn en blanco. Aunque con alta tasa
de paro y nivel medio de intruccin superior hay varios barrios en la zona sureste de
la capital que presentan un nivel medio en el ndice de infancia. Por ltimo, con alta
tasa de instruccin superior y nivel medio en la tasa de paro hay un importante
nmero de barrios, ocupando todo el centro y parte de la periferia, con niveles
medio/bajo en el ndice de infancia.

Figura 8

Mapa condicional del ndice de infancia condicionado a la tasa de paro y


tasa de instruccin superior.

Fuente: Elaboracin propia a partir de GeoDa.

4.1.7. Anlisis exploratorio de la dependencia espacial global


La dependencia o autocorrelacin espacial consiste en la existencia de una
relacin funcional entre lo que ocurre en un punto determinado del espacio y lo que
sucede en lugares cercanos o vecinos al mismo. Es decir, una variable estar
espacialmente autocorrelacionada cuando los valores observados en un punto o
regin dependan de los valores observados en regiones vecinas, de forma que se
produzca una cierta continuidad geogrfica en la distribucin de esta variable, por
ejemplo, sobre un mapa. La principales tcnicas de asociacin espacial en el AEDE
reticular son el diagrama de dispersin de Moran y grficos LISA (mapa/diagrama de
caja), as como sus correspondientes versiones multivariantes. En este apartado, se
presentan los diagramas de dispersin de Moran (univariante y bivariante) al tratarse
de tcnicas de representacin de la tendencia espacial, dejando los grficos LISA
para el Apartado 4.2.
Diagrama de dispersin de Moran
Se trata de un diagrama de dispersin que representa en el eje X la variable
previamente estandarizada y en el eje Y se representa el retardo espacial de dicha
variable estandarizada. Se entiende por retardo espacial el promedio ponderado de

los valores que adopta una variable en el subconjunto de observaciones vecinas a


una dada. Por ejemplo, el retardo espacial de la variable renta per cpita de la
provincia de Madrid podra obtenerse como una media aritmtica simple de los
valores de renta per cpita en las provincias limtrofes (Segovia, vila, Toledo,
Cuenca y Guadalajara).
En este tipo de diagrama de dispersin, en el que se relacionan, para cada
observacin, el valor de la variable en la misma y el valor promedio en sus
correspondientes observaciones vecinas, la pendiente de la recta de regresin es el
valor del denominado estadstico I de Moran de autocorrelacin espacial global3. As,
cuanto mayor sea el valor de este estadstico, es decir, el ngulo que forme la recta
de regresin con el eje de abscisas, ms fuerte ser el grado de autocorrelacin
espacial en la variable, y viceversa. En los ejemplos de la Figura 9, la variable tasa
de paro de los barrios madrileos tiene un mayor grado de dependencia espacial
que la variable poblacin.
Este diagrama de dispersin suele dividir el tipo de asociacin espacial en
cuatro categoras: dos para autocorrelacin espacial positiva (valores altos de una
variable rodeados de valores altos o valores bajos rodeados de valores bajos) y dos
para autocorrelacin espacial negativa (valores altos rodeados por valores bajos, y
viceversa). Las categoras de asociacin espacial positiva se corresponden con los
cuadrantes I y III. Por ejemplo, en la Figura 5 (grfico izquierdo) en los cuadrantes I y
III se presentan aquellos barrios que, con una tasa de paro superior/inferior a la
media municipal (valor estandarizado positivo/negativo de la variable) se encuentran
rodeados de barrios que tambin disponen de tasas de paro superiores/inferiores a
la media municipal (retardo espacial positivo/negativo), respectivamente. Por el
contrario, las categoras de asociacin negativa vienen dadas por los cuadrantes II y
IV de este diagrama, en los que se representan los barrios con valores bajos/altos
de tasa de paro rodeadas por barrios con valores altos/bajos de dicha variable,
respectivamente.
Debe advertirse, adems, que la regresin del retardo espacial sobre la
variable correspondiente se realiza con todas las hiptesis clsicas del anlisis de
regresin. As, la interpretacin del test I de Moran claramente permite conocer el
grado en que este estadstico resume la estructura global de asociacin lineal
existente en un fenmeno espacial que, en el caso que se expone en la Figura 5,
para el total de la distribucin, sera del 39% para la variable tasa de paro (valor del
estadstico I de Moran en trminos porcentuales) y 15% para la poblacin.
Dado que los valores de la variable se encuentran estandarizados, es posible
conseguir informacin tanto de la asociacin espacial global (pendiente de la recta
de regresin) como de la asociacin espacial local. De este modo, los valores en el
diagrama de dispersin de Moran situados a ms de dos unidades del origen (valor
0) pueden considerarse como puntos atpicos en el diagrama de dispersin de
Moran, es decir, importantes agujeros locales de no estacionariedad espacial. As,
para la variable tasa de paro, habra 3 barrios con valores atpicamente bajos en la
tasa de paro, rodeados por barrios con tambin bajas tasas de paro (La Piovera, El
Planto y Villamarn), as como barrios en entornos con tasas de paro atpicamente
altas (Orcasur y San Cristbal).
3

Una revisin ms extensa de las medidas estadsticas de autocorrelacin espacial se encuentra,


entre otras referencias, en Chasco (2003).

Figura 9

Diagrama de dispersin de Moran: univariante (izda.) y bivariante (dcha.)

Fuente: Elaboracin propia a partir de GeoDa.

Diagrama de dispersin de Moran bivariante


Se trata de un diagrama de dispersin de Moran en el que se representa en el
eje vertical Y el retardo espacial de la variable que se desea explicar y en el eje X la
variable explicativa. Ambas variables deben estar previamente estandarizadas, de
tal forma que la media de ambas sea cero y la desviacin tpica sea uno. Es decir,
se trata de ver la relacin que existe, en cada punto de la muestra, entre los valores
de una variable y el valor medio de otra variable en el entorno de dicho punto. La
pendiente de la lnea de regresin muestra el grado de relacin lineal existente entre
la variable del eje horizontal y los valores de la variable del eje vertical en los puntos
vecinos a uno dado.
Este anlisis resulta de gran utilidad en fenmenos socioeconmicos en los
que se da un fenmeno de difusin espacial de forma que, por ejemplo, un cambio
en las tasas de instruccin superior en un punto provocan un cambio en las tasas de
paro de los lugares vecinos a dicho punto. ste es precisamente el ejemplo que se
presenta en la Figura 9 (derecha) para los barrios del municipio de Madrid. Como
puede observarse, el valor del estadstico I de Moran (-0,32), que coincide con la
pendiente de la recta de regresin, es medianamente elevado y negativo. Es decir,
los barrios con mayores/menores tasas de instruccin superior son los que tienen, a
su vez, un entorno vecino con menores/mayores tasas de paro, respectivamente.
Sin embargo, hay dos barrios con valores especialmente bajos en la tasa de
instruccin superior que pueden estar condicionando el valor de la pendiente o
estadstico I de Moran. El programa GeoDa es un programa dinmico que permite
prescindir de dichas observaciones y recalcular el valor de dicho estadstico de
Moran que, como puede observarse, aumenta en trminos absolutos a 0,44.

4.2. Mtodos de representacin de los atpicos espaciales


Estos mtodos exploratorios analizan la existencia de concentraciones de
observaciones cuyo valor se encuentra a cierta distancia de la tendencia general
(mediana). Esta propiedad tiene un carcter local, pues suele producirse en
determinadas zonas del mapa general, normalmente en forma de agrupaciones (o
clusters) de valores muy altos/bajos comparativamente con el entorno. En la Tabla
2, se presentaban las principales tcnicas de AEDE reticular destinadas al anlisis
de esta propiedad local: grficos de caja (diagrama y mapa), mapa de percentiles,
cartograma y grficos LISA de dependencia espacial local. Estas tcnicas poseen la
propiedad de poder detectar valores significativos atpicamente altos o bajos que se
determinan a partir de criterios estadsticos.
4.2.1. Grficos de caja
Los grficos de caja constituyen un mtodo de representacin univariante. El
diagrama de caja es una representacin muy comn de AED general, cuya
construccin parte del clculo de los cuartiles y la media de una variable, as como
de la obtencin de las llamadas cotas o valores adyacentes superior e inferior, que
se obtienen, a su vez, como el producto de los valores del tercer (primer) cuartil por
1,5 veces el recorrido intercuartlico. De esta forma, se consideran como valores
atpicos aqullos situados por encima (o por debajo) de dichas cotas (en la Figura
10, se trata del diagrama de la variable tasa de extranjera). Un criterio un poco ms
estricto que el anterior consistira en multiplicar por tres el recorrido intercuartlico
para la fijacin de las cotas.
En el ejemplo de la Figura 10, se ha representado el diagrama de caja de la
tasa de extranjera de los barrios de Madrid y, para el criterio menos estricto se han
identificado 3 puntos atpicos correspondientes a los barrios de Embajadores, Sol y
Universidad (destacados en la parte superior del grfico). El mapa de caja es una
derivacin, propia del AEDE, a partir del diagrama de caja. En este mapa se
representan con distintos colores las unidades geogrficas cuyos datos en una
variable coinciden con la mediana, el rango intercuartlico y los valores atpicos (altos
y bajos).
Figura 10 Grficos de caja de la tasa de extranjera: diagrama (izda.) y mapa (dcha.)

Fuente: Elaboracin propia a partir de GeoDa.

4.2.2. Mapa de percentiles


El mapa de percentiles es un caso particular del mapa de cuantiles, es decir, un
mapa temtico. Pero, a diferencia del mapa de cuantiles, este mapa permite la
deteccin de puntos atpicos en la distribucin espacial. Las categoras se disean
de modo que queden acentuados los valores extremos de la variable. El programa
GeoDa crea, en concreto, se crean 6 categoras correspondientes a los siguientes
percentiles4: <1, [1,10), [10,50), [50,90), [90,99), >99. En la Figura 11, se presenta el
mapa de percentiles de la variable ndice de vejez. Como puede observarse, hay 3
barrios con valores atpicamente altos: El Goloso y Helln (San Blas), mientras que
slo un barrio tiene un valor atpicamente bajo: Horcajo (Moratalaz).
Figura 11 Mapa de percentiles (izda.) y cartograma del ndice de vejez (dcha.)

Fuente: Elaboracin propia a partir de GeoDa.

4.2.3. Cartograma
El cartograma es un mapa en el que los valores de la variable que representa
no se diferencian con diferentes colores, sino mediante el tamao de la superficie de
las unidades geogrficas (pases, regiones, barrios). Las representacin grfica de
las unidades geogrficas a travs de polgonos irregulares es reemplazada por un
crculo, que estar situado en la misma localizacin y cuyo tamao ser mayor o
menor segn sea el valor de la variable. Aunque en GeoDa el color por defecto para
los crculos es el verde, existen otros colores para destacar determinados valores,
como los negativos (negro), ceros (blanco) y valores atpicamente altos (rojos) o
bajos (azul).
Los valores atpicos son identificados por el cartograma del mismo modo que
en los grficos de caja, a partir de cotas definidas por encima o por debajo del valor
medio, como proporciones del recorrido intercuartlico (1,5 y 3). As, en la Figura 11
se muestra el cartograma de la variable ndice de vejez, para el que se ha aplicado
el criterio de deteccin de puntos atpicos menos exigente. Como puede observarse,
el cartograma destaca los mismos dos barrios con valores atpicamente altos que el
mapa de percentiles: El Goloso y Helln (San Blas), mientras que, tambin como el

El parntesis cuadrado indica que ese extremo se incluye en el intervalo y el curvo indica que no se incluye.

citado mapa, slo un barrio tiene un valor inferior a la media menos 1,5 veces el
recorrido intercuartlico: Horcajo (Moratalaz).
4.2.4. Anlisis exploratorio de la dependencia espacial local
El estadstico I de Moran y el grfico de dispersin de Moran son mtodos que
permiten analizar el fenmeno de dependencia o autocorrelacin espacial desde un
punto de vista global. Es decir, no son capaces de detectar la presencia de bolsas
significativas de no-estacionariedad (zonas calientes/fras) que se desvan de la
tendencia general de una variable. Es cierto que el diagrama de dispersin de Moran
es capaz de detectar ciertos aspectos locales de una distribucin sealando aquellos
puntos especialmente alejados de la media (superiores al valor 2). Pero no puede
determinar sobre la existencia de especiales concentraciones o ausencia de
concentracin de valores altos/bajos de dicha variable. Para ello, se han diseado
los grficos LISA de dependencia espacial local que ofrecen una indicacin del
grado de concentracin de valores similares (altos o bajos) en torno a cada unidad
geogrfica.
Mapa LISA
Las letras LISA significan Local Indicator of Spatial Asociation. El mapa LISA
es un mapa en el que se representan las localizaciones con valores significativos en
determinados indicadores estadsticos de asociacin espacial local (Getis y Ord,
1992; Anselin, 1995; Ord y Getis, 1995; Unwin, 1996). En concreto, los grficos LISA
incluidos en GeoDa se basan en el estadstico I de Moran de asociacin local. Se
trata de un estadstico que, a diferencia del estadstico I de Moran anteriormente
expuesto, no se calcula de forma global para todas las observaciones del mapa, sino
que adquiere un valor diferente para todas y cada una de ellas. Efectivamente, este
estadstico mide el grado de concentracin de valores altos/bajos de una variable en
el entorno geogrfico de cada una de las observaciones de la muestra. Para cada
valor del estadstico es posible realizar una inferencia para evaluar el nivel de
significatividad estadstica de rechazo de la hiptesis nula de ausencia de similitud o
disimilitud de valores en una localizacin geogrfica. De este modo, se pone de
manifiesto la presencia de puntos calientes (hot spots) o atpicos espaciales, cuya
mayor o menor intensidad depender de la significatividad asociada de los citados
estadsticos.
En la Figura 12, se ha representado el mapa LISA de agrupamientos
espaciales (spatial clusters) de la tasa de extranjera. Como puede observarse, a
travs de una gradacin de colores, este mapa representa las zonas calientes de
concentraciones de barrios con alto valor (color rojo) y bajo valor (azul) en la tasa de
extranjera. La zona caliente de barrios con una significativa concentracin de tasas
altas de extranjera est formada por los 6 barrios del distrito Centro de Madrid, as
como en los barrios cntricos de Chopera, Palos de Moguer, Recoletos, Trafalgar,
Almagro y Moscard. En el extremo opuesto, la concentracin de bajas tasas de
extranjera se produce, en general, en barrios de los distritos perifricos de
Fuencarral-El Pardo, Hortaleza, San Blas, Viclvaro, Moratalaz, Puente de Vallecas
y Pacfico. El mapa destaca tambin aquellos barrios en los que se producen
discontinuidades significativas en los valores de la variable. Por ejemplo, el caso de
San Fermn y La Piovera, en los que la tasa de extranjera es especialmente alta,
pero se encuentran rodeados por barrios con tasas especialmente bajas o el caso de

los barrios de Imperial, Acacias, Atocha, Jernimos y Vallehermoso que, con tasas
de extranjera especialmente bajas, se encuentran rodeados por barrios con tasas
especialmente altas.
Figura 12 Grficos LISA: mapa (izda.) y diagrama de caja (dcha.)

Fuente: Elaboracin propia a partir de GeoDa.

Diagrama de caja LISA


Se trata de un diagrama de caja que representa los valores del estadstico I
local de Moran de asociacin espacial. En la Figura 12, se ha representado tambin
el diagrama de caja de los estadsticos locales de Moran, uno para cada barrio de
Madrid. De todos ellos, los que han resultado estadsticamente ms significativos
(mayor valor del estadstico) son los que se encuentran encima de la caja y se han
destacado en amarillo. Como puede observarse, aunque el mapa pone de manifiesto
la presencia significativa en los barrios de concentraciones de valores altos y bajos
de la tasa de extranjera, as como algunas disimilitudes de valores altos/bajos y
bajos/altos, el diagrama de caja indica que slo los 6 barrios del distrito Centro
(Palacio, Embajadores, Cortes, Justicia, Universidad y Sol) y Palos de Moguer
destacan por su especialmente alta y significativa concentracin de extranjeros en el
municipio.
Grficos LISA bivariantes
Por ltimo, se presenta la versin multivariante de los grficos LISA: el mapa
y diagrama de dispersin LISA bivariantes. En el caso univariante, el estadstico
LISA de asociacin espacial comparaba los valores de una variable en cada unidad
geogrfica con los valores de su correspondiente retardo espacial (variable con los
valores medios de las unidades vecinas a una dada). De este modo, es posible
determinar la existencia o no de concentraciones significativas de una variable en
torno a una unidad geogrfica. En el caso bivariante, el estadstico LISA tiene en
cuenta para cada unidad geogrfica, los valores de una variable y el retardo espacial
de otra variable diferente. Por ejemplo, en el caso de la Figura 13, para cada barrio
de Madrid se calcula un estadstico LISA. Este estadstico mide el grado de
asociacin entre la tasa de paro, en un barrio, y la tasa de instruccin superior media
en sus correspondientes barrios vecinos. De este modo, el mapa LISA bivariante

destaca pocos casos de asociacin local positiva: alta concentracin de valores altos
de ambas variables (Sol y Legazpi) y de valores bajos (Bellas Vistas y El Pardo). Sin
embargo, predominan las concentraciones de valores disimilares en ambas variables
como es el caso de alta instruccin en vecinos/baja tasa de paro que se produce en
gran parte de los barrios de los distritos del centro-norte (Salamanca, Chamartn,
Moncloa-Aravaca). Sin embargo, la mayor parte de los casos contrarios de
significativa concentracin de valores diferentes (baja instruccin en vecinos/alta
tasa de paro) se producen en barrios de los distritos del sur (Puente de Vallecas,
Usera, Villaverde) y centro este (San Blas) de la capital.
Figura 13 Grficos LISA bivariantes: mapa (izda.) y diagrama de caja (dcha.)

Fuente: Elaboracin propia a partir de GeoDa.

5. CONCLUSIN
El AEDE debe constituir la etapa previa a todo anlisis modelizador y decisor
en el campo de la investigacin socioeconmica. En este artculo se han presentado
las principales tcnicas del AEDE, que combinan el anlisis estadstico con el
grfico, haciendo posible el estudio de las distribuciones espaciales y sus valores
atpicos, esquemas de asociacin espacial, agrupamientos espaciales y puntos
calientes/fros (hot spots). Para ello, se ha utilizado un nuevo programa informtico,
GeoDa, que tiene como grandes ventajas el haber sido concebido como un producto
autosuficiente, que no supone para el usuario el conocimiento de un sistema
especfico de GIS, funciona en cualquiera de los sistemas operativos de Windows y
Mac y es actualmente un producto de libre acceso en Internet.
Efectivamente, el anlisis de las series geogrficas requiere de herramientas
propias, que van ms all de las convencionales tcnicas del AED o minera de
datos y, por tanto, de un software especfico. Estas herramientas deben estar
dirigidas al anlisis de 2 elementos fundamentales: tendencia espacial y puntos
atpicos, entendiendo esto ltimo no slo como la determinacin de valores
significativamente altos/bajos de una variable, sino como concentracin de valores
similares o disimilares en torno a una unidad geogrfica (dependencia espacial).
GeoDa es un programa que combina tcnicas del AED convencional con las ms
novedosas herramientas del AEDE, en un entorno dinmico que permite conexiones
y arrastrado (linking y brushing) entre diferentes vistas.

6. BIBLIOGRAFA
. ANSELIN, L. (1995), Local Indicators of Spatial Association-LISA. Geographical Analysis,
vol. 27(2); pp. 93-115.
. ANSELIN, L. (1999), The future of spatial analysis in the social sciences. Geographic
Information Sciences, 5 (2); pp. 67-76.
. ANSELIN, L. (2003), GeoDaTM 0.9 users guide. Pgina web del Spatial Analysis
Laboratory: http://sal.agecon.uiuc.edu/stuff_main.php#tutorials .
. ANSELIN, L. (2003), GeoDaTM 0.9.5-i release notes. Pgina web del Spatial Analysis
Laboratory: http://sal.agecon.uiuc.edu/stuff_main.php#tutorials .
. ANSELIN, L., Y.W. KIM e I. SYABRI (2004A), Web-based analytical tools for the
exploration of spatial data. Journal of Geographical Systems (prxima publicacin).
. ANSELIN, L, I. SYABRI y Y. KHO (2004B), GeoDa: An introduction to spatial data
analysis. Geographical Analysis (prxima publicacin).
. BAO, S., L. ANSELIN, D. MARTIN y D. STRALBERG (2000), Seamless integration of
spatial statistics and GIS: the S-Plus for ArcView and the S+Grassland links. Journal of
Geographical Systems 2 (3), pp. 287306.
. CHASCO, C. (2003), Econometra espacial aplicada a la prediccin-extrapolacin de datos
microterritoriales. Consejera de Economa e Innovacin Tecnolgica de la Comunidad de
Madrid.
. CRESSIE, N. (1993), Statistics for spatial data..Revised edition. New York: Wiley.
. GETIS, A. y J. ORD (1992), The analysis of spatial association by use of distance
statistics. Geographical Analysis, 24; pp. 189-206.
. HAINING, R., S. WISE y P. SIGNORETTA (2000),Providing scientific visualization for
spatial data analysis: Criteria and an assessment of SAGE. Journal of Geographical
Systems, 2; pp.121-140.
. MORENO, R. y E. VAY (2000), Tcnicas economtricas para el tratamiento de datos
espaciales: la econometra espacial. Edicions Universitat de Barcelona, colecci UB 44,
manuals.
. ORD, J.K. y A. GETIS (1995), Local spatial autocorrelation statistics: distributional issues
and an application. Geographical Analysis, 27.4; pp. 286-306.
. STATSOFT Inc. (2000), Electronic Text Book Statsoft. www.statsoft.com
. TUKEY, J.W. (1977), Exploratory Data Analysis. Reading: Addison-Wesley.
. UNWIN, A. (1996), Exploratory spatial analysis and local statistics. Computational
Statistics, 11; pp. 387-400.
. UNWIN, A. (2000), Using your eyes- making statistics more visible with computers.
Computational Statistics & Data Analysis, 32; pp. 303-312.