Sie sind auf Seite 1von 75

Anlisis de datos espaciales con R

Anlisis de datos espaciales con R


Rosana Ferrero
http://statisticalecology-met.blogspot.com/

10 de Noviembre del 2011

Anlisis de datos espaciales con R

Guin

Introduccin

Por qu tanto inters en el anlisis espacio-temporal en ecologa?. Aplicaciones Tipos de datos paquetes y ejemplos en R
2 3 4

Patrones de puntos Geoestadstica Datos regionales

Anlisis de datos espaciales con R Introduccin

Introduccin

Anlisis de datos espaciales con R Introduccin Por qu tanto inters en el anlisis espacio-temporal en ecologa?.

Introduccin
Los procesos de los sistemas naturales y los patrones que resultan de l ocurren en el espacio y en el tiempo. Por tanto, para estudiar la estructura natural y entender el proceso funcional subyacente, necesitamos identicar las escalas espaciales y temporales en las que ocurren. El gran nmero y variedad de tcnicas estadsticas para el anlisis espacial en ecologa est aumentando y muchos eclogos an no estn familiarizados con las tcnicas disponibles ni con cmo utilizarlas correctamente. En este sentido, esta breve gua pretende dar un resumen de las principales tcnicas estadsticas para analizar datos espaciales. Trabajaremos mediante ejemplos reales de aplicacin en el contexto ecolgico introducidos mediante el software R.

Anlisis de datos espaciales con R Introduccin Por qu tanto inters en el anlisis espacio-temporal en ecologa?.

Aplicaciones

Anlisis de datos espaciales con R Introduccin Por qu tanto inters en el anlisis espacio-temporal en ecologa?.

Aplicaciones

Entre otras cosas, podemos caracterizar espacialmente una regin, estudiar la dependencia o autocorrelacin espacial de nuestros datos, evaluar la escala del patrn observado, determinar mtodos de muestreo, realizar interpolaciones para estimar el valor de una variable en localizaciones que no han sido observadas, realizar regresiones para evaluar la relacin entre variables y predecir, evaluar la interaccin o conectividad entre reas de un paisaje, simular y modelar relaciones entre localidades.

Anlisis de datos espaciales con R Introduccin Tipos de datos espaciales (Cressie, 1993).

Patrones de puntos
Son puntos o eventos (

dominio discreto )

dentro de la regin de

estudio, donde su seleccin no depende del investigador (

aleatorio ).

dominio

Pueden contener datos asociados (o marcas).

Examples
nidos de pjaros, sitios de terremotos, presencia de una especie.

Anlisis de datos espaciales con R Introduccin Tipos de datos espaciales (Cressie, 1993).

Datos geoestadsticos
La variable respuesta existe en cada punto de la regin de estudio (

dominio continuo );

sin embargo, el investigador puede hacer una

seleccin de puntos a conveniencia ( [bottom-up ].

dominio jo ).

Aproximacin

Examples
niveles de un contaminante, precipitacin mensual o el nivel de CO2 medido en una torre de eddy covariance.

Anlisis de datos espaciales con R Introduccin Tipos de datos espaciales (Cressie, 1993).

Datos regionales, de reas o en grilla (lattice)


La variable respuesta existe y es observada solo en un conjunto nito de puntos o subregiones ( los sitios de medicin depende Aproximacin [top-down ].

dominio discreto ), y la seleccin del investigador (dominio jo ).

de

Examples
nmero de especies en cada regin, valores de los pxeles en interpretacin de imgenes de satlite.

Anlisis de datos espaciales con R Introduccin Tipos de datos espaciales (Cressie, 1993).

Cul es la diferencia entre los tipos de datos?.

Dominio discreto Dominio jo Dominio aleatorio


Example datos de grilla (lattice) patrones de puntos

Dominio continuo
datos geoestadsticos

La geoestadsitica trata a las localizaciones espaciales como las variables explicativas (o causa) y a los valores asociados a ellas como variables respuetas (o efecto). Sin embargo, la estadstica de patrones puntuales espaciales trata a las localizaciones espaciales, y a los valores asociados a ellas, como variables respuesta.

Anlisis de datos espaciales con R Introduccin Tipos de datos espaciales (Cressie, 1993).

Dependencia espacial

Sea cual fuere el objetivo del anlisis, en los tres casos lo importante es modelar la

dependencia espacial entre las


la dependencia espacial est dada por

observaciones. Cmo hacerlo depende del modelo inherente: Para

patrones puntuales,

las propiedades de la funcin de intensidad. En

geoestadstica

se busca modelar la covarianza (similaridad)

o semivarianza (disimilaridad) entre observaciones. Estas medidas pueden o no ser estacionarias. Para los

patrones en rejilla,

la dependencia espacial se modela

mediante las distribuciones condicionales.

Anlisis de datos espaciales con R Introduccin Tipos de datos espaciales (Cressie, 1993).

Paquetes de R
Genrico : sp. Patrones puntuales :

spatstat (diagnstico y modelado

paramtrico), splancs (datos espacio-temporales y modelado no paramtrico), VR:spatial.

Datos geoestadsticos :

gstat (geoestadstica clsica: kriging,

variogramas, etc.), geoR (geoestadstica basada en modelos), geoRglm, elds, spBayes, RandomFields (procesos estocsticos), VR:spatial, sgeostat, vardiag, akima (interpolacin).

Datos regionales (lattice):

spdep (dependencia espacial),

spgwr (regresin ponderada geogrcamente), ade4, maps (mapas de polgonos), DCluster, SDMTools (FRAGSTAT).

Anlisis de datos espaciales con R Patrones de puntos

Patrones de puntos
library(spatstat)

Anlisis de datos espaciales con R Patrones de puntos

Caractersticas
Objetivo: analizar la distribucin espacial (y sus causas) de un patrn de puntos. Tipos de datos: sin marcas, con marcas y covariables. Cul es la diferencia entre marcas y covariables? La principal diferencia entre ellas es que las marcas estn asociadas a los datos de puntos, son parte de la variable respuesta (del patron de puntos), mientras que las covariables son variables explicativas.

Podemos caracterizar el patrn de los datos a nivel local y/o global?


Las caractersticas principales de un proceso de puntos pueden ser resumidas en su propiedad de primer orden (, o intensidad: densidad), y de segundo orden (o interaccin: dependencia estocstica entre los puntos).

Anlisis de datos espaciales con R Patrones de puntos Preguntas a resolver

Intensidad e Interaccin
Intensidad Interaccin
(i.e. densidad media de puntos): puede ser constante (uniforme u homogneo) o variar de localizacin a localizacin (no-uniforme o no-homogneo). (i.e. dependencia estocstica entre los puntos): mayor entre puntos que estn cercanos.

Example
La distancia entre pinos japoneses es mayor (i.e. inhibicin o competencia) o menor (i.e. atraccin o contagio) a lo esperado por un patron al azar?.

Anlisis de datos espaciales con R Patrones de puntos Preguntas a resolver

Covariables
Efectos de covariables:
nos permite investigar si la intensidad de un patrn puntual depende de ellas y analizar las caractersticas de los patrones puntuales luego de dar cuenta de esta dependencia.

Example
(Tropical rainforest data) La densidad de rboles depende de la pendiente?, y luego de dar cuenta de esta variacin en la densidad de rboles debida a la pendiente, existe evidencia de agrupacin entre los rboles?.

Anlisis de datos espaciales con R Patrones de puntos Preguntas a resolver

Marcas I
Segregacin
de puntos con diferentes marcas: investigar si los puntos con diferentes marcas estn segregados (se encuentran en diferentes partes de la regin de estudio).

Example
izq. (lansing -marcas categricas) La regin de estudio est dividida en dominios donde solo predomina una especia o las distintas especias estn dispersadas aleatoriamente?; der. (longleaf -marcas continuas-) El tamao y edad de los pinos indican algn tipo de variacin espacial en su densidad?.

Anlisis de datos espaciales con R Patrones de puntos Preguntas a resolver

Marcas II
Dependencia
entre puntos con marcas: investigar si existe interaccin entre los sub-patrones de puntos o si existe dependencia entre los valores de las marcas en distintas localizaciones.

Example
(ants' nests) la especie A localiza sus nidos intencionalmente cerca de la especie B?. Nidos de hormigas de las especies

bicolor

Messor wasmanni y Cataglyphis

en el norte de Grecia.

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Introduccin

Los mtodos de anlisis espacial para patrones puntuales inlcuyen mtodos basados en el vecindario (vecindario ms cercano, mtodos renados del vecindario ms cercano, funciones K de Ripley) para datos de una o varias variables (uni-, bi- y multi- variados), el anlisis de datos para distintas dimensiones (uni -transecto-, bi -plano- o multi -volumen- dimensional), as como para datos con marcas (correlacin de marcas). Tambin se utiliza la teora de grafos o anlisis de redes (redes de vecinos), mtodos de anlisis de varianza en cuadrantes (TTLQC, PQC, etc.), anlisis espectrales (con transformaciones de Fourier o Walsh), wavelets y anlisis de crculos circunscritos.

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Inspeccin de los datos.

Example

library(spatstat) X<-data(japanesepines) # accede a los datos y asigna un objeto X a ellos summary(X) # resumen del patrn de puntos X X # descripcin bsica de X any(duplicated(X)) # revisa puntos duplicados en X istat(X) # anlisis de datos interactivo

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Herramientas exploratorias
La prueba ms bsica es la de aleatoriedad espacial completa (CSR o HPP), que signica que los eventos se distribuyen

independientemente y aleatoriamente (intensidad constante ).

en el rea de estudio

Example
Las semillas de secuoya (redwood) muestran un patrn agrupado, los centros de 42 clulas biolgicas observadas al microscopio (cells) tienen una distribucin regular y los pinos juveniles japonenes (japanese) no parecen estar en ninguna de estas dos situaciones.

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Herramientas exploratorias.
Clsicas Example

clarkevans(redwood) # Clark and Evans aggregation index clarkevans.test(redwood, alternative="less") #alternative hypothesis: mean nn distance less than expected under CSR (clustered) clarkevans.test(redwood, alternative="greater") #alternative hypothesis: mean nn distance greater than expected under CSR (regular) fryplot # Fry plot miplot # Morishita Index plot
Modernas Example

nnclean # Byers-Raftery feature detection sharpen.ppp # Choi-Hall data sharpening rhohat # Smoothing estimate of covariate effect

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Mtodos de distancia al vecindario


Anlisis de primer orden

Funcin de Clark & Evans (1954): test basado en la distancia media al vecino ms prximo. Funcin G (Diggle, 1979): funcin de distribucin de distancia desde un evento al evento vecino ms cercano. Funcin F (Diggle, 1979): funcin de distribucin de distancia desde un punto jo aleatorio al evento vecino ms cercano (o funcin de espacio vaco). (t ) Funcin J : J (t ) = 1G (t ) 1F
Anlisis de segundo orden

Funcin K de Ripley: estima para todas las escalas (tiene en cuenta todos los pares de eventos). ( Funcin L: L(t ) = t Kt ) Funcin g de correlacin pareada: g (r ) = K (r )/(2 r )

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Mtodos de distancia al vecindario


Local vs. global?.
Anlisis de primer orden. ventajas: tiles en los primeros pasos y cuando los datos estn muy agregados. desventajas: solo local, son denso-dependientes (i.e. dicultan su comparacin). Anlisis de segundo orden: ventajas: globales desventajes: efectos acumulados (i.e. no a una distancia dada) Otras herramientas: pruebas de segundo orden con estadsticos no acumulados (i.e. NDF), ndices de distancia (SADIE; combinan el anlisis local y global).

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Anlisis del patrn puntual III: mtodos de distancia al vecindario


Cul es el poder de los estadisticos estudiados?
discriminacin: la funcin Los

estadsticos presentados tambin varan en su poder o capacidad de

es determina mejor la regularidad de

un patrn, mientras que la funcin poder que

discrimina mejor patrones de

agregacin; para patrones agregados, la funcin

F,

tiene mejor

pero para patrones regulares, es mauor que el de

(Digle, 1979; , 2006).

Qu prueba debo usar?.

Podemos utilizar una amplia variedad

de estadisticos para analizar los patrones puntuales, sin embargo, la pregunta planteada no es fcil de responder. La mejor opcin es utilizar una combinacin de pruebas complementarias (Ripley, 1981; Diggle, 2003).

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Estadsticas de resumen para patrones de puntos.


Example

nndist # nearest neighbour distances nnwhich # find nearest neighbours pairdist # distances between all pairs of points crossdist # distances between points in two patterns nncross # nearest neighbours between two point patterns quadratcount # Quadrat counts quadrat.test # Quadrat test Fest # empty space function F Gest # nearest neighbour distribution function G Kest # Ripley's K-function Lest # Besag-Ripley L-function Jest # J-function J = (1-G)/(1-F) allstats #all four functions F, G, J, K pcf # pair correlation function envelope # simulation envelopes for a summary function varblock # variances and confidence intervals for a summary function.
Hay ms...

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Estadsticas de resumen para patrones de puntos.

Example
Se observa: (arriba izquierda) funcin G, (arriba derecha) funcin F, (debajo) funcin K. Se observan las funciones empricas vs. las funciones tericas (bajo CSR) con envelopes del 96% (variabilidad del proceso bajo CSR). Los rboles japoneses parecen tener una distribucin homogna, las clulas biolgicas muestran un patron regular, mientras que las semillas de secuoya muestran un patrn agrupado.

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Estadsticas de resumen para patrones de puntos mltiples.


Marcas=factor Example

Gcross,Gdot,Gmulti # multitype nearest neighbour distributions G[i,j], G[i.] Kcross,Kdot, Kmulti # multitype K-functions K[i,j], K[i.] Lcross,Ldot # multitype L-functions L[i,j], L[i.] Jcross,Jdot,Jmulti # multitype J-functions J[i,j],J[i.] pcfcross # multitype pair correlation function g[i,j] pcfdot # multitype pair correlation function g[i.] markconnect # marked connection function p[i,j] alltypes # estimates of the above for all i,j pairs

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Estadsticas de resumen para patrones de puntos mltiples.

Example
data(ants). Queremos buscar evidencia de competencia intra e inter especca entre nidos. Observamos la funcin de correlacin apreada (pcf ): fuerte inhibicin entre los nidos de Messor para todas las escalas, inhibicin entre los nidos de Cataglyphis a pequeas escalas y atraccin a media escala, inhibicin entre Cataglyphis y Messor hasta 10 ft (3 metros aprox.).

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Estadsticas de resumen para patrones de puntos con marcas.


Marcas=numricas Example

markcorr # mark correlation function markvario # mark variogram markcorrint # mark correlation integral Emark # mark independence diagnostic E(r) Vmark # mark independence diagnostic V(r) nnmean # nearest neighbour mean index nnvario # nearest neighbour mark variance index Gmulti # multitype nearest neighbour distribution Kmulti # multitype K-function Jmulti # multitype J-function
Alternatively use

cut.ppp

to convert a marked point pattern to a

multitype point pattern.

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Estadsticas de resumen para patrones de puntos con marcas.

Example
data(longleaf ). Patrn agrupado para marcas <=15 y marcas >=25. Las correcciones utilizadas son: iso isotropica, trans por translacin y border por borde (theo representa el modelo terico de Poisson).

Anlisis de datos espaciales con R Patrones de puntos Anlisis de datos exploratorio.

Estadsticas de resumen para patrones tri- y multidimensionales.


Example

pairdist.pp3 # distances between all pairs of points crossdist.pp3 # distances between points in two patterns nndist.pp3 # nearest neighbour distances nnwhich.pp3 # find nearest neighbours F3est # empty space function F G3est # nearest neighbour function G K3est # K-function pcf3est # pair correlation function envelope.pp3 # simulation envelopes pairdist.ppx # distances between all pairs of points crossdist.ppx # distances between points in two patterns nndist.ppx # nearest neighbour distances nnwhich.ppx # find nearest neighbours

Anlisis de datos espaciales con R Patrones de puntos Modelado.

Modelos
Procesos de Poisson homogneo: mecanismo estocastico ms sencillo. Utiliza una funcin de intensidad constante

Procesos de Poisson con clsters: incorporan explcitamente la formacin de grupos y, por tanto, proporcionan la base adecuada para modelar patrones puntuales con eventos agrupados. Procesos de Poisson no homogneos: cuando no es realista suponer estacionariedad (e.g. en estudios epidemiolgicos). Utiliza una funcin de intensidad variable

(x )

y permiten introducir covariables en ella.

Procesos de Cox: modela fenmenos donde la distribucin espacial de los eventos puede ser el resultado de variaciones estocsticas en los factores ambientales. Utiliza una funcin de intensidad como una realizacin de un proceso estocstico. Procesos de Inhibicin Simple: permiten producir diseos agrupados. Procesos Puntuales de Markov: procesos que requieren una descripcin ms exible que la que proporcionan los procesos de inhibicin simple.

Anlisis de datos espaciales con R Patrones de puntos Modelado.

Modelos en R

Example
Modelo general:

ppm(X, trend, interaction, ...)

1) tendencia espacial.

~1 # tendencia constante (proceso estacionario) ~x+y # tendencia log-lineal de las coordenadas cartesianas (proceso no estacionario) ~bs(x,2) o ~s(x,2) # B-splines y suavizado por splines, respectivamente, con 2 grados de libertad.
2) trmino de interaccin.

Poisson # proceso de Poisson Strauss # proceso de Strauss Pairwise # interaccin pareada

Anlisis de datos espaciales con R Patrones de puntos Modelado.

Correlacin entre los eventos y las variables ambientales predictoras

Example
data(bei). Investigar la correlacin entre la intensidad de la presencia de

Beilschmiedia pendula Lauracear

y la elevacin, pendiente, ndice de humedad

topogrca y altitud. Utilizando el AIC observamos que el modelo mejora si usamos las covariables para predecir la intensidad.

Anlisis de datos espaciales con R Patrones de puntos Modelado.

Example
Si ajustamos un proceso de puntos no estacionario con una intensidad no-lineal (izquierda), observamos que la intensidad est correlacionada negativamente con el ndice de humedad y positivamente con los dems predictores. Adems, podemos construir con ellos un ndice de adecuacin del hbitat (derecha).

Anlisis de datos espaciales con R Patrones de puntos Pruebas de hiptesis y diagnstico.

Pruebas de hiptesis clsicas.

Example

quadrat.test chi^2 goodness-of-fit test on quadrat counts clarkevans.test Clark and Evans test kstest Kolmogorov-Smirnov goodness-of-fit test bermantest Berman's goodness-of-fit tests envelope critical envelope for Monte Carlo test of goodness-of-fit anova.ppm Analysis of Deviance for point process models

Anlisis de datos espaciales con R Patrones de puntos Pruebas de hiptesis y diagnstico.

Grcos de diagnstico: tendencia.

Example
Diagnstico del modelo de tendencia (sin covariables): abajo der.) residuos suavizados (diferencia entre la estimacin no paramtrica de la intensidad y la estimacin paramtrica del modelo), encima izq.) carga de residuos, los otros dos paneles son la variable vs. las coordenadas cartesianas (falta ajuste en y=0.15).

Anlisis de datos espaciales con R Patrones de puntos Pruebas de hiptesis y diagnstico.

Grcos de diagnstico: interaccin.

Example
Podemos detectar la dependencia (o independencia) de eventos usando la funcin K y los grcos Q-Q de los residuales. Se observan envelopes 5% para simulaciones del modelo ajustado. Sugiere que el modelo ajustado es correcto.

Anlisis de datos espaciales con R Patrones de puntos Pruebas de hiptesis y diagnstico.

Resumen

Anlisis de datos espaciales con R Patrones de puntos Pruebas de hiptesis y diagnstico.

Aplicacin: John Snow y el clera.

Example
John Snow demostr que el clera era causado por el consumo de aguas contaminadas con materias fecales, al comprobar que los casos de esta enfermedad se agrupaban en las zonas donde el agua consumida estaba contaminada con heces, en la ciudad de Londres en el ao de 1854.

Anlisis de datos espaciales con R Patrones de puntos Pruebas de hiptesis y diagnstico.

Aplicacin: Productividad=Clima+Vegetacin+Litologa. MM.

Example

Cabello Pinar et. al. 2011. The role of vegetation and lithology in the spatial and inter-annual response of EVI to climate in drylands of Southeastern Spain. Journal of Arid Environments. in press.

Anlisis de datos espaciales con R Patrones de puntos Pruebas de hiptesis y diagnstico.

Aplicacin: R + Maxent. Rana toro.

Example
(izquierda) Proyeccin del modelo MaxEnt para Lithobates catesbeianus (rana toro) utilizando las variables climticas generadas en el anlisis de componentes principales del apartado anterior. Los colores clidos indican reas con mejores condiciones predichas y las zonas verdes corresponden a las reas de menor probabilidad de ocurrencia de la especie. Los puntos blancos sealan las localidades utilizadas en el test del modelo. (derecha) Resultados de las simulaciones de L. catesbeianus, para Dolores, Soriano (A) y Acegu, Cerro Largo (B). En la parte superior se muestran los aos de colonizacin en cada celda del mapa de propagacin. En la parte inferior se expone el conteo de sitios colonizados por ao, mostrando los casos extremos de posible invasin.

Anlisis de datos espaciales con R Geoestadstica

Geoestadstica
library(c(geoR,gstat))

Anlisis de datos espaciales con R Geoestadstica

Caractersticas
Objetivo: analizar la distribucin espacial (y sus causas) de una variable regional, interpolacin de las muestras a toda la regin. Example

Hidrogeologa: permeabilidad y transmisividades, diseo de Redes ptimas de monitoreo. Medio Ambiente: Prediccin de la distribucin de contaminantes en atmsfera, suelos, acuferos y cuerpos de agua, evaluacin de sitios y estudio del impacto ambiental. Salud Pblica: distribucin espacial de enfermedades, estimacin de la exposicin de personas a elementos nocivos (acsticos, qumicos, polvos, etc.). Ciencias Agrcolas y Forestales: distribucin espacial de plagas. Inventarios forestales: Estudio cuantitativo de suelos y sus propiedades qumicas y mecnicas. Pesqueras: Relacin entre la distribucin espacial de especies de peces y diferentes variables (profundidad, temperatura, salinidad, etc.).

Anlisis de datos espaciales con R Geoestadstica

Etapas del anlisis

Etapas
1

Anlisis exploratorio. Anlisis estadstico de la variable y comprobacin de los datos (e.g. EDA).

Anlisis estructural. Caracterizacin de la estructura espacial y obtencin de un modelo geoestadstico (e.g. variograma) .

Predicciones. Interpolacin de los valores de la variable en aquellos sitios donde no se ha muestreado (e.g. kriging).

Anlisis de datos espaciales con R Geoestadstica Anlisis exploratorio

Anlisis exploratorio

Example
El conjunto de datos del ro Mosa (meuse) contiene datos de concentraciones de metales pesados (Zn, Cu, Cd, Pb), tipos de suelo, elevacin, materia orgnica, y zonas de distinta frecuencia de inundacin. Los datos son colectados cerca del pueblo Stein (NL) mediante muestras de 15m x 15m.

http://127.0.0.1:16508/library/sp/html/meuse.html.

(izquierda)

contenido de Zn, (derecha) dems variables. Se utiliz la funcin

ssplot

del

Anlisis de datos espaciales con R Geoestadstica Anlisis exploratorio

Anlisis exploratorio
1

Estadstica univariada: funcin de distribucin, percentiles, momentos (media, varianza), valores atipicos, errores. Estadstica bivariada: patrn de dependencia entre 2 variables (covarianza). Regresin lineal y mnimos cuadrados (relacin funcional entre variables).

Anlisis de datos espaciales con R Geoestadstica Anlisis estructural

Anlisis estructural
En dependencia de las caractersticas de estacionaridad del fenmeno se modelar la funcin de covarianzas o la de semivarianzas (variograma). Modelacin del variograma: Algunos geoestadsticos ajustan los modelos de forma visual. Es recomendable auxiliarse con algn procedimiento estadstico. Por ejemplo, un ajuste con un Mtodo de Mnimos Cuadrados. Se requiere de un criterio de bondad de ajuste y complejidad del modelo. Por ejemplo, el criterio de Informacin de Akaike (AIC)

Anlisis de datos espaciales con R Geoestadstica Anlisis estructural

Modelizacin de la variabilidad espacial


El variograma (o semivariograma) representa la tasa media de cambio de una propiedad con la distancia. Permite analizar la estructura espacial de una variable sobre un rea denida, obteniendo la inuencia de los datos a diferentes distancias. Procedimiento:
1 2

Eliminar la tendencia. Seleccionar el lag h y ngulo (para variogramas direccionales).

3 4

Crear el variograma experimental. Crear el variograma terico.

Example

lznr.vgm = variogram(log(zinc) ~ sqrt(dist), meuse) lznr.fit = fit.variogram(lznr.vgm, model = vgm(1, "Exp", 300, + 1)) lznr.fi plot(lznr.vgm, lznr.fi)

Anlisis de datos espaciales con R Geoestadstica Anlisis estructural

Ejemplo

Example

Pepita o nugget:

varianza no explicada por el modelo (varianza error). Puede

ser debido a errores de medicin en la variable o a la escala de la misma. En algunas ocasiones puede ser indicativo de que parte de la estructura espacial se concentra a distancias inferiores a las observadas. En un modelo que explique bien la realidad, la pepita no debe representar mas del 50% de la meseta.

Rango:

a distancia a partir de la cual dos observaciones son independientes mxima semivarianza, debe coincidir con la varianza de la

(zona de inuencia; tamao de grano).

Meseta o sill:
poblacin.

Anlisis de datos espaciales con R Geoestadstica Anlisis estructural

Modelos
Modelos bsicos: esfrico, exponencial, gaussiano, potencial, lineal y el efecto pepita puro, pudindose combinar linealmente.

Example
Modelo esfrico: representa los parches, donde el dimetro promedio de los parches est representado por el rango del modelo. Modelo exponencial: procesos autorregresivos de primer orden y procesos de Markov. Si se tienen dos variables relacionadas, pueden denirse los variogramas cruzados (tambin los correlogramas y las funciones de covarianza cruzadas). Anisotropa: cuando la variacin espacial no es la misma en todas las direcciones se debe calcular el variograma en varias direcciones.

Anlisis de datos espaciales con R Geoestadstica Anlisis estructural

Ejemplo

Example
Pasos en el modelado del variograma: (a) localizacin del muestreo (155) y valores medidos de la concentracin de zinc, (b) variograma nube con los pares de semivarianzas (para log-zinc), (c) semivarianzas agregadas para distancias de 100m (lag) y (d) el modelo nal del variograma (aqu ajustado con los parmetros que vienen por defecto en gstat).

variogram(log(zinc) ~ 1, meuse) #tendencia constante variogram(log(zinc) ~ sqrt(dist), meuse) #funcin media no constate

Anlisis de datos espaciales con R Geoestadstica Prediccin

Modelos de prediccin espacial mecnicos

(i.e. los parmetros los establece por defecto el software)


1 2 3 4

anlisis de supercie de tendencia polgonos de Thiessen interpolacin por la distancia inversa regresin con las coordenadas (i.e. supercie de tendencia -global- o interpolacin de supercie mvil -local-): Ordinary Least Squares (OLS).

regresin con splines (polinomio a trozos con suavizado)

Anlisis de datos espaciales con R Geoestadstica Prediccin

Modelos de prediccin espacial estadsticos


Permite producir mapas ms objetivos y adecuados entender las fuentes de error en los datos y grado de incertidumbre (var o sd). evidenciar reas/puntos problemticas/os que necesitan ser revisados.
1

Kriging (Krige, 1951): Kriging simple (SK, media constante y conocida), Kriging ordinario (OK, media constante y desconocida; variable estacionaria), Kriging universal (media variable y desconocida; variable con tendencia o deriva).

Correlacin ambiental (para covariables ambientales): modelos basados en la clasicacin, modelos basados en diagramas de rbol y modelos de regresin (GLMs y GAMs).

Modelos hbridos: regresin-kriging, co-kriging (para covariables).

Anlisis de datos espaciales con R Geoestadstica Prediccin

Modelos de prediccin espacial mecnicos


krige(zinc~1, meuse, meuse.grid, degree=2, nmax=20).
Supercie de tendencia: regresin lineal mltiple con polinomios de las coordenadas como variables predictoras independientes. Tambin se pueden ajustar tendencias locales.

krige(zinc~1, meuse, meuse.grid).

Interpolacin por la inversa de la

distancia: calcula una media ponderada de puntos en el vecindario (el global, por defecto), utilizando pesos inversos proporcional a la distancia de las localizaciones de los datos respecto a la localizacin de las predicciones, elevadas a la potencia p (2, por defecto).

krige(log1p(zinc)~sqrt(dist), meuse, meuse.grid).


lineal.

Regresin

glm(zinc~dist+soil+ffreq+X+Y, meuse, family=poisson()).


Modelo GLM.

krige(log1p(zinc)~1, meuse, meuse.grid, vt.fit).


ordinario (ordinary kriging).

Kriging

krige(log1p(zinc)~sqrt(dist), meuse, meuse.grid, vr.fit).


Regresin-Kriging.

Anlisis de datos espaciales con R Geoestadstica Prediccin

Ejemplo

Example
data(meuse). Comparacin de las tcnicas de prediccin espacial con los datos del rio Mosa: kriging ordinario (ok) y regresin-kriging (rk), modelo GLM (glm), interpolacin por distancia inversa (id), regresin con las coordenadas (trend, tr) y regersin lineal (lm).

Anlisis de datos espaciales con R Geoestadstica Prediccin

Seleccin del modelo de prediccin

Example
rbol de decisin para seleccionar un modelo de prediccin espacial adecuado, basado en la estimacin del modelo.

Anlisis de datos espaciales con R Geoestadstica Prediccin

Validacin de los modelos de prediccin espacial

media del error de prediccin (ME), raz cuadrada del error de prediccin (RMSE), estandarizados (RMNSE, etc.). validacin cruzada: k-fold, leave one out (LOO), jacknife. estadsticos kappa. Example
leave one out: Consiste en sacar un punto de la muestra y estimar con Kriging el valor en ese punto usando el modelo de variograma obtenido. anloga se acta para el resto de los elementos de la muestra.

De forma

Como

resultado se obtiene un mapa de las diferencias entre el valor real y el estimado.

Anlisis de datos espaciales con R Geoestadstica Prediccin

Principales funciones del paquete gstat.

Anlisis de datos espaciales con R Geoestadstica Prediccin

Resumen

Anlisis de datos espaciales con R Datos en grilla (lattice)

Datos en grilla library(c(spdep, SDMTools))

Anlisis de datos espaciales con R Datos en grilla (lattice)

Caractersticas
El objetivo es la construccin del vecindario, estimar los pesos asociados a l y medir la autocorrelacin espacial. Para abordar estos temas dividiremos la seccin en 3 partes:
1

Vecindario espacial: vecindario por contiguidad, vecindario basado en grafos (triangulacin Delauney, Gabriel, etc.), vecindario basado en distancias, vecindario por grillas, otros.

Pesos espaciales: generales, importados de otros software. Utilizacin de los pesos para simular la autocorrelacin espacial.

Pruebas de autocorrelacin. Test globales: I de Moran, C de Geary, G de Getis-Ord, Test de Mantel del producto cruzado. Test locales: adaptacin de los anteriores a nivel local.

Anlisis de datos espaciales con R Datos en grilla (lattice) Vecindario espacial

Redes de vecindario y pesos espaciales

Example
Casos de leucemia en 19781982, en Syracuse (Waller and Gotway, 2004; Bivand et al. 2007): (izquierda) vecindario por contiguidad, (derecha) vecindario basado en grafos (triangulacin Delauney, Gabriel, etc.).

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Pruebas de autocorrelacin espacial. library(spdep)

Datos continuos Globales:

moran.test() #Coeficiente I de Moran (1950) geary.test() #Coeficiente C de Geary (1954) globalG.test() #Coeficiente G de Getis-Ord sp.mantel.mc() #Test de Mantel espacial de producto cruzado.
Locales:

localmoran() #Coeficiente I de Moran local (1950) localG #Coeficiente G local de Getis-Ord


Datos categricos

local indicator of spatial association

(LISA)

joincount.test() ; joincount.multi() #Estadsticos join count.

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Autocorrelacin global
Coeciente I de Moran (1950):

[-1, 1]

Los valores positivos indican la existencia de autocorrelacin positiva mientras que los valores negativos la presencia de autocorrelacin negativa. El valor esperado ante la ausencia de autocorrelacin espacial es prximo a cero. Problemas: pocos datos o comportamiento no estacionario.

Coeciente C de Geary (1954):


tiende hacia 1.

[0, 2]

El valor 0 es el mximo de autocorrelacin positiva, y el 2 indica fuerte autocorrelacin negativa. En ausencia de autocorrelacin el valor esperado Este coeciente mide directamente la diferencia entre los valores de la variable en dos localidades, de manera que el grado de autocorrelacin espacial est basado en estas diferencias en funcin de la distancia. Problemas: pocos datos.

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Signicacin y correlograma
Signicacin de los coecientes
Podemos estandarizar los valores de los estadsticos y compararlo con la distribucin normal para encontrar la probabilidad del estadstico observado bajo la hiptesis nula de independencia espacial para los pesos elegidos. Tambin podemos realizar aleatorizacin mediante Monte Carlo o boostrap.

Correlogramas

Podemos calcular los coecientes anteriores para cada intervalo de distancia y gracarlos. De esta manera, y al contrario de lo que ocurre con el test de Mantel, no se asume previamente la escala espacial de la estructura. Cuando los valores son positivos a corta distancia y luego muestran una marcada uctuacin alrededor del valor esperado, el correlograma indica la existencia de un proceso marcado por la existencia de parches ( patchiness ). El correlograma de la c de Geary tiene una forma inversa al correlograma de la I de Moran.

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Autocorrelacin local

La existencia de pequeas reas de heterogeneidad espacial de carcter local puede quedar enmascarada por la utilizacin de un solo coeciente medio de autocorrelacin o una serie de coecientes medios calculados a diferentes distancias (correlogramas; Fortin y Dale, 2005). Por ello, conviene tambin usar estadsticos de autocorrelacin locales (versin de los anteriores).

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Autocorrelacin global y local

Example
(izquierda) Correlograma de I de Moran global para 8 lags, (derecha) I de Moran local para la ciudad de Binghampton: supuesto de normalidad, valores exactos e hiptesis de riesgo contante. Casos de leucemia en Syracuse (Waller and Gotway, 2004; Bivand et al. 2007).

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Correlacin entre variables

Test de Mantel

Es un estadstico de la correlacin entre dos o tres matrices. Las muestras que son similares en ambiente tambin lo son en su ecologa? las muestras que estn cercanas son similiares en ecologa?

Test de Mantel parcial

las muestras que son similares en ambiente tambin lo son en su ecologa, dada una estructura espacial en el ambiente? las muestras que estn cercanas son similiares en ecologa luego de dar cuenta del ambiente?

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Modelado

Podemos modeladar la estructura espacial de dependencia mediante: ltrado espacial con vectores propios de Moran, regresin ponderada geogrcamente, modelos SAR o CAR, o por modelos GAM, GEE, GLMM.

lm.morantest() # Regresin con I de Moran Global para los residuos gwr.sel(); gwr # regersin ponderada geogrficamente spautolm() # Modelos autoregresivos simultneos (SAR) lm(..., weigths=tam) # Regresin lineal ponderada por la inversa del tamao poblacional, por ej. spautolm(..., family=CAR) # Modelos autorregresivos condicionales (CAM)

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Resumen

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Aplicacin: Cadenas de Markov + CA. Conectividad.

Example

Piquer-Rodriguez et. al. 2011. Future land use eects on the connectivity of protected area networks in Southeastern Spain. Journal for Nature Conservation. in press.

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Aplicacin: R + FRAGSTATS. CA.

Example
Podemos trabajar con paisajes fragmentados y calcular estadsiticos de parches, clases de parches o del paisaje. El paquete

SDMTools

permite realizar las

mtricas del programa FRAGSTATS en R. (Tesina de Mster).

Anlisis de datos espaciales con R Datos en grilla (lattice) Pruebas de autocorrelacin

Visin nal

Das könnte Ihnen auch gefallen