Sie sind auf Seite 1von 10

MÉTODOS GEOESTADÍSTICOS, VARIABLE REGIONALIZADA, SEMIVARIOGRAMAS Y KRIGEAGE

El estudio de fenómenos con correlación espacial, por medio de métodos geoestadísticos, surgió a
partir de los años sesenta, especialmente con el propósito de predecir valores de las variables en
sitios no muestreados. Como antecedentes suelen citarse trabajos de Sichel (1947; 1949) y Krige
(1951). El primero observó la naturaleza asimétrica de la distribución del contenido de oro en las
minas surafricanas, la equiparó a una distribución de probabilidad lognormal y desarrolló las
fórmulas básicas para esta distribución. Ello permitió una primera estimación de las reservas, pero
bajo el supuesto de que las mediciones eran independientes, en clara contradicción con la
experiencia de que existen “zonas” más ricas que otras. Una primera aproximación a la solución de
este problema fue dada por geólogo G. Krige que propuso una variante del método de medias
móviles, el cual puede considerarse como el equivalente al krigeado simple que, como se verá más
adelante, es uno de los métodos de estimación lineal en el espacio con mayores cualidades
teóricas. La formulación rigurosa y la solución al problema de predicción (estimación en muchos
textos geoestadísticos) vinieron de la mano de Matheron (1962) en la escuela de minas de París.
En los años sucesivos la teoría se fue depurando, ampliando su campo de validez y reduciendo las
hipótesis necesarias (Samper y Carrera, 1990). De la minería las técnicas geoestadísticas, se han
"exportado" a muchos otros campos como hidrología, física del suelo, ciencias de la tierra y más
recientemente al monitoreo ambiental y al procesamiento de imágenes de satélite. La
geoestadística es solo una las áreas del análisis de datos espaciales. Es importante reconocer
cuando la información georreferenciada es susceptible de ser analizada por medio de dicha
metodología.

GEOESTADÍSTICA

La geoestadística es una rama de la estadística que trata fenómenos espaciales (Journel &
Huijbregts, 1978). Su interés primordial es la estimación, predicción y simulación de dichos
fenómenos (Myers, 1987). Esta herramienta ofrece una manera de describir la continuidad
espacial, que es un rasgo distintivo esencial de muchos fenómenos naturales, y proporciona
adaptaciones de las técnicas clásicas de regresión para tomar ventajas de esta continuidad (Isaaks
& Srivastava, 1989). Petitgas (1996), la define como una aplicación de la teoría de probabilidades a
la estimación estadística de variables espaciales. La modelación espacial es la adición más reciente
a la literatura estadística. Geología, ciencias del suelo, agronomía, ingeniería forestal, astronomía,
o cualquier disciplina que trabaja con datos colectados en diferentes locaciones espaciales
necesita desarrollar modelos que indiquen cuando hay dependencia entre las medidas de los
diferentes sitios. Usualmente dicha modelación concierne con la predicción espacial, pero hay
otras áreas importantes como la simulación y el diseño muestral (Cressie, 1989). Cuando el
objetivo es hacer predicción, la geoestadística opera básicamente en dos etapas.

Etapas de la geoestadistica

- La primera es el análisis estructural, en la cual se describe la correlación entre puntos en el


espacio.

- En la segunda fase se hace predicción en sitios de la región no muestreados por medio de la


técnica kriging.

Este es un proceso que calcula un promedio ponderado de las observaciones muestrales. Los
pesos asignados a los valores muestrales son apropiadamente determinados por la estructura
espacial de correlación establecida en la primera etapa y por la configuración de muestreo
(Petitgas, 1996). Los fundamentos básicos de estas etapas son presentados a continuación.

¿Cómo funciona?

Una vez recogida la información que va a utilizarse, se decide qué modelos de estimación se
usarán. Existen dos grandes modelos actualmente utilizados: el kriging (o krigeaje), que se
subdivide en ordinario, simple y de indicadores, y el kriging puntual y de bloques. Esto en honor al
ingeniero sudafricano Danie Krige, que comenzó a desarrollar la geoestadística durante su trabajo
en las minas de oro de Witwatersrand.

Además existen otros modelos de kriging como el universal, el IRFk, el disyuntivo y el log-normal.
El kriging no sólo se usa en minería; tiene aplicaciones hidrogeológicas, en las ciencias de la tierra,
medioambientales, en el procesamiento de imágenes satelitales e incluso en el diseño de aparatos
que utilizan microondas, entre otros.

En el campo de la minería, lo que busca el kriging en términos generales es interpolar un valor


(como la elevación, porosidades o presencia de contaminantes, por ejemplo) de un lugar que aún
no ha sido observado en base a observaciones realizadas en ubicaciones cercanas.

Así, la geoestadística puede realizar evaluaciones de reservas mineras, es decir, la estimación de


parámetros a partir de un número relativamente pequeño de perforaciones y muestras diversas.

Íntimamente relacionadas a los modelos de estimación están los modelos de simulación. Esto
debido a la necesidad de una mayor precisión de la información obtenida del kriging.

VARIABLE REGIONALIZADA.
Una variable medida en el espacio de forma que presente una estructura de correlación, se dice
que es una variable regionalizada. De manera más formal se puede definir como un proceso
estocástico con dominio contenido en un espacio euclidiano d- dimensional Rd, {Z(x) : x ∈ D ⊂ Rd}.
Si d = 2, Z (x) puede asociarse a una variable medida en un punto x del plano (Díaz-Francés, 1993).
En términos prácticos Z(x) puede verse como una medición de una variable aleatoria (p.ej.
concentración de un contaminante) en un punto x de una región de estudio. Recuérdese que un
proceso estocástico es una colección de variables aleatorias indexadas; esto es, para cada x en el
conjunto de índices D, Z(x) es una variable aleatoria. En el caso de que las mediciones sean hechas
en una superficie, entonces Z(x) puede interpretarse como la variable aleatoria asociada a ese
punto del plano (x representa las coordenadas, planas o geográficas, y Z la variable en cada una de
ellas). Estas variables aleatorias pueden representar la magnitud de una variable ambiental
medida en un conjunto de coordenadas de la región de estudio.

Se conviene en que una variable geográfica o espacial es una variable regionalizada si cumple con
los siguientes requisitos:

1. Es continua pero no matematizable


2. Posee variación local aleatoria
3. Posee variación regional o conjunta no aleatoria

Los requisitos (2) y (3) significan que la variable regionalizada deba asumirse como una variable
estocástica; se considera que una variable es estocástica si ella resulta de la combinación de
factores deterministas y de factores aleatorios. La naturaleza aleatoria está prescrita en el
requisito (2), mientras que la naturaleza determinista está dada por la exigencia (3). En la
literatura estadística especializada se acepta que si una variable geográfica cumple con la
condición (3) entonces existe entre los datos autocorrelación espacial o que la variable geográfica
posee una estructura de autocovarianza o de autocorrelación. Finalmente, si la variable geográfica
posee una estructura de autocorrelación se concluye que ella forma parte o es el resultado de un
Proceso Espacial Estocástico.
SEMIVARIOGRAMA

El semivariograma experimental tiene múltiples utilidades pero generalmente su uso se limita a


ser el paso previo para realizar una interpolación espacial de las muestras mediante krigeado y
poder así predecir los valores de la variable en los lugares no muestreados. Este krigeado es una
de las técnicas clásicas geoestadísticas más conocidas dentro de los sistemas de información
geográfica (SIG). Dentro de las distintas técnicas de muestreo en el que la elección de la muestra
puede verse condicionada por un componente espacial definido (como las variables ambientales)
se obvia el uso del semivariograma como el mejor estimador de la mínima distancia de muestreo.

En la estadística tradicional, se usa la varianza como el parámetro que define la variación de las
muestras con respecto a su media. Dentro del mundo de la estadística espacial, la semivarianza
mide la variación de las muestras pero en componentes de distancia y orientación. Si asumimos
que la varianza de los incrementos correspondientes a dos localizaciones distintas depende solo del
vector que los separa, la semivarianza definirá la autocorrelación que poseen los pares de
puntos y a partir de que distancia el par de puntos no es similar.

Cuando el semivariograma se calcula para todos los pares de datos de la muestra se obtiene la
denominada nube de semivarianza, solo práctica desde un punto de vista teórico, ya que, al existir
tal cantidad de pares de datos, se convierte en una herramienta inmanejable. Por ello, las
muestras se agrupan en conjuntos o bins separados por una distancia o lag distance, de forma
que se calculen los puntos del variograma a partir de los valores medios de los puntos incluidos en
estos conjuntos, asumiéndose cierto margen de error debido a la variación inherente entre las
muestras que se agrupen en un mismo bin.

De forma paramétrica, la semivarianza se expresa entonces con la

ecuación donde es el número de pares de


localizaciones, el valor del punto con información y el punto parejo separado
una distancia del primero.

Al graficar dicha función (y salvo que la variable no sea estacionaria, es decir que su distribución de
probabilidad es la misma en cualquier lugar), se tiene una función monótona creciente, debido a
que al aumentar la distancia $h$ también lo hace la diferencia entre y . Además,
como se indicó anteriormente, cuando la distancia entre dos puntos excede una cierta distancia, la
varianza de los incrementos se mantiene constante (alcanza una continuidad asintótica). Esta
distancia, denominada de autocorrelación, indica la distancia máxima en la que existe cierto grado
de similitud explicable por el espacio.

El cálculo del semivariograma experimental o variografía conlleva una serie de decisiones a tomar
para que el ajuste sea el correcto y se tengan en cuenta todos los pares símiles:

1. Para limitar el tamaño de bin, se debe especificar el lag space (o lag distance). Esta, se
aproxima generalmente a la distancia media entre muestras. Su conocimiento es
fundamental debido a que si es muy pequeña habrá lugares en los que no existan pares de
puntos, mientras que si es muy grande se cogerán puntos sin ningún “parecido” espacial.

2. Asimismo, se definirá el número de lags o el lag tolerance (entendido este último, como la
distancia al centro de gravedad del bin), dependiendo de la metodología que se use
(mallas cuadradas o circulares).

¿Cómo nos puede ayudar el semivariograma?


Anteriormente se ha dicho que, si existe un razonable parecido entre las muestras cuanto más
cercanas son, la representación gráfica del semivariograma es una función monótona creciente y
que, por otro lado, a medida que aumenta la separación entre las muestras el semivariograma se
vuelve asintótico. Esta asíntota será la que nos marque la distancia óptima de separación de
nuestras muestras: muestras más cercanas no serán necesarias porque supondrían
sobremuestrear, pero en cambio, muestras muy alejadas de esta distancia supondría lo contrario.

Por tanto, si realizamos un adecuado muestreo piloto y, a la muestra recogida, aplicamos el


cálculo de su semivarianza, podremos optimizar el muestreo definitivo, estando seguros que
recogeremos toda la variabilidad existente en componentes de separación y dirección espacial.

Modelos Teóricos de Semivarianza.

Existen diversos modelos teóricos de semivarianza que pueden ajustarse al semivariograma


experimental. En Samper y Carrera (1990) se presenta una discusión respecto a las características
y condiciones que éstos deben cumplir. En general dichos modelos pueden dividirse en no
acotados (lineal, logarítmico, potencial) y acotados (esférico, exponencial, gaussiano) (Warrick et
al., 1986). Los del segundo grupo garantizan que la covarianza de los incrementos es finita, por lo
cual son ampliamente usados cuando hay evidencia de que presentan buen ajuste. Todos estos
modelos tienen tres parámetros comunes que son descritos a continuación:

Efecto Pepita

Se denota por C0 y representa una discontinuidad puntual del semivariograma en el origen. Puede
ser debido a errores de medición en la variable o a la escala de la misma. En algunas ocasiones
puede ser indicativo de que parte de la estructura espacial se concentra a distancias inferiores a
las observadas.

Meseta

Es la cota superior del semivariograma. También puede definirse como el límite del
semivariograma cuando la distancia h tiende a infinito. La meseta puede ser o no finita. Los
semivariogramas que tienen meseta finita cumplen con la hipótesis de estacionariedad fuerte;
mientras que cuando ocurre lo contrario, el semivariograma define un fenómeno natural que
cumple sólo con la hipótesis intrínseca. La meseta se denota por C1 o por (C0 + C1) cuando la
pepita es diferente de cero. Si se interpreta la pepita como un error en las mediciones, esto explica
porque se sugiere que en un modelo que explique bien la realidad, la pepita no debe representar
más del 50% de la meseta. Si el ruido espacial en las mediciones explica en mayor proporción la
variabilidad que la correlación del fenómeno, las predicciones que se obtengan pueden ser muy
imprecisas.
Rango

En términos prácticos corresponde a la distancia a partir de la cual dos observaciones son


independientes. El rango se interpreta como la zona de influencia. Existen algunos modelos de
semivariograma en los que no existe una distancia finita para la cual dos observaciones sean
independientes; por ello se llama rango efectivo a la distancia para la cual el semivariograma
alcanza el 95% de la meseta. Entre más pequeño sea el rango, más cerca se está del modelo de
independencia espacial. El rango no siempre aparece de manera explícita en la fórmula del
semivariograma. En el caso del modelo esférico (3.2.1), el rango coincide con el parámetro a, que
se utilizará en las ecuaciones más adelante. Sin embargo, en el modelo exponencial (3.2.2), el
rango efectivo es a/3 y en el modelo gaussiano (3.2.3) es a/√3.

Modelo Esférico

Tiene un crecimiento rápido cerca al origen (Fig. 10), pero los incrementos marginales van
decreciendo para distancias grandes, hasta que para distancias superiores al rango los
incrementos son nulos. Su expresión matemática es la siguiente:

Modelo Exponencial
Este modelo se aplica cuando la dependencia espacial tiene un crecimiento exponencial respecto a
la distancia entre las observaciones. El valor del rango es igual a la distancia para la cual el
semivariograma toma un valor igual al 95% de la meseta (Fig. 10). Este modelo es ampliamente
usado. Su expresión matemática es la siguiente:

Modelo Gaussiano
Al igual que en el modelo exponencial, la dependencia espacial se desvanece solo en una distancia
que tiende a infinito. El principal distintivo de este modelo es su forma parabólica cerca al origen
(Fig.10). Su expresión matemática es:

MÉTODO KRIGEADO

KRIGING es un método geoestadístico de interpolación que ha probado ser útil y popular en


muchos campos (Burgess y Webster, 1980). En la actualidad FUNDECOR utiliza este método de
interpolación de modelos de elevación digital (mapas de curvas de nivel) para la planificación del
aprovechamiento forestal de los bosques naturales. Dicho método provee, a partir de una muestra
de puntos, ya sean regular o irregularmente distribuidos, valores estimados de aquellos sitios
donde no hay información, sin sesgo y con una varianza mínima conocida.
Kriging tiene dos formas para ser aplicado, como “ORDINARY KRIGING” o “UNIVERSAL KRIGING”.
El primero asume que la variación en los valores de elevación está libre de cualquier componente
estructural (DRIFT).

El segundo asume que dicha tendencia de variación espacial está presente en los datos. Esta
puede ser ajustada de dos formas: con un modelo lineal o con uno cuadrático. En datos de
elevación, FUNDECOR ha utilizado, con buenos resultados, Universal Kriging con un ajuste de
tendencia lineal.

Este método tiene en cuenta tanto el espaciamiento de los puntos en los cuales se tiene
información, como su distribución en el dominio a interpolar. Además, considera la
variabilidad espacial de los datos, esto lo hace mediante el uso del semivariograma (que
será explicado más adelante), el cual se construye a partir de la covarianza entre cada par
de puntos ubicados a distintas distancias; a éste se ajusta un variograma teórico que
represente lo más fielmente la variabilidad de los datos. Cada modelo teórico está
asociado a un conjunto de parámetros como el efecto pepita, la meseta y el rango que
son determinados a partir de las características de los datos y que posteriormente son
usados por Kriging durante la interpolación. El semivariograma establece una distancia
efectiva de influencia a partir de la cual se supone que no existe correlación entre los
datos (Gallego y Toro, 2006).

En general el propósito del método de Kriging, es estimar el valor desconocido de una


variable en un punto con coordenadas específicas usando, en la mayoría de los casos, un
estimador lineal de n valores conocidos de la variable a interpolar, minimizando la
varianza del error cuadrático medio del campo espacial interpolado. Se busca representar
los valores que puede tomar la variable dentro del área de estudio mediante una función
aleatoria. Este estimador involucra una matriz de pesos, la cual es construida a partir de
cada uno de los datos y su relación con los demás en función de su separación. El valor
estimado por esta metodología es aquel que minimiza la varianza del error de la
estimación y debe ser un estimador insesgado.

Es de gran importancia conocer que la superficie de interpolación obtenida con Kriging


mantiene los datos puntuales con los cuales se hace la estimación.

Das könnte Ihnen auch gefallen