Beruflich Dokumente
Kultur Dokumente
4500.00
5.000
4.500
4.000
3.500
Norte
3.000
2.500
2.000
1.500
1.000
.5000
.0
3600.00
5200.00
Este
6000.00
Simulacin Geoestadstica
TABLA DE CONTENIDOS
1. INTRODUCCIN
Alcance
Objetivos
Contenidos del curso
Etapas en la evaluacin de yacimientos
Muestreo y variabilidad del fenmeno
Origen de la variabilidad
11
22
5. ANLISIS BIVARIABLE
Grfico de dispersin o Scatterplot
Q-q plot
Correlacin
Regresin normal
Regresin lognormal
Paso de la regresin a promedios ponderados
36
6. EVALUACIN GLOBAL
Efecto de soporte
50
54
Simulacin Geoestadstica
60
9. EVALUACIN LOCAL
Mtodos de estimacin clsicos
Relacin entre la varianza y el tamao del dominio
Varianza-Error de estimacin
Kriging Simple
Kriging Ordinario
Kriging lognormal
80
103
111
114
116
120
Simulacin Geoestadstica
133
152
Simulacin Geoestadstica
1. INTRODUCCIN
Alcance
El presente apunte forma parte del curso de posttulo dictado por el Departamento
de Ingeniera de Minas de la Universidad de Chile, dentro del programa de
Capacitacin en Innovacin Tecnolgica para la Minera. El curso considera el
desarrollo de un proyecto tridimensional por parte de los alumnos, adems del
repaso de los conceptos tericos, tanto de estadstica clsica como de
geoestadstica, orientado a la evaluacin de recursos minerales.
El proyecto contempla el anlisis exploratorio inicial, a travs del cual se concluye
en una estimacin global de los recursos disponibles, seguido del estudio
geoestadstico (variografa, validaciones y estimacin) para la obtencin final de la
estimacin local. Las ventajas del uso de herramientas de simulacin tanto con el
fin de realizar la estimacin local, como para evaluar incertidumbre y establecer
intervalos de confianza en los resultados, son expuestas como parte del curso.
El presente apunte est orientado principalmente al rea minera, sin embargo, las
tcnicas expuestas son aplicables a otras reas.
Objetivos
El uso de la geoestadstica para estimar leyes o, en general, concentraciones de
elementos, fue establecido hace varias dcadas. Las tcnicas han ido
evolucionando desde mtodos puramente geomtricos hacia mtodos que
consideran la variabilidad en el espacio de la variable de inters. Actualmente,
simulaciones condicionales se utilizan para establecer la incertidumbre en los
resultados. La industria del petrleo y minera han liderado buena parte de las
aplicaciones. El rea medioambiental se ha visto forzada al uso de la
geoestadstica por razones legales, en pases como Estados Unidos o Canad,
donde los litigios medioambientales requieren establecer medidas junto a su
incertidumbre, o nivel de error, en trminos probabilsticos.
En aplicaciones mineras, el muestreo y la evaluacin de yacimientos permiten en
una etapa temprana de un proyecto, tomar la decisin de continuar explorando,
iniciar la explotacin o abandonar el proyecto. Esta decisin puede tomarse
despus de una evaluacin global bastante preliminar, o bien, luego de una
evaluacin local ms detallada.
Una vez que el yacimiento est en explotacin, se utilizan estas herramientas para
construir los planes de produccin de corto, mediano y largo plazo, as como para
determinar nuevas zonas explotables, o para volver a evaluar el proyecto inicial,
con la nueva informacin disponible proveniente de la explotacin.
Simulacin Geoestadstica
Simulacin Geoestadstica
d. Kriging ordinario
e. El efecto proporcional
6. Otros mtodos de estimacin local
a. Kriging Multi-Gaussiano
b. Kriging de Indicadores
7. Aspectos generales de simulacin
a. Reproduccin de la covarianza
b. Caso general de simulacin directa
c. El problema de la forma de las distribuciones condicionales
8. Simulacin Gaussiana secuencial
a. Aspectos tericos
b. Aspectos prcticos
9. Simulacin secuencial de indicadores
a. Aspectos tericos
b. Aspectos prcticos
c. Aplicacin a variables categricas
10. Simulacin de varias variables
a. Simulacin Gaussiana con cokriging
b. Simulacin Gaussiana usando variable colocalizada
Etapas en la evaluacin de yacimientos
Las principales etapas en la evaluacin de un yacimiento son:
Simulacin Geoestadstica
Simulacin Geoestadstica
Simulacin Geoestadstica
6
Simulacin Geoestadstica
Origen de la variabilidad
El principal problema que motiva la toma de muestras y el desarrollo de una
evaluacin de los recursos disponibles, es que la variable que interesa estudiar
tiene un comportamiento difcil de predecir. Resulta lgico pensar que si dicha
variable fuera constante en el depsito, bastara tomar slo una muestra para
conocer su valor en cualquier punto del yacimiento. Sin embargo, en la prctica
esta situacin nunca existe, debido a la presencia de una variabilidad que debe
ser estudiada para poder realizar estimaciones en puntos en los que la variable no
ha sido medida.
Esta variabilidad proviene principalmente de dos fuentes:
Simulacin Geoestadstica
Simulacin Geoestadstica
81 cm
140 cm
75 cm
215 cm
106 cm
253 cm*gr/ton
199 cm*gr/ton
335 cm*gr/ton
581 cm*gr/ton
212 cm*gr/ton
75 cm
34 cm
91 cm
156 cm*gr/ton
296 cm*gr/ton
352 cm*gr/ton
705 cm*gr/ton
Simulacin Geoestadstica
10
m2 =
gr Au
1 335 253 581 199 212 705 296 156 352
+
+
+
+
+
+
+
+
= 2.94
9 119
81 140 75 106 215 75
34
91
ton
Simulacin Geoestadstica
11
Simulacin Geoestadstica
12
Simulacin Geoestadstica
13
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
Frecuencia
0
9
48
108
146
149
155
162
181
158
177
165
128
119
119
88
81
66
47
40
39
48
33
13
20
11
%
0,00
0,38
2,02
4,55
6,14
6,27
6,52
6,82
7,62
6,65
7,45
6,94
5,39
5,01
5,01
3,70
3,41
2,78
1,98
1,68
1,64
2,02
1,39
0,55
0,84
0,46
Clase
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1
y mayor
Frecuencia
8
9
9
6
4
1
4
0
3
0
1
1
1
0
3
2
2
1
0
0
1
0
0
1
0
9
%
0,34
0,38
0,38
0,25
0,17
0,04
0,17
0,00
0,13
0,00
0,04
0,04
0,04
0,00
0,13
0,08
0,08
0,04
0,00
0,00
0,04
0,00
0,00
0,04
0,00
0,38
Simulacin Geoestadstica
14
Histograma
200
180
160
Frecuencia
140
120
100
80
60
40
20
0
0
Clase
Figura 6: Histograma.
Mediante la visualizacin del histograma, se puede definir la existencia de valores
errticos altos. Se considerar un valor errtico alto aquel que se destaque en su
vecindad por ser extremadamente alto en relacin con los dems y que ocurra con
poca frecuencia. Como se ve es una definicin un tanto ambigua que requiere del
discernimiento de quin est analizando los datos.
En el caso de evaluaciones de reservas interesan las frecuencias acumuladas
sobre lmites inferiores (por ejemplo, leyes de corte). Para esto, la preparacin de
tablas de frecuencia acumulada y sus correspondientes histogramas
acumulados se hace despus de ordenar los datos en orden decreciente.
En el clculo se considera el nmero total de valores sobre una cierta ley de
corte. El histograma acumulado es una funcin no decreciente entre 0 y 100%.
Ambas formas, porcentaje de frecuencia y porcentaje de frecuencia acumulada se
utilizan indistintamente pues uno se obtiene del otro.
Enseguida se presentan para los mismos datos anteriores, la tabla de frecuencia
acumulada (Tabla 2) y el histograma acumulado (Figura 7).
Simulacin Geoestadstica
Ley de
Corte ZC
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
Frecuencia
Acumulada
2376
2376
2367
2319
2211
2065
1916
1761
1599
1418
1260
1083
918
790
671
552
464
383
15
%
Z(u) > ZC
0,00
0,38
2,40
6,94
13,09
19,36
25,88
32,70
40,32
46,97
54,42
61,36
66,75
71,76
76,77
80,47
83,88
86,66
Ley de
Corte ZC
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,3
3,4
Frecuencia
Acumulada
317
270
230
191
143
110
97
77
66
58
49
40
34
30
29
25
25
25
%
Z(u) > ZC
88,64
90,32
91,96
93,98
95,37
95,92
96,76
97,22
97,56
97,94
98,32
98,57
98,74
98,78
98,95
98,95
98,95
99,07
Ley de
Corte ZC
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
y mayor
Frecuencia
Acumulada
22
22
21
20
19
19
16
14
12
11
11
11
10
10
10
9
9
%
Z(u) > ZC
99,07
99,12
99,16
99,20
99,20
99,33
99,41
99,49
99,54
99,54
99,54
99,58
99,58
99,58
99,62
99,62
100,00
Histograma acumulado
Frecuencia acumulada
100%
80%
60%
40%
20%
0%
0
Clase
Simulacin Geoestadstica
16
F(x) = f ( y )dy
Estadsticas bsicas
Los datos experimentales slo permiten construir el histograma, mediante el cual,
se pueden estimar algunos parmetros de la distribucin de la poblacin real. El
histograma puede ser descrito por unos pocos estadsticos los que se dividen en
medidas de posicin, de dispersin y de forma.
Medidas de posicin:
Media m: corresponde al estimador de la media de la poblacin (parmetro de
la distribucin), y se calcula como el promedio aritmtico de los valores
experimentales z(u):
m=
1 n
z (u )
n =1
1
z (u )du
D D
Simulacin Geoestadstica
17
M = ( z (u n / 2 ) + z (u( n / 2)+1 ))
si n es par
si n es impar
Simulacin Geoestadstica
18
1 n
( z (u ) m) 2
n =1
2 =
1
( z (u ) ) 2 du
DD
= 2
Rango intercuartil (IQR): Otra medida til para describir la dispersin de los
valores observados es el rango intercuartil. Es la diferencia entre los cuartiles
superior e inferior y est dado por:
IQR = Q 3 Q 1
Al contrario que la varianza y la desviacin estndar, el rango intercuartil no utiliza
la media como centro de la distribucin y por esta razn se la prefiere cuando
algunos valores errticos influencian fuertemente la media.
Coeficiente de variacin (CV): Este estadstico se utiliza para comparar la
dispersin de la distribucin relativa a la media (se asume aqu que se estudian
variables positivas), dividiendo el valor de la desviacin estndar por la media:
CVexp . =
s
m
CVpobl. =
Simulacin Geoestadstica
19
CV = 0.7
CV = 1.5
CV = 4.5
Para ilustrar estos casos, se presentan plantas de estos tres yacimientos con
diferentes grados de continuidad (Figura 8). A la izquierda, se muestra el
yacimiento tipo prfido cuprfero, cuya mineralizacin es bastante continua. A la
derecha arriba, el yacimiento de cobre de mediana variabilidad, donde se aprecia
que la mineralizacin es un poco ms discontinua. Y finalmente, debajo del
anterior se presenta el yacimiento de oro de alta variabilidad, donde se aprecia
una mineralizacin muy discontinua, con bolsones de alta ley extendidos
preferentemente en la direccin N 50E aproximadamente. Esta tendencia de la
variable a ser ms continua en una direccin que en otra, se denomina
anisotropa, y ser estudiada ms adelante.
Medidas de forma
Coeficiente de asimetra (skewness): Una caracterstica del histograma que los
estadsticos anteriores no capturan es su simetra. El estadstico ms utilizado
para referirse a la forma de una distribucin es la cantidad llamada coeficiente de
asimetra. En realidad, el trmino skewness se traduce como sesgo, y se entiende
como el hecho de que la media y la mediana no son iguales, por lo que el
histograma es asimtrico (lo que se presta a confusin pues el trmino sesgo se
utiliza principalmente para describir la diferencia entre la estimacin y la realidad).
Este coeficiente se define como:
1 n
( z (u ) m) 3
n
Coeficiente de asimetra = =1
s3
Simulacin Geoestadstica
20
este coeficiente dado que las diferencias entre los datos y la media estn elevadas
al cubo.
A menudo no se utiliza la magnitud de este coeficiente, sino que slo su signo
para describir la simetra (Figura 9). Un histograma positivamente sesgado tiene
una larga cola de valores altos hacia la derecha, haciendo que la mediana sea
menor que la media. En datos geoqumicos, asimetras positivas son tpicas
cuando la variable descrita es la concentracin de un elemento menor. Si se tiene
una larga cola de valores bajos hacia la izquierda y la mediana es mayor que la
media, lo que es tpico en el caso de concentraciones de elementos mayores, el
histograma ser negativamente asimtrico. Si el coeficiente es cercano a cero, el
histograma es aproximadamente simtrico y la mediana se parece a la media
(este es el caso de las distribuciones Gaussianas, por ejemplo).
Simulacin Geoestadstica
21
Frec.
Frec.
Mm
z(x)
Frec.
M
m
z(x)
mM
z(x)
Simulacin Geoestadstica
22
1
2
1 z
donde:
z es el valor observado
2 es la varianza de la poblacin
es la media de la poblacin
Y si se hace:
y=
1
2
y
2
G( y ) =
g( y) dy
Simulacin Geoestadstica
23
g(z)
G(z)1.0
0.40
0.9
0.35
0.8
0.30
0.7
0.25
0.6
0.20
0.5
0.4
0.15
0.3
0.10
0.2
0.05
0.1
0.00
0.0
0
10
12
14
16
10
12
14
16
Repasando los principales estadsticos para esta distribucin, se puede ver que si
se tienen n muestras, la media se estima simplemente con el promedio de los
datos:
1 n
z (u )
n =1
Sin embargo para estimar la varianza en el caso en que las muestras no estn
1
1
por
. Esto, para tener
correlacionadas, es necesario reemplazar el factor
n
n 1
un estimador insesgado de la varianza de la poblacin. De esta manera, la
varianza se estima a travs de la siguiente frmula:
2
1 n 2
Varianza de las muestras = s =
z (u ) z (u ) / n
n 1 =1
=1
[m s ; m + s]
Y el intervalo central de confianza a un 95% de probabilidad:
[m 1.96 s ; m + 1.96 s]
Simulacin Geoestadstica
24
g(z)
g(z)
0.40
0.40
0.35
0.35
0.30
0.30
0.25
0.25
0.20
0.20
68%
0.15
0.15
0.10
0.10
0.05
0.00
0
95 %
16%
2
10
12
14
16
0.00
0
2.5%
2.5%
0.05
16%
10
12
14
16
90 %
0.15
0.10
0.05
0
-4
-3
-2
-1
Simulacin Geoestadstica
y
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3
0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594
0,84134
0,86433
0,88493
0,90320
0,91924
0,93319
0,94520
0,95543
0,96407
0,97128
0,97725
0,98214
0,98610
0,98928
0,99180
0,99379
0,99534
0,99653
0,99744
0,99813
0,99865
0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859
0,84375
0,86650
0,88686
0,90490
0,92073
0,93448
0,94630
0,95637
0,96485
0,97193
0,97778
0,98257
0,98645
0,98956
0,99202
0,99396
0,99547
0,99664
0,99752
0,99819
0,99869
0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121
0,84614
0,86864
0,88877
0,90658
0,92220
0,93574
0,94738
0,95728
0,96562
0,97257
0,97831
0,98300
0,98679
0,98983
0,99224
0,99413
0,99560
0,99674
0,99760
0,99825
0,99874
25
0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381
0,84849
0,87076
0,89065
0,90824
0,92364
0,93699
0,94845
0,95818
0,96638
0,97320
0,97882
0,98341
0,98713
0,99010
0,99245
0,99430
0,99573
0,99683
0,99767
0,99831
0,99878
0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639
0,85083
0,87286
0,89251
0,90988
0,92507
0,93822
0,94950
0,95907
0,96712
0,97381
0,97932
0,98382
0,98745
0,99036
0,99266
0,99446
0,99585
0,99693
0,99774
0,99836
0,99882
0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894
0,85314
0,87493
0,89435
0,91149
0,92647
0,93943
0,95053
0,95994
0,96784
0,97441
0,97982
0,98422
0,98778
0,99061
0,99286
0,99461
0,99598
0,99702
0,99781
0,99841
0,99886
0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147
0,85543
0,87698
0,89617
0,91308
0,92785
0,94062
0,95154
0,96080
0,96856
0,97500
0,98030
0,98461
0,98809
0,99086
0,99305
0,99477
0,99609
0,99711
0,99788
0,99846
0,99889
0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398
0,85769
0,87900
0,89796
0,91466
0,92922
0,94179
0,95254
0,96164
0,96926
0,97558
0,98077
0,98500
0,98840
0,99111
0,99324
0,99492
0,99621
0,99720
0,99795
0,99851
0,99893
0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646
0,85993
0,88100
0,89973
0,91621
0,93056
0,94295
0,95352
0,96246
0,96995
0,97615
0,98124
0,98537
0,98870
0,99134
0,99343
0,99506
0,99632
0,99728
0,99801
0,99856
0,99896
0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891
0,86214
0,88298
0,90147
0,91774
0,93189
0,94408
0,95449
0,96327
0,97062
0,97670
0,98169
0,98574
0,98899
0,99158
0,99361
0,99520
0,99643
0,99736
0,99807
0,99861
0,99900
x
=1
2
.
n
Simulacin Geoestadstica
26
Adems, los lmites de confianza para la media, calculados con los datos
experimentales, pasan a ser los siguientes en el caso del 68% de probabilidad
central:
s
s
;m +
m
n
n
s
s
; m + 1.96
m 1.96
n
n
s
s
;m + t P
m t P
n
n
Para este clculo es necesario utilizar la Tabla 4, que entrega el valor de tP para
distintos grados de libertad, que corresponden a n-1, siendo n el nmero de datos.
Ejemplo:
Se tiene un conjunto de 20 datos con media 2 y varianza 4, y se quiere determinar
el intervalo de confianza central para la media a 90 % de probabilidad. Utilizando
la tabla anterior, se determina que para un 90 % de probabilidad central, se debe
buscar el valor de tP que acumule el 95 % de probabilidad, con 19 grados de
libertad (n-1). Con esto, se obtiene tP = 1,7291. Luego, el intervalo de confianza
central para la media ser:
s
s
2
2
;m + t P
; 2 + 1,7291
= [1,226 ; 2,773]
m t P
= 2 1,7291
n
n
20
20
Simulacin Geoestadstica
Grados de
libertad
n-1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
30
40
50
100
1000000
27
1-p
80 %
90 %
95 %
97,5 %
1,3764
1,0607
0,9785
0,9410
0,9195
0,9057
0,8960
0,8889
0,8834
0,8791
0,8755
0,8726
0,8702
0,8681
0,8662
0,8647
0,8633
0,8620
0,8610
0,8600
0,8591
0,8583
0,8575
0,8569
0,8562
0,8538
0,8507
0,8489
0,8452
0,8416
3,0777
1,8856
1,6377
1,5332
1,4759
1,4398
1,4149
1,3968
1,3830
1,3722
1,3634
1,3562
1,3502
1,3450
1,3406
1,3368
1,3334
1,3304
1,3277
1,3253
1,3232
1,3212
1,3195
1,3178
1,3163
1,3104
1,3031
1,2987
1,2901
1,2816
6,3137
2,9200
2,3534
2,1318
2,0150
1,9432
1,8946
1,8595
1,8331
1,8125
1,7959
1,7823
1,7709
1,7613
1,7531
1,7459
1,7396
1,7341
1,7291
1,7247
1,7207
1,7171
1,7139
1,7109
1,7081
1,6973
1,6839
1,6759
1,6602
1,6449
12,7062
4,3027
3,1824
2,7765
2,5706
2,4469
2,3646
2,3060
2,2622
2,2281
2,2010
2,1788
2,1604
2,1448
2,1315
2,1199
2,1098
2,1009
2,0930
2,0860
2,0796
2,0739
2,0687
2,0639
2,0595
2,0423
2,0211
2,0086
1,9840
1,9600
Simulacin Geoestadstica
donde y C =
28
xC
Ahora, la ley media sobre dicha ley de corte, est dada por:
( z > z C ) = +
2
yC
e 2
2 G( y C )
Ejemplo:
Se tiene un yacimiento donde la ley sigue una distribucin normal de media = 5 y
desviacin estndar = 2. Se quiere determinar el tonelaje y la ley media sobre
una ley de corte zC = 3.
Primero, se pasa la ley de corte a una normal (0,1), restando la media y dividiendo
por la desviacin estndar:
yC =
zC 3 5
=
= 1
g(z)
g(z)
0.40
0.40
0.35
0.35
0.30
0.30
0.25
0.25
0.20
0.20
84.13%
0.15
0.10
0.10
0.05
0.05
-4
-3
-2
-1
84.13%
0.15
-4
-3
-2
-1
Simulacin Geoestadstica
29
( z > z C ) = +
( z > 3) = 5 +
( z > 3) = 5 +
2
yC
e 2
2 G( y C )
( 1) 2
e 2
2 G( 1)
2
0.6065
2.5066 0.84134
( z > 3) = 5.5752
En resumen, para el yacimiento cuya distribucin de leyes es normal de media 5 y
desviacin estndar 2, el tonelaje sobre una ley de corte de 3 corresponde al
84,13 %, con una ley media de 5,5752.
Grfico de probabilidad normal
Simulacin Geoestadstica
30
g( z) =
1
2 ln( z + )
1
e
z+
1 ln( z + )
2 ln( z + )
Simulacin Geoestadstica
31
donde:
z es el valor observado
es la media de los ln(z+)
ln(z+) es la desviacin estndar de los ln(z+)
es la constante aditiva de la distribucin lognormal
La Figura 15 muestra la densidad de probabilidad y densidad acumulada de una
distribucin lognormal.
g(z)
G(z)
0.35
1.0
0.9
0.30
0.8
0.25
0.7
0.6
0.20
0.5
0.15
0.4
0.3
0.10
0.2
0.05
0.00
0.1
0.0
10
10
Si se hace x = ln(z+), se obtiene una distribucin normal para x, por lo que todos
los clculos vistos para este tipo de distribucin vuelven a ser vlidos para esta
nueva variable.
g( x ) =
1
2 ln( z + )
1 x
2 ln( z + )
Media aritmtica:
Media geomtrica:
2
ln(
z + )
2
=e
M.G. = e
= (M.G. + ) e
Simulacin Geoestadstica
32
Adems:
2
e ln( z + )
2z = ( + ) 2 (e
2
ln(
z +)
1)
2
+
ln( z + )
1
z + ln( z + )
ln C
G
ln(
z
)
( z > z C ) =
1
z + ln( z + )
+
G
ln C
ln(
z
)
( + )
Ejemplo:
Se tiene un depsito aurfero de potencia variable, cuya acumulacin sigue una
distribucin de probabilidades lognormal de media 1015 cm*g/t y la desviacin
estndar de los ln(z+) es 1,3. La constante aditiva de la distribucin es = 60
cm*g/t. Se quiere determinar el tonelaje (en porcentaje) y la acumulacin media
sobre una ley de corte zC = 500 cm*g/t.
Utilizando primero la frmula para el tonelaje, se tiene:
1
z + ln( z + )
+
%( z > z C ) = G
ln C
2
+
ln( z + )
1015 + 60 2
Simulacin Geoestadstica
33
2
+
ln( z + )
( z > z C ) =
1
z + ln( z + )
+
G
ln C
2
+
ln( z + )
( + )
1
500 + 60 1,3
G
ln
G( 1,15)
1,3 1015 + 60 2
(1015 + 60) 60 =
1075 60
( z > 500) =
G(0,15)
1
500 + 60 1,3
G
ln
+
1,3 1015 + 60 2
g(z)
g(z)
0.40
0.40
0.35
0.35
0.30
0.30
0.25
0.25
0.20
0.20
87.49%
0.15
0.10
0.10
0.05
0.05
-4
-3
-2
-1
87.49%
0.15
-4
-3
-2
-1
De la tabla, se obtiene (Figura 16) que G(1,15) = 0,87493, que representa el rea
bajo el valor 1,15 (figura de la izquierda), y se quiere obtener el rea sobre G(1,15) (figura de la derecha), por lo tanto el valor recin obtenido es equivalente al
buscado, y finalmente:
( z > 500) =
0,87493
1075 60 = 2077
0,44038
Simulacin Geoestadstica
34
Al igual que el grfico de probabilidad normal, este grfico permite detectar si una
distribucin es lognormal o no.
Usando ahora escala logartmica en el eje X, correspondiente a la ley de corte, y
conservando la escala probabilstica en el eje Y, asociado a la frecuencia
acumulada, se puede verificar la lognormalidad si se obtiene una recta (Figura
17).
Simulacin Geoestadstica
35
Tal como poda suponerse, el histograma presenta dos modas (una muy cercana
a 0 y la otra alrededor de 0,8), lo que confirma que el quiebre en la curva del
grfico de probabilidad se deba a la presencia de ms de una poblacin. Como se
puede suponer, el estudio de esta clase de hechos debe hacerse cuidadosamente
en cada caso de manera de poder determinar el origen de estas variaciones en las
curvas de probabilidad.
Simulacin Geoestadstica
36
5. ANLISIS BIVARIABLE
Las herramientas anteriores permiten tener un conocimiento bastante acabado de
una poblacin de datos (variable regionalizada). Sin embargo, en un mismo
dominio puede existir ms de una poblacin de inters. Puede ocurrir que se
tengan datos de la misma variable medidos de diferentes maneras (a travs de
dos campaas de sondajes diferentes) o en distintos soportes, o bien, que exista
ms de una variable regionalizada de inters (por ejemplo, puede interesar la
acumulacin y la potencia, o la ley de oro y de plata en una veta, etc.). Por esta
razn, puede ser interesante verificar si las distribuciones son independientes, si
estn correlacionadas, o si son iguales, en el caso en que se estudia la misma
variable medida de distintas formas.
El primer anlisis que debe hacerse es la comparacin entre las estadsticas
bsicas (media, varianza, cuartiles,...) de las variables en estudio (para simplificar
hablaremos slo de dos variables, pero todos los anlisis son extensivos a
cualquier nmero de variables).
Dos histogramas parecidos indican que las distribuciones se parecen, pero no
indica que exista alguna relacin espacial entre ellas.
Grfico de dispersin o Scatterplot
El grfico de dispersin corresponde al tpico despliegue de los pares ordenados,
considerando una distribucin en cada eje del grfico. Es la forma ms sencilla de
comparar dos distribuciones, pues adems de dar una buena idea del
comportamiento de ambas variables, nos permite determinar si existe alguna
correlacin entre ellas, junto con ser una herramienta muy til para detectar
valores aberrantes.
A continuacin se presenta un tpico grfico de dispersin (Figura 20), donde se
puede ver que las dos variables presentadas estn fuertemente correlacionadas,
lo que puede cuantificarse utilizando las herramientas que se entregan ms
adelante.
Simulacin Geoestadstica
37
Grfico de Dispersin
2,5
Variable 2
1,5
0,5
0
0
0,5
1,5
2,5
Variable 1
Simulacin Geoestadstica
38
Sondaje N1
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Ley
0.02
0.03
0.05
0.07
0.07
0.10
0.12
0.15
0.20
0.20
0.22
0.28
0.29
0.35
0.36
Sondaje N2
% Acum.
3.33
6.67
10.00
13.33
16.67
20.00
23.33
26.67
30.00
33.33
36.67
40.00
43.33
46.67
50.00
N
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Ley
0.40
0.50
0.52
0.61
0.66
0.85
1.03
1.10
1.20
1.32
1.40
1.42
1.50
1.53
1.55
% Acum.
53.33
56.67
60.00
63.33
66.67
70.00
73.33
76.67
80.00
83.33
86.67
90.00
93.33
96.67
100.00
N
1
2
3
4
5
6
7
8
9
10
Ley
0.01
0.02
0.04
0.08
0.12
0.15
0.35
0.52
0.78
0.96
% Acum.
5.00
10.00
15.00
20.00
25.00
30.00
35.00
40.00
45.00
50.00
N
11
12
13
14
15
16
17
18
19
20
Ley
1.02
1.02
1.10
1.15
1.20
1.22
1.24
1.25
1.27
1.29
% Acum.
55.00
60.00
65.00
70.00
75.00
80.00
85.00
90.00
95.00
100.00
1,4
Sondaje 2 (%Cu)
1,2
0,8
0,6
0,4
0,2
0
0
0,2
0,4
0,6
0,8
1,2
1,4
1,6
Sondaje 1 (%Cu)
Simulacin Geoestadstica
39
cualquiera con los de una normal o los de una lognormal, para verificar si son
iguales.
La similitud entre una poblacin y un modelo terico de distribucin normal o
lognormal se mide por la rectitud de los puntos en el grfico de probabilidad
respectivo.
Correlacin
Aunque el grfico de dispersin permite detectar la relacin que existe entre dos
variables, es necesario poder cuantificar qu tan buena es la correlacin. En
general, se pueden presentar tres casos que relacionen las dos variables:
correlacin positiva, correlacin negativa e inexistencia de correlacin.
Se considera una correlacin positiva si los valores altos de una variable estn
asociados a los valores altos de la otra, y los bajos de la primera lo estn tambin
con los bajos de la segunda. En un grfico de dispersin, esta situacin se detecta
como una nube de puntos elptica, cuyo radio mayor tiene pendiente positiva. Un
caso comn podra ser la comparacin entre la concentracin de dos elementos
presentes en una misma mineralizacin.
La correlacin negativa corresponde al caso donde valores altos de una variable
estn relacionados con valores bajos de la otra y viceversa. En este caso, la nube
de puntos tiene su eje mayor con pendiente negativa. Esto puede ocurrir en el
caso en que un elemento reemplaza a otro en una mineralizacin.
Finalmente, el caso en que no existe correlacin corresponde a aquel en que las
variables no estn relacionadas de ninguna manera. En el grfico de dispersin,
los pares ordenados generan una nube de puntos circular, sin un eje mayor
pronunciado.
Para cuantificar la relacin que existe entre dos variables se utiliza el coeficiente
de correlacin , el cual se calcula de la siguiente forma:
1 n
( z 1 m Z1 )( z 2 m Z 2 )
n =1
=
Z1 Z 2
donde
n es el nmero de datos.
los z 1 corresponden a los valores medidos para la primera variable.
Simulacin Geoestadstica
40
= 0,73
= -0,68
X
Simulacin Geoestadstica
41
Caso 1
Caso 2
Y
=1
= 0,68
Caso 3
Caso 4
Y
=0
=0
Caso 6
Caso 5
Y
Y
= -0,87
= -1
Simulacin Geoestadstica
42
Probabilidad
0,1
0,988
0,900
0,805
0,729
0,669
0,621
0,582
0,549
0,521
0,497
0,476
0,457
0,441
0,426
0,412
0,400
0,398
0,378
0,369
0,360
0,323
0,296
0,275
0,257
0,243
0,231
0,211
0,195
0,183
0,173
0,164
0,05
0,997
0,950
0,878
0,811
0,754
0,707
0,666
0,632
0,602
0,576
0,553
0,532
0,514
0,497
0,482
0,468
0,456
0,444
0,433
0,423
0,381
0,349
0,325
0,304
0,287
0,273
0,250
0,232
0,217
0,205
0,195
0,02
0,999
0,980
0,934
0,882
0,833
0,789
0,750
0,716
0,685
0,658
0,634
0,612
0,592
0,574
0,558
0,543
0,528
0,516
0,503
0,492
0,445
0,409
0,381
0,358
0,338
0,322
0,295
0,274
0,256
0,242
0,230
0,01
1,000
0,990
0,959
0,917
0,874
0,834
0,798
0,765
0,735
0,708
0,684
0,661
0,641
0,623
0,606
0,590
0,575
0,561
0,549
0,537
0,487
0,449
0,418
0,393
0,372
0,354
0,325
0,302
0,283
0,267
0,254
0,001
1,000
0,999
0,992
0,974
0,951
0,925
0,898
0,872
0,847
0,823
0,801
0,780
0,760
0,742
0,725
0,708
0,693
0,679
0,665
0,652
0,597
0,554
0,519
0,490
0,465
0,443
0,408
0,380
0,357
0,337
0,321
Resulta interesante poder estimar una variable utilizando otra, cuando ambas
estn relacionadas, es decir, cuando tienen un coeficiente de correlacin
significativo. Para esto, se utiliza la regresin lineal, que permite estimar una
variable con otra conocida, mediante la lnea de regresin que minimiza la suma
de los errores al cuadrado.
Sean Z1 y Z2 dos variables con distribucin normal:
Z 1 ~ N( Z1 , 2Z1 )
Z 2 ~ N( Z 2 , 2Z 2 )
Simulacin Geoestadstica
43
Z1Z 2
Z1 Z 2
presentan en la Tabla 7.
Descripcin
Parmetro de la
Poblacin
Media de Z1
Z1
m Z1 =
Media de Z2
Z2
m Z2
Varianza de Z1
2Z1
Varianza de Z2
2Z 2
Covarianza de Z1 y Z2
Z1Z 2
Coeficiente de
Correlacin
Z1Z 2
1 n
z1
n =1
1 n
= z2
n =1
1 n
( z 1 m Z1 ) 2
n 1 =1
1 n
s 2Z 2 =
(z 2 m Z2 ) 2
n 1 =1
1 n
=
(z 1 m Z1 )(z 2 m Z2 )
n 1 =1
s Z1Z 2
rZ1Z 2 =
s Z1 s Z 2
s 2Z1 =
s Z1Z 2
s Z2
s Z1
b = m Z 2 rZ1Z 2
s Z2
s Z1
m Z1
Simulacin Geoestadstica
44
2Z 2 / Z1 = 2Z 2 (1 r 2 )
z 1
2Z1 / Z 2 = 2Z1 (1 r 2 )
z 2
7
4
Variable z1
Variable z 2
K1
1
1
7
6
Lnea de
regresin
5
de z 2 en z 1
4
3
Lnea de regresin
de z 1 en z 2
M
0
1
7
10
Variable z1
4
9
9
15
11
12 0
15
20 20
Coeficiente de
Correlacin
r = 0,5
15
12
15
31 31
Distribucin Marginal (Global) de
z2
Media = 5
2
Z2 = 1,334
Z2 = 1,155
11
10
4a. Columna
8a. Columna
Ejemplos de distribuciones
en columnas verticales
La media corresponde a la
de la lnea KL de regresin
2
2
2
Z2/Z1 = Z2 (1-r ) = 1,00
Variable z 2
1
9
Simulacin Geoestadstica
45
Regresin lognormal
ln( Z 2 + Z 2 ) ~ N( Z 2 ,
2
ln( z 2 + Z 2 )
donde:
Z1 es la media de los ln( z1 + Z1 )
2
ln(
z 1 + Z1 ) es la varianza de los ln( z1 + Z 1 )
2
ln(
z 2 + Z2 ) es la varianza de los ln( z 2 + Z 2 )
se tiene que las ecuaciones para la regresin normal siguen siendo vlidas, pero
la recta de regresin es:
ln( z2 + Z 2 ) = Z 2 + r
sZ 2
sZ 1
ln( z1 + Z1 ) Z1 +
1 2
Z2 1 r 2
2
o bien,
sZ
1
ln( z2 + Z 2 ) = ln(mz2 + Z ) + r sZ 2 ( sZ1 r sZ 2 ) + r 2 ln( z1 + Z1 ) ln(mz1 + Z )
1
2
2
sZ1
Ejemplo:
Se presenta el caso del horizonte basal de la mina Harmony del Orange Free
State en Sudfrica, donde se dispona de la tabla de correlacin presentada en la
Figura 25 para bloques explotados que previamente haban sido estimados (se
considera que ambas distribuciones son lognormales con constante aditiva =
20). Las leyes estimadas de bloques se determinaron utilizando muestras
obtenidas en chimeneas en la periferia de los bloques, mientras que las leyes
reales se obtuvieron de muestras tomadas al interior de los bloques durante su
explotacin. Al interior de cada celda se presenta la frecuencia, es decir, el
nmero de bloques en cada intervalo.
Simulacin Geoestadstica
46
1102
36
68
14
52 120
60
23
85
35
12
6,33
5,87
5,41
4,95
6,79
688
427
262
158
92
4,49
51
92
158
262
427
688
1102
1758
4,95
5,41
5,87
6,33
6,79
7,25
Frec.
4
1
5
23
3
12
85
52
4
1
35
Frec.
120
36
1
8
60
68
7
5
14
4
2
1 = ln( z 1 + )
2 = ln( z 2 + )
Con esto, se tiene:
m 1 = 5,84
Simulacin Geoestadstica
47
m 2 = 5,83
s
2
1
1 n
1 n
n
2
2
= 0,221
(
m
)
f
f
/
n
=
1
1
1
1
n 1 =1
n 1 =1
=1
2
2
1 n
1 n
n
2
2
( 2 m 2 ) =
f 2 f 2 / n = 0,157
=
n 1 =1
n 1 =1
=1
s 1 2 =
=
r1 2 =
1 n
( 1 m 1 )( 2 m 2 )
n 1 =1
n
1 n
n
f 1 2 f 1 f 2 / n = 0,123
n 1 =1
=1
=1
s 1 2
s 1 s 2
= 0,660
sZ2
s Z1
ln(z 1 + Z 1 ) Z1 +
1
2Z2 1 r 2
2
0,396
1
(ln( z 1 + 20 ) 5,84 ) + 0,157 1 0,660 2
0,470
2
As, para bloques que se haban estimado con una ley de 100 cm*g/t, se obtuvo
en realidad una media de:
ln( z 2 + 20) = 0,556 ln(100 + 20) + 2,626 z 2 = 178 cm * g / t
(Subestimacin)
Por otro lado, para bloques estimados como de alta ley, por ejemplo, 800 cm*g/t,
se obtuvo:
ln( z 2 + 20) = 0,556 ln(800 + 20) + 2,626 z 2 = 556 cm * g / t
(Sobrestimacin)
Simulacin Geoestadstica
48
sZ
z 2 = z 1 r 2
sZ
1
s
+ m 1 r Z 2
s Z1
Valores
perifricos
Otros valores
en el sector
Simulacin Geoestadstica
Peso
49
Peso
Peso
Periferia
Periferia
Periferia
Media de todos
los valores
externos
Media de valores
cercanos a la
periferia
Valores externos
con pesos
decrecientes
Simulacin Geoestadstica
50
6. EVALUACIN GLOBAL
Con las herramientas de anlisis exploratorio vistas hasta ahora, se puede obtener
el conocimiento bsico de la variable de inters. Ahora, para iniciar el estudio de
recursos disponibles, se debe comenzar con una estimacin global de la variable
regionalizada. Esto se puede realizar, por ejemplo, determinando la media. Las
muestras existentes permitirn estimar la distribucin real de la variable en el
yacimiento, sin embargo, en muchos casos, el muestreo es preferencial en
aquellas zonas que resultan ms interesantes, es decir, se tiene una mayor
densidad de muestras, lo que distorsiona el histograma global.
Por esta razn, se utilizan mtodos de declusterizacin (del ingls, cluster, que
significa grupo) que permiten obtener una distribucin representativa del
yacimiento.
Para desagrupar existen tres metodologas:
Uno de los problemas de este mtodo est en la definicin de los bordes del
campo (que generalmente no es muy clara), producindose una diferencia
importante en la estimacin global, segn los bordes que se hayan definido de
la mineralizacin.
Simulacin Geoestadstica
51
Simulacin Geoestadstica
52
Simulacin Geoestadstica
53
Simulacin Geoestadstica
54
Simulacin Geoestadstica
55
Hiptesis de ergodicidad
Se debe asumir la hiptesis de ergodicidad para hacer la inferencia estadstica,
que en trminos simples considera que no es necesario tener muchas
realizaciones de la funcin, sino que se pueden considerar los numerosos valores
obtenidos de una sola realizacin para caracterizarla. Para esto, se requiere un
dominio D de tamao suficientemente grande, de manera que la media espacial
de la realizacin converja a la esperanza estacionaria de la funcin aleatoria.
Hiptesis de estacionaridad
Adems de la hiptesis de ergodicidad, es necesario definir el comportamiento de
los dos primeros momentos que se requiere estimar, lo que podra considerarse
como una caracterizacin de la homogeneidad espacial de la variable:
Hiptesis de estacionaridad estricta: Se dice que una funcin aleatoria es
estacionaria en un sentido estricto, cuando su ley espacial es invariante por
traslacin. Es decir, cuando todos los sectores del campo tienen las mismas
caractersticas estadsticas, o sea, sus momentos, si existen, son todos iguales.
Sin embargo, esta hiptesis es muy fuerte y en geoestadstica, se puede restringir
a los dos primeros momentos (que son aquellos que podemos inferir).
Hiptesis de estacionaridad de segundo orden: Una funcin aleatoria Z(x) es
estacionaria de segundo orden cuando su esperanza matemtica existe y no
depende del punto x, y cuando para cualquier par de valores {Z(x),Z(x+h)} la
covarianza existe y slo depende del vector h:
E [Z (u )] = m
independiente de u
slo depende de h
Simulacin Geoestadstica
56
14
zona
pobre
12
20
10
z(x)
z(x)
15
10
5
0
zona rica
0
200
global
400
4
2
20
40
local
1) E [ Z (u + h) Z (u ) ] = 0
2) var ianza { Z (u + h) Z (u ) } = 2 (h) no depende ms que de h
Hiptesis casi-intrnseca: Al igual que en el caso casi-estacionario, esta
definicin pasa por la escala de trabajo adoptada. Se dir que una funcin
aleatoria es casi-intrnseca si el variograma (u,u+h) slo depende de h cuando
este valor es menor a un radio local, es decir, cuando es localmente estacionario.
En el siguiente ejemplo (Figura 33) se muestra una variable cuyos datos brutos no
son estacionarios, ni intrnsecos. Al calcular los crecimientos de los datos, es
decir, las diferencias entre un valor y el anterior, se aprecia que la media de los
crecimientos es constante, sin embargo, su dispersin en torno a sta es irregular.
Si se considera el logaritmo de los datos brutos, se aprecia a simple vista que si
bien la media no permanece constante, la variabilidad en torno a las medias
Simulacin Geoestadstica
57
1.5
3.5
0.5
2.5
2
-0.5
1.5
-1
-1.5
0.5
0
100
200
300
400
500
-2
0
datos brutos
0.4
0.6
0.3
0.4
0.2
0.2
0.1
-0.2
-0.1
-0.4
-0.2
-0.6
-0.3
100
200
300
200
300
400
500
0.8
-0.8
0
100
400
500
-0.4
0
100
200
300
400
500
Simulacin Geoestadstica
58
Ley Espacial
Recordando que se considera la variable regionalizada z(u) como una realizacin
particular de una funcin aleatoria Z(u), entonces, cmo inferir la ley espacial de
esta funcin aleatoria, si slo se dispone de una realizacin nica?
La ley espacial corresponde al conjunto de funciones de distribucin de cualquier
vector de variables aleatorias, dada una funcin aleatoria. Sin embargo, no es
necesario conocer todos los parmetros de la ley espacial, puesto que los
momentos de orden superior a dos tienen una utilidad cuestionable (resultan
difciles de estimar y son cada vez menos importantes).
Los dos primeros momentos que sern de utilidad para caracterizar la funcin que
representa el fenmeno regionalizado en estudio, son los siguientes:
Esperanza matemtica o momento de primer orden: Sea Z(u0) una variable
aleatoria definida en el punto u0. Si la funcin de distribucin de Z(u0) tiene una
esperanza, esta esperanza es una funcin de u0 y se escribe:
E (Z (u0 ) ) = m(u0 ) .
La esperanza de la variable aleatoria Z(u0) en un punto u0 dado es un valor
numrico que representa la media alrededor de la cual los valores de Z(u0) se
distribuyen segn la ley de probabilidad P de Z(u0).
Momentos de segundo orden: se utilizan principalmente los siguientes:
varianza 2(u), o varianza a priori de Z(u): cuando existe, est definida como el
momento de segundo orden de la variable aleatoria Z(u) de esperanza m(u):
Simulacin Geoestadstica
59
La covarianza permite tener una visin elemental de la relacin que existe entre
Z(u1) y Z(u2). En particular, si se relaciona una variable consigo misma, se tendr:
C (u1 , u1 ) = 2 (u1 ) , varianza a priori de Z(u1).
La desigualdad de Cauchy-Schwarz permite relacionar la covarianza entre Z(u1) y
Z(u2) con las varianzas de Z(u1) y Z(u2):
C (u1 , u 2 ) 2 (u1 ) 2 (u 2 ) .
(u1 , u2 ) =
1
var ianza (Z (u1 ) Z (u 2 ) ) .
2
C (u1 , u 2 )
(u1 ) 2 (u 2 )
2
Simulacin Geoestadstica
60
(u, h) =
1
2
E [Z (u ) Z (u + h)]
2
Considerando el caso general, el variograma (u, h ) es una funcin tanto del punto
u , como del vector h . Luego, la estimacin de este variograma requiere de varias
realizaciones, [z k (u ), z k (u + h )], [z k ' (u ), z k ' (u + h )],..., [z k '' (u ), z k '' (u + h )] , del par de
variables aleatorias [Z (u ), Z (u + h )] . Ahora, en la prctica, al menos en aplicaciones
mineras, slo una de tales realizaciones [z (u ), z (u + h)] est disponible y
corresponde al par de valores medidos en los puntos u y u + h . Como se
explicara antes, para solucionar este problema, se introduce la hiptesis
intrnseca. Esta hiptesis es que la funcin variograma (u , h ) depende slo del
vector de separacin h (mdulo y direccin) y no de la posicin u . Es posible
Simulacin Geoestadstica
61
* (h) =
1 N (h )
[z (u ) z (u + h)]2 ,
2 N (h) =1
[z (u ), z (u + h)]
de datos
El variograma es simtrico:
(h) = ( h)
Se anula en el origen:
(0 ) = 0
Es positivo o nulo:
(h) 0
En el infinito, el variograma crece menos rpido que una parbola.
Toda suma de variogramas es un variograma
El producto de variogramas no es necesariamente un variograma
Simulacin Geoestadstica
62
Simulacin Geoestadstica
63
Paso 0
hH
Paso 1
Paso 2
Paso 3
Paso 4
Simulacin Geoestadstica
64
12
11
1 n( h)
mcola =
z (u )
n(h) =1
1 n(h)
mcabeza =
z (u + h)
n(h) =1
n( h)
1
2
2
scola =
( z (u ) mcola )
n(h) 1 =1
n( h)
1
2
( z (u + h) mcabeza )
n(h) 1 =1
2
scabeza
=
C ( h) =
r(h) =
C(h)
s cabeza s cola
( h) =
n(h)
1
2
(z (u ) z (u + h) )
2 n(h) =1
n( h)
1
( z (u ) mcola ) ( z (u + h) mcabeza )
n(h) 1 =1
Simulacin Geoestadstica
65
n(h)
10
7
6
6
mcabeza
6,300
7,286
7,500
7,333
s2cabeza
11,344
10,950
13,900
13,867
mcola
6,300
6,143
6,500
6,333
s2cola
11,344
9,476
13,100
19,067
C(h)
11,344
7,619
4,300
-1,733
r(h)
1,00
0,75
0,32
-0,11
(h)
0,000
2,859
8,167
15,667
11,344
10,000
12,00
10,00
8,00
6,00
8,000
Varianza
=11,344
8,17
0,000
-2,000 0
0,00
0,00
0
4,300
4,000
2,000
2,86
4,00
2,00
7,619
6,000
C(h)
(h)
12,000
15,67
16,00
14,00
3 -1,733
-4,000
Distancia h (m)
Distancia h (m)
1,00
r(h)
0,80
0,75
0,60
0,40
0,32
0,20
0,00
-0,20
3 -0,11
Distancia h (m)
Puede ser, por ejemplo, que se estudie una variable estacionaria, caso en el
cual, el variograma tender a estabilizarse para una determinada distancia,
llamada alcance, en un valor que debera corresponder a su varianza a priori (la
Simulacin Geoestadstica
66
C(0)=2
C(h)
(h)
alcance a
Simulacin Geoestadstica
67
(h)
Efecto pepita (discontinuo): en este caso se tiene que cuando |h| tiende a 0,
(h) no tiende a 0, es decir, dos puntos muy cercanos presentan una
correlacin baja, lo que se puede deber a la existencia de mineralizacin
discontinua (en pepitas por ejemplo, como es el caso del oro, de donde este
comportamiento obtuvo su nombre), o bien, debido a que la escala de trabajo
impide ver la presencia de una estructura (variograma) de muy corto alcance.
Adems errores de muestreo, de preparacin de muestras, de anlisis qumico,
etc. tambin se reflejan en este valor.
Simulacin Geoestadstica
68
(h)
parablico
(h)
lineal
(h)
(h)
C0
efecto pepita
C0
0
(h) =
C
para h = 0
para h > 0
(h)
Simulacin Geoestadstica
69
3 h 1 h3
C
(h) = 2 a 2 a 3
para 0 h a
(h)
para h a
2a/3
h
(h) = C 1 exp
a
(h)
3a
h 2 35 h 3 7 h 5 3 h 7
C 7
(h) = a 2
4 a3 2 a5 4 a7
para 0 h a
para h a
Simulacin Geoestadstica
70
(h)
C
0.95 C
h2
(r ) = C 1 exp 2
a
(h)
a 3
Simulacin Geoestadstica
71
1.212 C
sin ( h a )
(h) = C 1
h
a
4,493 a
20,371 a
Modelos sin meseta: Estos modelos salen del marco estacionario de segundo
orden. Corresponden a funciones aleatorias intrnsecas estrictas.
Potencia de parmetros y :
= 1,5
=1
(h) = h
= 0,5
(h)
(h) = h
Mapa variogrfico
Simulacin Geoestadstica
72
Simulacin Geoestadstica
73
Simulacin Geoestadstica
74
(h)
d1
d2
ad1
ad2
Simulacin Geoestadstica
75
v()
Simulacin Geoestadstica
76
q' = a q b
donde
a=
CV 2 + 1
m
f CV 2 + 1
b=
ln( f CV 2 + 1)
ln(CV 2 + 1)
Correccin de la media
m
q'
m'
donde q' ' es el cuantil corregido final y m' la media obtenida despus del paso
anterior.
q' ' =
Simulacin Geoestadstica
77
Simulacin Geoestadstica
78
Variogramas cruzados
Cuando se tiene ms de una variable, la informacin contenida en las mediciones
de una variable puede ayudar a estimar o simular otras variables, siempre que
stas estn correlacionadas. Para medir la relacin entre dos variables, se puede
construir un variograma cruzado. Este se define como el producto de las
diferencias entre los valores obtenidos para la primera y segunda variables en dos
puntos separados por una distancia dada:
XY (h) =
1
E{( X (u ) X (u + h))(Y (u ) Y (u + h))}
2
Como puede verse, para calcular el variograma cruzado se requiere tener ambas
variables medidas en los mismos puntos. Esto puede ser una limitacin para su
inferencia, sin embargo, algunas formas de superar este problema han sido
propuestas.
El variograma cruzado lucir como el variograma directo, sin embargo, el primero
puede ser negativo si la correlacin entre ambas variables lo es. La meseta en el
caso del variograma directo corresponde a la varianza de la poblacin. En el caso
de los variogramas cruzados, sta corresponde al coeficiente de correlacin lineal
existente entre las dos variables.
Tambin resulta interesante notar que el variograma cruzado a una distancia cero
es, al igual que el variograma, nulo, dado que depende de una diferencia de la
misma variable medida en dos puntos. Si el punto es el mismo, la diferencia es
cero, haciendo que por definicin el valor del variograma directo y cruzado a una
distancia h=0, sea cero.
Simulacin Geoestadstica
79
XX (h) = b
0
XX
NST
i
+ b XX
i (h)
i =1
NST
0
i
XY (h) = b XY
+ b XY
i (h)
i =1
NST
0
i
YY (h) = bYY
+ bYY
i (h)
i =1
>0
b XX
i
bYY > 0
i
i
i
i
2
b XX bYY (b XY )
Como puede verse, las restricciones implican que las contribuciones deben ser
todas positivas (puesto que se trata de varianzas), y que la contribucin de una
estructura al variograma cruzado debe ser menor que la raz cuadrada del
producto de las contribuciones de la misma estructura a los dos variogramas
directos.
Como se ver ms adelante, tambin existe el modelo de Markov de
corregionalizacin, que asume que la muestra secundaria ubicada exactamente en
el punto a estimar apantalla todas las otras muestras secundarias, por lo que slo
se requiere el use de esta muestra secundaria colocada.
Simulacin Geoestadstica
80
9. EVALUACIN LOCAL
Mtodos de estimacin clsicos
Polgonos: El mtodo de los polgonos de influencia consiste simplemente en
ponderar el valor de la variable en cada
D
punto por el rea o volumen de
influencia. En tres dimensiones, el
z(u)
procedimiento de clculo consiste en
S
crear una malla fina de nodos y asignar
a cada uno, el valor de la muestra ms
cercana. De esta manera, se pueden
realizar estimaciones tanto globales,
como locales. Para realizar con este
mtodo una estimacin global se
requiere tener bien delimitado el campo
de estudio.
Figura 53: Estimacin por polgonos.
Estimacin local:
z(u) = z(u)
donde
u es el punto ms cercano a u
z(u) es el valor de la variable en el punto muestreado u
Estimacin global:
m=
1
V
V z (u )
=1
donde
V = | D| corresponde al volumen total del dominio
V es el volumen de influencia de la muestra ubicada en el punto u
z(u) es el valor de la variable en el punto muestreado u
Inverso de la distancia: este mtodo sirve para realizar estimaciones locales y
consiste en ponderar las muestras cercanas al punto a estimar por el inverso de la
distancia elevado a alguna potencia (en general, entre 1 y 2). La suma de todas
las muestras ponderadas, dividida por la suma de los ponderadores entrega el
valor estimado en el punto que se quera estimar.
Simulacin Geoestadstica
81
D
z(u)
d
Estimacin local:
z (u )
dp
z (u ) = =n1( u )
1
p
=1 d
donde:
n(u) corresponde al nmero de muestras utilizadas para estimar el punto u,
que puede estar definido por un radio de bsqueda, por ejemplo.
p es la potencia a la que se eleva el inverso de la distancia y que en general
est entre 1 y 2.
z(u) es el valor de la variable en el punto muestreado u
Relacin entre la varianza y el tamao del dominio
Se puede determinar la relacin existente entre la varianza y el tamao del
dominio, de manera de comprobar por ejemplo, si se llega a una varianza
constante a partir de un determinado volumen. Tambin se puede calcular la
varianza de un tamao dado de bloques dentro del dominio, utilizando esta
relacin. Esta varianza se conoce como varianza de dispersin.
Para ilustrar estos conceptos, se considerar el siguiente ejemplo bidimensional:
En un rea de 2000 x 500 metros, se dispone de 21 muestras de una variable
regionalizada, tal como se muestra en la figura 55.
Simulacin Geoestadstica
82
2000
A1
B1
C1
10
D1
E1
8
6
9
B2
11
10
C2
12
A3
D2
E2
H1
I1
14
12
F2
10
15
G1
13
A2
F1
20
15
13
G2
19
H2
I2
19
17
12
B3
C3
D3
E3
F3
G3
H3
I3
o2/ B =
(n
i =1
1) i2
(n
i =1
1)
donde:
o2/ B corresponde a la varianza de las muestras (puntuales) en un rea
correspondiente a un bloque B.
ni corresponde al nmero de datos encontrados en el i-simo bloque.
i2 es la varianza experimental encontrada entre las muestras del i-simo
bloque.
Con esto, se puede construir la siguiente tabla y graficar la varianza de los datos
en funcin del rea.
500
Simulacin Geoestadstica
rea
W1 (500 x 2000)
W2 (500 X 1000)
W4 (500 X 500)
W8 (250 X 500)
W8 (500 X 250)
Sub
rea
1
1
2
1
2
3
4
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Lmites
A1I1A3I3
A1E1A3E3
E1I1E3I3
A1C1A3C3
C1E1C3E3
E1G1E3G3
G1I1G3I3
A1C1A2C2
C1E1C2E2
E1G1E2G2
G1I1G2I2
A2C2A3C3
C2E2C3E3
E2G2E3G3
G2I2G3I3
A1B1A3B3
B1C1B3C3
C1D1C3D3
D1E1D3E3
E1F1E3F3
F1G1F3G3
G1H1G3H3
H1I1H3I3
A1B1A2B2
B1C1B2C2
C1D1C2D2
D1E1D2E2
E1F1E2F2
F1G1F2G2
G1H1G2H2
H1I1H2I2
A2B2A3B3
B2C2B3C3
C2D2C3D3
D2E2D3E3
E2F2E3F3
F2G2F3G3
G2H2G3H3
H2I2H3I3
83
Nmero de
muestras
21
12
9
7
5
6
3
3
3
5
1
4
2
1
2
5
2
3
2
0
6
1
2
2
1
1
2
0
5
0
1
3
1
2
0
0
1
1
1
Varianza
15,76
5,90
9,19
7,62
3,70
6,27
2,33
4,33
1,00
1,30
--4,67
2,00
--2,00
1,30
40,50
6,33
0,50
--6,27
--0,50
0,50
----0,50
--1,30
----1,00
--2,00
-----------
Grados de
libertad
20
11
8
6
4
5
2
2
2
4
0
3
1
0
1
4
1
2
1
--5
0
1
1
0
0
1
--4
--0
2
0
1
----0
0
0
Varianza
promedio
15,76
7,29
5,68
4,61
1,13
Tabla 10: Varianza de las muestras al interior del bloque en funcin del rea.
Simulacin Geoestadstica
84
20
16
15,76
2
12
8
4,61
5,68
7,29
B/D
o/B=
BB
1,13
0
0
0,2
0,4
0,6
0,8
1,2
Simulacin Geoestadstica
85
Varianza de estimacin:
Si a partir de un conjunto de muestras V={v1, v2, , vn} (que pueden considerarse
puntuales), se quiere estimar la media de un bloque V, mediante el promedio
aritmtico del conjunto de muestras (sin ponderar), y notando E2 ( V, V ' ) , la
varianza de la diferencia Z(V) - Z(V'), se puede hacer la siguiente deduccin:
E2 ( V, V ' ) = Var (Z( V ) Z( V ' ))
Es decir, se interpreta la diferencia Z(V) - Z(V') como el error de estimacin, el cual
si se considera una variable estacionaria (de orden dos), tiene esperanza nula y
varianza igual a la varianza de estimacin recin expuesta. En caso de estimar la
ley de un bloque mediante una muestra central, por ejemplo, la varianza de
estimacin se denomina varianza de extensin.
Ahora bien. esta varianza puede desarrollarse como sigue:
donde
es decir, la varianza del error de estimar V con V' es dos veces el variograma
medio entre todos los pares de puntos en los que un punto pertenece a V y el otro
Simulacin Geoestadstica
86
v1
3
Simulacin Geoestadstica
( v 1 , V ) =
87
1
(0,5 2 ) + (1,5 2 ) + (2,5 2 ) + 2 ( 0,5 2 + 1,5 2 )
9
Una dimensin:
Dos dimensiones:
Tres dimensiones:
10
6 x 6 = 36
4 x 4 x 4 = 64
1
9 (0) + 24 (1) + 16 ( 2 ) + 12 (2) + 4 (2 2 ) + 16 ( 5 )
81
= 0,784
( V, V ) =
Simulacin Geoestadstica
88
v2
Simulacin Geoestadstica
89
v2
v1
3
Simulacin Geoestadstica
90
mitad del primer caso. Finalmente, dando iguales ponderadores a las dos
muestras, se obtiene una varianza an menor.
Se puede concluir que no tiene sentido dar igual peso a dos muestras que
conducen a errores tan diferentes. Intuitivamente, la muestra central debiera tener
un ponderador de aproximadamente dos tercios y la muestra de la esquina, de
slo un tercio.
Ahora bien, se desea que el error de estimacin sea lo ms pequeo posible, es
decir, que la varianza de estimacin sea mnima. Este es el origen del kriging.
Para lograr este objetivo debe desarrollarse una expresin para la varianza de
estimacin en que los ponderadores sean las incgnitas a determinar.
Kriging Simple
Z * (u0 ) = Z (u )
=1
=1
= C (u u ) + C (0) 2 C (u u )
=1 =1
=1
Simulacin Geoestadstica
91
Para obtener los ponderadores que minimizan esta varianza, se debe derivar e
igualar a cero la expresin anterior, obtenindose el sistema de kriging simple:
n
C (u u ) = C (u u )
= 1,,n.
=1
[C (u u )]
C (u1 u1 ) L C (u1 u n )
M
M
C (u u ) L C (u u )
n
1
n
n
1 C (u1 u0 )
M
M =
C (u u )
n
0
n
2
KS
(u0 ) = C (0) C (u u0 )
=1
El haber asumido la media nula es una decisin que no parece muy prctica en el
caso minero, en que las variables regionalizadas son en su mayora mayores que
cero. Sin embargo, lo que se hace es trabajar con la variable Zm que tiene media
nula, resolver el sistema como se muestra en los prrafos anteriores, y luego
volver a Z una vez que se tengan los ponderadores ptimos y se haya resuelto el
sistema, de la siguiente forma:
n
Z * (u0 ) m = [ Z (u ) m] ,
=1
o bien
n
=1
=1
Z * (u0 ) = Z (u ) + ( 1 ) m .
Simulacin Geoestadstica
92
Ejemplo:
Dada la siguiente configuracin, calcular el estimador de kriging simple y su
varianza para estimar el punto u0.
15 m.
u0
u2
15 m.
u1
2
KS
Simulacin Geoestadstica
93
1 = 0,208
2 = 0,410
(1 1 2 ) = 0,382
Kriging ordinario
Z * (u0 ) = Z (u )
=1
=m
( 1 )
=1
=1
= 1.
Simulacin Geoestadstica
94
s.a.
=1
= 1
=1
E2 2 1
=1
=1
n
= 0 : =1
=1
= 1...n
o matricialmente,
C (u u ) 1
1
0
C (u u0 )
=
M
M
M M
M
C (u u ) L C (u u ) 1 = C (u u )
n
1
n
n
n
0
L
1
1
0
1
2
KO
(u0 ) = 2 C (u u0 ) +
=1
Simulacin Geoestadstica
95
n
(u u ) + = (u u0 )
=1
n
=1
=1
= 1... n
o matricialmente,
(u u ) 1
1
0
(u u0 )
=
M
M
M M
M
(u u ) L (u u ) 1 = (u u )
n
1
n
n
n
0
L
1
1
0
1
2
KO
(u0 ) = (u u0 ) + .
=1
Simulacin Geoestadstica
96
Ejemplo:
Dada la misma configuracin anterior, calcular el estimador de kriging ordinario y
su varianza para estimar el punto u0.
15 m.
u0
u2
15 m.
u1
1 + 2 = 1
Del modelo variogrfico se tiene que:
Simulacin Geoestadstica
97
1 = 0,399
2 = 0,601
= 0,595
Y su varianza asociada:
2
KO
= 2,05 (0,399 0,86) (0,601 1,06) + 0,595 = 1,66 (g/t) 2
(u ) = ln (Z (u ) + )
En este caso, el estimador es:
ln Z * (u0 ) + = ln (Z (u ) + ) + ( 1 ) ln (m + )
+
=1
=1
1
(C (u u ) C (u0 u ) )
2 =1
o equivalentemente,
n
=1
=1
1
2
Simulacin Geoestadstica
98
ln Z * (u0 ) + = ln (Z (u ) + ) +
=1
1 n
1
(C (u u ) C (u0 u ) ) +
2 =1
2
o bien,
n
1
2
1
2
* (u0 ) = (u ) + (C (u u ) C (u0 u ) ) +
=1
=1
Simulacin Geoestadstica
99
Caso base
2
Efecto de distancia
2
= 0,1888
0,25
50
0,25
= 0,2162
0,265
50
0,25
0,303
0,25
0,303
0,129
50
50
Figura 62: Caso base y efecto del aumento de la distancia sobre los
ponderadores.
Como es lgico, al alejar una muestra, los pesos de las muestras ms cercanas al
bloque a estimar aumentan y el de la que se alej, disminuye. La varianza de
estimacin aumenta (pues la informacin es de peor calidad al estar ms lejos).
Adems se produce un resultado interesante: las muestras ms cercanas a la
muestra que se alej toman un peso mayor que la ms lejana (en este caso la de
ms arriba). Esto se debe a que el peso que pierde la muestra al alejarse se
traspasa principalmente a las muestras que se encuentran ms cercanas a ella.
Ahora considerando respecto al caso base, la presencia adicional de dos muestras
que estn ocultas respecto al bloque a estimar, se tendr el efecto pantalla.
Efecto pantalla
2
= 0,1668
0,247
50
0,233
0,233
0,174
0,080
0,033
50
Como se puede ver, los ponderadores de las muestras afectadas por este efecto
pantalla son muy bajos. Las tres muestras que forman este grupo suman un peso
de 0,287 (muy distinto al 0,5 que se podra suponer por tratarse de tres muestras
de seis). La varianza de estimacin disminuye, pues se cuenta con una mayor
cantidad de informacin (adems sta es de calidad superior al caso base, pues
Simulacin Geoestadstica
100
= 0,1668
0,111
0,106
0,111
0,242
= 0,2107
0,3437
0,215
50
50
0,016
0,013
0,016
0,2674
0,215
0,3437
50
50
100
150
= 0,2248
0,074
50
0,426
0,426
0,074
50
Simulacin Geoestadstica
101
= 0,0827
= 0,1206
0,208
0,1044
50
50
0,042
50
(h) = 0,2 + 0,8 Sph(100)
0,1456
50
(h) = 0,7 + 0,3 Sph(100)
Como puede verse, los ponderadores tienden a parecerse cuando el efecto pepita
es ms alto, llegando al extremo de ser todos iguales si se tiene efecto pepita
puro, sin importar la posicin de las muestras respecto al bloque a estimar.
Eleccin del mejor plan de kriging
Validaciones cruzadas
En el plan de kriging, existe una serie de parmetros que hacen que el resultado
de la estimacin sea mejor o peor. Para decidir si un determinado plan es mejor
que otro, se deben realizar validaciones cruzadas para comparar varios planes,
viendo el efecto que tienen sobre los resultados la modificacin de los siguientes
parmetros:
Radio de bsqueda
Mnimo nmero de compsitos a utilizar
Mximo nmero de compsitos a utilizar
Mnimo nmero de octantes con informacin
Mximo nmero de compsitos por octantes
Mximo nmero de compsitos por sondaje
Simulacin Geoestadstica
102
muestra a estimar, y se evala su valor con los otros datos y los parmetros de
bsqueda y el variograma. De esta forma, se podr comparar el valor estimado
con el valor real (el de la muestra), y determinar qu plan de estimacin es mejor.
Una vez calculadas las validaciones cruzadas, se deben aplicar los siguientes
criterios para decidir cual es mejor plan:
Utilizando estos criterios para comparar los planes de kriging diseados, variando
los parmetros antes mencionados, se elige el plan de kriging con el que se
realizar la estimacin definitiva del yacimiento.
Simulacin Geoestadstica
103
Simulacin Geoestadstica
104
(h; u1 )
f (m(u1 ))
(h; u 2 )
f (m(u 2 ))
Simulacin Geoestadstica
105
La varianza de kriging por s sola no es una buena medida para clasificar reservas,
dado que slo corresponde a una medida de la configuracin espacial de las
muestras utilizadas para estimar el valor del punto o bloque de inters. Sin
embargo, al incorporar el efecto proporcional, se est adems considerando la
influencia de las leyes de las muestras utilizadas en la estimacin, a travs de la
utilizacin de la media local para escalar el variograma y, consecuentemente, la
varianza de estimacin.
A pesar de que la incorporacin del efecto proporcional soluciona en parte el
problema de la evaluacin de la incertidumbre en torno a la prediccin realizada a
travs de kriging, varios problemas adicionales hacen que el uso de simulaciones
resulte en estimaciones e intervalos de confianza ms realistas y que han
demostrado en la prctica una mejor reconciliacin con los resultados obtenidos
en la fase de produccin.
Algunos de estos problemas son la inferencia del variograma, la cual resulta ms
fcil y confiable al transformar los datos a valores normales o a indicadores. Estas
transformaciones eliminan la existencia de valores errticos altos o outliers. La
inferencia y modelamiento del variograma resulta ms fcil y confiable.
Un segundo punto es que los mtodos de simulacin consideran de manera
implcita el efecto proporcional. Una propiedad de la transformacin a valores
normales es que en el espacio normal, la variable es homoscedastica, es decir, no
tiene efecto proporcional (Figura 68). Al transformar de vuelta a la variable
original, se inyecta de vuelta el carcter heteroscedstico de la variable original.
Kriging es simplemente una regresin lineal a partir de las muestras. El valor
estimado por kriging resulta idntico a la esperanza condicional obtenida en el
caso multi-Gaussiano, es decir, implcitamente se asume que la varianza es
constante. Por lo tanto, en el espacio normal, la hiptesis de varianza constante
respecto a la variable se cumple. El efecto proporcional puede verse como un
efecto de la distinta pendiente de la distribucin acumulada de la variable original.
Mientras ms cercana a cero la pendiente, mayor ser la varianza local.
Simulacin Geoestadstica
106
Simulacin Geoestadstica
107
Figura 69: Mapas obtenidos por kriging (arriba izquierda) y por simulacin
Gaussiana secuencial (tres mapas restantes). Se puede apreciar el efecto de
suavizamiento del mtodo de estimacin, en contraste a la mejor
reproduccin de la variabilidad real del fenmeno en los mapas simulados.
Categorizacin de recursos
Una vez que se ha comprobado que la estimacin se realiz de manera correcta
(mediante una comprobacin estadstica y grfica), se deben determinar los
recursos del yacimiento en estudio. Sin embargo, no todos estos recursos tienen
el mismo grado de confiabilidad, dado que hay bloques que fueron estimados con
muchas muestras, incluso, con muestras al interior de ellos, y otros que fueron
estimados con pocas muestras muy distantes del bloque (en la periferia, por
ejemplo). Por esta razn, se definen categoras de recursos:
Recursos medidos: son aquellos bloques que han sido estimados con un
mayor grado de seguridad, dado que haba muestras muy cercanas y en
suficiente cantidad para realizar dicha estimacin.
Simulacin Geoestadstica
108
De todas estos recursos, para efectos financieros o comerciales, los nicos vlidos
son los demostrados (es decir, medidos ms indicados), por lo que interesa tener
la curva tonelaje-ley de ellos.
Para efectos prcticos, las descripciones dadas recin de cada tipo de recurso son
muy vagas, por lo que se debe definir algn procedimiento prctico que permita
distinguir lo "confiable", de lo "menos confiable" y de lo "poco confiable".
Debemos mencionar que el uso de la varianza de kriging sin un exhaustivo
anlisis del efecto proporcional y correspondiente modelamiento del variograma
considerando el escalamiento antes indicado, no es recomendado, a pesar de que
ha sido utilizado extensivamente en aos anteriores. Esta prctica ha sido
constantemente criticada y la tendencia actual es a evitarla. La incertidumbre en la
estimacin puede obtenerse mediante el uso de la varianza de kriging escalada
para considerar el efecto proporcional, o bien mediante el uso de simulaciones que
permiten obtener la varianza condicional a travs de la generacin de mltiples
realizaciones.
Varios factores influyen en la calidad de la estimacin. En primer lugar, est la
cantidad de informacin disponible para estimar un bloque dado. Si el bloque se
encuentra muy lejos de las muestras la calidad de la estimacin ser baja. Un
segundo factor a considerar es el efecto proporcional. Si el bloque es de baja ley,
lo ms probable es que la incertidumbre que se tiene en su ley no sea demansiado
alta. Si, por el contrario, el bloque se encuentra en una zona de alta ley, su ley es
mucho ms incierta. Es por esta razn que puede darse el caso de un bloque de
baja ley que se ha estimado con relativamente pocas muestras (o con muestras
distantes) que es tan confiable como un bloque de alta ley que ha sido estimado
con abundantes muestras (e incluso con muestras cercanas). Este hecho es
problemtico a la hora de definir los recursos. Por ejemplo, puede ocurrir que la
mayor parte de los recursos medidos sea de baja ley y que muchos de los bloques
de alta ley, precisamente aquellos que son de inters, queden clasificados como
recursos indicados o inferidos.
Una prctica habitual es utilizar tambin el espaciamiento de sondajes como una
referencia para la varianza mxima que se quiere obtener en una categora.
Nuevamente, esta varianza depender de si se est en una zona de alta o baja
ley. Por esta razn, hablamos de una varianza condicional.
Simulacin Geoestadstica
109
Por ejemplo, se puede definir que los bloques estimados dentro de una malla de
70 x 70 metros (por ejemplo, para un prfido cuprfero) sern considerados
recursos medidos (Figura 70). Con esto se determina la mayor varianza de un
bloque que se encuentre dentro de una malla de este tamao, la que se
considerar como varianza de corte para este tipo de categora. En la figura
siguiente se muestra la varianza de estimacin de los bloques, adems de los
cuatro sondajes con que fueron estimados (los que se encuentran
aproximadamente en una malla de 70 x 70 m.). En este caso, se podra escoger
como varianza de corte 0,4. Esta decisin se toma considerando varios casos y
escogiendo un nmero que aparezca como razonable para todos ellos.
De esta misma manera, se pueden definir como recursos indicados aquellos que
se encuentren entre sondajes espaciados 120 metros. Con esto se definir una
nueva varianza de corte (por ejemplo, 0,7). Luego, sern recursos indicados todos
aquellos cuya varianza de estimacin est entre 0,4 y 0,7.
Finalmente, la categora de recursos inferidos corresponder a aquellos bloques
cuya varianza de estimacin sea superior al ltimo valor considerado, es decir,
superiores a 0,7, y que hayan sido razonablemente estimados.
Simulacin Geoestadstica
110
Recursos medidos: aquellos cuya ley est en el intervalo definido por +/15% del valor estimado, 80% del tiempo, para una produccin mensual.
Recursos indicados: aquellos cuya ley est en el intervalo definido por +/15% del valor estimado, 80% del tiempo, para una produccin trimestral.
Recursos inferidos: todos los otros bloques razonablemente estimados.
Simulacin Geoestadstica
111
Simulacin Geoestadstica
112
Simulacin Geoestadstica
113
Kriging de Indicadores
Una segunda alternativa al kriging convencional es el kriging de indicadores. ste
ser discutido ms adelante.
Simulacin Geoestadstica
114
Simulacin Geoestadstica
115
Simulacin Geoestadstica
116
Simulacin Geoestadstica
117
de los valores normales con el sesgo que puedan tener los datos respecto a la
distribucin original.
Estimacin de la media y varianza de la distribucin de incertidumbre local y
simulacin
Como se mencionara antes, la distribucin local de incertidumbre ser Gaussiana
en forma, dada la hiptesis multi-Gaussiana. La media y varianza estn dadas por
el kriging simple de los valores normales dentro de una vecindad del punto a ser
estimado. Con este procedimiento se obtiene una distribucin local a partir de la
cual se genera un valor simulado por simulacin de Monte-Carlo (ver Figura 73).
La simulacin se realiza secuencialmente, es decir, se visitan los nodos que se
quieren simular y se va generando un valor simulado en cada uno, el que es
utilizado como dato para la estimacin de la media y varianza de kriging simple en
los prximos nodos.
El uso de un camino aleatorio para visitar los nodos a simular se debe a la
necesidad de evitar los artefactos que se producen debido al efecto de pantalla de
kriging. Cuando los datos se apantallan es comn encontrar pesos inusualmente
altos o bajos. Esto genera algunos problemas en el resultado final. Por ello, se
prefiere visitar cada nodo sin un orden preferencial. En cada punto se hace una
bsqueda de muestras y nodos previamente simulados que se utilizarn para
resolver el sistema de kriging simple. Una vez obtenidos el valor estimado y
varianza de kriging, se genera un valor simulado.
Transformacin de vuelta de los valores simulados
Se debe recordar que todos los valores simulados estn en el espacio normal,
pues son valores simulados a partir de la distribucin de incertidumbre del valor
normal en el punto de inters. As, la realizacin debe transformarse de vuelta a
las unidades originales, utilizando el proceso inverso al mostrado en la Figura 71.
Caso de varias variables
Cuando se tiene ms de una variable, suele ser conveniente considerar la
cosimulacin de las variables. La idea es utilizar la informacin contenida en una
variable para estimar la otra en un punto que no ha sido muestreado. El uso de
una o ms variables que llamaremos secundarias es recomendado slo si la
correlacin entre ambas variables es significativa. Dado que los mtodos
presentados a continuacin estn tambin basados en la hiptesis multiGaussiana, consideraremos que ambas variables han sido transformadas a
valores normales. Esta transformacin se hace por separado para cada variable.
Simulacin Geoestadstica
118
[C 21 (u u )] [C 22 (u u )] [ (u )]T = [C (u u )]T
2
1
2
2
2
21 1
Cada submatriz representa las covarianzas entre las muestras primarias, entre
primarias y secundarias y entre secundarias. El sistema es virtualmente el mismo
de un kriging simple, pero considera las covarianzas cruzadas y las de la variable
secundaria. Se asignan pesos de cokriging tanto a los datos provenientes de la
variable primaria, a travs del vector [ 1 (u )] , como a los datos secundarios, por
medio del vector [ 2 (u )] .
El estimador de cokriging es:
[ y1 (u )]*CKS =
n1
n2
(u ) y1 (u ) + (u) y 2 (u )
1 =1
2 =1
y la varianza:
n1
n2
2
CKS
= C11 (0) (u ) C11 (u u ) (u ) C21 (u u )
1 =1
2 =1
Simulacin Geoestadstica
119
[ C11 (u u )]
C22 (0)
1
(u ) = C (0)
11
2
[ y1 (u )]
n1
= 1 (u ) y1 (u 1 ) + 2 (u ) y2 (u )
1 =1
n1
2
CKS
= C11 (0) (u ) C11 (u u ) 2 (u ) C11 (0)
1 =1
Simulacin Geoestadstica
120
Simulacin Geoestadstica
121
k = 1,..., K
i (u ; z ) = Pr ob{z (u ) z k } = Fu ( z k )
Simulacin Geoestadstica
122
i (u ; z k ) = indefinido, si a < z (u ) b
si z (u ) a
0,
k = 1,..., K
Simulacin Geoestadstica
123
1, si v(u ) (vl 1 , vl ]
i (u ; vl ) =
en otro caso
0,
l = 1,..., L
Simulacin Geoestadstica
124
El estimador por kriging simple (estacionario) del indicador en ese umbral es:
donde los pesos SK (u; z ) son la solucin nica del sistema de kriging simple:
donde los pesos OK (u; z ) son la solucin nica del sistema de kriging ordinario:
Una vez ms, las covarianzas de los indicadores tienen que ser deducidas para
cada umbral.
Kriging del indicador de la mediana
En el kriging de indicadores simple y ordinario, es necesario modelar K
variogramas o covarianzas. La inferencia de los variograms en umbrales
extremadamente bajos o altos es, en general, difcil, dado que los ceros y unos
no se encuentran en la misma proporcion, generando un variograma
experimental ms errtico. Para umbrales cercanos a la mediana donde el
nmero de ceros y unos es aproximadamente el mismo, la inferencia del
variograma es ms fcil. El kriging del indicador de la mediana se puede aplicar
Simulacin Geoestadstica
125
Simulacin Geoestadstica
126
donde C I (h; z k , z k ' ) es la covarianza cruzada entre las dos variables aleatorias
p (u ) = r (u ) / n
donde r (u ) es la posicin del dato z (u ) .
El estimador de kriging de probabilidad se escribe:
Simulacin Geoestadstica
127
Informacin Secundaria
Kriging simple de indicadores con media local
En kriging simple, la decisin del estacionaridad implica que la media de la
funcin aleatoria del indicador es independiente de la posicin u a estimar. En
algunos casos, se puede tener una variable secundaria que nos da informacin
a priori sobre la probabilidad de tener Z (u ) z . Se define dicha probabilidad
como:
y (u; z k ) = Pr ob{Z (u ) z k | informacion secundaria en u}
entonces, podemos reescribir el estimador de kriging simple usando estas
medias locales, como sigue:
donde los pesos SK (u; z ) son los mismos que en caso estacionario del kriging
simple de indicadores, es decir, el caso en que la media es constante.
Cokriging Blando
Las probabilidades usadas como medias locales a priori en el caso anterior
pueden usarse como variable secundaria (variable blanda). Se interpretan como
una realizacin de una variable aleatoria Y(u,zk), correlacionada espacialmente
con Z(u,zk). Se puede calcular el estimador de cokriging considerando solamente
la variable primaria y secundaria al valor de corte de inters:
Simulacin Geoestadstica
128
con
Simulacin Geoestadstica
129
Simulacin Geoestadstica
Interpolacin y extrapolacin
acumulativas condicionales
130
de
las
funciones
de
distribucin
Simulacin Geoestadstica
131
Simulacin Geoestadstica
132
Simulacin de indicadores
La simulacin de indicadores utiliza la distribucin obtenida a travs del kriging
de los indicadores para generar un valor simulado utilizando la simulacin de
Monte-Carlo. Es importante acentuar que los datos condicionantes usados para
obtener la distribucin condicional, corresponden a las muestras y a valores
previamente simulados dentro de la vecindad de bsqueda utilizada en la
estimacin. De esta manera, se asegura la reproduccin de las covarianzas de
indicadores.
El mtodo secuencial de simulacin procede como sigue:
Simulacin Geoestadstica
133
Simulacin Geoestadstica
134
Variografa
Para aplicar las tcnicas de indicadores, los valores de corte a utilizar deben
seleccionarse. De acuerdo a la distribucin de las muestras, 10 umbrales fueron
elegidos para tener una buena discretizacin de las funciones de distribucin
acumulativas condicionales en cada sitio estimado. Se espera tener problemas
de relaciones de orden, los cuales sern analizados para entender las razones
de su ocurrencia. Los umbrales fueron elegidos para considerar valores crticos
y se intent distribuirlos uniformemente (en probabilidad). El primer umbral fue
elegido apenas sobre cero. Los 8 umbrales siguientes corresponden a los
deciles, comenzando en 20 y hasta 90. El ltimo umbral fue fijado en el cuantil
95 de la distribucin. Los cuantiles y los umbrales que corresponden a los
valores de U de la distribucin de muestras se presentan en la Tabla 11. Los
Simulacin Geoestadstica
135
Figura 78: Q-q plot mostrando que la distribucin de los datos exhaustivos
y de las muestras tienen aproximadamente la misma forma, pero diferentes
varianzas.
Los variogramas deben calcularse para cada umbral. Para encontrar las
anisotropas se construyeron mapas variogrficos. La Figura 79 muestra los
mapas variogrficos para cada umbral. En la mayora de los casos, la direccin
de la continuidad mxima tiene un azimut de 20. Para el segundo y tercer
umbral, la direccin principal parece estar a 45. El mapa variogrfico para el
primer umbral presenta ms variabilidad y no demuestra claramente ninguna
caracterstica.
Umbral
Cuantil
1
2
3
4
5
6
7
8
9
10
0.08
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
0.95
Valor
distribucin
muestras
0.010
2.011
8.272
21.726
46.070
91.140
164.690
315.847
572.619
965.674
Valor
distribucin
exhaustiva
0.020
3.100
11.800
26.940
56.970
115.151
228.600
427.875
786.383
1236.893
Simulacin Geoestadstica
136
Simulacin Geoestadstica
137
7
15.0 unidades
7.5 unidades
4
70, 160, 45 y 135
22.5
25.0 unidades
Umbral
1
2
3
4
5
6
7
8
9
10
Efecto
Pepita
Relativo
0.10
0.30
0.30
0.50
0.40
0.40
0.30
0.30
0.30
0.20
Meseta
Relativa
0.90
0.70
0.70
0.50
0.60
0.60
0.70
0.70
0.70
0.80
Exponencial
Alcance
Alcance a
a 160
70
25
15
40
15
50
15
45
25
45
25
45
20
45
30
40
40
45
30
40
30
Simulacin Geoestadstica
138
Simulacin Geoestadstica
139
Simulacin Geoestadstica
140
Simulacin Geoestadstica
141
78000
230,126
220,973
0,960
1565,339
280,320
158,584
88,891
6,445
Potencia
w=0,5
78000
216,582
195,742
0,904
1336,107
270,934
154,367
86,736
6,445
Potencia
w=2,0
78000
243,718
246,855
1,013
1794,669
288,507
162,726
91,363
6,445
Simulacin Geoestadstica
142
Simulacin Geoestadstica
143
Simulacin Geoestadstica
144
Simulacin Geoestadstica
145
Simulacin Geoestadstica
146
Simulacin de indicadores
La simulacin secuencial de indicadores fue implementada usando los
parmetros enumerados en la Tabla 15.
Nmero mximo de muestras para cada kriging
Nmero mximo de nodos previamente simulados para cada kriging
Mximo nmero de octantes
Radio mximo de bsqueda
Parmetro de extrapolacin modelo potencia
16
16
4
60
0.5
Umbral
1
2
3
4
5
6
7
8
9
10
Nmero de
desviaciones de las
relaciones de orden
64423
52745
49072
46447
51455
44249
53277
49729
48997
67989
Promedio de
desviaciones
Desviacin
mxima
0.0054
0.0076
0.0123
0.0158
0.0090
0.0105
0.0062
0.0069
0.0031
0.0021
0.1958
0.1435
0.1715
0.1958
0.1761
0.1752
0.1517
0.1582
0.1083
0.1446
Tabla 16: Resumen de problemas con las relaciones de orden para una
realizacin.
Cuatro realizaciones de la variable regionalizada simulada se presentan en la
Figura 88.
Simulacin Geoestadstica
147
Simulacin Geoestadstica
148
Simulacin Geoestadstica
149
Simulacin Geoestadstica
150
Simulacin Geoestadstica
151
Simulacin Geoestadstica
152
Cada uno de los tres espectros puede tomar valores entre 0 y 255, por lo que el
nmero total de combinaciones posibles es 2563. Esta transformacin genera un
valor nico para cada combinacin de los tres colores. El mapa de la nueva
variable se presenta en la Figura 91. Observe que los valores de esta nueva
variable no tienen un significado fsico, por lo que se utilizarn como una variable
artificial.
Transformacin a valores normales
La distribucin exhaustiva original fue transformada a una distribucin
Gaussiana. Una comparacin de la distribucin original y aquella de los datos
transformados se presenta en la Figura 92. Los datos transformados sern
utilizados a partir de este punto.
Simulacin Geoestadstica
153
Muestreo anidado
Un esquema de muestreo anidado se podra aplicar en la prctica para asegurar
que un nmero suficiente de pares est disponible para calcular el variograma a
diferentes pasos. Cien muestras fueron tomadas en una malla rectangular (el
espaciamiento es 59 unidades en la direccin Este-Oeste por 31 unidades en la
direccin Norte-Sur). Luego, en dos sectores diferentes se tomaron 36 muestras
en una malla ms densa (el espaciamiento fue de 12 unidades en la direccin
Norte-Sur y 7 unidades en la direccin Este-Oeste). Finalmente, se identificaron
dos nuevos sectores para tomar muestras con un espaciamiento aun ms
denso. Treinta y seis muestras adicionales espaciadas a 2 unidades en el EsteOeste y slo 1 unidad en la direccin Norte-Sur completan las muestras para
esta aplicacin. Este muestreo se presenta en la Figura 93. Dada la disposicin
de las muestras, se han creado grupos que sesgarn las estadsticas. El tamao
de celda ideal para aplicar desagrupamiento por el mtodo de las celdas est
dado por el tamao de estos grupos. Utilizando un tamao de celda rectangular
de 59 por 31 unidades se resolver el sesgo generado por estos grupos.
Estas muestras se utilizan como datos condicionantes en la simulacin. Sin
embargo, puesto que el objetivo de esta aplicacin es demostrar el uso de las
tcnicas de simulacin Gaussiana y de indicadores, y no ocuparse de problemas
de inferencia de estadsticas representativas, se utilizarn las estadsticas
extradas dela distribucin exhaustiva. Las estadsticas de las muestras se
presentan en el Apndice como referencia.
Simulacin Geoestadstica
154
Distribucin de referencia
Para simular es necesario tener una distribucin de referencia que servir para
la transformacin, en el caso Gaussiano, o para utilizar la forma de las colas al
extrapolar y extraer los umbrales de inters, en el caso de la simulacin de
indicadores. En este estudio, se utiliza la distribucin exhaustiva transformada a
valores normales estndares.
Continuidad espacial
El estudio de la continuidad de la variable fue realizado utilizando la base de
datos exhaustiva y las 228 muestras anidadas. Para cada caso, los variogramas
conituo y de indicadores fueron calculados. Los variograms obtenidos a partir de
los datos exhaustivos se presentan aqu, mientras que aquellosobtenidos a partir
de las muestras se entregan en el Apndice.
Variograma continuo de los datos exhaustivos
Los variogramas experimentales obtenidos a partir de la base de datos
exhaustiva tienen un muy buen comportamiento. Para encontrar posibles
direcciones de anisotropa, un mapa variogrfico fue construido a una resolucin
de 10 m para 21 pasos (Figura 94).
Segn lo demostrado en la Figura 94, la continuidad es istropa y el alcance
aproximado es 200 unidades. Una inspeccin ms detallada revela
caractersticas de ''diente de sierra que irradian del centro. Estas caractersticas
son un artefacto del espaciamiento regular de los datos y del procesamiento
original con que se obtuvo la imagen.
Simulacin Geoestadstica
155
Simulacin Geoestadstica
156
Umbral
10
20
30
40
50
60
70
80
90
-1.282
-0.842
-0.524
-0.253
0.000
0.253
0.524
0.842
1.282
Efecto
Pepita
0.25
0.25
0.25
0.25
0.25
0.25
0.30
0.30
0.40
Exponencial
Meseta
Alcance
0.50
5
0.45
5
0.45
5
0.45
5
0.45
5
0.45
5
0.50
5
0.55
5
0.55
5
Exponencial
Meseta
Alcance
0.25
60
0.30
80
0.30
140
0.30
140
0.30
160
0.30
160
0.20
180
0.15
200
0.05
240
Simulacin Geoestadstica
157
Simulacin Geoestadstica
158
Simulacin Geoestadstica
159
Simulacin Geoestadstica
160
Simulacin Geoestadstica
161
Simulacin Geoestadstica
162
utilizados
en
la
24
48
300
simulacin
secuencial
de
Simulacin Geoestadstica
163
Simulacin Geoestadstica
164
Discusin
Los resultados presentados en este estudio sugieren lo siguiente:
Modelar la continuidad de manera diferente para los valores altos y bajos
es una ventaja de los mtodos de indicadores, por sobre los mtodos
Gaussianos.
En este caso, mostramos que la variable no era multi-Gaussiana. De
haberlo sido, los mtodos de indicadores habran caracterizado de
manera ms pobre a la variable, sin embargo, fueron capaces de capturar
mejor su variabilidad.
A pesar de que los problemas de relaciones de orden en los mtodos de
indicadores son una desventaja, en general no impiden una buena
reproduccin de los variogramas para cada umbral.
Los mtodos del indicador son convenientes para muchos usos donde los
mtodos Gaussianos resultan inapropiados, puesto que los primeros no
imparten entropa mxima en los extremos. Sin embrago, requieren ms
esfuerzo en trminos de inferencia.
Simulacin Geoestadstica
165
Simulacin Geoestadstica
166
Simulacin Geoestadstica
167
Simulacin Geoestadstica
168
Figura 105: Q-q plot de las muestras originales versus las muestras
desagrupadas y grfico de probabilidad normal de la distribucin
desagrupada.
Simulacin Geoestadstica
169
Simulacin Geoestadstica
170