Beruflich Dokumente
Kultur Dokumente
1
1
n = nmero de datos contenidos en la muestra
X
i
= valor de cada variable en el conjunto de datos (muestra)
4.- Moda: Es el valor ms frecuente de la distribucin.
5.- Mediana: Es el valor para el cual la mitad de los datos son menores y
la otra mitad estn por encima de este valor.
Si ordenamos los datos en orden ascendente podemos calcular la
mediana como.
X
(n+1)/2
si n es impar.
M = '
(X
n/2
+ X
n/2+1
)/2 si n es par.
La mediana es tambin llamada percentil 50, adems los datos no solo se
dividen en dos grupos, sino que se pueden dividir en cuatro partes,
cuartiles, donde Q
1
= percentil 25, Q
2
= Mediana y Q
3
= percentil 75, si los
datos se dividen en 10, tenemos los deciles. De forma general estas
medidas se pueden calcular por: [p(n+1)/100] sima observacin de los
datos ordenados ascendentemente, donde p es el percentil que se desea
calcular.
6.- Varianza: Describe la variabilidad de la distribucin. Es la medida de
la desviacin o dispersin de la distribucin y se calcula por:
( )
2
2
1
1
1
n
i m
X X
i
n
n = nmero de datos contenidos en la muestra
X
i
= valor de cada variable en el conjunto de datos (muestra)
X
m
= media o valor promedio del conjunto de datos.
La razn principal por la que se aboga por la divisin entre n-1 en la
estimacin de la varianza, es porque proporciona un mejor estimado; si
dividimos por n-1 nos referimos a la varianza muestral S
2
como un
estimador insesgado de la varianza poblacional
2
. Esto significa que si un
experimento fuera repetido muchas veces se podra esperar que el
promedio de los valores as obtenidos para S
2
igualara a
2.
Por otra parte
si dividimos entre n los valores obtenidos para S
2
seran como promedio
demasiado pequeo, sin embargo cuando tenemos muestras mayores a
100 datos, los resultados de la varianza muestral y poblacional tienden a
ser iguales.
7.- Desviacin estndar: Describe la tendencia o dispersin de la
distribucin. Es la medida de desviacin alrededor de la media. Se calcula
por:
=
2
8.- Coeficiente de asimetra: Describe la simetra de la distribucin
relativa a la distribucin normal. Se calcula por:
( )
3
3
1
3
1
n
X X S
i m
i
n
n = nmero de datos contenidos en la muestra
X
i
= valor de cada variable en el conjunto de datos (muestra)
X
m
= media o valor promedio del conjunto de datos.
S
3
= momento de tercer orden.
En la distribucin normal la asimetra tiene valor cero, un valor negativo
indica una cola a la izquierda y un valor positivo indica una cola a la
derecha.
9.- Curtosis: Describe el grado de esbeltez de la distribucin, tomado
por lo general en relacin a una distribucin normal, y se puede calcular
por:
( )
4
4
1
4
1
n
X X S
i m
i
n
n = nmero de datos contenidos en la muestra
X
i
= valor de cada variable en el conjunto de datos (muestra)
X
m
= media o valor promedio del conjunto de datos.
S
4
= momento de cuarto orden.
La distribucin normal tiene curtosis igual a tres, y es llamada
mesocrtica. A las distribuciones ms agudas, con colas relativamente
anchas, se les llama leptocrticas, tienen valores de curtosis mayores que
tres, y las distribuciones ms bien achatadas en el centro se llaman
platicrticas, tienen valores menores que tres, en ocasiones se
acostumbra a definir la curtosis como
4
- 3.
10.- Error estndar: Describe el grado de conocimiento de los datos y
se puede calcular por:
=
2
/ n
La distribucin normal tiene un valor de error estndar menor que 1.25 y
la distribucin lognormal o una distribucin con tendencia positiva, tiene
valores de error estndar mayores que 1.25.
11.- Coeficiente de variacin: Es una medida de la variacin relativa
de los datos y puede ser calculado por:
CV = S/X
m
y en porcentaje como: 100 CV = 100 (S/X
m
) %
CV = coeficiente de variacin
S = desviacin estndar
X
m
= media
Proporciona una comparacin entre la variacin de grandes valores y la
variacin de pequeos valores. Las tcnicas de Geoestadstica Lineal que
predomina en el campo de las geociencias producen los mejores
resultados cuando el coeficiente de variacin es menor que uno, CV < 1.
Para CV > 1 se recomiendan tcnicas de Geoestadstica no Lineal.
12.- Prueba Chi-Cuadrado: Permite determinar si la distribucin es
normal, lognormal o alguna otra distribucin probabilstica, es su lugar
puede ser usada la prueba Kolmogorov Smirnov como se refleja por
muchos autores es ms robusta.
13.- Prueba t-Student: Permite determinar si en una distribucin
bimodal las medias de las poblaciones son estadsticamente diferentes.
B: Construccin de grficos estadsticos: Estos grficos permiten
ilustrar y entender las distribuciones de los datos, identificar datos
errados, valores extremos, los mismos incluyen:
1.- Mapa base, seccin cruzada y vista en perspectiva: Son usados
para visualizar la relacin espacial en 2 y 3 dimensiones, permiten
encontrar errores en la informacin.
2.- Histogramas: Son usados para ver las caractersticas descriptivas de
la distribucin. Es un grfico de barras donde en las abscisas aparecen los
lmites de las clases y en las ordenadas las frecuencias correspondientes
a cada clase.
3.-Frecuencia acumulativa: Usado para identificar el tipo de
distribucin muestral y ayuda a determinar si estn presentes
poblaciones mixtas. Es un grfico de lmite de clase contra frecuencia
acumulada.
En el caso de grficos estadsticos es til usar los grficos de frecuencia
absoluta, relativa, acumulativa y el diagrama de dispersin, como se
presenta en muchos sistemas.
Todos estos elementos permiten decidir sobre las condiciones de
estacionaridad vistas anteriormente. Muchos autores slo toman como
elementos fundamentales de estadstica bsica que: la media y la
mediana tome valores prximos; el coeficiente de variacin sea inferior a
1; la distribucin de los datos est prxima a la curva normal y no existan
valores extremos que afecten el desarrollo del anlisis estructural.
4.- Distribucin Normal:
La distribucin normal o gaussiana es el modelo ms importante y de
mayor uso de todas las distribuciones continuas de probabilidad. Un gran
nmero de estudios indican que la distribucin normal proporciona una
adecuada representacin de las distribuciones de una gran cantidad de
variables fsicas.
DEFINICION: Se dice que una V.A. X se encuentra normalmente distribuida
si su funcin de densidad de probabilidad esta dada por:
2
2
1
* 2
1
) , ; (
,
_
x
e x f
para - < x < - < < > 0
El parmetro no influye en la forma de la curva f(x), su variacin conduce
a un desplazamiento de la curva a lo largo del eje x.
La variacin del parmetro , altera la forma de la curva f(x).
RESUMEN DE MEDIDAS
+
dx x xf x E ) ( ) (
) (x E
i
x
n
1
2 2
) ( x E
( )
1
1
]
1
n
x
x
n
i
i
2
2
2
1
+
n
x
n
x
;
Central 95%
1
]
1
+
n
x
n
x
96 . 1 ; 96 . 1
Central 99.7%
1
]
1
+
n
x
n
x
3 ; 3
Limites de confianza para n<25
Lmite central (1-2p)
1
]
1
+
n
T x
n
T x
P P
;
5.- Funcin de Distribucin Acumulativa:
La probabilidad de que una V.A. normalmente distribuida X sea menor
igual a un valor especfico x, esta dada por la funcin de distribucin
acumulativa F(x)
( )
1
1
]
1
,
_
x
dt
t
Exp x F x X P
2
2
1
2
1
, ; ) (
Esta integral no puede evaluarse en forma cerrada, sin embargo se puede
tabular F(x;,) como una funcin de y , lo que necesitara una tabla para
cada par de valores. Como existe un nmero infinito de valores de y ,
esta tarea es virtualmente imposible.
6.- Distribucin Normal Standar:
Ecuacin de transformacin
x
z
Donde y son la media y la desviacin estndar de X respectivamente.
De acuerdo con lo anterior Z es una V.A. estandarizada con media 0 y
desviacin estndar 1, lo que nos conduce a la Ley Normal Reducida (LNR)
( ) ( ) z Z P x X P
Funcin de densidad de probabilidad (PDF)
,
_
2
2
1
) (
2
z
Exp x f
Funcin de distribucin acumulativa
Si:
) 1 , 0 ; ( ) , ; ( ) ( ) ( z F x F z Z P x X P
z x
Donde
1 , 0 ; (z F
z
) es la funcin de distribucin acumulativa de la funcin de
probabilidad normal estandarizada, la misma que se encuentra tabulada en
forma extensa.
( ) ( )
,
_
z
z
dt
t
Exp z F z Z P
2
2
1
1 , 0 ;
2
Para cualquier valor especfico de z, el correspondiente valor en la tabla es
la probabilidad de que la V.A. normal estandarizada Z sea menor o igual a
z.
INTERVALOS DE CONFIANZA
7.- Modelo Log Normal:
Se dice que una variable aleatoria X sigue un Ley Lognormal, si su
logaritmo (neperiano, base e) sigue una Ley Normal. Su funcin de
densidad de probabilidad viene expresada de la siguiente manera:
'
>
,
_
0 ..... 0
0 ...
* 2 *
1
) (
2
ln
2
1
x
x e
x
x f
e
e
x
x d e x f
e
e
x
ln
2
1
) (
2
ln
2
1
,
_
Considerando la constante de aditividad
, tendramos:
( )
+
,
_
x e
x
x f
x
....
1
*
* 2
1
) (
2
) ln(
2
1
PARAMETROS
Si los datos se asemejan a una distribucin lognormal, la poblacin se
puede definir como una poblacin lognormal de dos parmetros, siendo
estos parmetros la media y la varianza de la poblacin logartmica.
Entonces el valor verdadero de la ley media se puede obtener con la
frmula:
1
1
]
1
,
_
2
2
e
e
e
[ ] 1
2
2 2
e
e
donde:
= valor estimado de la Ley Media
e
Siendo los x
i
los valores de los percentiles correspondientes a cada caso.
Este valor se aade a la poblacin original de datos (sin transformar
logaritmicamente) y, a continuacin, se realiza la transformacin
logartmica, obtenindose una nueva poblacin ln(x
i
+) que, representada
en el papel probabilstico, s genera ya una lnea recta.
Para calcular, en este caso, el valor de la ley Media, se aplica el
procedimiento descrito para la poblacin de dos parmetros,
sustrayndose el valor de la constante aditiva del resultado final. Las
frmulas quedaran:
1
1
]
1
,
_
+
2
2
e
e
e
[ ] 1 ) (
2
2 2
+
e
e
TRANSFORMACION
Si
Lnx z
Obtendramos la siguiente funcin de probabilidad Normal
2
2
1
* 2
1
) (
,
_
z
e x f
8.- Modelo estandarizado:
S,
x
Ln
Ln Lnx
t
1
De donde obtenemos:
t Ln Lnx +
en trminos de diferenciales:
dt
x
dx
reemplazando esta expresin en la ley normal
x
dx
e dx x f
x
2
ln ln
2
1
2
1
) (
,
_
Obtenemos el siguiente modelo estandarizado.
( )
dt e t F
t t
2
2
1
2
1
) (
[L
k-1
,L
k
]
Procedimiento de clculo
1. Determinar el rango (R) de variacin de los datos
R = Xmax - Xmin (diferencia entre el dato mximo y mnimo)
2. Determinar el nmero de intervalos (K) en forma directa,
seleccionando un nmero entre 5 y 30 intervalos, o calcularlo
mediante la frmula de Sturges, cuyo resultado debe ser redondeado
al entero inmediato superior.
K = 1 + 3.3log(n) n >= 10
3. Determinar la amplitud o ancho del intervalo (W)
W = R / K
4. Determinar los lmites de los intervalos
L
1
= [X
min
, X
min
+ W)
L
2
= [X
min
+ W, X
min
+ 2W)
L
3
= [X
min
+ 2W, X
min
+3W)
L
k
= [X
min
+ (k-1)W, X
min
+ KW]
Presentacin de datos
Los datos pueden ser presentados mediante los siguientes grficos:
Histograma de frecuencias
Polgono de frecuencias
Histograma acumulado
Grficos de variabilidad
Grafico de probabilidad
Otros
Clculos previos para la construccin de la tabla de frecuencias, usando los
datos de la mina de carbn.
VARIABLE VALOR
n 96
min 19,92
max 30,46
Rango 10,54
k 8
w 1,32
Distribucin de
frecuencias
INTERVALO
S
Xi fi hi Fi Hi hi*100 Hi*100
Li Ls
19,920 21,240 20,580 9 0,094 9,000 0,094 9,375 9,375
21,240 22,560 21,900 13 0,135 22,000 0,229 13,542 22,917
22,560 23,880 23,220 15 0,156 37,000 0,385 15,625 38,542
23,880 25,200 24,540 21 0,219 58,000 0,604 21,875 60,417
25,200 26,520 25,860 15 0,156 73,000 0,760 15,625 76,042
26,520 27,840 27,180 11 0,115 84,000 0,875 11,458 87,500
27,840 29,160 28,500 8 0,083 92,000 0,958 8,333 95,833
29,160 30,480 29,820 4 0,042 96,000 1,000 4,167 100,000
Construccin del histograma X
i
VS f
i
:
HISTORAMA
0
5
10
15
20
25
20,580 21,900 23,220 24,540 25,860 27,180 28,500 29,820
Cualitativamente observamos que los datos siguen un modelo Normal, con una tendencia hacia
la zona central, que aproximadamente equidistan de los extremos.
HISTOGRAMA ACUMULADO
0,000
20,000
40,000
60,000
80,000
100,000
120,000
2
0
,
5
8
0
2
1
,
9
0
0
2
3
,
2
2
0
2
4
,
5
4
0
2
5
,
8
6
0
2
7
,
1
8
0
2
8
,
5
0
0
2
9
,
8
2
0
Grfico acumulado X
i
VS F
i
, con crecimiento ascendente.
Variabilidad
0,00
5,00
10,00
15,00
20,00
25,00
30,00
35,00
9
5
0
0
9
6
5
0
9
5
0
0
1
0
7
0
0
1
0
4
0
0
1
0
2
5
0
1
0
2
5
0
9
8
0
0
1
0
1
0
0
9
8
0
0
9
6
5
0
9
8
0
0
Grfico mostrando las variaciones del valor calorfico, a lo largo de la coordenada Este.
MEDIDAS ESTADISTICAS CUNATITATIVAS, CALCULADO CON EL PROGRAMA
GEOEAS.
Grafico de probabilidad, basado en la recta de Henry, para demostrar la
normalidad del conjunto de datos, obsrvense las medidas estadsticas,
cuyos valores confirman que los datos siguen una Distribucin Normal, con
parmetros, media igual a 24.624 MJ y varianza de 6.043 o desviacin
estndar de 2.458 MJ.
El valor de la media y la mediana, tienden al valor de 24.6 MJ. lo que quiere
decir que el valor es bastante representativo, con un coeficiente de
asimetra (Skewness) de 0.228, que confirma el sesgo mnimo de la data.
2.- CASO DE ESTUDIO CON DATOS DE UNA MINA DE ORO
Las muestras tomadas en un yacimiento de oro, configuran los siguientes
datos expresados en gr/ton.
0,1 0,2 0,5 1,0 1,2 2,1 2,5 3,0 5,1 10
Calcular las medidas estadsticas, analizar la variabilidad de los datos y
la tendencia hacia un modelo Normal o Log Normal.
Estructura de datos para un clculo manual
ID Xi (Xi - Media)^2 (Xi - Media)^3 (Xi - Media)^4 Hi*100
1 0,1 6,101 -15,069 37,220981 10
2 0,2 5,617 -13,312 31,549566 20
3 0,5 4,285 -8,870 18,360368 30
4 1 2,465 -3,870 6,075732 40
5 1,2 1,877 -2,571 3,522754 50
6 2,1 0,221 -0,104 0,048797 60
7 2,5 0,005 0,000 0,000024 70
8 3 0,185 0,080 0,034188 80
9 5,1 6,401 16,194 40,971521 90
10 10 55,205 410,172 3047,580984 100
Aplicando las formulas estadsticas, tenemos los siguientes resultados:
Medida Valor
media 2,570
mediana 1,650
Var 8,236
desv std 2,870
CV (%) 111,668
Q1 0,350
Q3 2,750
IQR 2,400
moment3 38,265
moment4 318,536
sk 1,619
E 1,696
histograma
0
1
2
3
4
5
6
1 3 5 7 9 Xi
f
i
Asociado al conjunto de datos de la mina de oro, observando el histograma y las medidas
estadsticas, notamos que hay valores OUTLIERS, fuera de la vecindad del conjunto y uno de
esos valores es el dato cuyo valor tiene 10 gr/ton, lo que hace que la distribucin tenga un sesgo
pronunciado con tendencia al modelo Log Normal y el valor de la media no es representativo ya
que tiene una tendencia hacia los valores altos, mostrndose una gran diferencia entre el valor
de la media y la mediana (0.92 gr/ton).
Esto implica que no podemos seguir con nuestro anlisis, ya que primero tenemos que
homogenizar nuestra data para no arrastrar errores, que podran repercutir ms adelante cuando
uno haga estimaciones y modelamientos, los mismos que devendran en no confiables.
Vamos a eliminar el valor alto de 10 gr/ton de la data y veamos ahora cual es el comportamiento
el modelo y sus medidas estadsticas.
Medida Valor
Media 1,744
Mediana 1,200
Var 2,336
desv std 1,528
CV (%) 87,611
Q1 0,275
Q3 2,400
IQR 2,125
Moment3 3,290
Moment4 16,156
Sk 0,921
E -0,039
histograma
0
1
2
3
4
5
6
1 3 5 7 9 Xi
f
i
El modelo Log Normal est ms definido y ahora la diferencia entre la media y la mediana es
menor (0.54 grs/ton).
Los alumnos ahora comprendern porque es necesario hacer el anlisis estadstico, previo a un
anlisis espacial o geoestadistico, el objetivo es no incurrir en mayores errores.
3.- CASO DE UN YACIMIENTO DE ORO CON 30 DATOS.
Leyes en grs/ton.
ID Xi ID Xi ID Xi
1 0,1 11 0,6 21 0,4
2 5,5 12 1,4 22 0,5
3 0,5 13 6,8 23 1,5
4 1,0 14 5,1 24 2,3
5 1,2 15 8,4 25 3,2
6 2,1 16 4,2 26 2,9
7 2,5 17 0,3 27 4,3
8 3,0 18 1,5 28 3,8
9 5,1 19 1,8 29 7,2
10 10,0 20 2,2 30 4,9
Histograma deducido en base a una tabla de frecuencias.
Yacimiento de Oro
0
2
4
6
8
10
12
14
1,0 2,7 4,4 6,1 7,8 9,5
xi
f
i
Observamos claramente que los datos tienden a un modelo Log Normal.
Veamos como resultan las medidas estadsticas, calculadas con el Programa Geoeas.
El grafico de probabilidad, nos muestran que estos datos no siguen una Distribucin Normal, ya
que no se alinean a una recta, sobre todo en los primeros datos. La asimetra o sesgo es evidente
por los valores mostrados del coeficiente Skewness de 1.019, que indica el sesgo existente en el
conjunto de datos, demostrando la aproximacin a un modelo Log Normal.
Haciendo la transformacin logartmica de los datos con Y
i
= Ln (X
i
), obtenemos una
distribucin normal, con los siguientes resultados:
Estos valores logartmicos, se aproximan a una distribucin normal, obsrvese la similitud de
los valores de la media y la mediana, con un coeficiente de asimetra Skewness, mnimo de
-0.031.
Estimacin de los parmetros del modelo Log Normal, en unidades el conjunto de datos.
Reemplazando los valores logartmicos en las formulas, obtenemos:
1
1
]
1
,
_
2
2
e
e
e
54 . 3
2
541 . 0
995 . 0
1
]
1
,
_
+
e
54 . 3
[ ] 1
2
2 2
e
e
[ ] 1 ) 54 . 3 (
541 . 0 2 2
e
99 . 8
2
3
Entonces decimos, que la data del yacimiento de oro, sigue un Modelo Log Normal con
parmetros, media igual a 3.54 grs/ton y con una varianza de 8.99 o una desviacin estndar de
3 grs/ton.
2.5. CURVAS LEY TONELAJE
Las aplicaciones de las Curvas Ley Tonelaje nos permiten analizar el
comportamiento de un conjunto de datos de un determinado yacimiento
minero, en cuanto a sus recursos econmicamente explotables de acuerdo
a una Ley mnima o Cutt Off. Con lo que se puede presentar varias
alternativas, en funcin a sus reservas. Segn el modelo que siga cada
yacimiento, tendr un procedimiento especifico.
1.- Curvas Ley Tonelaje cuando el yacimiento sigue un Modelo
Normal
Proporcin de mineral sobre una ley de corte
( ) z F P 1
c
x
z
( )
,
_
z
z
dt
t
Exp z F
2
2
1
1 , 0 ;
2
(tabla Distribucin Normal Standar)
Ley promedio recuperable
( ) ) ( * z
P
x x
c
+ +
,
_
2
exp
2
1
) (
2
z
z
2.- Curvas Ley Tonelaje cuando el yacimiento sigue un Modelo Log
Normal
Calculo de parmetros logartmicos
Paso Previo, cuando los parmetros estn expresados en
unidades logartmicas.
Cuando los datos estadsticos estn referidos al clculo original de las
muestras x
i
, entonces es necesario calcular previamente los
parmetros logartmicos para despus proceder con el mtodo
normal.
1
]
1
+ 1
2
2
2
x
S
Ln S
e
( ) ( )
2
5 . 0
e e
s x Ln x
donde:
2
e
s = Varianza de los logartmicos
2
s = Varianza muestral original
2
x = Media muestral original
e
x
= Media de los logartmicos
Clculo de la proporcin del tonelaje minable (P)
Evaluacin de Z
e
e c
X LnX
Z
o
2
1
e c
e
x
Ln Z
+
1
]
1
+
+
Z = t
( )
dt e t F
t t
2
2
1
2
1
) (
(tabla)
( ) t F P 1
Ley promedio recuperable (
lc
X
+
)
x
P
Q
X
lc
*
+
( )
e
s z F Q 1
( )
e
s z F valor calculado o de tabla
Tambin se puede usar la siguiente frmula.
( ) ( )
+
1
]
1
,
_
+
+
1
]
1
,
_
+
+
+
2
1
2
1
e c
e
e c
e
c
x
Ln F
x
Ln F
x
F(z) = Tabla
3.- Aplicaciones de las Curvas Ley Tonelaje.
1. Caso de estudio de un depsito de hierro: Tenemos un depsito
de hierro, el cual se conoce que las muestras siguen una distribucin
normal con un ley promedio del 48% y una desviacin estndar del
5%. Asimismo el modelo de bloques del yacimiento nos da una
desviacin estndar del 4.45%.
Analizar las incidencias de las dos distribuciones en el clculo de la
Ley/Tonelaje.
Representaremos los modelos en funcin a sus parmetros y
utilizando las formulas del modelo normal y clculos efectuados en el
programa Excel, para reproducir las funciones de densidad de
probabilidad.
Distribucin Normal
-0,01
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
-30 -20 -10 0 10 20 30 40 50 60 70 80 90
x
f
(
x
)
Muestras
Bloques
Modelo normal para muestras y bloques.
Calculo del Tonelaje y Ley para varias leyes de corte, usando el
programa Excel y las formulas expuestas anteriormente, para el
Modelo Normal.
L.C.
MUESTRAS BLOQUES
P(%) L.MEDIA P(%) L.MEDIA
40 94,52 48,59 96,39 48,37
42 88,49 49,10 91,12 48,79
44 78,81 49,84 81,56 49,45
46 65,54 50,81 67,34 50,38
48 50 51,99 50 51,55
50 34,46 53,34 32,66 52,91
52 21,19 54,84 18,44 54,43
54 11,51 56,44 8,88 56,06
56 5,48 58,12 3,61 57,77
Cada Ley de Corte, representa una alternativa de explotacin con una
proporcin de tonelaje econmicamente explotable con su respectiva
Ley, para cada modelo de muestras y bloques. Generalmente un
yacimiento se explota en base al modelo de bloques, en este caso,
por ejemplo si las condiciones de la tecnologa y el mercado
determinan utilizar una Ley de Corte de 44 %, entonces tendramos el
81.56 % de mineral econmicamente explotable con una ley
promedio de 49.45 %.
Con estos datos, representamos las curvas Ley Tonelaje.
Ley de Corte/Tonelaje
0
0,2
0,4
0,6
0,8
1
1,2
35 40 45 50 55 60
L.C
P
Muestras
Bloques
Curvas Ley de Corte/Tonelaje, para el modelo de muestras y bloques
del depsito de hierro.
Ley de Corte/Ley Media
45
50
55
60
35 40 45 50 55 60 LC
L
e
y
M
e
d
i
a
Muestras
Bloques
Curvas Ley de Corte/Ley media, para el modelo de muestras y
bloques del depsito de hierro.
2. Caso de estudio de un yacimiento de Pb y Zn.
Tomemos el caso de un yacimiento de Pb, Zn, donde el porcentaje de
metal combinado es la variable econmica. Se conoce que las
muestras estn distribuidas lognormalmente con un valor promedio
del 12% y una desviacin estndar del 8%.
La unidad de minado seleccionada es un bloque de 10x10x5 mts.,
cuya desviacin estndar es igual a 5.56% de metal combinado.
Analizar las incidencias del clculo de la Ley/tonelaje.
Representaremos los modelos en funcin a sus parmetros y
utilizando las formulas del modelo lognormal y clculos efectuados en
el programa Excel, para reproducir las funciones de densidad de
probabilidad.
FUNCION DE PROBABILIDAD LOGNORMAL
0
0,02
0,04
0,06
0,08
0,1
0,12
0 10 20 30 40 50
X
f
(
x
) muestras
bloques
Funcin de probabilidad para el Modelo Log Normal para muestras y bloques.
Calculo del Tonelaje y Ley para varias leyes de corte, usando el
programa Excel y las formulas expuestas anteriormente, para el
modelo Log Normal.
L.C.
MUESTRAS BLOQUES
P(%) L.MEDIA P(%) L.MEDIA
4 93,29 12,637 98,11 12,159
5 87,12 13,213 94,17 12,459
6 79,76 13,924 87,60 12,941
7 71,92 14,734 78,95 13,579
8 64,12 15,616 69,19 14,338
9 56,69 16,550 59,23 15,188
10 49,83 17,523 49,77 16,105
11 43,62 18,525 41,20 17,072
Cada Ley de Corte, representa una alternativa de explotacin con una
proporcin de tonelaje econmicamente explotable con su respectiva
Ley, para cada modelo de muestras y bloques. Generalmente un
yacimiento se explota en base al modelo de bloques, en este caso,
por ejemplo si las condiciones de la tecnologa y el mercado
determinan utilizar una Ley de Corte del 7 %, entonces tendramos el
78.95 % de mineral econmicamente explotable con una ley
promedio de 13.579 %.
CAPITULO 3
GEOESTADISTICA Y TEORIA DE LAS VARIABLES REGIONALIZADAS
3.1. VARIABLES REGIONALIZADAS
En trminos mineros se define la geoestadstica como la aplicacin de la
teora de las variables regionalizadas a la estimacin de los recursos
mineros.
Una variable regionalizada es una funcin que representa la variacin en el
espacio de una cierta magnitud asociada a un fenmeno natural, abreviada
generalmente como V.R.
Sea x un punto del espacio. Se designa la variable regionalizada por la
notacin z(x).
3.2. NOTACION CONDENSADA
Antes de estudiar ejemplos de variables regionalizadas, mencionemos que
en geoestadstica se utiliza la notacin condensada: Un punto del espacio
se representa por la letra x. Por ejemplo la ley en el punto x se representa
por z(x). Por consiguiente, z(x) puede significar:
z(x) si el problema es unidimensional (1-D)
z(x
1
, x
2
) si el problema es bidimensional (2-D)
z(x
1
, x
2
, x
3
) si el problema es tridimensional (3-D)
Se observa que existen problemas de notacin: Se acostumbra a designar
una variable regionalizada con la letra z, lo cual coincide con la notacin
utilizada para la cota o elevacin.
3.3. EJEMPLOS DE VARIABLES REGIONALIZADAS (V.R.)
Ejemplo 1: En el espacio de una dimensin, sea z(x) = Ley de Cu a lo
largo de una galera:
Figura 3.1: Canaletas en una galera.
Figura 3.2: Galera reconocida entre los puntos A y A
Las leyes muestreadas en las canaletas se pueden graficar:
Figura 3.3: Leyes muestreadas en las canaletas entre A y A.
Ejemplo 2: En la dimensin tiempo (una dimensin t), el precio de un metal
p(t).
Fig. 3.4: Precio del cobre (promedio mensual (1987-2005) en
centavos de dlar / libra.
Ejemplo 3 : En el espacio de dos dimensiones, sea z(x
1
, x
2
) = z(x)
= potencia mineralizada en un yacimiento de nitratos:
Figura 3.5: Depsito de nitratos-yodo: La zona mineralizada, de color
rojo en la figura, se llama caliche.
Ejemplo 4 : En el espacio de tres dimensiones, sea z(x
1
, x
2
, x
3
) = z(x) =
Ley de Cu en el punto x dentro de un depsito masivo:
Figura 3.6: Caso tpico de depsito de xidos-sulfuros. La capa superior
corresponde a grava.
Figura 3.7. Planta en mina. Leyes de bloques de 25mx25mx15m.
Zona de xidos.
En un depsito de este tipo se puede comprobar que la ley de cobre se
comporta de manera diferente en la zona de xidos y en la zona de sulfuros.
Esto nos conduce a considerar para la ley de cobre, dos variables
regionalizadas diferentes.
Ejemplo 5 : En el espacio de tres dimensiones, sea z(x
1
, x
2
, x
3
) = z(x)
= densidad de la roca en un punto x dentro de un depsito minero:
Figura 3.8: Densidades superficiales en ton/m
3
en un yacimiento de cobre.
La densidad in situ, medida en toneladas / m
3
es una variable importante
para cubicar los recursos de un depsito minero.
Los ejemplos anteriores nos muestran que una variable regionalizada es
simplemente una funcin z(x) del punto x.Sin embargo, esta funcin no
se comporta como las funciones que se estudian en Matemticas: En general
z(x) es muy desordenada en su variacin espacial y no se podr expresar,
en particular, z(x) como un polinomio (ver figuras 3.1 al 3.8).
3.4. CAMPO Y SOPORTE
Se llama campo a la zona en la cual se estudia la variable regionalizada.
Para definir bien el campo (por ejemplo los lmites) es necesario utilizar un
modelo geolgico adecuado, por ejemplo, en la figura 3.6 se podran
distinguir dos campos disjuntos, los cuales se pueden tratar de manera
independiente y corresponden a unidades geolgicas: Unidad xidos y
unidad sulfuros.
Entonces en un mismo depsito minero D pueden haber varios campos o
unidades D
1
, D
2
, ..., D
k
, en general disjuntos, cuya reunin es el conjunto D.
Figura 3.9: Unidades D
1
, D
2
, D
3
, D
4
en una seccin del depsito de cobre
porfdico de Inca de Oro. Las unidades corresponden a una
interpretacin geolgica a partir de los sondajes.
En algunas situaciones, cada campo debera tener un tratamiento
geoestadstico diferente: Para estimar una zona V contenida en una cierta
unidad, slo se utilizan datos de la misma unidad: Se dice que se tienen
fronteras dura s .
Las fronteras duras entre las unidades D
r
y D
s
se justifican cuando
existe independencia entre las leyes de D
r
y D
s
(es decir existe una
discontinuidad geolgica). La independencia debe ser comprobada
mediante un anlisis de las leyes en las fronteras de las unidades D
r
y
D
s
.
El soporte es el volumen de la muestra que define la variable regionalizada.
A menudo el soporte es un cilindro (figura 3.10) llamado testigo:
Figura 3.10: Un testigo. Tiene un cierto largo l y un
cierto dimetro d.
z(x) ser entonces la ley del volumen de muestra localizado en el
punto x., en el ejemplo 5 el soporte es un cilindro vertical de 15 metros
de largo.
En general, en el estudio de una variable regionalizada no es conveniente
mezclar soportes de tamaos diferentes.
En el caso en que los testigos que constituyen el sondaje son de tamao
irregular, es necesario hacer una operacin la cual consiste en regularizar o
compositar el sondaje, es decir disponer de datos (compsitos) de longitud
constante (figura 3.11).
Figura 3.11: Regularizacin de un sondaje a un largo constante b. Esta
operacin produce errores.
La figura 3.12 muestra una seccin transversal en un depsito de xidos de
cobre. Las lneas representan los sondajes de exploracin. El punto rojo se
denomina collar del sondaje. El collar est caracterizado por las
coordenadas x
0
, y
0
, z
0
y por dos ngulos:
( , ) Azimuth e
inclinacin.
Figura 3.12: Seccin en el depsito de cobre. Se observan las unidades grava
( estril), lixiviado, xidos y sulfuros. Un compsito est caracterizado por sus
coordenadas x, y, z, las leyes de cobre total, de cobre soluble, un cdigo que
indica la unidad, adems del nombre del sondaje que contiene al compsito.
Cada compsito est caracterizado por sus coordenadas x, y, z, sus leyes,
un cdigo que indica el dominio o unidad geolgica y la identificacin del
sondaje, eventualmente otra informacin. Se tiene as la base de datos de
sondajes del depsito, la cual, en formato de texto, puede ser incorporada
en cualquier paquete computacional.
Para tratar las desviaciones de los sondajes, se divide el sondaje en tramos
rectilneos
L
1
, L
2
, ,
L
r
.
Figura 3.13: Azimuth (se mide en grados desde el norte) e inclinacin (se
mide en grados desde la horizontal) de un sondaje.
3.5. VARIABLES ADITIVAS
En general, en la estimacin de recursos mineros conviene utilizar
variables aditivas. Una variable regionalizada es aditiva cuando se cumple
la condicin siguiente: Se conoce la variable z en dos soportes V1 y V2, con
valores medios respectivos z1 y z2, entonces el valor medio de la variable z
en el soporte homogeneizado V1 U V2 es igual al promedio ponderado de
z1 y z2, en particular si V1 = V2, entonces el valor medio de la variable es
(z1 + z2) / 2.
Por ejemplo, la variable ndice de trabajo WI(x) (parmetro de
conminucin que expresa la resistencia de la roca a ser molida, en
Kwh/ton) no es aditivo. Sin embargo es muy importante disponer de un
modelo del WI en una mina.
Otros casos de variables no aditivas son, la recuperacin metalrgica, y, en
una mina de xidos de cobre, la razn (llamada solubilidad) (ley de CuS) /
(ley de CuT).
En el caso de una veta (figura 3.14) el sondaje S determina una potencia
aparente p (y una potencia real p0) y una ley z. La ley z no es aditiva. En
este caso hay que estudiar dos variables aditivas: La potencia p0 y la
acumulacin en un punto x, definida como el producto de la ley por la
potencia.
Figura 3.14: Veta y variables aditivas.
3.6. OBJETIVOS DE LA TEORIA
La teora de las variables regionalizadas se propone dos objetivos
principales:
Expresar las caractersticas estructurales de una variable regionalizada
mediante una forma matemtica adecuada.
Resolver, de manera satisfactoria, el problema de la estimacin de una
variable regionalizada a partir de un conjunto de muestras, asignando
errores a las estimaciones.
Estos dos objetivos estn relacionados: El error de estimacin
depende de las caractersticas estructurales (continuidad, anisotropas) y
se tendr un error mayor si la variable regionalizada es ms irregular y
discontinua en su variacin espacial.
Ejemplo: La figura 3.15 siguiente representa el caso de una variable
regionalizada z(x)
= ley de cobre definida en un soporte cuadrado de lado axa: La ley de
corte es w = 0.5.
Se definen otros soportes (tamao del bloque): (a)x(2a), (2a)x(a), (2a)x(2a),
(3a)x(3a) y
(6a)x(6a).
T es el tonelaje sobre la ley de corte medido en nmero de bloques de
tamao axa. m es la ley media de los bloques cuya ley es superior a la ley
de corte.
B es el beneficio convencional, definido por:
B = T ( m c )
La importancia econmica de la anisotropa y del soporte es evidente.
Figura 3.15: Importancia econmica del soporte y la anisotropa. A
medida que aumenta el soporte, se diluyen las leyes. Observar que la ley
de corte es mayor que la ley media. Repetir los clculos para una ley de
corte de 0.40
3.7. EL MODELO MATEMATICO DE LA GEOESTADISTICA: LAS
FUNCIONES ALEATORIAS
Para alcanzar los objetivos propuestos es necesario disponer de un
modelo
matemtico. La geoestadstica utiliza una cierta interpretacin
probabilstica de la variable regionalizada, mediante el modelo de las
funciones aleatorias.
En teora de probabilidad una serie de k variables aleatorias dependientes
Z
1
, Z
2
, ..., Z
k
definen un vector aleatorio Z = (Z
1
, Z
2
, ..., Z
k
) con k
componentes. Anlogamente, cuando el valor de una funcin Z(x) es una
variable aleatoria, al variar x en el espacio R
n
de n dimensiones, Z(x) define
una familia de variables aleatorias. A cada punto x
0
del espacio le
corresponde una variable aleatoria Z(x
0
). La funcin aleatoria (F.A) Z(x)
puede tambin interpretarse como una funcin del punto x, cuyo valor en
x
0
no es un nmero sino una variable aleatoria. Ntese que en general las
variables aleatorias correspondientes a dos puntos Z(x
1
) y Z(x
2
) no tienen
porqu ser independientes.
Un experimento sobre la F.A. Z(x) proporciona una funcin ordinaria z(x)
llamada trayectoria o realizacin de la F.A. Z(x); estas realizaciones son a
menudo muy irregulares, como puede apreciarse en la figura 3.16.
Figura 3.16: Realizacin de la funcin aleatoria Z(x)
La hiptesis constitutiva de la geoestadstica consiste en afirmar que la
variable regionalizada en estudio es la realizacin de una cierta funcin
aleatoria. Lo anterior equivale a decir que las leyes de nuestro yacimiento
se generaron a partir de un proceso o experimento muy complejo.
Figura 3.17: Funcin aleatoria y variable regionalizada. Los colores
indican rangos de la variable.
La Geoestadstica considera una variable regionalizada a z(x) en estudio,
como una realizacin particular de una cierta funcin aleatoria Z(x). Una
variable distribuida en el espacio de forma que presenta una estructura
espacial de correlacin se dice que esta regionalizada. As, una variable
regionalizada (V.R.) es una funcin que representa el desplazamiento en el
espacio de una cierta magnitud asociada a un fenmeno natural. En
adelante no haremos distincin entre la funcin aleatoria Z(x) y su
realizacin z(x).
Es muy frecuente observar en una V.R. dos aspectos complementarios y
aparentemente contradictorios:
Un aspecto aleatorio asociado con las variaciones errticas e
impredecibles de la variable, y.
Un aspecto general estructurado que refleja en cierta forma las
caractersticas globales de variacin del fenmeno regionalizado.
La interpretacin probabilstica de una V.R. como realizacin de una F.A.
Z(x) tiene sentido operativo slo si es posible inferir, al menos en parte, la
funcin de distribucin o ley de probabilidad de Z(x). En general, no es
posible la inferencia estadstica a partir de una sola realizacin, de la
misma manera que no es posible reconstituir la funcin de distribucin de
una variable aleatoria a partir de una sola observacin. Para hacer posible
la inferencia estadstica, se hace imprescindible introducir hiptesis
adicionales acerca de Z(x) para poder reducir el nmero de "parmetros"
de los que depende la funcin de distribucin. Estas hiptesis tienen que
ver con la homogeneidad espacial de la funcin aleatoria. Por ejemplo,
suponer que la funcin aleatoria es estacionaria puede pensarse como
equivalente a que la funcin aleatoria se "repite" en el espacio y esta
"repeticin" proporciona la informacin equivalente a muchas realizaciones
de la misma F.A., permitiendo de esta forma la posibilidad de la inferencia
estadstica.
Observaciones:
a) No se puede afirmar que una variable regionalizada es una funcin
aleatoria.
Esto tendra el mismo sentido que decir el nmero 6 es una variable
aleatoria.
El enunciado correcto de la hiptesis probabilstica de la
geoestadstica es: z(x)
es la realizacin de una funcin aleatoria Z(x).
b) Para que esta hiptesis probabilstica tenga un sentido real, es
necesario poder reconstituir, al menos en parte, la ley de
probabilidad de la funcin aleatoria, lo cual supone que la inferencia
estadstica (es decir el clculo de parmetros que caracterizan la
funcin aleatoria) es posible. Es necesario introducir una
hiptesis suplementaria a la funcin aleatoria Z(x). Esta hiptesis es
conocida como hiptesis de estacionaridad y expresa que la
variacin espacial de las realizaciones de Z(x) deben ser
homogneas. Esta hiptesis se puede debilitar al suponer que las
diferencias Z(x) Z(y) son estacionarias localmente (lo cual se
conoce como hiptesis intrnseca).
La estacionaridad es una propiedad del modelo (funcin aleatoria) y
quedar ms clara cuando se estudie el clculo de variogramas.
3.8. FUNCION DE DISTRIBUCION Y MOMENTOS DE UNA
FUNCION ALEATORIA
Considrese una funcin aleatoria Z(x) definida en R
n
. Para
cualesquiera k puntos x
1
, x
2
, ..., x
k
, el vector aleatorio [Z(x
1
), Z(x
2
), ...,
Z(x
k
)] se caracteriza por su funcin de distribucin k-variable.
[ ]
k k k x x x
Z x Z Z x Z Z x Z ob Z Z Z F
k
) ( ,..., ) ( , ) ( Pr ) ,..., , (
2 2 1 1 2 1 ,..., ,
2 1
(3.1)
El conjunto de todas estas distribuciones para todo valor de k y para
cualquier seleccin de puntos en R
n
constituye la "ley espacial de
probabilidad" de la funcin aleatoria Z(x).
El momento de primer orden es la esperanza matemtica definida
como:
[ ] ) ( ) ( x m x Z E
(3.2)
Aunque la funcin m(x) se conoce con los nombres de deriva y
tendencia, algunos autores prefieren la utilizacin del trmino deriva.
Los tres momentos de segundo orden a ser considerados son:
a) La varianza o momento de segundo orden de Z(x) respecto
a m(x).
[ ] [ ] { }
2 2
) ( ) ( ) ( x m x Z E x Z Var
(3.3)
b) La covarianza de dos variables aleatorias Z(x
i
) y Z(x
j
), se
define como:
[ ][ ] { } ) ( ) ( ) ( ) ( ) , (
j j i i j i
x m x Z x m x Z E x x C
(3.4)
Es en general una funcin de x
i
y x
j
. Esta funcin se llama a veces
funcin de autocovarianza.
c) El semivariograma, llamado muchas veces indistintamente
como el variograma. En adelante cualquiera de estos
nombres que se use, har referencia a la siguiente
definicin:
[ ] { }
2
) ( ) (
2
1
) , (
j i j i
x Z x Z E x x
(3.5)
Ntese que tanto la varianza como el semivariograma son siempre
positivos, mientras que la covarianza puede adoptar valores
negativos.
3.9. FUNCIONES ALEATORIAS ESTACIONARIAS
Se dice que una funcin aleatoria es estrictamente estacionaria s su
funcin de distribucin (4.1) es invariante respecto a cualquier
traslacin del vector h, o lo que es lo mismo, la funcin de
distribucin del vector aleatorio [Z(x
1
), Z(x
2
),..., Z(x
k
)] es idntica a la
del vector [Z(x
1
+h), Z(x
2
+h),..., Z(x
k
+h)] para cualquier h. Sin
embargo, puesto que la Geoestadstica lineal se basa en los dos
primeros momentos de la funcin aleatoria, es suficiente suponer
que estos dos momentos existen y limitar la hiptesis de
estacionariedad a los dos primeros momentos. Se dice que una
funcin aleatoria Z(x) es estacionaria de orden 2 o de segundo orden,
s:
a) E[Z(x)] existe y no depende de x, es decir:
[ ] m x Z E ) ( para todo x (3.6)
b) Para toda parejas de variables aleatorias {Z(x+h), Z(x)}su covarianza existe y slo
depende del vector de separacin h, es decir:
[ ] ) ( ) ( ) ( ) , (
2
h C m x Z h x Z E x h x C + + (3.7)
La estacionariedad de la covarianza implica que la varianza Var[Z(x)]
existe, es finita y no depende de x, es decir, Var[Z(x)] = C(0).
c) Bajo esta misma hiptesis, el semivariograma tambin es
estacionario y se cumple que:
[ ] { }
2
) ( ) (
2
1
) ( ) , ( x Z h x Z E h x h x + + (3.8)
Dado que h es un vector y una funcin escalar, en general
puede depender tanto de la magnitud
h h
como de la orientacin
u = h/h. Es decir (h) puede ser anisotrpica. Sin embargo, en la
mayora de los casos el nmero de datos no es suficiente para
estimar esta anisotropa y se suele hacer la hipstesis de suponer
que es independiente de la orientacin de h y tomarlo como
isotrpico.
3.10. RELACION ENTRE EL SEMIVARIOGRAMA Y LA
COVARIANZA
Cuando la funcin aleatoria es estacionaria, la relacin entre el
semivariograma y la covarianza es inmediata, ya que de acuerdo con
la ecuacin (4.8) se cumple:
[ ] { } + +
2
) ( ) (
2
1
) ( m x Z m h x Z E h
[ ] [ ] [ ] { } + + + ) ) ( )( ) ( ( 2 ) ( ) (
2
1
2 2
m x Z m h x Z E m x Z E m h x Z E
[ ] ) ) ( )( ) ( ( ) ( m x Z m h x Z E Z Var +
(3.9)
y puesto que de (3.7) se deduce que:
[ ][ ] m x Z m h x Z E h C + ) ( ) ( ) (
(3.10)
se obtiene finalmente que:
) ( ) ( ) ( h C Z Var h
(3.11)
Es decir, bajo la hiptesis de estacionariedad el semivariograma
resulta ser igual a la varianza menos la covarianza, por lo que la
equivalencia es total (vase la figura 4.2) sin embargo cuando la
media vara "lentamente" de forma que en la escala local se puede
suponer constante (aunque desconocida), el semivariograma es
independiente del valor local de dicha media, mientras que la
autocovarianza requiere su estimacin. Esto introduce un sesgo en el
clculo de la funcin de autocovarianza. En este sentido, (h) es un
estadstico ms conveniente que C(h), para aquellas funciones cuya
media varia lentamente.
Figura 4.2: Relacin entre el semivariograma y la funcin de
covarianza
3.11. EL CORRELOGRAMA
Una tercera funcin que tambin caracteriza la estructura de
correlacin es el correlograma (h) definido como el cociente entre la
covarianza C(h) y la varianza:
) 0 (
) (
1
) 0 (
) (
) (
C
h
C
h C
h
(3.12)