Beruflich Dokumente
Kultur Dokumente
INTRODUCCION
Para poner en prctica lo aprendido en el curso de geoestadstica
especficamente a nuestro tema el anlisis exploratorio de datos se
ha llevado acabo el presente trabajo que es una aplicacin que
revalidara la teora ,se basa en el anlisis de una data real de una
yacimiento de muestras obtenidas del sondaje de sus exploraciones
llamado la data de toromocho en alusin al nombre de la unidad
minera en un campo de estudio real en minera se lleva a cabo los
procedimientos que se detallaran ms adelante aunque de una
manera ms completa y ms minuciosa as este trabajo es una
aproximacin a menor escala del trabajo que se realiza en la minera
en materia del anlisis de sus datos de exploracin y que es un
primordial que se haga lo ms preciso posible una mal anlisis dar
malos resultados y por ende significara el fracaso de las operaciones
de una unidad minera por ello la importancia del muestreo y el
anlisis e interpretaciones que se haga con estos datos que si bien es
un anlisis ms estadstico que geoestadistico ayuda en el propsito
de lograr establecer la manera como estn distribuidas las leyes en el
yacimiento para poder hacer una buena estimacin de los recursos
as el anlisis
exploratorio de datos constituye la
etapa
inicial en el proceso de
estimacin de reservas que
luego seguirn en otros
procedimientos como el
variograma para su
posterior kriging.
cobre.
fig. Apreciamos los 8009 datos que procesaremos para nuestro anlisis
estadstico
Para tener una idea de cmo est distribuido vemos las leyes de cu se hizo
distribuciones agrupando los datos y observndolos en un grfico lo mismo
se hizo pero ordenando las muestras de menor a mayor.
De esta manera podemos notar como estn distribuidas las leyes as como
ya podemos notar la presencia de los outliers valores atpicos que salen al
hacer los anlisis pero que debemos determinar si estos lo son realmente o
si son solo errores de muestreo o mal digitados o mal analizados como
muchas veces puede suceder para ello se debe volver a analizar y
posteriormente eliminarlos o hacer las correcciones del caso.
Adems Podemos apreciar la gran cantidad de datos que vamos a procesar
a continuacin el anlisis estadstico con Excel con la finalidad de calcular
los parmetros para su distribucin.
Fig. Observamos los datos a partir del cual haremos el anlisis estadstico
Hallamos el rango el dato mximo menos el mnimo, el criterio de stuges
para hallar el numero de intervalos k=1+3.32*logN obtenemos
redondeando 14 clases o intervalos tambin hallamos la amplitud o periodo
de cada clase
histograma- ley CU
4000
3500
3000
2500
Frecuencia
2000
1500
1000
500
10
11
Obtenemos los siguientes resultados sea calculado cada clase con sus
respectiva amplitud hasta completar el dato mximo para las 14 clases se
halla el Xi o promedio de cada clase adems de su frecuencia es decir la
cantidad de datos entre intervalo de clase lo cual al sumar debemos llegar a
los 8009 datos obtenido hallamos tambin el hi y Hi que son frecuencia
relativa simple y frecuencia relativa acumulada respectivamente las cuales
para confirmar que el clculo fue bien hecho debe llegar a la unidad.
Adems de otros datos que se calculan por defecto para los diagramas de
anlisis pero que son de vital importancia para hacer una buena distribucin
de los datos de la data. Adems se calcula la media y la varianza para
calcular tambin el coeficiente de asimetra y el de kurtosis para la
completa interpretacin del histograma
Fig. Histograma de frecuencias de la data toromocho
12
13
14
INTERPRETACIONES
Este grafico nos da los resultado as podemos apreciar la cantidad de cores
con su respectiva ley por lo que podemos apreciar de la clase 1 es decir del
intervalo de 0.002 a 0.321 tenemos 3430 muestras, de la clase 2 de
intervalo de 0.321 a 0.639 tenemos 2883 muestras y la clase 3 de intervalo
de 0.639 a 0.958 tenemos 1153 muestras; podemos decir que existe una
buena cantidad de cores con leyes bajas.
De la clase 4 a la clase 8 la cantidad de cores va a bajando a medida que la
ley va a aumentando y tambin se presenta nula mineralizacin de la clase
9 a la clase 13 y apenas un solo dato con una ley alta de 4.145 a 4.464 es
decir pocos cores con muy buena mineralizacin eso contando a las 5
muestras de la clase 7 y 8 que tienen leyes que varan entre 1.914 a 2.552
pero ese dato se puede tratar como un posible outliers que tenemos que
analizar para descartar errores que se suelen cometer en estos
procedimientos como errores de muestreo, de digitacin entre otros o si
representan una mineralizacin importante existente si encontramos que
son datos propios del fenmeno estaramos frente a un probable recurso
mineral econmicamente explotable luego obviamente del estudio y
planeamiento de minado. Probablemente la existencia de dos
mineralizaciones diferentes con diferencias muy marcadas en cuanto a su
contenido.
kurtosis Ac=7,4425 es decir es mayor a tres lo que hace nos indica que su
distribucin es de mayor altura que la distribucin normal. Adems tenemos
una distribucin log normal.
se logra visualizar los outliers cosa por la que necesitamos de la ayuda del
spss.
Aqu henos considerado usar tambin las otras variables del cu lo que son el
CUS, CUCN Y CUR que son el cobre soluble, cianurado y recuperable
respectivamente para un anlisis ms amplio del diagrama de cajas aunque
nuestro inters se centra en el cu total
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
CU
CUS
CUCN
CUR
EVALUACIN DE LA MORMALIDAD DE
LOS DATOS
Como obtuvimos una distribucin log normal de leyes de Cu entonces lo
siguiente es normalizar nuestros datos es decir llevarlos a una distribucin
normal para ello se lleva a cabo el estudio de la normalidad existen diversos
mtodos para la evaluacin de la normalidad de un conjunto de datos para
nuestro caso se crey conveniente usar un mtodo sencillo y practico como
es el mtodo grafico es hacer el diagrama de cuantiles(QQ-plot) que
detallaremos pero cabe resaltar que tambin se normaliza con el contraste
de hiptesis o Prueba de normalidad de Kolmogorov que es un poco ms
tediosa pero con el diagrama de cuantiles de forma grfica podremos
normalizar nuestra distribucin.
GRFICO DE CUANTIL (QQ-PLOT) EN EXCEL
La construccin de este grafico de probabilidad normal se realiza a travs
de los cuantiles de la normal estndar, de forma que aceptaremos la
hiptesis de normalidad de nuestros datos siempre que los puntos en el
grafico tengan un comportamiento suficientemente rectilneo
Grfico Q-Q nos permite comparar los cuantiles obtenidos de la muestra
con los de la distribucin terica. Este grfico sirve para determinar si un
conjunto de datos se ajusta a una distribucin normal. La normalidad de los
datos ser perfecta cuando los puntos estn sobre la lnea recta
Fig.
Muestra los tipos de graficas de cuantiles o grficos de probabilidad normal
Normalmente se a=0.5 pero para obtener una mayor precisin otros autores
como Kimbal (Kimbal B., Journal of the American Statistical Association
recomiendan el valor de a =3/8 esta esperanza como medida de localizacin
tiene una mayor aproximacin a la distribucin normal por lo que la formula
seria:
INTERPRETACION
De acuerdo al estudio de la normalidad vemos que nuestro resultado fue
una distribucin Platicrtica es decir presenta una kurtosis diferente a la
normal en este caso es menor de 3.
Es importante destacar que esta representacin de dispersin de estos
datos es para lograr la normalidad de los datos lo cual se logra cuando los
puntos estn sobre una lnea recta adems de que hay ciertos parmetros
que considera este mtodo de grafica de cuantiles que otros no toman en
cuenta pero que al fin de cuentas buscan la normalidad de los datos.
Fig. Muestra los resultados con sus ubicaciones en el diagrama de cajas con
spss
Antes de analizar a nuestro ejemplo primeramente analicemos que
informacin nos aporta el diagrama de cajas en el spss que es casi similar al
Excel pero que la diferencia est en la manera de analizarlo el spss es ms
completo y permite la observacin de los outliers.
En este software ya se puede observar los outliers el cual era el objetivo
para el anlisis del diagrama de cajas y bigotes, estos valores atpicos que
escapan como datos aislados para luego hacer el anlisis respectivo que se
hacer ante el tratamiento de outliers.
CONCLUSIONES
Para eso este anlisis estadstico de las muestras recogidas de los datos de
campo recolectadas de los sondajes, en nuestra ejemplo de aplicacin de la
data toromocho la cual se analiz las muestras se organiz la informacin y
se hizo el anlisis estadstico obtenindose una distribucin de leyes de
cobre log normal como era de esperar pues es normal en ciencias de la
tierra este tipo de distribucin. Pero la cual debemos normalizar pralo que
se utiliz el diagrama de cuantiles esta grafica de probabilidad normal lo
cual estima a una distribucin normal mediante una recta adems de ello
mediante el grafico de cajas y bigotes se pudo observar los datos atpicos
los outliers los cuales sern evaluados para su tratamiento todo el presente
anlisis se realiz en Excel y en el software spss para la aplicacin de
nuestra data de leyes de cu de toromocho.
BIBLIOGRAFIA
www.dmae.upm.es/...distribuciones.../DISTRIBUCI_N
%20LOG.doc
http://www.scielo.cl/scielo.php?pid=S071602081998000100006&script=sci_arttext
http://www.youtube.com/watch?v=LV6lWTHvIk4
http://www.youtube.com/watch?v=yXGKpJEwphE