You are on page 1of 7

Aplicacin de herramientas de inteligencia de negocios en modelamiento geometalrgico

Vernica Escobar Gonzlez , Claudio Barrientos Ochoa, Sergio Barrientos Ochoa, Direccin de Modelamiento Geometalrgico Codelco Norte

RESUMEN La Direccin de Modelamiento Geometalrgico de Codelco Norte tiene como objetivo reconocer el comportamiento y explicar la variabilidad de la respuesta metalrgica para los distintos minerales del yacimiento, tanto en laboratorio como en planta, sirviendo as de sustento a la planificacin minera. De esta manera es posible disminuir los niveles de incertidumbre asociados a los distintos Programas de Produccin, gestionar de mejor forma las mezclas de alimentacin desde el punto de vista de respuesta operacional, adems de servir de apoyo a la gestin de los procesos en planta concentradora y aguas abajo, entre otros beneficios. La aplicacin de las herramientas de Inteligencia de Negocios, como la construccin de un Data Mart, el uso de algoritmos de Minera de Datos y el desarrollo de Sistemas de Apoyo a la Decisin han sido aplicadas con xito en la Direccin y se han traducido en la optimizacin de recursos humanos, disminucin en los tiempos de respuesta, aumento de la capacidad predictiva de los modelos, mayor tratamiento de volmenes de datos, mejor entendimiento de los procesos, consideracin del contexto geolgico-metalrgico en lugar de variables aisladas y la trazabilidad de los datos trabajados entre otras. La Direccin sigue desarrollando aplicaciones y analizando nuevas formas de modelamiento, entendiendo que uno de los activos ms importantes de la organizacin es su informacin, por tanto un adecuado tratamiento de los datos en todos los niveles se traducir en un mejor entendimiento de la respuesta metalrgica y constituir una ventaja competitiva. Este tipo de desarrollos sustentan las predicciones de parmetros metalrgicos en la planificacin minera en Codelco Norte y pueden ser extendidos a otras reas de ingeniera y anlisis.

INTRODUCCIN La informacin reduce nuestra incertidumbre sobre algn aspecto de la realidad y, por tanto, nos permite tomar mejores decisiones. Desde la antigedad, los sistemas de informacin se han recopilado y organizado para asistir en la Toma de Decisiones. En las ltimas dcadas la modernizacin de las bases de datos ha permitido almacenar, organizar y recuperar grandes volmenes de informacin. Desgraciadamente, gran parte de esta informacin se genera con un fin concreto y posteriormente no se analiza ni integra con el resto de conocimiento del dominio de actuacin. Un claro ejemplo de ello son las bases de datos transaccionales (sistema de informacin de una organizacin) que sirven para el funcionamiento de las aplicaciones del da a da, pero que raramente se utiliza con fines analticos. Esto se debe, fundamentalmente, a que no se sabe cmo hacerlo, es decir, no se dispone de las personas y herramientas indicadas para ello.

La Direccin de Modelamiento Geometalrgico de Codelco Norte tiene como objetivo reconocer el comportamiento y explicar la variabilidad de la respuesta metalrgica para los distintos minerales del yacimiento, tanto en laboratorio como en planta, sirviendo as de sustento a la planificacin minera. De esta manera es posible disminuir los niveles de incertidumbre asociados a los distintos Programas de Produccin, gestionar de mejor forma las mezclas de alimentacin desde el punto de vista de respuesta operacional, adems de servir de apoyo a la gestin de los procesos en planta concentradora y aguas abajo, entre otros beneficios.

Business Intelligence is a method of storing and presenting key enterprise data so that anyone in your company can quickly and easily ask questions of accurate and timely data. Effective BI allows end users to use data to understand why your business got the particular results that it did, to decide on courses of action based on past data, and to accurately forecast future results. (Lynn Langit)[1]

MOTIVACIN Las actividades relacionadas con la anticipacin en los negocios estn tomando cada vez mayor relevancia, la diferencia entre las organizaciones la hace el conocimiento que son capaces de extraer de sus propias prcticas. Bajo esta premisa, la prediccin de la respuesta metalrgica se torna de vital importancia, ya que est orientada a la disminucin de incertidumbre para la toma de decisiones. Es por ello que la Direccin de Modelamiento Geometalrgico implementa distintas herramientas de Inteligencia de Negocios en sus procesos como Direccin, como la aplicacin de algoritmos de Minera de Datos para el modelamiento predictivo de recuperaciones en planta, construccin de Data Mart y desarrollo de aplicaciones de reportes automatizados. METODOLOGA La Direccin sigue la metodologa KDD (Knowledge Discovery from Databases), que consiste bsicamente en el proceso de extraccin de conocimiento oculto y til a partir de los datos (en este caso corresponde a data histrica de los procesos e informacin de muestras geometalrgicas) para apoyar la toma de decisiones. Las etapas incluidas en la metodologa son: consolidacin, seleccin y preprocesamiento de datos, anlisis y modelamiento (minera de datos), interpretacin y evaluacin, visualizacin del conocimiento y finalmente apoyo a la toma de decisiones. Cabe sealar que el proceso es continuo y recursivo, por ejemplo en ocasiones dependiendo de los resultados se debe volver a la etapa de procesamiento de los datos. La figura 2 ilustra las etapas incluidas en la metodologa KDD.

Figura 2 Metodologa KDD (Knowledge Discovery from Databases) A continuacin se analizarn con mayor detalle aquellas etapas relacionadas con mejoras en los procedimientos aplicadas directamente y an en desarrollo por la Direccin: - Consolidacin de Datos Anlisis y Modelamiento Visualizacin del Conocimiento

Consolidacin de Datos La informacin geolgica y metalrgica necesaria para la generacin y posterior aplicacin de modelos se encuentra disponible en diferentes fuentes (archivos de texto, planillas Excel, Bases de Datos) con diferentes formatos, lo que lo hace que la extraccin manual de ellos (inicialmente practicada) sea costosa en tiempo y recursos, adems de susceptible a errores. Muchas reas orientadas al anlisis no cuentan con bases de datos analticas y sistemas automticos de consolidacin, es por ello que deben realizar el proceso de manera manual, con todas las desventajas asociadas. Un Data Mart es una versin reducida de un Almacn de Datos (Data Warehouse), su alcance es un rea de negocio, en este caso la Direccin de Modelamiento Geometalrgico. Consiste en una base de datos analtica (orientada a las consultas y al anlisis) que sirve de soporte a los anlisis posteriores incluidos en el proceso de Minera de Datos.

Debido a la orientacin analtica de la Direccin, es necesario contar con grandes volmenes de datos, entonces se torna fundamental que el Data Mart se alimente de manera automtica por el costo asociado a la extraccin de informacin. En la etapa de Consolidacin se recolectan los datos de distintas fuentes (Planificacin, Geologa, Planta Concentradora, etc.) y se les aplican mecanismo de aseguramiento de integridad, los que tienen por objetivo validar que los datos sean consistentes en su contexto. Una vez validada la informacin es llevada al nivel de detalle requerido (da, mes, ao, turno, muestra, etc.) y almacenado en la base de datos propiamente tal. En la etapa de Consolidacin se recolectan los datos de distintas fuentes (Planificacin, Geologa, Planta Concentradora, etc.) y se les aplican mecanismo de aseguramiento de integridad, los que tienen por objetivo validar que los datos sean consistentes en su contexto. Una vez validada la informacin es llevada al nivel de detalle requerido (da, mes, ao, turno, muestra, etc.) y almacenado en la base de datos propiamente tal. Las ventajas de la extraccin de datos automtica y la disposicin de un Data Mart en la Direccin son las siguientes: Reduccin en el costo de extraccin de informacin, de esta manera el personal experto puede invertir ms tiempo en realizar nuevos anlisis y construir modelos, en vez de consolidar datos manualmente. Incremento del nmero de variables disponibles para el anlisis, debido a que existe una reduccin en el costo de extraccin. Mejora en la calidad de los datos, con la aplicacin de reglas de integridad disminuye la probabilidad de encontrar en el anlisis informacin fuera de contexto. La informacin es preprocesada para calcular un promedio por turno, da, semana o mes, por lo que el almacn de datos solo contiene informacin til para el anlisis.

Anlisis y Modelamiento

Etapa en la cual se realizan distintas actividades orientadas a la extraccin de conocimiento en s. Usualmente se comienza con un Anlisis Exploratorio de los Datos (EDA), que corresponde a un conjunto de procedimientos que apuntan al entendimiento de la data y las relaciones entre las variables. Generalmente desarrollado a travs de clculos de estadsticos y tablas resumen, como tambin usa herramientas de presentacin grfica de los datos. EDA fue propuesto por Tukey (1977) [2] y las actuales prcticas comprenden bsicamente los siguientes pasos, que son considerados habitualmente por la Direccin en los anlisis que realiza: Estadstica Descriptiva, donde se examina la estadstica univariada de cada una de las variables Anlisis de las distribuciones de cada variable y evolucin temporal Clculo de los coeficientes de correlacin entre las variables en estudio Deteccin de valores fuera de rango (outliers)

Exploracin de relaciones no lineales entre diferentes variables utilizando grficos de dispersin

El modelamiento corresponde a la resolucin de alguna tarea en particular, como predecir, agrupar, explicar, clasificar, entre otras. Por lo tanto se debe seleccionar una herramienta adecuada que sea capaz de dar respuesta a la necesidad planteada y donde se cumplan los requerimientos de la herramienta en s, variables numricas continuas por ejemplo en el caso de la regresin lineal.

Data mining is the extraction of implicit, previously unknown, and potentially useful information from data. (Witten & Frank, 2000)[3] Las funciones estadsticas ofrecen diversos mtodos de pronstico para apoyar la toma de decisiones y resultan de gran utilidad al momento de descubrir patrones o construir modelos de prediccin. La Minera de Datos ofrece mtodos ms robustos de modelamiento respecto a la estadstica clsica y tambin requieren de una mayor potencia de clculo, lo que hoy en da ya no supone un problema. Siguiendo la metodologa KDD, la Direccin de Modelamiento Geometalrgico ha construido diversos modelos predictivos de recuperaciones de cobre, molibdeno y leyes de Concentrado Colectivo mediante tcnicas de Minera de Datos como Redes Neuronales. Emblemtico es el caso de la recuperacin de cobre, donde el modelo predictivo de redes neuronales ha sido capaz de predecir la recuperacin real diaria en planta concentradora con errores cercanos a 1% [4] utilizando variables predictoras geolgicas como mineralogas, leyes y alteraciones. El modelo de redes neuronales aprende de la historia y anticipa de manera intrnseca los parmetros de la operacin, logrando predecir la recuperacin y detectar anomalas en el proceso. Los modelos son sometidos a una constante evaluacin por medio de conciliaciones semanales. Adems de encontrar grupos de comportamientos geolgicos-metalrgicos mediante tcnicas de clustering como K-Medias, como parte del anlisis descriptivo previo al modelamiento predictivo. Los beneficios asociados al uso de la Minera de Datos son varios: Anlisis Multivariable robusto y captura patrones complejos Mayor Capacidad de Procesamiento de Datos Aumento en la Precisin de las Predicciones Posibilita aplicacin de nuevas formas de Visualizacin de Conocimiento Los modelos son evaluados y se cuantifican los errores Se descubren nuevas interdependencias entre las variables geolgicas y metalrgicas

Visualizacin del Conocimiento La visualizacin del resultado de las herramientas de Inteligencia de Negocios utilizadas con anterioridad se encuentran comprendidas en un Sistema de Apoyo a la Decisin (DSS, Decision Support System), el cual reporta de manera automatizada la informacin contenida en el Data Mart (variables de un plan minero por ejemplo) con su respectivo resultado en la evaluacin del modelo previamente construido. En la actualidad el DSS es utilizado para predecir el comportamiento de las variables metalrgicas en la planificacin de corto plazo y visualizar las variables geolgicas y qumicas de inters (mineralogas de mena, participacin de los dominios de alteracin y leyes programadas). La figura 3 ejemplifica el DSS utilizado en la planificacin semanal de produccin. Se puede visualizar que expone el da perteneciente a la semana con su respectiva prediccin. Adems de dos grficas, la primera representa el comportamiento de la mineraloga durante el periodo de la planificacin, mientras que la segunda la mineraloga del da seleccionado. La aplicacin se encuentra alojada en un servidor en desarrollo de carcter local, por lo que cualquier persona autorizada de la Direccin puede acceder al DSS y visualizar la informacin contenida en un programa de produccin.

Figura 3 SAD orientado a la planificacin semanal

Las ventajas de esta ltima mejora a los procesos de la Direccin ha repercutido directamente en los tiempos de respuesta, mayor cantidad de informacin entregable, adems de la contribucin al mayor entendimiento del comportamiento de las variables geolgicas y metalrgicas.

CONCLUSIONES La aplicacin de las herramientas de Inteligencia de Negocios, como la construccin de un Data Mart, el uso de algoritmos de Minera de Datos y el desarrollo de Sistemas de Apoyo a la Decisin han sido aplicadas con xito en la Direccin y se han traducido en la optimizacin de recursos humanos, disminucin en los tiempos de respuesta, aumento de la capacidad predictiva de los modelos, mayor tratamiento de volmenes de datos, mejor entendimiento de los procesos, consideracin del contexto geolgico-metalrgico en lugar de variables aisladas y la trazabilidad de los datos trabajados entre otras. El desarrollo de aplicaciones a nivel local resulta ser una adecuada manera de solucionar y mejorar los procesos de la Direccin, dado que la informtica avanza ms lento que la velocidad natural del negocio. Es posible desarrollar aplicaciones que resuelvan tareas rutinarias y contribuyan al anlisis y a la deteccin de factores de inters en otras reas del negocio. La Direccin sigue desarrollando aplicaciones y analizando nuevas formas de modelamiento, entendiendo que uno de los activos ms importantes de la organizacin es su informacin, por tanto un adecuado tratamiento de los datos en todos los niveles se traducir en un mejor entendimiento de la respuesta metalrgica y constituir una ventaja competitiva. Este tipo de desarrollos sustentan las predicciones de parmetros metalrgicos en la planificacin minera en Codelco Norte y pueden ser extendidos a otras reas de ingeniera y anlisis.

REFERENCES
Lynn Langit (2007) Fundations of SQL Server 2005: Business Intelligence. Apress, United States of America. [1] Mamdouh Refaat (2007) Data Preparation for Data Mining Using SAS . Morgan Kaufmann, United States of America. [2] Ian H. Witten & Eibe Frank (2005) Data Mining: Practical Machine Learning Tools and Techniques. Elsevier, United States of America. [3] Direccin de Modelamiento Geometalrgico, Codelco Norte (2010) Informe Predicciones P1-2011: Parmetros Geometalrgicos. [4]