Beruflich Dokumente
Kultur Dokumente
Introduccin
Hoy en da toda empresa necesita depositar mucha confianza en la toma de decisiones sobre los negocios, para tomar dichas decisiones requerimos hechos y cifras, sabemos que la competencia crece en todo momento por lo que las decisiones deben ser mas aceleradas; pero que pasa si tenemos una montaa de informacin la cual debe ser analizada, lgicamente?... Por ese motivo se requieren herramientas que ayuden a minimizar el tiempo para analizar mucha informacin con mayor velocidad y precisin; utilizando dichas herramientas logramos mantenernos competitivos, ya que nuestros negocios deben reaccionar al cambio del mercado. De otro modo el mercado globalizado, la presin inmensa de la competencia, los arranques tecnolgicos, etc. Debilitaran nuestra empresa. Esto nos muestra que las empresas invierten en tecnologa y soluciones con las cuales se mantienen en este mundo cambiante, es decir, las empresas no dependen tan solo de factores como ubicacin, productos, etc. Sino tambin del conocimiento. Tal conocimiento basado en informacin comprensible, detallada y relevante es crucial para lograr y sostener ventaja competitiva. El poseer conocimientos correctos se tienen respuestas correctas y se pueden tomar decisiones estratgicas para la ejecucin de la empresa. Pero las tareas de recolectar, procesar, limpiar y transformar la informacin necesaria para la toma de decisiones no es una tarea sencilla si consideramos que una empresa tiene distintas reas que a veces se encuentran alejadas de los ejecutivos de negocios. El Componente de Bussines Intelligence que resuelve este caos de los datos es el Data Warehouse.
Qu es Data Warehousing?
En la actualidad hay confusin respecto a lo que es un Data Warehouse que, afortunadamente, est comenzando a despejarse. No obstante, parece que cada proveedor de un producto o servicio relacionado con tecnologa informtica tiene su definicin y, lo que es peor, en su propia jerga no siempre comprensible. Algunos llaman al Data warehouse, Business Intelligence or Decision Support en realidad es considerada la solucin integral y oportuna para desarrollar negocio Es un conjunto de datos integrados u orientados a una materia, que varan con el tiempo y que no son transitorios, los cuales soportan el proceso de toma de decisiones de la administracin y esta orientada al manejo de grandes volmenes de datos provenientes de diversas fuentes o diversos tipos. Estos datos cubren largos perodos de tiempo lo que trae consigo que se tengan diferentes esquemas de los datos fuentes, La concentracin de la informacin esta orientada a su anlisis para apoyar la toma de decisiones oportunas y fundamentadas, Previo a su utilizacin se debe aplicar procesos de anlisis, seleccin y transferencia de datos.
Data Warehouse:
Qu es Data Warehousing?
Es un proceso, no un producto. Es una tcnica para consolidar y administrar datos de variadas fuentes con el propsito de responder preguntas de negocios y tomar decisiones, de una forma que no era posible hasta ahora.
Estos desarrollos tecnolgicos, correctamente organizados e interrelacionados, constituyen lo que se ha dado en llamar un Data Warehouse o Bodega de Datos.
Existen muchas definiciones para el DW, la ms conocida fue propuesta por Inmon [MicroSt96] (considerado el padre de las Bases de Datos) en 1992:
Un DW es una coleccin de datos orientados a temas, integrados, no voltiles y variante en el tiempo, organizados para soportar necesidades empresariales.
En 1993, Susan Osterfeldt publica una definicin que sin duda acierta en la clave del DW:
Yo considero al DW como algo que provee dos beneficios empresariales reales: Integracin y Acceso de datos. DW elimina una gran cantidad de datos intiles y no deseados, como tambin el procesamiento desde el ambiente operacional clsico.
Informacin de la organizacin accesible: los contenidos del Data WareHouse son entendibles y navegables, y el acceso a ellos son caracterizado por el rpido desempeo. Cuando hablamos de entendible significa, que los niveles de la informacin sean correctos y obvios. Y Navegables significa el reconocer el destino en la pantalla y llegar a donde queramos con solo un clic. Rpido desempeo significa, cero tiempo de espera. Informacin de la organizacin consistente: la informacin de una parte de la organizacin puede hacerse coincidir con la informacin de la otra parte de la organizacin. Si dos medidas de la organizacin tienen el mismo nombre, entonces deben significar la misma cosa. Y a la inversa, si dos medidas no significan la misma cosa, entonces son etiquetados diferentes. Informacin consistente significa, informacin de alta calidad, toda la informacin es contabilizada y completada.
2.
Informacin adaptable y elstica: el Data WareHouse esta diseado para cambios continuos. Cuando se le hacen nuevas preguntas al Data WareHouse, los datos existentes y las tecnologas no cambian ni se corrompen. Cuando se agregan datos nuevos al Data WareHouse, los datos existentes y las tecnologas tampoco cambian ni se corrompen. Es un seguro baluarte que protege los valores de la informacin: el Data WareHouse no solamente controla el acceso efectivo a los datos, si no que da a los dueos de la informacin gran visibilidad en el uso y abusos de los datos, an despus de haber dejado el Data WareHouse. Es la fundacin de la toma de decisiones: el Data WareHouse tiene los datos correctos para soportar la toma de decisiones. Solo hay una salida verdadera del Data WareHouse: las decisiones que son hechas despus de que el Data WareHouse haya presentado las evidencias. La original etiqueta que preside el Data WareHouse sigue siendo la mejor descripcin de un sistema de soporte a las decisiones.
4.
5.
este es el primer paso de obtener la informacin hacia el ambiente del Data WareHouse. 2. Transformacin: una vez que la informacin es extrada hacia el rea de trafico de datos, hay posibles paso de transformacin como; limpieza de la informacin, tirar la basura que no nos sirve, seleccionar nicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, hacindolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensin. 3. Carga: al final del proceso de transformacin, los datos estn en forma para ser cargados
Las estaciones de trabajo de cada usuario debern cumplir con las caractersticas recomendadas por el proveedor de la herramienta de consulta seleccionada.
Data Mining
Es una tecnologa de soporte para usuario final, cuyo objetivo es extraer conocimiento til y utilizable a partir de la informacin contenida en las bases de datos de las empresas. Los objetivos de un sistema Data mining nos permiten analizar factores de influencia en determinados procesos, predecir o estimar variables o comportamientos futuros, segmentar o agrupar tems similares, adems de obtener secuencias de eventos que provocan comportamientos especficos. Se desarrollan bajo lenguajes de ultima generacin basados en la inteligencia artificial y utilizando mtodos matemticos, tales como:
Redes neuronales Introduccin de reglas Arboles de decisin Conjunto de reglas por clase
Soporta tambien sofisticadas operaciones de anlisis tales como los sistemas Scoring y aplicaciones de deteccin de fraude.
A continuacin veremos ejemplos de aplicaciones tpicas y algunos casos puntuales en distintas industrias.
En NCR San Diego, California, se encuentra el centro de desarrollo de los computadores WorldMark. Sobre los mismos se realiz la demostracin del Data Warehouse ms grande del mundo: 10 Terabytes de informacin (=10.000 Gigabytes=10.000.000 Megabytes), para poner esto en trminos manejables debemos considerar que toda la informacin escrita de la Biblioteca del Congreso de los Estados Unidos se podra almacenar en unos 20 Terabytes. En NCR Dayton, Ohio, la compaa dispone de un Data Warehouse de 1 Terabyte (=1000 Gigabytes) destinado fundamentalmente a tareas de marketing, produccin y finanzas. A la fecha tiene almacenados 281.154 documentos, agrupados en 36 grupos de inters temtico, que pueden ser accedidos 24 Hs. al da, los siete das de la semana, por 16.100 usuarios distribuidos en 46 pases. A principios del ao 1996 el sistema estaba respondiendo un promedio de 242.707 consultas mensuales.