Beruflich Dokumente
Kultur Dokumente
DATAWAREHOUSE
Profesor. RICARDO FLORES OLIVEROS
TRABAJO DE INVESTIGACIN:
HERRAMIENTAS OLAP
Integrantes del equipo 4:
WENDY CORTS VZQUEZ NO. DE CONTROL 09320791 GLORIA MAYRA FLORES NO. DE CONTROL 13320151 LUIS FERNANDO RICO CAMPOS NO. DE CONTROL 0 IRVIN SALINAS PALMA NO. DE CONTROL 11320271 LUIS IVN SORIANO PARRAL NO. DE CONTROL 09320521
NDICE
INTRODUCCIN ................................................................................................................................... 3 IDENTIFICACION DEL PROBLEMA ........................................................................................................ 4 OBJETIVO GENERAL ............................................................................................................................. 5 OBJETIVOS ESPECFICICOS................................................................................................................... 5 METODOLOGA.................................................................................................................................... 6 JUSTIFICACIN .................................................................................................................................... 7 ESTADO DEL ARTE ............................................................................................................................... 8 DESARROLLO ..................................................................................................................................... 16 RESULTADOS ..................................................................................................................................... 17 CONCLUSIN ..................................................................................................................................... 18 BIBLIOGRAFA .................................................................................................................................... 19
INTRODUCCIN
Desde el inicio de la era de la computacin las organizaciones han usado los datos desde sus sistemas operacionales para atender sus necesidades de informacin. Algunas proporcionan acceso directo a la informacin contenida dentro de las aplicaciones operacionales. Otras, han extrado los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus necesidades de informacin. Ambos mtodos han evolucionado a travs del tiempo y ahora las organizaciones manejan datos aislados e incompletos, sobre los cuales, en la mayora de las veces, se toman importantes decisiones. La gestin administrativa reconoce que una manera de elevar su eficiencia est en hacer el mejor uso de los recursos de informacin que ya existen dentro de la organizacin. Sin embargo, a pesar de que esto se viene intentando desde hace muchos aos, no se tiene todava un uso efectivo de los mismos. La razn principal es la manera en que han evolucionado las computadoras, basadas en las tecnologas de informacin y los sistemas. La mayora de las organizaciones hacen lo posible por conseguir buena informacin, pero el logro de ese objetivo depende, fundamentalmente, tanto de su arquitectura actual, como del hardware y software. El Datawarehouse es actualmente, el centro de atencin de las grandes instituciones, porque provee un ambiente para que las organizaciones hagan un mejor uso de la informacin que est siendo registrada por las diversas aplicaciones operacionales. La ley de Moore sostiene que el poder de procesamiento de datos se duplica cada 18 meses, mientras que el costo permanece constante. Segn Henderson & Porter (1998): La estrategia envuelve todo y requiere compromiso, involucramiento y dedicacin por parte de toda la organizacin. La incapacidad de cualquier competidor en reaccionar, reorganizar y distribuir sus propios recursos contra un movimiento estratgico de un rival, puede cambiar radicalmente todo el relacionamiento competitivo. Esto demuestra la complejidad y el anlisis riguroso que debe ser hecho antes de decidir sobre cualquier tipo de inversin en tecnologa. Henderson & Porter (1998), adems, citan cinco elementos que consideran bsicos para la competitividad estratgica y que para ellos van ms all de los requisitos bsicos para encarar cualquier inversin:
a. Capacidad de comprender el comportamiento competitivo como un sistema en el cual competidores, clientes, dinero, personas y recursos interactan continuamente; b. Capacidad de usar esa comprensin para predecir como el dato de un movimiento estratgico va a alterar el equilibrio competitivo; c. Recursos que pueden ser permanentemente invertidos en nuevos usos aunque los beneficios resultantes solo surjan a largo plazo; d. Capacidad de prever riesgos y ganancias con exactitud y certeza suficientes para justificar la inversin correspondiente; e. Disposicin para actuar. Muchos ejecutivos afirman que todo proyecto de inversin en TI debe ser acompaado de un anlisis costo/beneficio, o cuando los beneficios son intangibles, de una lista cualitativa de los beneficios estratgicos esperados que, en algn momento, se convertirn o auxiliaran en el logro de los objetivos de la organizacin o en resultados financieros cuantificables.
OBJETIVO GENERAL
OBJETIVOS ESPECFICICOS
METODOLOGA
A partir de la introduccin del modelo de datos multidimensional como formalismo de modelado para Almacenes de Datos (ADs), se han realizado distintas propuestas metodolgicas para capturar la estructura del AD a nivel conceptual. Las soluciones propuestas parten de diferentes aspectos de diseo: los requisitos de usuario, el anlisis del esquema de la base de datos operacional o una combinacin de ambos (tcnicas mixtas). Model Driven Architecture (MDA) es un nuevo estndar para el desarrollo de sistemas dirigido por modelos. MDA propone tres puntos de vista: Computation Independent Model (CIM), Platform Independent Model (PIM) and Platform Specific Model (PSM). rea del diseo de ADs con MDA (una metodologa para el diseo conceptual de ADs). Este mtodo, es empleado con una metodologa compuesta y consiste de tres fases. La primera fase, esta dedicada a examinar el esquema ER de la base de datos operacional, generando los esquemas multidimensionales candidatos para el AD. La solucin a esta fase, se abordada en el contexto de MDA para esto, se definen un conjunto de reglas de transformacin entre el PIM Entidad Relacin (ER) y el PIM On-Line Analytical Processing (OLAP). En la segunda fase, los requisitos de usuario son recogidos por medio de entrevistas. El propsito de las entrevistas es obtener informacin acerca de las necesidades de anlisis de los usuarios. Como base para esta fase, se adapta un mtodo de elicitacin de requisitos basado en metas. La tercera fase, contrasta la informacin obtenida en la segunda fase, con los esquemas multidimensional candidatos formados en la primera fase generando as, la mejor solucin (soportada por las bases datos operacionales) que mejor reflejan los requisitos de usuario.
JUSTIFICACIN
La tcnica de las herramientas OLAP permiten un rpido acceso a los datos de los diferentes almacenes, ya que usa la tecnologa multidimensional de representacin de datos llamados cubos, los cuales modelan los datos de las dimensiones y tablas de hechos proporcionando diferentes tipos de consultas y anlisis a las aplicaciones cliente. La informacin que generan estas herramientas OLAP ayuda a los diferentes ejecutivos en la toma de grandes decisiones para tener una visin ms amplia de las diferentes situaciones que ha tenido la empresa y poder tomar la solucin ms acertada. Adems la informacin podr consultarse en cualquier momento, procesndose de manera rpida y a un bojo costo para la empresa.
De acuerdo a su forma de funcionamiento y a su estructura, los sistemas OLAP han sido clasificados en distintas categoras, como ROLAP, MOLAP, HOLAP, WOLAP, DOLAP, RTOLAP y SOLAP. Uno de los tipos de sistema OLAP ms utilizado hoy en da es el llamado ROLAP. EXPLICACIN DE LOS DISTINTOS SISTEMAS OLAP ROLAP Significa Procesamiento Analtico OnLine Relacional, es una herramienta OLAP (Procesamiento Analtico OnLine) construido sobre una base de datos relacional. En este sistema tiene importancia la tabla de hechos, que es donde se almacena la historia de la informacin relevante para la empresa que requiere ser estudiada. En la industria del OLAP, el sistema ROLAP es conocido por ser capaz de escalar grandes volmenes de informacin, pero su rendimiento a la hora de ejecutar consultas es inestable comparado con otro sistema de la industria OLAP, MOLAP. Ya que luego de un estudio realizado se llego a la conclusin de que una compaa que utiliza el sistema ROLAP es menor rendimiento que aquellas que utilizan el sistema MOLAP. MOLAP Significa Procesamiento Analtico Multidimensional OnLine, es una alternativa a la tecnologa ROLAP. El sistema MOLAP Almacena los datos en una matriz multidimensional optimizada de almacenamiento y requiere que el procesamiento y almacenamiento de informacin este contenido en el cubo OLAP.
HOLAP Significa Procesamiento Analtico en Lnea Hbrido, es una combinacin de los sistemas ROLAP y MOLAP permitiendo ordenar una parte de los datos como en un sistema MOLAP y el resto de los datos como un sistema ROLAP.
DOLAP Desktop Online Analytical Processing, Se refiere a una aplicacin de negocios en lnea. Incluye la capacidad para obtener pequeos cubos de datos del servidor y ejecutar el clculo multidimensional cuando est fuera en el servidor. Este atributo es funcional para los usuarios mviles. RTOLAP Real Time OLAP; Es un protocolo que analiza los valores cuando sea necesario. Ahorra cada bit de informacin en la memoria RAM. Los clculos se ejecutan bajo un derecho de paso de manera que reduce el retroceso vinculado con explosin de la informacin, ya que slo guarda la informacin bajo la norma tamao de la RAM.
EJEMPLO DE UN MODELO OLAP IBM DB2 OLAP SERVER Creacin de un Modelo OLAP Es una estructura lgica que describe el plan comercial general. El modelo toma la forma de un esquema estrella, que representa la relacin entre sus componentes con una estructura en estrella. En el centro del esquema se encuentra una tabla de hechos, que contiene los datos reales que desea utilizar, como por ejemplo las cifras de las ventas de productos. De la tabla de hechos salen las tablas de mediciones que contienen los datos que definen las dimensiones OLAP, como por ejemplo nmeros de cuentas, meses, nombres de productos. Una vez iniciada la interfaz del escritorio de integracin server, se debe conectar a los metadatos del catalogo OLAP.
Luego de esta se debe iniciar el asistente de modelos OLAP y conectar a la base de datos de DB2 que contiene la fuente de datos.
Seleccin de la Tabla de Hechos Cada modelo necesita una tabla de hechos que es el centro del esquema estrella. La dimensin Accounts contiene los datos numricos que desea analizar y de las cuales desea hacer un seguimiento a lo largo del tiempo, como por ejemplo; ventas o inventarios, estos datos tambin reciben el nombre de datos de medidas variables y permiten una contabilidad inteligente durante el proceso analtico en lnea.
Creacin de Dimensiones
Unin de la Tabla de Mediciones El esquema estrella representa las relaciones entre la tabla de hechos y las otras dimensiones del modelo. Se puede definir la estructura del esquema en estrella mediante uniones entre las tablas de mediciones y la tabla de hechos. La parte izquierda de la pgina Fact Table Joins lista todas las dimensiones del modelo. La parte derecha muestra las columnas que se unen entre las tablas de mediciones y la tabla de hechos, si existe una unin.
Creacin de Herencia Las jerarquas organizan relaciones entre las columnas de una dimensin y se visualizan como estructura.[12]
APLICACIN La mayora de las empresas que utilizan software OLAP son grandes empresas y las pequeas organizaciones muchas veces no pueden costear su uso y continan utilizando tecnologas tradicionales de reportes y anlisis. Desde el ao 2002, Contour Components provee al mercado con herramientas OLAP para pequeas y medianas empresas as como para departamentos y proyectos locales de grandes compaas. Contour Components Ltd. es una empresa privada Britnica. Ofrece al mercado soluciones de Business Intelligence con componentes OLAP para desarrolladores y aplicaciones para usuarios finales. Es una compaa multinacional, que posee actualmente oficinas en Londres, Mosc y Madrid (desde este ltimo emplazamiento se gestiona el negocio en Espaa, Portugal y pases de Latinoamrica). Bajo la suite de productos Contour BI, la compaa fabrica y comercializa tecnologa orientada a recolectar y almacenar datos (generalmente de naturaleza estadstica) para su posterior publicacin, diseminacin y publicacin en forma de potentes informes interactivos en portales analticos. Se trata de una plataforma innovadora de Business Intelligence, que basada en la ltima tecnologa, en potentes algoritmos estadsticos y en la mejora continua, proporciona tiempos de implementacin extremadamente reducida y de mnimo esfuerzo a la hora de construir atractivas soluciones de mercado. En este sentido, permite crear sistemas globales de recoleccin de datos, para su almacenamiento y distribucin centralizada va webs pblicas o privadas (sistemas analticos corporativos), centros administrativos de toma de decisiones etc... En la actualidad, y a travs de una plantilla de alta cualificacin profesional y personal, la compaa est desarrollando proyectos de gran calado y envergadura, tanto en importantes instituciones privadas internacionales como en la administracin pblica y otros organismos gubernamentales, entre los que podra destacarse los exitosamente ejecutados en la Federacin Rusa, dnde Contour BI se ha convertido en un estndard oficial para la publicacin de los datos federales. En el mbito privado, podra citarse el ejemplo de una corporacin multinacional del sector hidrocarburos, la cual recopila y explota para propsitos comerciales datos de ventas en CIS a travs de la plataforma Contour BI, (Contour Distribution Network Analysis System) Contour Components dispone en la actualidad de ms de 1000 organizaciones clientes, en varias industrias y organizaciones gubernamentales en todo el mundo (ms de 70 pases).
DESARROLLO
RESULTADOS
CONCLUSIN
OLAP es una herramienta que nos permite un anlisis de base de datos mucho ms eficiente, dinmica y para grandes niveles de informacin, su principal caracterstica por lo tanto, es su facilidad de uso, la flexibilidad y la velocidad con que se obtiene la informacin relevante y el objetivo de este tipo de herramienta es que el usuario navegue por la informacin de manera que vaya descubriendo cruces de inters para el anlisis. Es una de las herramientas ms utilizadas en el campo de las soluciones Business Intelligence, ya que brinda la posibilidad de disponer de una base de datos multidimensional que permite llevar a cabo el procesamiento analtico de la informacin de manera online. Proporcionan una de las ms importantes funciones de anlisis para los niveles de generacin de informacin y soporte de decisin, que es la posibilidad del anlisis multidimensional. Las aplicaciones OLAP son la principal herramienta de los sistemas de soporte de decisin (DSS).
La naturaleza del mercado de negocios global requiere datos en tiempo real, el requisito de que las hojas de clculo no estar a la altura. Sin embargo, como OLAP es una base de datos central, es capaz de comunicarse con otras bases de datos sin fisuras, que permite que los datos se extraigan de los sistemas de origen en la demanda. El tiempo real de datos sueo ya no es un sueo. Ahora es posible que el informe semanal, todos los das, incluso cada hora con informacin precisa y significativa accesibles por una amplia gama de usuarios con poca o ninguna comprensin de las estructuras de las fuentes de datos subyacentes.
BIBLIOGRAFA