Sie sind auf Seite 1von 19

INSTITUTO TECNOLGICO DE ACAPULCO

INGENIERIA EN SISTEMAS COMPUTACIONALES

DATAWAREHOUSE
Profesor. RICARDO FLORES OLIVEROS

TRABAJO DE INVESTIGACIN:
HERRAMIENTAS OLAP
Integrantes del equipo 4:

WENDY CORTS VZQUEZ NO. DE CONTROL 09320791 GLORIA MAYRA FLORES NO. DE CONTROL 13320151 LUIS FERNANDO RICO CAMPOS NO. DE CONTROL 0 IRVIN SALINAS PALMA NO. DE CONTROL 11320271 LUIS IVN SORIANO PARRAL NO. DE CONTROL 09320521

Horario: 1:00-2:00 pm.

Acapulco Gro. A 16 de Mayo de 2013

NDICE
INTRODUCCIN ................................................................................................................................... 3 IDENTIFICACION DEL PROBLEMA ........................................................................................................ 4 OBJETIVO GENERAL ............................................................................................................................. 5 OBJETIVOS ESPECFICICOS................................................................................................................... 5 METODOLOGA.................................................................................................................................... 6 JUSTIFICACIN .................................................................................................................................... 7 ESTADO DEL ARTE ............................................................................................................................... 8 DESARROLLO ..................................................................................................................................... 16 RESULTADOS ..................................................................................................................................... 17 CONCLUSIN ..................................................................................................................................... 18 BIBLIOGRAFA .................................................................................................................................... 19

INTRODUCCIN
Desde el inicio de la era de la computacin las organizaciones han usado los datos desde sus sistemas operacionales para atender sus necesidades de informacin. Algunas proporcionan acceso directo a la informacin contenida dentro de las aplicaciones operacionales. Otras, han extrado los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus necesidades de informacin. Ambos mtodos han evolucionado a travs del tiempo y ahora las organizaciones manejan datos aislados e incompletos, sobre los cuales, en la mayora de las veces, se toman importantes decisiones. La gestin administrativa reconoce que una manera de elevar su eficiencia est en hacer el mejor uso de los recursos de informacin que ya existen dentro de la organizacin. Sin embargo, a pesar de que esto se viene intentando desde hace muchos aos, no se tiene todava un uso efectivo de los mismos. La razn principal es la manera en que han evolucionado las computadoras, basadas en las tecnologas de informacin y los sistemas. La mayora de las organizaciones hacen lo posible por conseguir buena informacin, pero el logro de ese objetivo depende, fundamentalmente, tanto de su arquitectura actual, como del hardware y software. El Datawarehouse es actualmente, el centro de atencin de las grandes instituciones, porque provee un ambiente para que las organizaciones hagan un mejor uso de la informacin que est siendo registrada por las diversas aplicaciones operacionales. La ley de Moore sostiene que el poder de procesamiento de datos se duplica cada 18 meses, mientras que el costo permanece constante. Segn Henderson & Porter (1998): La estrategia envuelve todo y requiere compromiso, involucramiento y dedicacin por parte de toda la organizacin. La incapacidad de cualquier competidor en reaccionar, reorganizar y distribuir sus propios recursos contra un movimiento estratgico de un rival, puede cambiar radicalmente todo el relacionamiento competitivo. Esto demuestra la complejidad y el anlisis riguroso que debe ser hecho antes de decidir sobre cualquier tipo de inversin en tecnologa. Henderson & Porter (1998), adems, citan cinco elementos que consideran bsicos para la competitividad estratgica y que para ellos van ms all de los requisitos bsicos para encarar cualquier inversin:

a. Capacidad de comprender el comportamiento competitivo como un sistema en el cual competidores, clientes, dinero, personas y recursos interactan continuamente; b. Capacidad de usar esa comprensin para predecir como el dato de un movimiento estratgico va a alterar el equilibrio competitivo; c. Recursos que pueden ser permanentemente invertidos en nuevos usos aunque los beneficios resultantes solo surjan a largo plazo; d. Capacidad de prever riesgos y ganancias con exactitud y certeza suficientes para justificar la inversin correspondiente; e. Disposicin para actuar. Muchos ejecutivos afirman que todo proyecto de inversin en TI debe ser acompaado de un anlisis costo/beneficio, o cuando los beneficios son intangibles, de una lista cualitativa de los beneficios estratgicos esperados que, en algn momento, se convertirn o auxiliaran en el logro de los objetivos de la organizacin o en resultados financieros cuantificables.

IDENTIFICACION DEL PROBLEMA


Herramientas OLAP: Datawarehouse son utilizados por diferentes herramientas OLAP, que le ayudarn a obtener un mejor anlisis de la informacin de los informes de que podemos generar. Las herramientas de OLAP presentan al usuario una visin multidimensional de los datos (esquema multidimensional) para cada actividad que es objeto de anlisis. El usuario formula consultas a la herramienta OLAP seleccionando atributos de este esquema multidimensional sin conocer la estructura interna (esquema fsico) del almacn de datos. La herramienta OLAP genera la correspondiente consulta y la enva al gestor de consultas del sistema (mediante una sentencia SELECT). Una consulta a un almacn de datos consiste generalmente en la obtencin de medidas sobre los hechos parametrizadas por atributos de las dimensiones y restringidas por condiciones impuestas sobre las dimensiones.

OBJETIVO GENERAL

OBJETIVOS ESPECFICICOS

METODOLOGA
A partir de la introduccin del modelo de datos multidimensional como formalismo de modelado para Almacenes de Datos (ADs), se han realizado distintas propuestas metodolgicas para capturar la estructura del AD a nivel conceptual. Las soluciones propuestas parten de diferentes aspectos de diseo: los requisitos de usuario, el anlisis del esquema de la base de datos operacional o una combinacin de ambos (tcnicas mixtas). Model Driven Architecture (MDA) es un nuevo estndar para el desarrollo de sistemas dirigido por modelos. MDA propone tres puntos de vista: Computation Independent Model (CIM), Platform Independent Model (PIM) and Platform Specific Model (PSM). rea del diseo de ADs con MDA (una metodologa para el diseo conceptual de ADs). Este mtodo, es empleado con una metodologa compuesta y consiste de tres fases. La primera fase, esta dedicada a examinar el esquema ER de la base de datos operacional, generando los esquemas multidimensionales candidatos para el AD. La solucin a esta fase, se abordada en el contexto de MDA para esto, se definen un conjunto de reglas de transformacin entre el PIM Entidad Relacin (ER) y el PIM On-Line Analytical Processing (OLAP). En la segunda fase, los requisitos de usuario son recogidos por medio de entrevistas. El propsito de las entrevistas es obtener informacin acerca de las necesidades de anlisis de los usuarios. Como base para esta fase, se adapta un mtodo de elicitacin de requisitos basado en metas. La tercera fase, contrasta la informacin obtenida en la segunda fase, con los esquemas multidimensional candidatos formados en la primera fase generando as, la mejor solucin (soportada por las bases datos operacionales) que mejor reflejan los requisitos de usuario.

JUSTIFICACIN
La tcnica de las herramientas OLAP permiten un rpido acceso a los datos de los diferentes almacenes, ya que usa la tecnologa multidimensional de representacin de datos llamados cubos, los cuales modelan los datos de las dimensiones y tablas de hechos proporcionando diferentes tipos de consultas y anlisis a las aplicaciones cliente. La informacin que generan estas herramientas OLAP ayuda a los diferentes ejecutivos en la toma de grandes decisiones para tener una visin ms amplia de las diferentes situaciones que ha tenido la empresa y poder tomar la solucin ms acertada. Adems la informacin podr consultarse en cualquier momento, procesndose de manera rpida y a un bojo costo para la empresa.

ESTADO DEL ARTE


OLAP no es un nuevo concepto y ha permanecido en el tiempo por dcadas, de hecho el origen de la tecnologa OLAP se remonta a 1962. Pero no fue hasta 1993 que comienza a ser usada por grandes corporaciones con el fin de dar soporte a las estrategias de negocios basada en la informacin de ventas, finanzas y produccin; para realizar consultas de grandes cantidades de datos que a la fecha se tornaba engorrosa. Para esto el software utiliza estructuras multidireccionales o Cubos OLAP, que son bases de datos multidireccionales en la cual el almacenamiento fsico de los datos se realiza en un vector multidireccional. Los cubos OLAP se pueden considerar como una ampliacin de las 2 dimensiones de una hoja de clculo, estos contienen datos resumidos de grandes bases de datos o Sistemas Transaccionales. En el mundo empresarial de la actualidad existe una seria de competidores en donde se hace primordial tener software que entregan informacin como lo es OLAP, software que son de gran ayuda para las organizaciones ya que entregan soluciones inteligentes que permiten a los usuarios llevar a cabo anlisis de datos para as tomar decisiones puntuales que son los principales problemas que enfrentaban las empresas. En la actualidad su aplicacin a sido expandida hacia todas las reas de la empresa y hacia otros tipos de organizaciones que analizan volmenes masivos de datos, incluyendo medianas empresas, academia, Gobierno y dems instituciones pblicas y privadas, las cuales cada da ms, requieren de un anlisis dinmico, potente y en lnea de los indicadores para tomar las decisiones, lo que genera un potente aumento en la demanda del software. Este sistema debe estar preparado para un gran nmero de usuarios en lnea y los distintos tipos de operaciones que necesitaran una respuesta inmediata. Como mencionamos anteriormente los sistemas OLAP son una de las herramientas ms utilizadas en el campo de las soluciones Business Intelligence, ya que brinda la posibilidad de disponer de una base de datos multidimensional que permite llevar a cabo el procesamiento analtico de la informacin de manera online. Con el paso de los aos y el avance de las tecnologas informticas al servicio de las empresas, que han logrado convertirse en la solucin adecuada para la realizacin de negocios inteligentes, la herramienta OLAP ha dado lugar al nacimiento de diversos sistemas basados en su arquitectura que pueden ofrecer respuestas a las necesidades de las distintas compaas.

De acuerdo a su forma de funcionamiento y a su estructura, los sistemas OLAP han sido clasificados en distintas categoras, como ROLAP, MOLAP, HOLAP, WOLAP, DOLAP, RTOLAP y SOLAP. Uno de los tipos de sistema OLAP ms utilizado hoy en da es el llamado ROLAP. EXPLICACIN DE LOS DISTINTOS SISTEMAS OLAP ROLAP Significa Procesamiento Analtico OnLine Relacional, es una herramienta OLAP (Procesamiento Analtico OnLine) construido sobre una base de datos relacional. En este sistema tiene importancia la tabla de hechos, que es donde se almacena la historia de la informacin relevante para la empresa que requiere ser estudiada. En la industria del OLAP, el sistema ROLAP es conocido por ser capaz de escalar grandes volmenes de informacin, pero su rendimiento a la hora de ejecutar consultas es inestable comparado con otro sistema de la industria OLAP, MOLAP. Ya que luego de un estudio realizado se llego a la conclusin de que una compaa que utiliza el sistema ROLAP es menor rendimiento que aquellas que utilizan el sistema MOLAP. MOLAP Significa Procesamiento Analtico Multidimensional OnLine, es una alternativa a la tecnologa ROLAP. El sistema MOLAP Almacena los datos en una matriz multidimensional optimizada de almacenamiento y requiere que el procesamiento y almacenamiento de informacin este contenido en el cubo OLAP.

HOLAP Significa Procesamiento Analtico en Lnea Hbrido, es una combinacin de los sistemas ROLAP y MOLAP permitiendo ordenar una parte de los datos como en un sistema MOLAP y el resto de los datos como un sistema ROLAP.

DOLAP Desktop Online Analytical Processing, Se refiere a una aplicacin de negocios en lnea. Incluye la capacidad para obtener pequeos cubos de datos del servidor y ejecutar el clculo multidimensional cuando est fuera en el servidor. Este atributo es funcional para los usuarios mviles. RTOLAP Real Time OLAP; Es un protocolo que analiza los valores cuando sea necesario. Ahorra cada bit de informacin en la memoria RAM. Los clculos se ejecutan bajo un derecho de paso de manera que reduce el retroceso vinculado con explosin de la informacin, ya que slo guarda la informacin bajo la norma tamao de la RAM.

EJEMPLO DE UN MODELO OLAP IBM DB2 OLAP SERVER Creacin de un Modelo OLAP Es una estructura lgica que describe el plan comercial general. El modelo toma la forma de un esquema estrella, que representa la relacin entre sus componentes con una estructura en estrella. En el centro del esquema se encuentra una tabla de hechos, que contiene los datos reales que desea utilizar, como por ejemplo las cifras de las ventas de productos. De la tabla de hechos salen las tablas de mediciones que contienen los datos que definen las dimensiones OLAP, como por ejemplo nmeros de cuentas, meses, nombres de productos. Una vez iniciada la interfaz del escritorio de integracin server, se debe conectar a los metadatos del catalogo OLAP.

Luego de esta se debe iniciar el asistente de modelos OLAP y conectar a la base de datos de DB2 que contiene la fuente de datos.

Seleccin de la Tabla de Hechos Cada modelo necesita una tabla de hechos que es el centro del esquema estrella. La dimensin Accounts contiene los datos numricos que desea analizar y de las cuales desea hacer un seguimiento a lo largo del tiempo, como por ejemplo; ventas o inventarios, estos datos tambin reciben el nombre de datos de medidas variables y permiten una contabilidad inteligente durante el proceso analtico en lnea.

Creacin de Dimensiones

Unin de la Tabla de Mediciones El esquema estrella representa las relaciones entre la tabla de hechos y las otras dimensiones del modelo. Se puede definir la estructura del esquema en estrella mediante uniones entre las tablas de mediciones y la tabla de hechos. La parte izquierda de la pgina Fact Table Joins lista todas las dimensiones del modelo. La parte derecha muestra las columnas que se unen entre las tablas de mediciones y la tabla de hechos, si existe una unin.

Creacin de Herencia Las jerarquas organizan relaciones entre las columnas de una dimensin y se visualizan como estructura.[12]

Guardar Modelo OLAP

APLICACIN La mayora de las empresas que utilizan software OLAP son grandes empresas y las pequeas organizaciones muchas veces no pueden costear su uso y continan utilizando tecnologas tradicionales de reportes y anlisis. Desde el ao 2002, Contour Components provee al mercado con herramientas OLAP para pequeas y medianas empresas as como para departamentos y proyectos locales de grandes compaas. Contour Components Ltd. es una empresa privada Britnica. Ofrece al mercado soluciones de Business Intelligence con componentes OLAP para desarrolladores y aplicaciones para usuarios finales. Es una compaa multinacional, que posee actualmente oficinas en Londres, Mosc y Madrid (desde este ltimo emplazamiento se gestiona el negocio en Espaa, Portugal y pases de Latinoamrica). Bajo la suite de productos Contour BI, la compaa fabrica y comercializa tecnologa orientada a recolectar y almacenar datos (generalmente de naturaleza estadstica) para su posterior publicacin, diseminacin y publicacin en forma de potentes informes interactivos en portales analticos. Se trata de una plataforma innovadora de Business Intelligence, que basada en la ltima tecnologa, en potentes algoritmos estadsticos y en la mejora continua, proporciona tiempos de implementacin extremadamente reducida y de mnimo esfuerzo a la hora de construir atractivas soluciones de mercado. En este sentido, permite crear sistemas globales de recoleccin de datos, para su almacenamiento y distribucin centralizada va webs pblicas o privadas (sistemas analticos corporativos), centros administrativos de toma de decisiones etc... En la actualidad, y a travs de una plantilla de alta cualificacin profesional y personal, la compaa est desarrollando proyectos de gran calado y envergadura, tanto en importantes instituciones privadas internacionales como en la administracin pblica y otros organismos gubernamentales, entre los que podra destacarse los exitosamente ejecutados en la Federacin Rusa, dnde Contour BI se ha convertido en un estndard oficial para la publicacin de los datos federales. En el mbito privado, podra citarse el ejemplo de una corporacin multinacional del sector hidrocarburos, la cual recopila y explota para propsitos comerciales datos de ventas en CIS a travs de la plataforma Contour BI, (Contour Distribution Network Analysis System) Contour Components dispone en la actualidad de ms de 1000 organizaciones clientes, en varias industrias y organizaciones gubernamentales en todo el mundo (ms de 70 pases).

DESARROLLO

RESULTADOS

CONCLUSIN
OLAP es una herramienta que nos permite un anlisis de base de datos mucho ms eficiente, dinmica y para grandes niveles de informacin, su principal caracterstica por lo tanto, es su facilidad de uso, la flexibilidad y la velocidad con que se obtiene la informacin relevante y el objetivo de este tipo de herramienta es que el usuario navegue por la informacin de manera que vaya descubriendo cruces de inters para el anlisis. Es una de las herramientas ms utilizadas en el campo de las soluciones Business Intelligence, ya que brinda la posibilidad de disponer de una base de datos multidimensional que permite llevar a cabo el procesamiento analtico de la informacin de manera online. Proporcionan una de las ms importantes funciones de anlisis para los niveles de generacin de informacin y soporte de decisin, que es la posibilidad del anlisis multidimensional. Las aplicaciones OLAP son la principal herramienta de los sistemas de soporte de decisin (DSS).

La naturaleza del mercado de negocios global requiere datos en tiempo real, el requisito de que las hojas de clculo no estar a la altura. Sin embargo, como OLAP es una base de datos central, es capaz de comunicarse con otras bases de datos sin fisuras, que permite que los datos se extraigan de los sistemas de origen en la demanda. El tiempo real de datos sueo ya no es un sueo. Ahora es posible que el informe semanal, todos los das, incluso cada hora con informacin precisa y significativa accesibles por una amplia gama de usuarios con poca o ninguna comprensin de las estructuras de las fuentes de datos subyacentes.

BIBLIOGRAFA

Das könnte Ihnen auch gefallen