Sie sind auf Seite 1von 4

REYES CRUZ IVAN TPICOS AVANZADOS GRUPO: 6751

Base de datos multidimensional


Las bases de datos multidimensionales se utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad es que por cada dimensin tienen un campo (o columna), y otro campo por cada mtrica o hecho, es decir estas tablas almacenan registros cuyos campos son de la forma: Implementacin Lo ms importante a tener en cuenta para implementar esta estructura de datos es que la tabla contiene todas las n-tuplas, con los valores de las dimensiones, o ndice del cubo, y los valores de las mtricas previamente calculados para el cruce de valores del ndice en cuestin. Bases de datos multidimensionales vs. Cubos OLAP Cada una de estas tablas puede asimilarse a un hipercubo o -ms concretamente si de herramientas OLAP se trata- a un cubo OLAP, donde las dimensiones del mismo se corresponden los campos de dimensiones de la tabla (campos 'di...'), y el valor almacenado en cada celda del cubo equivale a la mtrica o mtricas (campos 'fi...') almacenadas en la tabla.

Cubo OLAP

Cubo OLAP de tres dimensiones (Ciudades, Productos y Tiempo). Un cubo OLAP, OnLine Analytical Processing o procesamiento Analtico En Lnea, trmino acuado por Edgar Frank Codd de EF Codd & Associates, encargado por Arbor Software (en la actualidad Hyperion Solutions), es una base de datos multidimensional, en la cual el almacenamiento fsico de los datos se realiza en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliacin de las dos dimensiones de una hoja de clculo. A menudo se pensaba que todo lo que los usuarios pueden querer de un sistema de informacin se podra hacer de una base de datos relacional. No obstante Codd fue uno de los precursores de las bases de datos relacionales, por lo que sus opiniones fueron y son respetadas.

REYES CRUZ IVAN TPICOS AVANZADOS GRUPO: 6751

Dispersin en cubos OLAP Vincular o enlazar cubos es un mecanismo para superar la dispersin. sta se produce cuando no todas las celdas del cubo se rellenan con datos (escasez de datos o valores nulos). El tiempo de procesamiento es tan valioso que se debe adoptar la manera ms efectiva de sumar ceros (los valores nulos o no existentes). Por ejemplo los ingresos pueden estar disponibles para cada cliente y producto, pero los datos de los costos pueden no estar disponibles con esta cantidad de anlisis. En lugar de crear un cubo disperso, a veces es mejor crear otro cubo distinto, pero vinculado, en el que un subconjunto de los datos se pueden analizar con gran detalle. La vinculacin asegura que los datos de los dos cubos mantengan una coherencia. ] Acceso y clculo de un cubo OLAP
Persistencia MOLAP, ROLAP, HOLAP Los cubos, las dimensiones y las jerarquas son la esencia de la navegacin multidimensional del OLAP. Al describir y representar la informacin en esta forma, los usuarios pueden navegar intuitivamente en un conjunto complejo de datos. Sin embargo, el solo describir el modelo de datos en una forma ms intuitiva, hace muy poco para ayudar a entregar la informacin al usuario ms rpidamente.

Un principio clave del OLAP es que los usuarios deberan obtener tiempos de respuesta consistentes para cada vista de datos que requieran. Dado que la informacin se colecta en el nivel de detalle solamente, el resumen de la informacin es usualmente calculado por adelantado. Estos valores precalculados son la base de las ganancias de desempeo del OLAP. En los primeros das de la tecnologa OLAP, la mayora de las compaas asuma que la nica solucin para una aplicacin OLAP era un modelo de almacenamiento no relacional. Despus, otras compaas descubrieron que a travs del uso de estructuras de base de datos (esquemas de estrella y de

REYES CRUZ IVAN TPICOS AVANZADOS GRUPO: 6751 copo de nieve), ndices y el almacenamiento de agregados, se podran utilizar sistemas de administracin de bases de datos relacionales (RDBMS) para el OLAP. Estos vendedores llamaron a esta tecnologa OLAP relacional (ROLAP). Las primeras compaas adoptaron entonces el trmino OLAP multidimensional (MOLAP), estos conceptos, MOLAP y ROLAP, se explican con ms detalle en los siguientes prrafos. Las implementaciones MOLAP normalmente se desempean mejor que la tecnologa ROLAP, pero tienen problemas de escalabilidad. Por otro lado, las implementaciones ROLAP son ms escalables y son frecuentemente atractivas a los clientes debido a que aprovechan las inversiones en tecnologas de bases de datos relacionales preexistentes.

Sistemas MOLAP

La arquitectura MOLAP usa unas bases de datos multidimensionales para proporcionar el anlisis, su principal premisa es que el OLAP est mejor implantado almacenando los datos multidimensionalmente. Por el contrario, la arquitectura ROLAP cree que las capacidades OLAP estn perfectamente implantadas sobre bases de datos relacionales Un sistema MOLAP usa una base de datos propietaria multidimensional, en la que la informacin se almacena multidimensionalmente, para ser visualizada en varias dimensiones de anlisis. El sistema MOLAP utiliza una arquitectura de dos niveles: la bases de datos multidimensionales y el motor analtico. La base de datos multidimensional es la encargada del manejo, acceso y obtencin del dato. El nivel de aplicacin es el responsable de la ejecucin de los requerimientos OLAP. El nivel de presentacin se integra con el de aplicacin y proporciona un interfaz a travs del cual los usuarios finales visualizan los anlisis OLAP. Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de datos multidimensional. La informacin procedente de los sistemas operacionales, se carga en el sistema MOLAP, mediante una serie de rutinas por lotes. Una vez cargado el dato elemental en la Base de Datos multidimensional (MDDB), se realizan una serie de clculos por lotes, para calcular los datos agregados, a travs de las dimensiones de negocio, rellenando la estructura MDDB. Tras rellenar esta estructura, se generan unos ndices y algoritmos de tablas hash para mejorar los tiempos de accesos a las consultas. Una vez que el proceso de compilacin se ha acabado, la MDDB est lista para su uso. Los usuarios solicitan informes a travs de la interfase, y la lgica de aplicacin de la MDDB obtiene el dato. La arquitectura MOLAP requiere unos clculos intensivos de compilacin. Lee de datos precompilados, y tiene capacidades limitadas de crear agregaciones dinmicamente o de hallar ratios que no se hayan precalculados y almacenados previamente.

Sistemas ROLAP

La arquitectura ROLAP, accede a los datos almacenados en un datawarehouse para proporcionar los anlisis OLAP. La premisa de los sistemas ROLAP es que las capacidades OLAP se soportan mejor contra las bases de datos relacionales.

REYES CRUZ IVAN TPICOS AVANZADOS GRUPO: 6751 El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la funcionalidad analtica. El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtencin del dato. El nivel de aplicacin es el motor que ejecuta las consultas multidimensionales de los usuarios. El motor ROLAP se integra con niveles de presentacin, a travs de los cules los usuarios realizan los anlisis OLAP. Despus de que el modelo de datos para el datawarehouse se ha definido, los datos se cargan desde el sistema operacional. Se ejecutan rutinas de bases de datos para agregar el dato, si as es requerido por el modelos de datos. Se crean entonces los ndices para optimizar los tiempos de acceso a las consultas. Los usuarios finales ejecutan sus anlisis multidimensionales, a travs del motor ROLAP, que transforma dinmicamente sus consultas a consultas SQL. Se ejecutan estas consultas SQL en las bases de datos relacionales, y sus resultados se relacionan mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios. La arquitectura ROLAP es capaz de usar datos precalculados si estos estn disponibles, o de generar dinmicamente los resultados desde los datos elementales si es preciso. Esta arquitectura accede directamente a los datos del datawarehouse, y soporta tcnicas de optimizacin de accesos para acelerar las consultas. Estas optimizaciones son, entre otras, particionado de los datos a nivel de aplicacin, soporte a la desnormalizacin y joins mltiples.

Sistemas MOLAP

Un desarrollo un poco ms reciente ha sido la solucin OLAP hbrida (HOLAP), la cual combina las arquitecturas ROLAP y MOLAP para brindar una solucin con las mejores caractersticas de ambas: desempeo superior y gran escalabilidad. Un tipo de HOLAP mantiene los registros de detalle (los volmenes ms grandes) en la base de datos relacional, mientras que mantiene las agregaciones en un almacn MOLAP separado.

Das könnte Ihnen auch gefallen