Sie sind auf Seite 1von 4

Cubos Dimensiones Tabla de hechos

Qu es un cubo?
Una de las formas ms populares de analizar la informacin es mediante el uso de cubos OLAP (o bases de datos multidimensionales). Bsicamente, un cubo es una estructura de datos organizada mediante jerarquas. Cada indicador se puede evaluar en cualquiera de los niveles de las jerarquas. As, por ejemplo, se pueden obtener las "ventas" a nivel diario, mensual, o a anual, para un cliente, una provincia, o un pas El uso de cubos OLAP tiene dos ventajas fundamentales: Facilidad de uso. Una vez construido el cubo, el usuario de negocio puede consultarlo con facilidad, incluso si se trata de un usuario con escasos o nulos conocimientos tcnicos. La estructura jerrquica es sumamente fcil de comprender para la mente humana, y si sta coincide con el modelo de negocio, los resultados suelen ser espectaculares, ya que el cubo se convierte en una gran "tabla dinmica" que el usuario puede consultar en cualquier momento. Rapidez de respuesta. Habitualmente, el cubo tiene pre calculados las distintas agregaciones, por lo que los tiempos de respuesta son muy cortos. Si el cubo est bien diseado, resultar igual de rpido consultar las ventas de una ciudad, o las ventas de todo el pas, o incluso el total de ventas de la compaa.

Sin embargo, no todo son ventajas Estos son algunos de los inconvenientes: El cubo es estructura adicional de datos que mantener y actualizar, eso supone un gasto extra de recursos (servidores, discos, procesos de carga). El modelo de negocio no siempre se adapta bien en un modelo jerrquico. Por poner algunos ejemplos tpicos: Una semana no pertenece a un nico mes, o las zonas de venta corporativas no tienen porqu coincidir con la estructura provincial de cada pas, o varios responsables pueden encargarse de una misma tienda, o distintos departamentos de la compaa pueden utilizar distintas agrupaciones de los productos... Estas casusticas, que pueden parecer triviales, son habituales en cualquier compaa, y dificultan enormemente la construccin y uso de los cubos OLAP.

La alternativa a los cubos son las habituales bases de datos relacionales. En estos casos, se suele hablar de cubos o herramientas ROLAP, donde el usuario

tiene la sensacin de estar trabajando con un cubo, aunque internamente existe una base de datos normal y corriente Estos sistemas son bien conocidos, y siguen unos estndares ms aceptados que en el caso de las bases de datos multidimensionales, por lo que -en mi opinin- siempre debera ser una opcin a evaluar dentro de cualquier proyecto de Business Intelligence. Desgraciada a afortunadamente, no existe una nica solucin que valga para todos las compaas y proyectos Cada caso se tiene que estudiar y decidir, segn las necesidades, si realmente vale la pena utilizar cubos OLAP. Me atrevo a lanzar la siguiente recomendacin: Un cubo no puede sustituir a un modelo relacional. Detrs de cada cubo, debera existir un nico repositorio con la informacin normalizada Es decir, primero normalicemos la informacin que queremos analizar y despus, si en necesario, construyamos uno o varios cubos para los usuarios

Qu es una dimensin?
Es aquello por lo que podemos desglosar un indicador o mtrica.

Algunas herramientas permiten crear dimensiones con mltiples niveles, otras dimensiones virtuales, otras con padres e hijos, otras de solo un nivel (etc., etc.) pero todas ellas para propsitos prcticos sirven para la misma cosa: para desglosar el indicador. Algunos ejemplos de dimensiones pudieran ser: tienda, departamento, familia y producto si estamos hablando de un cubo de ventas supermercados. Departamento, puesto y empleado si estamos hablando de un cubo de recursos humanos. Cuenta, centro de costos y empresa para un cubo de finanzas. Por desglosar no me refiero a por ejemplo desglosar el Margen en Ventas Costo Gastos (ventas menos costo menos gasto). NO, eso es descomponer un indicador o mtrica en otros indicadores. Ms bien se refiere a los cortes o agrupaciones en la informacin para dicha mtrica.

Qu es una tabla de hechos?


Denominamos hechos a los indicadores de negocio. Por ejemplo, son hechos las ventas, los pedidos, los envos, las reclamaciones, las compras, etc. Es decir, son todas aquellas medidas numricas que incluiremos en nuestro sistema Business Intelligence. Tcnicamente, una tabla de hecho es la tabla central de un modelo en estrella. En el siguiente diagrama, la tabla de ventas es la tabla de hechos:

Una caracterstica importante de las tablas de hecho es el nivel de detalle de la informacin que se almacena. En el anterior ejemplo, las ventas estn guardadas a nivel de cliente, producto, almacn, promocin y fecha. La tabla de hechos contiene las claves subrogadas de aquellas dimensiones que definen su nivel de detalle, y los indicadores. Nada ms. Por lo tanto, antes de crear la tabla de hechos debe entenderse perfectamente la informacin que se guardar, o se estar cometiendo un ERROR.

Aadir dimensiones en una tabla de hechos antes de definir su granularidad (ERROR).


De hecho, la creacin de una tabla de hechos es una tarea con poco margen a la imaginacin. Antes que nada, debe localizarse el origen de la informacin que se quiere cargar, debe entenderse perfectamente el significado de estos indicadores, y debe determinarse el nivel de detalle de estos datos. Una vez

hecho esto, la creacin de la estructura de la tabla es inmediata. Tal y como comentaba anteriormente:La tabla de hechos contiene las claves subrogadas de aquellas dimensiones que definen su nivel de detalle, y los indicadores. Nada ms. Y nada menos. En particular, es un error desnormalizar cualquier dimensin en la tabla de hechos. Por ejemplo, si la informacin est a nivel de cliente, no necesitamos poner la poblacin o el pas en la tabla de hechos. Resultara redundante e impactara directamente en el tamao de la tabla (y en los tiempos de respuesta).

Tipos de tablas de hecho


En el momento de hablar de los diferentes tipos de tabla de hechos que existen es preciso indicar que se va a usar la terminologa original por ser mucho ms precisa:

Transaction Fact Tables: representan eventos que suceden en un

determinado espacio-tiempo. Se caracterizan por permitir analizar los datos con el mximo detalle. Factless Fact Tables/Coverage Tables: Son tablas que no tienen medidas y tiene sentido dado que representan el hecho que el evento suceda. Frecuentemente se aaden contadores a dichas tablas para facilitar las consultas SQL. Periodic Snapshot Fact Tables: Son tablas de hecho usadas para recoger informacin de forma peridica a intervalos de tiempo regulares. Dependiendo de la situacin medida o de la necesidad de negocio este tipo de tablas de hecho son una agregacin de las anteriores o estn diseadas especficamente. Accumulating Snapshot Fact Table: representan el ciclo de vida completo de una actividad o proceso, que tiene un principio y final. Se caracterizan por presentar mltiples dimensiones que relacionadas con los eventos presentes en un proceso.

Das könnte Ihnen auch gefallen