Sie sind auf Seite 1von 30

CARRERA PROFESIONAL DE ING.

DE SISTEMAS Y
TELEMÁTICA

CURSO : Base de Datos II.

DOCENTE : Ing. Marco Aurelio Porro Chulli.

TEMA : OLAP - Procesamiento Analítico en Línea

ESTUDIANTES :
✓ AGUILAR CABRERA, Yosmer
✓ ALTAMIRANO GUEVARA, Yoseily
✓ HERRERA CIEZA, Erlin Darwin
✓ OCAÑA BUENO, Lisbeth

CICLO : VIII

GRUPO : “A”
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

INDICE
I. OLAP – PROCESAMIENTO ANALITICO EN LINEA ................................................................... 1
1. Contenido .......................................................................................................................... 1
Introducción .......................................................................................................................... 1
Definición de OLAP ................................................................................................................ 2
Características de OLAP......................................................................................................... 3
¿Cómo funcionan los cubos OLAP? ....................................................................................... 3
¿En qué sistemas se pueden realizar los cubos OLAP? ......................................................... 5
Tipos de sistemas OLAP ......................................................................................................... 6
Funciones de OLAP .............................................................................................................. 15
Ventajas de OLAP ................................................................................................................ 16
Desventajas de OLAP ........................................................................................................... 16
2. Resumen .......................................................................................................................... 17
3. Summary ......................................................................................................................... 19
4. Recomendaciones ........................................................................................................... 22
5. Conclusiones.................................................................................................................... 23
6. Apreciación del equipo.................................................................................................... 23
7. Glosario de términos ....................................................................................................... 25
8. Linkografía ....................................................................................................................... 28

ING. DE SISTEMAS Y TELEMÁTICA


UNIVERSIDAD POLITÉCNICA AMAZÓNICA

I. OLAP – PROCESAMIENTO ANALITICO EN LINEA

1. Contenido

Introducción
Las empresas de consultoría, las de servicios, las de software, y la
literatura para directivos, están ejerciendo una presión creciente para
la introducción del BI (Business Intelligence).

OLAP es el acrónimo en inglés de procesamiento analítico en línea


(On-Line Analytical Processing). Es una solución utilizada en el campo
de la llamada Inteligencia empresarial cuyo objetivo es agilizar la
consulta de grandes cantidades de datos. Está destinada a mostrar
cualquier correlación, dentro de un volumen de datos importante, del
sistema de información con el fin de detectar alguna tendencia. Para
ello utiliza estructuras multidimensionales (o Cubos OLAP) que
contienen datos resumidos de grandes Bases de datos o Sistemas
Transaccionales (OLTP). Se usa en informes de negocios de ventas,
marketing, informes de dirección, minería de datos y áreas similares.

La razón de usar OLAP para las consultas es la velocidad de


respuesta. Una base de datos relacional almacena entidades en
tablas discretas si han sido normalizadas. Esta estructura es buena
en un sistema OLTP pero para las complejas consultas multitabla es
relativamente lenta. Un modelo mejor para búsquedas (aunque peor
desde el punto de vista operativo) es una base de datos
multidimensional.

La principal característica que potencia a OLAP, es que es lo más


rápido a la hora de ejecutar sentencias SQL de tipo SELECT, en
contraposición con OLTP que es la mejor opción para operaciones de
tipo INSERT, UPDATE Y DELETE.

1
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

Definición de OLAP
Un cubo OLAP o Procesamiento Analítico en Línea es una base de
datos que presenta múltiples dimensiones para el almacenamiento
físico de los datos el cual se realizará dentro de un arreglo de múltiples
dimensiones según se vaya requiriendo, dicho en otras palabras, es
como si los datos se fueran guardando dentro de una figura que está
compuesta por una cantidad indefinida de lados (dimensiones) según
sean necesitados, lo cual ayuda a mejorar significativamente el
análisis y las consultas de cada uno de los datos dentro del negocio
ya que permite manipular una gran cantidad de información de una
manera más rápida y precisa debido al hecho de que esta se
encuentra agrupada dentro del campo correspondiente que mejor la
define, lo que además permite proporcionar sistemas más confiables
y seguros para la toma de decisiones y para informes más precisos,
pues se puede llegar a entender como un incremento de las
dimensiones de una tabla u hoja de cálculo debido al hecho de que
un cubo OLAP amplía las posibilidades que las tablas y hojas de
cálculo ofrecen al usuario.

A pesar del hecho de que la mayoría de las personas piensan que lo


que todos los usuarios necesitan de un sistema de información se
puede representar dentro de una base de datos relacional, esto no
siempre es ni será así, pues como es bien conocido el flujo de
información dentro de una organización es constante y al mismo
tiempo proviene de diferentes fuentes que no siempre podrán seguir
este patrón relacional y que al almacenarla en únicamente dos
dimensiones esta podría ser más difícil de tratar, analizar y consultar
a diferencia de que al almacenarla en múltiples dimensiones esta se
encuentra mejor agrupada y categorizada por la base de datos lo que
nos permite que el mismo análisis sea más fácil, eficiente y a un menor
costo.

2
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

Características de OLAP
• En este modelo los datos son vistos como cubos los cuales
consisten en categoría descriptivas (dimensiones) y valores
cuantitativos (medidas).
• Es un modelo multidimensional de datos, que simplifica a los
usuarios realizar consultas complejas, arreglar datos en un
reporte, cambiar de datos resumidos a datos detallados, etc.
• Los Cubos OLAP son vectores en los cuales se dispone la
información, y gracias a esta ordenada jerarquía es posible llevar
a cabo un análisis rápido de los datos.

¿Cómo funcionan los cubos OLAP?


Los cubos OLAP como se ha dicho utilizan estructuras de múltiples
niveles que contienen datos resumidos de grandes Bases de datos o
Sistemas Transaccionales (OLTP) y que al mismo tiempo se
encuentran organizados a manera de jerarquía a nivel de detalle. Para
entender mejor su funcionamiento podemos compararlo con los cubos
de rompecabezas (cubo de rubick) en el que se trata de armar cada
uno de los diferentes colores, a diferencia de que aquí lo que se va
acomodando en orden son cada uno de los datos con los que se
cuenta por medio de tablas pero con la peculiar diferencia de que
mientras los cubos de rubick solamente tienen 3 dimensiones
mientras que los cubos OLAP poseen el número de dimensiones que
se necesitan por lo que el termino de cubo es nada más que una
simple comparación o concepto para entenderlo un poco mejor, es por
esta razón que estos cubos también reciben el nombre de hipercubos.
Un cubo OLAP por otra parte contiene datos de una determinada
variable, la cual se desee analizar, lo que al mismo tiempo va
proporcionando una vista lógica de los datos que son presentados por
el sistema de información que esté haciendo uso de ellos hacia la data
warehouse, además de que la vista estará acomodada según las
dimensiones necesitadas y además podrán estar conformadas por
información calculada.

3
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

El análisis de cada uno de los datos por otra parte se encuentra


basado en las dimensiones del hipercubo (cubo OLAP), por lo cual es
considerado como un análisis multidimensional, y a la información que
este contiene se le puede tener acceso mediante la utilización de
“tablas dinámicas” dentro de una hoja de cálculo o a través de
programas o aplicaciones personalizadas y desarrolladas con este
propósito. Las tablas dinámicas al mismo tiempo nos permiten
manipular con mucha rapidez, facilidad y simpleza cada una de las
vistas que se presentan ya sean por cruces, filtrados, por organización
e incluso totales de la información. Si llevamos estos conceptos a lo
que viene siendo un data warehouse, esto sería una colección de
datos que se encuentra compuesta por una cantidad x de
dimensiones, así como también por x variables, entendiéndose bajo
el termino de dimensiones a cada uno de los elementos que se
encuentran participando dentro del análisis, mientras que cada una de
las variables será cada uno de los valores que se quiere analizar. En
este sentido cada una de las dimensiones de los hipercubo son
catálogos de información complementaria, la cual es necesaria para
mostrar cada uno de los diferentes datos que serán mostrados a cada
uno de los diferentes usuarios que lo requieran, estos catálogos
pueden ser, por ejemplo: descripciones, nombres, zonas, rangos de
tiempo, entre otras cosas, es decir la información general
complementaria a cada uno de los diversos registros de la tabla de
hechos. Mientras que cada una de las variables o indicadores de
gestión son los datos que se encuentran siendo analizados, y por
ende también forman parte de la tabla de los hechos, dicho de otra
manera más formal , cada una de las variables representa algún
aspecto cuantificable o medible de cada uno de los diversos objetos
o eventos a analizar por el sistema de información, en este sentido las
variables normalmente son representadas por valores detallados y
numéricos para cada instancia del objeto o evento que se esté
midiendo, a diferencia de las dimensiones que son atributos
referentes a cada una de las variables utilizadas con el propósito de
indexar, ordenar, agrupar o abrevar cada uno de los valores de las

4
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

mismas, además de que las dimensiones poseen una granularidad


menor, pues van tomando como valores un conjunto de elementos
menor que el de las variables, algunos ejemplos de dimensiones
podrían ser productos, localidades o zonas, así como el tiempo
medido en días, horas o semanas por mencionar algunos ejemplos,
mientras que los ejemplos que podemos utilizar para representar
variables serian: gastos, ventas, beneficios, entre otros. En este
sentido se puede construir un cubo de información acerca del índice
de ventas (esta sería la variable que se va a analizar) en función del
producto vendido, así como de la provincia, el mes del año y si el
cliente se encuentra casado o soltero (estas serían cada una de las
dimensiones utilizadas durante el análisis), por lo que se estaría
formando un hipercubo de 4 dimensiones.

¿En qué sistemas se pueden realizar los cubos OLAP?


Actualmente dentro del mundo de las soluciones empresariales donde
se utilizan las herramientas informáticas que se basan en algunos de
los parámetros de la inteligencia de negocios, una de las herramientas
más utilizadas y difundida durante los últimos años es la que
comúnmente se denomina cubos OLAP y es la que hoy en día se ha
convertido en un elemento esencial para el procesamiento de la
información más importante para la optimización de las diferentes
operaciones productivas. Esta herramienta actualmente es
mayormente utilizada durante los últimos años en los diversos
sectores empresariales, por ejemplo en los rubros de marketing,
ventas, gerencia, entre otras, lo cual está permitiendo realizar
informes de negocios más confiables y que al mismo tiempo ayudan
a mejorar la competitividad que existe entre las diversas
organizaciones, tanto dentro de los diferentes departamentos de las
mismas, así como también la que existe entre las diferentes
organizaciones que compiten dentro del mismo sector e incluso hasta
otros sectores.

5
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

Normalmente, los sistemas que utilizan esta herramienta se clasifican


en las siguientes categorías:

ROLAP, MOLAP, HOLAP y DOLAP.

Tipos de sistemas OLAP


❖ ROLAP

ROLAP significa Procesamiento Analítico OnLine Relacional,


es decir, se trata de sistemas y herramientas OLAP construidos
sobre una base de datos relacional. Este tipo de sistema OLAP
es que más rápidamente se está extendiendo.

Las herramientas ROLAP soportan los productos SGBDR


mediante el uso de un nivel de metadatos, evitando así la
necesidad de crear una estructura de datos multidimensional
estática. Esto facilita la creación de múltiples vistas
multidimensionales de la relación bidimensional. La
arquitectura típica de los sistemas ROLAP es la siguiente:

Aunque las aplicaciones ROLAP se construyen sobre sistemas


de bases de datos relacionales, generalmente estas bases de
datos deben ser diseñadas cuidadosamente para el uso de
ROLAP. En este diseño tiene una especial importancia la
denominada tabla de hechos, que es donde se almacena la
historia de alguna magnitud relevante para la empresa que
necesita ser estudiada de forma exhaustiva, como por ejemplo,
las ventas. Adicionalmente, esta tabla de hechos estará ligada
a otras tablas en las que se almacenarán los parámetros en
función de los cuales varía la magnitud a estudiar, estos

6
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

parámetros reciben el nombre de dimensiones; típicamente,


para el caso del estudio de la magnitud ventas, las dimensiones
podrían ser: el tiempo (por días, semanas, horas, ...según
interese), los productos, las zonas geográficas (regiones,
países, ciudades, códigos postales, ...), los clientes, etc.
Finalmente, el diseño de estas tablas dará lugar a una
estructura en cuyo centro estará la tabla de hechos y, alrededor
de ésta y relacionadas con ella, estarán las tablas para las
dimensiones, dando lugar a un esquema en estrella.

Podría darse el caso de que se quisiera jerarquizar alguna de


las dimensiones, por ejemplo, los productos podrían estar
agrupados por categorías. La construcción de este diseño
implicaría añadir nuevas tablas que se relacionarían con las
dimensiones de la tabla de hechos central. A este diseño se le

7
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

llama esquema en copo de nieve (base de datos altamente


des-normaliza).

Una vez finalizado el diseño de este sistema, se tiene una


estructura que se identifica con un cubo OLAP. Un almacén de
datos dispondrá de varios de estos cubos, uno por cada
magnitud (o conjunto de magnitudes si éstas dependen de las
mismas dimensiones) de interés para la empresa.

Para mejorar las prestaciones, algunos productos ROLAP


disponen de motores SQL mejorados para soportar la
complejidad del análisis multidimensional.

Los problemas de desarrollo asociados con los sistemas


ROLAP son:

8
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

• Problemas de rendimiento asociado con el


procesamiento de consultas complejas que requieren
efectuar múltiples pasadas a través de los datos
relacionados.
• Desarrollo de middleware para facilitar el desarrollo de
aplicaciones multidimensionales, es decir, software que
convierta la relación bidimensional en una estructura
multidimensional.
• Desarrollo de una opción para crear estructuras
multidimensionales persistentes, junto con las funciones
para ayudar en la administración de estas estructuras.
❖ MOLAP
MOLAP es el acrónimo inglés de Multidimensional Online
Analytical Processing, es decir, “procesamiento analítico
multidimensional en línea”.
Se trata de una alternativa a la tecnología ROLAP (OLAP-
Relacional). Aunque ambos tipos de herramientas están
diseñadas para realizar análisis de datos a través de un modelo
de datos multidimensional, MOLAP se diferencia
significativamente en que requiere un pre procesamiento y
almacenamiento de la información contenida en el cubo OLAP.
MOLAP almacena estos datos en una matriz de
almacenamiento multidimensional optimizado, más que en una
base de datos relacional (o en un ROLAP).
La arquitectura MOLAP usa unas bases de datos
multidimensionales para proporcionar el análisis. Su principal
premisa es que el OLAP está mejor implantado almacenando
los datos multidimensionalmente que sobre bases de datos
relacionales (como opina la arquitectura ROLAP).

Un sistema MOLAP usa una base de datos propietaria


multidimensional, en la que la información se almacena
multidimensionalmente, para ser visualizada
multidimensionalmente.

9
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

El sistema MOLAP utiliza una arquitectura de dos niveles: La


bases de datos multidimensionales y el motor analítico.
• La base de datos multidimensional, es la encargada del
manejo, acceso y obtención del dato.
• El nivel de aplicación es el responsable de la ejecución
de los requerimientos OLAP. El nivel de presentación se
integra con el de aplicación y proporciona un interfaz a
través del cual los usuarios finales visualizan los análisis
OLAP. Una arquitectura cliente/servidor permite a varios
usuarios acceder a la misma base de datos
multidimensional.
La información procedente de los sistemas operacionales, se
carga en el sistema MOLAP, mediante una serie de rutinas
batch. Una vez cargado el dato elemental en la Base de Datos
multidimensional (MDDB), se realizan una serie de cálculos en
batch, para calcular los datos agregados, a través de las
dimensiones de negocio, rellenando la estructura MDDB.
Tras rellenar esta estructura, se generan unos índices y
algoritmos de tablas hash para mejorar los tiempos de accesos
a las consultas.
Una vez que el proceso de compilación se ha acabado, la
MDDB está lista para su uso. Los usuarios solicitan informes a
través de la interface, y la lógica de aplicación de la MDDB
obtiene el dato.
La arquitectura MOLAP requiere unos cálculos intensivos de
compilación. Lee de datos precompilados, y tiene capacidades
limitadas de crear agregaciones dinámicamente o de hallar
ratios que no se hayan pre calculados y almacenados
previamente.

10
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

VENTAJAS DE MOLAP
• Consulta rápida debido a la optimización del rendimiento
de almacenamiento, la indexación multidimensional y la
memoria caché.
• Ocupa menor tamaño en disco en comparación con los
datos almacenados en base de datos relacional debido
a técnicas de compresión.
• Automatización del procesamiento de los datos
agregados de mayor nivel.
• Muy compacto para conjuntos de datos de pocas
dimensiones.
• El modelo de almacenamiento en vectores/matrices
proporciona una indexación natural.
• Eficaz extracción de datos lograda gracias a la pre-
estructuración de los datos agregados.
• Ofrece buen rendimiento cuando se trabaja sobre datos
agregados, totales, subtotales, series temporales y
diversos grados de detalle de los datos.
• Facilita el estudio a alto nivel de los datos, al ofrecer una
mayor flexibilidad y rapidez de acceso.
• Almacenamiento de datos y consultas bastante
eficientes.
• La complejidad de la BD se oculta a los usuarios.
• El análisis se hace sobre datos agregados y métricas o
indicadores pre calculados.
• Mayor rendimiento frente a Rolap en el procesamiento
de consultas en BD pequeñas.
• Almacena agregados para facilitar un acceso rápido.

11
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

DESVENTAJAS DE MOLAP
• La etapa de procesamiento (carga de datos) puede ser
bastante larga, sobre todo para grandes volúmenes de
datos. Normalmente, esto se puede evitar con un
procesamiento incremental, es decir, sólo el
procesamiento de los datos que han cambiado (por lo
general, los nuevos datos) en lugar de volver a procesar
de todo el conjunto de datos.
• Las herramientas MOLAP tradicionalmente tienen
dificultades para consultar con modelos con
dimensiones muy altas (del orden de millones de
miembros).
• El enfoque MOLAP introduce redundancia en los datos.
• La asimilación de los conceptos multidimensionales, en
especial, cuando se tienen hipercubos de muchas
dimensiones.
• La construcción y poblado de las estructuras
multidimensionales puede demandar mucho tiempo.
• Están limitados a tener diez o menos dimensiones
debido a la complejidad para el manejo de las mismas.
• No se puede acceder a datos que no están en el cubo
(Ibarra, 2005).
• Debe trabajar con volúmenes de datos limitados, menos
de 5GB (Nader, 2003).
• Existen pocas herramientas gratuitas que lo soporten.
❖ HOLAP
Un desarrollo un poco más reciente ha sido la solución OLAP
híbrida (HOLAP), la cual combina las arquitecturas ROLAP y
MOLAP para brindar una solución con las mejores
características de ambas: desempeño superior y gran
escalabilidad. Un tipo de HOLAP mantiene los registros de
detalle (los volúmenes más grandes) en la base de datos
relacional, mientras que mantiene las agregaciones en un
almacén MOLAP separado.

12
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

Las herramientas HOLAP suministran a la máquina de


escritorio los datos relacionados directamente desde el SGBD
o a través de un servidor MOLAP en la forma de un cubo de
datos, el cual se almacena, analiza y mantiene localmente
mediante un servidor local. Los fabricantes promueven esta
tecnología alegando facilidad de instalación y administración, y
costes y mantenimiento reducidos.

PROBLEMAS DE HOLAP
• La arquitectura provoca una gran cantidad de
redundancia de datos.
• La posibilidad de cada usuario para construir un cubo de
datos personalizado pude provocar falta de coherencia
entre los datos de diferentes usuarios.
• Solo puede mantenerse de manera eficiente una cantidad
limitada de datos
La arquitectura típica HOLAP es la siguiente:

13
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

❖ DOLAP
Desktop OLAP u OLAP de Escritorio se está consagrando
como una de las herramientas OLAP más populares. Éstas
almacenan los datos en archivos simulados utilizando un motor
multidimensional del lado del cliente. Estos datos pueden llegar
al lado del cliente por adelantado o mediante petición (a través
de la web), sin embargo se requiere que el volumen de datos
sea pequeño.

Dada la creciente capacidad de procesamiento de los


ordenadores de escritorio, los fabricantes aprovechan cada vez
más para realizar algunos cálculos multidimensionales
directamente en ellos, y según que producto, todos los
cálculos. La arquitectura típica DOLAP es la siguiente:

Los problemas asociados a DOLAP son los siguientes:

Dado que los datos son extraídos físicamente del sistema y


enviados a los diferentes usuarios, es necesario un mecanismo
de seguridad orientado a dicha tesitura. Esto plantea un dilema
de provisión de los controles de seguridad dado que una vez
que los datos son cargados y formado el cubo del lado de los
clientes dichos datos pasan a ser propiedad de dicho cliente.

14
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

La solución actual consiste en limitar la información que se


puede compilar de cada cubo.

Se hace necesaria una fuerte reducción del esfuerzo para la


implantación y mantenimiento de una herramienta DOLAP.
Actualmente, la tendencia de los fabricantes es proporcionar
las herramientas a través de correo electrónico, web o
mediante la arquitectura tradicional clientes-servidor.

Funciones de OLAP
Las herramientas OLAP proporcionan a las compañías un sistema
confiable para procesar datos que luego serán utilizados para llevar a
cabo análisis e informes que permitan mejorar las operaciones
productivas, tomar decisiones inteligentes y optimizar la
competitividad en el mercado.

Para funcionar, las aplicaciones OLAP utilizan un tipo de base de


datos que posee la peculiaridad de ser multidimensional, denominada
comúnmente Cubo OLAP.

Básicamente, el Cubo OLAP, es una base de datos que posee


diversas dimensiones, ampliando las posibilidades que hasta el
momento ofrecían las conocidas hojas de cálculo.

Mediante la incorporación de estos vectores o cubos, se han ampliado


las posibilidades de las bases de datos relacionales, permitiendo el
procesamiento de importantes volúmenes de información, que de lo
contrario sería imposible realizar.

Cada una de las dimensiones que posee la base de datos incorpora


un campo determinado para un tipo de dato específico, que luego
podrá ser comparado con la información contenida en el resto de las
dimensiones, para hacer posible la evaluación y posteriores informes
de la información realmente relevante para una compañía.

Una base de datos multidimensional puede contener varios cubos o


vectores que extenderán las posibilidades del sistema OLAP con el
cual se trabaja.

15
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

Por ello, si bien en general los sistemas OLAP suelen estar


compuestos por tres dimensiones, lo cierto es que existe la posibilidad
de que el sistema OLAP albergue más de tres dimensiones mediante
la utilización de estos Cubos OLAP.

Para tener una idea más simple de la función de los Cubos OLAP
dentro de una base de datos multidimensional, cabe destacar que
cada una de las dimensiones o escalas del cubo corresponde
básicamente a una jerarquía de datos.

Ventajas de OLAP
❖ Es de fácil uso y acceso flexibles para los usuarios.
❖ Los datos están organizados en diferentes dimensiones lo que
permite un mejor análisis.
❖ Ahorro generado por productividad de personas altamente
profesionales.
❖ Permite encontrar la historia en los datos.
❖ Genera cierta ventaja competitiva.
❖ Tiene acceso a grandes cantidades de información.
❖ Analiza las relaciones entre muchos tipos de elementos
empresariales.
❖ Involucra datos agregados.
❖ Compara datos agregados a través de periodos jerárquicos.
❖ Presentan los datos en diferentes perspectivas.
❖ Involucran cálculos complejos entre elementos de datos.
❖ Pueden responder con rapidez a consultas de usuarios.

Desventajas de OLAP
❖ A pesar de las grandes ventajas que presenta este tipo de base
de datos multidimensional que incluye Cubos OLAP, la cual
permite obtener mayor rapidez en las consultas y en el
procesamiento de la información, lo cierto es que su gran falla
reside en la imposibilidad de realizar cambios en su estructura.
❖ Debido a su forma de funcionamiento y almacenamiento de la
información, cuando los usuarios requieren realizar
modificaciones en la estructura de este tipo de base de datos,

16
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

deben rediseñar el Cubo OLAP, sin posibilidades de poder


utilizar la estructura en la que se trabajó hasta el momento.

2. Resumen

Definición de OLAP
Un cubo OLAP o Procesamiento Analítico en Línea es una base de
datos que presenta múltiples dimensiones para el almacenamiento
físico de los datos el cual se realizará dentro de un arreglo de múltiples
dimensiones según se vaya requiriendo, dicho en otras palabras, es
como si los datos se fueran guardando dentro de una figura que está
compuesta por una cantidad indefinida de lados (dimensiones) según
sean necesitados, lo cual ayuda a mejorar significativamente el
análisis y las consultas de cada uno de los datos dentro del negocio
ya que permite manipular una gran cantidad de información de una
manera más rápida y precisa debido al hecho de que esta se
encuentra agrupada dentro del campo correspondiente que mejor la
define, lo que además permite proporcionar sistemas más confiables
y seguros para la toma de decisiones y para informes más precisos,
pues se puede llegar a entender como un incremento de las
dimensiones de una tabla u hoja de cálculo debido al hecho de que
un cubo OLAP amplía las posibilidades que las tablas y hojas de
cálculo ofrecen al usuario.

Características de OLAP:
• En este modelo los datos son vistos como cubos los cuales
consisten en categoría descriptivas (dimensiones) y valores
cuantitativos (medidas).
• Es un modelo multidimensional de datos, que simplifica a los
usuarios realizar consultas complejas, arreglar datos en un
reporte, cambiar de datos resumidos a datos detallados, etc.
• Los Cubos OLAP son vectores en los cuales se dispone la
información, y gracias a esta ordenada jerarquía es posible
llevar a cabo un análisis rápido de los datos.

17
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

¿Cómo funcionan los cubos OLAP?


Los cubos OLAP como se ha dicho utilizan estructuras de múltiples
niveles que contienen datos resumidos de grandes Bases de datos
o Sistemas Transaccionales (OLTP) y que al mismo tiempo se
encuentran organizados a manera de jerarquía a nivel de detalle.
Para entender mejor su funcionamiento podemos compararlo con los
cubos de rompecabezas (cubo de rubick) en el que se trata de armar
cada uno de los diferentes colores, a diferencia de que aquí lo que
se va acomodando en orden son cada uno de los datos con los que
se cuenta por medio de tablas pero con la peculiar diferencia de que
mientras los cubos de rubick solamente tienen 3 dimensiones
mientras que los cubos OLAP poseen el número de dimensiones que
se necesitan por lo que el termino de cubo es nada más que una
simple comparación o concepto para entenderlo un poco mejor, es
por esta razón que estos cubos también reciben el nombre de
hipercubos. Un cubo OLAP por otra parte contiene datos de una
determinada variable, la cual se desee analizar, lo que al mismo
tiempo va proporcionando una vista lógica de los datos que son
presentados por el sistema de información que esté haciendo uso de
ellos hacia la data warehouse, además de que la vista estará
acomodada según las dimensiones necesitadas y además podrán
estar conformadas por información calculada.

Tipos de sistemas OLAP

ROLAP: Implementación OLAP que almacena los datos en un motor


relacional. La arquitectura está compuesta por un servidor de banco
de datos relacional y el motor OLAP se encuentra en un servidor
dedicado. La principal ventaja de esta arquitectura es que permite el
análisis de una enorme cantidad de datos.

MOLAP: Esta implementación OLAP almacena los datos en una


base de datos multidimensional.

HOLAP (Hybrid OLAP): Almacena algunos datos en un motor


relacional y otros en una base de datos multidimensional.

18
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

DOLAP o Desktop OLAP: OLAP de escritorio.

Ventajas de OLAP:

❖ Es de fácil uso y acceso flexibles para los usuarios.


❖ Los datos están organizados en diferentes dimensiones lo
que permite un mejor análisis.
❖ Ahorro generado por productividad de personas altamente
profesionales.

Desventajas de OLAP:

❖ A pesar de las grandes ventajas que presenta este tipo de


base de datos multidimensional que incluye Cubos OLAP, la
cual permite obtener mayor rapidez en las consultas y en el
procesamiento de la información, lo cierto es que su gran falla
reside en la imposibilidad de realizar cambios en su
estructura.
❖ Debido a su forma de funcionamiento y almacenamiento de la
información, cuando los usuarios requieren realizar
modificaciones en la estructura de este tipo de base de datos,
deben rediseñar el Cubo OLAP, sin posibilidades de poder
utilizar la estructura en la que se trabajó hasta el momento.

3. Summary

Definition of OLAP

An OLAP cube or Online Analytical Processing is a database that


presents multiple dimensions for the physical storage of the data which
will be done within a multi-dimensional array as it is required, in other
words, it is as if the data they were stored within a figure that is
composed of an indefinite number of sides (dimensions) as needed,
which helps to significantly improve the analysis and queries of each
of the data within the business because it allows to manipulate a large
amount of information in a faster and more precise way due to the fact
that it is grouped within the corresponding field that best defines it,
which also allows to provide more reliable and secure systems for

19
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

decision making and for more precise reports, since can come to
understand as an increase in the dimensions of a table or spreadsheet
due to the fact that an OLAP cube extends the possibilities that tables
and spreadsheets offer the user.

OLAP characteristics:

• In this model the data are viewed as cubes which consist of


descriptive category (dimensions) and quantitative (measured)
values.
• It is a multidimensional data model, which simplifies users to
make complex queries, fix data in a report, change summary
data to detailed data, etc.
• OLAP Cubes are vectors in which information is available, and
thanks to this orderly hierarchy it is possible to carry out a quick
analysis of the data.

How do OLAP cubes work?

The OLAP cubes as mentioned above use multi-level structures that


contain summarized data from large Databases or Transactional
Systems (OLTP) and that are organized at the same time as a
hierarchy at the level of detail. To better understand how it works we
can compare it with the puzzle cubes (cube of rubick) in which we try
to assemble each of the different colors, unlike here what is arranged
in order are each of the data with those that are counted by tables but
with the peculiar difference that while the cubes of rubick only have 3
dimensions while the cubes OLAP have the number of dimensions that
are needed so the term cube is nothing more than a simple
comparison or concept to understand it a little better, it is for this
reason that these cubes also receive the name of hypercubes. An
OLAP cube on the other hand contains data of a certain variable,
which you want to analyze, which at the same time provides a logical
view of the data that is presented by the information system that is
making use of them to the data warehouse , in addition to the view will

20
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

be accommodated according to the dimensions needed and may also


be made up of calculated information.

Types of OLAP systems

ROLAP: OLAP implementation that stores the data in a relational


engine. The architecture is composed of a relational database server
and the OLAP engine is located on a dedicated server. The main
advantage of this architecture is that it allows the analysis of a huge
amount of data.

MOLAP: This OLAP implementation stores the data in a


multidimensional database.

HOLAP (Hybrid OLAP): Stores some data in a relational engine and


others in a multidimensional database.

DOLAP or OLAP Desktop: Desktop OLAP.

Advantages of OLAP:

• It is easy to use and flexible access for users.


• The data is organized in different dimensions, which allows a
better analysis.
• Savings generated by productivity of highly professional people.

Disadvantages of OLAP:

• Despite the great advantages of this type of multidimensional


database that includes Cubes OLAP, which allows to obtain
greater speed in queries and in the processing of information,
the truth is that its great fault lies in the impossibility of make
changes in its structure.
• Due to the way information is stored and stored, when users
need to make modifications to the structure of this type of
database, they must redesign the OLAP cube, without being
able to use the structure in which they worked until the moment.

21
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

4. Recomendaciones

❖ Se recomienda hacer uso de OLAP para realizar


informes de negocios de ventas, marketing, informes,
minería de datos, áreas similares, etc.
❖ Se recomienda usar los cubos OLAP ya que hace el análisis
más fácil y eficiente para usuarios de negocio permitiéndoles
optimizar la toma de decisiones que es esencial para la
competitividad de una empresa.
❖ Debemos tener muy en cuenta que los cubos no sustituyen a
las tablas relacionales; simplemente ayudan a mejorar la
eficiencia, la velocidad de respuesta y la simplicidad de las
consultas, pero deben apoyarse siempre en un sistema o
modelo relacional con los datos previamente normalizados
como en el sistema DOLAP quien recolecta la información
desde la base de datos relacional y las almacena en el
escritorio para el respectivo análisis de consultas.
❖ Se recomienda hacer uso adecuado del levantamiento
de información, para que los datos que sean modelados
mediante cubos OLAP sean clasificados y organizados.
De esta forma, es posible garantizar un rendimiento en
la ejecución de las consultas.
Debe destacarse que el proceso de implementación de
un modelo de cubos OLAP debe ir acompañado de una
serie de reglas de negocio, procedimientos y aplicación
de buenas prácticas para que el proceso pueda crecer
y consolidarse en el mediano y largo plazo.
❖ Se recomienda usar los cubos OLAP especialmente
para empresas de mayor capacidad; que necesitan
información sobre el funcionamiento de su empresa ya
que gracias a OLAP, podrán obtener la información
detallada a menor tiempo posible.

22
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

5. Conclusiones

❖ En conclusión la principal característica que potencia a OLAP,


es que es lo más rápido a la hora de ejecutar sentencias SQL
de tipo SELECT.
❖ Se utiliza Procesamiento Analítico en Línea (OLAP), para
resumir grandes cantidades de información en una base de
datos.
❖ DOLAP es un OLAP orientado a equipos de escritorio (Desktop
OLAP). Trae toda la información que necesita analizar desde la
base de datos relacional y la guarda en el escritorio. Desde ese
momento, todas las consultas y análisis son hechas contra los
datos guardados en el escritorio.
❖ OLAP es una herramienta que tiene como función proporcionar
un sistema confiable para procesar datos; nos abre la puerta a
la competitividad, optimiza tiempo y dinero. Nos permite tener
una toma de decisiones, con fundamentos sólidos, positiva
para la organización y productiva y sobre todo facilita la
comprensión de cantidades grandes de información fáciles de
consultar.
❖ Se ha concluido que el objetivo de los cubos OLAP es que las
personas que tienen a cargo el proceso de toma de decisiones
dentro de las empresas tengan a mano una herramienta que
les permita acceder rápida y fácilmente a la información de la
empresa que sea pertinente para el proceso de toma de
decisiones, además Las áreas en las que más comúnmente se
utilizan los cubos OLAP son las de ventas, marketing, finanzas
y producción.

6. Apreciación del equipo

❖ Gracias a los cubos OLAP se puede navegar de forma más


fácil por la información que disponemos, solicitándola de
manera rápida, fácil y dinámica, con el detalle preciso y los
filtros adecuados.

23
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

❖ Las bases de datos de OLAP se adaptan a una amplia gama


de análisis, incluyendo rendimiento de procesamiento y eficacia
de la fabricación, eficacia del servicio de cliente, y análisis de
coste del producto. En definitiva, un sistema OLAP es útil para
todo proceso en el que sea necesario tomar decisiones. Entre
sus tipos de sistemas encontramos a DOLAP que viene a ser
un caso particular de OLAP ya que está orientado a equipos de
escritorio y consiste en obtener la información necesaria desde
la base de datos relacional y guardarla escritorio.
❖ En este tema podríamos entender que hacer un Data warehose
es precisamente trabajar ya orientado en análisis OLAP. SI
estoy en una BD Relacional seria ROLAP, si estoy en un gestor
multidimensional seria MOLAP. Lo cual nos ayudará a realizar
nuestra base de datos de una manera más ordenada y con un
acceso a los datos con mayor facilidad teniendo en cuenta que
si no es necesario la implantación de un análisis
multidimensional, no se debe implementar.
❖ En este trabajo se ha podido apreciar la importancia de los
avances tecnológicos para las compañías. Pero como se sabe
con el paso del tiempo la información ha venido hacer un
recurso más para la organización con ella se toman decisiones
para que dicha organización siga funcionando de la mejor
manera, pero esta información al transcurrir los días se vuelve
más robusta es decir la cantidad de información es muy
abundante por lo que hacer un análisis se vuelve un poco
complejo y necesita de mayor tiempo. Para dar solución a este
problema se crea un herramienta muy importante que es el
procesamiento analítico en línea que nos da la facilidad para
analizar en menos tiempo la gran cantidad de información
almacenada y para que el gerente tome una mejor decisión y
tenga un mejor control de la organización.

24
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

7. Glosario de términos

1) Acrónimo: Sigla que se pronuncia como una palabra


2) Correlación: Indica la fuerza y la dirección de una relación
lineal y proporcionalidad entre dos variables estadísticas.
3) Entidades: Es un objeto concreto o abstracto que presenta
interés para el sistema y sobre el que se recoge información la
cual va a ser representada en un sistema de base de datos.
4) Normalizadas: Es un proceso que consiste en designar y
aplicar una serie de reglas a las relaciones obtenidas tras el
paso del modelo entidad-relación al modelo relacional.
5) Sentencias SQL: Elementos básicos en los que se divide el
código en un lenguaje de programación.
6) Hoja de cálculo: Tipo de documento, que permite manipular
datos numéricos y alfanuméricos dispuestos en forma de tablas
compuestas por celdas (las cuales se suelen organizar en una
matriz bidimensional de filas y columnas).
7) Multidimensional: Que concierne varios aspectos de un
asunto.
8) Matriz: es un conjunto de vectores o mejor dicho es un vector
de muchas direcciones.
9) Motor analítico: es el nombre de la primera computadora
programable y de uso general
10) Requerimientos: Petición de una cosa que se considera
necesaria, especialmente el que hace una autoridad.
11) Provisión: Es una cantidad de recursos que conserva la
empresa por haber contraído una obligación, con el objetivo de
guardar esos recursos hasta el momento en el que deba
satisfacer la factura.
12) Tesitura: Es la combinación de factores y circunstancias que
caracterizan una situación en un momento determinado.
13) Cubo: Estructura de datos que agrega las medidas mediante
los niveles y jerarquías de cada una de las dimensiones que
desee analizar

25
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

14) Medida: Conjunto de valores basados en una columna de la


tabla de hechos del cubo y que suelen ser valores numéricos.
Las medidas son los valores centrales del cubo que se
procesan, agregan y analizan.
15) Jerarquía: Estructura de árbol lógica que organiza los
elementos de una dimensión tal que cada elemento tiene un
elemento principal y cero o más elementos secundarios. Un
elemento secundario es un elemento en el nivel
inmediatamente inferior de una jerarquía que está directamente
relacionada con el elemento actual.
16) Dimensión: Conjunto de una o varias jerarquías de niveles de
un cubo que comprende un usuario y utiliza como base para el
análisis de datos.
17) Nivel: En cada jerarquía, los datos se pueden organizar en
niveles inferiores y superiores de detalle, como los niveles Año,
Trimestre, Mes y Día de una jerarquía de tiempo.
18) Parámetro: Elemento o dato importante desde el que se
examina un tema, cuestión o asunto.
19) Inteligencia de negocios: el conjunto de metodologías,
aplicaciones y tecnologías que permiten reunir, depurar y
transformar datos de los sistemas transaccionales en
información estructurada para su análisis.
20) Optimización: Método para determinar los valores de las
variables que intervienen en un proceso o sistema para que el
resultado sea el mejor posible.
21) Marketing: Conjunto de técnicas y estudios que tienen como
objeto mejorar la comercialización de un producto.
22) SGBDR: Sistemas de gestión de bases de datos relacionales
23) Base de Datos Multidimensional: Es un tipo de base de datos
que se ha optimizado para data warehouse y aplicaciones de
procesamiento analítico en línea Se crean con frecuencia
usando entradas de las bases de datos relacionales existentes.
24) Magnitud: Son aquellas magnitudes que se utilizan en la
computación. Las más comunes son bit y byte.

26
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

25) Bases de datos relacionales: Es una colección de elementos


de datos organizados en un conjunto de tablas formalmente
descritas desde la que se puede acceder a los datos o volver a
montarlos de muchas maneras diferentes sin tener que
reorganizar las tablas de la base.
26) Esquema en estrella: Este esquema se compone de una tabla
de hechos central y de varias tablas de dimensiones que se
relacionan con esta a través de sus respectivas claves.
27) Esquema de copo de nieve: Este esquema representa una
extensión del modelo en estrella cuando las dimensiones se
organizan en jerarquías de dimensiones.
28) Middleware: Software de conectividad que consiste en un
conjunto de servicios que permiten interactuar a múltiples
procesos que se ejecutan en distintas máquinas a través de
una red. Ocultan la heterogeneidad, abstrae la complejidad
subyacente y proveen de un modelo de programación
conveniente para los desarrolladores de aplicaciones.
29) Warehouse: Un data warehouse es un sistema utilizado para
reportar y analizar datos. Almacenan datos actuales e
históricos y son utilizados para crear informes analíticos para
los trabajadores del conocimiento de toda la empresa.
30) Cubo de Rubik: Es un rompecabezas
mecánico tridimensional inventado por el escultor y profesor
de arquitectura húngaro Erno Rubik.
31) Hipercubo o Teseracto: Es una figura formada por
ocho cubos tridimensionales ubicados en un espacio donde
existe un cuarto eje dimensional. Se compone de 8
celdas cúbicas, 24 caras cuadradas, 32 aristas y 16 vértices.

27
ING. DE SISTEMAS Y TELEMÁTICA
UNIVERSIDAD POLITÉCNICA AMAZÓNICA

8. Linkografía

http://es.wikipedia.org/wiki/MOLAP

http://www.csae.map.es/csi/silice/DW2251.html#MOLAP

http://www.scielo.org.co/scielo.php?pid=S0120-
56092006000300016&script=sci_arttext

https://www.ecured.cu/Cubos_OLAP

https://carlostopicos.wordpress.com/2010/02/05/cubos-olap/

28
ING. DE SISTEMAS Y TELEMÁTICA

Das könnte Ihnen auch gefallen