Sie sind auf Seite 1von 21

Nube BI: El futuro de la inteligencia empresarial en la

nube

Hussain Al-Aqrabi,
Lu Liu, ,
Richard Hill,
Nick Antonopoulos
Mostrar ms
doi: 10.1016 / j.jcss.2014.06.013
Obtener los derechos y contenidos

Destacados

Responda a estas preguntas clave en lo que respecta a la toma de


inteligencia de negocio a la nube.

El Cloud hosting de BI se ha demostrado con la ayuda de la simulacin.

Procesar de manera eficiente el procesamiento analtico (OLAP)


demandas de las aplicaciones en lnea en La computacin en nube.

Abstracto
En entornos auto-organizado se tema que la inteligencia de negocios (BI),
finalmente se enfrentar a una situacin de crisis de recursos debido a la
expansin sin fin de los almacenes de datos y el procesamiento analtico
en lnea (OLAP) exige el establecimiento de una red subyacente. La
computacin en nube ha instigado una nueva esperanza para las futuras
perspectivas de BI. Sin embargo, cmo se BI implementarse en la nube
y cmo ser el aspecto del trfico y el perfil de la demanda como? Esta
investigacin intenta responder a estas cuestiones clave en lo que
respecta a la toma de BI a la nube. El Cloud hosting de BI se ha
demostrado con la ayuda de una simulacin en OPNET comprende un
modelo de nube con varios servidores de aplicaciones OLAP aplican
cargas de consultas en paralelo en una serie de servidores que alojan las
bases de datos relacionales. Los resultados de la simulacin reflejan que
el procesamiento paralelo extensible de servidores de bases en la nube
puede procesar de manera eficiente las demandas de aplicaciones OLAP
sobre computacin en nube.

Palabras clave

La inteligencia de negocios;
Procesamiento analtico en lnea;
La computacin ennube;
Software-as-a-service;
Base de datos-as-a-service;
Sistemas masivamente paralelos

1. Introduccin
La computacin en nube se ha convertido en una de las tecnologas
revolucionarias en los ltimos aos. La computacin en nube se
conceptualiza en tres formas - Software-as-a-service (SaaS), plataforma
como servicio (PaaS) e infraestructura-como-un-servicio (IaaS). La
interfaz de los proveedores de SaaS con los usuarios finales, en virtud de
la provisin de servicios de aplicaciones de negocios similares a los que
tradicionalmente han sido auto-organizada por las casas de las
empresas [1]. Nube paradigma de computacin se ha convertido para
llevar la informtica, recursos de almacenamiento a gran escala y los
recursos de los servicios de datos en conjunto para construir un VCE
(entorno informtico virtual) [2]. Usuarios de cloud computing pueden
descartar las molestias de las inversiones a gran escala en las
plataformas de hardware y software, en actualizarlas con regularidad y en
costosas licencias de software de aplicacin que se utilizan para ejecutar
los procesos de negocio, transacciones relacionadas y los sistemas de
soporte de decisiones [3].
La nube es generalmente un entorno de computacin multiarrendatario; las soluciones de nube multi-tenant pueden optimizar el
intercambio de recursos al tiempo que proporciona solucin de
aislamiento en diferentes niveles requeridos para el inquilino[4].
Este modelo se ha asegurado una mejor accesibilidad de los mejores
sistemas de aplicacin posibles de apoyo por lo tanto un aumento de la
eficiencia de las empresas[5]. Los recursos se asignan a los usuarios
contra las solicitudes de servicio realizadas por sus terminales de gama
terminar, y los recursos son asignados por un motor de aprovisionamiento
de servicios que verifica la elegibilidad de los usuarios a partir de un
objeto de esquema separado que contiene datos multi-tenencia sobre
todos los usuarios y grupos de la nube. Una vez que la elegibilidad se
verifica, los recursos se reservan para el usuario a travs de los enlaces
de la sesin hasta que los procesos de computacin estn en curso por el
terminal de usuario. El terminal es normalmente un cliente virtualizado
presentado a travs de un conjunto de servidores virtuales. Sin embargo,
no puede haber carga directa de los recursos, as (ejemplo, para copia de
seguridad de datos). Una capa separada controla el uso de sesiones y
utilizacin de los recursos de tal manera que la informacin de facturacin
relacionada se puede generar[6]. NIST (Instituto Nacional de Estndares y
Tecnologa) est en el proceso de desarrollo de protocolos estndar para
la conectividad de los usuarios a la nube a travs de la interfaz de la
virtualizacin, la interfaz de emulacin de terminal, la interfaz de cliente

ligero y una interfaz de navegador de Internet. A partir de ahora, no hay un


protocolo estndar para la conectividad de los usuarios a la nube alojada
recursos [7].
Como un enfoque centrado en los datos de inteligencia de negocios (BI),
la adquisicin de datos es cada vez ms fcil de adquirir y grandes
almacenes de datos con 10-100s de terabytes de sistemas de gestin de
bases de datos relacionales (RDBMS) se estn convirtiendo cada vez ms
comn debido a la popularidad de los interactivos, web bases de datos
basadas en [33]. BI ha sido histricamente una de las aplicaciones
intensivas de la mayora de los recursos. Comprende una serie de
almacenes de datos creadas por ir a buscar los datos de apoyo a las
decisiones de amplias bases de datos de la organizacin. Los almacenes
de datos se actualizan a intervalos frecuentes a travs de consultas
apropiadas ejecutados en el procesamiento de los negocios y las bases
de datos transaccionales. Procesamiento analtico en lnea (OLAP) es la
interfaz de usuario final de BI que est diseado para presentar informes
grficos multidimensionales a los usuarios finales. OLAP emplea una
tcnica llamada anlisis multidimensional se utiliza principalmente para
permitir el anlisis interactivo flexible de los datos
multidimensionales [32]. Mientras que un relacionales base de datos
almacena todos los datos en forma de filas y columnas, OLAP tambin
emplea cubos de datos formadas como resultado de consultas
multidimensionales ejecutar en una gran variedad de almacenes de
datos. Por otra parte, una aplicacin OLAP obtiene datos de los
almacenes de datos, los organiza en cubos de datos multidimensionales
de alta complejidad, y se presenta a los usuarios a travs de definido por
el usuario y cuadros de mando GUI configurados [8]. Marco de BI y OLAP
tiene una utilidad de gran negocio, ya que ayuda a localizar y eliminar o
resolver las deficiencias del proceso de negocio, los pasos del proceso
ineficientes y pasos del proceso de residuos. Se espera que un marco de
BI y OLAP para proporcionar informacin oportuna, precisa, organizada e
integrada a los tomadores de decisiones de negocios [8] y [9].
A pesar de la excelente utilidad del negocio de marco de BI y OLAP,
muchos propietarios de negocios se vieron obligados a buscar su
alternativa debido a aumento incontrolado de los requisitos informticos y
de recursos de almacenamiento en entornos auto organizado. En algn
momento, el costo de mantener y actualizar el marco de BI y OLAP vuelve
injustificada para que una empresa [10]. Sin embargo, los puntos de venta
exclusivos de la nube oferta de computacin exactamente lo que las
empresas necesitan para ejecutar correctamente BI y OLAP marcosilimitadas recursos, la elasticidad de los recursos (recursos bajo
demanda), costos moderados de uso, alta de tiempo de actividad y
disponibilidad, de alta seguridad, no hay problemas de actualizacin y el
mantenimiento de cargas de servidores y bases de datos, y as
sucesivamente [1] y [5]. Por lo tanto, por la presente se argument que la
computacin en nube tiene el potencial de ofrecer una nueva oportunidad
de vida en el marco de BI y OLAP. Por otra parte, tambin se argumenta
que la computacin en nube puede extender el poder de BI y OLAP a las
pequeas y las empresas medianas, que no poda permitirse el marco en
el auto-organizada infraestructuras de TI. Sin embargo, es importante

establecer un marco para la implementacin de BI y OLAP en una


plataforma de computacin en nube.
El resto del documento est organizado de la siguiente
manera. Seccin 2 es una revisin de la literatura sobre cmo marco BI y
OLAP se puede implementar en las nubes y presenta beneficios clave de
la computacin en la nube para BI. Seccin 3muestra un enfoque para la
toma de BI a la nube, as como los desafos clave en la organizacin de BI
en la nube. Seccin 4 describe y explica en detalle cmo marco BI y
OLAP se puede modelar en una nube y cmo debe comportarse con el fin
de ampliar la mxima utilidad a las empresas en virtud de un experimento
de simulacin OPNET basado. Seccin 5 se presenta el resumen de los
resultados de investigacin y anlisis.Finalmente, las conclusiones de este
trabajo con las direcciones futuras se discuten en la Seccin 6.

2. Revisin de la literatura
2.1. Una revisin de la inteligencia empresarial y OLAP y su portabilidad
en computacin en nube
La inteligencia de negocios (BI) se emplea para monitorear el desempeo
de los procesos de negocio a travs de la presentacin y el anlisis de
datos multidimensionales tomadas de los sistemas de procesamiento de
transacciones distribuidas en toda la empresa precisa [23]. Los analistas
utilizando cuadros de mando OLAP habilitado sistemas de informacin y
prefieren asignar los datos financieros con los datos de rendimiento (de
personas y procesos) para identificar ineficiencias y reducir a travs de la
reestructuracin estratgica de los procesos de negocio y flujos de
trabajo[23]. Segn [24], un sistema de BI est hecha de siete capas: TI y
la infraestructura conexa, adquisicin de datos, integracin de datos,
almacenamiento de datos, organizador de datos, anlisis de datos y
presentacin de datos.
Los cubos OLAP forman el almacenamiento de datos (parcialmente, en
forma de puntos de vista) y los datos de la organizacin de capas de un
sistema de BI. Se asienta sobre las tablas de almacenamiento de datos en
forma de puntos de vista multidimensionales.Una estructura del cubo est
hecho de una serie de columnas con referencias cruzadas con datos
obtenida de diferentes procesos y tablas de datos financieros en un
periodo.Los perodos en un cubo son ms cortos que los que hay en el
almacn de datos que tiene la tarea de datos de proceso de
almacenamiento relacionados y financieros de perodos ms largos (por lo
general, cinco aos o ms). Las consultas OLAP son comandos de
bsqueda robusta que comprende datos de mltiples puntos de vista a la
vez. La capa de presentacin hace que los conjuntos de datos visibles en
forma de pantallas grficas multidimensionales [25] y [26].
Varios tipos de consulta OLAP se utilizan para generar las vistas y
presentarlos en los cuadros de mando / pantallas de
presentacin. Algunas de las consultas OLAP populares incluyen: slice
and dice, consultas pivotantes, fusionar / consultas de divisin, laminados
en marcha consultas y de perforacin hacia abajo consultas [26]. El cubo
OLAP se puede visualizar como una pila de planos matriz bidimensional,
en el que cada plano de la matriz representa una relacin entre dos

dimensiones diferentes [26]. Fig. 1es una presentacin de un cubo OLAP


multidimensional que comprende dos planos dimensionales matriz.

Fig. 1.
Una vista de la matriz de un cubo OLAP multidimensional.
Opciones Figura

Cabe sealar que estas matrices no son independientes el uno del


otro. Todos los atributos de estos planos se anidan entre s, y estn
vinculadas con una clave principal que controla todas las relaciones a
travs de mltiples elementos compuestos de muchos a muchos. Por
ejemplo, un cdigo de producto puede ser visto como una clave principal
que controla las relaciones entre todos los atributos relacionados con las
ventas en una empresa [27].
Formacin de cubos OLAP en una empresa no es una tarea fcil. Una
arquitectura bien planificada tiene que estar en su lugar para el contenido
de integracin, modelado / mapeo y presentacin. La arquitectura tpica
debera formar parte de: componentes y conectividad para el acceso
federado a todos los y DSS (sistemas de soporte de decisiones) en toda la
empresa, un diccionario de datos diseada de acuerdo con las
formulaciones de cubos OLAP, un mapeo de metadatos segn el
diccionario de datos, una de datos reales repositorio (almacenamiento), un
repositorio virtual de (vistas de datos que sirven como bloques de
construccin de los cubos OLAP) y los servicios avanzados de
presentacin de datos (cuadros de mando e interfaces de informes de BI
personalizadas) [28]. Modelado de datos precisos, el mapeo de metadatos
y la integracin de contenidos ayuda a la formacin precisa de cubos
multidimensionales y, finalmente, lo que resulta en la presentacin exacta
de temas de negocios [29]. La presentacin de datos debe hacerse de tal
manera que la interfaz hombre-mquina es tan amable como sea posible
(clasificacin, grficos, cdigos de colores y caractersticas interactivas
multidimensionales) [30].
El tipo de documento lenguaje de datos (DTD) definicin para definir un
esquema XML es el facilitador principal para la toma de BI a las
Nubes. Las vistas de datos multidimensionales en los cubos OLAP se

pueden formar mediante la inclusin de DTD analiza los archivos de datos


XML. DTD analiza archivos XML en un cubo OLAP resultados en las
estructuras adecuadas para hacer uso de los servicios web arquitectura
de una nube de orientacin. El tablero de instrumentos / BI de informes
interfaces y anlisis de datos capas se construyen en aplicaciones que
pueden alojarse como modo SaaS de Cloud hosting. Los almacenes de
datos y cubos OLAP se pueden formar empleando archivos de datos XML
multidimensionales y jerrquicas. Las estructuras DTD-uno a muchos se
pueden utilizar para crear los almacenes de datos y de los muchos-amuchos estructuras DTD se pueden utilizar para crear los cubos
OLAP.Los cubos y almacenes se pueden alojar en el modo PaaS de Cloud
hosting. Los componentes de la infraestructura de servidores
subyacentes, bases de datos, almacenamiento y red se pueden alojar en
el modo de IaaS de nube de alojamiento [22].
2.2. BI y OLAP
Marco BI y OLAP comprende una estructura multi-capa altamente
compleja. Los siguientes son los componentes clave del marco de BI y
OLAP [8]:

Una capa de interfaz de usuario que comprende una gran biblioteca de


cuadros de mando para la generacin de informes grficos.

Una capa de anlisis de datos que comprende escenarios hipotticos,


informes, consultas almacenadas y modelos de datos.

Una capa para el almacenamiento de los cubos OLAP formados por la


extraccin de datos multi-dimensional de la capa de datos (los
almacenes de datos).

Una capa de integracin de datos para la identificacin, limpieza,


organizacin y agrupacin de los datos extrados de los almacenes de
datos antes de que se forman los cubos.

Una capa de datos que comprende de los almacenes de datos.

Una capa de adquisicin de datos de la transformacin empresarial,


apoyo a las decisiones y de las bases de datos transaccionales
utilizados por varias funciones de la organizacin.

La capa que comprende los componentes de la infraestructura de TI y


recursos relacionados (procesamiento de datos, almacenamiento y red).
La caracterstica clave de un marco BI y OLAP es el cubo OLAP, que es
una vista multidimensional formado en la estructura de una matriz. El cubo
OLAP es una vista de datos complejo formado mediante la ejecucin de
consultas simultneas en las mesas de los almacenes de datos

subyacentes que recuperan al menos tres veces ms datos en


comparacin con una consulta de base de datos comn. Cada cubo
comprende una pila de mltiples dos informes dimensionales (un grafo
plano ordinaria que muestra una relacin entre dos variables). En
aplicaciones tpicas OLAP, las consultas traen tpicamente 10-12 veces
ms datos que una consulta de base de datos comn [11]. Una aplicacin
OLAP puede comprender mltiples cubos OLAP almacenados en forma
de una compleja jerarqua de matrices que tienen datos organizados en
forma de tabulaciones cruzadas. Los cubos normalmente se almacenan
en mercados de datos separados o dentro de tablas predefinidas en los
almacenes de datos [12]. Las funciones OLAP comunes empleados para
la formacin de dichos cubos con una jerarqua de datos de tabulacin
cruzada son drill-down, fusionar / dividir, roll-up, cortar-y-dados y
pivotante. Cada plano matriz se identifica por su propia clasificacin que
comprende diferentes asignaciones de datos. Los planos forman una
estructura en forma de nido como debido a interrelaciones. La relacin
resultante se parece a un rbol con las races que comprenden las
variables primarias y las ramas que comprenden las variables
secundarias. Por ejemplo, un cdigo de producto es una variable primaria
y los ingresos generados en lugar de venta es una variable secundaria. El
operador salpicadero puede modificar o cambiar las variables primarias y
secundarias, que dirige la consulta en busca de un conjunto diferente de
datos para formar diferentes tabulaciones cruzadas en el prximo ciclo de
consulta en los almacenes de datos subyacentes. Por lo tanto, los cubos
OLAP son flexibles y se pueden cambiar dinmicamente de acuerdo con
las necesidades del negocio [13]. Fig. 2 muestra el marco BI y OLAP.

Fig. 2.
El marco de BI y OLAP.
Opciones Figura

La figura muestra dos formas de cubos - los cubos de datos


multidimensionales OLAP y los cubos OLAP de datos maestros. Los

cubos de datos maestros controlan la formacin de la relacin entre los


planos de datos bidimensionales dentro de los cubos de datos
multidimensionales. Los usuarios de negocios se les ofrece una amplia
gama de variables que se pueden combinar para formar diferentes puntos
de vista de los informes de dos dimensiones necesarias en los cuadros de
mando. Los datos se extrae de OLTP (procesamiento de transacciones en
lnea) y bases de datos DSS en las tablas de almacenamiento de datos de
forma peridica, lo que a su vez ayuda en la actualizacin automtica
peridica de los datos en los cubos de datos y, finalmente, en los cuadros
de mando. Por lo tanto, los usuarios de negocio pueden seguir de cerca el
desempeo del negocio, en virtud de la actualizacin de cuadros de
mando de forma continua.Apropiada cdigo de colores de referencia
puntos / umbrales de ayuda en la generacin de alertas y alarmas. Esto
podra ayudar a los negocios que toman las decisiones estratgicas que
adopten medidas apropiadas [14] y [5].
2.3. Beneficios de Cloud BI
Hoy en da, las soluciones de la nube de BI estn ganando gradualmente
popularidad entre las empresas, ya que muchas empresas se estn dando
cuenta de los beneficios del anlisis de datos. Las empresas necesitan
conocimientos de calidad impulsadas por datos precisos ms que
nunca. Los proveedores de SaaS estn sirviendo como la interfaz
principal a la comunidad de los usuarios de negocios [22]. Nube de BI es
el concepto de la entrega de capacidades de BI como servicio. Los
siguientes son los beneficios clave de la computacin en nube para la
inteligencia de negocios.
2.3.1. La eficiencia de costes
En la nube, las empresas no necesitan presupuesto para los grandes, por
adelantado las compras de paquetes de software o realizar cambios que
requieren mucho tiempo en los servidores locales de poner la
infraestructura de BI en marcha y funcionando. Ellos lo tratan como un
servicio, pagando slo por los recursos informticos que necesitan y evitar
la adquisicin de activos costosos y mantenimiento reduciendo la barrera
de umbral de entrada.
2.3.2. La flexibilidad y la escalabilidad
Soluciones de nube de BI permiten una mayor flexibilidad para ser
alterado rpidamente para dar a los usuarios el acceso a tcnicas nuevas
fuentes de datos, la experimentacin con modelos analticos. Con las
soluciones de nube de BI, los usuarios de negocio podrn mantener un
mejor control fiscal sobre los proyectos de TI y tienen la flexibilidad para
ampliar o reducir el uso a medida que cambian las necesidades. Por otra
parte, en la nube, los recursos pueden escalar de forma automtica y
rpidamente y escalar, y puede soportar un gran nmero de usuarios
simultneos. Esto significa que los clientes pueden fcilmente aumentar
su uso de software sin demora o el costo de tener que desplegar e instalar
el hardware y el software adicional.

2.3.3. Confiabilidad
Confiabilidad mejora mediante el uso de mltiples sitios redundantes, que
puede proporcionar lugares de fiabilidad y seguros para el
almacenamiento de datos y los recursos se puede transmitir a travs de
un gran nmero de usuarios, lo que hace que la computacin en la nube
adecuado para la recuperacin de desastres y continuidad del negocio.
2.3.4. Capacidades de intercambio de datos mejorada
Aplicaciones en la nube permiten acceder a los datos a ser compartida de
forma remota y activar las capacidades de intercambio de datos entre la
ubicacin de fcil, ya que se despliegan a travs de Internet y fuera del
firewall de la empresa.
2.3.5. Sin gastos de capital
Bajo TCO (coste total de propiedad) es un beneficio clave del modelo de
Cloud. Con la nube, las empresas pagan por un servicio que realmente
utilizan. Con esta poltica, computacin en nube permite a las empresas
controlar mejor el CAPEX (gastos de capital) y el OPEX (gastos de
operaciones) asociada a actividades no esenciales. Por lo tanto, los
beneficios de BI se puede rodar ms rpido a ms usuarios dentro de la
organizacin.

3. Teniendo BI a la nube
BI en la nube es un juego de cambio de fase de TI, ya que hace BI
finalmente asequible y accesible en comparacin con el BI tradicional. En
la nube, las matrices en los cubos OLAP se pueden formar utilizando el
concepto de almacenamiento de datos web haciendo uso de los archivos
de datos XML utilizando DTD (definicin de tipo de documento) describe
lenguaje de programacin XML. Las estructuras de datos en los cubos se
forman usando la DTD analiza archivos XML [14]. El formato DTD ayuda a
un archivo XML para exhibir propiedades relacionales de una base de
datos convencional.Esto es lo que permite a los cubos OLAP
almacenados en la nube haciendo uso de los archivos de datos XML
siguientes estructuras DTD (llamadas cubos web). Esto tambin ayuda a
que el sistema de BI hacer uso de componentes de servicios web
garantizando as un mejor rendimiento en la nube [15], [16], [17] y [18]. El
marco OLAP entera que comprende los cuadros de mando y la capa de
anlisis de datos se puede alojar como SaaS. Las plataformas de software
marco BI y OLAP disponibles para Cloud hosting son SAP, IBM Cognos y
el salpicadero Web-Sphere Dashboards, objetos de negocio de Oracle y
Salesforce.com. La integracin de los almacenes de datos (basado en
XML) y bases de datos OLTP / DSS se pueden alojar en PaaS. Los
servidores y bases de datos subyacentes se pueden alojar en el modo de
IaaS de Cloud hosting. Para un rendimiento ptimo en la nube, los
servidores y matrices de base de datos debe ser aplicado en un sistema
paralelo masivo capaz de procesar grandes consultas en paralelo [19].
Una base de datos optimizado para trabajar en un entorno de
procesamiento masivamente paralelo. Las bases de datos en la nube

deben aplicarse en forma de un sistema paralelo masivo para apoyar alta


elasticidad de la demanda del marco de BI y OLAP. Un objeto de esquema
centralizado puede estar diseado para mantener los datos y privilegios
de todos los inquilinos en la Nube. Cada objeto de esquema que contiene
los archivos de datos puede dividirse masivamente de manera que cada
particin puede ser ocupado por un servidor independiente en una matriz
de servidores a gran escala. El proveedor de IaaS debe ser capaz de
rpida expansin de la que hace uso matriz de servidor de expansin del
array virtualizado. De esta manera, puede ser posible para servir a una
particin a travs de ms de un servidor que puede mejorar el rendimiento
de BI. El proveedor de IaaS debe mantener una estrecha vigilancia sobre
los dos patrones de distribucin y tiempo de respuesta de carga y hacer
cambios en la red eficaces para garantizar que la carga de la red tambin
se distribuye de manera uniforme [21]. La aplicacin OLAP alojado en la
nube puede no ser compatible servicios web. Para hacer una aplicacin
OLAP compatible con la arquitectura de servicios web, el proveedor de
SaaS puede permitir la creacin de una capa intermedia para albergar un
grafo de dependencias que ayuda en la cada de los atributos no se
necesitan en el cubo de datos XML finalizado [20] y [21].
Por lo tanto, los siguientes son los desafos clave en la organizacin de BI
en la nube:

El cumplimiento de la aplicacin de BI con los servicios web estndares


arquitectnicos (y los estndares definidos por el proveedor de SaaS o
PaaS, como las normas de Google Apps).

Despliegue del sistema de datos de depsito masivamente paralelo con


la carga distribuida uniformemente consulta e incluso los patrones de los
tiempos de respuesta de todos los servidores de bases de datos. El
proveedor de IaaS debe utilizar con eficacia la gestin matriz de servidor
virtualizado y expansin para satisfacer los recursos bajo demanda.

La arquitectura de red debe estar diseado de tal manera que la carga


de consulta puede ser distribuido uniformemente entre los servidores en
una matriz. Esto asegurar incluso los tiempos de respuesta de
procesamiento de consultas por los servidores en una matriz. Si la
matriz de servidor emplea rea de almacenamiento en red para
almacenar los archivos de datos XML y los cubos OLAP, ir a buscar los
datos de varios dispositivos de almacenamiento de nuevo deben ser
distribuidos de manera uniforme, en virtud de las conexiones de red
apropiados.
En la siguiente seccin, se ha creado un modelo de OPNET de un marco
de BI y OLAP pequea escala en el Cloud. La red ha sido diseado de tal
manera que la carga se distribuya de manera uniforme a todos los
sistemas de gestin de base de datos relacionales (RDBMS)
servidores. Adems, las demandas de las aplicaciones se han creado de
tal manera que todos los servidores RDBMS estn implicados de manera
uniforme en la recepcin y el procesamiento de la carga de consulta

OLAP. El BI en el modelo de nube se describe en la siguiente seccin y


los resultados de la simulacin se describen en la siguiente seccin.

4. BI en el modelo de la nube
En esta seccin se ofrece una breve descripcin de la interfaz principal del
modelo OPNET. El modelo consta de dos grandes dominios - BI en el
dominio de la nube y el dominio Extranet que comprende seis
corporaciones que tienen 500 usuarios OLAP en cada uno como se
muestra en la Fig. 3. Las nubes se muestran en esta interfaz se crean
utilizando la red IP objetos Nube en OPNET. Un objeto de la nube de la
red IP se puede ampliar para entrar en otra gama de colores para la
realizacin de modelo detallado que comprende nodos y enlaces.

Fig. 3.
La arquitectura del modelo.
Opciones Figura

Las Nubes de aplicacin son objetos de la nube de red IP que


comprenden matrices de servidores de aplicaciones y bases de datos,
conjuntos de servidores conectados a una red de la nube. Los perfiles son
necesarios en un modelo OPNET para configurar el comportamiento de
las aplicaciones configuradas en la red y aplicar en sistemas de servidor,
de forma selectiva, de tal manera que el papel, la carga de trfico,
patrones de trfico, de inicializacin y terminacin, e inter-sesin retrasos
pueden ser claramente definida. Los perfiles tambin ayudan en la
definicin de un patrn de trfico iniciado por un servidor o un dispositivo
cliente final, como - constante, lineal, logartmica, en serie al azar, en serie
ordenada, paralelo (con tiempos superpuestos), concurrente, o
exponencial. Si la calidad del servicio se lleva a cabo, los perfiles tambin
ayudan en la definicin de prioridades de trfico.
Experto en BI tendr en cuenta al hacer el cambio a BI basada en la nube
supondr una implementacin masiva de las bases de datos relacionales
en la nube alojada servidores. Por lo tanto, los arrays de servidor (tanto la
aplicacin como bases de datos) se implementan en forma de un sistema
de procesamiento paralelo masivo sin objeto fsico ligado a ningn
hardware especfico [31]. Las aplicaciones y bases de datos en las
plataformas de cloud computing deben ser Web 2.0. Por lo tanto, todas las
aplicaciones y bases de datos deben soportar los formatos XML y

WML. Estos formatos son compatibles con todos los sistemas de bases
de datos modernos. Por lo tanto, los datos almacenados en los objetos
tradicionales de esquema se pueden exportar a formatos DTD para formar
archivos de datos XML. Anlisis sintctico es una forma de filtrado de
datos y la formacin de una estructura de DTD idntica a la estructura
prevalente en los objetos de esquema. De anlisis tambin ayuda en la
migracin de las propiedades relacionales en los objetos de esquema en
los archivos XML. Dado que los cubos OLAP son "extractos" multidimensionales de las tablas de esquema de un almacn de datos, que
pueden formarse fcilmente utilizando los archivos XML despus de un
anlisis DTD organizado. Estos archivos XML se pueden consultar ms de
alimentar datos en varios cuadros de mando, que esencialmente son autoactualizacin de dos dimensiones grficos / tablas / metros.
El BI en el dominio de la nube se expande en la Fig. 4. El marco de BI en
la nube se ha modelado mediante cuatro nmeros de Cisco 7609 capa 3
series de enrutamiento de gama alta interruptores de conexin de tal
manera que la carga se distribuya uniformemente. El interruptor de la
nube 4 est dedicado a enrutar todo el trfico entrante a los servidores y
enviar sus respuestas de nuevo a los clientes. La nube interruptores 1 y 3
estn cumpliendo cuatro servidores RDBMS cada uno y la Nube
interruptor 2 est sirviendo a todos los servidores de aplicaciones
OLAP. Una serie de cinco nmeros de los servidores de aplicaciones
OLAP y una serie de ocho nmeros de servidores RDBMS. Las lneas de
puntos azules indican la distribucin del flujo de trfico configurado entre
los servidores de aplicaciones OLAP y los servidores RDBMS. Las
demandas de los servidores RDBMS se distribuyen por igual a invocar un
procesamiento paralelo masivo como el medio ambiente.

Fig. 4.
El BI en la arquitectura Cloud.
Opciones Figura

Las lneas de puntos azules de cada servidor OLAP se dibujan a todos los
servidores RDBMS que indican que cada servidor OLAP utilizar los
servicios de todos los servidores RDBMS disponibles en la matriz para
procesar una consulta de base de datos. La carga del cliente se enva a
los servidores de aplicaciones OLAP utilizando la configuracin de
preferencias de destino en los objetos cliente configurados en el dominio
Extranet, como se muestra en la figura. 5.

Fig. 5.
El dominio Extranet comprende seis corporaciones que tienen 500 usuarios OLAP en
cada empresa.
Opciones Figura

La Extranet consta de tres interruptores de puerta de enlace de ISP que


sirven seis segmentos LAN corporativas que tienen 500 usuarios cada
una. Un total de 3000 usuarios concurrentes OLAP se han modelado en la
red. En Nubes reales este nmero podra ser mucho mayor (cientos de
miles). La idea clave es analizar cmo los servidores de bases de datos
estn procesando la carga paralela aplicada por la aplicacin OLAP. Cada
objeto LAN tiene los cuatro servidores OLAP configurados como
preferencias de destino para el perfil de aplicacin OLAP. De esta forma,
las peticiones de los clientes OLAP se enrutan a los cuatro servidores
OLAP y las solicitudes de RDBMS se enrutan de los cuatro servidores
OLAP a los ocho servidores RDBMS (que sirven como una pequea
matriz de servidores de escala en este modelo).
Consultas OLAP son 10-12 veces ms pesado que las consultas de bases
de datos normales. Esto se debe a que cada consulta extrae datos
multidimensionales de varios esquemas. Por lo tanto, la carga de consulta
en las transacciones OLAP es muy alta.Teniendo en cuenta que el servicio
de OLAP en una nube puede ser utilizada por cientos de miles de
usuarios, las bases de datos de back-end necesitan ser repartido
masivamente con el procesamiento paralelo de las particiones para
manejar la carga de consultas OLAP. Este hecho se ha demostrado en los
resultados de la simulacin. Un objeto de esquema centralizado debe
mantenerse con todos los detalles de los inquilinos, como - la

identificacin, los usuarios por el inquilino, identificadores de usuario,


contraseas, secretos pre-compartida, privilegios de acceso, las
asignaciones de nivel de servicio y los detalles de esquema inquilino [31].
Las consultas OLAP se han configurado con los siguientes atributos:

Mezcla de transaccin comprende 100% de las consultas de slo lectura


porque todas las tablas de data warehouse son.

Transaccin tiempo entre llegadas es de 1 s que indican una carga


pesada consulta.

Cada transaccin transfiere 10.240 bytes, que es 10 veces ms que el


tamao predeterminado en OPNET. Esto se debe a una consulta OLAP
es al menos 10 veces ms pesado que consulta la base de datos
normal.
Las consultas RDBMS se configuran mediante los atributos que se
muestran en la Tabla1. Las configuraciones por defecto de carga de base
de datos de pesada de OPNET ha sido elegido y luego aument en 10
veces en la Tabla 2. Esto se basa en la revisin de la literatura que OLAP
carga de consulta de bases de datos est en menos 10 veces ms
pesado que la carga normal de consulta. Adems, el tiempo entre
llegadas de consulta se ha fijado en un segundo, y el tipo de servicio se
ha fijado en "excelente servicio". Por ltimo, la mezcla de transaccin de
consultas frente a las transacciones totales se ha fijado en 100%. Esto es
porque el BI y el marco de OLAP no tiene la carga de entrada de datos ya
que el marco se utiliza para el soporte de decisiones estratgicas.
Mesa 1.
Los ajustes de consulta de base de datos para emular la carga de consultas OLAP en
las bases de datos.

Tabla 2.
El perfilado de aplicaciones OLAP.

La aplicacin OLAP se ha configurado como una aplicacin HTTP


navegacin pesada que tiene que vara de 5120 bytes a 10.240 bytes de
descargas de objetos por segundo (continuamente cuadros de mando de
actualizacin), de 7 a 10 objetos por interfaz (cuadros de mando, sus
pantallas descripcin, leyendas, cuadros de texto, y as sucesivamente),
una segunda vez objeto de actualizacin (debido a que el tiempo de
transaccin entre llegadas en las bases de datos es de un segundo) y 10segunda pgina de tiempo de refresco (asegurndose de que la pantalla
OLAP se actualiza despus de cada 10 de cubo se actualiza de tal
manera que el usuario obtiene notable cambios de datos en cada
actualizacin de la pantalla).
La Tabla 2 muestra el perfil de aplicacin de aplicacin OLAP (peticiones
OLAP) y los servicios RDBMS. Tanto los perfiles disparan
simultneamente con un desplazamiento de 5 a 10 s despus de la hora
de inicio. La hora de inicio se ha configurado a 50-55 s para asegurarse
de que todas las actualizaciones de enrutamiento se completen con xito
en la red antes de que se activan los servicios de aplicacin.

5. Los resultados de investigacin y anlisis


En esta investigacin, los resultados que se muestran aqu son los
capturados de una simulacin de 50 millones de eventos que es el
mximo posible en la edicin acadmica OPNET. La carga de consultas
no es exactamente el mismo en los servidores RDBMS pero el patrn
indica casi una distribucin uniforme de la carga de la consulta. Esto es
evidente en las "solicitudes de consulta de bases de datos por segundo"
estadsticas recopiladas en los ocho servidores RDBMS apilados uno
encima de otro como se muestra en la figura. 6.

Fig. 6.
Carga de consultas en los servidores RDBMS.
Opciones Figura

Las solicitudes de consulta experimentados por cada servidor se


representan en forma de "nmero de consultas por segundo" en la Y eje x
con respecto al tiempo de simulacin en el X eje y. En la Fig. 6, esta
estadstica se reporta para el servidor RDBMS del 1 al 8 de servidor en la
nube. Esto ha sido posible en OPNET debido a la aplicacin de las
configuraciones de la demanda de cada servidor OLAP a todos los
servidores RDBMS.
Sin embargo, esto no ser tan sencillo en una verdadera nube de BI como
aparece aqu.Tal distribucin paralela de carga de consulta se conseguir
mediante la implementacin de los motores de enrutamiento
apropiados. Adems, la carga de consulta de cada servidor OLAP ser
diferente y por lo tanto, el motor de enrutamiento debe ser un dispositivo
inteligente que puede detectar la carga de todos los servidores OLAP e
igualmente distribuirlos entre los servidores de RDBMS. Si una matriz de
servidores RDBMS se carga de manera ptima, el motor de enrutamiento
debe garantizar extienda de la carga a matrices adicionales conectados a
la nube. Puede ser posible que los arreglos adicionales son recibidos por
otros proveedores de IaaS.
La carga de consultas est ligeramente por encima o por debajo de 40
solicitudes por segundo en todos los servidores RDBMS. Esto revela que
la distribucin de la carga a travs de la configuracin de red adecuada y
la aplicacin de perfiles de demanda (configuraciones de flujo de trfico
indicados por lneas de puntos azules en la Fig. 4).Estas configuraciones
han causado cerca de una distribucin uniforme de la carga de consulta
de los cuatro servidores OLAP en los servidores RDBMS. Adems, los
tiempos de procesamiento de la tarea de consulta en los servidores de
bases de datos son tambin casi incluso como se muestra en la figura. 7.

Esto ha sido posible debido a que el mismo hardware marca, modelo y


configuraciones han sido elegidos por todos los ocho servidores
RDBMS. El tiempo de respuesta de la consulta por cada servidor se
representa en forma de "nmero de consultas procesadas por segundo"
en la Y eje x con respecto al tiempo de simulacin en el X eje y. En la
Fig. 7, esta estadstica se reporta para el servidor RDBMS del 1 al 8 de
servidor en la nube.

Fig. 7.
Consulta el tiempo de procesamiento de tareas por los servidores RDBMS.
Opciones Figura

Estos resultados son una buena demostracin de cmo un sistema


RDBMS masivamente paralelo puede ser desplegado para formar un
marco de BI y OLAP, y cmo el marco debe realizar en el entorno
Cloud. Esto est en consonancia con los requisitos establecidos por los
investigadores como revisado en el estudio de la literatura. Sin embargo,
hay algunos puntos clave que se deben tener en cuenta acerca de este
modelo que se enumeran a continuacin:
En primer lugar, el modelo tiene slo ocho servidores de la matriz RDBMS
que sirven slo cuatro nmeros de servidores de aplicaciones OLAP.
En segundo lugar, la distribucin de la carga se ha gestionado de manera
uniforme a travs de modelos de flujo de demanda de aplicaciones que es
una excelente caracterstica de OPNET y funciona muy bien.
En tercer lugar, los servidores seleccionados en este modelo son de la
misma marca y modelo que tiene la configuracin de hardware idntico.
En cuarto lugar, la carga se ha modelado como constante despus de un
aumento exponencial en la salida. La simulacin de la carga llevada a
cabo en este modelo ha durado slo para 50 millones de eventos sin
variaciones de carga.

Por ltimo, este modelo cuenta con slo 3.000 usuarios OLAP de
conexin al mismo tiempo. Un entorno de BI real sobre computacin en
nube tendr decenas de miles de usuarios finales que solicitan la carga BI
concurrente en los servidores.
Estos son escenarios ideales que no ser posible en las nubes reales. Sin
embargo, estos ajustes en OPNET han convertido en retos que se
enfrentan en el movimiento de BI a la nube segn los requisitos
establecidos por los investigadores. Una nube tendr cientos de
servidores en las matrices; por lo tanto, una distribucin uniforme de carga
de la red ser una tarea muy difcil.
Los arquitectos tendrn que mirar para los cuellos de botella en las
conexiones entre switches, incluso si se implementan mediante las
conexiones ATM posibles de ms rpido o el gigabit Ethernet 10G. La
distribucin de la carga tendr que ser gestionado por los motores y los
routers de aprovisionamiento avanzadas, que no ser tan fcil como la
configuracin de los patrones de flujo de la demanda de aplicaciones en
OPNET segn lo indicado por las lneas de puntos azules en la figura. 4.
Estos motores de aprovisionamiento y routers necesitan ser optimizados
para asegurar que la carga del usuario se distribuye uniformemente entre
los servidores de la matriz y se extendi a matrices adicionales si hay un
escenario de sobrecarga. La particin de bases de datos en los
almacenes de datos se debe lograr de una manera tal que las matrices se
pueden expandir con rapidez y nuevos servidores pueden empezar a
contribuir recursos al servicio de las particiones sin llevar a cabo los
cambios estructurales de las bases de datos. En algn momento, debera
ser posible implementar tanto los almacenes de datos y cubos OLAP que
emplean los archivos de datos XML, eliminando por completo la
necesidad de sistemas de software RDBMS tradicionales en el marco de
BI y OLAP.
En cuanto al hardware, puede que no sea posible que el proveedor de
IaaS de implementar una nube con hardware idntico marca, modelo y
configuraciones. Por lo tanto, el tiempo de respuesta de procesamiento de
consultas de cada servidor ser diferente en la nube debido a diferencias
en las configuraciones de hardware. Por lo tanto, una mera distribucin
uniforme de la carga a los servidores por el motor de aprovisionamiento
de servicios y el router no sirva al propsito. Debe haber algo de
inteligencia para dirigir la carga basado en el conocimiento de los tiempos
de respuesta de procesamiento de consultas de los servidores. Los
servidores con tiempos de respuesta ms lentos deben recibir menos
carga en comparacin con los servidores con tiempos de respuesta ms
rpidos para eliminar estados de espera en el extremo receptor. Las
capacidades de particionamiento RDBMS, balanceo de carga RDBMS,
servicios de aplicaciones aprovisionamiento web, motores de
enrutamiento de servicios y consulta de optimizacin de rendimiento
deben ser explotados de manera efectiva por los arquitectos de BI. Esto
es para asegurar que el sistema de procesamiento masivamente paralelo
de matrices de servidor de base de datos funciona perfectamente para
utilizar eficazmente la potencia de procesamiento de los servidores y

sincronizar los tiempos de procesamiento de consultas para reducir o


eliminar los estados de espera al final de los servidores de aplicaciones.
La discusin anterior presenta un reto ms en la adopcin de BI a las
Nubes. Los proveedores de SaaS, PaaS y IaaS pueden ser diferentes
empresas. Por lo tanto, para garantizar los requisitos anteriores de BI de
alojamiento en las nubes, estos proveedores necesitan para llevar a cabo
una excelente coordinacin de los detalles arquitectnicos para el diseo
y la implementacin de los servicios para permitir que las diversas capas
del marco de BI y OLAP. BI no se puede implementar de una manera adhoc por los proveedores de lo contrario sufrir el mismo nivel de los
cuellos de botella y las crisis de recursos, ya que ha estado sufriendo en
entornos auto-organizada. Los proveedores necesitan para llevar a cabo
una planificacin eficaz de todos los detalles y poner en prctica los
componentes de infraestructura, componentes de la plataforma y los
componentes de la aplicacin para lograr un verdadero sistema de
procesamiento masivamente paralelo con un marco de aumento de la
capacidad de alta elasticidad utilizando todas las tecnologas disponibles
de manera eficiente.

6. Conclusiones y direcciones futuras


Cloud es una parte importante del futuro de BI y ofrece varias ventajas en
trminos de eficiencia de costes, flexibilidad y escalabilidad de la
aplicacin, la confiabilidad y capacidades mejoradas de intercambio de
datos. Nube tiene el potencial de ofrecer una nueva oportunidad de vida al
marco de BI y OLAP. La computacin en nube se compone de tres modos
de aprovisionamiento de servicios - software-as-a-service (SaaS),
plataforma como servicio (PaaS) e infraestructura-como-un-servicio
(IaaS). Estos servicios pueden ser prestados por la misma o de diferentes
proveedores, dependiendo de los acuerdos comerciales. Sin embargo, el
proveedor de SaaS necesita la configuracin de la PaaS y IaaS Nubes
que se definan de acuerdo con los servicios de aplicaciones
proporcionadas a travs de los componentes de la arquitectura de
servicios web. Nubes comprenden los de aprovisionamiento y de
enrutamiento motores de servicios que pueden detectar con eficacia el
patrn de carga en los recursos subyacentes.
Marco de BI y OLAP es muy intensivo en recursos. Tiene una arquitectura
multicapa que comprende cubos OLAP multidimensionales con matrices
multiplexados que representan las relaciones entre las diferentes variables
de negocio. Los cubos se forman mediante el envo de consultas OLAP a
los almacenes de datos almacenados en los servidores RDBMS. El
tamao de una consulta OLAP es tpicamente 10-12 veces ms grande
que una consulta de base de datos comn. Por lo tanto, si se toma marco
de BI y OLAP a la nube para servir a cientos y miles de usuarios finales,
es esencial que los proveedores de la nube implementar sistemas de
procesamiento de RDBMS masivamente paralelas con una distribucin
uniforme de la carga de consulta y los tiempos de respuesta de consultas
para los servidores de aplicaciones OLAP. En esta investigacin, un marco
de BI y OLAP se ha modelado utilizando OPNET y los requisitos de una
matriz de servidor RDBMS masivamente paralelo se ha modelado usando

las caractersticas OPNET. Los resultados han reflejado el escenario ideal


para la toma de BI a la nube. Sin embargo, las nubes reales no tendrn
configuraciones ideales como hecho en este modelo OPNET. Por lo tanto,
los desafos reales en la nube deben ser identificados y dirigida a
garantizar que los resultados se pueden acercar a los escenarios ideales
en la medida de lo posible.
Se han discutido los detalles de desafos en la implementacin de un
sistema de servidor de procesamiento masivamente paralelo RDBMS para
tomar BI a la nube. Muchos ajustes que son posibles en el entorno de
simulacin OPNET pueden requerir innovaciones arquitectnicas
significativas para lograr lo que se ha descrito en este documento para
tomar con xito de BI a las Nubes.
En el futuro, los investigadores pueden gustara estudiar tecnologas
modernas relativas a la prestacin de servicios, enrutamiento de servicios,
la particin de esquema, balanceo de carga, y as sucesivamente para
poner en prctica un sistema RDBMS nivel de la empresa para lograr un
sistema de servidor de procesamiento RDBMS masivamente paralelo para
la toma de BI a las Nubes . En este contexto, hay una gran oportunidad
para llevar a cabo mltiples estudios experimentales para evolucionar las
soluciones de configuracin prcticos tiles para los proveedores de
servicios cloud destinados a albergar marco BI y OLAP en la Nube.
La computacin en nube tambin ofrece potencia de clculo considerable
y capacidad.Por lo tanto, se espera que BI para entrar en muchos
dominios complejos (empresariales y no empresariales relacionados) que
eran imposible que en un entorno alojado en s mismo. Aplicaciones
como, automatizacin sensible al contexto reconoce la ubicacin, la
semntica masivas escala, bases de datos de ciencia y tecnologa
avanzada, el desastre en tiempo real y gestin de crisis, gestin de la
ciudad, las finanzas globales y reporte economa y la vigilancia mundial de
las industrias y sectores son pocas reas donde BI o BI como sistemas
poseen un enorme potencial de la computacin en la nube. El tamao, la
escala, el dinamismo y alcance de mercados de datos y almacenes de
datos en las nubes pueden superar incluso la escala de petabytes (el
desafo emergente de Big Data). Tales sistemas de datos no se pueden
gestionar mediante sistemas y herramientas tradicionales. Los desafos de
seguridad en tales escalas masivas ser diferente y mucho ms
compleja. Por lo tanto, esta investigacin tiene aberturas significativas
para las contribuciones futuras. Este concepto es una especie de principio
de crear un escenario para los estudios sobre este tipo de desafos
futuros.

Agradecimientos
El trabajo presentado en este trabajo ha sido apoyado por la Asociacin
de Investigacin de Educacin Superior entre China y Reino Unido para
Estudios de doctorado, Fundacin de Ciencias Naturales de la provincia
de Jiangsu de China (BK20130528), RLTF Social P2P
Programa (RLTFD015), Visitante Programa Becario de Investigacin de la
Universidad de Tongji ( 8,105,142,504), la Fundacin Nacional de Ciencias

Naturales de ChinaPrograma (61202 mil cuatrocientas setenta y


cuatro y 61272 mil setenta y cuatro) y de China 973 Fundamental I + D
Programa (2011CB302600).