Sie sind auf Seite 1von 110

UNIVERSIDAD VERACRUZANA

Facultad De Contadura y Administracin


Desarrollo de Cubos como Herramienta de
Explotacin de Datawarehouse

MONOGRAFA
para obtener el Ttulo de:

Licenciado en Sistemas
Computacionales Administrativos
Presenta:

Diana Yazmin Daz Amaro


Asesor:

M.C.C. Rafael Barragn Flores


Xalapa-Enrquez, Veracruz

Agosto 2009

UNIVERSIDAD VERACRUZANA
Facultad De Contadura y Administracin
Desarrollo de Cubos como Herramienta de
Explotacin de Datawarehouse

MONOGRAFA
para obtener el Ttulo de:

Licenciado en Sistemas
Computacionales Administrativos
Presenta:

Diana Yazmin Daz Amaro


Asesor:

M.C.C. Rafael Barragn Flores


Xalapa-Enrquez, Veracruz

Agosto 2009

DEDICATORIAS
Principalmente a Dios por darme la oportunidad de culminar mis estudios y cumplir as con
el sueo de ser una gran profesionista por darme la oportunidad de ver y disfrutar un da
mas lleno de ilusiones y esperanzas y por hacerme una mujer con firmeza y determinacin.
A mis padres Blanca y Ricardo por ser mi gua, mi base, mis cimientos, por
ensearme lo esencial de la vida y por apoyarme siempre y en todo momento porque sin
ustedes este logro no sera tan satisfactorio. Gracias por permitirme compartir todos y cada
uno de los momentos de logro, tristeza, alegra, enojo, decepcin, que esta etapa de estudiante
han dejado. Gracias por brindarme su confianza e inculcarme los valores y las ganas de
superacin.

A ti mam, porque tus brazos siempre se abren cuando necesito un abrazo; porque tu
corazn sabe comprender cuando necesito una amiga; porque tus ojos sensibles se endurecen
cuando necesito una leccin; porque tu fuerza y tu amor me han dirigido por la vida y me han
dado las alas que necesitaba para volar.

A ti pap, porque cuando nac eras el ser que siempre apareca para aplaudir mis
ltimos logros; cuando me iba haciendo mayor la figura que me enseaba la diferencia entre el
bien y el mal; quien durante mi adolescencia, era la autoridad que pona limites a mis deseos, y
quien ahora en esta etapa de mi vida deseara que fueras el mejor consejero y amigo que
pudiera tener.

A mi hermana Marisol, por aguantarme en esos momentos de tensin y estrs; por


ser mi mejor amiga, que con su alegra arranca sonrisas aun en los momentos ms difciles; por
hacerme ver que la vida hay que disfrutarla y hacer de ella la mejor fiesta.

A mi abuelita Tomasita, por su amor incondicional, por apoyarme en todo


momento y por depositar su confianza en m por darme la motivacin necesaria para
continuar con la lucha del da a da.

A mis tos Juanita y Gil, por creer en m; por brindarme siempre su apoyo y por ser
un gran ejemplo para m. Por estar en los momentos buenos y malos y por transmitirme su
motivacin y sus ganas de que sea una persona de bien.

A ti Amor, por estar conmigo en las buenas y en las malas porque tu amor me da
un motivo ms para ser mejor y superarme da a da.

Al Lic. Barragn, por depositar su confianza en m, por creer en m, por brindarme


su apoyo y por ser un ejemplo de superacin.

Gracias a todos por ser parte fundamental de este gran logro, por ser parte de mi
crecimiento y por motivarme a ser una mejor persona y permitirme compartir con
ustedes esta inmensa alegra.

Deseo que sepan que este logro es mo y de ustedes.


GRACIAS POR CREER EN M

Con Amor y Cario.

INDICE
Resumen ............................................................................................................. 1
Introduccin ......................................................................................................... 2
Capitulo 1: conceptos Bsicos ............................................................................. 7

1. Inteligencia de Negocios ................................................................................ 8


1.1. Antecedentes ........................................................................................... 8
1.1.1. Niveles de uso de los datos ........................................................ 9
1.2. Definicin ................................................................................................ 10
1.3. Valor de la Inteligencia de Negocios........................................................ 12
1.4. Beneficios de la Inteligencia de Negocios ............................................... 13
1.5. Cinco Etapas Evolutivas de la Inteligencia de Negocios ......................... 14
1.6. Ciclo de la Inteligencia de Negocios ........................................................ 15
1.7. Inteligencia de Negocios en la Pirmide Organizacional ......................... 17
1.8. Herramientas de Inteligencia de Negocios .............................................. 17
1.9. Soluciones de Inteligencia de Negocios .................................................. 18
1.10. La Inteligencia de Negocios en el Futuro.19

2. 2.Datawarehouse ............................................................................................... 20
2.1. Procesamiento de Datos ......................................................................... 20
2.1.1. OLTP........................................................................................... 20
2.1.2. OLAP .......................................................................................... 21
2.1.3. Diferencias entre OLTP y OLAP ................................................. 22
2.2. Datawarehousing ..................................................................................... 23
2.2.1. Definicin .................................................................................... 23
2.3. Datawarehouse........................................................................................ 24

iii

2.3.1. Definicin .................................................................................... 24


2.4. Arquitectura Bsica.................................................................................. 25
2.5. Metodologas de Diseo .......................................................................... 26
2.5.1. Enterprise Datawarehouse (EDW) .............................................. 27
2.5.1.1. Componentes ............................................................. 29
2.5.2. Datawarehouse Bus o Dimensional ............................................ 30
2.5.2.1. Componentes ............................................................. 31
2.6. Proceso ETL, Extraccin, Transformacin y Carga ................................. 34
2.6.1. Extraccin ................................................................................... 34
2.6.2. Transformacin ........................................................................... 35
2.6.3. Carga .......................................................................................... 36
2.7. Metadatos ................................................................................................ 38
2.7.1. Clasificacin ................................................................................ 39
2.8. Modelado Dimensional ............................................................................ 39
2.8.1. Componentes.............................................................................. 40
2.8.1.1. Tabla Hecho ............................................................... 40
2.8.1.2. Tabla Dimensin ........................................................ 40
2.8.2. Esquemas Relacionales.............................................................. 40
2.8.2.1. Esquema Estrella ....................................................... 41
2.8.2.2. Esquema Copo de Nieve ........................................... 43
2.9. Datamart .................................................................................................. 45
2.9.1. Definicin .................................................................................... 45

Capitulo 2 Herramientas de Explotacin de Datawarehouse ............................... 46

2.1 Generalidades .......................................................................................... 47


2.2 Herramientas de Explotacin ................................................................... 48
iv

2.2.1 Query and Reporting .................................................................... 48


2.2.1.1 Soluciones de Query and Reporting en el mercado ...... 50
2.2.2 EIS Executive Information System ............................................... 52
2.2.3 Tableros de Control ...................................................................... 53
2.2.3.1 Semforos..................................................................... 54
2.2.4 Datamining ................................................................................... 54
2.2.5 Webhousing.................................................................................. 56
2.2.6 Herramientas OLAP...................................................................... 57

Captulo 3 Cubos OLAP ....................................................................................... 58


3.
3.1. Definicin ................................................................................................. 59
3.2. Cubos Virtuales ....................................................................................... 60
3.3. Restricciones ........................................................................................... 60
3.4. Componentes .......................................................................................... 61
3.4.1. Dimensiones ............................................................................... 61
3.4.2. Niveles de Jerarqua ................................................................... 62
3.4.3. Medidas ...................................................................................... 62
3.4.4. Hechos ........................................................................................ 63
3.5. Propiedades de los miembros ................................................................. 65
3.6. Agregaciones ........................................................................................... 65
3.7. Tipos de Almacenamiento ....................................................................... 66
3.7.1. ROLAP ........................................................................................ 66
3.7.2. MOLAP ....................................................................................... 67
3.7.3. HOLAP ........................................................................................ 68
3.7.4. Diferencias .................................................................................. 68
3.8. Operaciones con Cubos .......................................................................... 69
v

3.9. Indicadores .............................................................................................. 70


3.9.1. Definicin .................................................................................... 70
3.10. Optimizacin del Rendimiento ............................................................... 71
3.11. Recomendaciones para el diseo de Cubos ......................................... 72
3.12. Software para la creacin de Cubos ...................................................... 74
3.12.1. Pentaho .................................................................................... 75
3.12.2. Microsoft SQL Analysis Services SSAS .................................... 75
3.12.3. OlapX ..................................................................................... 76
3.12.4. Oracle 10g y 11g....................................................................... 77
3.12.5. SAP Bussiness Object .............................................................. 77

Captulo 4 Visualizacin de un ejemplo de Cubo ................................................. 80


4.1Descripcion ............................................................................................... 80
4.2 Visualizacin de la informacin del cubo ................................................. 80
4.3 Componentes Bsicos ............................................................................. 81
4.3.1Formato ......................................................................................... 81
4.3.2 Reports ......................................................................................... 84
4.3.3 Measures and Dimensiones ......................................................... 85
4.3.4 Visualizacin de los datos ............................................................ 86
4.4Categorias y series ................................................................................... 86

Conclusiones ........................................................................................................ 88
Fuentes de Informacin ........................................................................................ 92
ndice de Figuras .................................................................................................. 97
ndice de Tablas ................................................................................................... 98
Anexo I ................................................................................................................. 99

vi

RESUMEN
El presente trabajo de investigacin, trata conceptos, que para la actualidad es
necesario conocer, debido a que representan lo que hasta el da de hoy las
empresas requieren para ser competitivos y presentar su informacin del negocio
adecuadamente para su correcto anlisis y toma de decisiones.
Hoy en da la tecnologa avanza a pasos agigantados y es necesario reunir
herramientas tecnolgicas que permitan a las empresas transformar la informacin
del negocio en conocimiento y por ende representar una ventaja contra sus
competidores.
Debido a lo anterior el contenido se centra en conceptos como Inteligencia de
Negocios, Datawarehouse, Herramientas de Explotacin de Datawarehouse y el
tema central de este trabajo Cubos OLAP.

INTRODUCCIN

Nos encontramos en un mundo Globalizado, razn principal por la cual se busca


mejorar las funciones realizadas en la empresa u organizacin. Hoy en da es
fundamental el uso de la Tecnologa como herramienta que permita mejorar
procesos, ser ms eficaz y eficiente, adems de ser una ventaja a nivel
competitivo ya que se buscan mecanismos que permitan marcar la diferencia entre
los competidores y brinden mayores posibilidades de crecimiento.
En la actualidad se observa que las empresas u organizaciones cuentan con una
gran cantidad de datos que convierten en informacin para llevar a cabo un
proceso fundamental que es la Toma de Decisiones.
La informacin es un concepto relevante que ha tomado gran importancia al grado
de considerarla como el principal activo de la sociedad, as como los datos son el
ncleo de cualquier Sistema de Informacin.
El tratamiento que se le da a la informacin es fundamental para la toma de
decisiones y actualmente las herramientas utilizadas para la presentacin de sus
datos se limita al uso de reportes basados en ciertos requerimientos definidos por
los usuarios de acuerdo a su percepcin y experiencia o de acuerdo a las
necesidades que se van presentando en el da a da. Lo cual no les permite ser
eficientes ya que puede que no se cumpla con las expectativas deseadas ni con
las necesidades reales de los usuarios considerando que muchos de los informes
y reportes tienen un formato preestablecido.
El presente trabajo de investigacin tiene como finalidad, dar a conocer conceptos
que hoy en da son relevantes para cualquier organizacin que desee brindar
dinamismo a la presentacin de su informacin y quieran ser ms competitivos.
Los conceptos sobre los cuales se hace nfasis son:
Inteligencia de Negocios, Datawarehouse, Herramientas de Explotacin de
Datawarehouse y Cubos OLAP

Es importante mencionar que para el desarrollo del tema principal se parte del
concepto fundamental de Inteligencia de Negocios, ya que representa el conjunto
de conceptos y mtodos, es decir, la integracin de la informacin para llevar a
cabo la optimizacin e los procesos del negocio y ayudar a mejorar el proceso de
Toma de Decisiones.
Visto desde un enfoque general, la Inteligencia de Negocios est representada
como el todo, ya que a travs de diversas tcnicas, mtodos, herramientas,
permiten convertir los datos en informacin y la informacin en conocimiento; para
a travs de esto generar reportes analticos que permitan a los usuarios satisfacer
las necesidades de los diversos usuarios finales.
Se procede a explicar otro concepto fundamental, el cual es Datawarehouse,
comnmente conocido como Almacn de Datos. Forma parte de lo que se
conoce como Inteligencia de Negocios. El Datawarehouse proporciona a la
empresa una visin global de sus datos, de forma qe los integra para
posteriormente llevar a cabo su anlisis y utilizarlos para obtener respuestas del
negocio que las bases de datos transaccionales implementadas en la organizacin
no nos permitiran conocer.
La principal ventaja de tener los datos de la organizacin almacenados en una
estructura de Datawarehouse es que permite la consulta y el anlisis de la
informacin.
Los sistemas transaccionales brindan la informacin al usuario final de manera
esttica, adems son utilizados para llevar a cabo las operaciones diarias de la
organizacin; en cambio los sistemas analticos permiten flexibilidad en la
representacin de la informacin, adems hoy en da existen diversas
herramientas basadas en el Procesamiento Analtico en Lnea. El contenido de
este tema abarca los conceptos de los 2 principales exponentes del
Datawarehouse, ya que hasta hoy en da continan vigentes, Bill Inmon, padre del
Datawarehouse y Ralph Kimball. La finalidad es conocer ambas metodologas y

empaparse de os conceptos fundamentales para comprender bien a detalle el


tema.
Posteriormente se habla de Herramientas de Explotacin del Datawarehouse, ya
que de nada servira a las empresas implementar un almacn de datos sino se
piensa como extraer su informacin. El Datawarehouse no representa un fin, sino
un medio para solucionar necesidades, razn fundamental por lo cual es
importante conocer las diversas tcnicas de explotacin de los datos contenidos
en el Datawarehouse. En el contenido de este tema se mencionan y se da una
breve explicacin de las principales herramientas utilizadas en la actualidad para
extraer los datos.
Por ltimo se aborda el tema principal y por el cual se realizo este trabajo de
investigacin, para el cual era necesario conocer los conceptos bsicos
mencionados anteriormente, que permitieran el correcto entendimiento de este
ltimo tema, Cubos OLAP.
Los Cubos OLAP representan una herramienta de explotacin de Datawarehouse
y son una excelente opcin para las organizaciones que deseen obtener informes
de datos resumidos para llevar a cabo su anlisis. Adems de que representan un
mecanismo para la bsqueda y presentacin de datos con rapidez y tiempo de
respuesta uniforme, independientemente de la cantidad de datos o la complejidad
de la bsqueda.

Las empresas u organizaciones an no cuentan con tecnologa sofisticada ni con


Datawarehouse como tal, pero es importante adentrarnos en este tema ya que la
tecnologa avanza a pasos agigantados y es fundamental tener el conocimiento de
que existen diferentes herramientas de explotacin de Datawarehouse. Por lo
anterior se considera que el diseo y construccin de cubos OLAP permitir a
cualquier tipo de empresa poder potenciar la explotacin de la informacin
realizando anlisis con los cubos OLAP, ya que permitir obtener datos
relevantes.
5

La finalidad es dar a conocer conceptos fundamentales de lo que hoy en da


representa la Inteligencia de Negocios y sus diversas aplicaciones en las
organizaciones de la actualidad y hacer del conocimiento que los cubos OLAP,
representan una excelente opcin para la manipulacin y presentacin de datos
de manera dinmica y fcil de usar para los usuarios finales. Y que su
implementacin depender de los requerimientos de cada empresa, pero sin duda,
representan una de las mejores opciones para el anlisis de la informacin.

Captulo 1: Conceptos Bsicos

1. INTELIGENCIA DE NEGOCIOS

1.1 ANTECEDENTES
A finales del siglo XX las empresas se preocuparon en conocer los datos que se
manejaban en fuentes no automatizadas. Las empresas carecan de recursos de
computacin que les permitiera analizar los datos y llevar a cabo la toma de
decisiones de manera estructurada basados en datos en informacin reales y no
basadas en la intuicin.
Las empresas comenzaron a automatizar sus procesos creando sistemas, con
esto los datos se hicieron ms accesibles, pero su obtencin contino siendo un
gran reto debido a que no se contaba con la tecnologa necesaria y los sistemas
eran incompatibles con la tecnologa que se tena. Las decisiones eran tomadas
pero a largo plazo ya que no se contaba con la informacin al momento que se
requera.
En base a esas necesidades surge el concepto de Inteligencia de Negocios; hoy
en da facilita la toma de decisiones en cualquier nivel sea Estratgico, Tctico u
Operativo, debido a que permite desarrollar la posibilidad de extraer datos,
analizarlos y generar reportes, as como ejecutar bsquedas de datos rpidamente
para permitir un mejor anlisis del rendimiento de un producto, departamento,
compaa. Esto permite a las empresas realizar reportes, realizar anlisis de la
informacin como apoyo a la toma de decisiones.

Hoy en da las empresas acometen una gran variedad de iniciativas para alcanzar
sus objetivos, bajo la influencia de 5 elementos fundamentales: Velocidad de
cambio, innovacin de nuevos modelos de negocio, nuevas estructuras de
relaciones entre las empresas, sus clientes y asociados, la conectividad de
personas, organizaciones y pases, y el valor del conocimiento residente en la
empresa. (Davis & Meyer 2000)

1.1.1 NIVELES DE USO DE LOS DATOS


Nivel operacional: Se utilizan sistemas de informacin que monitorean las
actividades y transacciones elementales.
Nivel de administracin: Realiza operaciones repetitivas de captura masiva
de datos y servicios bsicos de tratamiento de datos, con tareas
predefinidas.
Nivel de conocimientos: Realiza actividades de anlisis, de seguimiento, de
control y toma de decisiones, realiza consultas sobre informacin
almacenada.
Nivel estratgico: Realizar las actividades de planificacin a largo plazo,
tanto del nivel de administracin como de los objetivos que la empresa
posee. Es visionario, y ve hacia el futuro.

Figura 1.1 Niveles de uso de los datos

1.2 DEFINICIN
En 1989 Howard Dresner, actual Presidente de Dresner Advisory Services, invent
el acrnimo de BI Business Intelligence o Inteligencia de Negocios, para indicar el
conjunto de conceptos y mtodos para mejorar la toma de decisiones en los
negocios utilizando sistemas de apoyo basados en hechos.
Actualmente el concepto de BI implica la integracin de la informacin para una
buena planeacin que conlleve a la optimizacin de procesos de negocio. Adems
incluye una amplia categora de metodologas, aplicaciones y tecnologas que
permiten reunir, acceder, transformar y analizar los datos, transacciones e
informacin no estructurada con el propsito de ayudar a los usuarios de una
empresa a tomar decisiones de negocio. Lo anterior se puede lograr, ya sea,
mediante la explotacin directa mediante consultas, reportes o haciendo uso del
anlisis y conversin en conocimiento. La Inteligencia de Negocios tambin puede
10

intervenir en todos y cada uno de los procesos de una empresa, operando en


tareas y actividades del personal, mejorando la comunicacin e incrementando la
reaccin de la compaa.
Abordando de manera general el concepto de Inteligencia de Negocios simple y
sencillamente se puede decir que es la habilidad para transformar los datos en
informacin, y la informacin en conocimiento en forma que se pueda optimizar el
proceso de toma de decisiones.
En la siguiente figura se ilustra la definicin anterior.

Figura 1.2. Inteligencia de Negocios.

A continuacin se muestran definiciones de Inteligencia de Negocios de acuerdo al


enfoque de diversos autores:
(Hackney, 2001) nos dice que el Business Intelligence se compone de todas las
actividades relacionadas a la organizacin y entrega de informacin as como el
anlisis del negocio. Esto incluye Minera de Datos, Administracin del
Conocimiento, Aplicaciones Analticas, Sistemas de Reportes y principalmente
Data Warehousing.

(Buksard, Mollot y Richards, 2000) comentan en su artculo que la necesidad de


nuevas herramientas de acceso y reporte de informacin, para diversos tipos de
usuarios, ha impulsado la creacin de nuevas herramientas, colectivamente
conocidas como Business Intelligence. Business Intelligence no es una

sola

tecnologa o aplicacin. No es una cosa, sino que se trata de un suite de


11

productos que trabajan de manera conjunta para proveer datos, informacin y


reportes analticos que satisfagan las necesidades de una gran variedad de
usuarios finales.

Por otra parte el Datawarehouse Institute, lo define como: la combinacin de


tecnologa, herramientas y procesos que permiten transformar los datos
almacenados en informacin, esta informacin en conocimiento y este
conocimiento dirigido a un plan o una estrategia comercial. La inteligencia de
negocios debe ser parte de la estrategia empresarial, esta le permite optimizar la
utilizacin de recursos, monitorear el cumplimiento de los objetivos de la empresa
y la capacidad de tomar buenas decisiones para as obtener mejores resultados.

Figura 1.3 Conceptos que abarca la Inteligencia de Negocios

1.3 VALOR DE LA INTELIGENCIA DE NEGOCIOS


La Inteligencia de Negocios es una rpida estrategia que ha llegado a hacer la
diferencia en las organizaciones de hoy en da. De acuerdo con Keith Gile (2002),
La Inteligencia de Negocios ha estado envuelta en los ltimos tres aos en un
nicho, departamentalmente centrado en el valor de la solucin de estrategias
empresariales.
Hoy en da los mercados son cada vez ms competitivos, las empresas necesitan
administrar y reducir costos de operacin. Un beneficio clave de la Inteligencia de
Negocios es que brinda a los ejecutivos, de nivel medio o jerrquico, y empleados
la informacin necesaria para manejar eficientemente las operaciones. La
Inteligencia de Negocios tambin hace ms fcil el anlisis de los gastos de los
mltiples sistemas de informacin posibles.
12

Inteligencia de Negocios es un factor clave, ya que actualmente es de suma


importancia que las organizaciones exploten los datos y la informacin existente,
con la finalidad de convertirla en conocimiento que sirva de apoyo en el proceso
de toma de decisiones sobre el negocio. El convertir la informacin en
conocimiento y utilizarla, produce mejoras en los procesos de negocio y llevan a
las organizaciones a tener operaciones ms efectivas y optimizadas. Se logra
debido a que el acceso e interpretacin de la informacin es un elemento
diferenciador, productivo y rentable para todas las organizaciones, por lo tanto una
correcta gestin del conocimiento garantiza el xito dentro de un mercado
competitivo.

1.4 BENEFICIOS DE LA INTELIGENCIA DE NEGOCIOS


El contar con un esquema de Inteligencia de Negocios en una organizacin, brinda
ventajas, las cuales se mencionan a continuacin:

Disposicin de la informacin correcta en el momento adecuado para la


toma de decisiones.

Con BI no es necesario solicitar a diferentes

departamentos, con los consiguientes plazos de espera, la informacin que


se requiere para tomar decisiones. La informacin est almacenada en un
nico lugar, y se puede extraer de manera sencilla y en tiempo real.
Brinda la capacidad de poder evaluar distintos escenarios. En los cuales se
puedan analizar diferentes situaciones que pueden poner en riesgo el
negocio y tomar decisiones estratgicas anticipadas y hacer que una
tendencia negativa se convierta en acciones positivas para la organizacin.
La informacin de calidad va mucho ms all de los reportes operacionales,
ya que no solamente se puede consultar la informacin que genera una
compaa en todo momento, sino que

adems se pueden denir

indicadores que me permitan medir el desempeo del negocio.


13

Permite agrupar informacin de distintas reas en un solo cuadro, lo cual es


muy favorable para el cambio de polticas o reorientaciones de los planes
establecidos.
Genera capacidad de reaccin a situaciones imprevistas con un nivel de
riesgo menor, ya que producto del anlisis de escenarios, se tienen
predenidas las acciones a tomar en caso de ocurrir, lo cual permite a su
vez analizar con anticipacin el riesgo que se tendra al tomar dichas
decisiones.
Capacidad de retroalimentar el conocimiento adquirido. Una de las
caractersticas ms importantes de BI incluye el hecho de mantener
disponibles las decisiones tomadas y el impacto que sobre el negocio
gener. Esto permite que el conocimiento organizacional se almacene y no
sea necesario retransmitirlo directamente a las personas cuando ocupan un
cargo diferente.

1.5 CINCO ETAPAS EVOLUTIVAS DEL BI


En

los

ltimos

aos,

la

inteligencia

de

negocios

ha

evolucionado

significativamente, con lo que ha dejado de ser simples hojas de reportes de


informacin para convertirse en todo un sistema de gestin de desempeo para la
toma de decisiones.

IBM ha identificado cinco niveles evolutivos de BI a lo largo del tiempo los cuales
son:
Primer Nivel.- La Inteligencia de Negocios comenz con el manejo de hojas de
Excel donde se tena toda la informacin que se centralizaba en una sola persona.

Segundo Nivel.- La informacin y los tableros de control pasaron a manos de la


gente de tecnologa, sin que existiera relacin entre la informacin y el negocio,
porque se le vena dando el foco total a la informacin desde el punto de vista de
tecnologa y no tanto del negocio.
14

Tercer Nivel.- Se comenz a tomar en cuenta al negocio para habilitar procesos.


En esta etapa ya se identificaban reas funcionales y se habilitaba a la compaa
no slo en la parte de soluciones departamentales sino ya se contemplaba a la
empresa como tal.

Cuarto Nivel.- Los sistemas de Inteligencia de Negocios ya tenan objetivos de


negocio y focos en estrategias. Las empresas traan la parte de la administracin
del desempeo, tanto financiero como corporativo; donde ya se incorporaban y
relacionaban todos los departamentos y todas las entidades de las compaas. En
este nivel, ya se tena planeacin y consolidacin financiera, planeacin operativa,
y el sistema estaba dando un valor a la empresa.

Quinto Nivel.- Es el nivel actual y en el que IBM ha puesto mucho el nfasis e


inters, ya que es la tendencia. En ste, ya que se cuenta con la informacin
empresarial, hoy en da debemos tener una sola verdad de toda la compaa. Hay
que tener toda la informacin en tiempo, forma y con los niveles de confianza que
se requieren.

1.6 CICLO DE LA INTELIGENCIA DE NEGOCIOS


La Inteligencia de Negocios en una plataforma de administracin del desempeo
que representa al ciclo en el que las empresas establecen sus objetivos, analizan
sus progresos, reflexionan, actan, miden su xito y empiezan una nueva fase. Su
ciclo se compone de cuatro etapas a saber: Anlisis, reflexin, accin y medicin.
El anlisis comienza por determinar los datos a recopilar. La seleccin se basa en
un entendimiento bsico y en supuestos de cmo opera la organizacin,
considerando aquello que es relevante a los clientes, proveedores, empleados, los
factores que afectan los insumos, la produccin, el costo y la calidad. A la
coleccin de todo aquello que se debe conocer acerca de la empresa se conoce
15

como modelo mental. Este concepto aplica a nivel de las personas y de la


organizacin como un todo. Los modelos mentales son esenciales para los
ejecutivos para tomar decisiones, puesto que representan las bases para
reconocer una buena idea, pero tambin constituyen los lmites para no ver
aspectos que se encuentran afuera.
La reflexin implica el estudio minucioso de los hechos y de la situacin, adems
de considerar el rumbo que puede tomar el caso de estudio. El escenario que
abarca la reflexin depende del nivel jerrquico que la est realizando y la
consideracin del ambiente externo. La reflexin nace de un anlisis libre de
preguntas que solo los ejecutivos pueden formular y que se encaminan al
descubrimiento de patrones relevantes. Al encontrar algunos hechos que pueden
ser contradictorios a los postulados establecidos, implica una labor de
convencimiento y de superacin de resistencias al cambio, sin embargo para que
la iniciativa tenga xito, es necesario compartirla y allegarse de aliados. La
conexin de la accin al ciclo de la Inteligencia de Negocios es a travs del
proceso de toma de decisiones, en donde las acciones se suceden como
resultado de las decisiones. La toma de decisiones al estar basada en la
Inteligencia

de

Negocios

ofrece

mejores

condiciones

para

identificar

oportunidades, orientar las acciones, la experimentacin, la prueba y la


retroalimentacin.
La medicin procura evaluar los resultados al compararlos contra los estndares
cuantitativos y las expectativas planteadas originalmente; con lo cual se da vida a
otro ciclo de anlisis, reflexin, accin y medida. En la Inteligencia de Negocios se
pueden establecer estndares para pruebas de comparacin que faciliten
monitorear el desempeo y proveer retroalimentacin para cada rea funcional del
negocio. La mtricas corresponden a los indicadores clave de desempeo que se
generan a partir de explorar grandes cantidades de datos integrados de fuentes
heterogneas que son evaluados por algoritmos para descubrir, inferir, y calcular
informacin relevante, dando como resultado reportes consistentes sobre criterios
de actividad que los ejecutivos consideran y usan como argumentos para sus
decisiones.
16

1.7

INTELIGENCIA

DE

NEGOCIOS

EN

LA

PIRMIDE

ORGANIZACIONAL
La Inteligencia de Negocios a Nivel Operativo permite que los empleados que
trabajan con informacin operativa puedan recibir la misma de una manera
oportuna, exacta y adecuada y se componen bsicamente de herramientas de
reportes u hojas de clculo con un formato fijo cuya informacin se actualiza
frecuentemente.
La Inteligencia de Negocios a Nivel Tctico permite que los analistas de datos y la
gerencia media de la empresa utilicen herramientas de anlisis y consulta con el
propsito de tener acceso a la informacin sin intervencin de terceros.
La Inteligencia de Negocios a Nivel Estratgico permite que la alta direccin de las
empresas pueda analizar y monitorear tendencias, patrones, metas y objetivos
estratgicos de la organizacin.

1.8 HERRAMIENTAS DE INTELIGENCIA DE NEGOCIOS


Son un tipo de software de aplicaciones diseado para colaborar con la
inteligencia

de

negocios

(BI)

en

los

procesos

de

las

organizaciones.

Especficamente se trata de herramientas que asisten el anlisis y la presentacin


de los datos.
Las herramientas de inteligencia de negocios y el perfil de usuarios analticos han
evolucionado a travs de estos aos. Adems, el nivel de conciencia, la necesidad
y la evolucin del mercado han llevado a las empresas a considerar que la
Inteligencia de Negocios sea una prioridad ante la gerencia y las personas que
toman decisiones.
Un proyecto de inteligencia de negocios debe llevar tanto el compromiso del
equipo de IT como el de la gente de negocios, la participacin activa de estos
usuarios de negocios es fundamental para el xito del proyecto. Estos usuarios
son los que adolecen realmente de una herramienta que se ajuste a la necesidad
17

de la empresa y les provea el nivel de detalle que se requiera.

1.9 SOLUCIONES EN INTELIGENCIA DE NEGOCIOS


Planeamiento Estratgico.
El planeamiento estratgico es la herramienta indispensable para gestionar
adecuadamente todo tipo de Organizaciones pblicas o privadas, con o sin fines
de lucro, grandes, medianas o pequeas.

Tableros de Control
Herramienta

que

posibilita

en

una

Organizacin

medir

el

desempeo,

productividad o rentabilidad de un rea, rubro o unidad de negocios.

Cuadros de Mando Integral o Tableros de Comando.


Esta herramienta posibilita la medicin constante de los objetivos estratgicos de
la Organizacin en forma rpida, simple y eficiente.

Vistas dinmicas.
Reportes Dinmicos que permiten diferentes formas de anlisis de la informacin
sin necesidad de re-estructurarlas.

Gestin del Capital Intelectual


Esta herramienta posibilita identificar y calcular el valor de los recursos intangibles
de su empresa.

Datawarehouse.
Almacn de datos para la integracin de la informacin de la Organizacin que
sirve como soporte para la toma de decisiones

18

1.10 LA INTELIGENCIA DE NEGOCIOS EN EL FUTURO


En una visita a Mxico, Howard Dresner dijo que la tecnologa ha evolucionado,
madurado y mejorado dramticamente durante los 20 aos que lleva involucrado
en ella. Dichos cambios han beneficiado las partes de BI y de la gestin de
desempeo de las empresas (EPM, por sus siglas en ingls). Ahora el reto de las
organizaciones es poder apalancar la tecnologa a BI para operar de manera ms
eficiente.
Con BI, la planeacin de los negocios se lleva a cabo de una mejor manera
gracias a que la informacin, adems de ser capturada y organizada, es analizada
para ejecutar planes que estn enfocados a cumplir con los objetivos de las
empresas, que al final resultan en mayores ingresos.
(Dresner) La importancia de llevar a cabo una planeacin es para que las
empresas construyan una perspectiva completa de su negocio y de los mercados
dentro de los que trabajan, a fin de que puedan saber qu es lo que sucede y
ejecuten con precisin sus procesos.
La Inteligencia de Negocios ahora radica en la competencia para tomar
decisiones, para enfoques dinmicos de los problemas y oportunidades y para
desarrollar los recursos y capacidades internas de la organizacin. Generar
cambios estratgicos construidos con los recursos de la organizacin para
desarrollar una organizacin ms flexible y dinmica, con el apoyo de las
tecnologas para la toma de decisiones y la intervencin de los expertos del
negocio. Es importante entender que las herramientas de soporte a la toma de
decisiones, son eso, herramientas, y que la seleccin y uso, simplifican muchas
operaciones y procesos en el negocio, pero que los tomadores de decisiones son
la piedra angular.

19

2. DATAWAREHOUSE

2.1 PROCESAMIENTO DE DATOS


2.1.1 OLTP (On Line Transaction Processing)
Las bases de datos relacionales de procesamiento de transacciones en lnea
(OLTP) son ptimas para administrar datos que cambian. Suelen tener varios
usuarios que realizan transacciones al mismo tiempo que cambian los datos en
tiempo real. Aunque las solicitudes de datos realizadas individualmente por los
usuarios suelen hacer referencia a pocos registros, muchas de estas solicitudes se
producen al mismo tiempo.
Las bases de datos OLTP estn diseadas para permitir que las aplicaciones
transaccionales escriban slo los datos necesarios para controlar una sola
transaccin lo antes posible. Las bases de datos OLTP se caracterizan en general
por lo siguiente:
Admiten el acceso simultneo de muchos usuarios que agregan y modifican
datos con regularidad.
Representan el estado en cambio constante de una organizacin, pero no
guardan su historial.
Contienen muchos datos, incluidos todos los datos utilizados para
comprobar transacciones.
Tienen estructuras complejas.
Se ajustan para dar respuesta a la actividad transaccional.
Proporcionan la infraestructura tecnolgica necesaria para admitir las
operaciones diarias de la empresa.
Las transacciones individuales se completan rpidamente y se tiene acceso
a cantidades de datos relativamente pequeas. Los sistemas OLTP estn
diseados y ajustados para procesar cientos o miles de transacciones que
se indican al mismo tiempo.
20

Tienen baja redundancia de datos.

Este tipo de procesamiento es el que permite mover los engranes de la


organizacin. Son los productores principales de la informacin dentro de la
Pirmide Organizacional.

2.1.2 OLAP (On Line Analytical Processing)


Trmino acuado por Codd & Associates. Se refiere a aplicaciones que se
encargan de analizar datos del negocio para generar informacin tctica y
estratgica que sirve de soporte para la toma de decisiones. Mientras que las
transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos,
OLAP logra su mxima eficiencia y flexibilidad operando sobre Bases de datos
Multidimensionales. El procesamiento analtico en lnea cuenta con las siguientes
caractersticas:
Estructura de datos transparente al usuario
Solo Consulta, trabajan sobre la informacin operacional generada por los
sistemas OLTP
Consultas sobre grandes volmenes de datos no predecibles
Informacin histrica
Modo de actualizacin Batch
Alta redundancia de datos para facilitar la generacin de consultas y
obtener buenos tiempos de respuesta
Trabaja con resmenes de miles de registros condensados en una sola
respuesta
En este tipo de procesamiento los usuarios nicamente ven como se mueven los
engranes de la organizacin. Solamente se analizan los datos para buscar
respuestas y comportamiento a travs del tiempo, ayudan en el proceso de la
tome de decisiones fundamentadas en los datos histricos.
21

2.1.3 Diferencias entre OLTP y OLAP


Mientras que las aplicaciones OLTP se caracterizan por estar actualizadas
constantemente por varios usuarios a travs de transacciones operacionales sobre
datos individuales, las aplicaciones OLAP son utilizadas por personal de niveles
ejecutivos que requieren datos con alto grado de agregacin y desde distintas
perspectivas (dimensiones)
A continuacin se muestra una tabla en la cual se establecen las principales
diferencias que existen entre OLTP y OLAP.
OLTP

OLAP

Utiliza bases de datos transaccionales

Hace

uso

de

bases

de

datos

multidimensionales.
Estn organizados por aplicacin

Se organiza por dimensiones definidas


por las reglas del negocio

Los datos que estn incluidos son Sus datos son histricos
voltiles,

ya

que

son

actualizados

constantemente
Los usuarios son los que giran las Los usuarios observan como giran las
ruedas de la organizacin a travs de ruedas de la organizacin a travs de
actualizaciones

consultas y anlisis de los datos

Los datos operacionales son altamente Los Datos del DW son altamente
voltiles, cambian en medida que opera estables, son insertados en intervalos
la empresa.

de

tiempo

definidos.

no

son

modificados
Cada aplicacin del negocio puede Toda la informacin de un tema,
tener

informacin

en

diferentes alimentado de varios sistemas, reunido

Sistemas y base de datos.

en una sola Base de Datos

Mantienen la Integridad de los datos

Soporta el anlisis del negocio

Se manejan cientos de registros por Se maneja una transaccin con cientos


da, se realizan operaciones de Insert, de registros por medio de Selects

22

Update, Delete, Select

Baja redundancia de datos

Alta redundancia de datos para facilitar


la generacin de consultas y obtener
buenos tiempos de respuesta

Tabla 2.1 Diferencias entre OLTP y OLAP

El rendimiento tambin se ve afectado en cada tipo de procesamiento. Como se


puede observar en la siguiente figura. En la cual se mide el procesamiento en un
entorno OLTP y en un entorno OLAP.

Figura 2.1. Representacin del rendimiento entre transacciones OLTP y OLAP

2.2 DATA WAREHOUSING


2.2.1 DEFINICIN
Se entiende por Datawarehousing el proceso de extraer y filtrar datos de las
operaciones comunes de la organizacin, procedentes de los distintos sistemas de
informacin operacionales y/o sistemas externos, para transformarlos, integrarlos
y almacenarlos en un Datawarehouse, tambin conocido como depsito o
23

almacn de datos, con el fin de acceder a los datos para dar soporte en el proceso
de toma de decisiones de una organizacin. El objetivo es convertir los datos
operacionales en informacin relacionada y estructurada, homognea y de mayor
calidad, identificada convenientemente y que se mantenga en el tiempo, es decir,
los datos ms recientes no sustituyen a los precedentes, pero tampoco se
acumulan de cualquier manera, sino que se suelen mantener con un mayor nivel
de detalle los datos actuales, y de manera ms agregada los datos anteriores. Se
pretende crear un crculo virtuoso para la informacin.

2.3 DATA WAREHOUSE


Un Datawarehouse, proporciona una visin global, comn e integrada de los datos
de la organizacin, independiente de cmo se vayan a utilizar posteriormente por
los consumidores o usuarios, con las propiedades siguientes: estable, coherente,
fiable y con informacin histrica. Al abarcar un mbito global de la organizacin y
con un amplio alcance histrico, el volumen de datos puede ser muy grande. Las
bases de datos relacionales son el soporte tcnico ms comnmente usado para
almacenar las estructuras de estos datos y sus grandes volmenes. Normalmente
en el almacn de datos habr que guardar informacin histrica que cubra un
amplio perodo de tiempo. Pero hay ocasiones en las que no se necesita la historia
de los datos, sino slo sus ltimos valores, siendo adems admisible
generalmente un pequeo desfase o retraso sobre los datos operacionales.
Cuando as sucede el Datawarehouse es comnmente llamado

almacn

operacional (ODS, Operational Data Store).

2.3.1 DEFINICIN
Una definicin sencilla y fcil de recordar es: Un Datawarehouse es un almacn de
datos. Partiendo de esa definicin, podemos obtener muchas ms y de diversos

24

autores que han formulado su propia definicin. Sin embargo se tienen dos
personajes vinculados al concepto de Datawarehouse.
Bill Inmon es considerado el padre del Datawarehouse, debido a que l acu este
trmino, a continuacin se muestra su definicin:
(Inmon, 1996) Datawarehouse es un conjunto de datos integrados, histricos,
variantes en el tiempo y unidos alrededor de un tema especfico, que es usado por
la gerencia para la toma de decisiones.
Surgi otro personaje importante en el desarrollo del tema de Datawarehouse,
Ralph Kimball quien es considerado el principal promotor del enfoque dimensional
para el diseo de almacenes de datos, planteo una nueva metodologa muy
diferente a lo que planteo Bill Inmon. Por lo cual menciona otra definicin para
Datawarehouse la cual dice lo siguiente:
(Kimball, 2003) Un Datawarehouse es una copia de los datos transaccionales
especficamente estructurada para la consulta y el anlisis.

2.4 ARQUITECTURA BSICA


La arquitectura bsica de un Datawarehouse tiene los siguientes elementos:
1. Datos Fuente: Se refiere a las bases de datos transaccionales, archivos
planos, otros sistemas de donde se obtienen los datos. Sistemas OLTP,
Datos del Entorno o Mercado Externo, Datos Distribuidos en Sistemas
Heredados o satelitales que alimentan los ERP.
2. Proceso ETL: Extraccin, Transformacin y Carga de Datos, es el proceso
que permite a las organizaciones mover datos desde mltiples fuentes,
reformatearlos, limpiarlos y cargarlos en otra base de datos, data mart, o
Datawarehouse para analizar, o en otro sistema operacional para apoyar un
proceso de negocio. Aqu se ubica el rea de Stage (rea de trabajo para
realizar la depuracin de la informacin.
25

3. Creacin del DW: Se integra la informacin de la organizacin de manera


estructurada y consolidada para dar soporte a la Inteligencia Empresarial
(Inteligencia de Negocios)
4. Explotacin de la Informacin: Se extrae y procesa la informacin de
simples consultas SQL a un enfoque OLAP, a travs de diversos mtodos,
herramientas de toma de decisin, datamining, software hecho a la medida,
etc. Proveen la interfaz humana con el Datawarehouse.

Figura 2.2 Arquitectura de un Datawarehouse.

2.5 METODOLOGAS DE DISEO

Existen dos metodologas fundamentales para llevar a cabo el diseo de un


Datawarehouse las cuales son:
Enterprise Datawarehouse: Bill Inmon
Arquitectura Bus: Ralph Kimball
26

2.5.1 ENTERPRISE DATAWAREHOUSE (EDW)

El almacn de datos empresarial es el centro de la fbrica de la informacin


corporativa. El Datawarehouse Empresarial tiene caractersticas diferentes.
La primera caracterstica del Datawarehouse empresarial es que contiene alta
granularidad de los datos. La informacin en el Enterprise Datawarehouse est en
el nivel ms bajo y es el comn denominador. En ninguna otra parte que en la
organizacin est el bajo nivel de granularidad. Otras arquitecturas se basan en
esta granularidad de los datos, ya que reconfiguran y recombinan los datos
encontrados en la empresa de almacenamiento de datos para satisfacer sus
necesidades. La segunda caracterstica de los datos encontrados en el
Datawarehouse empresarial es que son histricos. En trminos histricos es decir
que de cinco a diez aos se encuentran almacenados los datos de la empresa.
Cuando se considera que el almacenamiento de datos de la empresa es a la vez
histrico y granular, es inevitable que los grandes volmenes de datos se
encuentran all.
La tercera caracterstica es que los datos residentes dentro del Datawarehouse
empresarial estn integrados. Como los datos se mueven de la aplicacin
heredada a travs de la integracin del medio ambiente y la capa de
transformacin, los datos se integran. Significa que hay una sola interpretacin de
los datos corporativos que tiene la empresa, almacenados y por lo tanto hay una
nica comprensin de lo que es un cliente, lo que es un producto, una transaccin,
etc.
La cuarta caracterstica es, que un Datawarehouse empresarial es corporativo.
Esta caracterstica est relacionada con las anteriores. La naturaleza corporativa
del Datawarehouse empresarial se deriva del modelo de datos corporativo que
sirve de base para el diseo del Datawarehouse empresarial.

27

El diseo del Datawarehouse empresarial esta tpicamente normalizado. La


estructura clsica entidad-relacin de los datos, acompaada por la consiguiente
normalizacin de las estructuras de datos se adapta muy convenientemente con
los requisitos de la utilizacin de la empresa de almacenamiento de datos.
Las

caractersticas

del

Datawarehouse

empresarial

que

se

explicaron

anteriormente son las siguientes:


Granularidad
Integridad
Datos Histricos y
Corporativos
Inmon define al EDW como el corazn de los Sistemas de Toma de Decisin DSS
(Decisin Support Systems). El EDW

es alimentado por los sistemas

operacionales (ODS) y la capa de transformacin. A su vez el EDW alimenta el


entorno de los DSS.
La metodologa de Inmon plantea la necesidad de transferencia de datos OLTP de
diversos sistemas en un lugar centralizado donde los datos pueden ser utilizados
para el anlisis. Los datos deben organizarse en materia orientadas, integrado, no
voltil y estructuras de tiempo variante. Los datos deben ser accesibles al nivel
atmico detallado por medio de la perforacin o en el resumen de los niveles de
perforacin Los datos son tratados como Datamarts, sub conjuntos de la base de
datos. Cada uno de los Datamarts se construye para un departamento y est
optimizado para el anlisis de necesidades de cada departamento para el que se
crea.

28

2.5.1.1 COMPONENTES

Inmon define la arquitectura de una bodega de datos con cuatro componentes


bsicos: 1) los sistemas fuente, donde se gestiona la informacin relevante de la
operacin de la organizacin; 2) el rea intermedia (o staging area), en la cual se
hace la integracin, unificacin y limpieza de los datos que vienen de los
diferentes sistemas fuente; 3) el rea de almacenamiento, conformada por dos
elementos: el repositorio y los metadatos; y 4) el rea de acceso a los datos a
travs de diferentes herramientas de consulta, tales como publicacin en la web,
generadores de reportes dinmicos y predefinidos, herramientas de minera de
datos y OLAP.

Figura 2.3 Enterprise Datawarehouse

El EDW es el centro de la informacin corporativa de la empresa. Los datos que


se encuentran en el EDW alimentan a los Datamarts, a la explotacin y al
datamining, as como a los Sistemas de Tomas de decisin o Analticos.

29

Los datos encontrados en el EDW en algunas ocasiones es llamado como el


punto de la verdad (single point of truth) para la empresa.
El dato es granular y no redundante y es el punto de reconciliacin de las
diferencias cuando uno o ms personas difieren del resultados obtenido de un
anlisis de la informacin corporativa.

2.5.2 DATAWAREHOUSE BUS O DIMENSIONAL

Esta arquitectura consiste en iniciar la planeacin del Datawarehouse con la fase


de arquitectura de datos corta que tenga los objetivos especficos y finitos y
despus continuar con la implementacin paso a paso de los Datamarts
separados, donde cada paso de implementacin se incorpora cuidadosamente a
la arquitectura.
La fase de arquitectura de datos produce lneas directivas que los equipos de
desarrollo de los Datamarts puedan seguir y puedan trabajar de manera asncrona
e independientemente.
De tal forma que como se vayan poniendo en lnea los Datamarts vayan
ajustndose unos a otros como piezas de un rompecabezas.

30

Figura 2.4 Arquitectura Bus

2.5.2.1 COMPONENTES

Los componentes incluidos en la arquitectura de bus de Kimball difieren de los que


considera Inmon, a continuacin se explican cada uno.

Sistemas Fuentes
Son aquellos que sus principal funcin es almacenar las transacciones del
negocio, a travs de bases de datos operacionales. Sus principales prioridades
son mantenerse actualizados y en lnea.
Un sistema Fuente frecuentemente es llamado Sistemas heredados (legacy
system) en un entorno mainframe.

31

Data Staging Area (rea de trabajo, o presentacin)


Es un rea de almacenamiento, en el cual se conjuntan procesos de vital
importancia, aqu se preparan los datos fuentes para ser transformados, cargados
y distribuirlos en el Datawarehouse. La interseccin de estos datos no
precisamente proviene de Bases de Datos relacionales, se alimenta de archivos
planos, de diversas fuentes. En esta rea los datos no proveen consultas ni
servicios para gestin, esta rea se encuentra entre los sistemas fuentes y el
servidor de presentacin del Datawarehouse.

Servidor de Presentacin
Es la mquina fsica (Servidor) en la cual se almacenan los datos del
datawarehouse y estn disponibles para ser consultados a travs de sistemas de
domas de decisin, reporteadores u otras aplicaciones que le permitan al usuario
final realizar consultas ad-hoc.

Modelo Dimensional
Representa una alternativa para el modelado Entidad/Relacin (E/R). Es ms
simple, ya que brinda una fcil visualizacin y entendimiento de los datos en
comparacin con el modelado E/R.
Ms adelante se enfatizara acerca de este tema de Modelo multidimensional y de
sus elementos.

Procesos del Negocio


Es el conjunto de actividades que le dan sentido y direccin a una organizacin,
dependiendo del giro y entorno, variarn los procesos de negocio entre una u otra
organizacin.

32

Metadata
Es toda la informacin del medio ambiente del Datawarehouse que no es el dato
mismo.

Figura 2.5 Representacin de los elementos de la arquitectura de Bus

33

2.6 PROCESO ETL, EXTRACCIN, TRANSFORMACIN Y CARGA


ETL son las siglas en ingls Extract, Transform and Load. Es el proceso que
permite a las organizaciones mover datos desde mltiples fuentes, reformatearlos,
limpiarlos y cargarlos en otra base de datos, Datamart, o Datawarehouse para
analizar, o en otro sistema operacional para apoyar un proceso de negocio. Cada
una de las operaciones involucra sus propias consideraciones especiales.

2.6.1 Extraccin
La primera parte del proceso ETL consiste en extraer los datos desde los sistemas
de origen. La mayora de los proyectos de almacenamiento de datos fusionan
datos provenientes de diferentes sistemas de origen. Cada sistema separado
puede usar una organizacin diferente de los datos o formatos distintos. Los
formatos de las fuentes normalmente se encuentran en bases de datos
relacionales o ficheros planos, pero pueden incluir bases de datos no relacionales
u otras estructuras diferentes. La extraccin convierte los datos a un formato
preparado para iniciar el proceso de transformacin.
Una parte intrnseca del proceso de extraccin es la de analizar los datos
extrados, de lo que resulta un chequeo que verifica si los datos cumplen la pauta
o estructura que se esperaba. De no ser as los datos son rechazados.
Un requerimiento importante que se debe exigir a la tarea de extraccin es que
sta cause un impacto mnimo en el sistema origen. Si los datos a extraer son
muchos, el sistema de origen se podra ralentizar e incluso colapsar, provocando
que ste no pueda utilizarse con normalidad para su uso cotidiano. Por esta razn,
en sistemas grandes las operaciones de extraccin suelen programarse en
horarios o das donde este impacto sea nulo o mnimo.

34

En esta fase de extraccin se incluye la limpieza de los datos, en esta se debe


verificar si existe un control en la calidad de los datos. Frecuentemente los datos
requieren limpieza, generalmente esta es por lote, antes de proceder a
introducirlos a la base de datos. Las operaciones de limpieza bsicas incluyen
llenado de valores faltantes, correccin de errores tipogrficos y otros errores de
captura de datos, se procede a hacer remplazo de sinnimos por identificadores
que respeten un estndar, y as se unifiquen criterios de los datos.
Existen hoy en da muchas herramientas disponibles para ayudar en esta tarea,
incluyendo herramientas proporcionadas por el sistema, programas de extraccin
personalizados y productos de extraccin comerciales.

2.6.2 Transformacin
Despus de extraer y llevar a cabo la limpieza de los datos. Contina la fase de
transformacin, esta aplica una serie de reglas de negocio o funciones sobre los
datos extrados para convertirlos en datos que sern cargados. Algunas fuentes
de datos requerirn alguna pequea manipulacin de los datos.
Se deben codificar datos que se han decodificado en forma inconsistente en
diferentes fuentes, se deben hacer varias consideraciones a tomar en cuenta para
la forma de almacenar los datos, algunas consideraciones son: si aceptara valores
nulos, traducir cdigos, codificar valores libres, unir datos de mltiples fuentes,
abreviaturas de estados, cdigo de productos, lugares de negocios, entre otros. El
software de transformacin convierte los datos durante el traslado para asegurar
que la informacin sea compatible con la base de datos que la recibe.
Desarrollar, seleccionar e integrar estas piezas de software requiere tcnicas de
administracin de datos y de administracin de base de datos. Tambin se
requieren tcnicas en el rea de afinar la ejecucin de consultas en la base de
datos para obtener un rendimiento aceptable de la solucin del Datawarehouse.
35

La aplicacin de cualquier forma, simple o compleja, de validacin de datos, y la


consiguiente aplicacin de la accin que en cada caso se requiera:

2.6.3 Carga
La fase de carga es el momento en el cual los datos de la fase de transformacin,
son cargados en el sistema de destino. Dependiendo de la organizacin que se
trate y de sus requerimientos el proceso de carga puede abarcar diversas
acciones a realizar. En algunas bases de datos se sobrescribe la informacin
antigua con nuevos datos. Los Datawarehouse mantienen un historial de los
registros de manera que se pueda hacer una auditora de los mismos y disponer
de un rastro de toda la historia de un valor a lo largo del tiempo.
Para desarrollar el proceso de carga existen dos formas bsicas las cuales se
mencionan a continuacin:
Acumulacin simple: es la ms comn y sencilla, consiste en realizar un
resumen de un periodo de tiempo de todas y cada una de las transacciones
realizadas en ese periodo seleccionado y transportar el resultado como una
nica transaccin hacia el Datawarehouse, almacenando un valor calculado
que consistir tpicamente en un sumatorio o un promedio de la magnitud
considerada.
Rolling: este proceso es aplicado cuando se desea mantener diversos
niveles de granularidad. Para ello se almacena informacin resumida a
distintos niveles, correspondientes a distintas agrupaciones de la unidad de
tiempo o diferentes niveles jerrquicos en alguna o varias de las
dimensiones de la magnitud almacenada.
La fase de carga interacta directamente con la base de datos de destino. Al
realizar esta

operacin

se aplicarn

todas las restricciones y

triggers

(disparadores) que se hayan definido en sta (por ejemplo, valores nicos,


36

integridad referencial, campos obligatorios, rangos de valores). Estas restricciones


y triggers (si estn bien definidos) contribuyen a que se garantice la calidad de los
datos en el proceso ETL, y deben ser tenidos en cuenta.
De acuerdo con la metodologa de Ralph Kimball, la carga al Datawarehouse
toma la forma de replicacin de las tablas dimensin y las tablas dato. Despus de
haber cargado el Datamart destino debe ser indexado para ofrecer un mejor
desempeo de consulta sobre los datos recin llegados. Cuando cada Datamart
ha sido cargado, indexado y provisto de sus agregados, siguen procesos que
forman parte de un completo trabajo, los cuales son:
Aseguramiento de calidad
Liberacin/publicacin
Actualizacin
Pruebas previas de consultas
Retroalimentacin de datos/alimentacin en reversa
Auditoria
Seguridad
Respaldo y recuperacin.
Usualmente los Datawarehouse son alimentados de manera asncrona desde
distintas fuentes, que son tiles para diferentes propsitos. El proceso ETL es
clave para lograr que los datos extrados asncronamente de orgenes
heterogneos se integren finalmente en un entorno homogneo.

Hay dos conceptos fundamentales en el desarrollo del proceso de ETL, estos son:
Service Level Agreement (SLA) y Change Data Capture (CDC), tienen que ver con
la escalabilidad del proceso de ETL durante su vida til, el cual debe establecerse
en el anlisis. SLA se refiere al nivel de servicio en la comprensin del volumen de
datos procesado. Debido a que el tiempo en que se dispone para la extraccin de
datos de los sistemas de origen puede cambiar.

37

Por otro lado el CDC es referido a la captura de datos modificados en tiempo real
para una transformacin y actualizacin continua. Ya que algunos sistemas ETL
son escalados para procesar gran cantidad de datos al momento de llevar a cabo
la actualizacin de un Datawarehouse, lo cual implicara que un aumento en el
volumen de los datos pueda hacer que en lugar de que los datos se procesen por
lotes, se lleve a cabo en micro-lotes.

2.7 METADATOS
Este concepto toma gran relevancia al hablar de Datawarehouse. De manera
simple y sencilla un metadato puede ser definido como datos sobre los datos.
Representa toda la informacin del medio ambiente del Datawarehouse que no es
el dato mismo.
En el entorno del DW se aclara este concepto y se habla de:
El back-room metadata el cual gua a los procesos de carga, limpieza y
extraccin.
El front-room metadata que hace que las herramientas de consultas y
reporteo funcionen de manera optima.
El back-room metadata ayuda al DBA a traer los datos del almacn, as como
tambin ayuda a los usuarios finales cuando preguntan del origen de los datos y
como llego ah.
El metadata se debe catalogar, asignarle versiones, documentarlo y respaldarlo.
En un Datawarehouse, los metadatos describen los tipos de datos en el
Datawarehouse, esto es, las definiciones fsica y lgica de los datos, consultas y
reportes predefinidos, reglas de validacin y orientadas al tema, definiciones de
fuentes de datos, rutinas de transformacin y de proceso, e informacin del
usuario. Los metadatos se refieren a cualquier cosa que define un objeto del
38

Datawarehouse. Adems guan los procesos de extraccin, transformacin


(limpieza) y carga.

2.7.1 CLASIFICACIN
Generalmente, los metadatos son divididos en:
Tcnicos. En estos se interesan los desarrolladores y administradores. Los
desarrolladores los utilizan para conocer las definiciones fsica y lgica de los
datos para poder disear y escribir aplicaciones. Por su parte los administradores
accesan a los metadatos para ejecutar tareas de administracin como gestin de
los objetos y usuarios, afinamiento de la base de datos y almacenamiento de
datos.
Semticos u orientados al tema. Tienen que ver con los usuarios finales como
gerentes o analistas, estos son los que no estn familiarizados con los formatos de
descripcin del Datawarehouse, pero estn interesados en entender la semntica
orientada al tema y necesitan representaciones ricas en estructura y contenido.

2.8 MODELADO DIMENSIONAL

(Wolf, 1999) El modelado dimensional es una tcnica para modelar bases de


datos simples y entendibles al usuario final. La idea fundamental es que el usuario
visualice fcilmente la relacin que existe entre los distintos componentes del
modelo.
Es adecuado para resumir y organizar datos. Enfocado para trabajar sobre datos
de tipo numrico. Un modelo dimensional contiene la misma informacin que un
modelo E/R, sin embargo ste, agrupa los datos en un formato simtrico cuyos
39

objetivos de diseo son el entendimiento del usuario, el desempeo de consultas y


flexibilidad al cambio.
(Harjinder y otros, 1996) El procesamiento analtico o anlisis multidimensional se
emplea para anlisis de histricos complejos, con amplia manipulacin (anlisis de
datos dinmicos), as como para la planeacin a futuro y pronsticos, el pasado
como prlogo del futuro.

2.8.1 COMPONENTES DEL MODELADO DIMENSIONAL


Los principales componentes del modelo dimensional son:

2.8.1.1 TABLA HECHO


Es la tabla principal en cada modelo dimensional, la cual denota las dimensiones
del negocio. Cada tabla dato representa un relacin de muchos a muchos y cada
una contiene un conjunto de dos o ms llaves forneas que unen a sus
respectivas tablas dimensin. Contiene valores de las medidas del negocio.

2.8.1.2 TABLA DIMENSIN


Contiene el detalle de los valores que se encuentran asociados a la tabla hecho.
Cada dimensin est definida por su llave primaria que sirve como base para la
integridad referencial con cualquier tabla hecho a la cual est relacionada.

2.8.2 ESQUEMAS RELACIONALES DEL MODELADO DIMENSIONAL


El modelo multidimensional de datos se puede instrumentar por un esquema
relacional, donde las dimensiones de un cubo son modeladas como relaciones de
40

dimensiones. El esquema relacional almacena datos en tablas relacionales


especializadas, llamadas tablas de hechos y de dimensiones. Lo cual brinda una
vista multidimensional de los datos usando un modelo relacional como soporte.
Existen dos esquemas principales para llevar a cabo el diseo dimensional de la
base de datos de un Datawarehouse, estos esquemas son usados para soportar
una operacin de datos multidimensional.

2.8.2.1 ESQUEMA ESTRELLA

El esquema Estrella (Star schema), se le conoce como el esquema tradicional, del


que de este derivan los dems esquemas conocidos, su nombre hace mencin a
que grficamente es representado como una estrella.
Su diseo consiste en una tabla de hechos en el centro que est relacionada a
cada tabla de dimensin. Las tablas de dimensin son enlazadas a la tabla de
hechos mediante referencias de una llave fornea. Por su parte la llave primaria
de la tabla de hechos se compone de una relacin de las llaves primarias de las
tablas de dimensiones. En la tabla de hechos se encuentran ls atributos que son
destinados a cuantificar, medir el hecho. En tanto que en la tabla de dimensin
estn destinados a elementos de nivel que representan los distintos niveles de
jerarqua de las dimensiones.

41

Figura 2.6. Ejemplo del esquema Estrella

La caracterstica que define este esquema es que las tablas de dimensin


nicamente pueden estar relacionadas a la tabla de hechos. Adems las tablas de
dimensin no estn normalizadas, esto significa, que toda la informacin referente
a una dimensin se almacena en la misma tabla.
El esquema estrella es til debido a que cada propiedad de una dimensin puede
ser recuperada con una unin desde la tabla de datos a la tabla de dimensin
relevante. Esto permite mejorar el desempeo de la consulta, pero incrementa el
volumen de datos

42

2.8.2.2 ESQUEMA COPO DE NIEVE

El esquema copo de nieve (Snowflake schema) representa una variacin del


esquema estrella tradicional. La diferencia que tiene con el anterior es que en
cada dimensin se almacenan jerarquas de atributos, es decir, se separan
atributos en otra entidad con la finalidad de obtener un mayor desempeo y
utilizacin del espacio. Para realizar este esquema es necesario llevar a cabo las
reglas de normalizacin a cada una de las tablas de dimensiones, con la finalidad
de simplificar las operaciones de seleccin de datos, lo que da como resultado una
mejor presentacin de los datos, evitando redundancia. Lo cual se traduce en una
eficiente recuperacin de la informacin que manipulan las tablas. A diferencia del
esquema estrella, es que la tabla de hechos deja de ser la nica que se relaciona
con otras tablas. Aqu si est permitido relacionar entre si las tablas de
dimensiones, debido a que hay un mayor nivel de detalle en cada una de las
tablas de dimensin.
Es til porque elimina la duplicacin que podra ocurrir. No obstante, se debe
considerar la frecuencia que una consulta utilizar los datos del esquema copo de
nieve, ya que este esquema requiere una unin adicional lo que lo hace ms lenta
la respuesta de la consulta y se presentan problemas de desempeo.

43

Figura 2.7. Ejemplo del esquema Copo de Nieve

Como se puede observar en la figura 2.7 existe nivel e detalle en las tablas de
dimensin Store, de ella se derivan las tablas de dimensin StoreType y
StoreManager. Tambin en la tabla Salesperson se deriva otra tabla dimensin
llamada Departament.

44

2.9 DATAMART
2.9.1 Definicin

El concepto de Datamart al igual que el de Datawarehouse fue dado de diferente


manera de acuerdo las filosofas de los autores Bill Inmon y Ralph Kimball.
Para Inmon un Datamart es:
Es una estructura que es alimentada por el EDW.
Es donde el usuario final tiene ms interaccin con el entorno de la
empresa.
Los datos ms detallados se encuentran en el Datamart de acuerdo al
departamento o entidad de la empresa.
Por otro parte para Kimball un Datamart es:
Es un subconjunto lgico del Datawarehouse completo. Este subconjunto est
enfocado hacia un rea o departamento de la empresa. Cada Datamart debe ser
representado por un modelo dimensional dentro de un Datawarehouse, dichos
datamarts deben ser construidos a partir de dimensiones conformadas y datos
conformados.
(Kimball) El termino Datamart significa evitar la imposibilidad de abordar la
planeacin completa de un Datawarehouse Empresarial al mismo tiempo.

45

Captulo 2 Herramientas de Explotacin de


Datawarehouse

2.1 GENERALIDADES

El Datawarehouse est orientado a apoyar el proceso de toma de decisiones, para


obtener una ventaja estratgica. Los datos en el Datawarehouse estn
almacenados en categoras o son estructurados a manera de que favorezcan el
anlisis de los datos histricos.
Un Datawarehouse no representa un fin, sino que representa un medio para
solucionar una necesidad, es por eso que est preparado para la explotacin de
sus datos mediante el uso de herramientas especficas que permitan la extraccin
de informacin significativa y patrones de comportamiento que permanecen
ocultos en este repositorio de datos.
La explotacin consiste en llevar a cabo consultas al Datawarehouse, esto es, la
manipulacin, anlisis y visualizacin de la informacin que realizan los usuarios
sobre los datos almacenados en el Datawarehouse.
Algunas de las herramientas de explotacin de Datawarehouse ms utilizadas se
presentaran a continuacin, haciendo nfasis en las caractersticas ms
importantes de cada una de ellas.

47

2.2 HERRAMIENTAS DE EXPLOTACIN DE DATAWAREHOUSE

2.2.1 QUERY AND REPORTING


Permite a los usuarios consultar el modelo de dimensiones directamente y definir
un conjunto de resultados, ya que simples herramientas ad hoc slo entregan los
resultados tabulares conjuntos, mientras que las herramientas ms avanzadas
permiten la creacin de la plena realizacin de informes complejos. En este caso,
las herramientas ad hoc tambin sirven como herramientas de desarrollo estndar
para los informes que otros usuarios ejecutan.
Las herramientas adecuadas de consulta y presentacin de informes proveen a
los usuarios acceso directo al modelo dimensional, generalmente a travs de la
capa de metadatos que provee una columna adicional de subgrupos, descripcin
de negocios y la unin de las definiciones. Debido a la complejidad de la
herramienta y la necesidad de comprender los detalles de los datos, las
herramientas ad hoc son en su mayora utilizados por los usuarios expertos que
cuentan con conocimientos tanto tcnicos y empresariales. Tpicamente, el
usuario puede arrastrar y soltar las columnas en el informe del rea, establecer
limitaciones, y aadir formato. El resultado final en la mayora de las herramientas
de consulta ad hoc es un informe. El analista tiene a menudo el informe resultante
de los datos de otro entorno, por lo general Excel cuenta con complementos para
la consulta y generacin de informes. Debido a que Microsoft ha invertido mucho
en desarrollar capacidades de Excel para realizar consultas y generacin de
informes.

48

Explicando a lo que se refiere a esta herramienta de explotacin de los datos


contenidos en el Datawarehouse, es importante mencionar que los Query and
Reporting trabajan tanto sobre el detalle como sobre las agregaciones de la
informacin.
Realizar este tipo de explotacin en un Datawarehouse supone una mejor
optimizacin del tradicional entorno de informes (reporting), dado que el
Datawarehouse mantiene una estructura y una tecnologa mucho ms apropiada
para este tipo de solicitudes. Lo cual quiere decir que es ms sencillo realizar este
tipo de consultas e informes debido a su enfoque OLAP.
Como se menciona anteriormente en los Datawarehouse es sencillo implementar
este tipo de explotacin de los datos, sin embargo, es importante mencionar que
los sistemas de Query & Reporting, que no se basan en Datawarehouse, se
caracterizan por la complejidad de las consultas, los altos tiempos de respuesta y
la interferencia con otros procesos informticos que compartan su entorno.
La explotacin del Datawarehouse mediante Query & Reporting permite una
gradacin de la flexibilidad de acceso, proporcional a la experiencia y formacin
del usuario. A este respecto, se recomienda el mantenimiento de al menos tres
niveles de dificultad:
Los usuarios poco expertos podrn solicitar la ejecucin de informes o
consultas predefinidas segn unos parmetros predeterminados.
Los usuarios con cierta experiencia podrn generar consultas flexibles
mediante una aplicacin que proporcione una interfaz grfica de ayuda.
Los

usuarios

altamente

experimentados

podrn

escribir,

total

parcialmente, la consulta en un lenguaje de interrogacin de datos.

49

2.2.1.1 SOLUCIONES DE QUERY AND REPORTING EN EL MERCADO

Actualmente en el mercado podemos encontrar una amplia gama de productos


dedicados a ofrecer el servicio de Consulta e Informes, para explotar los datos
contenidos en el Datawarehouse. Algunos corresponden a marcas reconocidas
como Oracle, IBM Cognos, Microsoft, entre otros. A continuacin se mencionaran
algunos de ellos con una breve descripcin de sus caractersticas:
Hyperion Interactive Reporting / Oracle : Software para la creacin de
grficos, tablas dinmicas e informes a partir de los datos de diversas
fuentes operativas y analticas. Adems, permite acceder directamente a
las fuentes relacionales sin necesidad de crear ni acceder a la capa
semntica de Oracle Business Intelligence Server.
Hyperion SQR Production Reporting / Oracle: Herramienta que se
conecta a fuentes de datos empresariales diversas y puede programarse
para crear informes peridicos de gran tamao. Permite consultar distintas
fuentes de datos, como las principales bases de datos relacionales,
multidimensionales y sistemas desarrollados (por ejemplo, IBM DB/2, SAP
R/3, SAP BW y SQL Server). Desbloquea los datos y permite utilizarlos
para crear informes multifuncionales que permitan a las empresas detectar
excepciones y supervisar el rendimiento de los distintos procesos.
IBM Cognos 8 Business Intelligence Analysis / IBM Cognos: Software
que proporciona completas capacidades de BI en una arquitectura probada.
Permite la exploracin guiada y el anlisis de informacin relacionado con
todas las dimensiones de su negocio, con independencia de dnde se
encuentren almacenados los datos. Analice y genere informes a partir de
fuentes OLAP y fuentes de datos relacionales basadas en dimensiones.
IBM Cognos 8 Business Intelligence Reporting / IBM Cognos: Producto
que proporciona completas capacidades de BI en una arquitectura probada.
Da acceso a una completa lista de tipos de informes de autoservicio, se
adapta a cualquier fuente de datos, y opera desde una nica capa de
50

metadatos para ofrecer diversos beneficios como el reporting en mltiples


idiomas.
Longview / Exact Software: Software que dispone de herramientas
propias de anlisis y reporting (principalmente multidimensional). Expone
por otra parte sus datos por ODBC y web services para poder integrarse
como una fuente de informacin ms de los sistemas de reporting de las
compaas. Dispone de Web services y herramientas de programacin para
poder automatizar procesos de alimentacin y extraccin con los sistemas
con los cuales se relaciona.
SQL Server Analysis Services / Microsoft: Proporciona funciones de
procesamiento analtico en lnea (OLAP) y minera de datos para
aplicaciones de Business Intelligence. Analysis Services admite OLAP al
permitirle disear, crear y administrar estructuras multidimensionales que
contienen datos agregados desde otros orgenes de datos, por ejemplo
bases de datos relacionales.
WebFOCUS Visual Discovery / Information Builders: Herramienta de
consulta y anlisis completamente visual que con satisface las necesidades
de una amplia gama de usuarios, incluso aquellos sin un perfil tcnico. En
cuestin de minutos se pueden crear completos dashboards de anlisis
muy visuales y grficos.
Las herramientas mencionadas anteriormente atienden a necesidades especificas
de cada organizacin, por lo cual para llevar a cabo la seleccin de uno de ellos se
debe llevar a cabo un anlisis para determinar cul es el que mejor se adapta a las
necesidades y requerimientos de la organizacin en la cual se desea implementar.

51

2.2.2 EIS (EXECUTIVE INFORMATION SYSTEM)

Los Sistemas de Informacin para Ejecutivos tambin conocidos por sus siglas en
ingles como EIS (Executive Information Systems) estn dirigidos a altos ejecutivos
de una organizacin como ayuda a la toma de decisiones. Presentan informacin
relevante tanto interna como externa usando recursos visuales y de fcil
interpretacin, con el objetivo de mantenerlos informados. La informacin que
presentan est enfocada a la situacin actual de la organizacin
(Bird, 1992) Un EIS es un software, con un sistema de recuperacin amigable que
provee informacin electrnica a los directivos con un acceso rpido a la
informacin que forma parte de las reas clave de la empresa, ayudando a realizar
las actividades de gestin para conseguir los objetivos de la empresa. Los
sistemas de informacin para ejecutivos tienen como objetivo soportar la categora
de decisiones que son descritas como no programables o intuitivas.
Para que sea considerado un sistema de informacin para ejecutivos, debe
cumplir con algunas caractersticas, sus principales caractersticas son:
Son utilizados por los altos ejecutivos de una organizacin.
Extraen, filtran, consolidan y visualizan los datos crticos.
Permiten acceder en tiempo real a las variables que definen en estado
actual de la organizacin.
Cuentan con una interfaz de usuarios amigable.
Para la presentacin de la informacin utiliza graficas, tablas, texto, etc.
Los Sistemas de Informacin para Ejecutivos, son considerados como herramienta
de explotacin del Datawarehouse, debido a que son utilizados como apoyo para
la toma de decisiones por los altos ejecutivos, los cuales no cuentan con el tiempo,
ni la habilidad para llevar a cabo anlisis de los grandes volmenes de datos, por
lo tanto el EIS proporciona medios fciles de usar para la consulta y anlisis de la
informacin

confiable

presentando

los

datos

simplificados,

altamente
52

consolidados, preparados para su presentacin. Facilitando a los usuarios la


recuperacin y anlisis de la mtricas de performance de la organizacin.

2.2.3 Tableros de Control


Es una herramienta grfica que le permite a los directivos concentrarse en
indicadores fundamentales que tienen relacin directa con los objetivos de negocio
de la empresa. Este no es un repositorio de datos, es una herramienta que
muestra indicadores relacionando los resultados esperados con los reales, es una
manera de analizar la evolucin del negocio.
Business Process Improvement (2009) Menciona que un Tablero de Control, es
una poderosa herramienta de administracin es utilizada para monitorear y
administrar el desempeo de la estrategia en una organizacin. Convierte la
misin y visin en un conjunto integral de objetivos y medidas de desempeo que
pueden ser cuantificadas y valuadas.
Un Tablero de Control permite visualizar datos trascendentes que esquematizan
la naturaleza de la empresa y su destino. Estos indicadores deben mostrar la
informacin en forma oportuna, sencilla e integrada, y ser claros y confiables.
No garantizan el xito de una empresa, debe comprometerse el esfuerzo
necesario para su efectiva utilizacin y generar una transformacin en la cultura de
trabajo empresarial.
Es importante tener en cuenta que un Tablero de Control no administra ni
gestiona; los indicadores le muestran los problemas a los directivos, pero el
anlisis de las causas y la forma de solucionarlos depende de las decisiones que
ellos tomen. El Tablero de Control le indica a los directivos si la organizacin est
cumpliendo con los objetivos o no, pero en ningn momento genera una solucin
automtica.
53

Los tableros de Control sirven, fundamentalmente para proporcionar una rpida


visualizacin del estado actual de las variables bsicas y la relacin con los
objetivos de la empresa. Permite saber si existen problemas en la organizacin y
facilitan la visualizacin de su evolucin, esto con la finalidad de tomar acciones
oportunas para corregir posibles desvos en los objetivos y poder corregirlos a
tiempo.

2.2.3.1 Semforos
Son frecuentemente utilizados para indicar las variables en los Tableros de
Control. Existen una serie de variables que son manejadas por los semforos, a
continuacin se explican cada una de esas variables:
Modelo del Semforo: el modelo del semforo est determinado por el
nmero de niveles que posee y est directamente relacionado con la
sensibilidad o capacidad de detalle.
Valor Real: representa la variable que se desea monitorear.
Valor Destino: representa el valor con el cual se establecern diferencias,
desvos de los valores reales, durante el monitoreo.
Umbrales: son los valores porcentuales que definen el paso de un estado a
otro del semforo. Depende de la cantidad de niveles del semforo.

2.2.4 DATAMINING
La Minera de Datos o Datamining es utilizada cuando se pretende obtener el
mximo de la informacin, es decir, cuando se desea extraer conocimiento de los
datos de la organizacin.

54

(W. Frawley, 1992) Puede definirse como la extraccin no trivial de informacin


implcita, previamente desconocida y potencialmente til, a partir de los datos.

Para conseguirlo hace uso de diferentes tecnologas que resuelven problemas


tpicos de agrupamiento automtico, clasificacin, asociacin de atributos y
deteccin de patrones secuenciales. La minera de datos es, en principio, una fase
dentro de un proceso global denominado descubrimiento de conocimiento en
bases de datos (Knowledge Discovery in Databases o KDD), aunque finalmente
haya adquirido el significado de todo el proceso o en lugar de la fase de extraccin
de conocimiento.
El uso de la minera de datos como herramienta de explotacin de un
Datawarehouse, contribuye a la toma de decisiones tcticas y estratgicas
proporcionando un sentido automatizado para identificar la informacin clave
desde grandes volmenes de datos. Permite a los usuarios dar prioridad a
decisiones y acciones que deben realizarse y que tengan mayor relevancia, en el
cumplimiento de los objetivos organizacionales. Proporciona a los usuarios tomar
las mejores decisiones de acuerdo al problema presentado, siendo capaces de
medir las acciones y los resultados. La minera de datos cuenta con una serie de
modelos descriptivos y predictivos.
La minera de datos provee principalmente dos capacidades que generan nuevas
oportunidades de negocios, las cuales son:
Prediccin automatizada de tendencias y comportamientos. La Minera
de datos automatiza el proceso de encontrar informacin predecible en
grandes bases de datos. Se puede contestar rpidamente a preguntas que
antes requeran un intenso anlisis de los datos.
Descubrimiento automatizado de modelos previamente desconocidos.
Las herramientas de Minera de Datos recorren las bases de datos e
identifican modelos previamente escondidos en poco tiempo.

55

Las tcnicas de Minera de Datos brindan beneficios de automatizacin. Ya que


cuando esas herramientas son implementadas en sistemas de procesamiento
paralelo de alto performance, pueden analizar los datos de una gran cantidad de
datos masivos en pocos minutos.
El tema de minera de datos es muy complejo e involucra una infinidad de
conceptos, en este apartado nicamente se pretende conocer el concepto y los
beneficios que brinda como herramienta de explotacin de un Datawarehouse.

2.2.5 WEBHOUSING

Representa una tendencia tecnolgica para el Datawarehouse. Las tecnologas


Web y el uso de Internet en las organizaciones ha tomado gran importancia hoy en
da, ya que permite a las organizaciones mantenerse informados, sin necesidad de
estar fsicamente en su lugar de trabajo. Debido a esto surge la necesidad de
integrar el internet y el Datawarehouse.
El uso de esta tecnologa como herramienta de explotacin de Datawarehouse
representa diversas ventajas como las siguientes:
Bajo costo de desarrollo y mantenimiento, ya qe hace uso de internet y no
necesita una infraestructura compleja. nicamente se debe llevar a cabo la
creacin de interfaces Web.
Brinda consistencia en los datos que se presentan.
Es accesible, mediante el uso del browser de internet, lo cual hace sencilla
la bsqueda de informacin.
Confianza de los datos, debido a que hoy en da la seguridad es un papel
fundamental y existen numerosos protocolos desarrollados para proteger
los datos de personas ajenas a la organizacin.
56

La representacin de los datos extrados del Datawarehouse pueden darse


mediante:
Publicacin de datos.
Distribucin de reportes
Aplicaciones dinmicas
La aplicacin de esta forma de explotacin mediante el uso de internet aun tiene
aspectos que deben considerarse al querer implementarlo. Ya que se deben
considerar los tiempos de respuesta y se debe contar con una arquitectura de red
solida y robusta para soportar este tipo de consultas OLAP.

2.2.6 HERRAMIENTAS OLAP


Las herramientas OLAP permiten navegar a travs de los datos almacenados en
el

Datawarehouse

analizarlos

dinmicamente

desde

una

perspectiva

multidimensional, es decir, considerando unas variables en relacin con otras y no


de forma independiente entre s y permitiendo enfocar el anlisis desde distintos
puntos de vista.

En el siguiente captulo se profundiza en el tema de las herramientas OLAP,


especficamente Cubos OLAP; el cual es el tema principal de este trabajo de
investigacin.

57

Capitulo 3 Cubos OLAP

3.1 DEFINICION

Como antecedentes tenemos que OLAP (On-Line Analytical Processing) significa,


Procesamiento Analtico en Lnea y constituye la manera de organizar los datos
contenidos en una base de datos para que se ajusten al modo que tienen los
usuarios de analizarlos.
Los cubos OLAP, representan una herramienta utilizada en los que se conoce
como Inteligencia de Negocios, debido a que permite a la organizacin optimizar
sus procesos y generar informacin til, rpida y

fcil de analizar para los

ejecutivos, como apoyo en la Toma de Decisiones, en base a datos histricos que


permitan brindar seguridad y soporte.
Un cubo OLAP muestra los resultados resumidos de los informes, en vez de una
gran cantidad de registros individuales, para que sea posible analizar muchos
datos que, por la cantidad de datos los recursos del sistema no podran manejar,
constituye

una

tecnologa

que

provee

rpido

acceso

datos

en

un

Datawarehouse. Los cubos proporcionan un mecanismo para buscar datos con


rapidez y tiempo de respuesta uniforme independientemente de la cantidad de
datos en el cubo o la complejidad del procedimiento de bsqueda.

59

Los cubos son subconjuntos de datos de un almacn de datos, organizado y


sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de
acuerdo a factores de negocio seleccionados, dando el mecanismo para la rpida
y uniforme tiempo de respuesta de las complejas consultas.

3.2 CUBOS VIRTUALES


Haciendo una analoga, el realizar cubos virtuales, es similar al proceso de juntar
tablas con vistas en las bases de datos relacionales. Un cubo virtual, provee
acceso a los datos en los cubos combinados como si estuvieran en un nico cubo,
sin la necesidad de construir un nuevo cubo, siempre y cuando el diseo de cada
cubo individual tenga un buen diseo.

La principal ventaja que ofrece los cubos virtuales es que almacena nicamente
definiciones, no los datos, por lo tanto, requieren menos espacio de
almacenamiento que los cubos normales.

Un cubo podr ser actualizado, procesando solo los datos que han sido aadidos,
en vez de hacerlo con el cubo entero, se puede usar la actualizacin incremental
para actualizar un cubo mientras se est usando.

3.3 RESTRICCIONES
El esquema de un Cubo permite manejo de restricciones, estas se pueden
clasificar a grandes rasgos como:
Restricciones de Llave
Restricciones de Integridad Referencial
60

Restricciones No Nulas
As mismo pueden clasificarse tambin en dos categoras:
1) Restricciones intra-cubo. Define restricciones dentro del cubo, se encarga
de explotar la relacin que existe dentro de los distintos atributos del cubo.
2) Restricciones inter-cubo. Define las restricciones entre dos a ms cubos.

3.4 COMPONENTES
Los cubos se constituyen de diversos elementos, de los cuales es necesario
conocer y entender el concepto de cada uno de ellos. Los componentes de un
cubo son:
Dimensiones
Niveles de Jerarqua
Medidas
Hechos
A continuacin se explican a detalle cada uno.
3.4.1 Dimensiones
Son categoras descriptivas por los cuales los datos numricos (mediciones) en un
cubo, son separados para su anlisis. Son usadas para seleccionar y agregar
datos a un cierto nivel de detalle.
Por ejemplo, si una medicin de un cubo es el conteo de las ventas y las
dimensiones son tiempo, vendedor, producto, los usuarios del cubo, podrn

61

separar el conteo de las ventas realizadas dentro de las categoras que


corresponden a las dimensiones antes mencionadas.
Una dimensin puede ser creada para usarse en:
Cubo individual. Llamada dimensin privada.
Mltiples cubos. Llamada dimensin compartida. Es ms conveniente
utilizar la dimensin compartida debido a que se podrn usar dentro de todo
el cubo, mediante esto se optimiza el tiempo y se evita duplicacin de
dimensiones privadas, adems estandarizan las mtricas de negocios entre
los cubos, es decir, las dimensiones estn organizadas similarmente en
todos los diferentes cubos y se puedan analizar sin inconvenientes.

3.4.2 Niveles de Jerarqua


Representan la jerarqua de los miembros de las dimensiones. Se refiere al nivel
de detalle que se da en cada una de las dimensiones. Estos niveles de jerarqua
tienen relacin con el esquema copo de nieve, ya que de una dimensin se hace
el desglose para saber especficamente acerca de un dato. Por ejemplo, se tiene
la dimensin Pas, pero de desea analizar ms a detalle acerca de ese pas, se
jerarquiza en Pas, Estado, Ciudad.

3.4.3 Medidas
Son datos numricos de inters primario para los usuarios del cubo. Representan
el resultado del dato que se requiere conocer y analizar. Algunas medidas
comunes son Ventas en unidades, ventas en pesos, costo de ventas, gastos,
conteo de la produccin, presupuesto, entre otras. Son usadas por el
62

procedimiento de agregacin de los servicios de OLAP y almacenadas para su


rpida respuesta a las peticiones de los usuarios.

3.4.4 Hechos
Son las colecciones de datos que se extraen, es lo que se quiere ubicar. Son
mediciones numricas (valores) que representan un aspecto o actividad de
negocio especifica.

Figura 3.1 Representacin de un cubo OLAP.

A continuacin se explican cada uno de los componentes de un cubo, con la


finalidad de que cada uno de los miembros sean entendidos e identificados, para
lo cual se tomara como ejemplo la figura 3.1
El cubo corresponde al nmero de entregas de paquetes que se realizan de
acuerdo a una ruta determinada, pas y en que lapso de tiempo. La dimensin
63

Source representa las ubicaciones en las que se producen las importaciones, caso
de frica o Asia. La dimensin Time representa los trimestres y semestres de un
nico ao.
Dimensiones: Route, Source y Time.
Niveles de Jerarqua: por ejemplo, en la dimensin Route su nivel de jerarqua es
nonground que a su vez se divide en air, sea y ground roal, rail.

Route
Nonground

Air

Sea

Ground

Air

Sea

Figura 3.2. Representacin de Niveles de Jerarqua

Hecho. Numero de paquetes entregados por ruta air, en North America en


el tercer trimestre del ao.
Medidas. Del hecho anterior la medida seria 4,360.

Figura 3.3. Representacin de la medida.

64

3.5 PROPIEDADES DE MIEMBROS

Se pueden definir propiedades para los miembros de dimensin y usar datos para
estas propiedades dentro de un cubo. Por ejemplo, si los miembros de la
dimensin producto son su nmero de partes, es lo mismo hacer varias
propiedades asociadas con este nmero de parte tales como, el tamao, color,
etc. Se pueden especificar tales propiedades, como una propiedad miembro y
utilizarla en las bsquedas analticas.

3.6 AGREGACIONES

Se le llama as, al proceso de precalcular sumas de datos, para ayudar a disminuir


los tiempos de respuestas, en los procesos de bsquedas de informacin. Las
agregaciones pueden precalcularse durante el procesamiento de los cubos o al
momento en que se realiza la consulta. Lo ms recomendable es realizarlo
durante el procesamiento para que as devuelva el resultado de la consulta ms
rpidamente
En Analysis Services de Microsoft, se pueden calcular fcilmente otros valores
agregados tomando como base otras agregaciones precalculadas. Y brinda un
equilibrio entre los requisitos de almacenamiento y el porcentaje de las posibles
agregaciones que se precalculan, esto debido a que todas las agregaciones
posibles requieren tiempo de procesamiento y espacio de almacenamiento.
Si durante la consulta no es necesario precalcular agregaciones, la cantidad de
tiempo de procesamiento y de espacio de almacenamiento que se necesita para
65

un cubo se reduce al mnimo, aunque el tiempo de respuesta puede ser lento, ya


que es preciso recuperar de las celdas hoja los datos necesarios para responder a
cada consulta y luego agregarlos en el tiempo de la consulta para responder a
cada una de ellas.

3.7 TIPOS DE ALMACENAMIENTO


Existen varios tipos de almacenamiento para los cubos, pero hay 3 principales los
cuales son:
ROLAP
MOLAP
HOLAP

3.7.1 ROLAP (Relational On Line Analytical Process)


Su forma de almacenamiento es en una base de datos relacional, como bien su
nombre lo indica.
Este modo de almacenamiento, no guarda una copia de los datos de origen, las
consultas son realizadas directamente a las tablas originales de la base de datos.
Por lo cual, el resultado de la consulta suele ser ms lento en comparacin con los
otros dos tipos de almacenamiento. Su tiempo de procesamiento tambin se ve
reducido. Sin embargo permite a los usuarios, ver los datos en tiempo real y
ahorrar espacio de almacenamiento ya que es recomendable utilizar ROLAP para

66

grandes volmenes de informacin que no son frecuentemente buscados tales


como datos histricos.
Por lo tanto ROLAP, ofrece caractersticas de escalabilidad, concurrencia y
administracin de datos.

3.7.2 MOLAP (Multidimensional On Line Analytical Process)


Como su nombre lo indica, utiliza una base de datos multidimensional. En este tipo
de almacenamiento se carga la informacin procedente de los sistemas
transaccionales. Las vistas de los datos en este tipo de almacenamiento son
dadas por medio de estructuras de arreglos. Despus de cargar los datos se
generan ndices con la finalidad de mejorar los tiempos de respuesta de las
consultas.
La estructura multidimensional es una copia de los datos de origen, por lo cual los
datos fuente son almacenados junto con sus agregaciones en una estructura
multidimensional de alto rendimiento. Dichas agregaciones permiten disminuir los
tiempos de respuesta de las consultas. MOLAP, proporciona excelente
rendimiento y compresin de datos.
Este tipo de almacenamiento, es adecuado para volmenes de informacin
pequeos con nmero limitado de dimensiones, adems para cubos con uso
frecuente por su rpida respuesta.

67

3.7.3 HOLAP
El almacenamiento en HOLAP combina atributos de MOLAP y ROLAP, para
almacenar la agregacin de los datos utiliza la estructura multidimensional de
MOLAP y la base de datos fuente esta dada en una base de datos relacional.
Para devolver los resultados de una consulta lo realiza accediendo a datos
sumarizados como en MOLAP
Para procedimientos de bsqueda que accesan datos sumarizados, HOLAP es
equivalente a MOLAP. Los cubos almacenados en HOLAP, son ms pequeos
que los MOLAP, ya que no contienen datos de origen y responden ms rpido que
las consultas realizadas en ROLAP.
HOLAP es generalmente usado para cubos que requieren rpida respuesta, para
sumarizaciones basadas en una gran cantidad de datos.

3.7.4 DIFERENCIAS
Actualmente es importante conocer los requerimientos de la organizacin para
poder llevar a cabo la mejor seleccin del tipo de almacenamiento de los datos
para un cubo. Ya que como se explico anteriormente cada tipo de almacenamiento
tiene sus ventajas y desventajas no se podra decir con exactitud cul es el mejor.
Sin embargo tambin es importante mencionar que HOLAP ofrece las ventajas de
los otros dos tipos de almacenamiento por lo cual representa una opcin
adecuada.
A continuacin se muestra una tabla en la cual de hace una comparacin de las
diferencias entre ROLAP y MOLAP en cuatro aspectos fundamentales:

68

DATOS

MOLAP

ROLAP

Detalle y precalculados,

Detalle y agregados

agregados
ESTRUCTURA

Matrices comprimidas

Tablas relacionales

ADMINISTRACIN

Especialista en Bases de

Administrador de Base de

Datos Multidimensionales

Datos

(BDMD)
ACCESO

Lenguaje especializado

SQL

Tabla 3.1. Diferencias entre MOLAP y ROLAP

3.8 OPERACIONES CON CUBOS


Las operaciones ms comunes para realizar con cubos son:
Roll up. Se refiere al incremento en el nivel de agregacin de los datos. Se refiere
a una exploracin de los datos de manera ascendente, es decir, desplaza la
jerarqua hacia arriba, agrupndola en unidades mayores a travs de una
dimensin. Un ejemplo de esta operacin es cuando se desea conocer el resumen
de las ventas realizadas en semanas, trimestres o anuales.
Drill down. Es la reduccin de la dimensionalidad de los datos mediante
seleccin. Es el proceso de visualizacin de datos a mayor nivel de detalle. Se
refiere a una exploracin descendente. Un ejemplo de donde estara aplicada esta
operacin, es cuando se desea conocer las ventas a nivel nacional, por regin y
por subregin.
Slice. Esta operacin ejecuta una seleccin sobre la dimensin de un cubo dado,
resultando un subcubo.
Dice. Esta operacin define un subconjunto realizando una seleccin de dos o
ms dimensiones.
69

Las operaciones Slice y Dice, agregan, remplazan o eliminan atributos especficos


de una dimensin o una parte de esos atributos.
Pivotaje o rotacin. Reorientacin de la visin multidimensional de los datos.
Selecciona el orden de visualizacin de cada una de las dimensiones que
conforman el cubo.
Drill Across. Se refiere a pasar de una dimensin a otra. Es la accin de
desglosar una mtrica por una dimensin que pertenece a otro cubo.
Drill Through. Consulta sencilla que permite indicar y expresar que existe un nivel
de datos detallados.

3.9 INDICADORES KPI


La funcin principal de utilizar herramientas de explotacin en un Datawarehouse
es con la finalidad de obtener datos resumidos de la gran cantidad de datos que
se tiene almacenados. Por lo tanto el concepto de Indicador, toma gran relevancia
en los Cubos OLAP.

3.9.1 DEFINICION
Un KPI es sencillamente un indicador que est asociado a un objetivo. Indica el
estado en que la empresa se encuentra, es decir, si est por encima o por debajo
de una meta predeterminada. Comnmente se muestran como una tasa o
porcentaje y estn diseados para permitir que un usuario de negocios pueda

70

saber instantneamente si estn dentro o fuera de su plan sin que tenga que
buscar informacin adicional.
Un indicador clave de rendimiento (KPI) es una medida cuantificable para valorar
los xitos de la empresa.
En Analysis Services, un KPI es un conjunto de clculos asociados a un grupo de
medida de un cubo, que se usa para evaluar el xito empresarial. Normalmente,
estos clculos son una combinacin de expresiones MDX (Expresiones
multidimensionales) o miembros calculados. Los KPI tambin tienen metadatos
adicionales que proporcionan informacin acerca de cmo deberan las
aplicaciones cliente mostrar los resultados de los clculos de KPI.
Un KPI administra informacin sobre un objetivo establecido, la frmula real del
rendimiento registrada en el cubo y medidas para mostrar la tendencia y el estado
del rendimiento.
Los Cubos OLAP, son una excelente herramienta que permite generar
Indicadores, fcil y sencillamente, adems de brindar ventajas en la visualizacin
de los datos, adems son de fcil entendimiento y manejo.

3.10 OPTIMIZACIN DEL RENDIMIENTO


Al preparar los datos para pasarlos a cubos OLAP, es importante tener en cuenta
la indexacin de cada una de las dimensiones y tablas de hechos, para tener un
buen rendimiento en el procesamiento de los cubos.
Es fundamental comprobar el rendimiento, ya que si no se tiene el rendimiento
previsto se debe comprobar cmo optimizar las consultas o el esquema para
mejorar el rendimiento. Si el rendimiento es lento se debe revisar el esquema
relacional utilizado y en cmo esta implementado, es decir, revisar sus ndices,
relaciones, integridad, limpieza de datos.

71

Existe una gua dada por Microsoft que aplica a Servicios OLAP de Microsoft SQL
Server. La cual menciona los pasos a seguir antes de procesar un cubo de
servicios OLAP.

1. Declare una clave principal en cada tabla de la dimensin.


2. Para las dimensiones de estrella, declare las relaciones de claves externas
(FK) entre cada tabla de dimensiones y tabla de hechos correspondiente.
Adems, para las dimensiones de copo de nieve, declare las relaciones de
claves externas entre cada tabla de dimensiones secundaria y la tabla de
dimensiones primaria que aumenta.
3. Asegrese de que hay una clave principal asociada a las tablas de hechos.
4. Declare ndices en cada una de las claves principales en las tablas de
dimensin y en las tablas de hechos.
5. Declare ndices en cada una de las claves externas de las tablas de
hechos.
6. Limpie los datos para quitar todos los valores NULL para esos elementos
de datos que se pasan a Servicios OLAP.

3.11 RECOMENDACIONES PARA EL DISEO DE CUBOS


El diseo de los cubos, es sencillo, pero debe atender a requerimientos
especficos, se deben tomar en cuanta diversas especificaciones para qu el
diseo sea correcto y atienda a las necesidades de la empresa. Adems de que
brinde resultados correctos que permitan tomar decisiones adecuadamente.

Los cubos bien diseados satisfacen mejor las necesidades de los usuarios
finales. A continuacin se muestra una serie de prcticas recomendadas por

72

Microsoft TechNet, que pueden ayudar a mejorar la usabilidad y el rendimiento de


los cubos.
Evitar incluir medidas no vinculadas en el mismo cubo. Tener muchos grupos
de medidas en un cubo puede afectar negativamente el rendimiento del las
consultas del cubo, incluso para las consultas que solo utiliza un grupo de
medidas.
Evitar tener muchas dimensiones padre-hijo en un cubo. Se deben utilizar solo
cuando sea extremadamente necesario, debido a que las consultas tendrn my
poco rendimiento.
Evitar tener muchas dimensiones de muchos a muchos. Esto puede tener
como consecuencia tener problemas de rendimiento.
Evitar

crear

mltiples

grupos

de

medidas

que

tengan

la

misma

dimensionalidad y granularidad. El tener muchos grupos de medidas puede


afectar negativamente el rendimiento. Adems la presencia de muchos grupos de
medida similares presenta un modelo complejo para el usuario final. Por lo tanto
debe considerarse la creacin de un solo grupo de medidas que contenga varias
particiones.
Poner cada medida dentro de un grupo de medidas. Esto permitir mejorar el
rendimiento.
Establecer explcitamente algn miembro predeterminado del juego de rol de
las dimensiones directamente en las dimensiones del cubo. Esto implica que
una dimensin puede tener diferente nombre de acuerdo a la funcin que
desempee, por ejemplo OrdeFecha y FechaEnvio estn basados en la dimensin
Fecha, sin embargo tienen diferente nombre de acuerdo a su funcin. Esto
representa

una

ventaja,

ya

que

permite

que

los

diferentes

miembros

predeterminados desempeen una funcin diferente y no exista confusin en las


dimensiones y atributos.

73

Reutilizar dimensiones en los cubos, en lugar de crear dimensiones


duplicadas. Se debe evitar considerablemente la duplicacin de dimensiones, ya
que si no se tendrn problemas de almacenamiento y excesivos gastos de
mantenimiento.
Utilizar el tipo de dato adecuado para cada una de las medidas. El tipo de dato
debe ser el adecuado no debe ser ms pequeo de lo que se necesita ni mas
grande, para no reducir los costos de almacenamiento.
Dimensiones materializadas. Esto se debe realizar con la finalidad de mejorar el
rendimiento y las dimensiones de referencia deben ser materializadas.

As como las anteriores hay otras recomendaciones que se deben tomar en


cuenta, estas nicamente son recomendaciones por parte de Microsoft para
generar una buena estructura en la creacin de Cubos OLAP. Todas y cada una
de las prcticas anteriores pueden ayudar al responsable de la creacin y diseo
de Cubos a tener una gua de los aspectos que son fundamentales y que se
deben tomar en cuenta.

3.12 SOFTWARE PARA LA CREACIN DE CUBOS


Actualmente existen muchas empresas que se dedican a crear y distribuir
soluciones para las empresas que requieren elevar su nivel de competitividad y
contar con herramientas OLAP que les permita eficientar sus procesos y tomar
decisiones basadas en el negocio y los resultados.
Es por eso que a continuacin se muestran las principales empresas dedicadas a
crear soluciones de Inteligencia de Negocios y que brindan el software necesario
para la creacin del tema central de este captulo que son los Cubos OLAP.

74

3.12.1 PENTAHO
La corporacion Pentaho es el patrocinador primario y propietario del proyecto
Pentaho BI. La PLATAFORMA Pentaho BI es una iniciativa en curso por la
comunidad de Open Source que provee organizaciones con mejores soluciones
para las necesidades de BI de una empresa, en Arquitectura,

Soporte,

Funcionalidad e Implantacin.
En la plataforma Open Source de PENTAHO se incluye la herramienta OLAP
Mondrian, que permite crear cubos de informacin para anlisis multidimensional.
Dichos cubos se componen de archivos XML y en ellos se definen las
Dimensiones y las conexiones de los datos. Los archivos XML por lo general son
complejos de realizar manualmente por lo que es comn utilizar herramientas
graficas para realizar la edicin de estos. Como ejemplo de estas herramientas
Open Source Pentaho tenemos a Cube Designer para la Creacin de cubos y el
Workbench para la edicin de los mismos.

3.12.2 MICROSOFT: SQL ANALYSIS SERVICES (SSAS)


Microsoft SQL Server 2005 Analysis Services (SSAS) ofrece funciones de
procesamiento analtico en lnea (OLAP) y minera de datos para aplicaciones de
Business Intelligence. Analysis Services admite OLAP y permite disear, crear y
administrar estructuras multidimensionales que contienen datos agregados desde
otros orgenes de datos, como bases de datos relacionales.
Los cubos son objetos OLAP que se componen de medidas y dimensiones
relacionadas que se configuran en una base de datos de Analysis Services. Puede
definir y configurar varios cubos en una nica base de datos; y cada cubo puede
usar algunas de las mismas dimensiones o todas ellas. Tambin puede definir un
75

solo cubo que contenga varios grupos de medida en la misma base de datos en
lugar de definir cubos independientes. Al definir un cubo con varios grupos de
medida, debe definir cmo se relacionan las dimensiones con cada grupo de
medida y personalizar, segn corresponda, los objetos de dimensin de cada cubo
y grupo de medida. Al definir un cubo, tambin se definen propiedades avanzadas
del mismo: clculos, KPI, acciones, particiones, agregaciones, perspectivas y
traducciones.

As como esta Analysis Services de Microsoft, tambin es muy utilizado para la


creacin de Cubos, la herramienta de Office Microsoft, Excel en conjunto con
Microsoft Access. Esta forma de creacin de cubos ha sido muy utilizada, debido a
que todas las empresas cuentan con este Software y existen en la red muchas
guas y manuales, que ayudan a la creacin de cubos OLAP. Adems existen
herramientas de Inteligencia de Negocios que permiten la creacin de cubos pero
utilizando como herramienta para la visualizacin Microsoft Excel.

3.12.3 OlapX
Es una sofisticada herramienta OLAP que le permite crear o utilizar cubos
multidimensionales existentes para el anlisis de la informacin de su empresa.
Permite

el

anlisis

interactivo,

reporteo

presentacin

de

cubos

multidimensionales que se encuentren en bases de datos de Microsoft Analysis


Services o en archivos locales.
Est diseado para usuarios de cualquier negocio o nivel tcnico para que puedan
llevar a cabo los anlisis de la informacin por ellos mismos, crear reportes y
consultas y compartirlos para mejorar el proceso de toma de decisiones de una
compaa.

76

Cuenta con 4 productos fundamentales que atienden requerimientos especficos,


los cuales son:
OlapX Application: Una aplicacin cliente servidor que le permite crear,
ver y analizar cubos multidimensionales.
OlapX Lite: El compaero de OlapX Application. Este producto ser
gratuito por un tiempo limitado, le permite a usuarios finales utilizar el
trabajo realizado con OlapX Application.
OlapX Developer: Si desea desarrollar aplicaciones Olap personalizadas,
puede crearlas y distribuirlas con este producto
OlapX Web: Para distribuir sus cubos a travs de un sitio web, puede
utilizar este control e insertarlo en su sitio.

3.12.4 ORACLE 10G Y 11G


A partir de la versin de Oracle 10g, se introducen a ella nuevas caractersticas en
comparacin con versiones anteriores, una de ellas es que permite la creacin de
cubos OLAP incorporando caractersticas de alto desempeo para el depsito de
datos en Oracle.
En la versin 11g se incluyen visualizaciones relacionales de un cubo que son
administradas por la base de datos, una fuente de dilas para la exploracin de
cubos y visualizaciones materializadas. Oracle OLAP utiliza un espacio de trabajo
analtico, en el cual almacena los datos en la base de datos como cubos
multidimensionales, que son diseados para consultas y actualizaciones cada vez
ms rpidas.

3.12.5 SAP BUSINESS OBJECT


Es el proveedor lder en lo que a Inteligencia de Negocios se refiere y cuanta con
miles de clientes. Tambin ofrece creacin y mantenimiento de cubos OLAP para
la presentacin de la informacin del negocio.
77

Ofrece un extenso portafolio de Inteligencia de Negocios, en el cual incluye


productos como:
SAP BO Web Intelligence.
SAP BO Desktop Intelligence
SAP BO Crystal Reports
SAP BO xCelsius
SAP Voyager
SAP BO Set Analysis, entre otros ms.

Anteriormente se mencionaron solo algunas de las marcas reconocidas en el


mercado y que son ampliamente utilizadas por las empresas para implementar
soluciones OLAP, que les permitan realizar anlisis de sus datos del negocio. As
como estas existen otras ms, por lo cual la seleccin de la mejor depender de
los requerimientos de la empresa y de conocer a fondo cuales son las
caractersticas que ofrece y en base a esto seleccionar la que mejor se adecue a
los

procesos

de

la

empresa

sus

necesidades.

78

Captulo 4 Visualizacin de un ejemplo de Cubo


OLAP

4.1 DESCRIPCIN
A continuacin se presenta la descripcin de la interfaz utilizada por usuarios
finales, de un cubo. Este muestra informacin relevante acerca del nmero de PE
de Posgrado. Es importante mencionar que este cubo fue diseado previamente y
los valores mostrados no pueden cambiar, lo nico que se puede cambiar es la
forma de visualizacin de los datos.

4.2 VISUALIZACIN DE LA INFORMACION DEL CUBO


A continuacin se explicara y se mostrara un ejemplo de un cubo realizado, que ya
se encuentra funcionando y que sirve de soporte para tomar decisiones.
Se procede a explicar la interfaz utilizada.
Como se explicaba anteriormente, el cubo ya fue diseada previamente, indicando
las dimensiones requeridas, por lo tanto nicamente se pueden visualizar los
datos y no se pueden realizar cambios.
En la figura 4.1 se muestra la pantalla principal, sobre la cual se pueden visualizar
y cambiar las vistas de los datos presentados.
Como se puede visualizar en la figura 4.1. La interfaz contiene diversos mens a
los cuales se puede acceder y realizar cambios en la vista de la informacin
presentada. Ms adelante se explicaran a detalle todas y cada una de las
principales herramientas y funciones que se pueden realizar.

80

Figura 4.1 Pantalla principal

4.3 COMPONENTES BSICOS


A continuacin se procede a explicar todas las herramientas que incluye la
interfaz.

4.3.1 FORMATO
En la parte superior de la pantalla se puede observar el men que nos brinda
diversas opciones de formato para realizar al cubo mostrado.

81

Figura 4.2 Men de formato

Para comenzar a describir cada uno de los botones de la figura 4.2 se empezara
de izquierda a derecha
Save Chart Image. Permite guardar la grafica del cubo mostrado. Mostrara una
ventana donde dir si queremos Abrir, Guardar o Cancelar.
Copy Chart. Almacena en el portapaleles la imagen para copiarla en algn
documento.
Print Chart. Permite imprimir la grafica del cubo mostrado.
Print Preview Chart. Permite visualizar antes de imprimir la grafica de los datos
del cubo.
Select Chart Type. Permite cambiar el tipo de grafica. En la figura 4.3 se muestra
los diferentes tipos de graficas.

Figura 4.3 Tipos de grficas.

Toggle Chart Legend. Oculta la leyenda de los datos mostrados.

82

Properties. Abre una ventana en la cual se pueden realizar otras configuraciones.


Como estilo, tipo de grafica, titulo, colores, leyenda, apariencia entre otras. Como
se muestran en la figura 4.4

Figura 4.4 Ventana de Propiedades.

Select Color Palette. Permite cambiar la combinacin de los colores de la


ventana.
Pivots Data. Al seleccionar esta opcin, muestra en la grafica los datos pivote. En
este caso son las regiones. En la figura 4.5 se muestra el resultado al seleccionar
esta opcin.

83

Figura 4.5 Vista de los datos al seleccionar Pivots Data

Switch to simple view. Muestra una vista simple del grafico.

4.3.2 Reports
Este men ofrece diversas opciones para crear reportes de los datos. En la figura
4.6 se muestra el men. Se proceder a explicar de izquierda a derecha.

Figura 4.5. Men Reports

84

Add Report. Agrega un Nuevo reporte


Remove report.Elimina reporte seleccionado
Revert to original report. Si se han realizado cambios a algun reporte realizado,
deshace los cambios y conserva el original.
Rename report. Permite cambiar el nombre al reporte.
Save reports. Almacena el reporte generado
Load reports. Carga los reports generados.

4.3.3 Measures and Dimensiones


En este apartado se muestran las medidas y dimensiones utilizadas para crear
diferentes cubos. En la figura 4.6 se pueden observar las definidas para este cubo.
Las que estn marcadas con negritas son las utilizadas para el cubo mostrado en
este ejemplo.

Figura 4.6 Medidas y dimensiones utilizadas en el cubo.

85

4.3.4 Visualizacin de los datos


Esta interfaz permite mostrar los datos de dos diferentes maneras:
Chart. Los datos son visualizados mediante grafica.
Grid. Los datos se visualizan mediante tablas. En la figura 4.7 se muestra la
visualizacin por medio de grid.

Figura 4.7 Visualizacin de datos mediante la opcin Grid.

4.4. CATEGORAS Y SERIES


Mediante estos mens podemos seleccionar los datos que se desean mostrar
nicamente en las graficas. En el apartado de Categoras, para cuestiones de este
ejemplo, se muestran las dimensiones Regin y rea Acadmica. Al seleccionar la
pestaa de alguna de estas mostrara los datos que se tienen para establecer
diversas vistas de los datos. En la figura 4.8 se muestran los datos que se tienen
configurados para este ejemplo.
86

Figura 4.8 Datos contenidos en las dimensiones Regin y rea Acadmica .

87

CONCLUSIONES

A lo largo de este trabajo de investigacin, se llega a la conclusin de que los


conceptos sobre los cuales se centra, son actualmente de vital importancia
conocer, ya que aunque en Mxico muy pocas empresas tienen implementados
Datawarehouse, si hay muchas que hacen uso de herramientas de Inteligencia de
Negocios para eficientar sus procesos y llevar una adecuada toma de decisiones,
que permitan alcanzar los objetivos planteados y brindar ventaja competitiva, aun
utilizando bases de datos transaccionales.
Considero que es de vital importancia evolucionar y optar por herramientas
dinmicas que permitan y ayuden a las organizaciones a transformar su
informacin en conocimiento y cambiar las bases de datos operacionales por las
bases de datos multidimensionales que le den flexibilidad a los datos y se puedan
implementar diversas soluciones para este tipo de datos.
Como antecedente, por muchos aos se ha utilizado sistemas basados en
Procesamiento Transaccional, comnmente conocido como OLTP, las cuales han
funcionado muy bien y hasta el da de hoy permiten realizar las operaciones
bsicas del negocio, sin embargo no permiten realizar anlisis de sus datos debido
a que sus estructuras son muy robustas y no permiten flexibilidad de sus datos
almacenados.
Sin embargo surgi el concepto de de Procesamiento Analtico en Lnea OLAP, el
cual con el paso de los aos se ha vuelto ms popular debido a que mejora
significativamente el anlisis del negocio y aunque en un principio era considerado
como difcil y costoso de implementar, no obstante se han desarrollado diversas
herramientas que hacen ms fcil y menos costo. Es importante que las empresas
hagan un anlisis de las operaciones y procesos que realizan con la finalidad de
evaluar y pensar en implementar soluciones de Inteligencia de Negocios, debido a
que no solo se deben implementar para no estar un paso atrs, sino es necesario
determinar si son requeridas y cul es la que mejor se adecua a los
requerimientos de la empresa.

89

Para las empresas que llevan muchos aos en el mercado representara una
excelente opcin pensar en implementar un Datawarehouse, ya que este contiene
datos histricos de 5 a 10 aos y permitira llevar a cabo anlisis de la informacin
contenida en el almacn de datos.
De las diversas herramientas de explotacin de Datawarehouse que se presentan
en el contenido del trabajo, cabe mencionar que no son las nicas que existen,
peo el propsito de esta investigacin es brindar una idea general de las que
existen y cules son las ms utilizadas por las empresas.
Adems de las herramientas mencionadas existen, lo que es el tema principal y
por el cual se llevo a cabo dicha investigacin. Los cubos OLAP, los cuales desde
mi punto de vista proporcionan una excelente visin de los datos, ya que cuenta
con diversos componentes que brindan una representacin dinmica de la
informacin.
Hoy en da las empresas les hace falta realizar un cambio en la representacin de
la informacin al usuario final, es necesario implementar herramientas que
permitan un fcil y correcto anlisis de la informacin del negocio y brinden una
visin general de cmo se llevan a cabo las operaciones con el paso del tiempo y
saber si estn cumpliendo con sus objetivos.
Los cubos permiten mostrar indicadores, este concepto ha tomado gran
importancia y los cubos son una excelente herramienta para representarlos. Los
indicadores estn asociados con objetivos, a las empresas hoy en da les interesa
conocer si estn cumpliendo con las metas trazadas y medir el xito o fracaso de
acuerdo a determinadas situaciones.
Actualmente los indicadores son muy utilizados en el mbito de la educacin y
diversas organizaciones educativas forman parte del proyecto de integracin del
sistema nacional de indicadores en educacin superior del pas y hasta el da de
hoy existe un registro de diversos indicadores desde el ao 2006.

90

Es por esto que los cubos OLAP son una herramienta que permite generar
indicadores de manera fcil y sencilla, adems de brindar ventajas en la
visualizacin de los datos, anexando su fcil entendimiento y manejo para los
usuarios finales.
Es importante mencionar adems que al implementarlos se debe estar muy
pendiente del rendimiento y tomar en cuenta las diversas recomendaciones para
su diseo, es importante hacer nfasis en este tema ya que se le debe dar la
importancia necesaria al llevar a cabo su diseo, ya que aunque represente una
buena herramienta, sino son diseados adecuadamente mostraran informacin
errnea y por ende no se podrn obtener buenos resultados ni indicadores
confiables que permitan la correcta toma de decisiones.
En la actualidad existen muchas empresas que ofrecen soluciones de inteligencia
de Negocios y proporcionan diversas aplicaciones para la creacin de cubos, cada
vez son ms sencillas de utilizar y brindar interfaz grafica que permiten su fcil
creacin; por lo cual antes de llevar a cabo su seleccin, se debe llevar a cabo un
anlisis para determinar cul es la que mejor se adecua a los requerimientos de la
empresa.

Para finalizar, como aportacin personal, puedo concluir que la tecnologa avanza
constantemente, por lo cual es importante estar actualizados en los temas que son
relevantes. Los cubos OLAP representan una solucin reciente que da a da va
mejorando, por lo cual no est por dems considerarlo como una buena
herramienta de explotacin de los datos contenidos en un Datawarehouse. Las
organizaciones deben avanzar y no tener miedo al cambio, las herramientas OLAP
representaran una ventaja siempre y cuando se tome el tiempo adecuado para
analizar los requerimientos de la empresa y as obtener la mejor solucin.

91

FUENTES DE INFORMACION

BERSON, Alex (1997). DATA WAREHOUSING, DATA MINING & OLAP. New
York: Mc Graw Hill.

BIRD, J. EXECUTIVE INFORMATION SYSTEMS. MANAGEMENT Handbook.


Oxford: Blackwell, 1992.

FRAWLEY W. & Piatesky-Shapiro G. & Matheus C. (1992) KNOWLEDGE


DISCOVERY IN DATABASES: AN OVERVIEW, (pg. 213-228)

GILE, Keith (2002) BUSINESS INTELLIGENCE STRATEGIC PLAN. The Giga


Group Developing

GINER DE LA FUENTE, Fernando & GIL, Ma. De los ngeles (2004). LOS
SISTEMAS DE INFORMACION EN LA SOCIEDAD DEL CONOCIMIENTO. ESIC
Editorial.

JIAWER, Han & KRAMBER, Micheline (2006). DATA MINING: CONCEPTS AND
TECHNIQUES. Segunda edicion. USA: Morgan Kaufmann.

KIMBALL, Ralph (1998). THE DATAWAREHOUSE LIFECYCLE TOOLKIT:


EXPERT

METHODS

FOR

DESING,

DEVELOPING

AND

DEPLOYING

DATAWAREHOUSE. USA: John Wiley & Sons.


92

KIMBALL, Ralph (2008). THE DATAWAREHOUSE LIFECYCLE TOOLKIT:


PRACTICAL

TECHNIQUES

FOR BUILDING DATA WAREHOUSE

AND

BUSINESS INTELLIGENCE SYSTEMS. USA: John Wiley & Sons.

STANLEY M. Davis & Meyer Christopher (2000). BLUR: THE SPEED OF


CHANGE IN THE CONNECTED ECONOMY Addison-Wesley

THOMSEN, Erick (2002). OLAP SOLUTIONS: BUILDING MULTIDIMENSIONAL


INFORMATION SYSTEM. Segunda edicin. USA: John Wiley & Sons.

Business Application Research Center (2008) The OLAP Report. Recuperado el


10 de junio de 2009, de http://www.olapreport.com/fasmi.htm

Business Process Improvement (2009) Consult. Recuperado el 19 de junio de


2009, de http://www.grupoconsult.com/tablero_de_control.html

Cavazos E. (2008) Gravitar Informacin sin Lmites. Recuperado el 20 de abril de


2009,

de

http://www.gravitar.biz/index.php/bi/el-costo-de-una-solucion-de-

business-intelligence-parte-1-de-2/

Carlos.

Dataprix.

Recuperado

el

16

de

mayo

de

2009,

de

http://www.dataprix.com/herramientas-para-la-implantaci%C3%B3n-de-unsistema-de-data-warehouse

93

Data.ti. (2008) Herramientas de Query/Reporting y Anlisis. Recuperado el 01 de


junio de 2009, de http://www.datati.es/herramientas-de-queryreporting-y-analisis/

HAHCIET. (2009). Revista de Telecomunicaciones. Recuperado el 15 de junio de


2009, de http://www.ahciet.net/actualidad/revista/r.aspx?ids=10796&ids2=21861

Implementando Cubos OLAP. Recuperado el 25 de mayo de 2009, de


http://download.microsoft.com/download/2/d/8/2d83e4ac-89e4-4319-a5c54185d8d264c9/Academia%20BI%20Unidad%205.doc

Jimnez Mariana (2008) Gravitar Informacin sin Lmites. Recuperado el 28 de


junio de 2009, de http://www.gravitar.biz/index.php/bi/pentaho-ejemplo-cubomondrian/

Martinez. O. A. Gestiopolis. Recuperado el 05 de junio de 2009, de


http://www.gestiopolis.com/canales8/ger/olap-online-analytic-processing.htm

Microsoft.(2007) Microsoft Ayuda y Soporte. Recuperado el 8 de junio de 2009, de


http://support.microsoft.com/kb/199132/es

Microsoft (2009). Microsoft TechNet. Recuperado el 05 de julio de 2009, de


http://technet.microsoft.com/es-mx/library/cc966399(en-us).aspx#EDAA

94

Msdn Microsoft Developer Network. Recuperado el 6 de junio de 2009, de


http://msdn.microsoft.com/es-es/library/ms174915.aspx

Msdn Microsoft Developer Network. Recuperado el 10 de junio de 2009, de


http://msdn.microsoft.com/es-es/library/ms174758.aspx

OlapX Software (2005) OlapX. Recuperado el 29 de junio de 2009, de


http://www.olapxsoftware.com/es/default.asp

Recuperado

el

06

de

junio

de

2009,

de

http://www.itson.mx/dii/jgaxiola/introduccion/eis.html

Prez S. (2006) Apoyo para la Toma de Decisiones. Recuperado el 15 de abril de


2009, de http://www.edutecne.utn.edu.ar/sistemas-informacion/Data%20MiningDataWarehouse.pdf

Portal Corporation Sybven.(2009). Corporation Sybven. Recuperado el 20 de abril


de

2009,

de

http://www.corporacionsybven.com/portal/index.php?option=com_content&view=ar
ticle&id=198:etl&catid=124:conceptos-teoricos

PriceWaterhouseCoppers.
Intelligence).

(2008).

Recuperado

el

La
12

Inteligencia
de

de
abril

Negocios
de

(Business

2009,

de

http://www.pwc.com/ve/spa/pdf/aseger_200810.pdf

95

Punsalan.D. (2007) Information Management. Recuperado el 15 de abril de 2009,


de

http://informationmanagement.wordpress.com/category/data-

warehousing/page/2/

Reall-Tech (2001). SQL MAX Connections. Recuperado el 14 de abril de 2009, de


http://www.sqlmax.com/dataw1.asp

Sistemas de Informacin para Ejecutivos, Inteligencia de Negocio y Cuadro de


Mando

Integral.

Recuperado

el

18

de

junio

de

2009,

de

http://isg.enmollina.com/EIS_BI_BSC.pdf

Vlamis Dan. Oracle Technology Network. Recuperado el 04 de julio de 2009, de


http://www.oracle.com/technology/global/lad-es/pub/articles/08jul/o38olap.html?_template=/ocom/print

Wolf C.G (2002). Modelamiento Multidimensional. Recuperado el 20 de abril de


2009, de http://www.inf.udec.cl/~revista/ediciones/edicion4/modmulti.PDF

96

NDICE DE FIGURAS

1.1 Niveles de uso de los datos ............................................................................ 10


1.2 Inteligencia de Negocios ................................................................................. 11
1.3 Conceptos que abarca la Inteligencia de Negocios ........................................ 12
2
2.1 Representacin del Rendimiento entre transacciones OLTP y OLAP ........... 23
2.2 Arquitectura de un Datawarehouse ................................................................. 26
2.3 Enterprise Datawarehouse.............................................................................. 29
2.4 Arquitectura Bus ............................................................................................. 31
2.5 Representacin de los elementos de la Arquitectura Bus ............................... 33
2.6 Ejemplo del esquema Estrella......................................................................... 42
2.7 Ejemplo del esquema Copo de Nieve ............................................................. 44
3 Capitulo 3
3.1 Representacin de un Cubo OLAP ................................................................. 63
3.2 Representacin de Niveles de Jerarqua ........................................................ 69
3.3 Representacin de las medida........................................................................ 69

97

NDICE DE TABLAS

2.1 Diferencias entre OLTP y OLAP..................................................................... 22


3.1 Diferencias entre MOLAP y ROLAP ............................................................... 69

98

ANEXO I

PRUEBA FASMI
Es utilizada para definir las caractersticas de las aplicaciones OLAP de manera
especfica y sencilla de recordar, debido a que las reglas de Codd son numerosas
y la prueba FASMI representa un resumen de ellas. El concepto fue utilizado por
primera vez en 1995 y aun continua vigente.
"FASMI"

que

se

refieren

cinco

palabras;

Fast

Analysis

of

Shared

Multidimensional Information (Anlisis rpido de informacin multidimensional


compartida), que adems, son en s mismas una definicin de lo que es el OLAP.
Fast. La primera regla de Codd se refiere a que el sistema debe ser capaz de
responder de una forma rpida y gil a la informacin que le sea solicitada por el
usuario, el cual no deber esperar ms de cinco segundos a la hora de resolver
peticiones sencillas y no ms de veinte segundos en las peticiones complejas. Las
herramientas debern, pues, proveer una amplia variedad de tcnicas para
cumplir esta regla, tales como almacenamiento especializado de los datos,
preclculos.
Analysis. Significa que el sistema debe poder reflejar cualquier lgica del negocio
para poder responder a las preguntas especficas y necesidades empresariales.
Por ejemplo, deber permitir generar clculos 'ad-hoc' sin necesidad de usar una
herramienta de programacin especfica. Esto no implica que forzosamente deba
proveer la herramienta un entorno para conseguirlo, sino que puede proveer la
integracin con productos externos, como una hoja de clculo.
Shared. El sistema deber proporcionar herramientas que garanticen la
confidencialidad de los datos, seguridad de acceso por perfiles de los usuarios,
etc. Representa un gran riesgo en los productos OLAP, lo cual constituye una gran
debilidad, por lo cual se debe prestar atencin en este aspecto.
Multidimensional. Este es el punto ms importante que podra definir como OLAP
en s mismo. El sistema debe proveer una vista conceptual multidimensional de los
100

datos adems de proporcionar soporte a cada una de las mltiples jerarquas que
puedan existir dentro de la organizacin.
Information. Se refiere a la totalidad de los datos obtenidos y de la informacin
necesaria para el anlisis. La cual nos permitir la toma de decisiones en nuestra
organizacin. Mide la capacidad de los productos en trminos de la cantidad de
datos de entrada que soporta. Para eso se toman en cuenta diversas
consideraciones como: duplicacin de datos, memoria RAM necesaria, espacio en
disco, rendimiento e integracin de los datos.

101

Das könnte Ihnen auch gefallen