Sie sind auf Seite 1von 10

Introduccin

En la actualidad, las tecnologas de la informacin han automatizado los procesos de carcter tpicamente
repetitivo o administrativo, haciendo uso de lo que se denomina sistemas de informacin operacionales.
Dichos sistemas resuelven las necesidades de funcionamiento de la empresa, donde sus principales
caractersticas son la actualizacin y el tiempo de respuesta.
Las necesidades informacionales (necesidades de funcionamiento de la empresa, son aquellas que tienen
por o!"eto o!tener la informacin necesaria, que sirva de !ase para la toma de decisiones tanto
a escala estrat#gica como tctica. Estas necesidades se !asan en gran medida en el anlisis de un n$mero
ingente de datos, en el que es tan importante el o!tener un valor muy detallado de negocio como el valor
totalizado para el mismo. %s tam!i#n, es fundamental la visin histrica de todas lasvaria!les analizadas, y
el anlisis de los datos del entorno.
&ualquier actividad que realiza la empresa est refle"ada de forma minuciosa en sus !ases de datos, por lo
tanto, esto puede derivarnos en diferentes pro!lemas de tipo informacional. En primer lugar, al realizar
consultas masivas de informacin, se puede ver per"udicado el nivel de servicio del resto de sistemas, dado
que las consultas de las que estamos ha!lando, suelen ser !astante costosas en recursos. Dichas
necesidades se ven insatisfechas por la limitada fle'i!ilidad a la hora de navegar por la informacin y a su
inconsistencia de!ido a la falta de una visin glo!al En esta situacin, el siguiente paso evolutivo ha venido
siendo la generacin de un entorno gemelo del operativo, que se ha denominado com$nmente &entro de
(nformacin,
En el &entro de (nformacin, la informacin se refresca con menor periodicidad que en los entornos
operacionales y los requerimientos en el nivel de servicio al usuario son ms fle'i!les. &on esta estrategia se
resuelve el pro!lema de la planificacin de recursos, ya que las aplicaciones que precisan un nivel de
servicio alto usan el entorno operacional y las que precisan consultas masivas de informacin tra!a"an en el
&entro de (nformacin. La informacin mantiene la misma estructuraque en las aplicaciones operacionales
por lo que este tipo de consultas de!e acceder a multitud de lugares para o!tener el con"unto de datos
deseado. El tiempo de respuesta a las solicitudes de informacin es e'cesivamente elevado.
Definicin de Data Warehouse
%lgunas definiciones de Data )arehouse.
*n almac#n de datos (Data )arehouse es una coleccin de datos orientada a un determinado m!ito
(empresa, organizacin, etc., integrado, no voltil y varia!le en el tiempo, que ayuda a la toma de
decisiones en la entidad en la que se utiliza. Es una estructura de datos donde la informacin contenida
esta dise+ada para favorecer el anlisis y la divulgacin eficiente de datos. Los almacenes de
datos contienen a menudo grandes cantidades de informacin que se su!dividen a veces en unidades
lgicas ms peque+as dependiendo del su!sistema de la entidad del que procedan o para el que sean
necesario. Dichas unidades se denominan Data ,arts.
*n Data )arehouse es una -ase de Datos que contiene.
Datos empresariales
(ntegrar coleccin de datos histricos
Datos. dirigidos al usuario, consolidados y consistentes
Datos estructurados para distri!ucin y consultas
*n Data )arehouse es un repositorio de datos de muy fcil acceso, alimentado de numerosas fuentes,
transformadas en grupos de informacin so!re temas especficos de negocios, para permitir nuevas
consultas, anlisis, reportes y decisiones.
E'isten dos grandes autores con respecto al tema Data )arehouse. -ill (nmon y /alph 0im!all.
-ill (nmon. 1El Data )arehouse es una coleccin de datos orientados al tema, integrados, no voltiles e
historiados, organizados para el apoyo de un proceso de ayuda a la decisin1
/alph 0im!all. 1El Data )arehouse es una copia de las transacciones de datos especficamente
estructurada para la consulta y el anlisis2 es la unin de todos los Data ,arts de una entidad1.
Arquitectura de un Data Warehouse
La arquitectura de un Data )arehouse se la utiliza para representar cual es la estructura final de los datos,
la forma en que se comunican esos datos, su procesamiento y presentacin. La misma esta constituida por
diferentes partes que se encuentran interconectadas, las cuales son.
-ase de datos operacional 3 4ivel de !ase de datos e'terno. los sistemas operacionales procesan datos
para apoyar las necesidades operacionales crticas. 5ara hacer eso, se han creado las !ases de datos
operacionales histricas que proveen una estructura de procesamiento eficiente, para un numero
relativamente peque+o de transacciones comerciales !ien definidas.
% causa del enfoque limitado de los sistemas operacionales, las !ases de datos dise+adas para soportar
estos sistemas, tienen dificultad para acceder a los datos para otra gestin o propsitos informticos.
&iertamente, la meta del Data )arehousing, es li!erar la informacin que es almacenada en !ases de datos
operacionales y com!inarla con la informacin desde otra fuente de datos, generalmente e'terna.
4ivel de acceso a la informacin. El nivel de acceso a la informacin de la arquitectura Data
)arehouse, es el nivel del que el usuario final se encarga directamente. En particular, representa
las herramientas que el usuario final normalmente usa da a da. %ctualmente, e'isten herramientas ms
y ms sofisticadas para manipular, analizar y presentar los datos, sin em!argo, hay pro!lemas
significativos al tratar de convertir los datos tal como han sido recolectados y que se encuentran
contenidos en los sistemas operacionales en informacin fcil y transparente para las herramientas de
los usuarios finales.
*na de las claves para esto es encontrar un lengua"e de datos com$n que puede usarse a trav#s de toda la
empresa
4ivel de acceso a los datos. El nivel de acceso a los datos de la arquitectura Data )arehouse est
involucrado con el nivel de acceso a la informacin para relacionarse con el nivel operacional. El nivel de
acceso a los datos no solamente conecta D-,61s diferentes y sistemas de archivos so!re el
mismo hard7are, sino tam!i#n a los fa!ricantes y protocolos de red.
*na de las claves de una estrategia Data )arehousing es proveer a los usuarios finales con 1acceso a datos
universales1, significa que, por lo menos, los usuarios finales sin tener en cuenta la herramienta de acceso a
la informacin o u!icacin, de!eran ser capaces de acceder a cualquier o todos los datos en la empresa que
es necesaria para ellos, para hacer su tra!a"o. El nivel de acceso a los datos es responsa!le de la interfaz
entre las herramientas de acceso a la informacin y las !ases de datos operacionales. En algunos casos, esto
es todo lo que un usuario final necesita.
4ivel de directorio de datos (,etadata. % fin de proveer el acceso a los datos universales, es
a!solutamente necesario mantener alguna forma de directorio de datos o repositorio de la informacin
,etadata. La ,etadata es la informacin alrededor de los datos dentro de la empresa.
% fin de tener un depsito totalmente funcional, es necesario tener una variedad de ,etadata disponi!les,
informacin so!re las vistas de datos de los usuarios finales e informacin so!re las !ases de datos
operacionales. (dealmente, los usuarios finales de!eran de acceder a los datos desde el Data )arehouse o
desde las !ases de datos operacionales, sin tener que conocer dnde residen los datos o la forma en que se
han almacenados.
4ivel de gestin de proceso. El nivel de gestin de procesos tiene que ver con la programacin de
diversas tareas que de!en realizarse para construir y mantener el Data )arehouse y la informacin del
directorio de datos.
Este nivel puede depender del alto nivel de control de tra!a"o para muchos procesos (procedimientos que
de!en ocurrir para mantener el Data )arehouse actualizado.
4ivel de mensa"e de la aplicacin. El nivel de mensa"e de la aplicacin tiene que ver con
el transporte de informacin alrededor de la red de la empresa. El mensa"e de aplicacin se refiere
tam!i#n como 1su!producto1, pero puede involucrar slo protocolos de red.
4ivel de D). En el Data )arehouse (n$cleo es donde ocurre la data actual, usada principalmente para
usos estrat#gicos. 6e puede pensar del Data )arehouse simplemente como una vista lgica o virtual de
datos.
En un Data )arehouse fsico (copias, en algunos casos, muchas copias de datos operacionales y3o
e'ternos, son almacenadas realmente en una forma que es fcil de acceder y es altamente fle'i!le.
4ivel de organizacin de datos. El componente final de la arquitectura Data )arehouse es la
organizacin de los datos. 8am!i#n denominada gestin de copia o r#plica, incluye todos los procesos
necesarios como seleccionar, editar, resumir, com!inar y cargar datos en el depsito y acceder a la
informacin desde !ases de datos operacionales y3o e'ternas.
La organizacin de datos involucra con frecuencia una programacin comple"a, donde se estn creando las
herramientas Data )arehousing para ayudar en este proceso.
Objetivos de un Data Warehouse
Los o!"etivos fundamentales de un Data )arehouse son.
9acer que la informacin de la organizacin sea accesi!le, donde los contenidos del Data )arehouse
son entendi!les (informacin correcta y o!via y navega!les (reconocer el destino en la pantalla, y el
acceso a e ellos son caracterizados por el rpido desempe+o (cero tiempo de espera. Estos
requerimientos no tiene fronteras y tampoco limites fi"os.
9acer que la informacin de la organizacin sea consistente. La informacin de una parte de la
organizacin puede hacerse coincidir con la informacin de la otra parte de la organizacin.
5roporcionar informacin adapta!le y elstica. El Data )arehouse esta dise+ado para cam!ios
continuos. %l realizarse nuevas preguntas o agregar datos nuevos so!re el Data )arehouse, los datos
e'istentes y las tecnologas no cam!ian ni se corrompen.
Es un seguro !aluarte que protege los valores de la informacin. El Data )arehouse controla el acceso
efectivo a los datos, como as tam!i#n da a los 1due+os1 de la informacin gran visi!ilidad en el uso y
a!usos de los datos.
Es la fundacin de la toma de decisiones. El Data )arehouse tiene los datos correctos para soportar la
toma de decisiones.
Elementos y Procesos bsicos de un Data Warehouse
Los elementos !sicos de un Data )arehouse son los siguientes.
Sistema uente! 6on los sistemas operacionales (Legacy 6ystem de registros que tienen
como funcin capturar las transacciones del negocio.
"rea de trfico de datos! Es un rea de almacenamiento y grupo de procesos, que limpian,
transforman, com!inan, guardan, archivan, etc., los datos fuentes para ser usados en el Data
)arehouse.
Servidor de #resentacin! Es la maquina fsica donde los datos del Data )arehouse son
organizados y almacenados por consultas realizada por los usuarios finales, reportes y otra aplicaciones.
$odelo dimensional! Es una disciplina especfica para el modelado de datos que es una alternativa
para los modelos de entidad:relacin (DE/.
Procesos de ne%ocios! Es un coherente grupo de actividades de negocio que le dan sentido a los
usuarios del negocio del Data )arehouse.
Data $art! Es un su!grupo lgico del Data )arehouse.
Data Warehouse! Es la unin de todos los Data ,arts que la constituyen.
Almacenamiento o#eracional de datos! Es el punto de integracin por los sistemas
operacionales. Es el acceso al soporte de decisiones de los e"ecutivos deuna empresa.
O&AP! Es un estilo dimensional especfico de !$squedas y presentacin de informacin, que es
e"emplificado por vendedores de ;L%5.
'O&AP! Es un grupo de interfaces de usuarios y aplicaciones que le dan a la !ase de datos relacional
un estilo dimensional.
$O&AP! Es un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnologa de !ases de
datos que tienen un fuerte estilo dimensional.
A#licaciones #ara usuarios finales! Es una coleccin de herramientas que hacen las consultas, las
analizan y luego presentan la informacin necesaria y o!"etiva para el soporte de las necesidades de
negocio.
(erramientas de acceso a datos #or usuarios finales! 6on los 1clientes1 del Data )arehouse
$odelado de a#licaciones! Es un sofisticado tipo de cliente de Data )arehouse con capacidades
analticas que transforma o difiere las salidas del Data )arehouse
$eta Data! Es toda la informacin en el 1am!iente1 del Data )arehouse. 4o son los datos actuales.
Procesos )sicos del Data Warehouse *E+&,
Los procesos !sicos del Data )arehouse son.
E-traccin. es el primer paso de o!tener informacin hacia el am!iente del Data )arehouse.
&onsiste en e'traer los datos desde los sistemas de origen. &adasistema separado puede usar una
organizacin diferente de los datos o formatos distintos. La e'traccin convierte los datos a un formato
preparado para iniciar el proceso de transformacin.
*n parte intrnseca del proceso de e'traccin es la de analizar los datos e'trados, se realiza un chequeo, el
cual verifica si los datos cumplen la pauta o estructura que se espera!a. 6i no es as son rechazados.
+ransformacin. luego de que la informacin fue e'trada, se pueden realizar diferentes pasos de
transformacin, como ser. limpieza de la informacin, !otar a la !asura lo que consideramos
innecesario, seleccionar campos especficos que consideremos necesarios para el Data )arehouse,
realizar com!inaciones fuentes de datos, etc.
/ar%a. al final del proceso de transformacin, los datos estn en forma para ser cargados.
Dependiendo de los requerimientos de la organizacin, este proceso puede a!arcar una amplia variedad
de acciones diferentes.
Las formas mas !sicas para desarrollar el proceso de carga son dos.
%cumulacin simple. consiste en realiza un resumen de todas las transacciones comprendida en el
periodo de tiempo seleccionado y transportar el resultado como una $nica transaccin hacia el Data
)arehouse para su almacenamiento.
/olling. almacena informacin resumida a distintos niveles, correspondientes a distintas agrupaciones
de la unidad de tiempo o diferentes niveles "errquicos. (&asos de varios niveles de granularidad
$etodolo%0a de 'al#h 1imball
La metodologa de 0im!all, llamada ,odelo Dimensional (Dimensional ,odeling, se !asa en lo que se
denomina &iclo de <ida Dimensional del 4egocio (-usiness Dimensional Lifecycle. Esta metodologa es
considerada una de las t#cnicas favoritas a la hora de construir un Data )arehouse.
En el ,odelo Dimensional se constituyen modelos de ta!las y relaciones con el propsito de optimizar la
toma de decisiones, con !ase en las consultas hechas en una !ase de datos relacional que estn ligadas con
la medicin o un con"unto de mediciones de los resultados de los procesos de negocio.
El ,odelo Dimensional es una t#cnica de dise+o lgico que tiene como o!"etivo presentar los datos dentro
de un marco de tra!a"o estndar e intuitivo, para permitir su acceso con un alto rendimiento. &ada ,odelo
Dimensional esta compuesta por una ta!la con una llave com!inada, llamada ta!la de hechos, y con un
con"unto de ta!las ms peque+as llamadas ta!las de dimensiones. Los elementos de estas ta!las se pueden
definir de la siguiente manera.
(echos. es una coleccin de piezas de datos y datos de conte'to. &adah hecho representa una parte
del negocio, una transaccin o un evento.
Dimensiones. es una coleccin de miem!ros, unidades o individuos del mismo tipo.
$edidas. son atri!utos num#ricos de un hecho que representan el comportamiento del negocio
relativo a una dimensin.
&ada punto de entrada a la ta!la de hechos esta conectado esta conectado a una dimensin, lo que permite
determinar el conte'to de los hechos.
*na !ase de datos dimensional se puede conce!ir como un cu!o de tres o cuatro dimensiones (;L%5, en el
que los usuarios pueden acceder a un porcin de la !ase de datos a lo largo de cualquiera de sus
dimensiones.
Dado que es muy com$n representar a un modelo dimensional como un ta!la de hechos rodeada por las
ta!las de dimensiones, frecuentemente se le denomina tam!i#n modelo estrella o esquema de estrella:
unin
;tra variante es la que se conoce como sno7fla=e o copo de nieve, en donde se presentan ramificaciones a
partir de las ta!las de dimensiones y no solo a partir de la ta!la de hechos.
/iclo de 2ida Dimensional del 3e%ocio
La metodologa propuesta por 0im!all, esta compuesta por las siguientes fases.
Planificacin del Proyecto. !usca identificar la definicin y el alcance que tiene el proyecto de
D)9. Esta etapa se concentra so!re la definicin del proyecto, donde, a nivel de planificacin, se
esta!lece la identidad del mismo, el personal, desarrollo del plan de proyecto, el seguimiento y la
monitorizacin.
Definicin de los 'equerimientos del 3e%ocio. es un factor determinante en el #'ito de un
proceso de D)9. Los dise+adores de los Data )arehouse de!en tener en claro cuales son los factores
claves que guan el negocio para determinar efectivamente los requerimientos y traducirlos en
consideraciones de dise+o apropiadas.
$odelado Dimensional. se comienza con una matriz donde se determina la dimensionalidad de
cada indicador para luego especificar los diferentes grados de detalle dentro de cada concepto del
negocio.
Dise4o 0sico. se centra en la seleccin de las estructuras necesarias para soportar el dise+o lgico.
*n elemento principal de este proceso es la definicin de estndares del entorno de la !ase de datos. La
inde'acin y las estrategias de particionamiento se determinan en esta etapa.
Dise4o y Desarrollo de la #resentacin de datos. tiene como principales actividades la
e'traccin, transformacin y carga (E8L. Estas actividades son altamente crticas ya que tienen que ver
con la materia prima del Data )arehouse que son los datos.
Dise4o de la arquitectura t5cnica. en esta fase se de!en tener en cuenta tres factores. los
requerimientos de negocio, los actuales entornos t#cnicos, y las directrices t#cnicas y estrat#gicas futuras
planificadas por la compa+a, lo que permitir esta!lecer el dise+o de la arquitectura t#cnica del entorno
del Data )arehouse.
El proceso de dise+o de la arquitectura t#cnica esta compuesto de > pasos.
?. Esta!lecer un grupo de tra!a"o de arquitectura
@. /equisitos relacionados con la arquitectura
A. Documento de requisitos arquitectnicos
B. Desarrollo de un modelo arquitectnico de alto nivel
C. Dise+o y especificacin de los su!sistemas
D. Determinar las fases de aplicacin de la arquitectura
E. Documento de la arquitectura t#cnica
>. /evisar y finalizar la arquitectura t#cnica
Seleccin de #roductos e instalacin. se evalua y selecciona cuales son los componentes
necesarios especficos de la arquitectura (plataforma de hard7are,motor de la -D, herramienta de E8L,
etc.
Luego de realizar la instalacin de los componentes previamente evualados y seleccionados, se recomienda
una serie de premisas.
&omprender el proceso de compras corporativas
Ela!orar una matriz de evaluacin del producto
/ealizar la investigacin de mercados
Filtrar opciones y realizar evaluaciones mas detalladas
,ane"o de un prototipo
6eleccin del producto, instalacin y negociacin
Es#ecificacin de A#licaciones #ara usuario finales. se identifican los roles o perfiles de
usuarios para los diferentes tipos de aplicaciones necesarias en !ase al alcance de los perfiles detectados.
Desarrollo de a#licaciones #ara usuario finales. involucra configuraciones de los metadatos
y construccin de reportes especficos.
Im#lementacin. representa el correcto funcionamiento de la tecnologa, los datos y las aplicaciones
de usuarios finales accesi!les para el usuario del negocio.
$antenimiento y crecimiento. se !asa en la necesidad de continuar con las actualizaciones de
forma constante para as lograr la evolucin de las metas por conseguir.
6estin del #royecto. asegura que todas las actividades del ciclo de vida se lleven a ca!o de manera
sincronizada.
(erramienta S7& SE'2E' 899:
6GL 6erver @HHC es un sistema para la gestin de !ases de datos producida por ,icrosoft !asado en el
modelo relacional. ,icrosoft 6GL 6erver @HHC es una completa inteligencia de negocios que ofrece las
caractersticas, herramientas y funcionalidades para crear tipos clsicos e innovadores de aplicaciones
analticas.
Las herramientas ms utilizadas para el desarrollo y administracin de 6GL 6erver @HHC son.
)ase de datos relacional. *n motor de !ase de datos relacional ms seguro, confia!le, escala!le y
altamente disponi!le con el me"or rendimiento y compati!le para datos estructurados y sin estructura
(I,L.
Servicios de re#lica. /eplica de datos para aplicaciones de procesamiento de datos distri!uidas o
mviles, alta disponi!ilidad de los sistemas, concurrencia escala!le con almacenes de datos secundarios
para soluciones de informacin empresarial e integracin con sistemas heterog#neos, incluidas las !ases
de datos;racle e'istentes.
3otification Services. &apacidades avanzadas de notificacin para el desarrollo y el despliegue de
aplicaciones escala!les que pueden entregar actualizaciones de informacin personalizadas y oportunas
a una diversidad de dispositivos conectados y mviles.
Inte%ration Services. &apacidades de e'traccin, transformacin y carga (EL8 de datos para
almacenamiento e integracin de datos en toda la empresa.
Analysis Services. &apacidades de procesamiento analtico en lnea (;L%5 para el anlisis rpido y
sofisticado de con"unto de datos grandes y comple"os, utilizando almacenamiento multidimensional.
'e#ortin% Services. *na solucin glo!al para crear, administrar y proporcionar
tanto informes tradicionales orientados al papel como informes interactivos !asados en la )e!.
(erramientas de administracin. incluye herramientas integradas de administracin para
administracin y optimizacin avanzadas de !ases de datos, as como tam!i#n integracin directa con
otras herramientas. Los protocolos de acceso de datos estndar reducen drsticamente el tiempo
que demanda integrar los datos en 6GL 6erver con los sistemas e'istentes. %simismo, el soporte de
servicio )e! nativo est incorporado en 6GL 6erver para garantizar la interopera!ilidad con otras
aplicaciones y plataformas.
(erramientas de desarrollo. 6GL 6erver ofrece herramientas integrada de desarrollo para el
motor de !ase de datos, e'traccin, transformacin y carga de datos, minera de datos, ;L%5 e informes
que estn directamente integrados con ,icrosoft <isual 6tudio para ofrecer capacidades de desarrollo
de aplicacin de e'tremo a e'tremo. &ada su!sistema principal en 6GL 6erver se entrega con su propio
modelo de o!"eto y con"unto de interfaces del programa de aplicacin (%5( para ampliar el sistema de
datos en cualquier direccin que sea especifica de su negocio.
/onclusin
La metodologa 0im!all conduce a una solucin completa en una cantidad de tiempo relativamente
peque+a. %dems, de!ido a la gran cantidad de documentacinque se puede encontrar y a los numerosos
e"emplos aportados en diferentes entornos, permite encontrar una respuesta a casi todas las preguntas que
puedan surgir, so!re todo cuando no se dispone de la e'periencia previa necesaria.
5or otro lado, este tipo de metodologa !ottom:up permite que, partiendo de cero, podamos empezar a
o!tener informacin $til en cuestin de das y despu#s de los prototipos iniciales, comenzar el ciclo de vida
normal que nos ofrezca una solucin completa de -(.
Los Data ,arts resultantes son fcilmente consulta!les tanto para los desarrolladores como para los
usuarios finales. La relacin directa entre los hechos y dimensiones conceden a cualquier usuario la
posi!ilidad de construir consultas muy sencillas, la mayora de las veces sin tener a mano la documentacin
de los metadatos.
La metodologa de 0im!all es ideal para los primeros pasos de implantacin de -( a un cliente, cuando la
comple"idad de almacenamiento de datos no es demasiado grande y donde la infraestructura del -( se
encarga de los datos procedentes de un n$mero limitado de fuentes. 6in em!argo, cuando el almac#n de
datos adquiere comple"idad, entonces es peligroso forzar el desarrollo de esta metodologa. En el mundo del
-(, cuando las cosas adquieren gran comple"idad, es el momento de introducir nuevos enfoques al
pro!lema, como el propuesto por (nmon.
)iblio%raf0a
-i!liografa utilizada para realizar la monografa
/. 0im!all. 8he Data )arehouse 8ool=it. Ed. John )iley, ?KKD.
/. 0im!all. 8he Data )arehouse Lifecycle 8ool=it. Ed. John )iley, ?KK>
http.33777.microsoft.com
http.33777.7i=ipedia.com

Das könnte Ihnen auch gefallen