Sie sind auf Seite 1von 10

INTRODUCCIÓN

Data Warehouse no es un término nuevo si no una vieja rutina con un nombre


nuevo. El almacenamiento de datos históricos y análisis de estos para tomar decisiones
futuras ya era practicado por los aztecas y mallas en su increíble calendario solar. Incluso
los egipcios atesoraban registros de las primaveras con amplios desbordamientos del
Nilo, que les permitía saber si el año sería de una buena cosecha o no.
El estudio de datos relacionados con la gestión empresarial, empezó cuando todavía
la computación no llegaba a dar respuesta a estos problemas. Los directivos estudiaban
enormes informes elaborados por comerciales y económicos compuestos de varias
páginas de datos escrupulosamente resumidos. El avance de la computación ha hecho el
trabajo un poco más fácil. El uso de aplicaciones OLTP (Online Transaction Proccesing)
ha traído consigo la recopilación muy rápida de datos que antes era casi imposible
obtener, aunque haciendo uso en muchos casos de múltiples sistemas que usan
SGBDR(Sistemas Gestores de Bases de Datos Relacionales) diferentes e incompatibles.
Esto hace difícil el correlacionar los datos obtenidos desde estos diversos sistemas
teniendo que volver al análisis impreso. Así esta nueva teoría viene a resolver un
problema viejo usando una nueva técnica: OLAP (Online Analitical Proccesing)
Procesamiento Anlítico En Línea.
Existen diversas variantes sobre esta teoría, que definen el futuro desarrollo de este
tipo de aplicaciones, pero una de las más aceptadas hasta ahora es el Modelo de Hechos
Dimensionales (DFM: Dimention Fact Model), que veremos a continuación para dar
comienzo a nuestro estudio.

DATA WAREHOUSE EN LA EMPRESA


INFORMATICA AVANZADA

CONCEPTO

Es un proceso, no un producto. Es una técnica para consolidar y administrar datos de


variadas fuentes con el propósito de responder preguntas de negocios y tomar decisiones,
de una forma que no era posible hasta ahora.

Consolidar datos desde una variedad de fuentes. Dentro del marco conceptual de Data
Warehousing los agruparemos dentro del proceso de Transformación de Datos.

Data warehouse es un sistema que se usa en las bases de datos de las compañías; las
compañías al almacenar grandes cantidades de información permite un fácil acceso a la
información ya que pude la transforma en grupos de información sobre temas específicos
de negocios, para permitir nuevas consultas, análisis, reportes y decisiones. Ralph
Zimball.

Definió la data warehouse como “una copia de las transacciones de datos específicamente
estructurada para la consulta y el análisis”.

Es un proceso, no un producto. Es una técnica para consolidar y administrar datos de


variadas fuentes con el propósito de responder preguntas de negocios y tomar decisiones,
de una forma que no era posible hasta ahora.

Consolidar datos desde una variedad de fuentes. Dentro del marco conceptual de Data
Warehousing los agruparemos dentro del proceso de Transformación de Datos.

Manejar grandes volúmenes de datos de una forma que no era posible, o no era costo
efectiva. A estos medios los agruparemos en Procesamiento y Administración de Datos.

Acceder a los datos de una forma más directa, en "el lenguaje del negocio", y analizarlos
para obtener relaciones complejas entre los mismos. Estos procesos se engloban en dos
categorías que serán explicadas más adelante: Acceso a los Datos y Descubrimiento o
Data Mining.

Estos desarrollos tecnológicos, correctamente organizados e interrelacionados,


constituyen lo que se ha dado en llamar un Data Warehouse o Bodega de Datos. Veamos
un poco más en detalle los grupos mencionados.

UPSJB 2
INFORMATICA AVANZADA

Existen muchas definiciones para el DW, la más conocida fue propuesta por
Inmon[MicroSt96] (considerado el padre de las Bases de Datos) en 1992: "Un DW es una
colección de datos orientados a temas, integrados, no-volátiles y variante en el tiempo,
organizados para soportar necesidades empresariales". En 1993, Susan
Osterfeldt[MicroSt96] publica una definición que sin duda acierta en la clave del DW:
"Yo considero al DW como algo que provee dos beneficios empresariales reales:
Integración y Acceso de datos. DW elimina una gran cantidad de datos inútiles y no
deseados, como también el procesamiento desde el ambiente operacional clásico".

OBJETIVOS

El acceso a ellos son caracterizado por el rápido desempeño. Estos requerimientos no


tienen fronteras y tampoco limites fijos. Cuando hablamos de entendible significa, que
los niveles de la información sean correctos y obvios. Y Navegables significa el reconocer
el destino en la pantalla y llegar a donde queramos con solo un clic. Rápido desempeño
significa, cero tiempo de espera. Todo lo demás es un compromiso y por consiguiente
algo que queremos mejorar.

 Hacer que la información de la organización sea consistente: la información de una


parte de la organización puede hacerse coincidir con la información de la otra parte de
la organización. Si dos medidas de la organización tienen el mismo nombre, entonces
deben significar la misma cosa. Y a la inversa, si dos medidas no significan la misma
cosa, entonces son etiquetados diferentes. Información consistente significa,
información de alta calidad. Significa que toda la información es contabilizada y
completada. Todo lo demás es un compromiso y por consiguiente algo que queremos
mejorar.
 Es información adaptable y elástica: el Data WareHouse esta diseñado para cambios
continuos. Cuando se le hacen nuevas preguntas al Data WareHouse, los datos
existentes y las tecnologías no cambian ni se corrompen. Cuando se agregan datos
nuevos al Data WareHouse, los datos existentes y las tecnologías tampoco cambian ni
se corrompen. El diseño de Data Marts separados que hacen al Data WareHouse,
deben ser distribuidos e incrementados. Todo lo demás es un compromiso y por
consiguiente algo que queremos mejorar.
 Es un seguro baluarte que protege los valores de la información: el Data WareHouse
no solamente controla el acceso efectivo a los datos, si no que da a los dueños de la

UPSJB 3
INFORMATICA AVANZADA

información gran visibilidad en el uso y abusos de los datos, aún después de haber
dejado el Data WareHouse. Todo lo demás es un compromiso y por consiguiente algo
que queremos mejorar.
 Es la fundación de la toma de decisiones: el Data WareHouse tiene los datos correctos
para soportar la toma de decisiones. Solo hay una salida verdadera del Data
WareHouse: las decisiones que son hechas después de que el Data WareHouse haya
presentado las evidencias. La original etiqueta que preside el Data WareHouse sigue
siendo la mejor descripción de lo que queremos construir: un sistema de soporte a las
decisiones.

CARACTERISTICAS
El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce
literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho más
que eso. Según definió el propio Bill Inmon, un datawarehouse se caracteriza por ser:

Integrado.-Los datos almacenados en el datawarehouse deben integrarse en una


estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas
operacionales deben ser eliminadas. La información suele estructurarse también en
distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios.

UPSJB 4
INFORMATICA AVANZADA

En la siguiente imagen podemos ver cómo se maneja la información en distintas


aplicaciones y lo que buscamos con la integración seria escoger de todas un estándar de
información para que uniformice los datos y se introduzcan al repositorio

Orientada hacia la información relevante en el tiempo.- sólo los datos necesarios para
el proceso de generación del conocimiento del negocio se integran desde el entorno
operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento
por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una única tabla del datawarehouse. De esta forma, las peticiones de
información sobre clientes serán más fáciles de responder dado que toda la información
reside en el mismo lugar.

En la siguiente imagen se muestra cómo se maneja un sistema de información orientada


a sus aplicaciones y otra temática una diferencia importante entre estas está en la
interrelación de la información. Los datos operacionales (aplicaciones) mantienen una

UPSJB 5
INFORMATICA AVANZADA

relación continua entre dos o más tablas basadas en una regla comercial. Las del data
warehouse miden espectros de tiempo y las relaciones encontradas en la data warehouse
(podremos indagar en toda la información pasada relacionada entre todas las
aplicaciones)

De tiempo variante.- el tiempo es parte implícita de la información contenida en un


datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la
actividad del negocio en el momento presente. Por el contrario, la información
almacenada en el datawarehouse sirve, entre otras cosas, para realizar análisis de
tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una
variable en el tiempo para permitir comparaciones.
Los datos históricos son de poco uso en el procedimiento operacional. La información del
depósito por el contrario, debe incluir los datos históricos para usarse en la identificación
y evaluación de tendencias.

UPSJB 6
INFORMATICA AVANZADA

No Volátil.- El almacén de información de un datawarehouse existe para ser leído, pero


no modificado. La información es por tanto permanente, significando la actualización del
datawarehouse la incorporación de los últimos valores que tomaron las distintas variables
contenidas en él sin ningún tipo de acción sobre lo que ya existía.

Como se puede observar en la imagen en la base de datos operacional la actualización


(actualizar, borrar y modificar) se hace regularmente, mientras en el data warehouse sea
una sola actualización esto hace que cuando tengamos que tomar una decisión con esta
información tengamos seguridad de esta.

CICLO DE DESARROLLO

UPSJB 7
INFORMATICA AVANZADA

ARQUITECTURA DEL DATA WAREHOUSE

Está compuesta por:

Fuentes de datos

Motor de data Warehouse

 Gestor de carga
 Matadatos
 Agregaciones
 Gestor de Data Warehuse
 Gestor de respaldo
 Dw repositorio

Herramientas de Acceso

UPSJB 8
INFORMATICA AVANZADA

VENTAJAS E INCONVENIENTES DEL DATA WAREHOUSE

VENTAJAS INCOVENIENTES

Menos carga de trabajo Muy costos y l mantenimiento

Facilita la estrategia de la empresa Prvacidad de los datos

Rentabiliza su inversion Recuperacion ante fallos de carga

Mejora la prodcutividad y Optimizacion de los recursos


competitividad en el mercado

UPSJB 9
INFORMATICA AVANZADA

CONCLUSIONES

 INFORMACIÓN ACCESIBLE
 INFORMACIÓN CONSISTENTE
 INFORMACIÓN ADAPTABLE Y ELÁSTICA
 PROTEGE LOS VALORES DE LA INFORMACIÓN
 ES LA FUNDACIÓN DE LA TOMA DE DECISIONES

BIBLIOGRAFIA

Laudon Keneth C., Laudon Jane P. , Sistemas de Información Gerencial (8ª ed.)

México, Pearson Educación, (2004)

http://www.dwinfocenter.org/casefor.html

http://datawarehouse.ittoolbox.com/

Ralph Kimball, Laua Reeves, Margy Ross, Warren ....The Data WareHouse Lifecycle
Toolkit

Wiley Edition

1
UPSJB
0

Das könnte Ihnen auch gefallen