Sie sind auf Seite 1von 2

TRABAJO DE INVESTIGACION DE TOPICOS AVANZADOS II

METODOLOGIAS SOBRE DATAWAREHOUSE

En casi todas las disciplinas, por no decir todas, existen diferentes enfoques
para abordar o para definir ciertos conceptos. Así podemos decir que para el
DWH también existen varios enfoques que abordan el concepto y uso de los
DWH de diferentes maneras.

Estos enfoques son los de Ralph Kimball y Bill Inmon quienes son las
personalidades mas importantes dentro del área del Data warehousing. A
continuación hablaremos de sus respectivos enfoques: MD
(Multidimensional Architecture) y CIF (Corporate Information Factory)

MD(Multidimensional Architecture)

La arquitectura MD fue desarrollada por el Dr. Ralph Kimball; está basada en


la premisa que todos los análisis Business Intelligence tiene su origen en
una estructura multidimensional. Quizá sea conveniente referirnos a la
definición que tiene Kimball de un data warehouse: una copia de las
transacciones de datos específicamente estructurada para la consulta y el
análisis.

Kimball acuñó la siguiente frase: “El Data Warehouse es la unión de todos


los Data Marts de una entidad”.

Podemos, entonces, entender de forma natural que la presente


metodología:

 Es ascendente (bottom-up).

 Está basado principalmente en uso de Data Marts independientes.

La arquitectura MD está separada en dos capas de procesos y servicios:

• Back Room: a groso modo la cocina de nuestro sistema. Se realizan


todos los procesos ETL para conseguir los datos de las fuentes de
origen (involucrando procesos de data quality, data staging u otros),
pero además también se consideran aquellos procesos ETL que
alimenta cada uno de los data marts independientes existentes en la
organización. Kimball distingue además dos tipos de data marts:

1. Atomic Data Marts: contienen la información al nivel de detalle


máximo.

2. Aggregated Data Marts: contienen la información


departamento, por áreas o funcional que puede estar alimentado
por los anteriores o directamente de la Staging Area.

• Front Room: consistente por las herramientas de análisis que usan


la información consolidada en los data marts de la back room. Es por
lo tanto claro, que para cada unidad de negocio se creará un data
mart (o varios) sin tener en cuenta las necesidades de otra unidad.
No prima la visión única del dato.

Al momento de implementarlo se tiene que considerar ciertos aspectos


como:

 El modelo dimensional se inicia con tablas:

• De hechos

• De dimensiones

 Los hechos contienen métricas

 Las dimensiones contienen atributos

• Puede contener grupos de datos repetidos

Das könnte Ihnen auch gefallen