Sie sind auf Seite 1von 100

DISEO DE UN ALMACN DE

DATOS(KIMBALL)
Date

1Qtr

2Qtr

3Qtr

4Qtr

sum
U.S.A
Canada
Mexico
sum

Dr. Abraham Jorge Jimnez Alfaro

Country

TV
PC
VCR
sum

Caso de Estudio (Order Management)


Northwind Traders es una empresa que se dedica a la venta de
diversos productos. Incluye tablas para clientes, proveedores,
facturas, lneas de factura y regiones comerciales.
El sistema OLTP de Northwind consta de varias plantillas que
permiten la captacin de informacin:
1.- Plantilla Catalog de Northwind. Los clientes utilizan esta plantilla
de para explorar las diferentes ofertas de productos de Northwind
Company. La plantilla recupera informacin de los productos de la
base de datos Northwind de SQL Server. Con esta plantilla, los
clientes pueden comprar varios productos, ver y actualizar sus
pedidos y completar los pedidos con la informacin de envo. La
Plantilla retiene la informacin del pedido entre un uso y otro para
permitir al cliente utilizar el catlogo.

Dr. Abraham Jorge Jimnez Alfaro

(Order Management)
2.-Una vez que los clientes completan sus pedidos, hacen clic en el
Md l Checkout,
Mdulo
Ch k t que enva
ell pedido
did all servicio
i i almacenado
l
d d
de
Northwind. El servicio agrega la informacin del pedido Northwind y
devuelve un identificador de pedido.
3.- Mdulo Order Rollup de Northwind. Esta Plantilla proporciona una
vista consolidada de todos los pedidos nuevos que se envan a travs
del catlogo y el servicio de almacenado Northwind. Los usuarios
pueden efectuar el seguimiento del historial de pedidos de la
compaa para ver qu productos se compran, quin los est
comprando, con qu frecuencia y cunto se compra.

Dr. Abraham Jorge Jimnez Alfaro

(Order Management)
4.- Los usuarios pueden ver una lista de todos los pedidos que se han
enviado
i d all servicio
i i d
de almacenamiento
l
i t N
Northwind
th i d d
desde
d una IInterfaz.
t f
Esta Interfaz lee los datos activando el Moldulo Order Rollup de
Northwind. Los usuarios pueden seleccionar un pedido y hacer clic en
el bot
e
botn C
Create
eate Invoice
o ce pa
para
a esc
escribir
b los
os datos de ese ped
pedido
do e
en u
un
nuevo documento creado desde el modulo de facturas de Northwind.
Tambin pueden ver las facturas que ya han sido creadas haciendo
clic en View Invoice.
5.-El Mdulo Invoice de Northwind. Los empleados de Northwind
Company utilizan este mdulo para crear facturas para los clientes.
Cuando un empleado
p
abre la p
plantilla, se crea la factura con los datos
de los clientes. Si no hay datos en la cach de datos, se muestra un
formulario Windows Forms y el usuario puede seleccionar para qu
cliente y qu pedido se crea la factura.

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos


P
Pasos
en ell di
diseo
d
dell almacn
l
d
de d
datos:
t

Paso 1. Elegir un proceso de la organizacin para


modelar.
Paso 2. Decidir el grnulo (nivel de detalle) de
representacin
p
del p
proceso.
Paso 3. Identificar las dimensiones que
caracterizan el proceso.
Paso 4. Decidir la informacin a almacenar sobre el
proceso.

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos


Paso 1. Elegir un proceso de la organizacin para modelar.

Proceso: actividad de la organizacin soportada por un


OLTP del cual se puede extraer informacin con el
propsito
p
p
de construir el almacn de datos.
Pedidos (de clientes)
Compras (a Proveedores)
Ventas

A ti id d Ventas.
Actividad:
Ventas

La actividad a modelar son las ventas de productos en las


ordenes asociadas a los clientes.
Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos


Paso 2. Decidir el grnulo (nivel de detalle) de representacin.

Grnulo: es el nivel de detalle al que se desea almacenar


informacin sobre la actividad a modelar.
9 El grnulo define el nivel atmico de datos en el almacn
de datos.
9 El grnulo determina el significado de las tuplas de la tabla
de hechos.
ec os
9 El grnulo determina las dimensiones bsicas del esquema
transaccin en el OLTP
informacin diaria
informacin semanal
informacin
i f
i mensual.
l ....
Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos


Ejemplo: Ordenes de Northwind .

Grnulo:
Grn
lo se desea almacenar informacin sobre las ventas
entas
diarias de cada producto asociadas a los clientes, el empleado
que realiza la venta, as como la forma de envi del producto.
Grnulo:
9define el significado de las tuplas de la tabla de hechos.
9d t
9determina
i llas di
dimensiones
i
b
bsicas
i
d
dell esquema.
producto
da
Clientes
Empleado
Envio
Ventas
Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos

tabla
Dimensin 1

tabla de
hechos
id_dim1

tabla
Dimensin 3

id_dim2
id_dim3
tabla
Dimensin 2

...
id_dim n
....
(hechos)

Dr. Abraham Jorge Jimnez Alfaro

tabla
Dimensin n

Diseo de un Almacn de Datos

tabla de
hechos

Sales_Fact
TimeKey
CustomerKey
ShipperKey
ProductKey

la clave primaria* est


formada por los
identificadores de las
dimensiones bsicas.

EmployeeKey
RequiredDate
LineItemFreight
LineItemTotal
LineItemQuantity
LineItemDiscount

Dr. Abraham Jorge Jimnez Alfaro

datos (medidas) sobre las


ventas diarias de un
producto en un almacn.

Modelo
Multidimensional

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos


Paso 3. Identificar las dimensiones q
que caracterizan el p
proceso.

9 Dimensiones: dimensiones que caracterizan la actividad al


nivel de detalle (grnulo) que se ha elegido.
Ti
Tiempo

(di
(dimensin
i ttemporal:
l cundo
d se produce
d
lla actividad?)
ti id d?)

Producto (dimensin cul es el objeto de la actividad?)


Envio(Embarque) (dimensin geogrfica: Por qu medio se envia en
l actividad?)
la
ti id d?)
Cliente

(dimensin quin es el destinatario de la actividad?)

Empleado (dimensin quin realiza la venta y en donde se


realiza (regin) de la actividad?)

9 Entre los atributos de una dimensin existen jerarquas


naturales q
que deben ser identificadas ((da-mes-ao))
Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos (Tiempo)


tabla
bl
Dimensin
de Tiempo

Time_Dim
TimeKey
TheDate
DayOfWeek
Month
Year
Quarter
DayOfYear
Holiday
Weekend
YearMonth
h
WeekOfYear

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos (Tiempo)


Dimensin Tiempo:
p
9 dimensin presente en todo AD porque el AD contiene
informacin histrica sobre la organizacin.
9 aunque el lenguaje SQL ofrece funciones de tipo DATE, una
dimensin Tiempo permite representar otros atributos
temporales no calculables en SQL.
9 se puede calcular de antemano
9 atributos frecuentes:
nro.
nro de da
da, nro
nro. de semana
semana, nro
nro. de ao: valores absolutos del
calendario juliano que permiten hacer ciertos clculos aritmticos.
da de la semana (lunes, martes, mircoles,...): permite hacer
anlisis sobre das de la semana concretos (ej. ventas en sbado,
ventas en lunes,..).
Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos (Tiempo)


Dimensin Tiempo:
9 atributos frecuentes:
- da del mes (1..31): permite hacer comparaciones
sobre el mismo da en meses distintos (ventas el 1 de
mes).
- marca de fin de mes, marca de fin de semana :
permite hacer comparaciones sobre el ltimo da del
mes o das de fin de semana en distintos meses.

Time_Dim
TimeKey
TheDate
DayOfWeek
y
Month
Year

- trimestre del ao (1..4): permite hacer anlisis sobre


un trimestre concreto en distintos aos.

Quarter

- marca de da festivo: permite hacer anlisis sobre los


das contiguos a un da festivo.

Holiday

- estacin (primavera, verano..)


- evento especial:
p
p
permite marcar das de eventos
especiales (final de futbol, elecciones...)
9 jerarqua natural:
da - mes - trimestre -ao

Dr. Abraham Jorge Jimnez Alfaro

DayOfYear
Weekend
YearMonth
WeekOfYear

Diseo de un Almacn de Datos (Producto)


tabla
bl
Dimensin
de Producto

Product_Dim
ProductKey
ProductID
ProductName
SupplierName
C t
CategoryName
N
ListUnitPrice

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos((Producto)


Dimensin Producto:
9

la dimensin Producto se define a partir del


fichero maestro de productos del sistema
OLTP.

Product_Dim

las actualizaciones del fichero maestro de


productos deben reflejarse en la dimensin
Producto (cmo?).

ProductID

la dimensin Producto debe contener el


mayor nmero posible de atributos
descriptivos que permitan un anlisis
flexible..

atributos frecuentes: identificador (cdigo


estndar), descripcin, Proveedor,
categora, precio, ...

jerarquas: producto

ProductKey
ProductName
SupplierName
CategoryName
ListUnitPrice

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos (Cliente)


tabla
bl
Dimensin
de Cliente

Customer_Dim
CustomerKey
CustomerID
CompanyName
C t tN
ContactName
ContactTitle
Address
City
Region
PostalCode
Country
Phone
Fax

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos(Cliente)


Dimensin Cliente:
9

la dimensin Cliente se define a partir del


fichero maestro de productos del sistema
OLTP.

Customer Dim
Customer_Dim

las actualizaciones del fichero maestro de


Clientes deben reflejarse en la dimensin
Cliente(cmo?).
la dimensin Cliente debe contener el
mayor nmero posible de atributos
descriptivos que permitan un anlisis
flexible..
atributos frecuentes: identificador (cdigo
estndar), Compaa, contacto, direccin,
regin, ...
jerarquas: Cliente-regin
Dr. Abraham Jorge Jimnez Alfaro

CustomerKey
CustomerID
CompanyName
ContactName
ContactTitle
Address
City
Region
PostalCode
Country
Phone
Fax

Diseo de un Almacn de Datos (Empleado)


tabla
bl
Dimensin
de
Empleado

Employee_Dim
EmployeeKey
EmployeeID
EmployeeName
HireDate
RegionID

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos(Empleado)


Dimensin Empleado:
9

la dimensin Empleado se define a partir del


fichero maestro de productos del sistema
OLTP.

Employee_Dim

las actualizaciones del fichero maestro de


Empleado deben reflejarse en la dimensin
Empleado (cmo?).

p
debe contener el
la dimensin Empleado
mayor nmero posible de atributos
descriptivos que permitan un anlisis
flexible..

atributos frecuentes: identificador (cdigo


estndar), Nombre, Fecha de Ingreso,
regin, ...

jerarquas: Empleado -regin


Dr. Abraham Jorge Jimnez Alfaro

EmployeeKey
EmployeeID
EmployeeName
HireDate
RegionID

Diseo de un Almacn de Datos (Shipper)


tabla
bl
Dimensin
de Shipper

Shipper_Dim
ShipperKey
ShipperID
ShipperName

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos(Shipper)


Dimensin Shipper:
9

la dimensin Shipper(Envio) se define a


partir del fichero maestro de Shipper del
sistema OLTP.

las actualizaciones del fichero maestro de


Shipper deben reflejarse en la dimensin
Shipper (cmo?).

la dimensin Shipper debe contener el


mayor nmero posible de atributos
descriptivos que permitan un anlisis
flexible..

atributos frecuentes: identificador (cdigo


estndar), Nombre

jerarquas: Nombre

Shipper Dim
Shipper_Dim
ShipperKey
ShipperID
ShipperName

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos


Time_Dim

Customer_Dim

Ti K
TimeKey

CustomerKey

TheDate

CustomerID

DayOfWeek

CompanyName

Month

ContactName

Year

ContactTitle

Quarter

Address

DayOfYear
Holiday
Weekend
YearMonth
a o
WeekOfYear

Product_Dim
ProductKey
ProductID
ProductName
SupplierName
CategoryName
ListUnitPrice

City
Region
PostalCode
Country

Employee
p oyee_Dim

Phone
Fax

EmployeeKey
EmployeeID
EmployeeName
HireDate
RegionID

Shipper_Dim
ShipperKey
ShipperID
ShipperName

Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos


Paso 4. Decidir la informacin a almacenar sobre el proceso.
p

Hechos: informacin (sobre la actividad) que se desea almacenar


en cada tupla de la tabla de hechos y que ser el objeto del
anlisis.
anlisis
Precio
Unidades
Importe
....

Nota: algunos datos que en el OLTP coincidiran con valores de


atributos de dimensiones, en el almacn de datos pueden
representar hechos. (Ejemplo: el precio de venta de un producto).
Dr. Abraham Jorge Jimnez Alfaro

Diseo de un Almacn de Datos


Ejemplo: Ordenes.

Grnulo: se desea almacenar informacin sobre las ventas


diarias de cada producto asociadas a los clientes, el empleado
que realiza la venta, as como la forma de envi del producto.
importe total de Lnea del producto en el da
importe total de las ventas del producto en el da
nmero total de unidades vendidas del producto en el da
Importe total de Descuentos en el da

Dr. Abraham Jorge Jimnez Alfaro

Customer_Dim
CustomerKey

Modelo en Star(Estrella)

CustomerID
CompanyName

Sales Fact
Sales_Fact
Product_Dim
ProductKey
ProductID
ProductName
SupplierName
CategoryName
ListUnitPrice

C t tN
ContactName

TimeKey

ContactTitle

CustomerKey

Address

ShipperKey

City

ProductKey

Region

EmployeeKey

PostalCode

RequiredDate

Country

LineItemFreight
LineItemTotal
LineItemQuantity

Shipper Dim
Shipper_Dim

LineItemDiscount

ShipperKey
ShipperID
ShipperName

Time_Dim
Region
RegionID
RegionName

Employee_Dim

TimeKey

EmployeeKey

TheDate

EmployeeID

DayOfWeek

EmployeeName

Month

HireDate

Year

RegionID

Quarter
DayOfYear
Holiday

Dr. Abraham Jorge Jimnez Alfaro

A Sample Data Cube(Kimball)


Date

2Qtr

3Qtr

4Qtr

sum

U.S.A
Canada
Mexico
i
sum

Dr. Abraham Jorge Jimnez Alfaro

Coountry

TV
PC
VCR
sum

1Qtr

Total annual sales


of TV in U
U.S.A.
SA

Browsing a Data Cube(Kimball)

Visualization
OLAP capabilities
I
Interactive
i manipulation
i l i

Dr. Abraham Jorge Jimnez Alfaro

Archivos de Creacin del Data Mart

1.-Northwind_Mart _4.pdf-- crear la base de datos y Tablas..


etldtamartLoad _Employee_Dimension.pdf
etldtamartLoad _Fact_Table.pdf
etldtamartLoad _Region_Dimension.pdf
_ g _
p
etldtamartLoad _Time_Dimension.pdf
etldtamartLoadCustomer_Dim.pdf
etldtamartLoadProduct Dimension pdf
etldtamartLoadProduct_Dimension.pdf
etldtamartLoadShipper_Dim.pdf

Dr. Abraham Jorge Jimnez Alfaro

SSIS.
SSIS

Dr. Abraham Jorge Jimnez Alfaro

Borrado de Tablas

Dr. Abraham Jorge Jimnez Alfaro

Customer DIM
Customer_DIM

Dr. Abraham Jorge Jimnez Alfaro

Customer DIM
Customer_DIM

Dr. Abraham Jorge Jimnez Alfaro

Customer DIM
Customer_DIM

Dr. Abraham Jorge Jimnez Alfaro

Customer DIM
Customer_DIM

Dr. Abraham Jorge Jimnez Alfaro

Customer DIM
Customer_DIM

Dr. Abraham Jorge Jimnez Alfaro

Customer DIM
Customer_DIM

Dr. Abraham Jorge Jimnez Alfaro

Shipper DIM
Shipper_DIM

Dr. Abraham Jorge Jimnez Alfaro

Shipper DIM
Shipper_DIM

Dr. Abraham Jorge Jimnez Alfaro

Shipper DIM
Shipper_DIM

Dr. Abraham Jorge Jimnez Alfaro

Shipper DIM
Shipper_DIM

Dr. Abraham Jorge Jimnez Alfaro

Shipper DIM
Shipper_DIM

Dr. Abraham Jorge Jimnez Alfaro

Product DIM
Product_DIM

Dr. Abraham Jorge Jimnez Alfaro

Product DIM
Product_DIM

Dr. Abraham Jorge Jimnez Alfaro

Product DIM
Product_DIM

Dr. Abraham Jorge Jimnez Alfaro

Product DIM
Product_DIM

Dr. Abraham Jorge Jimnez Alfaro

Product DIM
Product_DIM

Dr. Abraham Jorge Jimnez Alfaro

Time DIM
Time_DIM

Dr. Abraham Jorge Jimnez Alfaro

Time DIM
Time_DIM

Dr. Abraham Jorge Jimnez Alfaro

Time DIM
Time_DIM

Dr. Abraham Jorge Jimnez Alfaro

Time DIM
Time_DIM

Dr. Abraham Jorge Jimnez Alfaro

Time DIM
Time_DIM

Dr. Abraham Jorge Jimnez Alfaro

Region DIM
Region_DIM

Dr. Abraham Jorge Jimnez Alfaro

Region DIM
Region_DIM

Dr. Abraham Jorge Jimnez Alfaro

Region DIM
Region_DIM

Dr. Abraham Jorge Jimnez Alfaro

Region DIM
Region_DIM

Dr. Abraham Jorge Jimnez Alfaro

Region DIM
Region_DIM

Dr. Abraham Jorge Jimnez Alfaro

Employee DIM
Employee_DIM

Dr. Abraham Jorge Jimnez Alfaro

Employee DIM
Employee_DIM

Dr. Abraham Jorge Jimnez Alfaro

Employee DIM
Employee_DIM

Dr. Abraham Jorge Jimnez Alfaro

Employee DIM
Employee_DIM

Dr. Abraham Jorge Jimnez Alfaro

Employee DIM
Employee_DIM

Dr. Abraham Jorge Jimnez Alfaro

Fact Table
Fact_Table

Dr. Abraham Jorge Jimnez Alfaro

Fact Table
Fact_Table

Dr. Abraham Jorge Jimnez Alfaro

Fact Table
Fact_Table

Dr. Abraham Jorge Jimnez Alfaro

Fact Table
Fact_Table

Dr. Abraham Jorge Jimnez Alfaro

Fact Table
Fact_Table

Dr. Abraham Jorge Jimnez Alfaro

A Sample Data Cube(Kimball)


Date

2Qtr

3Qtr

4Qtr

sum

U.S.A
Canada
Mexico
i
sum

Dr. Abraham Jorge Jimnez Alfaro

Coountry

TV
PC
VCR
sum

1Qtr

Total annual sales


of TV in U
U.S.A.
SA

SSISProyecto de Analysis Services

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

SSISVista de Datos

Dr. Abraham Jorge Jimnez Alfaro

VISTA DE DATOS

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

SSISCUBO DE DATOS

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Dr. Abraham Jorge Jimnez Alfaro

Das könnte Ihnen auch gefallen