Beruflich Dokumente
Kultur Dokumente
(SAD) - Senado
DW OLAP BI
Ilka Kawashita
ikawashi@gmail.com
n OLAP
n Data Warehouse (DW/ETL)
n Modelagem Multidimensional
n Data Mining
n BI - Business Intelligence
Warehouse
Aplicao B
Aplicao C
Aplicao D
Aplicao E
Aplicao B REL 2
Aplicao C REL 3
Aplicao D REL 4
REL 5
Aplicao E
Aplicao B REL 2
Aplicao C REL 3
Aplicao D REL 4
REL 5
Aplicao E
Aplicao B SAD 2
Aplicao C SAD 3
Aplicao D SAD 4
SAD 5
Aplicao E
Aplicao B SAD 2
Aplicao C SAD 3
Aplicao D SAD 4
SAD 5
Aplicao E
Aplicao B SAD 2
Aplicao C SAD 3
Aplicao D SAD 4
SAD 5
Aplicao E
Tecnologia de
Data
Aplicao B SAD 2
Warehousing
Aplicao C SAD 3
Aplicao D SAD 4
SAD 5
Aplicao E
Aplicao B
Aplicao C
DW
Aplicao D
Aplicao E
Contas,
Clientes, etc.
n Segundo W.H.Inmon:
DM
Aplicao B
Aplicao C
DW DM
Aplicao D
DM
Aplicao E
Modelagem Dimensional
Modelagem Relacional
22
ETL (Extrao, Transformao e Carga (Load)
Projeto de um DW
n Kimball aponta um conjunto pontos fundamentais no projeto
da estrutura de DW (tipo estrela). So os seguintes os
chamados pontos de deciso, que constituem definies a
serem feitas e correspondem, de fato, a etapas do projeto:
q Os processos, e por conseqncia, a identidade das tabelas de fatos;
q A granularidade de cada tabela de fatos;
q As dimenses de cada tabela de fatos;
q Aos fatos, incluindo fatos pr-calculados;
q Os atributos das dimenses;
q Como acompanhar mudanas graduais em dimenses;
q As agregaes, minidimenses e outras decises de projeto fsico;
q Durao histrica do banco de dados;
q Urgncia com que se d a extrao e carga para o DW.
Figura 1
Metodologia de design de DW do Kimball
Figura 2
Metodologia de design de DW do Inmon
INMON KIMBALL
Avalia o que o ambiente Orientada s necessidades
operativo tem a oferecer do usurio final
n Modelo Estrela
GEOGRAFIA
Cod_geografia integer PRODUTO
Nome varchar(10) Cod_produto integer
Populao integer
Estado char(2) Nome varchar(10)
Regio char(2)
VENDAS
Categoria char(4)
Familia char(4)
Cod_produto integer
Cod_tempo integer
Cod_geografia integer
Cod_canal integer
TEMPO
Cod_tempo integer Quantidade decimal(16,0)
Faturamento decimal(16,2) CANAL
Dia integer
Ms integer Cod_canal integer
Ano integer
Dia_semana char(3) Tipo varchar(10)
n Dimenso:
n Representao dos contextos relevantes
para a anlise de um fato.
q Exemplo:
n Fato: Vendas.
n Dimenses: Clientes, Produtos, Tempo, Locais, ...
n Uma dimenso pode
q conter membros;
q ser organizada em hierarquias.
n dimenso Locais:
q bairro, cidade, estado.
Hierarquias:
ANO REGIAO
TRIMESTRE ESTADO
MES
DIA
Agregados
n Normalmente, a modelagem dimensional
utilizando o esquema estrela apenas representa
os fatos no nvel de granularidade mais baixa
(a partir do qual possvel gerar as
combinaes ou diferentes perspectivas de
anlise).
n No entanto, torna-se evidente a vantagem (por
razes de desempenho) de pr-calcular e
armazenar fatos sumrio, contendo agregaes
segundo diferentes combinaes de dimenses.
Produto Ms Estado
Prof.: Ilka Kawashita
ikawashi@gmail.com
Agregados
Categoria
Venda
s Regio
Trimestre
XPTO
XPTA
XPTN Regio
Marca
Ano
Prof.: Ilka Kawashita
ikawashi@gmail.com
Agregados
Tempo de
Resposta
BD3
BD4
BD2
BD1
BD1
BD2
BD3
BD4
Prof.: Ilka Kawashita
ikawashi@gmail.com
Agregados
n Fatores:
q Custo de Criao;
q Custo de Manuteno;
q Frequncia de Manuteno;
q Frequncia de Utilizao;
q Tempo de Gerao.
n Nem sempre vivel armazenar todos os
agregados.
46
Pivot
47
Slice-and-Dice
Banco de Dados Multidimensional
MOLAP
ROLAP