Sie sind auf Seite 1von 5

02/07/12

Dez Regras de Ouro para Modelagem Dimensional Blog do Lito Data Warehouse / Business Intell

Blog do Lito Data Warehouse / Business Intelligence

Dez Regras de Ouro para Modelagem Dimensional


janeiro 12, 2010 Carlos Alberto Lorenzi Lima Conhea as dez regras de ouro para modelagem dimensional, segundo Kimball!

Regra 1: Carregar detalhes atmicos nas estruturas dimensionais.


Modelos Dimensionais devem ser populados alicerados em detalhes atmicos de forma a suportar filtros, consultas agrupadas, solicitadas pelas regras de negcio e consulta dos usurios. Tipicamente, os usurios no precisam ver uma nica linha por vez, mas podemos prever, de certa forma, as maneiras arbitrrias como eles iro querer ver na tela e navegar por esses detalhes. Se somente dados sumarizados estiverem disponveis, ento fizemos suposies sobre os padres de consulta dos usurios, que iro criar uma parede de tijolos quando esses usurios quiserem ir mais a fundo nas informaes, nos detalhes. claro que detalhes atmicos podem ser complementados por modelos dimensionais sumarizados, que iro melhorar a performance das consultas mais comuns, mas os usurios do negcio no podem viver apenas com dados sumarizados, precisam de detalhes para responder as questes do seu dia a dia.

Regra 2: Estruturar os DMs em volta dos Processos do Negcio.


Processos de Negcio so as atividades realizadas pela organizao; representam as medidas dos eventos, como fazer um pedido ou faturamento para um cliente. Tipicamente, processos de negcio capturam ou geram medidas nicas, referentes realizao dos seus eventos. Essas mtricas, transformadas em fatos, com cada processo de negcio, representa uma nica tabela fato atmica. Em adio a uma nica tabela fato do processo, tabelas fato consolidadas so, s
litolima.com/2010/01/12/dez-regras-de-ouro-para-modelagem-dimensional/ 1/5

02/07/12

Dez Regras de Ouro para Modelagem Dimensional Blog do Lito Data Warehouse / Business Intell

vezes, criadas combinando mtricas de mltiplos processos em uma tabela fato com um nvel comum de detalhes. Mais uma vez, tabelas fatos consolidadas so complementos do detalhamento dos processos e no um substituto.

Regra 3: Todo Fato deve ter uma Dimenso de Tempo associada.


A medio dos eventos, descritos na regra anterior, sempre tem uma data carimbada ou alguma variedade a eles associados, podendo ser o balance mensal, ou os valores capturados por minute, etc. Todo Fato deve ter, pelo menos, uma foreign Key de associao a uma Dimenso de Tempo (datas), cuja granularidade seja um nico dia com os atributos do calendrio e caractersticas no padronizadas sobre a data da medida do evento, como, por exemplo, ano fiscal, feriados, etc. comum termos vrias datas associadas a um fato.

Regra 4: Um Fato deve ter, sempre, a mesma granularidade.


Existem trs categorias fundamentais de granularidade: Transacional, Perodo no Tempo ou Perodo Acumulado (transacional, periodic snapshot, or accumulating snapshot). Indiferentemente do tipo da granularidade, cada medida em um Fato deve ter, exatamente, o mesmo nvel de detalhe. Quando misturamos fatos (medidas), representando mltiplos nveis de granularidade em uma mesma tabela Fato, estaremos gerando uma confuso de informaes sobre o negcio, gerando, com certeza, informaes erradas e desacreditando o BI na empresa.

Regra 5: Relacionamento muitos-para-muitos um Fato.


Como uma tabela Fato armazena os resultados dos eventos dos processos de negcio, existe um relacionamento muitos-para-muitos inerente a esse resultado, entre as foreign Keys, tais como mltiplos produtos sendo vendidos em mltiplas lojas em mltiplos dias. Essas foreign keys nunca devem ser nulas. s vezes, dimenses podem ter mltiplos valores para uma nica medida do evento, como mltiplos diagnsticos associados a um plano de sade ou mltiplos clientes com contas no Banco. Nesses casos no interessante resolver essa dimenso com muitos valores diretamente com a tabela fato, isso violaria a granularidade natural da medida do evento. Nesse caso, usamos uma tabela com chave dupla em conjuno com o Fato.
litolima.com/2010/01/12/dez-regras-de-ouro-para-modelagem-dimensional/ 2/5

02/07/12

Dez Regras de Ouro para Modelagem Dimensional Blog do Lito Data Warehouse / Business Intell

Regra 6: Resolver muitos-para-um na Dimenso.


Relacionamentos muitos-para-um entre atributos so tipicamente desnormalizados ou desmanchados em uma Dimenso. Caso tenhamos passado tempo demais desenhando modelos ER, deveremos resistir tentao em normalizar gerando varias subdimenses menores, criando uma estrutura snowflake. No esquea, desnormalizar o nome do jogo em Modelagem Dimensional.

Regra 7: Armazenar report labels e filter domain na Dimenso.


Os cdigos e, mais importante, decodes associados e descritores usados para nome de colunas em relatrios e filtrar consultas (queries) devem ser obtidos a partir da Dimenso. Evite armazenar campos codificados ou campos descritivos volumosos nas tabelas Fato; bem como no armazene o cdigo em Dimenses, assumindo que os usurios no precisam de decodes descritivos ou que eles podero ser manuseados na aplicao BI. Como observamos na regra 5 que as foreign keys nunca devem ser nulas, isso tambm deve ser considerado para os atributos das dimenses, evitando-se nulos, substituindo valores nulos por, por exemplo, NA (No se Aplica) ou outro valor default qualquer, reduzindo possveis confuses.

Regra 8: Usar Surrogate Key nas Dimenses.


O uso de Surrogate Key (SK) nas dimenses (com exceo da Dimenso Tempo, onde a data muito mais representativa), nos trs muitos benefcios, incluindo chaves menores que significa Fatos menores, ndices menores e melhora a performance. Surrogate keys so absolutamente necessrias se precisarmos acompanhar as mudanas de determinados atributos na Dimenso, ou seja, se precisarmos acompanhar histricos. Surrogate Keys tambm permitem mapear mltiplas chaves operacionais em um perfil comum.

Regra 9: Criar Conformed Dimensions.


Conformed dimensions so essenciais para um Data Warehouse corporativo. Gerenciadas apenas
litolima.com/2010/01/12/dez-regras-de-ouro-para-modelagem-dimensional/ 3/5

02/07/12

Dez Regras de Ouro para Modelagem Dimensional Blog do Lito Data Warehouse / Business Intell

uma vez, nos processos de ETL, e reusadas em mltiplas tabelas Fato, as Dimenses Conformadas apresentam atributos descritivos consistentes entre modelos dimensionais, e suportam tcnicas como Drill Across e integrao de informaes entre vrios processos de negcio. O Conceito de Enterprise Data Warehouse Bus Matrix a arquitetura chave, que representa o ncleo dos processos de negcio da empresa, dimensionalmente associados. O reuso de dimenses agiliza o processo de desenvolvimento e elimina redundncias. Contudo, necessita comprometimento e governana na tutela dos dados para potencializar a conformidade.

Regra 10: Manter equilbrio continuo entre DW/BI e Negcio .


Os arquitetos devem, constantemente, acompanhar os requerimentos dos usurios do negcio, com a realidade dos dados, para desenhar a implementao e entrega das informaes de forma a ser o BI adotado pelo negcio. As requisies versus a realidade balanceada das informaes, a vida de um DW/BI. Manter sempre uma estratgia de tcnicas para implementaes e melhorias nas informaes, com arquiteturas de ETL e disponibilizao de dados, definindo planos de ao. At a prxima! Publicado em Diversos. 3 Comentrios

3 Respostas para Dez Regras de Ouro para Modelagem Dimensional


1. Mauro Canoas diz: outubro 7, 2011 s 7:52 pm Carlos, achei excelente este artigo. Gostaria de uma ajuda em relao ao item que trata o uso de surrogate key. Sou AD e defendo esta pratica sempre que possivel, acontece que certos DBAs so contra e afirmam que o processo de carga fica muito prejudicado, no compensando o uso. Voc teria algo mais detalhado sobre o assunto para que eu pudesse argumentar junto aos DBAs? Desde j obrigado Mauro Canoas Responder Carlos Alberto Lorenzi Lima diz: outubro 11, 2011 s 12:05 pm Mauro, tudo bem? Obrigado pela visita! D uma olhada no BLOG, pois tem uma matria sobre Surrogate
litolima.com/2010/01/12/dez-regras-de-ouro-para-modelagem-dimensional/ 4/5

02/07/12

Dez Regras de Ouro para Modelagem Dimensional Blog do Lito Data Warehouse / Business Intell

Key, que eu acho que vai te ajudar. Se precisar de mais informaes, me avisa que eu corro atrpas. Obrigado e grande abrao. Lito Responder Carlos Alberto Lorenzi Lima diz: outubro 11, 2011 s 12:07 pm http://litolima.wordpress.com/wp-admin/post.php?post=871&action=edit Responder Uma Definio para Data Warehouse Armazm de Dados Business Intelligence chega fase de maturidade Blog no WordPress.com. Tema: Garland por Stefan Nagtegaal and Steven Wittens.

litolima.com/2010/01/12/dez-regras-de-ouro-para-modelagem-dimensional/

5/5

Das könnte Ihnen auch gefallen