Sie sind auf Seite 1von 40

Um Ambiente de DW

Prof: Jailton Cardoso da Cruz Instituto Federal de Alagoas

Agenda

Conceitos Processo de DW Apresentando ferramenta OLAP Perguntas

Conceitos

Data Warehouse

Armazm de dados. Pode ser definido como um banco de dados, destinado a sistemas de apoio deciso e cujos dados foram armazenados em estruturas lgicas dimensionais, possibilitando o seu processamento analtico por ferramentas especiais (OLAP e Mining). Um data warehouse um conjunto de dados baseado em assuntos, integrado, no-voltil, e varivel em relao ao tempo, de apoio s decises gerencias.[Inmon 96]

Conceitos

Data Warehouse - objetivos


O data warehouse fornece acesso a dados corporativos ou organizacionais Os dados do data warehouse so consistentes Os dados do DW podem ser separados e combinados usando-se qualquer medio possvel do negcio O DW no consiste apenas dos dados, mas tambm de um conjunto de ferramentas para configurar, consultar, analisar, e apresentar as informaes O DW o local em que publicamos dados confiveis A qualidade dos dados do DW impulsiona e reengenharia de negcios

Conceitos

Data Warehousing coleo de tecnologias de suporte deciso voltada para quem trabalha com conhecimento e no apenas com informao. Permite aos gerentes de empresas obter e integrar informaes de fontes heterogneas e consultar grandes bases de dados eficientemente

O Modelo DF (Dimensional Fact)

O modelo dimensional, tambm denominado Star Squema composto por uma tabela central, chamada de tabela de fatos, e um conjunto de tabelas relacionadas chamadas de dimenses, onde:

Fatos - o foco de interesse de um empresa (negcio) Dimenses determina a granularidade adotada para representar fatos Atributos propriedades do fato Hierarquias determina como os atributos das dimenses devem ser arranjados de forma que mantenham um relacionamento 1-N

Definindo Fato

Um fato expressa um relacionamento um-para-muito atravs das dimenses As tabelas de fatos servem para armazenar medidas numricas associadas a eventos de negcio Cada combinao de valores das dimenses define uma instncia do fato (fact instance) Instncia do fato a informao elementar representada no DW, cada fato pode armazenar uma ou mais medidas numricas, que constituem os valores objeto de anlise dimensional

Definindo Dimenso

Dimenso determina como cada instncia do fato pode ser agregada significantemente para o processo de tomada de deciso As tabelas de dimenso representam entidades de negcios. As tabelas de dimenso possuem relacionamento 1:N com a tabela de fato A escolha das dimenses crucial para determinar a granularidade das instncias do fato

Definindo Atributos do fato

Atributos do fato so basicamente contadores de ocorrncias, somatrios, mdias, mnimo e mximo obtidas atravs das funes agregadas SQL (count, sum, average, min, max) , etc Estes valores que estaro na intercesso das dimenses, so chamados de mtricas, pois normalmente so somados e trabalhados nas diversas dimenses

Definindo Hierarquias

Ao longo das dimenses os atributos devem ser arranjados de forma que mantenham um relacionamento 1-para-n entre os atributos da dimenso possibilitando anlise atravs de vrios nveis de agregao

Departamento Categoria Sub-categoria Marca Produto

Resumo Passos para Modelagem Dimensional

Definir a rea de negcio

Definir processo(s) dentro da rea de negcio Definir a granularidade desejada para os dados do processo Definir os atributos e hierarquias das dimenses

Prioridades de negcios, percepo mercado, comportamento de clientes

de

Definir as mtricas da tabela de fato

Considerar hierarquias mltiplas

O Processo DW

Consiste de quatro fases

Extrao de dados de fontes operacionais diversas Organizao e integrao dos dados de forma consistente no DW Gerenciamento do DW Acessar os dados de uma maneira eficiente e flexvel

O Processo DW

O Processo DW

Primeira fase - Extrao de dados de fontes operacionais diversas

Requer conhecimento do(s) ambiente(s) transacional(is) de onde sero extrados os dados baseado no modelo dimensional definido Abrange casos tpicos de servios de informao heterogneo tais como:

Estruturas de dados incompatveis Dados inconsistentes Granularidade diversificada

1999 TABELAS

O Processo DW

Segunda fase

Requer projeto completamente diferente do adotado para sistemas operativos (transacionais)

Dados dentro do DW so organizados de acordo com o modelo dimensional Projeto baseado em um modelo de negcio da empresa

69 DIMENSES

24 DATA MARTS (FATOS)

Datas de 23/03/0001 a 31/05/5007

O Processo DW

Terceira fase Monitoramento/gerenciamento das atividades do DW


Que dados esto em uso Quem est utilizando o data warehouse Qual o tempo de resposta Otimizao de queryes complexas Qual o planejamento do agendadamento dos processos de ETL

O Processo DW

Terceira fase

Requer capacidade de navegao em agregados Uma interface visual amigvel para ser utilizada por OLAP (On Line Analytical Processing) Minerao de dados

Interfaces de apoio Deciso

Requisitos

Manipular dados corporativos


Diferentes nveis de agregao Diferentes critrios de agregao

Critrio => Dimenso negcio

Emitir sries temporais

Conhecer o passado para prever o futuro

Alertar no caso de dados anmalos Ajudar o executivo a descobrir a(s) causa(s) de excees

www.microstrategy.com.br Data Warehouse Toolkit Tcnicas para Construir Data Warehouses Dimensionais Ralph Kimball, 1998 Como Construir Data Warehouse W. H. Inmon Gerenciando DataWarehouse W. H. Inmon

Perguntas

Perguntas

OBRIGADO

Das könnte Ihnen auch gefallen