Sie sind auf Seite 1von 29

Prof.

Elvis R Barreto
• Um armazém de dados o qual integra e gerencia o fluxo de informações a
partir dos bancos de dados corporativos.
◦ Orientado a Assunto: organizado conforme diferentes visões de
negócio.

◦ Integrado: a partir de fontes de dado heterogêneas.


◦ Não Volátil: sempre inserido, nunca excluído.

◦ Variante no Tempo: posições históricas das atividades no tempo.


 Percebe-se, nos últimos anos, um sensível crescimento da demanda por
recursos tecnológicos para o armazenamento, manutenção e
compartilhamento de dados de empresas as quais precisam manter
qualidade de informações cada vez melhores em suas bases de dados. Esse
grande volume de dados excede a capacidade humana de análise e
compreensão.

 As empresas de médio e grande porte necessitam de um eficiente Sistema


de Apoio às Decisões, fornecendo dados integrados históricos que são
utilizados nas gerências.
 Um dos maiores problemas no desenvolvimento do DW é a compreensão
dos dados, onde as dimensões devem ser definidas conforme a
necessidade de visualização do usuário, ou seja, é tentador pensar que a
criação do DW consiste em apenas extrair dados operacionais e inseri-los
no Data Warehouse.

 O valor de DW não está em colecionar dados e sim saber gerenciar aqueles


dados sendo transformados em informações úteis.

 Considerando complexa a construção de um DW, faz-se necessário um


amplo estudo para geração de uma metodologia a fim de se obter sucesso
no empreendimento.
• DW não é um produto que se compra, mas sim um projeto que envolve:

• Análise e implementação, com a participação de várias tecnologias.


FONTES PROVEDORAS ÁREA DE TRABALHO SUPORTE À DECISÃO
ou ou ou
SISTEMAS OPERACIONAIS DATA STAGING ÁREA DATA WAREHOUSE ÁREA DE APRESENTAÇÃO
DE ORIGEM DOS DADOS

Bases de _________
_________
_________
Sistemas _________
_________
Transacionais _________

Relatórios
Dados de DATA
Sistemas ERP MARTS

EXTRAÇÃO
ADEQUAÇÃO
Dados Locais LIMPEZA DATA
DERIVAÇÃO WAREHOUSE
AGREGAÇÃO

Dados Externos

Dados WEB Análise Financeira &


Estatística

[Adaptado de SunExpert Magazine, Outubro 1998.]


 São os sistemas operacionais de registro ou sistemas transacionais que
capturam as transações da empresa. Os sistemas de origem devem ser
considerados como externos ao data warehouse porque se presume que se
tenha pouco ou nenhum controle sobre o conteúdo e o formato dos dados
nesses sistemas. Os sistemas de origem também são chamados Sistemas
Legados ou OLTP
 A data staging área do data warehouse é tanto uma área de
armazenamento como um conjunto de processos, e normalmente
denomina-se ETL (Extract – Transformation - Load).
 A área de apresentação dos dados é o local em que os dados ficam
organizados, armazenados e tornam-se disponíveis para serem consultados
diretamente pelos usuários, por criadores de relatórios e por outras
aplicações de análise. Essa área é tudo o que a comunidade de negócio vê
e acessa através das ferramentas de acesso a dados (DB2, ESSBASE, etc).

 Um data mart trata de problema departamental ou local e é definido como


um subconjunto altamente agregado de dados, normalmente escolhido
para responder a uma questão de negócio específica ao invés da
corporação inteira.
 O último componente principal do ambiente de data warehouse é a
ferramenta de acesso a dados. Por definição, toda ferramenta de acesso a
dados consulta os dados na área de apresentação do DW
Ambiente do Extração e
DW Integração dos
dados

DW
OLTP

Acesso a
Dados
“Dividir para Conquistar”. Cria-se primeiro os
 Estratégia
Data Marts para depois chegar a um Data Warehouse
Corporativo.
Data Marts blocos de construção.
 Metadados são dados usados para explicar outros dados. Eles mantêm
informações sobre "o que e onde está" no ambiente de DW (INMON,
1992).

 Num projeto de data warehouse a documentação é tão importante quanto


a realização dos processos em si. Isso porque um projeto de DW costuma
ser gigantesco e engloba diversas áreas diferentes da organização, o que
faz com que nem todas as pessoas envolvidas tenham conhecimento de
tudo que acontece no projeto. A falta de documentação amarra o projeto a
pessoas e não a processos e isso é algo que não pode ocorrer em projeto
algum, sobretudo em um DW.
Ainda de acordo com Inmon, um metadados deve manter as seguintes
informações:

◦ A estrutura dos dados segundo a visão do programador;


◦ A estrutura dos dados segundo a visão dos analistas de SAD (Analistas
de Suporte a Decisão);
◦ A fonte de dados que alimenta o DW;
◦ A transformação sofrida pelos dados no momento de sua migração para
o DW;
◦ O modelo de dados;
◦ O relacionamento entre o modelo de dados e o DW;
◦ O histórico das extrações de dados;
 1º Passo: É importante traduzir rapidamente as necessidades do negócio em uma
especificação que possa ser construída em etapas. Minimiza riscos e o tempo de
apresentação dos resultados iniciais.

 2º Passo: Desafio de integração de sistemas. Dados de produção e de fontes


externas precisam ser mapeados para o modelo de dados do DW gerando um
sincronismo entre os dados operacionais e os dados de tomada de decisão.

 3º Passo: A escolha do banco de dados de suporte ao DW precisa ser criteriosa.


• Critérios
• Desempenho na carga e indexação dos dados;
• Tempo de resposta;
• Capacidade de armazenamento;
• Paralelismo.
• 4º Passo: Considerar as ferramentas disponíveis no mercado que devem
prover:
• Interfaces amigáveis;
• Geração de relatórios;
• Análises multi-dimensionais;
• Acesso via Web.

 5º Passo: Construir um DW que possa ser expandido, mantendo níveis


aceitáveis de desempenho até gigabytes.

 6º Passo: Ambiente DW deve ser aberto para permitir que os componentes


ou ferramentas identificadas no passo 4 possam ser substituídas por outras
mais atuais e eficientes.
• Oracle
• Sybase
• DB2
• Informix
• SQL Server
Relatórios que podem ser gerados
Ex.: Perfil dos clientes por faixa de renda
(salários mínimos)
Faixa de Renda

acima de 50 SM
2%
21 a 50 SM
10%
Não Informado
4% 1 a 3 SM
12%

11 a 20 SM
24%

4 a 10 SM
49%
 É constituído de um conjunto de tecnologias especialmente projetadas
para dar suporte ao processo decisório através de consultas, análises e
cálculos sofisticados nos dados corporativos estando armazenados em um
Data warehouse por partes dos seus usuários, geralmente analistas,
gerentes e executivos. À frente, exemplos:
 Atualmente o Estado de Minas Gerais conta com 13 projetos de Data
Warehouse nas suas diversas áreas (Segurança Pública, Administração,
Recursos Humanos, etc.), com todas as tecnologias possíveis envolvidas.
Possui extração de dados em Mainframe (bancos ADABAS e DB2) e em
baixa plataforma também (Oracle e SQL Server).

 Possui 90% dos DW construídos em Oracle e 10% em SQL Server. Possui


um grande mix de tecnologias envolvidas nos programas de ETL (extração,
transformação e carga), portanto, usamos muitas linguagens (Natural,
Cobol, PL/SQL, T-SQL).

 Os DWs são utilizados pelo estado na retirada de indicadores de negócio


para auxílio na tomada de decisão e na geração de informação gerencial
sendo que as modelagens de dados são imensas.
 É utilizada a ferramenta OLAP de exploração da Business Objects e todos
os DWs são explorados através de um portal na Web onde os clientes se
identificam e utilizam o DW que podem acessar (com toda a segurança nos
dados).

 As cargas são feitas fora do horário comercial, até mesmo ao decorrer da


madrugada.

Das könnte Ihnen auch gefallen