Sie sind auf Seite 1von 4

1

DataWarehouse
DataMart
DataMining
Luis E. Zrate
Kimball (1996) define DataWarehouse
(Armazm de dados) como:
Conjunto de ferramentas e tcnicas de projeto,
que quando aplicadas s necessidades
especficas dos usurios e s bases de dados
especficos, permite que seja planejado e
construdo um armazm de dados.
O Datawarehouse
Luis E. Zrate
Estrutura tpica de um
Datawarehouse
Aplicao A
Aplicao B
Datawarehouse
Rede de PCs
Servidores de Arquivos
ou mainframe
Dados
Operacionais
Servidor de
Arquivos de
transaes
Luis E. Zrate
O Datawarehouse (Armazm de Dados)
surgiu da necessidade ....
do armazenamento da informao numa base de
dados centralizada;
de integrar os dados de uma empresa;
de eliminar redundncia nos dados;
de manter o histrico das informaes para anlise
e tomadas de deciso, baseado em fatos e no
mais em intuio e especulao.
O Datawarehouse
Luis E. Zrate
A maioria dos sistemas de informao so
parametrizados, com consultas pr-definidas,
sem flexibilidade para criar novas pesquisas.
O DW tem como premissa resolver essa
questo, dando ao usurio flexibilidade para a
pesquisa, mesmo da aquelas mais complexas.
...outro objetivo do DW:
Luis E. Zrate
DW vs Banco de dados operacional
Caractersticas BDO DW
Objetivo Operaes dirias do negcio Analisar o negcio
Uso Operacional Informativo
Unidade de trabalho Incluso, alterao, excluso. Carga e consulta
Tipo de usurio Operadores Comunidade gerencial
Condies dos dados Dados operacionais Dados Analticos
Volume Megabytes gigabytes Gigabytes terabytes
Histrico 60 a 90 dias 5 a 10 anos
Estrutura Esttica Varivel
Manuteno desejada Mnima Constante
Acesso a registros Dezenas Milhares
Atualizao Contnua (tempo real) Peridica (em batch)
Inteno dos ndices Localizar um registro Aperfeioar consultas
Luis E. Zrate
2
Caractersticas do DW
Segundo Inmon 1997, DW possui
quatro caractersticas principais:
Orientao por assunto
Integrao
Incremento no Tempo
No Volatilidade
Luis E. Zrate
Arquitetura de um DW
Arquitetura proposta por (DalAlba,
1999)
Camadas de bancos de dados operacionais e
fontes externas
Camada de acesso informao
Camada de acesso aos dados
Camada de metadados (Dic. Dados)
Camada de gerenciamento de processos
Camada de transporte
Camada do DataWarehouse
Luis E. Zrate
Arquitetura de um DW
Luis E. Zrate
DataMart vs. DataWarehouse
Projetar um DW requer:
Tempo,
Disponibilidade financeira e
Considervel esforo gerencial.
O DataMart (DM) trata do problema de um
departamento ou local (necessidade especial)
Tecnologia no DM = Tecnologia no DW
Volume de Dados no DM < Volume de Dados no DW
Complexidade da carga DM < Complexidade da carga DW
Custo do DM (1/10)*Custo do DW
Prazo do DM (1/3)*Prazo do DW
Luis E. Zrate
Tcnicas para criar um DW
"top-down"
Luis E. Zrate
Tcnicas para criar um DW
"Bottom-Up"
Luis E. Zrate
3
Processo de criao de um DW
Processo ETL (Extrao, Transporte e Carga)
Luis E. Zrate
DataMining e DataWarehouse
Segundo Herbert 1998, um DW til para a
minerao dos dados
A limpeza dos dados no Data Mining semelhante
ao do DW.
Graas ao DW os dados esto carregados e
integrados.
Por outro lado o DW pode limitar a atuao do
Data Mining, pois esse seleciona os dados de
alguma forma, restringindo o domnio e o
conhecimento extrado, fazendo restries em
dados de acordo com o domnio pr-definido.
Luis E. Zrate
Ferramenta OLAP - On-Line Analytic Processing
Luis E. Zrate
As tcnicas tradicionais de consultas a BD so
ineficientes para obter informaes complexas
de apoio a deciso.
O conceito OLAP (On-Line Analytic Processing),
permite responder perguntas como:
Quais produtos esto vendendo bem?
Onde esto meus escritrios com as piores
vendas?
E se um dado evento acontecer?...
Introduo OLAP
Luis E. Zrate
Permitir uma viso conceitual-multidimensional
dos dados de uma empresa.
Etapas: modelar, organizar, filtrar dados e
analisar analiticamente dados histricos de forma
multi-dimimensional.
Caracterstica da Tecnologia OLAP
CUBO
Luis E. Zrate
As dimenses do cubo representam
componentes dos negcios da empresa:
Cliente",
Produto",
Regio,
Fornecedor,
Tempo, etc.
Viso Multi-dimensional - CUBO
Luis E. Zrate
4
A clula chamada de medida e geralmente
representa dados numricos como:
Unidades vendidas",
Lucro
Total de vendas, etc.
Viso Multi-dimensional - CUBO
Clula
Luis E. Zrate
Os mnimos/mximos,
Comparaes entre perodos,
Percentual de diferena,
Mdias de tendncia,
Somas ou contagens acumulativas,
Diversas funes estatsticas e financeiras.
Anlise Multi-dimensional Tpicas
Luis E. Zrate
Objetivos procurados pela OLAP
Atravs do comportamento de determinadas variveis
no tempo, descobrir tendncias, gerando informao
estratgica.
OLAP nas funes organizacionais:
Departamentos de Finanas: para planejar oramentos e
realizar anlises financeiras.
Departamento de Vendas: para fazer anlises e
estimativas de vendas.
Departamento de Marketing: para realizar pesquisas e
anlises de mercado, estimativas, anlises de clientes e
segmentao de mercado.
Manufatura: para realizar o planejamento, anlises da
produo e anlises de falhas ou defeitos.
Luis E. Zrate

Das könnte Ihnen auch gefallen