Sie sind auf Seite 1von 6

Fundamentos de Sistemas Analiticos

Bussiness Intelligence pode ser obtido por qualquer artefatos, seja tecnolgicos ou no, que permita a extrao de conhecimento a partir de anlise do negcio. Solues informatizadas de BI. Decision Support Systems (DDS), ou sistemas de apoio a de deciso. Utilizados por usurios de nvel operacional. Management Information System (MIS), ou sistemas de informaes gerenciais. So utilizados por analistas de negcio no nvel ttico. Executive Information System (EIS), ou sistemas de informaes executivas. So voltados para profissionais que atuam no nvel estratgico das empresas. Sistemas Transacionais x Sistemas Analticos Sistemas transacionais, tambm conhecido como sinttico ou ainda OLTP Online Transaction Processing so aqueles que, como o nome sugere, baseiam-se em transaes. y y y y Sistema Contbeis Aplicaes de Cadastro Sistema de Compras, Estoque, Invetrio ERP,CRMs.

Os sistemas transacionais se caracterizam pela alta taxa de atualizao, grandes volumes de dados e acessos pontuais, pesquisas cujo resultado seja de pequeno volume. Caracterstica Atualizaes Tipo de Informao Quantidade de Dados Preciso Complexidade Consistncia Exemplos Terminologia Sistemas Transacionais(OLTP) Mais freqentes Detalhes Poucos Dados atuais Baixa Microscpica CRM, ERP, Supply Chain Linhas e Colunas Sistemas Analticos(OLAP) Menos freqentes Agrupamento Muitos Dados histricos Alto Global MIS, DSS, EIS Dimenses, Medidas e Fatos

Data Warehouses e Data Marts Um Data Warehouse uma base de dados, geralmente relacional, que consolida as informaes empresariais. Com grandes quantidades de dados, diversas fontes de informaes

Pgina 1 de 6

com bases heterogneas e muitas vezes inconsistentes, envolvimento de vrias reas ou departamentos da empresa e. Um dos maiores desafios na construo do DW a extrao e consolidao dos dados operacionais. Pode haver vrias fontes; Os dados precisam ser limpos ; A granularidade precisa ser ajustada; Pode ser necessrio resumir dados; Deve haver valores default e tratamento de null; necessrio componente temporal; Os relacionamentos nos dados de entrada precisam ser claros. Como mtodo de construo, existem formalmente dois: Top-down, no qual realizada a modelagem integral do DW, seguida pelas extraes de dados. Bottom-up, onde o foco em uma rea por vez, com o crescimento gradual do DW. * Midle-out, aproveitar as vantagens de cada uma por meio do desenvolvimento iterativo do DW.

1. O modelo de dados corporativos o primeiro a ser desenvolvimento e o responsvel pela integrao dos demais; 2. As primeiras tabelas da rea de interesse escolhida so povoadas; primeiras anlises; 3. Povoamento de mais tabelas com dados histricos; 4. Alguns dados passam a compor o DW, saindo da base operacional; 5. Surgimento dos data marts ; 6. O ciclo se repete at que o DW esteja completo. A remoo de dados do DW: Resumir dados mais antigos; Armazenar os dados antigos em meio mais barato (fita); Remover os dados do DW. Tais estratgias no so excludentes, podendo ser utilizadas em conjunto. Ao contrrio do que ocorre com as bases operacionais, o DW, por conter dados histricos, no demanda alta taxa de atualizao. Desse modo, pode ser atualizado a cada 24 horas ou at mesmo uma vez por semana. Data Marts (DW), banco de dados multidimensionais especficos por rea de negcio para realizao de anlise. Banco de Dados Multidimensionais

Pgina 2 de 6

A finalidade de bases de dados multidimensionais (alguns autores chamam de dimensionais) fornecer subsdio para realizao de anlise. Terminologia. As anlises sobre dados histricos envolvem ema srie de possibilidades de cruzamentos e agrupamentos de informaes, com o uso dos seguintes termos: Dimenses: estabelecem a organizao dos dados, determinado possveis consulta/cruzamentos. Por exemplo: regio, tempo, canal de venda. Medidas: so os valores a serem analisados, como mdias, totais e quantidades; Fatos: so os dados a serem agrupados, contento os valores de cada medida para cada combinao das dimenses existentes. Agregaes: totalizaes calculadas nos diversos nveis hierrquicos. A criao de DMs implica na gerao de agregaes. Alicerce Relacional Esta forma de armazenamento conhecida como ROLAP, ou Relational OLAP. Alicerce em Cubos Outra forma de armazenamento, cujo modelo matemtico denomina-se hipercubos, apresenta a caracterstica de possuir armazenamento e indexao em estruturas de dados que otimizam ao invs de atualizaes. MOLAP, ou Multidimensionais OLAP Modelos de Dados Multidimensionais A natureza do uso de bancos de dados multidimensionais torna sua modelagem distinta daquela utilizada para sistemas transacionais. Neste ltimo aplicamos tcnicas de normalizao seguidas por graus de desnormalizao a fim de obter o desempenho desejado ao reduzir o nmero de tabelas em junes. (joins) Alguns conceitos Quando o modelo de dados comea a ser definido, elementos bsicos de representao precisam ter sido estabelecidos, de modo a criar-se um padro de modelagem. As dimenses e fatos representados em tabelas, podendo haver mltiplas dimenses e mltiplas tabelas fatos.

Pgina 3 de 6

Fatos Ao modelar a(s) tabela(s) de fatos (ou apenas tabela fato), deve-se ter em mente os seguintes pontos: A chave primria composta, sendo um elemento da chave para cada dimenso; Cada elemento chave para a dimenso deve ser representado e descrito na tabela dimenso correspondente (para efetuar a juno); A dimenso tempo sempre representada como parte da chave primria. Dimenses Deve haver uma tabela dimenso para cada dimenso do modelo, contendo: y y y y Uma chave artificial (ou gerada) genrica; Uma coluna de descrio genrica para a dimenso; Colunas que permitam efetuar os filtros; Um indicador NVEL que indica o nvel da hierarquia a que se refere a linha da tabela.

A Dimenso Tempo Esta uma dimenso que praticamente todos os sistema analticos possuem, dada a caracterstica de realizao de anlise em dados histricos. Deveria conter: y y y y y Uma coluna chave para a juno com a(s) tabelas(s) de fatos; Uma descrio genrica para cada perodo; Colunas que permitam efetuar os filtros; Coluna sinalizadora da presena de fatos para o perodo ao nvel de tempo indicado na linha Coluna RESOLUO usada para restringir o perodo ao nvel apropriado opera de forma idntica coluna NVEL das outras dimenses o Colunas SEQENCIA que contm um nmero seqencial de 1 a n em cada nvel do perodo de tempo e identifica a ordem relativa de cada data. o Construes com clculos de tempo, como ltimos quatro dias , por exemplo.

Consideraes sobre Chaves Sistemas analticos devem contar com chaves artificiais, por uma srie de motivos:

Pgina 4 de 6

y y

Qualquer atualizao de dados fica simplificada. Por exemplo, um recadastramento de CPFs, embora improvvel, poderia resultar em atualizao de grande volume para uma tabela de fatos de transaes bancrias, caso o cliente fosse identificado com CPF sendo chave; Com uma nica coluna para a chave, geralmente de tipo inteiro, o desempenho de pesquisas tende a ser melhor. O fato de ser chave simples facilita a execuo de junes.

Estrela e suas Variaes Uma das formas de apresentao de um banco de dados multidimensional atravs do Modelo Estrela, tabela de fatos e, ao seu redor, as dimenses. um modelo simples e eficiente, caracterizado por possuir uma nica tabela de fatos e chaves simples nas tabelas de dimenses. Cada dimenso representada por uma nica tabela. Modelo Estrela Parcial. uma variao do Modelo Estrela, na qual existem vrias tabelas fato e de dimenso separadas lgica e fisicamente por nveis de sumarizao. Modelo Estrela com Particionamento de Fatos ( ou Modelo Constelao de Fatos) uma variao do modelo Estrela Parcial, na qual os fatos so particionados e as dimenses compartilhadas. Modelo Estrela com Particionamento de Dimenses Assim como o anterior, uma variao do Modelo Estrela Parcial, porm com as dimenses particionadas, compartilhando a tabela de fatos. Snowflake e suas Variaes Os modelos Snowflakes acrescentam graus de normalizao s tabelas de dimenso do Modelo Estrela, eliminando redundncia e a necessidade do indicador NVEL. Modelo Snowflake Lookup Neste modelo, ilustrado na figura 17, as tabelas de dimenses so normalizadas, resultando na eliminao de redundncias, o que torna a manuteno mais gil e o modelo mais consistente. Modelo Snowflake Chain

Pgina 5 de 6

Este modelo encadeia as tabelas de dimenses comeando com a tabela principal, que o ponto de entrada para a tabela fato. A tabela principal da dimenso contm a chave para o prximo nvel da hierarquia da dimenso e assim por diante.

Modelo Snowflake Attribute Com o objetivo de reduzir o nmero de informaes referentes a atributos nas tabelas de fatos, geralmente utilizados para obteno de detalhes (drillthrough), inserimos todos eles em uma tabela de atributos. Modelo Snow flake Atribute Outra utilizadade deste modelo a consolidao de informaes sobre diversas pequenas dimenses que possuam poucos campos (muitas vezes apenas a descrio) em uma nica tabela. Desse modo, o nmero de tabelas em junes pode ser reduzindo, melhorando o desempenho.

Pgina 6 de 6

Das könnte Ihnen auch gefallen