Beruflich Dokumente
Kultur Dokumente
____________________________________________________________________________________
MSc. FERNANDO MASANORI ASHIKAGA
____________________________________________________________________________________
Dra. DANIELA LEAL MUSA
____________________________________________________________________________________
MSc. CARLOS AUGUSTO LOMBARDI GARCIA
___/___/___
DATA DE APROVAÇÃO
4
RESUMO
No mercado econômico atual, onde as empresas precisam se destacar entre seus concorrentes,
algum método diferencial deve ser implantado. Hoje em dia, a informação é a ferramenta
mais poderosa e importante que uma organização pode ter. Portanto, deve-se saber explorá-la
da forma mais inteligente possível para obter conhecimento sobre a própria empresa e tomar
decisões estratégicas, visando a melhoria da organização e, consequentemente, ganhando
destaque no mercado. Um sistema de Business Intelligence tem a função de fazer essa análise
de dados e retornar resultados, utilizando ferramentas como o Data Warehouse. Muitas
empresas de grande porte utilizam o Business Intelligence, mas poucas são as empresas de
pequeno porte que fazem uso dessa tecnologia. Esse trabalho explica as ferramentas utilizadas
em um ambiente de Business Inteligence, apresenta as formas de modelagem de um Data
Warehouse a ser utilizado em micro e pequenas empresas e analisa a estrutura dos sistemas de
algumas pequenas empresas, comparando com uma grande empresa que utiliza o Business
Intelligence; a fim de mostrar a viabilidade da implantação desse sistema.
ABSTRACT
In the actual economic market, where companies need to standout from their competitors,
different methods of drawing attention should be implanted. Nowadays, information is the
most powerful and important key that an organization may have. Therefore, information
should be used in the best possible way to obtain knowledge about the company itself, hence
helping the company make strategic decisions to improve the organization, obtaining a
noticeable position in the market. A Business Intelligence System can analyze this data and
present the necessary results by using tools such as the Data Warehouse. Many big
companies use the Business Intelligence System, but few are the small companies that take
advantage of this technology. This project explains the tools used in the Business Intelligence
environment, presents the modeling forms of a Data Warehouse system used in small
companies, and analyzes the structure of a few small companies, comparing them to a big
company which uses Business Intelligence, in order to show the viability of implementation of
this system.
LISTA DE ILUSTRAÇÕES
BI – Business Intelligence.
DM – Data Mining
DW – Data Warehouse.
ETL – Extraction, Transformation and Load
MPEs – Micro e Pequenas Empresas
ODS – Operational Data Store
OLAP – Online Analytical Processing
OLTP – On-Line Transaction Processing.
SEBRAE – Serviço Brasileiro de Apoio às Micro e Pequenas Empresas.
SGBD – Sistema de Gerenciamento de Banco de Dados
8
SUMÁRIO
1 INTRODUÇÃO ............................................................................................. 10
1.1 Motivação ....................................................................................................... 10
1.2 Objetivos ......................................................................................................... 10
1.3 Metodologia .................................................................................................... 10
1.4 Organização do trabalho ................................................................................. 11
2 DATA WAREHOUSE APLICADO ÀS PEQUENAS EMPRESAS ........ 12
2.1 Business Intelligence ……………………………………………………...... 12
2.2 OLTP (On-Line Transaction Processing) …………………………………... 15
2.3 ETL (Extraction, Transformation and Load) ..…………………………….... 15
2.4 Metadados ………………………………………………………………....... 17
2.5 Data Warehouse .............................................................................................. 18
2.5.1 Características do DW .................................................................................... 18
2.5.2 Passos para implantar um Data Warehouse .................................................... 19
2.6 Modelagem Multidimensional ………………................................................ 20
2.7 Data Mart ........…………………………………………………………........ 21
2.8 OLAP (On-Line Analytical Processing) ......................................................... 22
2.9 Considerações Finais ....................................................................................... 24
3 MODELO DE DW PARA MICRO E PEQUENAS EMPRESAS ............ 25
3.1 Pequenas empresas e suas necessidades .......................................................... 25
3.1.2 Infra-estrutura .................................................................................................. 26
3.2 Levantamento das entidades globais ............................................................... 27
3.3 Definindo Modelo Multidimensional .............................................................. 28
3.3.1 Definindo granularidade .................................................................................. 31
3.3.2 Definindo critérios de particionamento ........................................................... 32
3.4 Ciclicidade dos dados e dados instantâneos .................................................... 33
3.5 Escolha de uma arquitetura ............................................................................. 33
3.6 Popular o Data Warehouse .............................................................................. 34
3.7 Consulta ........................................................................................................... 35
3.8 Considerações Finais ....................................................................................... 36
4 ANÁLISE DA ESTRUTURA DE PEQUENAS EMPRESAS ................... 38
4.1 Infra-estrutura .................................................................................................. 38
4.1.1 Configuração dos computadores ..................................................................... 39
9
1 INTRODUÇÃO
1.1 Motivação
A maior parte das empresas estabelecidas no território brasileiro são micro e pequenas
empresas (MPEs), representando uma fatia de 98% das 5.1 milhões existentes (SEBRAE/SP
2008). Além de contribuir, gerando renda para o país, as micro e pequenas empresas são
responsáveis por 60% dos empregos com carteira assinada no país.
Apesar de serem importantes para o desenvolvimento do país, cerca de 27% das MPEs
morrem no primeiro ano e 60% delas não sobrevivem aos cinco primeiros anos, um fato
negativo para o país. A cada ano, 267 mil ocupações deixam de existir, o que gera um
prejuízo de 16 bilhões de reais.
Segundo pesquisa feita pelo SEBRAE com os próprios empresários em 2004, aponta que de
acordo com 49% dos entrevistados, para o sucesso, é necessário possuir um bom
conhecimento de mercado na área em que atua; e 48% acham importante ter boas estratégias
de vendas.
1.2 Objetivos
1.3 Metodologia
11
O trabalho faz uma análise da estrutura de três supermercados de pequeno porte, inclusive dos
sistemas automatizados implantados em cada um, e compara com um caso de uma empresa de
grande porte que possui um sistema de BI, para analisar a viabilidade da implantação desse
sistema nas pequenas empresas.
O quinto capítulo mostra a comparação feita entre uma grande empresa com sistema de BI e
três pequenas empresas.
O BI consiste, basicamente, em cada empresa examinar sua base de dados e analisar o que
deve ser feito em termos de planejamento (AUDY; ENDRES; MALVEZZI, 2003). Ele pode
ser implantado tanto em grandes quanto em pequenas e médias empresas (HABERMANN,
2006). Em relação à concorrência entre organizações, as que utilizam o BI em seu processo de
gerenciamento levam vantagem no mercado competitivo, afinal, não é de hoje que as
empresas competem umas com as outras para atingir um alto grau de qualidade, satisfazer as
necessidades dos clientes e, consequentemente, obter maiores lucros. O sistema capitalista
impõe essa competição e, para não sair perdendo, as empresas precisam realizar um bom
planejamento estratégico focado principalmente na tomada de decisões (BARBIERI, 2001).
13
Qualquer organização, seja qual for seu porte, possui dados que guardam várias informações
estratégicas. No entanto, estas informações precisam estar disponíveis para as pessoas certas e
tratadas de forma correta, para que se possa realizar uma análise eficaz, resultando na
extração de conhecimento (HABERMANN, 2006).
Uma simples análise das vendas do último mês, do produto mais vendido e do menos vendido
ou até dos produtos comprados pelo consumidor mais assíduo em um determinado intervalo
14
de tempo, podem ser fontes de informações para uma pequena empresa reconhecer se o
planejamento realizado está surtindo efeito ou se mudanças devem ser iniciadas. Ou seja,
essas informações auxiliarão as empresas a se adequarem conforme as necessidades dos seus
clientes.
Muitas empresas de pequeno e médio porte ainda organizam seus dados em planilhas, pois
acreditam não ser capazes de sustentar financeiramente a implantação de aplicações de BI.
Porém, nem todos os projetos de Business Intelligence começam com um alto custo. O capital
a ser investido aumenta com o tempo, de acordo com a necessidade e com o crescimento da
empresa (HABERMANN, 2006).
Feito isso, poderá iniciar-se o processo de implantação de uma estratégia mais forte, como o
Business Intelligence, fazendo com que essas empresas tenham cada vez mais visão de
mercado e consigam adequar-se ao contexto em que atuam.
Nenhuma empresa pequena deve esperar seu crescimento para definir um planejamento
estratégico. Muito pelo contrário. As empresas de pequeno e médio porte precisam, desde sua
criação, trabalhar sobre este assunto para tornarem-se grandes organizações. Inicialmente, os
processos de planejamento nestas empresas são incompletos e irregulares, mas, se trabalhados
corretamente e com seriedade, eles serão de extrema utilidade para auxiliar na tomada de
decisões da empresa (PRIMAK, 2009).
Diversas ferramentas podem ser utilizadas na implantação de uma aplicação de BI; como
ferramentas OLAP, Data Mining(DM), Data Warehouse(DW), por exemplo.
15
É justamente desses bancos que os dados são extraídos para compor o Data Warehouse.
Portanto, o DW é composto por vários dados extraídos de diversos bancos que a organização
possui, através do processo de ETL.
A ETL é um dos fatores mais críticos e importantes dentro de um DW, pois segundo Inmon
(2002 apud CRAMER, 2006, p. 21): "O processo de integração e transformação de dados,
tipicamente, consome até 80% dos recursos de desenvolvimento".
As bases de dados das fontes OLTP são os bancos transacionais de uma organização. Seus
dados são extraídos pela ferramenta de ETL e então, são transformados seguindo um padrão
definido. Após a validação destes dados padronizados, eles são enviados ao Data Warehouse
para a realização de análises.
A primeira coisa a se fazer em um processo ETL é definir de que locais os dados serão
extraídos. Várias origens diferentes podem armazenar esses dados, e elas podem possuir
formatos distintos, podendo ser um robusto SGBD ou até mesmo um simples arquivo texto ou
arquivos DBF, entre outros possíveis (KIMBALL e ROSS, 2002).
Com as origens definidas, o próximo passo é extrair os dados dos bancos de dados
transacionais, registro a registro, para serem carregados no aplicativo de solicitação, também é
gerado um catálogo desses dados para controle do sistema.
padronização dos dados, pois estes podem vir com formatação diferente dos diversos OLTP’s,
como no caso do ano que pode ser representado com dois ou quatro dígitos, permitindo uma
análise concisa. Outro exemplo seria um sistema ter a definição do sexo de uma pessoa como
“M” para Masculino e “F” para Feminino e outro sistema ter “M” para Feminino e “H” para
Masculino. Neste caso, o processo de transformação do ETL teria que padronizar os dados
para enviá-los ao Data Warehouse, para não haver informações iguais em formatos distintos
quando o usuário estiver realizando uma análise (CIELO, 2006).
Após serem padronizados, os dados são carregados no Data Warehouse pelo ETL, a partir de
um sistema de banco de dados temporário. E as tabelas que serão atualizadas no sistema de
DW devem ser montadas utilizando-se agregações, sumarizações e ordenação dos dados.
2.4 Metadados
As informações que descrevem os dados de uma empresa são chamadas de metadados. São as
informações de um DW que não são os próprios dados do banco. Os metadados atuam como
uma enciclopédia para o data warehouse (KIMBALL e ROSS, 2002).
Metadados também podem ser gerados por todas as mudanças sofridas pelas regras de
negócio da empresa, além da frequência de acesso aos dados. Com as informações obtidas
pelos metadados, os usuários tornam comuns os cruzamentos entre os dados para identificar
informações que não eram vistas nos sistemas transacionais (INMON, 1997).
Existem três tipos de metadados: os de nível operacional são aqueles existentes nos modelos
de dados dos sistemas transacionais; os de nível warehouse são orientados por assunto e
informam as transformações executadas sobre os dados; e os de nível do negócio representam
as informações disponíveis para análise dos usuários (SEN e VARGHESE, 1998).
Entre alguns exemplos de metadados estão as informações sobre transformações dos dados,
tabelas, colunas, agregações, índices, regras de transformação dos dados, os nomes dos
atributos, os domínios dos valores, os tipos de dados, as tabelas ou arquivos onde são
extraídos os dados, o mapeamento dos campos das tabelas físicas do DW, entre outros.
O DW geralmente utiliza um histórico de informações pelo período de cinco a dez anos. Ele
sempre conterá uma tabela armazenando o elemento tempo (hora, dia, semana, mês, semestre,
ano) para registrar quando uma transição foi realizada (INMON, 1997).
2.5.1 Características do DW
19
Na maioria dos bancos, é necessário um maior controle na entrada de dados, pois estes estão
sendo constantemente modificados, adicionados e removidos pelas transações efetuadas na
organização. Já no Data Warehouse, a preocupação não é com a entrada de dados, mas com a
saída, extração e apresentação dos dados, pois serão os resultados analisados nele que
definirão novas estratégias. E para garantir a eficiência na saída de informações, os DW’s
possuem algumas características:
Orientado por assunto: Os dados de uma empresa são organizados por assuntos de seu
interesse, sendo que estes levam a um assunto principal, que seria o foco central da empresa,
como por exemplo, análise de vendas, análise de segmentos de clientes (INMON, 1997).
Integrado: No Data Warehouse, os dados devem possuir formatos comuns de medida, para
que possa viabilizar uma análise eficiente. E para que um padrão seja aplicado aos dados,
estes passam por uma fase de transformação chamada ETL (INMON, 1997).
Variável no tempo: A análise dos dados em um Data Warehouse ocorre em função do tempo,
para que seja possível visualizar as mudanças que ocorreram na organização. Por isso, a cada
modificação no banco de dados transacional da empresa, uma nova entrada é criada no DW e
os dados deste nunca serão modificados, para que seja possível a análise de todo o histórico
armazenado (INMON, 1997).
Não Volátil: Os dados de um DW nunca poderão ser modificados, o usuário poderá apenas
consultar e gerar relatórios, para garantir o registro das mudanças com o decorrer do tempo
(INMON, 1997).
O Data Warehouse deve ser implantado aos poucos dentro de uma organização.
Primeiramente, devem ser criados todos os Data Mart’s necessários, um para cada
departamento da empresa, e então, chegar ao desenvolvimento de um DW em nível
corporativo. Sete etapas devem ser seguidas para implantação de um DW (FERNANDES et
al., 2006).
20
Etapa 1 – Atingir resultados em curto prazo: Toda e qualquer organização precisa desenvolver
estratégias em um curto prazo, por isso, é necessário definir etapas específicas de construção,
para minimizar os riscos e custo do negócio.
Etapa 2 – Integrar sistemas: É necessário integrar os diversos sistemas da empresa, onde todos
os dados de produção e das fontes externas precisam ser mapeados para o modelo de dados do
DW. Esse processo deve ser sincronizado para evitar problemas de acesso aos dados.
Etapa 6 - Manter o sistema aberto para mudanças: O ambiente DW deve ser aberto para
permitir que as ferramentas escolhidas no início da implantação do sistema possam ser
substituídas por outras mais atuais e eficientes.
Segundo Imhoff, Galemmo e Geiger (2003 apud CRAMER, 2006, p. 24), “um modelo
dimensional é uma forma de modelagem de dados que acondiciona os dados de acordo com
consultas e processos específicos do negócio”. Os objetivos são tornar os esquemas de dados
compreensíveis aos usuários e aumentar o desempenho através de consultas
multidimensionais.
O modelo multidimensional permite que o Data Warehouse seja desenvolvido por partes e
distribuído em toda organização através do uso de dimensões e fatos conforme as bases
lógicas do sistema (KIMBALL, 1998).
Um Data Mart é uma divisão lógica de um Data Warehouse, que atende uma área específica
da organização. Por isso, os DW’s são comumente orientados por assunto. Os Data Mart’s
pertencem às áreas específicas da empresa – contabilidade, finanças, vendas e etc. E são
modelados de acordo com as especificações de cada departamento, possuindo assim, design
único (INMON; TEDERMAN; IMHOFF, 2001).
Mas em um ambiente ideal, os Data Mart’s são integrados, onde existe comunicação entre
departamentos, e os dados possuem um formato mais próximo da realidade da empresa.
Porém, o tempo para seu desenvolvimento é maior.
A seguir, algumas diferenças entre Data Mart e Data Warehouse são apresentadas.
Criado em 1993, por Edgar F. Codd, o OLAP (Online Analytical Processing) - Processamento
Analítico em Tempo Real – é uma ferramenta que promove a busca de informações dentro de
um DW, devolvendo-as ao usuário, permitindo traçar metas estratégicas para a empresa
(CRAMER, 2006).
O THE OLAP COUNCIL(1995), um conselho para padronizar a tecnologia OLAP
(CRAMER, 2006), define o termo como:
O usuário pode fazer uma busca em diferentes níveis de profundidade, dependendo do que ele
queira analisar, e quanto menor for o grau de detalhamento da pesquisa, mais rápida será a
obtenção de resultados.
A base de dados OLAP fornece um método para acessar, visualizar e analisar dados
corporativos com alta flexibilidade e desempenho via um modelo de dados natural e intuitivo.
Existem quatro arquiteturas diferentes de OLAP que classificam-se em ROLAP, MOLAP,
HOLAP e DOLAP.
Também foi mostrado que o Data Warehouse é uma técnica que deve ser implantada
gradualmente, para que se possa ter um retorno imediato da análise dos dados para o
desenvolvimento de estratégias. Para análise de negócios são utilizadas outras ferramentas
além do próprio Data Warehouse, ferramentas como ETL e OLAP que fazem parte do
processo e que devem ser selecionadas de acordo com as necessidades e disposições da
empresa, levando em consideração o tempo de implantação e custos.
25
Este capítulo apresenta o modelo de um Data Warehouse para micro e pequenas empresas.
Inicialmente, faz-se uma abordagem sobre as necessidades das empresas, estruturando o DW
em um padrão mínimo, para que se possa implantar os Data Mart’s e estes comporem o Data
Warehouse.
O capítulo está dividido nos seguintes tópicos: Pequenas empresas e suas necessidades, infra-
estrutura, levantamento das entidades globais, escolha da arquitetura, popular o DW, consulta.
O primeiro passo para modelar um sistema de DW é fazer uma entrevista com os usuários
finais. Ela serve para que os projetistas possam descobrir as necessidades e as expectativas
dos usuários e gerentes da empresa, ou seja, conhecer os problemas da empresa e oferecer um
caminho para que os responsáveis pelo negócio encontrem soluções e estratégias inovadoras
(KIMBALL, 1998).
Muitos problemas ligados às MPEs estão no fato de não investirem em TI, ou investirem de
forma errônea. Conforme informação do presidente do Sindfor (Sindicato da Indústria de
Informática), o engenheiro Arquimedes Oliveira, cerca de 39% das micro e pequenas
empresas brasileiras não investem em TI, pois muitos empresários acham que são pequenos
demais para tal investimento ou que a tecnologia é cara demais. Mas na realidade, se
investirem de forma correta, a tecnologia pode proporcionar o crescimento do negócio ao
aperfeiçoar os processos e andamento da empresa, onde os problemas poderão ser
identificados antes de se tornarem problemas efetivos.
A falta de investimento faz com que as bases de dados OLTPs dessas empresas sejam
precárias. Muitas vezes o cliente nem é mencionado em uma venda, pois a prioridade é vender
e não registrar seus dados, o que é ruim para uma futura análise, pois dificulta traçar boas
26
Então é necessário, inicialmente, fazer um levantamento dos dados que a empresa dispõe e
mais alguns dados externos referentes ao local da empresa, perfil de consumidor, taxas
demográficas, entre outros que possam auxiliar na composição do Data Warehouse.
São pequenos passos que podem fazer grandes diferenças, pois uma vez que a empresa sabe o
que o cliente compra, é possível traçar estratégias para vender mais produtos a ele ou até
mesmo ajudar no controle do estoque, pois se sabe quais produtos determinado cliente
costuma comprar e com que freqüência ele realiza as compras.
Enfim, é necessário ser realista e mostrar que, em determinadas vezes, implantar um DW não
resolveria todos os problemas da empresa, mas é um grande passo para melhoria.
3.1.2 Infra-estrutura
Um dos pontos chave para descobrir as necessidades específicas de cada MPE é fazer uma
pesquisa de campo para estudar sua infra-estrutura. Com essa pesquisa é possível saber, por
exemplo, quantos computadores a empresa possui, e se esses computadores atendem aos
requisitos mínimos para a implementação de um Data Warehouse.
A figura a seguir mostra uma infra-estrutura genérica de uma pequena empresa que utiliza
DW, desde recursos humanos, recursos materiais e os sistemas.
ESTOQUE FORNECEDOR
PRODUTO
VENDA VENDEDOR
CLIENTE
O diagrama ilustra um cenário mínimo de uma pequena empresa, que pode variar conforme a
empresa ou ramo de atividade exercida. Se a empresa for de prestação de serviço, por
exemplo, a entidade venda pode ser a prestação de serviço, e produto seria serviço, entre
outras modificações.
O importante é que esse diagrama mostra a realidade da maioria das pequenas empresas que
estão preocupadas com a venda e obtenção de lucro. Esse seria o mínimo de entidades que
uma pequena empresa deveria possuir e, quanto mais entidades possuir, melhor será, pois
haverá mais dados que poderão ser analisados e transformados em informações.
Depois que todas as entidades dos sistemas da empresa foram levantadas, é necessário
reestruturar, sumarizar os dados para concepção e visualização de conjuntos de medidas que
descrevem aspectos comuns de um determinado assunto. A modelagem multidimensional
facilita as consultas por usuários não técnicos, acelerando o desempenho e admitindo a
redundância de informações. Esse modelo será dividido em três partes: fatos, dimensões e
medidas.
Fatos: um fato é uma coleção de itens de dados, composta de dados de medida e de contexto.
Representa um item, uma transação ou um evento associado ao tema da modelagem.
Medidas: uma medida é um atributo ou variável numérica que representa um fato. Exemplos:
valor da ação, quantidade de produtos vendidos, valor total da venda, etc.
O modelo mais adequado para MPEs, devido à complexidade e menor quantidade de dados
em comparação às grandes empresas, é o modelo Star Join, conhecido como modelo estrela.
Consiste em uma relação central que é o fato cercado por dimensões que compreendem as
detenções do problema.
30
QUANDO?
COMO? ONDE?
FATO
QUEM? O QUE?
No caso das MPEs, uma aplicação mais clara do modelo estrela pode ser aplicada ao cliente,
onde no centro são apresentados os dados relativos à identificação da instância cliente e o
valor da dimensão descrita para cada característica do cliente. E nas extremidades são
descritas as dimensões.
31
O modelo estrela para cliente, representado acima, mostra a tabela de fato cliente, e as várias
dimensões que permitem fazer análises estratégicas. Por exemplo, determinada empresa
poderia distribuir panfletos, com propaganda dos produtos, em determinada região da cidade.
Uma vez que essa região esteja associada à cliente como dimensão de pesquisa –
MORA_REGIÃO, é possível descobrir o impacto que a entrega desses panfletos causaram,
pois se o número de clientes dessas regiões passou a comprar mais, significa que foi uma
estratégia efetiva. É claro que essa pesquisa deve ser repetida várias vezes, para garantir a
consistência da informação, descartando a hipótese de coincidência.
A granularidade dos dados deve ser definida após o levantamento das entidades, porque está
diretamente relacionada ao nível de profundidade de busca por informação dentro do DW,
32
O modelo multidimensional deve ser planejado para que o Data Warehouse possa crescer
gradualmente, portanto é necessário particionar o projeto de acordo com as necessidades do
negócio, como por exemplo, data, área do negócio, área geográfica, permitindo a criação de
Data Mart’s. Com a identificação de pontos falhos e de setores com carência de informação, é
possível definir prioridades. Geralmente, o negócio necessita de resultados mais rápidos em
determinadas áreas de interesse. Serão esses pontos os primeiros a serem implementados a
fim de obter um retorno mais rápido do investimento.
O modelo acima mostra uma possível divisão do DW para pequena empresa, visando seu
crescimento gradual.
33
Os dados dos sistemas transacionais passam por constantes atualizações, ou novos registros
são incluídos, deve-se então definir a ciclicidade em que esses dados devem ser carregados
em um DW, pois se todos os dados forem imediatamente inseridos no DW, a performance do
sistema será comprometida, devido aos recursos das MPEs serem limitados, não podendo
investir em equipamentos melhores.
É necessário definir prioridades, pois atualizações sobre dados do cliente não precisam ser
imediatamente carregados no DW; já no caso de uma venda, pode ser interessante
dependendo da necessidade da empresa em obter relatórios.
A integração dos dados de diversas fontes é uma das principais dificuldades encontrada na
fase de ETL de um sistema DW, por isso deve-se escolher uma entre três arquiteturas que
mais se encaixe nas necessidades e no cenário do negócio.
Se a empresa contiver muitos sistemas e exigir um maior controle sobre os dados, deve ser
utilizada a arquitetura Top-Down, na qual os dados passam pela fase de extração e
transformação, depois são carregados em um sistema intermediário ODS (Operational Data
Store) que integra os diversos dados da empresa e de fontes externas, para depois serem
carregados no DW, conforme a figura abaixo:
34
A maior vantagem das MPEs é que, geralmente, os dados não vêm de diversos sistemas mas
de um sistema responsável pelo controle da empresa como um todo, facilitando assim a fase
de integração, pois os dados possuem formatação única. Logo, a arquitetura que se encaixa na
maioria das MPEs é a Bottom-up, não sendo necessária uma fase intermediária ODS. A
figura abaixo apresenta um modelo da arquitetura Bottom-up:
Popular o DW é uma das fases mais importantes, porque se os dados forem carregados de
forma errada, pode comprometer a fase de busca, ou até mesmo gerar resultados
inconsistentes, por isso é preciso definir regras de transformação e mapeamento dos dados
que atendam as necessidades do negócio.
Mas além das regras, é necessário escolher boas ferramentas para extrair, limpar e carregar os
dados transformados no DW, porém, levando em consideração que o orçamento das micro e
pequenas empresas é limitado, o ideal é utilizar ferramentas de código aberto (Open Source),
que são gratuitas e permitem adaptações para cada tipo de empresa.
Outro ponto importante é que, como na fase de ETL é possível identificar as falhas dos
sistemas transacionais, como no caso de muitas vendas não identificar o cliente, no caso a
falta de dados pode atrapalhar quando a consulta for da dimensão de perfil cliente, apesar de
não impossibilitar uma análise de vendas em função de tempo.
E além dos dados dos sistemas, o DW também será populado com dados externos, como no
caso da empresa fazer uma propaganda com carro de som em determinadas regiões, essa
informação deve ser inserida no sistema permitindo também a análise do ambiente externo,
gerando novas informações. As regras para inserção dessas informações devem ser definidas
levando em conta o tipo de informação e a ocorrência da mesma.
3.7 Consulta
A última fase do Data Warehouse é o planejamento para a exibição dos dados; nesse caso é
necessário definir as ferramentas OLAP que para as MPEs, como as ferramentas de ETL,
devem ser open source.
O OLAP deverá permitir uma busca em vários níveis de profundidade, de acordo com a
granularidade dos dados, levando em consideração o modelo multidimensional. Essa busca
pode ser representada por um cubo de dados que contém os valores medidos e as dimensões
de um determinado fato.
36
A análise pode ser feita em mais de três dimensões que formaria em hipercubo, porém não
existe maneira gráfica ideal de representar um cubo com mais três dimensões, por isso é
utilizado o cubo.
O modelo acima mostra uma consulta do fato venda de (produtos, por tempo e local) que
representam as dimensões da pesquisa. A partir desse cubo é possível visualizar informações
e transformar a informação em conhecimento, que poderão gerar novas estratégias para
empresa.
A busca por informações no OLAP pode ser efetuada através de alguns operadores, que têm
por objetivo definir parâmetros de busca nos modelos multidimensionais.
Este capítulo apresentou um modelo de Data Warehouse para micro e pequenas empresas,
mostrou também as fases para implantação de um DW, desde a pesquisa das necessidades da
empresa até a implantação de sistemas ETL e OLAP, para obtenção dos primeiros resultados.
38
Foram realizadas várias etapas para uma análise ambiental a fim de adequá-las para a
implantação do DW. Foi elaborado também um questionário de suporte que auxiliou no
levantamento das informações, este questionário está no apêndice deste trabalho para o caso
de posteriores consultas. Os principais envolvidos nas entrevistas foram os próprios
proprietários pelo negócio, pois são eles os administradores da empresa.
4.1 Infra-estrutura
Por serem empresas de um mesmo segmento, os três mercados possuem uma infra-estrutura
parecida, o que diferencia um do outro é a quantidade de funcionários e os computadores
utilizados. A tabela abaixo mostra a classificação operacional dos três mercados, feita com
base no questionário realizado em cada empresa.
Os funcionários são tanto do sexo feminino como do masculino, não havendo distinção
significativa para o negócio, o que se percebe nas três empresas a respeito dos funcionários é
que a maioria são jovens e estão trabalhando em seu primeiro emprego. Segundo Roberto
Morais, dono do mercado Eleven, que também é responsável pelas contratações, os
funcionários são jovens porque estão em busca de uma oportunidade para o primeiro
emprego, portanto aceitam receber menos. Já no mercado Patri, a gerente Ângela disse que os
funcionários são jovens porque têm mais facilidade para aprender a operar os computadores.
Os computadores possuem uma configuração compatível com as necessidades atuais das três
empresas. No caso do ELEVEN, eles são novos, com apenas 6 meses de uso, e nas outras
duas não, apesar de serem computadores bons, que comportam com folga a utilização do
sistema transacional. A tabela abaixo mostra a configuração dos micros nos três mercados e o
valor gasto com eles.
O que pode ser observado de diferente quanto à estrutura das três empresas é quanto ao
Supermercado Patri que possui os micros de suporte, cuja finalidade é ajudar no
gerenciamento e controle do estoque, não sobrecarregando o servidor no caso de análises. Por
possuir esses micros de suporte, a empresa possui um sistema de comunicação entre os micros
de forma diferente.
Como será abordado mais adiante, o sistema OLTP das empresas não carregam os dados
diretamente no servidor para não sobrecarregá-lo. Por esse motivo a comunicação na empresa
Patri é diferente, pois os computadores de suporte não se conectam somente ao servidor como
no caso dos caixas, mas conectam-se também aos caixas.
41
A ligação é em duplo sentido – tanto leitura como escrita, para que quando os dados
transacionais forem enviados ao servidor, este possa mandar uma mensagem para os caixas
apagando os dados dos caixas.
Figura 4.1 – Diagrama da conexão entre os computadores nos Mercados Eleven e Yamashita
Já no caso da empresa Patri, os caixas também não se comunicam com outros caixas, mas os
terminais de suporte se comunicam com os caixas, porém apenas em sentido único,
permitindo a consulta dos dados, ou seja, os terminais de suporte não podem enviar uma
mensagem para o caixa apagar os registros depois de carregado, cabendo apenas ao servidor
fazer isso.
42
O dia-a-dia nas três empresas costuma ser bem agitado devido ao número de clientes que
passam pelos mercados, uma média de 900 a 1000 clientes por dia no mercado Eleven, 400 a
600 no Patri e 700 a 900 clientes no Yamashita, aumentando em épocas comemorativas como
no natal.
Para a parte de vendas, segundo os funcionários, os três mercados têm uma rotina bem
parecida. Basicamente, um cliente chega, escolhe os produtos, passa no caixa onde o
funcionário registra o produto através de um leitor de códigos de barras; se o leitor falhar
devido à má conservação da etiqueta, o vendedor deverá registrar manualmente o código
numérico. Depois é apontada a forma de pagamento que pode ser através do cartão de crédito
ou débito do cliente, que automaticamente envia o valor para o leitor de cartões para que o
cliente digite a senha e a venda seja concluída. Já no caso de pagamento em dinheiro, o cliente
entrega o dinheiro, se o valor pago não for exato o funcionário digita no sistema o valor
entregue pelo cliente e o sistema automaticamente mostra o quanto de troco será retornado.
43
O mercado Eleven não aceita cheque como forma de pagamento, devido a problemas com
inadimplência. Já os mercados Patri e Yamashita aceitam, mas disseram que também já
tiveram problemas com pagamento em cheque.
No mercado Eleven, o proprietário Roberto e seu filho são os responsáveis pelo bom
andamento dos negócios. Eles relataram que há um trabalho semanal de passar nas prateleiras
verificando os produtos que estão em falta ou os produtos que estão em baixa, pois o estoque
são os próprios produtos que estão na prateleira para venda. Eles fazem uma lista desses
produtos e encaminham para o fornecedor que na semana seguinte entrega a encomenda,
repondo o estoque; ou seja, de semana em semana chegam novos produtos, esses devem ser
cadastrados no sistema para controle das vendas.
No cadastro, são incluídas informações como marca, tipo, fornecedor, preço e quantidade.
Mas de acordo com Roberto, o tempo para administrar o negócio é curto, e muitas vezes
vários produtos não são cadastrados, gerando um número negativo na quantidade de produtos,
com mais saída (venda), do que entrada (compra para repor estoque). Depois, os produtos são
colocados nas prateleiras de acordo com seu tipo.
Além do cadastro dos produtos, Roberto é responsável por várias funções da empresa como
cuidar das finanças, calculando os lucros e despesas como impostos e salários dos
funcionários, mas para isso ele conta com a ajuda do lápis, papel e calculadora. Segundo ele é
mais fácil e rápido para visualizar e fazer as contas sem o auxílio do computador.
como controle financeiro, de mão de obra e até mesmo acompanhar as vendas, executando
serviços no caixa.
O interessante é que às vezes eles também utilizam o sistema para conferências, verificam se
os resultados finais batem com as saídas e entradas de produtos.
O mercado Patri já segue uma linha diferente, e não é administrada pelos donos, mas sim por
uma pessoa encarregada somente pela administração da empresa. Foi realizada uma entrevista
com a gerente Ângela, que disse que é necessário acompanhar de perto o que acontece na
empresa. Ela disse também ter experiência por já ter trabalhado em grandes empresas e
reconhece a importância da informação para o negócio.
Diferente das outras duas empresas, a falta dos produtos é verificada no sistema e não nas
prateleiras. São encomendados ao fornecedor os produtos que estão em falta e duas vezes por
semana os produtos chegam, sendo 100% cadastrados no sistema. Além do cadastro total dos
produtos, a forma de organização também é diferente dos outros dois mercados. As prateleiras
são numeradas e o próprio sistema indica em que prateleira e qual o corredor determinado
produto deve ser colocado. De acordo com Ângela, isso facilita muito, pois às vezes um
cliente quer saber se tem determinado produto e o operador do caixa pode conferir já
indicando o local em que o produto está localizado. Ou pode ser usado para constatar falta de
produto ou na remarcação de preço no caso de uma promoção, pois não é necessário ficar
procurando o produto.
Uma grande diferença no mercado Patri é que a base transacional funciona off-line, ou seja, o
registro da venda é feito no próprio caixa e cabe à gerente Ângela baixar os dados no servidor
quando este estiver mais disponível.
Já o controle financeiro é feito através do sistema e de planilhas de apoio criadas pela própria
gerente, que depois são apresentadas aos donos da empresa.
que no final das contas acabam ganhando mais do que se fossem receber apenas o salário.
Cada funcionário é cadastrado no sistema e conforme vão consumindo os produtos, o valor é
descontado do vale compra.
Apesar de muito trabalho no dia-a-dia de todos envolvidos no negócio, muita coisa acontece
automaticamente graças ao sistema que compõe as três empresas.
As três empresas possuem o mesmo sistema de gerenciamento fornecido pela empresa MGF
SISTEMAS DE INFORMÁTICA. Esse sistema é responsável pelo controle de vendas,
estoque e financeiro da empresa, fazendo a comunicação direta dos dados entre o caixa e o
servidor. O sistema é dividido em duas partes principais – a parte de RETAGUARDA, que é
responsável pela a administração do negócio, como cadastros, consultas, finanças, entre
outros. A outra parte é o FRENTE DE CAIXA, que é instalado nos caixas para gerenciar as
vendas. As duas partes possuem os recursos listados a baixo:
A parte de Retaguarda é reservada somente aos administradores da empresa, pois sua função é
justamente controlar o que está acontecendo e sobre o que está acontecendo, permitindo desde
cadastros à consultas detalhadas sobre vendas.
Frente de Caixa
- Venda de produtos com ou sem código de barras
- Venda de produtos por etiqueta de balança
- Venda de produtos com pesagem no caixa
- Suprimento e Sangria com indicação de motivo
- Consulta rápida de preços
- Consulta de cheques pendentes
- Cálculo de juros de cheques pré-datados
- Cálculo de acréscimo em vendas com ticket
- Emissão de contravale
- Bloqueio de clientes com restrição
47
A parte do sistema Frente de Caixa é a mais utilizada. Ela se localiza nos caixas, registrando
todas as vendas, realizando consultas de preços para o cliente, entre outras funcionalidades.
Seus recursos são os que estão diretamente ligados ao cliente, além de ser a mais
automatizada e 100% das vendas devem ser registradas nesse sistema, pois se o cliente não
passar no caixa, não poderá levar o produto mesmo que a venda seja fiado.
Muitas operações presentes no sistema das empresas são automatizadas e são invisíveis aos
usuários. No caixa, por exemplo, quando o funcionário registra um produto com o leitor de
código de barras ele não necessita saber que o sistema faz uma consulta sobre o produto
retornando seu valor. E quando a venda é concluída o sistema automaticamente subtrai um
produto no estoque.
Os funcionários que operam os sistemas passaram por um treinamento realizado pela empresa
fornecedora do sistema. O conhecimento do pessoal na área de TI é mais voltado ao negócio
do que conhecimento técnico.
As principais entidades envolvidas nas empresas analisadas são as de produtos e vendas, por
se tratar de mercados. É através dessas duas entidades que é possível saber o quanto entra e o
quanto sai de mercadoria dos supermercados.
Mas no âmbito geral, se as micro e pequenas empresas analisadas fossem da área de prestação
de serviços, provavelmente o cliente também poderia ser uma entidade global, pois
geralmente empresas que prestam serviços costumam ter o cadastro dos cliente com os
serviços prestados para cada cliente, esses serviços poderiam ser comparados com o produto
das empresas analisadas.
Como as entidades globais são os produtos e as vendas, conclui-se que a parte ideal para
começar a implantar um DW nos mercados analisados é a parte de estoque, que foi o foco
para a análise da viabilidade dessa implantação em micro e pequenas empresas.
O banco de dados e o sistema das empresas possuem uma capacidade para operar com mais
de um milhão de registros, permitindo ainda que o sistema funcione normalmente. Mas a
quantidade de dados presente nos três mercados dependem de vários fatores como a data da
implantação do sistema, da quantidade de produtos que realmente é cadastrada, das
funcionalidades do sistema que são utilizadas, entre outros.
A tabela abaixo mostra a quantidade de registros das principais tabelas presentes no sistema
em cada empresa.
Tabela 4.5 – Quantidade de registros armazenados nas principais tabelas dos sistemas
MERCADO DATA IMPLANTAÇÃO PRODUTOS FLUXO DE CAIXA VENDAS
ELEVEN 16 de Janeiro de 2003 5.954 25.484 76.448
YAMASHITA 21 de Agosto de 2000 4.526 17.733 52.894
PATRI 10 de Março de 2009 4.905 42.637 136.066
O mercado Eleven, segundo entrevista, registra no caixa todas as vendas efetuadas, mas não
registra no servidor todas as mercadorias que chegam para repor as prateleiras. Este é um
ponto negativo, pois na hora de tirar a diferença entre entrada e saída de produtos, o resultado
será negativo, pois produtos que saem são subtraídos do sistema, mas os que entram não são
adicionados. Essa prática deixa a informação inconsistente, pois é como se tivesse feito a
venda de um produto que não existisse.
O sistema no mercado Eleven também não é utilizado para os cálculos financeiros. Isso é
ruim, pois não existem dados eletrônicos para uma análise em um Data Warehouse, por
utilizarem o papel e calculadora para fazer o fechamento dos caixas. Para que essa análise
50
possa ser feita, seria necessário digitar os dados que são colocados no papel em um sistema ou
em uma planilha.
Quanto aos recursos, o mercado Eleven possui apenas um servidor, sendo que o ideal seria se
tivesse outro apenas para colocar o DW, mas o proprietário disse estar disposto a investir em
outro computador se fosse necessário.
O cenário do mercado Yamashita é muito parecido com o do Eleven, onde nem todos os
produtos que entram são registrados, além da baixa quantidade de micros e dados, mesmo
com um elevado número de vendas.
Apesar do mercado Patri também não possuir sistema de cartões, eles trabalham com cheque e
com o registro dos clientes que o utilizam. Nesse caso, o DW pode ser utilizado para
encontrar padrões de inadimplência. Além disso, eles possuem um cadastro dos funcionários
que também compram no mercado.
O mercado Patri também conta com micros de apoio que poderiam ajudar na análise do DW,
além desses micros atenderem aos requisitos das ferramentas utilizadas, descritas mais
adiante, ou seja, um desses micros poderia ser reservado ao DW.
Nas três empresas foram encontradas dificuldades para compreensão do sistema que a
compõe devido a falta de uma documentação adequada. Geralmente, são poucas as pequenas
empresas que compram um sistema e preocupam-se com a documentação. Segundo os
administradores das empresas entrevistadas, não foi solicitada documentação porque o
51
importante era o funcionamento do sistema, além das três serem conveniadas à empresa
fornecedora de software que se responsabiliza pela manutenção e atualização do sistema.
O modelo que mais se encaixa com o cenário da empresa Patri e das outras duas, assim como
na maioria das pequenas empresas é o modelo estrela, que facilita a compreensão dos
usuários, pois as pequenas empresas possuem menos dados, menos sistemas transacionais e
um menor número de entidades que ficarão bem representadas com este modelo.
A figura abaixo representa o modelo estrela para a entidade Produto, feito com base no
sistema OLTP das pequenas empresas analisadas. Essa forma de representação (fato central e
dimensões em torno) é o melhor modelo a ser aplicado nas micro e pequenas empresas.
52
O modelo estrela facilita a compreensão para o usuário, como no caso do produto em que as
informações podem ser pesquisadas selecionando as dimensões em torno.
53
Foi realizada uma análise quanto às entidades que compõem o sistema e a quantidade de
dados relacionados a essas entidades. E apesar do volume de dados nas pequenas empresas ser
bem menor do que nas grandes, seria interessante a utilização de Data Mart’s para facilitar a
organização conforme o crescimento gradual do projeto de DW.
Foi decidido então que o Data Warehouse para o caso dos três mercados analisados deve ser
iniciado pela parte de estoque, que envolve tanto a entidade global Produtos como Vendas.
Portanto, o foco deste trabalho é voltado à parte de estoque. Mas as ferramentas utilizadas e o
crescimento do negócio dirão se outras partes poderão ser implantadas, como a de controle
financeiro e até mesmo a de clientes, caso o mercado passe a utilizar o sistema de cartões.
4.8 Ferramentas
Para que a implantação de um Data Warehouse nas micro e pequenas empresas seja viável, é
necessário escolher ferramentas adequadas que levem em conta os recursos disponíveis nas
empresas como no caso das máquinas, da quantidade e capacidade técnica dos funcionários e
principalmente do valor das ferramentas, pois diferente das grandes, as pequenas empresas
não dispõem de muito dinheiro para o investimento em tecnologia da informação.
Esse investimento, que chega na classe dos milhões para as grandes empresas, só é possível
porque elas têm a consciência de que a longo prazo, o lucro será muito maior. O mesmo
princípio deverá ser levado em conta para as pequenas empresas, considerando as devidas
proporções, pois inicialmente o retorno pode não passar dos milhares.
A fim de reduzir o custo das ferramentas, foi realizada uma pesquisa nas comunidades Open
Source em busca de ferramentas que atendam às necessidades das micro e pequenas
empresas, pois assim a parte mais cara de um Data Warehouse poderia se tornar gratuita.
54
Porém, não é porque as ferramentas são open source que deixam a desejar. Elas devem seguir
a alguns padrões de qualidade que são seguidos até pelas ferramentas comercias famosas.
A ferramenta de ETL escolhida para análise foi o Talend Open Studio. Desenvolvida em Java
e disponibilizada em 2006 pela empresa francesa Talend, ela é uma ferramenta open source
com uma interface gráfica baseada no Eclipse. O Talend dispõe de mais de 400 componentes
prontos que podem ser estendidos utilizando linguagem Perl, Java ou SQL.
Fonte: (www.talend.com)
A tabela a seguir faz a comparação entre três ferramentas open source de ETL (Kettle,
CloverETL e Talend Open Studio), de acordo com seus requisitos.
Tanto o Kettle quanto o Talend Open Studio se mostraram eficientes na maioria dos requisitos
apresentados. Enquanto o primeiro leva vantagem por disponibilizar uma linguagem de
programação para transformação de dados, o segundo se destaca por permitir o processamento
distribuído.
56
No caso do mercado Patri, por exemplo, com uma arquitetura distribuída é possível que os
dados sobre as vendas possam ser extraídos dos próprios caixas, já que os caixas também
possuem registros locais, aliviando assim a carga no servidor que forneceria apenas os dados
de produtos para extração.
A ferramenta OLAP, open souce, que vem sendo muito explorada nos últimos anos é o
Mondrian da comunidade Pentaho. Escrita em Java, o Mondrian possui quatro camadas,
descritas a seguir.
Camada de Apresentação, que faz a interface com o usuário final onde é exibido o resultado
final, através de gráficos, mapas entre outros.
Camada Estrela, que é responsável pelo relacionamento dos valores conforme os diferentes
níveis de pesquisa. É responsável também pelo armazenamento da informação.
O Mondrian utiliza esquemas para realizar as consultas, esses esquemas definem uma base de
dados multidimensional, e contém estruturas como cubos, hierarquias, níveis, medidas e
dimensões. Ou seja, são esses esquemas que definem quais dados serão consultados sobre
57
quais circunstâncias. A partir desse esquema serão exibidos os resultados para o usuário, onde
o Mondrian trabalhará em conjunto com o JPivot.
4.8.2.1 JPivot
O Talend Open Studio tem se mostrado bastante eficiente até mesmo para as grandes
empresas, demonstrando que com o crescimento da pequena empresa não deva ser necessário
59
utilizar outra ferramenta; e por possuir uma arquitetura distribuída também não será
necessário um investimento tão alto em equipamentos, barateando o custo de manutenção. E
segundo informação publicada no site oficial da Talend1, em 2009 a empresa recebeu o
investimento de doze milhões de dólares para serem investidos no aperfeiçoamento da
ferramenta, principalmente devido à utilização em SAP e com cerca de 3,3 milhões de
downloads da ferramenta desde sua data de disponibilização.
As análises feitas com os dados das empresas permitiram detectar alguns padrões e problemas
imediatos que poderiam ser utilizados como estratégia ou corrigidos o quanto antes pelas
empresas.
Um dos problemas que ficou transparente nas análises e que inclusive foi descrito pelos
administradores das empresas Eleven e Yamashita foi a falta de cadastro dos produtos que
chegavam pra repor o estoque.
Os gráficos abaixo mostram justamente a diferença entre a entrada e saída de produtos que
fica negativa, pois muitos produtos que são vendidos não possuem a quantidade cadastrada
corretamente no sistema OLTP.
1
http://www.talend.com/press/Talend-Secures-12-Million-dollar-in-Funding-to-Fuel-Continued-Worldwide-
Growth-and-Momentum.php
2
http://www.mondriantecnologia.com/site/node/9
60
Figura 4.6 – Médias de entrada e saída de produtos registrados nos sistemas OLTP’s dos
mercados Eleven e Yamashita
Figura 4.7 – Diferença entre as médias de entrada e saída de produtos registrados nos
sistemas OLTP’s dos mercados Eleven e Yamashita
A análise mostra uma falha que deve ser corrigida, a existância de mais produtos saindo do
que entrando no sistema, o que seria impossível uma vez que para determinado produto ser
vendido, é necessário obtê-lo. Essa diferença pode gerar inconsistência e a empresa não
poderá detectar problemas relacionados ao estoque, como a perda de produtos, análise da
quantidade de produtos vendidos em determinado período de tempo, entre outros.
61
Já no caso do mercado Patri, onde foi possível analisar os dados de forma concisa, foi
detectado um padrão interessante no setor de açougue. O gráfico abaixo mostra as vendas
efetuadas no açougue do mercado no mês de setembro de 2009.
Ao observar o gráfico, é possível constatar que existem picos nos finais de semana, ou seja, a
maior parte das vendas do açougue é no sábado e domingo. O administrador do mercado Patri
poderia criar novas estratégias com os resultados, como fazer promoções para vender mais no
meio de semana, ou tentar oferecer outros produtos em promoção para vender em conjunto
com os produtos de açougue.
Em função disso, foram apresentados aos administradores das duas empresas alguns casos
com as vantagens de um DW e a importância do registro da informação – dos produtos que
chegam e os que são vendidos, e a utilização do máximo possível do sistema que compõe as
empresas. Pois é através dos dados que é possível fazer uma análise para projetar novas
estratégias. Os administradores tanto do mercado Eleven como Yamashita disseram não
priorizar tanto a parte de TI da empresa, porém reconhecem que pode ser um diferencial para
o seu crescimento, e disseram que passarão a dar mais importância para que seja possível a
implantação de um Data Warehouse, e assim possam descobrir pontos falhos e novas
estratégias para o negócio.
63
5 VERIFICAÇÃO DE VIABILIDADE
A Cooperativa Central Oeste Catarinense Aurora é uma empresa de grande porte do setor
alimentício, composta por 17 filiais, com mais de 77 mil associados e 11 mil funcionários.
Ela emite mais de oito mil notas ficais por dia, esse elevado número de notas gerou ao longo
dos anos uma enorme massa de dados.
Os sistemas baseados em mainframe não eram suficientes para análise dos dados, o que fez a
empresa investir em uma solução de BI. Para isso, a Aurora fez uma parceria com a empresa
Benner, fornecedora de BI, que havia comprado a DSS. Segundo Claudio Figueira Cotini,
gerente de TI da Aurora, o custo foi baixo, se comparado ao retorno que traria para a empresa,
pois o nome da DSS/Benner associado a uma grande cooperativa seria bom para sua imagem.
A parceria durou um ano, porém o processo para implantação do BI foi feito em um tempo
menor, graças ao desenvolvimento de uma ferramenta de extração.
Após a implantação, o sistema passou a rodar em servidores NovaScale Montecito com banco
de dados Oracle que utiliza servidor HP Xeon Quadcore 2,33 GHz rodando em Linux. Já a
aplicação de BI roda em um servidor Intel Xeon Dualcore 2,33 GHz com o sistema
operacional Windows Server 2003.
A maior diferença entre as empresas de grande e de pequeno porte, é que as grandes possuem
muitos dados e muito mais recursos materiais e financeiros, e quando é feito investimento na
área de TI, espera-se um grande retorno em lucro.
A tabela a seguir faz uma comparação entre a Aurora Alimentos e os mercados analisados
neste trabalho, a partir de seus dados e informações, a fim de estruturar conclusões quanto à
viabilidade da implantação de um sistema de Business Intelligence em pequenas empresas.
65
Tabela 5.1 - Comparação conclusiva entre Aurora Alimentos e os três mercados analisados
COMPARAÇÃO MÉDIA CASO AURORA PEQUENAS EMPRESAS
ALIMENTOS ANALISADAS
A Aurora possui 11 mil funcionários, dos quais 300 fazem parte da divisão de BI da empresa
(GONZALES, 2009). Já nos três mercados analisados, a média é de 10 funcionários e no
máximo 3 deles poderão ser encarregados pelas análises de informações. Apesar do baixo
número de funcionários, as pequenas empresas possuem mão-de-obra suficiente para realizar
análises dos dados, pois o volume de dados é bem menor do que nas grandes empresas, com
uma média de 750 registros diários de vendas, contra 8 mil da Aurora Alimentos.
Devido a esse baixo volume de dados, os computadores das pequenas empresas não precisam
ser tão robustos. Assim, elas não precisam investir muito em equipamentos, sendo que os
66
próprios já presentes poderão ser utilizados para a implantação do DW, como no caso do
mercado Patri que possui os computadores de suporte, dos quais um poderia ser remanejado
para ser o repositório de DW. E para os outros dois mercados o investimento máximo com
equipamentos seria de R$1.500,00. Já no caso da Aurora Alimentos, o grande volume de
dados torna necessária a utilização de máquinas servidoras Xeon, que custam em torno de
R$5.000,00 cada1, podendo variar de acordo com suas configurações.
As grandes empresas possuem reservas financeiras para investir em soluções de BI. No caso
da Aurora Alimentos, o custo pelas ferramentas não foi divulgado, mas geralmente as
empresas de grande porte gastam apenas pelas licenças do projeto um mínimo de
R$100.000,002. Porém, as pequenas empresas não dispõem da mesma potência financeira,
mas a utilização de ferramentas Open Source viabilizam a implantação do projeto, pois estas
estão em constante ascensão no mercado, passando a conter todos os recursos necessários ou
até mais, como no caso do Talend Open Studio, que é a única ferramenta com arquitetura
distribuída. Segundo a Benner – empresa que implantou o BI na Aurora Alimentos – “a
maioria das empresas não quer gastar R$150.000,00 em um sistema de BI”3, isso mostra que
as ferramentas open source já estão sendo utilizadas também por grandes empresas, provando
assim sua viabilidade.
A tabela 5.1 mostra que tanto as pequenas como as grandes empresas possuem dificuldades
para extrair informações de seu próprio negócio sem a utilização de soluções de BI. No caso
da Aurora Alimentos, os sistemas transacionais não eram suficientes para gerar relatórios em
um curto tempo, podendo levar até 48 horas para obter as informações que eram geradas em
forma de texto, dificultando a compreensão dos executivos da empresa. Quanto às pequenas
empresas analisadas, apenas uma utiliza corretamente os sistemas transacionais para a busca
de informações – o mercado Patri. Já as outras duas não utilizam o sistema transacional,
fazendo as projeções manualmente, em papel e com controle visual de estoque, levando muito
tempo e permitindo a imprecisão das informações projetadas.
1 http://www.itbras.com.br/produtos/det/496316-201/HP/Servidores/Servidores-Rack/Servidor-Proliant-ML350-
G5-XEON-Quad-Core-5410-2.33GHz.aspx
2
http://emails.wba.com.br/upload/fotos/clicknewsproduto.pdf
3
http://www.benner.com.br/novosite/web/noticia.asp?catid=336&idconteudo=1311
67
6 CONSIDERAÇÕES FINAIS
A realização desse trabalho é de grande relevância para as micro e pequenas empresas que
querem se destacar no mercado e, a longo prazo, tornar-se uma grande empresa. Pois os
estudos realizados mostram que é possível uma pequena empresa investir em um sistema de
BI. Porém, é interessante ressaltar que elas precisam ter consciência de que deve haver um
investimento na área de TI e que os resultados começam a surgir a longo prazo.
Outra abordagem que pode ser aprofundada é quanto ao Data Warehouse relacionado ao SOA
(Arquitetura orientada a serviços). Além de Cloud Computing, podendo funcionar como um
Database As A Service.
70
REFERÊNCIAS BIBLIOGRÁFICAS
AUDY, Rejane Blomberg; ENDRES, Ana Cristina Trois; MALVEZZI, Maria Luiza
Falsarella. Case BI – Informações Gerenciais em Hospital de Referência. Porto Alegre:
2003. 11p. Artigo – Hospital de Clínicas de Porto Alegre. Disponível em : <
http://inf.unisul.br/~ines/workcomp/cd/pdfs/2420.pdf > Acesso em: 02 abr. 2009.
CIELO, Ivã. ETL – Extração, Transformação e Carga de Dados. [s.d]. Disponível em: <
http://www.datawarehouse.inf.br/etl.htm > Acesso em: 05 mar. 2009.
CRAMER, Renato. Estudo Analítico de ferramentas open source para ambientes OLAP.
Criciúma, 2006. Disponível em: <
http://www.datawarehouse.inf.br/Academicos/OpenSource.pdf > Acesso em: 05 mar. 2009.
ECKERSON, Wayne. A New Old Market. The Data Warehouse Institute, 2002.
Disponível em: < http://www.tdwi.org/research/display.aspx?id=6475 > Acesso em: 02 abr.
2009.
GONZALES, Max Alberto. Aurora usa BI para extrair valor de montanha de dados.
2009. Disponível em: < http://info.abril.com.br/ferramentas/print.php> Acesso em: 19 out.
2009.
71
INMON, William H. Como Construir o Data Warehouse. 2ª ed. Rio de Janeiro: Editora
Campus, 1997. 388 p.
INMON, William H.; TEDERMAN, R. H.; IMHOFF, Claudia. Data Warehouse: Como
transformar informações em oportunidades de negócios. Tradução de Melissa Kassner. São
Paulo: Berkeley Brasil, 2001. 266 p.
KIMBALL, Ralph. The Data Warehouse Toolkit: Practical Techniques for Building
Dimensional Data Warehouse. John Wiley & Sons, 1996. 374 p.
KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: Guia Completo para
Modelagem Dimensional. Rio de Janeiro: Editora Campus, 2002. 494 p.
SANTOS, Alan Ricardo dos. Análise de ferramentas de código aberto para construção de
Data Warehouse e Processamento Analítico On-Line. Londrina: Universidade Estadual de
Londrina, 2006. 60f. Trabalho de Conclusão de Curso apresentado à Universidade Estadual de
Londrina, como parte dos requisitos para obtenção do título de Bacharel em Ciência da
Computação, Londrina, 2006.
SERAIN, João Sidemar. Por que Business Intelligence? 2007. Disponível em: <
http://imasters.uol.com.br/artigo/5415/bi/por_que_business_intelligence/ > Acesso em: 02
abr. 2009.
<http://linux.softpedia.com/progScreenshots/Talend-Open-Studio-Screenshot-19135.html>
Acesso em: 19 out. 2009.
<http://www.benner.com.br/novosite/web/noticia.asp?catid=336&idconteudo=1311> Acesso
em: 19 out. 2009.
<http://www.itbras.com.br/produtos/det/496316-201/HP/Servidores/Servidores-
Rack/Servidor-Proliant-ML350-G5-XEON-Quad-Core-5410-2.33GHz.aspx> Acesso em: 19
out. 2009.
73
<http://www.talend.com/press/Talend-Secures-12-Million-dollar-in-Funding-to-Fuel-
Continued-Worldwide-Growth-and-Momentum.php> Acesso em: 19 out. 2009.
74
APÊNDICES
Qual a faixa etária, sexo e formação de cada funcionário que utiliza os computadores?
Faixa de 19 a 28 anos.
Masculino e feminino.
Alguns possuem Ensino Médio completo, outros estão cursando Ensino Superior.
Tanto o servidor quanto os caixas são Celeron 2.22GHz, com 2GB de memória, 150GB de
HD e com Windows XP instalado.
Qual a faixa etária, sexo e formação de cada funcionário que utiliza os computadores?
Faixa de 19 a 30 anos.
Masculino e feminino.
Alguns possuem Ensino Médio completo, outros estão cursando Ensino Superior.
O servidor é Celeron 2.0GHz, com 512MB de memória, 40GB de HD e com Windows Server
2003 instalado.
Os computadores de suporte são Atholon 1.47GHz, com 256MB de memória, 40GB de HD e
com Windows XP instalado.
Qual a faixa etária, sexo e formação de cada funcionário que utiliza os computadores?
Faixa de 20 a 40 anos.
Masculino e feminino.
Alguns possuem Ensino Médio completo, outros estão cursando Ensino Superior.