Sie sind auf Seite 1von 86

ANHANGUERA EDUCACIONAL S.A.

FACULDADE DE NEGCIOS E TECNOLOGIA DA INFORMAO - FACNET


BACHARELADO EM SISTEMAS DE INFORMAO BSI

PBIOS - PROJETO DE BUSINESS INTELLIGENCE OPEN SOURCE

CLEITON DE PAULO DA SILVA FREITAS


JOO HENRIQUE FROTA CAVALCANTE
OTAVIO AIRES LUSTOSA
THIAGO PEREIRA E SILVA MACDO
WASHINGTON MOREIRA DO NASCIMENTO

Braslia
2012

CLEITON DE PAULO DA SILVA FREITAS


JOO HENRIQUE FROTA CALVALCANTE
OTAVIO AIRES LUSTOSA
THIAGO PEREIRA E SILVA MACDO
WASHINGTON MOREIRA DO NASCIMENTO

PBIOS - PROJETO DE BUSINESS INTELLIGENCE OPEN SOURCE

Trabalho de concluso de curso apresentado


ao Curso de Sistemas de Informao da
Faculdade

Anhanguera,

como

requisito

parcial obteno do ttulo de Bacharel em


Sistemas de Informao.

Orientador: Guilherme Parente Costa

Braslia
2012

CLEITON DE PAULO DA SILVA FREITAS


JOO HENRIQUE FROTA CALVALCANTE
OTAVIO AIRES LUSTOSA
THIAGO PEREIRA E SILVA MACDO
WASHINGTON MOREIRA DO NASCIMENTO

PBIOS PROJETO DE BUSINESS INTELLIGENCE OPEN SOURCE

Trabalho de concluso de curso, apresentado como requisito final para obteno do


grau de Bacharel em Sistemas de Informao da Faculdade de Negcios e
Tecnologia da Informao FACNET.

Data de Aprovao:
__/__/__

BANCA EXAMINADORA

Nome:
Instituio:
Assinatura:
Nome:
Instituio:
Assinatura:

Nome:
Instituio:
Assinatura:

Queremos dedicar em primeiro lugar, a Deus, pela fora e


coragem durante essa caminhada. Dedicamos tambm aos
nossos familiares que sempre estiveram ao nosso lado, nos
dando fora quando mais precisvamos e sempre acreditaram
no nosso potencial.

AGRADECIMENTOS

Agradecemos inicialmente a Deus, que nos ajudou a transpor todas as dificuldades


e a quem devemos esse e todos os nossos projetos. Aos nossos mestres, que
conquistaram nosso respeito e admirao, nossos colegas e todos os integrantes do
curso de graduao, que direta ou indiretamente contriburam para a concluso
deste trabalho. Um agradecimento especial nossa famlia que nos momentos de
maior dificuldade no desistiram do nosso potencial e aos nossos amigos pelo
companheirismo.

H duas formas para viver a vida:


Uma acreditar que no existe milagre,
A outra acreditar que todas as coisas so um milagre.
Albert Einstein

RESUMO

A informao se tornou uma aliada primordial no apoio operacional das


organizaes, porm, muitas vezes esta no tida como um elemento base no seio
da tomada de decises estratgicas. Nesse cenrio, alta a dificuldade de realizar
anlises do negcio de forma a alcanar um diferencial competitivo. A monografia
tem como objetivo descrever o desenvolvimento de uma soluo de Business
Intelligence, utilizando ferramentas que se enquadram nos conceitos de software
livre e cdigo aberto, se tornando uma soluo de baixo custo e de alto valor
agregado, que ao final permitir atravs de relatrios gerenciais e anlises sobre o
negcio da organizao, as tomadas de decises mais rpidas e assertivas. A
soluo utiliza de um estudo de caso no qual inclui a construo de um Data
Warehouse e posteriormente a disponibilizao de consultas analticas ao usurio
de negcio.
Palavras-chave: Business Intelligence, software livre, cdigo aberto, decises.

ABSTRACT

The information became a primordial ally in the organizational operational backing;


however, many times this is not a base element in the middle of strategic decision
making. In this scenario the level of difficulty to perform business analysis to
accomplish a competitive differential is very high. The monograph have the objective
to describe the development of a Business Intelligence solution using software tools
that fits in the concept of free software and open source, being a low cost and high
added value, that will allow more quickly and assertive decision making through
management reports and business analysis about the organization. The solution
explores a use case that includes the development of a Data Warehouse and
afterwards will make available analytical queries to the business user.
Keywords: Business Intelligence, free software, open source, decision.

LISTA DE SIGLAS

BI Business Intelligence
DW Data Warehouse
ETL Extract, Transform, Load
MDS - Ministrio do Desenvolvimento Social e Combate Fome
DM - Data Mart
SIT - Sistema de Informao Transacional
SQL - Structured Query Language
OLAP - Online Analytical Process
MOLAP - Multidimensional Online Analytical Process
ROLAP - Relational Online Analytical Process
HOLAP - Hybrid Online Analytical Process
DOLAP - Desktop Online Analytical Process
SGBD - Sistema Gerenciador de Banco de Dados
CADUNICO - Cadastro nico
SICON - Sistema de Condicionalidades
SIGCISTERNAS Sistema de Cisternas

LISTA DE FIGURAS

Figura 1 Processo para deciso......................................................................................................... 13


Figura 2 - Componentes/Arquitetura DW .............................................................................................. 14
Figura 3 - Componentes de um DW ..................................................................................................... 17
Figura 4 - Exemplo de tabela fato ......................................................................................................... 20
Figura 5 - Exemplo de tabela de dimenso .......................................................................................... 21
Figura 6 - Modelo Estrela (Star Schema) .............................................................................................. 22
Figura 7 - Exemplo de processo ETL .................................................................................................... 25
Figura 8 - Exemplo de um cubo OLAP ................................................................................................. 28
Figura 9 - Arquitetura da Soluo ......................................................................................................... 38
Figura 10 - Modelo de dados Gesto das Famlias .............................................................................. 40
Figura 11 - Modelo de dados Gesto dos Integrantes .......................................................................... 42
Figura 12 - Mapeamento ETL STG_FAMILIA ....................................................................................... 45
Figura 13 - Mapeamento ETL DM_TIPO_LOCALIDADE ..................................................................... 47
Figura 14 - Mapeamento ETL FT_FAMILIA .......................................................................................... 48
Figura 15 - Job de carga da tabela STG_FAMILIA ............................................................................... 50
Figura 16 - Job de carga da dimenso DM_TIPO_LOCALIDADE ....................................................... 50
Figura 17 - Componente tMap para carga da tabela DM_TIPO_LOCALIDADE .................................. 51
Figura 18 - Transformao do campo DESC_TIPO_LOCALIDADE .................................................... 52
Figura 19 - Job de carga da tabela fato famlia ..................................................................................... 53
Figura 20 - Detalhamento do tMap da tabela fato famlia ..................................................................... 54
Figura 21 - Job master gesto das famlias .......................................................................................... 55
Figura 22 - Modelo Fsico Gesto das Famlias ................................................................................... 57
Figura 23 - Modelo de Negcios Gesto das Famlias ......................................................................... 58
Figura 24 - Propriedades do campo no modelo de negcios ............................................................... 59
Figura 24 Tela de login do SpagoBI Server ....................................................................................... 60
Figura 25 - Estrutura para criao dos relatrios .................................................................................. 61
Figura 26 - Exemplo relatrio gesto das famlias ................................................................................ 62
Figura 27 - Gerenciamento dos recursos do projeto............................................................................. 64
Figura 28 - Relatrio Valor da Renda Per capita e total das famlias por Estado ................................ 65
Figura 29 ndices domiclios DF agrupados por tipo de tratamento da gua .................................... 66
Figura 30 ndices domiclios PI agrupados por tipo de tratamento da gua ...................................... 67

SUMRIO
1.

INTRODUO .............................................................................................................................. 11

2.

REFERENCIAL TERICO ........................................................................................................... 12


2.1

BUSINESS INTELLIGENCE ................................................................................................. 12

2.2

DATA WAREHOUSE ............................................................................................................ 15

2.2.1

Arquitetura de Data Warehouse ................................................................................. 16

2.2.2

Componentes de um Data Warehouse...................................................................... 16

2.2.3

Sistemas Operacionais de Origem ............................................................................ 17

2.2.4

rea de Data Staging .................................................................................................. 18

2.2.5

rea de apresentao de dados ................................................................................ 18

2.2.6

Ferramenta de acesso aos dados .............................................................................. 18

2.2.7

Modelagem de Data Warehouse ................................................................................ 19

2.3

3.

4.

EXTRACT, TRANSFORM, LOAD ETL .............................................................................. 22

2.3.1

Extrao ....................................................................................................................... 23

2.3.2

Transformao ............................................................................................................. 23

2.3.3

Carga............................................................................................................................. 24

2.4

OLAP ONLINE ANALYTICAL PROCESSING ................................................................... 26

2.5

CDIGO ABERTO (OPEN SOURCE) .................................................................................. 28

DESCRIO DAS FERRAMENTAS............................................................................................ 29


3.1

DBDESIGNER ....................................................................................................................... 30

3.2

POSTGRESQL ...................................................................................................................... 30

3.3

TALEND OPEN STUDIO ...................................................................................................... 31

3.4

SPAGOBI .............................................................................................................................. 31

IMPLEMENTAO DA SOLUO ............................................................................................. 33


4.1

ENTENDIMENTO DO NEGCIO ......................................................................................... 33

4.1.1

Ministrio De Desenvolvimento Social e Combate Fome MDS ........................ 34

4.1.2

Cadastro nico para Programas Sociais do Governo CADUNICO ..................... 34

4.2

DESCRIO SUMRIA DO NEGCIO ............................................................................... 35

4.2.1

Gesto das famlias ..................................................................................................... 35

4.2.2

Gesto dos integrantes............................................................................................... 36

4.3

ARQUITETURA DA SOLUO ............................................................................................ 38

4.4

MODELAGEM DIMENSIONAL ............................................................................................. 38

4.5

PROJETO FSICO DO DATA WAREHOUSE ....................................................................... 43

4.6

DESENVOLVIMENTO DOS PROCESSOS ETL .................................................................. 43

4.6.1

Mapeamento dos Dados para o ETL ......................................................................... 44

4.6.2

Descrio dos Processos ETL ................................................................................... 49

4.6.3

Orquestrao e Agendamento dos Processos ETL ................................................ 55

4.7

DESENVOLVIMENTO DOS RELATRIOS GERENCIAIS .................................................. 56

4.8

GERENCIAMENTO DO PROJETO ...................................................................................... 62

5.

RESULTADOS OBTIDOS ............................................................................................................ 64

6.

CONSIDERAES FINAIS .......................................................................................................... 68

REFERNCIAS ..................................................................................................................................... 70
ANEXOS ............................................................................................................................................... 72

11

1. INTRODUO

Estamos na era dos grandes sistemas de informao, macrossistemas com


grande volume de dados e que normalmente so utilizados apenas como uma forma
rpida de automao e armazenamento, no sendo aproveitados e utilizados de
forma inteligente e eficiente em decises gerenciais e estratgicas.
No contexto de informaes gerenciais, a soluo que tem se destacado com
muito sucesso o Business Intelligence (BI), que envolve uma srie de processos e
etapas que vo desde a preparao dos dados produzidos pelas atividades
operacionais at a concepo de consultas e relatrios que atendam s reas
gerenciais (COMPUTERWORLD, 2012).
Nesse cenrio as organizaes possuem uma enorme dificuldade para
analisar o negcio e verificar tanto a evoluo quanto o desempenho da empresa.
Muitas vezes essas anlises so feitas de forma improvisada, devido ao alto nvel de
complexidade, geralmente os dados esto contidos em diversos sistemas,
necessrio padronizar e organizar os dados de forma visvel ao negcio.
Tudo isso demanda recursos de tempo e recursos humanos, sendo que na
maioria das vezes no atende s necessidades do negcio da forma desejada. A
soluo apresentada vem de encontro a sanar esse problema, disponibilizando aos
usurios de negcio a criao de anlises a partir de informaes que permitem a
tomada de decises de forma rpida e concisa.
O objetivo desse trabalho elicitar informaes, gerenci-las e apresent-las
utilizando os conceitos de Business Intelligence de forma acessvel, trabalhando
com ferramentas de software livre e cdigo aberto. A utilizao de tais conceitos
uma tendncia consolidada no mercado de TI, visto o baixo custo para sua
implantao e possibilidade de customizao. Fatores que so vistos com bons
olhos pelas organizaes, principalmente em casos de novos projetos e tecnologias
que no fazem parte da cultura da organizao.
A implementao do projeto tem como base um estudo de caso realizado
para o Ministrio do Desenvolvimento Social e Combate Fome, tendo como
objetivo a criao de uma soluo de Business Intelligence, composta pela

12

construo de um Data Warehouse (DW) e a gerao de diversas anlises


gerenciais.
Essa monografia est estruturada para apresentar um projeto de Business
Intelligence com ferramentas de cdigo livre. Contudo, no foram abordados apenas
os motivos da implantao, mas tambm a teoria envolvida no conceito de Business
Intelligence, contida em seu referencial terico, as ferramentas utilizadas durante o
processo, presentes na descrio das ferramentas, juntamente com todo o processo
realizado que ser apresentado na implantao da soluo. Por fim, so
apresentados os resultados obtidos com concluses acerca da implantao do
projeto proposto.

2. REFERENCIAL TERICO

Este captulo tem como objetivo descrever os principais conceitos para o


entendimento da soluo apresentada, sendo eles: Business Intelligence, Data
Warehouse, Extract, Transform e Load (ETL) e Online Analytic Process (OLAP).

2.1 BUSINESS INTELLIGENCE

A necessidade por informaes teis para auxlio tomada de deciso


perante as organizaes tem aumentado exponencialmente nos ltimos
anos. Neste contexto, com o grande volume de dados que as organizaes
vm armazenando, torna-se necessria uma ferramenta capaz de realizar a
transformao de dados em informao, que com a Tecnologia de
Informao (TI), o Business Intelligence (BI) vem realizar esta tarefa. Desta
forma, o BI adquiriu um papel extremamente significativo no ambiente dos
negcios, realizando o processo de extrao de grandes quantidades de
dados, analisando-os de forma eficiente para que sejam transformados em
informaes teis para as empresas (ANTONELLI, 2009, p. 79).

Desde a dcada de 90 at a atualidade, presenciada uma grande evoluo


em todos os setores, inclusive na rea de tecnologia da informao e ambientes
empresariais. Diante de tamanho progresso, as ferramentas de software ganharam
maior abrangncia e importncia, e o prprio termo BI ganhou reconhecimento
mundial.
Apesar de um sistema de BI trazer uma soluo tecnolgica o conceito BI no
se limita unicamente tecnologia, segundo Sezes, Oliveira e Baptista Em primeiro

13

lugar, BI refere-se simbiose entre gesto e tecnologia (2006, p. 5). muito


importante o entendimento de que BI vai alm de uma tecnologia, compreende uma
soluo com o objetivo de agregar valor ao negcio de uma organizao provendo
anlises sobre as suas informaes, possibilitando aos gestores e executivos terem
noo do que realmente est acontecendo nas organizaes, possibilitando a
tomada de decises mais rpidas e assertivas.
O termo BI foi criado na dcada de 80 pela empresa Gartner Group, e foi
definido

como:

processo

inteligente

de

coleta,

organizao,

anlise,

compartilhamento e monitorao de dados contidos em DW e/ou Data Mart (DM),


gerando informaes para o suporte tomada de decises no ambiente de negcio
(PRIMAK, 2008, p.5).
BI um termo abrangente que inclui arquiteturas, ferramentas, bancos de
dados, aplicaes e metodologias. BI definido como a transformao de dados em
informaes, depois em decises e finalmente em aes (TURBAN, 2008, p. 27).
A figura abaixo descreve exatamente o conceito de Turban:

Figura 1 Processo para deciso


Fonte: ANTONELLI (2009)

De acordo com a figura acima podemos entender o conceito de Turban, onde


os dados de uma organizao so extrados, transformados em informaes a partir
do conhecimento obtido e por fim decises so tomadas com base nessas
informaes.

14

Existem ainda muitas definies para o termo BI como sendo Inteligncia de


Negcios ou Inteligncia Empresarial um conjunto de metodologias de gesto
implementadas atravs de ferramentas de software, cuja funo proporcionar
ganhos tanto nos processos decisrios gerenciais quanto na alta administrao das
organizaes (ANGELONI e REIS apud ANTONELLI, 2009, p. 79). Tudo isso
baseado na capacidade analtica das ferramentas que integram em um s lugar
todas as informaes necessrias ao processo decisrio. Refora-se que o objetivo
do BI transformar dados em conhecimento, no qual suporta o processo decisrio
com o objetivo de gerar vantagens competitivas.
Um projeto/sistema de BI composto por alguns componentes principais,
sendo eles: um mdulo de ETL, responsvel pela extrao das informaes em
diversas fontes, um DW, local onde ficam concentrados os dados extrados, e um
front-end, parte visvel ao usurio, podendo consistir em relatrios padronizados,
relatrios ad hoc e anlise OLAP.
A figura abaixo apresenta os componentes de um DW:

Figura 2 - Componentes/Arquitetura DW
Fonte SEZES, OLIVEIRA e BAPTISTA (2006)

15

2.2 DATA WAREHOUSE

Geralmente quando falamos em DW imaginamos um produto ou um conjunto


de produtos, porm, um DW vai alm disso. Um DW algo que vem para auxiliar a
gesto de uma empresa, provendo informaes precisas e consolidadas
armazenadas em um repositrio nico.
Conforme Kimball (2002, p. 2) Os objetivos de um DW so distintos dos de
um banco de dados transacional, pois tem como objetivo responder s necessidades
do negcio a partir de informaes gerenciais. Os usurios dos sistemas de
informaes transacionais giram as rodas de uma organizao, eles recebem
pedidos, cadastram novos clientes, entre outras coisas. Geralmente lidam com um
registro por vez e realizam as mesmas tarefas operacionais diversas vezes, no
entanto, os usurios de um DW assistem as rodas de uma organizao girar, eles
contam a quantidade de pedidos e comparam com os da semana anterior,
questionam como e porque novos clientes foram cadastrados e do que eles se
queixaram.
Um DW tem como finalidade tornar a informao de uma organizao mais
acessvel, apresentar as informaes de uma organizao de forma consistente; Ser
um baluarte seguro que protege a informao, servindo como a fundao para
melhorar as tomadas de deciso.
A partir desse ponto j podemos perceber diversas diferenas entre os
objetivos de ambos os tipos de sistemas e entender que um DW possui algumas
distines, como os clientes, usurios e estrutura.
De posse do entendimento dos objetivos de um DW podemos comear a
entender seu conceito e de que forma ele estruturado. Uma definio de DW pode
ser vista abaixo:
Um DW um repositrio de informao que congrega os dados histricos
de cariz operacional e transacional de uma organizao agrupados numa
base de dados. Este armazenamento implica o favorecimento e a facilitao
de tarefas como a anlise e o reporting (SEZES, OLIVEIRA E BAPTISTA,
2006, p. 34).

Outra definio de DW colocada como um conjunto de dados baseado em


assuntos, integrado, no voltil e varivel em relao ao tempo, de apoio s
decises gerenciais (INMON apud HARRISON, 1998, p.48).

16

Quanto estrutura de um DW, ela difere de um sistema transacional


principalmente na sua modelagem, pois a modelagem de um DW tem como foco
operaes que acessam um grande volume de dados. A modelagem utilizada em
um DW denominada Modelagem Dimensional.
Um DW une bases de dados de toda a empresa e pode ser dividido em vrios
conjuntos, representando um assunto ou departamento especfico, sendo cada um
desses conjuntos denominado de DM.
Um DM um subconjunto de um DW, que normalmente consiste em uma
nica rea temtica, como marketing, vendas, operaes, ou qualquer outra rea de
uma empresa.

2.2.1 Arquitetura de Data Warehouse

Os componentes de um DW podem ser projetados de vrias maneiras,


levando em considerao diversos fatores, como: a estrutura fsica onde ele ser
armazenado e os recursos disponveis. Existem basicamente dois diferentes tipos de
arquitetura de DW, sendo elas diferenciadas pela quantidade de camadas, sendo
mais comuns as de duas e trs camadas.
Na primeira camada est contido o prprio DW, no qual contm os dados e os
softwares associados, na segunda camada est contido o software de aquisio de
dados, responsvel por extrair dados de sistemas legados e fontes externas, os
consolida e posteriormente os carrega no DW. Na terceira e ltima camada se
encontra o software cliente, que permite aos usurios acessar e analisar dados a
partir do DW.
Segundo Turban (2009, p. 62) a vantagem da arquitetura de trs a
separao das funes do DW, eliminando as limitaes de recursos e
possibilitando a fcil criao de DMs.
Em uma arquitetura de duas camadas o software de front-end, responsvel
por apresentar os dados ao usurio, executado no mesmo hardware que o DW, e
o software de aquisio de dados em outra plataforma fsica.

2.2.2 Componentes de um Data Warehouse

17

Existem quatro componentes distintos em um ambiente de DW, cada um com


uma funo especfica, so eles: sistemas operacionais de origem, rea de data
staging, rea de apresentao e ferramentas de acesso aos dados (KIMBALL, 2002,
p.7). A figura abaixo representa os componentes de um DW:

Figura 3 - Componentes de um DW
Fonte KIMBALL (2002)

2.2.3 Sistemas Operacionais de Origem

Os sistemas operacionais de origem so os sistemas que armazenam


informaes das transaes do negcio. Os sistemas operacionais de origem,
geralmente denominados Sistemas de Informaes Transacionais (SIT), so
responsveis por suportar a rea operacional de uma empresa e possui algumas
caractersticas como: selees que retornam somente um registro por vez, nas quais
fazem parte de um fluxo de transao normal e executam as mesmas tarefas
repetidas vezes, seguindo um fluxo pr-definido. Alm de suportar o fluxo
operacional de uma organizao, geralmente, a partir do SIT que so extrados os
dados que sero armazenados no DW, por isso so denominados sistemas
operacionais de origem.

18

2.2.4 rea de Data Staging

De acordo com Kimball (2002, p. 8) A rea de data staging tudo o que se


encontra entre os sistemas operacionais de origem e a rea de apresentao. Nessa
etapa podem haver extraes iniciais de diversas fontes de dados e uma limpeza
inicial dos dados.
Nesse passo realizada uma carga inicial, capturando os dados dos sistemas
de origem e so feitas algumas transformaes e combinaes nos dados.
Os SIT geralmente so sistemas que realizam transaes a todo o tempo,
fazendo operaes nas bases de dados, logo so sistemas de alta criticidade. A
rea de data staging responsvel por armazenar temporariamente os dados que
sero tratados e carregados no DW. Dessa forma a carga realizada de forma
rpida, desafogando os sistemas operacionais de origem.

2.2.5 rea de apresentao de dados

na rea de apresentao de dados que os dados so armazenados de


forma organizada, orientada por assunto e ficam disponveis para os usurios
criarem relatrios e diversas outras consultas analticas. A partir da rea de
apresentao de dados as informaes ficam disponveis para os usurios
realizarem as consultas atravs de ferramentas especficas.

2.2.6 Ferramenta de acesso aos dados

A ferramenta de acesso aos dados pode ser tida como qualquer capacidade
utilizada para visualizao dos dados contidos em um DW.
O termo ferramenta de acesso aos dados utilizado para referenciar
variedade de capacidades que podem ser providas aos usurios de negcio para
alavancar a rea de apresentao para tomar decises analticas. Todas as
ferramentas de acesso aos dados realizam consultas na rea de apresentao do

19

DW, podendo ser uma consulta customizada ou uma ferramenta complexa de


minerao de dados ou modelagem de aplicaes (KIMBALL, 2002, p. 13).

2.2.7 Modelagem de Data Warehouse

Um DW difere de uma base de dados transacional em diversos aspectos,


como por exemplo, seu objetivo, pois ele no busca apoiar questes operacionais de
uma organizao, mas sim, consolidar informaes sobre o negcio para apoiar as
reas gerenciais.
Para atingir esse objetivo so necessrias estratgias distintas das
conhecidas em bases de dados transacionais, como usar uma modelagem que
auxilie as buscas em grandes volumes de dados e que seja mais voltada gerao
de relatrios. A modelagem utilizada para o desenho de DW a chamada
modelagem dimensional. A modelagem dimensional facilita a visualizao dos dados
de uma maneira mais focada ao negcio, facilitando a criao de relatrios analticos
e a busca por padres de dados.
A modelagem dimensional possibilita visualizarmos questes muito abstratas
que usurios de negcio desejam que sejam respondidas como requisitos
(MACHADO, 2000, p.50). Na definio de Machado podemos entender um pouco
mais sobre o que a modelagem dimensional, e esse tipo de modelagem tem como
foco responder as questes do negcio.
A modelagem dimensional composta por dois tipos de tabelas,
basicamente, as tabelas de fato e dimenso. A tabela fato a tabela mais
importante em um modelo dimensional, pois ela que armazena as medidas de
desempenho do negcio, contendo valores, indicadores e mtricas. A tabela fato
tambm possui uma srie de chaves das dimenses, no qual podemos efetuar a
ligao entre a tabela fato e as dimenses, realizando a interseo entre ambas. As
tabelas de dimenso definem o nvel de granularidade da tabela fato e nos dizem
quais os escopos das mtricas.
Fatos so as medidas pelas quais um processo avaliado, por exemplo, um
processo de negcio de armazenar pedidos de clientes medido de pelo menos trs
maneiras: quantidade de pedidos, o valor e o custo dos produtos solicitados. A
imagem a seguir exemplifica uma tabela fato:

20

Figura 4 - Exemplo de tabela fato


Fonte KIMBALL, 2002

Outro tipo de tabela existente em um DW a tabela de dimenso. De acordo


com Kimball (2002, p. 19) as tabelas de dimenso integram a tabela fato, definem
qual o escopo dos valores contidos na tabela fato, contendo descries do negcio,
como por exemplo, em um DW de vendas as tabelas de dimenso contm
informaes como: o nome dos produtos, nome da marca, categoria da marca,
departamento, tipo do pacote, tamanho do pacote, nome das lojas e localidade das
lojas. Todos esses dados contidos nas tabelas de dimenso existem com o intuito de
definir o contexto de qual um relatrio. As tabelas de dimenso possuem os
parmetros pelos quais os valores contidos na tabela fato so calculados.
A imagem abaixo mostra um exemplo de uma tabela de dimenso:

21

Figura 5 - Exemplo de tabela de dimenso


Fonte KIMBALL, 2002

Alm do entendimento das tabelas fato e dimenso, existem tambm duas


formas de modelagem de um DW, um mais comumente utilizado denominado
esquema estrela (star schema) e outro denominado floco de neve (snow flake). A
soluo proposta ir trabalhar com o esquema estrela, portanto focaremos nesse
tipo de modelagem.
Um DW baseado no esquema estrela possui uma estrutura mais simples,
devido a baixa quantidade de relacionamentos e desnormalizaes, diminuindo sua
complexidade e aumentado seu desempenho. O esquema estrela construdo
basicamente pela interseo das dimenses com a tabela fato, onde existem vrias
dimenses se relacionando com a tabela fato.
A imagem abaixo exemplifica um modelo estrela:

22

Figura 6 - Modelo Estrela (Star Schema)


Fonte HOKAMA 2004

2.3 EXTRACT, TRANSFORM, LOAD ETL

O processo de ETL que significa Extract, Transform, Load (Extrao,


Transformao e Carga) o processo responsvel por extrair os dados que sero
armazenados no DW, dados esses que so extrados dos sistemas de origem,
sendo eles, bases de dados, webservices, arquivos texto, ou qualquer outro tipo de
fonte de dados. Aps essa extrao so realizadas todas as transformaes nos
dados e ento so carregados no DW.
O ETL usado para migrar dados de um banco para outro, para criar DMs e
DWs e tambm para converter banco de dados de um formato/tipo para outro
(KIMBALL, 2004, p.81). O processo de ETL destina-se a extrao, transformao e

23

carga de dados de uma ou mais bases de dados de origem para uma ou mais bases
de dados de destino.
O mdulo de ETL com certeza um dos mais crticos na construo de um
DW, pois nessa etapa que os dados so devidamente tratados e as
inconsistncias so retiradas, armazenando somente aquilo que de valia para o
negcio, e caso haja algum erro, pode afetar diretamente os resultados dos
relatrios, podendo levar a decises baseadas em dados incorretos, afetando os
negcios da organizao diretamente.
A maior parte do esforo exigido no desenvolvimento de um DW consumido
neste momento e no incomum que oitenta por cento de todo esforo seja
empregado no desenvolvimento dos processos de ETL.

2.3.1 Extrao

O primeiro passo da integrao bem sucedida extrair dados do sistema


fonte primrio, sem essa extrao de dados o DW intil (KIMBALL, 2004, p.55). A
primeira parte do processo de ETL a extrao dos dados dos sistemas de origem,
sendo que cada um desses sistemas podem utilizar um formato ou organizao de
dados diferente.
Um dos objetivos da primeira etapa, de extrao, realizar a busca dos
dados nesses sistemas de origem de forma a padroniz-los em um formato nico
para a entrada no processo de transformao.
Nessa etapa so extrados somente os dados de grande relevncia para o
negcio, no necessitando a busca de todos os dados de uma base.

2.3.2 Transformao

nessa fase que os dados so padronizados, todas as inconsistncias so


retiradas e alguns dados podem ser acrescentados, como por exemplo, a incluso
da descrio completa de determinadas siglas, incluso de M para Masculino e F
Feminino e S para Sim e N para No. Outra transformao bastante comum
feita para padronizao de endereos, onde muitas vezes nos sistemas de origem o

24

catlogo de endereo se encontra totalmente fora dos padres e endereos


duplicados.
A transformao dos dados pode ser definida como a manipulao necessria
dos dados de origem para que sejam transformados de maneira que se tornem teis
a empresa e ao DW (KIMBALL, 2004, p. 59). Na transformao dos dados
aplicada uma srie de regras ou funes aos dados extrados para derivar os dados
a serem carregados. Essa etapa tambm responsvel por garantir a consistncia e
integridade das informaes.
Na etapa de transformao realizada tambm a homogeneizao dos
dados, pois nessa etapa so encontrados muitos conflitos de modelagem de dados,
sendo estes divididos em semnticos e estruturais.
De acordo com Gonalves (2003, p.33) Os conflitos semnticos so todos
aqueles que envolvem o nome ou a palavra associada s estruturas de modelagem,
como por exemplo, o mesmo nome para diferentes entidades ou diferentes nomes
para a mesma entidade.
Os conflitos estruturais so definidos por Abreu (2007, p. 38) como os
conflitos relativos estrutura de modelagem escolhido, no s a nvel de estrutura,
como tambm de domnio. Depois de identificados os conflitos de modelagem, as
regras de converso devem ser criadas para os padres estabelecidos pelo DW. As
regras citadas acima podem ser criadas com a ajuda de ferramentas de integrao,
utilizadas no processo de extrao e carga de dados.
Aps a criao das regras, a etapa de carga dos dados pode ser planejada.

2.3.3 Carga

Nessa etapa os dados so efetivamente carregados no DW, pois eles j


foram extrados da origem e as devidas transformaes e tratamentos j foram
realizados.
Devemos nos preocupar em integrar as informaes de diversas fontes
externas e internas j devidamente tratadas (MACHADO, 2003, p. 29). na etapa
da carga que realizamos as junes dos dados de todas as fontes, depois de j
terem sido tratados e os carregados no DW.

25

A forma como essa carga feita pode variar bastante dependendo da


necessidade da organizao, alguns DW podem simplesmente substituir as
informaes existentes semanalmente, com dados cumulativos e atualizados, ao
passo que outro DW pode adicionar dados a cada hora. No momento da criao do
DW comum uma carga de dados inicial que faa com que a extrao busque todos
os dados do sistema fonte, mas com o decorrer do tempo a extrao deve estar
preparada apenas para fazer cargas incrementais.
A figura abaixo mostra os dados de trs bases de dados nos quais so
extrados, tratados e posteriormente carregados no DW.

Figura 7 - Exemplo de processo ETL


Fonte Sybase Data Integration, Installation Guide

A figura acima aponta os trs passos que compem um processo ETL, tendo
as trs bases de dados (Microsoft SQL Server, DB2 e Oracle), nas quais tero os
dados extrados, posteriormente os dados sero tratados, transformados e sero
feitas as limpezas necessrias e posteriormente carregados no DW, completando
assim o ciclo de vida do processo ETL.

26

2.4 OLAP ONLINE ANALYTICAL PROCESSING

A etapa de OLAP responsvel por apresentar ao usurio a informao


contida no DW de forma dinmica, no formato de relatrios gerenciais, grficos,
tabelas ou qualquer outra forma de apresentao dos dados. Outras funcionalidades
do OLAP permitir ao usurio o cruzamento de informaes existentes no DW e
fazer anlises temporais.
OLAP (online analytical processing) um conceito que se refere a
aplicaes informticas que permitem efectuar [sic], de forma rpida e
partilhada, a anlise de informao multidimensional, originria de diversas
fontes de dados (SEZES, OLIVEIRA E BAPTISTA, 2006, p.60).

As tecnologias OLAP permitem aos usurios de negcio analisar tendncias e


tirar concluses, o que tambm seria possvel em bases relacionais, contudo de
forma mais complexa e demorada.
Outra definio dada por Harrison (1998, p.11) a classe de ferramentas de
consultas e de relatrios do OLAP permite o usurio formular consultas a banco de
dados sem precisar interagir com a linguagem de programao do banco de dados
SQL.
As ferramentas OLAP oferecem a capacidade de visualizaes das
informaes e permitem a um usurio de forma fcil visualizar seletivamente as
informaes a partir de diversas perspectivas diferentes.
A visualizao dos dados a partir de uma aplicao OLAP realizada em
dados agregados, pois j esto organizados por assunto no DW, dessa maneira os
usurios de negcio, podero facilmente ter os dados passveis de tomadas de
decises estratgicas. Essa tecnologia auxilia o usurio a sintetizar informaes
corporativas por meio de vises comparativas, personalizadas, anlises histricas e
temporais, projees e elaboraes de cenrios.
Nessa etapa vemos verdadeiramente o grande ganho que temos ao se utilizar
um DW, pois ao utilizar o OLAP, o usurio final pode navegar nas informaes que
j esto organizadas por departamento, ou qualquer outra forma que tiver sido
definido para construo do DW.
Funes

OLAP

mais

complexas

englobam

uma

anlise

de

dados

multidimensional, que inclui um conjunto robusto de capacidades computacionais e

27

de navegao nos dados. A anlise multidimensional permite que os usurios


entrem em um DW a partir de qualquer dimenso para iniciar a anlise, navegando
ento para outras dimenses para analisar posteriormente as informaes
(HARRISON, 1998, p.12).
Em uma aplicao OLAP um usurio pode iniciar a anlise sob a perspectiva
do produto, repetindo ento a anlise em cada segmento de mercado. Algumas das
caractersticas da anlise multidimensional a capacidade de navegar no interior do
relatrio e a possibilidade de modificar parmetros de relatrios para isolar as
informaes que melhor respondam consulta, dessa forma o usurio tem um leque
grandioso de possibilidades de visualizao e agregao dos dados.
A escolha de qual ferramenta de OLAP utilizar crucial para o sucesso do
projeto, pois a partir dela que o usurio concretizar sua opinio sobre o mesmo e
conseguir realmente enxergar o produto final.
Os sistemas OLAP podem ser divididos trs tipos: OLAP Multidimensional
(MOLAP) implementado atravs de um DW multidimensional, os dados so
organizados em uma estrutura de cubos, que permite o cruzamento dos dados;
OLAP Relacional (ROLAP) implementado sobre um banco de dados relacional; e
OLAP Hbrido (HOLAP) combina atributos de MOLAP e ROLAP.
No MOLAP (Multidimensional On-Line Analytical Processing) os dados so
armazenados de forma multidimensional, sua implementao varia de acordo com a
sua ferramenta de OLAP e o acesso aos dados ocorre diretamente no banco de
dados do servidor multidimensional.
J no ROLAP (Relational On-Line Analytical Processing) os dados so
armazenados no modelo relacional como tambm suas consultas so processadas
pelo gerenciador do banco relacional.
A arquitetura mais recente a HOLAP (Hybrid On-Line Analytical Processing),
na qual ocorre uma combinao entre ROLAP e MOLAP. A vantagem que com a
mistura de tecnologias pode-se extrair o que h de melhor de cada uma, a alta
performance do MOLAP e a escalabilidade do ROLAP.
Existe tambm o DOLAP (Desktop On-Line Analytical Processing) uma
variao que existe para fornecer portabilidade dos dados. A vantagem que oferece
esta arquitetura a reduo do trfico na rede.
Ao se trabalhar com uma ferramenta OLAP existem algumas operaes
bsicas que podem ser realizadas, so elas: drill down, drill up, slice e dice - so

28

operaes que movimentam a viso dos dados (cubo) ao longo das hierarquias de
uma dimenso. O drill down ocorre quando o usurio desagrupa os dados,
aumentando o nvel de detalhe da informao. O drill up faz justamente o contrrio,
ocorre quando o usurio agrupa os dados, diminuindo o nvel de detalhamento da
informao. A operao slice acontece quando um membro em particular de uma
dimenso selecionado, formando uma espcie de fatia do cubo original. E por fim
o dice seleciona vrios membros de vrias dimenses formando um subcubo.
De acordo com Barbalho (2003, p.58) a aplicao das operaes (vises)
sobre um modelo multidimensional cria uma viso no formato cubo, conhecida como
cubo de deciso (decision cube ou cubo olap).
A figura abaixo exemplifica um cubo olap:

Figura 8 - Exemplo de um cubo OLAP


Fonte Desconhecido

2.5 CDIGO ABERTO (OPEN SOURCE)

Open Source um conceito de distribuio de software, que estabelece


como fundamentais, os princpios de desenvolvimento compartilhado, distribuio na
forma de cdigo fonte e licenciamento gratuito (LEITE, 2005).

29

O termo open source surgiu no como um conceito anticapitalista, mas veio


com o intuito de prover uma nova forma de distribuir software, uma alternativa que
se enquadre aos novos modelos de negcio. O modelo de software proposto pelo
open source sai do antigo paradigma de software fechado e traz um novo conceito,
de produo intelectual colaborativa.
Porm, open source no se limita somente a disponibilizar um software com
cdigo aberto, para ser considerado open source deve atender a alguns preceitos,
os principais so:

Distribuio livre;

Acesso ao cdigo-fonte;

Permisso para criao de trabalhos derivados;

Integridade do autor do cdigo-fonte;

No discriminao contra pessoas ou grupos;

No discriminao contra reas de atuao;

Distribuio da licena;

Licena no especfica a um produto;

Licena no restritiva a outros programas;

Licena neutra em relao tecnologia.


Grandes empresas que desde a sua criao s vendiam software de cdigo

fechado esto buscando se adequar a esse novo modelo de software, como IBM e
DELL.
A iniciativa open source est consolidada de tal forma que, atualmente grande
parte dos rgos governamentais brasileiros j utilizam desse modelo de software,
sendo que a tendncia ser disseminado cada vez mais.
A soluo apresentada vem de encontro a desfrutar da iniciativa open source,
mesclando ferramentas de baixo custo a uma soluo que agrega um alto valor ao
negcio.

3. DESCRIO DAS FERRAMENTAS

30

Nessa seo sero apresentadas as ferramentas utilizadas na soluo de BI,


sendo elas: DBDesigner, PostgreSQL, SpagoBI e Talend Open Studio, enfatizando o
fato de todas serem software livre e de cdigo aberto.

3.1 DBDESIGNER

Na soluo apresentada, utilizada para modelagem do DW a verso 4.0.5.6


do DBDesigner.
O DBDesigner uma ferramenta de modelagem de dados desenvolvida pela
empresa Fabulous Force Database Tools (fabForce), sob licena do tipo GNU GPL,
sendo este o tipo de licena de maior uso dentre os projetos de software livre, visto
que prov grande liberdade no uso do software.
Alm de permitir a modelagem, criao e manuteno de bancos de dados,
esta ferramenta possibilita tambm a engenharia reversa, gerando o modelo de
dados a partir da base de dados existente, e ainda possibilita o sincronismo entre o
modelo e o banco de dados.
Em virtude de suas qualidades o DBDesigner uma tima opo para
modelagem de bases de dados.

3.2 POSTGRESQL

Na soluo apresentada utilizada para construo do DW (armazenamento


dos dados) a verso 9.1 do PostgreSQL.
O PostgreSQL foi o SGBD (Sistema Gerenciador de Banco de Dados)
utilizado para construo e desenvolvimento do DW.
PostgreSQL o resultado de uma ampla evoluo que se iniciou com o
projeto denominado Ingres, desenvolvido na Universidade de Berkeley, Califrnia. A
sua primeira verso, 6.0, foi liberada em janeiro de 1997. Desde ento, um grupo de
desenvolvedores e voluntrios de todo o mundo, tm mantido o software e
desenvolvido novas funcionalidades. Alm de doaes, o projeto PostgreSQL se
sustenta pelo patrocnio de diversas empresas, entre as quais se destacam, Fujitsu,
Hub.Org, NTT Group, Red Hat, Skype e SRA.

31

O software tem adquirido prestgio na comunidade Linux, tendo recebido


diversas vezes o prmio Linux Journal Editor's Choice de melhor Sistema de
Gerenciamento de Banco de Dados (SGBD).
A aceitao do PostgreSQL tem se ampliado para alm da comunidade de
cdigo aberto. Entre seus usurios podemos citar grandes empresas internacionais,
rgos governamentais de vrios pases e universidades de prestgio mundial.

3.3 TALEND OPEN STUDIO

Na soluo apresentada utilizado o Talend Open Studio, verso 5.0.1, como


ferramenta ETL para captura, transformao e carga dos dados no DW.
Quem procura uma soluo ETL para Business Intelligence no deve deixar
de conferir o Talend. Conectado a diversas fontes de dados, ele s no faz chover
ainda (LACY, 2009, p. 62).
Talend Open Studio uma ferramenta de ETL totalmente open source e
disponibilizado de forma gratuita pela empresa francesa Talend, especializada em
produtos open source de integrao, tendo um leque de produtos nessa rea. O
Talend Open Studio foi disponibilizado em 2005 pela Talend e atualmente se
encontra em ampla expanso no mercado. A ferramenta j foi indicada pelo Gartner
Group no campo das ferramentas de ETL, como visionria. A Talend se posiciona
como o melhor sistema para necessidades de integrao de dados (FORRESTER,
apud LACY, 2009, p. 62).
A ferramenta totalmente desenvolvida em Java e dividida em mdulos,
possuindo trs grandes mdulos, um para desenho dos fluxos de dados de forma
no tcnica (business modeler), um mdulo para desenho dos processos ETL (job
design) e outro para as conexes com as fontes de dados (metadata). O Talend
Open Studio uma ferramenta orientada a componentes, ou seja, todo e qualquer
recurso utilizado em um processo ETL se d pela utilizao de componentes, como
por exemplo, componentes para captura de uma base de dados e componentes
para manipular arquivos.

3.4 SPAGOBI

32

Na soluo apresentada a ferramenta SpagoBI verso 3.4, utilizada para


gerao dos relatrios e anlises gerenciais.
O SpagoBI uma soluo para projetos de BI desenvolvida pela empresa
SpagoWorld que apoiada e fundada pela empresa Engineering Group. O SpagoBI
permite a criao de consultas analticas de diversos tipos como relatrios
gerenciais, tabelas piv, grficos de pizza, grficos de barra, indicadores de
performance, cockpits e dashboards. O SpagoBI vem de encontro a uma nova
tendncia de mercado que tem sido a utilizao de software livre, disponibilizando a
ferramenta de forma totalmente gratuita e com cdigo aberto.
Segundo anlise feita em 2008 pelo Gartner Group, somente quatro sistemas
de BI suportam realmente as necessidades de um projeto de BI de forma
corporativa, sendo o SpagoBI um deles (LACY, 2010, p. 59).
A ferramenta SpagoBI fornece anlises bastante flexveis e fceis de utilizar
possibilitando ao usurio a visualizao dos detalhes de cada nvel em diferentes
vises.
Um diferencial do SpagoBI o fato dele ser focado na integrao de outros
softwares, e no em uma nica plataforma de produto, ou seja, caso seja necessrio
a utilizao de OLAP, podemos utilizar os componentes Mondrian ou JPalo, que so
outros softwares incorporados ao SpagoBI.
Alguns outros mdulos disponveis na ferramenta so:

Reporting: Fornece a criao de relatrios estruturados, como por


exemplo, listas, tabelas, tabelas cruzadas e grficos.

OLAP: Anlise multidimensional de fcil utilizao. O usurio visualiza


detalhes dos nveis e diferentes vises.

Charts: Desenvolvimento de sistemas prontos que usam ferramentas


grficas, como por exemplos, grficos de pizza, de barra, de rea, de
linha e disperso.

Dashboards: Permitem

mostrar os indicadores de chaves de

performance, os KPIs (Key Performance Indicators).

KPI: Fornece ferramentas para criar, gerenciar, exibir e procurar


modelos de KPI.

Data Mining: Analisa os dados atravs da minerao do mesmo com a


inteno de descobrir regras de informao.

33

Smart Filter: Gera formulrio de simples consulta.

ETL: Carregamento dos dados devidamente tratados.

Outro ponto forte do SpagoBI o quesito segurana, em um universo no qual


os dados de maior relevncia para uma organizao estaro disponveis, o fator
segurana se torna primordial, e o SpagoBI vem sanar essa necessidade. Os dados
no so acessados diretamente, o SpagoBI utiliza uma camada modelo que faz a
intermediao com o banco de dados.
O SpagoBI tambm uma ferramenta multiplataforma, devido ao seu
desenvolvimento ter sido realizado na linguagem Java, ele pode ser executado nos
principais sistemas operacionais do mercado com suporte linguagem, bastando a
instalao da mquina virtual Java. Outro ponto importante que o SpagoBI
integrado ferramenta de ETL de integrao utilizado no projeto, o Talend Open
Studio.

4. IMPLEMENTAO DA SOLUO

Nesse captulo veremos como a soluo foi desenvolvida, passando por todas
as etapas do ciclo de vida de um projeto de BI.
A soluo aqui apresentada tem como objetivo prover ao MDS (Ministrio do
Desenvolvimento Social e Combate Fome) um conhecimento do rgo em um dos
programas de maior impacto sociedade, o Programa Bolsa Famlia, em um nvel
mais estratgico.
O sistema em questo ser desenvolvido sob uma plataforma de BI,
passando pela construo de um DW, desenvolvimento dos processos ETL para
extrao, transformao e carga dos dados e posteriormente a criao de relatrios
gerenciais a partir dos dados existentes no DW.
Ao final o usurio ter a seu dispor a possibilidade da criao de diversos
relatrios gerenciais, possibilitando a visualizao de dados histricos, grficos de
evoluo, dashboards, mapeamentos quantitativos, por regio, estado, cidade ou at
mesmo bairro.

4.1 ENTENDIMENTO DO NEGCIO

34

4.1.1 Ministrio De Desenvolvimento Social e Combate Fome MDS

O MDS bem como todas as instituies pblicas federais, vem passando por
um contnuo processo de aprimoramento de seus processos organizacionais, com o
objetivo de acompanhar o porte e o alcance dos programas governamentais,
principalmente os que afetam a rea social.
Essa evoluo proporciona, de forma crescente, considervel volume de
dados produzidos pelas atividades operacionais. Por consequncia desse acmulo
de dados e pela sua riqueza e, ainda, para calcar as esferas gerenciais de
informaes suficientes ao processo decisrio, tem feito parte da estratgia
organizacional a implantao de solues voltadas para que os agentes pblicos
tenham condies de acompanhar a dinamicidade dos movimentos sociais e suas
reivindicaes.
Dentro desse escopo e com intuito de melhorar a qualidade dessas
informaes, elevando os seus dados condio de informaes estratgicas, fazse necessrio o planejamento e a implantao de um sistema de informaes
gerenciais para criar novos, bem como aperfeioar os j existentes, instrumentos
que as diversas camadas gerenciais necessitam para conduzir a atuao do MDS.

4.1.2 Cadastro nico para Programas Sociais do Governo CADUNICO

O Cadastro nico (CADUNICO) ser o sistema operacional de origem a ser


utilizado como base para a implementao realizada nesse projeto. A partir dele
poderemos mapear as famlias e os integrantes que fazem parte dos programas
sociais do governo, estando diretamente relacionado com as famlias brasileiras de
baixa renda, o sistema operacional de origem, que contm os dados provenientes
para extrao, transformao e carga no DW.
O CADUNICO um instrumento de mapeamento e identificao das famlias
de baixa renda brasileira. As famlias so cadastradas por meio de formulrios que
identificam e registram informaes como: caractersticas do domiclio, composio
familiar, qualificao escolar e profissional, rendimentos e suas despesas.

35

Podem se cadastrar no sistema CADUNICO as famlias que possuem renda


per capita de at meio salrio mnimo e que tenham renda mensal total de at trs
salrios mnimos. Famlias com renda per capita superior a meio salrio mnimo
podem ser cadastradas desde que a sua incluso esteja vincula seleo ou ao
acompanhamento de programas sociais do governo federal, estados ou municpios.
O sistema de informaes transacionais responsvel por suportar o
CADUNICO denominado Sistema de Condicionalidades (SICON), no qual contm
os dados que sero carregados no DW.
importante frisar que o SGBD utilizado para armazenar os dados do SICON
o DB2 comercializado pela empresa IBM.

4.2 DESCRIO SUMRIA DO NEGCIO

A soluo foi dividida em dois mdulos, Gesto das Famlias e Gesto dos
Integrantes, conforme apresentado abaixo.

4.2.1 Gesto das famlias

O mdulo da gesto das famlias responsvel por prover ao usurio


informaes de todas as famlias presentes no CADUNICO. Algumas das
informaes disponibilizadas ao usurio sero:

Localidades nas quais as famlias residem;

Tipo da localidade (Urbana ou rural);

Situao do domiclio (Prprio, alugado, arrendado, cedido, invaso ou


financiado);

Tipo do domiclio (Casa, apartamento ou cmodos);

Tipo da construo (Tijolo/Alvenaria, adobe, madeira, taipa revestida, taipa


no revestida ou material aproveitado);

Tipo de abastecimento da gua (Rede pblica, poo/nascente ou carro pipa);

Tipo de tratamento da gua (Filtrao, fervura, clorao ou sem tratamento);

36

Tipo da iluminao (Relgio, sem relgio, relgio comunitrio, lampio ou


vela);

Tipo do escoamento sanitrio (Rede pblica, fossa rudimentar, fossa sptica,


vala ou cu aberto);

Destino do lixo (Coletado, queimado, enterrado ou cu aberto);

Possibilidade de navegao no tempo (dados histricos);

Indicadores como: Valor da renda per capita, valor da renda da famlia,


quantidade de pessoas, quantidade de mulheres, quantidade de mulheres
grvidas, quantidade de mes amamentando, quantidade de deficientes,
quantidade de indgenas, indicador de famlia quilombola, indicador de perfil
sade, indicador de perfil educao, indicador de responsvel legal indgena,
indicador de famlia situao rua, indicador de benefcio leite e indicador de
benefcio leite/produtor.

A partir das informaes disponveis o usurio ter a possibilidade de realizar


relatrios como:

Mapeamento das rendas per capitas das famlias de acordo com a


regio/estado;

Mapeamento das famlias que possuem pessoas com deficincia de acordo


com a regio/estado;

Mapeamento da quantidade de mulheres grvidas de acordo com a regio;

Mapeamento da evoluo da renda per capita de acordo com o ano,


semestre, trimestre, ms, ou qualquer outro tipo de anlise temporal;

Mapeamento da evoluo da renda da famlia de acordo com o ano,


semestre, trimestre, ms, ou qualquer outro tipo de anlise temporal;

Diversas combinaes de relatrios de acordo com os dados disponveis.

4.2.2 Gesto dos integrantes

O mdulo da gesto dos integrantes responsvel por prover ao usurio


informaes de todos os integrantes presentes no CADUNICO. Os integrantes
apresentam um nvel de detalhe a mais do que a gesto das famlias, pois

37

apresentem informaes das pessoas que compem as famlias. Algumas das


informaes disponibilizadas ao usurio sero:

Localidades nas quais as famlias residem;

Tipo da escola (Pblica municipal, pblica federal, pblica estadual, particular


ou se no frequenta);

Raa/Cor dos integrantes (Branco, negro, pardo, amarelo ou indgena);

Sexo (Masculino ou feminino);

Estado civil (Solteiro, casado, divorciado, vivo ou separado);

Nacionalidade (Brasileiro nato, brasileiro naturalizado ou estrangeiro);

Pas de origem;

Grau de instruo (Analfabeto, at 4 srie incompleta do ensino fundamental,


com 4 srie completa do ensino fundamental, da 5 8 srie do ensino
fundamental, ensino fundamental completo, ensino mdio incompleto, ensino
mdio completo, superior incompleto, superior completo, especializao,
mestrado ou doutorado);

Situao no mercado de trabalho (Empregador, assalariado com carteira de


trabalho, assalariado sem carteira de trabalho, autnomo com previdncia
social, autnomo sem previdncia social, aposentado / pensionista,
trabalhador rural, empregador rural ou no trabalha);

Ocupao (Advogado, autnomo, motorista, feirante, entre outros).

A partir das informaes disponveis o usurio ter a possibilidade de realizar


relatrios como:

Mapeamento dos integrantes com perfil educao de acordo com a


regio/estado;

Mapeamento dos integrantes com

perfil sade

de acordo com a

regio/estado;

Mapeamento da quantidade de deficientes com cegueira de acordo com a


regio/estado;

Mapeamento da quantidade de deficientes com surdez de acordo com a


regio/estado

Mapeamento da evoluo da renda per capita de acordo com o ano,


semestre, trimestre, ms, ou qualquer outro tipo de anlise temporal;

38

Diversas combinaes de relatrios de acordo com os dados disponveis.

4.3 ARQUITETURA DA SOLUO

A arquitetura da soluo foi separada em cinco etapas, sendo elas: a extrao


de dados do sistema operacional de origem SICON, envio dos dados para a rea
de staging (temporria), processos ETL, construo do DW e as consultas analticas.
A imagem abaixo apresenta a arquitetura proposta:

Figura 9 - Arquitetura da Soluo

4.4 MODELAGEM DIMENSIONAL

Na construo de um DW a modelagem de dados primordial e de grande


importncia, pois aqui que se concretiza o entendimento do negcio tido com o
cliente, e as dimenses e fatos sero criadas e organizadas de acordo com a
necessidade do usurio. Uma modelagem dimensional feita de forma correta auxilia
tanto na visualizao dos dados e gerao dos relatrios quanto na otimizao das

39

buscas realizadas na base de dados. Como o modelo utilizado no projeto foi o


esquema estrela, as normalizaes foram retiradas visando a melhor organizao
dos dados e o desempenho das buscas.
Em um DW comum utilizar a desnormalizao e a redundncia de dados,
com o intuito de se obter uma estrutura mais gil (BARBIERI, 2001).
A ferramenta utilizada para a modelagem dimensional foi o DBDesigner,
ferramenta essa totalmente open source.
A partir do entendimento do negcio foram construdos os modelos referentes
aos mdulos de gesto das famlias e gesto dos integrantes separadamente.
A imagem abaixo apresenta o modelo de gesto das famlias:

40

Figura 10 - Modelo de dados Gesto das Famlias

41

No modelo de dados acima apresentado se faz necessrio o entendimento de


algumas tabelas. Existem duas tabelas denominadas tabelas temporrias, ou rea
de data staging, so elas: STG_FAMILIA e STG_MUNICIPIO, essas tabelas so
responsveis por armazenar os dados provenientes da primeira extrao realizada
dos sistemas operacionais de origem, no caso o SICON. Nesse momento
realizada uma primeira transformao, pois so armazenados nas tabelas
temporrias somente os dados de valia para o mdulo de gesto das famlias. A
partir dessas tabelas so extrados os dados que posteriormente sero
armazenados nas tabelas de dimenso.
No modelo tambm podemos ver diversas tabelas em torno da tabela de fato
(FT_FAMILIA), so as denominadas tabelas de dimenso. Essas tabelas so
responsveis por armazenar as descries do negcio, a descrio textual que
define o contexto para os relatrios.
Por fim, foi criada uma tabela de fato, a tabela FT_FAMILIA, essa tabela
contm as medidas do negcio, as informaes de indicadores do negcio. Na
tabela FT_FAMILIA existem tambm as chaves estrangeiras para realizar a
interseo entre os dados presentes na tabela fato e as tabelas de dimenso.
O segundo modelo criado foi o modelo de gesto dos integrantes, como pode
ser visto na imagem a seguir:

42

Figura 11 - Modelo de dados Gesto dos Integrantes

43

Assim como no modelo de dados de gesto das famlias, esto presentes na


gesto dos integrantes algumas tabelas temporrias, so elas STG_INTEGRANTE e
STG_SERIE_ESCOLAR, responsveis por armazenar os dados extrados do
SICON, referentes gesto dos integrantes. Nesse modelo tambm esto presentes
as tabelas de dimenso e tabela fato.

4.5 PROJETO FSICO DO DATA WAREHOUSE

Aps a etapa de modelagem dimensional do DW, foi realizado o projeto fsico


do mesmo. Nessa etapa foram definidos os ndices, relacionamentos, tcnicas de
otimizao da base de dados e as tabelas foram criadas fisicamente.
Uma das tcnicas utilizadas para otimizao da base de dados foi a criao
de ndices para os campos com baixa cardinalidade, nos quais os valores contidos
na tabela no possuem um alto nvel de variao, como por exemplo, campos que
indicam se um registro est ativo ou no, dessa forma as consultas aos dados so
otimizadas consideravelmente.
Outra tcnica utilizada foi a criao de algumas tablespaces para separao
lgica dos dados. Segundo Smanioto (2006) tablespace uma pasta no sistema de
arquivos onde sero armazenados os objetos, como tabelas, funes, sequncias
ou ndices. Foram criadas trs tablespaces, uma para armazenamento dos ndices,
outra para armazenamento das tabelas temporrias e por fim uma para armazenar
os dados das demais tabelas.
Para a criao das tabelas fisicamente a ferramenta DBDesigner foi
responsvel por gerar script SQL com para criao de todos os objetos do DW.

4.6 DESENVOLVIMENTO DOS PROCESSOS ETL

Nessa etapa os dados foram efetivamente extrados do sistema operacional


de origem (SICON), todas as transformaes foram feitas, as duplicatas foram
retiradas, e os dados foram carregados no DW. Sem sombra de dvidas, essa foi a
etapa do projeto que consumiu mais recurso de tempo.

44

Existem basicamente trs tipos de tabelas envolvidas no projeto, so elas:


tabelas temporrias, tabelas de dimenso e tabelas fato. Para cada uma das etapas
aqui apresentadas, ser demonstrado um exemplo do trabalho efetuado em cada
um dos tipos de tabela, seguindo o mesmo modelo para as demais.

4.6.1 Mapeamento dos Dados para o ETL

Antes de iniciar o desenvolvimento dos processos ETL foi realizada uma


anlise para auxlio ao desenvolvedor. Nesse passo foram criados documentos
denominados Mapeamento de dados ETL, nos quais so responsveis por
direcionar o desenvolvedor na criao dos processos. Esse documento contm
detalhadamente quais tabelas e colunas dos sistemas de origem os dados sero
extrados, as regras de transformao, a query que ser utilizada para extrair os
dados, filtros, tipo de dados, chaves primrias e estrangeiras e as tabelas e colunas
de destino. Com esse documento em mos, o desenvolvedor ETL tem completa
noo de como efetuar o desenvolvimento de cada um dos processos.
A imagem a seguir apresenta o documento utilizado para mapeamento da
tabela temporria STG_FAMILIA, do mdulo de gesto das famlias:

45

Figura 12 - Mapeamento ETL STG_FAMILIA

46

Como podemos ver na imagem acima, esto includas no documento as


tabelas de origem, com seus respectivos campos, as tabelas de destino com os
respectivos campos, a seleo a ser feita na tabela de origem, tipos de dados,
chaves primrias, campos anulveis, regras de transformao e por fim os filtros a
serem feitos.
J no documento de Mapeamento ETL da tabela de dimenso no h a
necessidade de extrair os dados do sistema operacional de origem, pois os mesmos
j esto contidos na rea temporria. Outro ponto importante a citar o fato de
serem includas algumas transformaes para o campo textual, pois esse dado no
existe na tabela de origem, estando presente somente o campo cdigo.
A imagem a seguir apresenta o documento Mapeamento ETL utilizado em
uma dimenso, nesse caso na dimenso DM_TIPO_LOCALIDADE, do mdulo de
gesto das famlias:

47

Figura 13 - Mapeamento ETL DM_TIPO_LOCALIDADE

48

Por fim, a imagem abaixo exibe o documento criado para a tabela de fatos
(FT_FAMILIA):

Figura 14 - Mapeamento ETL FT_FAMILIA

49

A tabela de fatos consideravelmente a que envolve o maior grau de


complexidade, por envolver um relacionamento com todas as tabelas de dimenso.
Como podemos ver no documento acima, necessrio criar vrias regras de juno
para efetuar a carga dessa tabela.

4.6.2 Descrio dos Processos ETL

Conforme visto, a ferramenta utilizada para desenvolvimento dos processos


ETL foi o Talend Open Studio. O Talend Open Studio uma ferramenta na qual
permite o desenvolvimento dos processos ETL de forma totalmente grfica, esses
processos so denominados pela ferramenta como jobs.
Em ambos os mdulos, gesto das famlias e integrantes, os processos ETL
foram divididos em quatro etapas: carga das tabelas temporrias, carga das tabelas
de dimenso, carga das tabelas fato e por fim um job responsvel pela execuo de
todos os demais anteriormente citados.
A figura abaixo mostra o job responsvel por efetuar a carga da tabela
temporria STG_FAMILIA, tendo sido carregada com os dados provenientes da
tabela TB_FAMILIA, presente no sistema de origem SICON. O SICON se encontra
atualmente sob o gerenciador de banco de dados DB2 da empresa IBM. Um dos
papis do Talend Open Studio nesse momento normalizar os dados provenientes
do SICON para um formato que ser enviado para a nossa base de dados de
destino, na qual se encontra a tecnologia PostgreSQL. Os dados extrados do
SICON foram restritos ao universo do ano de 2009 at a data atual, contemplando
um nmero total de 2.050.686 registros.
A imagem abaixo mostra o job que efetua a carga da tabela STG_FAMILIA:

50

Figura 15 - Job de carga da tabela STG_FAMILIA

Aps a execuo do job anteriormente citado, foram criados os jobs que


efetuam a carga das dimenses, nos quais dispensam a busca por dados no
sistema de origem, uma vez que os dados necessrios para a carga de todas as
dimenses e tabela fato j se encontram presentes na nossa rea temporria.
A imagem abaixo mostra um job que efetua a carga da dimenso
DM_TIPO_LOCALIDADE:

Figura 16 - Job de carga da dimenso DM_TIPO_LOCALIDADE

O job anterior extrai os dados da rea temporria (STG_FAMILIA), com as


colunas referentes dimenso DM_TIPO_LOCALIDADE. Um dos tratamentos
realizados nessa dimenso foi a incluso de descries para determinados cdigos,
pois no sistema de origem se encontravam somente os cdigos dos tipos de
localidade, sendo necessria a incluso das descries para complementar as

51

descries textuais do negcio. O Talend Open Studio orientado a componentes,


tendo cada componente uma responsabilidade individual, sendo que o componente
tMap responsvel pela transformao e incluso das descries textuais.
A imagem abaixo exibe com detalhes o contedo presente no componente
tMap:

Figura 17 - Componente tMap para carga da tabela DM_TIPO_LOCALIDADE

52

Nesse momento necessria a realizao de algumas transformaes, sendo


estas realizadas de forma programtica. A transformao feita na dimenso
DM_TIPO_LOCALIDADE

incluso

dos

valores

para

campo

DESC_TIPO_LOCALIDADE, devido inexistncia deste na tabela de origem. Essa


transformao concretizada com base no campo COD_TIPO_LOCALIDADE, e
toda realizada em cima da linguagem Java, linguagem esta, utilizada na ferramenta
para todas as transformaes. A imagem abaixo mostra de que forma feita essa
transformao:

Figura 18 - Transformao do campo DESC_TIPO_LOCALIDADE

Aps terem sido realizadas as cargas de todas as dimenses, foi


desenvolvido o job responsvel por constituir a carga da tabela de fatos. Esse job
consideravelmente o que demanda mais tempo de desenvolvimento, pois ele agrega
todas as dimenses e a rea temporria em um s local, efetuando a juno das
mesmas com o propsito de carregar a tabela fato. necessrio que todas as
dimenses estejam carregadas devido ao relacionamento que elas fazem com a
tabela fato, pois nesta carga verificada a existncia do registro na dimenso,
denominado integridade referencial.
A imagem abaixo evidencia o job de carga da tabela fato (FT_FAMILIA):

53

Figura 19 - Job de carga da tabela fato famlia

54

Como visto na imagem acima, so inseridas no job todas as dimenses que


possuem relacionamento com a tabela fato e o componente tMap responsvel por
realizar a juno entre elas.
A imagem abaixo exibe com detalhes o componente tMap, presente no job de
carga da tabela fato:

Figura 20 - Detalhamento do tMap da tabela fato famlia

55

A ltima etapa dos processos ETL foi a criao de um job responsvel pela
execuo de todos os demais, no qual foi denominado job master. A imagem abaixo
apresenta o job criado:

Figura 21 - Job master gesto das famlias

Assim como foi feito no mdulo de gesto das famlias, foi implementado
tambm no mdulo de gesto dos integrantes seguindo o mesmo fluxo, com
algumas distines nas dimenses, pois se referem a um contexto diferente, e
tambm as mtricas que se referem a um nvel mais detalhado que o das famlias,
contemplando cada integrante da famlia individualmente.
Outra distino do mdulo de gesto dos integrantes foi o volume de dados,
no qual utilizando a mesma restrio, limitando os dados ao universo do ano de
2009 at a data atual, alcanou uma quantidade de 4.999.977 de registros.

4.6.3 Orquestrao e Agendamento dos Processos ETL

A criao dos processos ETL somente uma parte do ciclo de vida do


desenvolvimento ETL, para completar o ciclo de vida necessrio realizar
execues precisas desses processos. Isso feito de acordo com um tempo pragendado (KIMBALL, 2004, p. 301).

56

Uma vez que todos os processos ETL foram desenvolvidos necessrio que
estes sejam executados regularmente, passando novamente pelas etapas de
extrao, transformao e carga no DW.
Nem todas as regras de orquestrao foram definidas devido soluo
englobar somente um estudo de caso, no entrando em produo, porm algumas
regras j podem ser definidas nesse momento.
Algumas das regras para orquestrao dos processos ETL desenvolvidos
so:

Limpeza da rea temporria (staging area) antes de ser realizada a


extrao;

Execuo do job master responsvel pela execuo de todos os


processos de cada mdulo.

Algumas regras que precisam ser criadas ao se passar o projeto para


produo so:

Definir a regularidade com que os processos sero executados;

Definir o horrio em que os processos sero executados.

A definio das regras de agendamento conclui o ciclo de vida do


desenvolvimento ETL.

4.7 DESENVOLVIMENTO DOS RELATRIOS GERENCIAIS

Nessa etapa foram desenvolvidos os relatrios e a estrutura que ficar


disponvel para os usurios criarem as anlises gerenciais.
A ferramenta utilizada nessa fase foi o SpagoBI, ferramenta essa composta
por dois mdulos, Studio e Server. O SpagoBI Studio responsvel pela criao da
estrutura que ficar disponvel ao usurio, denominada camada semntica.
Na camada semntica trazemos a estrutura do DW para dentro do SpagoBI
Studio, contendo todas as tabelas, colunas e relacionamentos, essa estrutura
chamada de modelo fsico (Physical model).
A imagem a seguir apresenta o modelo fsico do mdulo de gesto das
famlias:

57

Figura 22 - Modelo Fsico Gesto das Famlias

Finalizada a criao do modelo fsico, foi desenvolvido o chamado modelo de


negcios, no qual tornamos a estrutura existente no modelo fsico com uma viso
negocial. A estrutura desenvolvida no modelo de negcios ser a qual ficar visvel
ao usurio na gerao dos relatrios gerenciais. Nessa etapa renomeamos as
dimenses e tabelas fato, tornamos ocultas ao usurio as colunas que no agregam
valor ao negcio, definimos as regras de agregao para os campos de mtricas,
como por exemplo, se um valor ser somado, contado, captura do valor mximo,
mnimo ou realizar o clculo da mdia.
A imagem abaixo exibe o modelo de negcios do mdulo de gesto das
famlias:

58

Figura 23 - Modelo de Negcios Gesto das Famlias

Como exemplo de outra funcionalidade do modelo de negcios, a imagem


abaixo mostra as propriedades do campo Valor da Renda da Per capita, dessa
forma podemos ver algumas propriedades como: regra de agregao (soma,
contagem, valor mximo, mnimo ou mdia), tipo do dado e se visvel ao usurio.

59

Figura 24 - Propriedades do campo no modelo de negcios

Aps a finalizao da camada semntica a estrutura desenvolvida


submetida ao SpagoBI Server. A partir desse momento a estrutura para criao dos
relatrios j est disponvel ao usurio.
Os relatrios gerenciais podem ser criados a partir de um portal web que est
disponvel ao usurio, necessitando apenas de um navegador de internet.
Nesse momento todas as informaes disponveis no DW j esto
disponveis, permitindo ao usurio cruzar dados, realizar pesquisas histricas,
grficos de evoluo, tudo isso em diversos formatos como: grfico de pizza, de
barra, de linha, tabela simples ou tabela dinmicas.
A imagem a seguir apresenta o portal web (SpagoBI Server), no qual o
usurio acessar para criao dos relatrios. Como podemos ver tambm na
imagem abaixo, uma das funcionalidades do SpagoBI Server a gerncia de
usurios, permitindo assim o controle de acesso. Outro ponto importante a
customizao visual da ferramenta de acordo com as necessidades do projeto,
devido ferramenta ser open source.

60

Figura 24 Tela de login do SpagoBI Server

61

A figura abaixo mostra como o usurio visualiza a estrutura das informaes


para criao dos relatrios:

Figura 25 - Estrutura para criao dos relatrios

62

Na imagem acima podemos ter a mesma viso que o usurio para criao
dos relatrios, nessa tela o usurio pode selecionar os campos que deseja,
arrastando-os para a seo Select Fields, e posteriormente incluir filtros, arrastando
os campos para a seo Where clause.
A imagem abaixo apresenta um exemplo de relatrio desenvolvido utilizando
a ferramenta SpagoBI, cruzando informaes como a renda per capita de acordo
com a situao do domiclio.

Figura 26 - Exemplo relatrio gesto das famlias

4.8 GERENCIAMENTO DO PROJETO

Nessa etapa apresentaremos uma viso conjunta das fases do projeto de


implementao, do tempo gasto e dos envolvidos.

63

O projeto desenvolvido no teve custo algum com ferramenta/software,


devido a todas elas serem disponibilizadas de forma gratuita, sendo as pessoas
envolvidas no projeto o nico recurso utilizado.
Em todas as etapas do projeto foram envolvidas cinco pessoas, tendo sido
dividas de acordo com o tempo de implementao de cada etapa da soluo.
A tabela a seguir apresenta as etapas da soluo de acordo com a
quantidade de pessoas envolvidas e o tempo gasto em dias:

Tabela 1 - Distribuio dos recursos do projeto

Etapa
Entendimento do
Negcio
Modelagem dimensional
Implantao do Modelo
Fsico
Implementao dos
Processos ETL
Carga da data
warehouse
Elaborao dos
relatrios gerenciais
Implantao da soluo

Quantidade de
Pessoas
5

Tempo Gasto (dias)

5
5

20
5

35

10

15

10

A imagem abaixo apresenta de forma grfica de que forma os recursos foram


gastos de acordo com cada etapa do projeto:

64

Figura 27 - Gerenciamento dos recursos do projeto

5. RESULTADOS OBTIDOS

Para implementao do projeto, escolhemos uma organizao do governo


federal que gerencia as pessoas de baixa renda e que participam dos programas
sociais do governo. Com um banco dados bem complexo e com um alto volume de
dados, na casa dos milhes de registros, o BI veio para dinamizar as consultas, j
no to performticas no convencional de banco relacional. O BI conhecido
geralmente por ser utilizado em empresas que buscam um diferencial competitivo,
visando aumentar os lucros, porm temos outro universo, onde podemos mapear
tendncias e indicadores para aes administrativas e at mesmo sociais, como no
caso apresentado. No estudo apresentado ser possvel conhecer a realidade e
munir os estados e municpios com essas informaes a fim de iniciar aes
polticas em seus benefcios. O uso interno da informao comum em qualquer
ente, pblico ou privado, a informao vital para a sobrevivncia e a interferncia
na realidade operacional e gerencial em consonncia com a misso da organizao.

65

Com acesso ferramenta OLAP bem simples e diversificada a gerao dos


relatrios, o nosso foco dar autonomia aos gestores para buscarem essa
informao. Abaixo segue um exemplo simples do que pode ser possvel dentro do
contexto estudado.

Figura 28 - Relatrio Valor da Renda Per capita e total das famlias por Estado

66

No grfico acima, possvel observar o mapeamento das mdias das rendas


per capitas e das totais das famlias agrupadas por estado. Como podemos observar
a renda mdia per capita muito baixa e h uma grande variao entre os estados
brasileiros. Com essa informao possvel ter o conhecimento do universo em que
estamos trabalhando. Com base nas informaes acima, selecionamos os estados
com maior e menor renda perca capta, Distrito Federal e Piau respectivamente, e
verificamos os aspectos das moradias dessas famlias, o primeiro ponto a ser
comparado foi em relao ao tratamento de gua, a seguir:

Figura 29 ndices domiclios DF agrupados por tipo de tratamento da gua

67

Figura 30 ndices domiclios PI agrupados por tipo de tratamento da gua

Podemos observar que o Distrito Federal, que foi o estado que obteve a maior
renda per capta do Brasil, possui poucos domiclios sem tratamento de gua,
totalizando 3,91% do total de domiclios participantes do programa, comparando
com o estado do Piau que possui a menor renda per capta o total de domiclios sem
tratamento de gua sobe para 31,80%, ou seja, uma diferena de 81,32% entre os
dois estados.
O MDS munido dessas informaes pode orientar os gestores da esfera
estadual, de como melhorar esse cenrio. Existem programas de capacitao
profissional que podem ser direcionados a esses estados de baixa renda. O
problema do tratamento de gua bem grave, pessoas que vivem em regies sem
tratamento de gua esto mais vulnerveis a contrair doenas, o que um grande
risco. Voltado para esse pblico, podem ser criados programas de assistncia, como
o exemplo do programa SIGCISTERNAS, onde foram implantadas cisternas de
captao de gua da chuva em ambientes que no possuem gua encanada ou que
moram em zonas rurais.
Esse foi apenas um exemplo das vrias informaes que podemos extrair
utilizando a ferramenta de OLAP.

68

6. CONSIDERAES FINAIS

Atualmente muitas empresas fazem mapeamentos gerenciais, porm esses


mapeamentos so apresentados de diversas maneiras, no padronizadas, muitas
vezes sendo entregues fora do prazo devido ao alto grau de complexidade tcnico,
pois os dados esto em diversos sistemas de origem, planilhas, arquivos de texto,
sistemas legados, web services e diversos outros tipos de fontes de dados. Alm
disso, ainda existem as limitaes tecnolgicas envolvidas, como por exemplo,
agregar dados de planilhas e bases de dados, ou fazer a juno entre bases de
dados de tecnologias distintas.
So inmeras as limitaes tecnolgicas, e tudo isso impacta diretamente o
negcio das organizaes, de tal forma que pode levar a uma perca no diferencial
competitivo. Diferencial competitivo a chave para a sobrevivncia de uma empresa
nos tempos atuais, onde tudo acontece muito rpido, novos produtos so lanados
diariamente com preos mais acessveis que um concorrente e rgos do governo
precisam entender como esto os seus programas oferecidos populao.
Atravs da soluo de BI apresentada pudemos ver como ela pde auxiliar a
tomada de decises estratgicas de uma organizao, sendo um diferencial. A
soluo apresentada permite que, alm dos relatrios apresentados, o usurio
possa criar uma infinidade de anlises a partir dos dados disponveis, combinando
informaes, analisando-os de forma histrica, navegando no tempo e tudo isso com
um alto grau de confiabilidade, uma vez que os dados foram tratados de forma
minuciosa. Outra vantagem foi a dinamicidade para criao das anlises, uma vez
que a ferramenta OLAP permite o acesso s informaes de forma facilitada e
orientada ao negcio.
Ao contrrio de planilhas eletrnicas, as solues de BI esto integradas
WEB, permitindo mobilidade e disponibilizao simultnea para todos os usurios
internos e externos organizao. As aplicaes de BI tm maior versatilidade na
explorao dos dados em seus diferentes nveis de granularidade, aumentando a
visibilidade e o poder decisrio.
Conseguimos nesse projeto implementar o projeto de BI utilizando
ferramentas de software livre, ferramentas estas que no deixaram a desejar em
nenhum quesito, todas em constante melhoria, como no caso do SpagoBI, que est

69

finalizando a sua plataforma para smartphones e tablets. E no podemos deixar de


mencionar o principal propsito do software livre, que a implantao de baixo
custo, nesse caso, o cliente que no possua nenhum tipo de ferramenta de controle
de gesto pde fazer uma prova de conceito, onde foram apresentados resultados
de grande importncia para o seu negocio, em um nvel gerencial.

70

REFERNCIAS

ABREU, Fbio. Estudo de usabilidade do software: Talend Open Studio como


ferramenta padro para ETL dos sistemas clientes da aplicao PostGeoOlap.
Maca: Faculdade Salesiana Maria Auxiliadora, 2007, Dissertao Graduao em
Sistemas de Informao, Maca, 2007.
ANTONELLI, Ricardo A. Conhecendo o Business Intelligence (BI): Uma
Ferramenta de Auxlio Tomada de Deciso. Revistas UTFPR, Pato Branco, v. 3, n.
3, p. 79-85, 2009.
BARBIERI, Carlos. BI Business Intelligence: Modelagem e Tecnologia. Rio de
Janeiro, Axcel Books, 2001.
EXECUTIVE BRIEFING, Guia Executivo Para Decises Estratgicas, A Importncia
da Business Intelligence. So Paulo, Now!Digital Business, 2012.
GONALVES, Marcio. Extrao de Dados para Data Warehouse. Rio de Janeiro:
Axcel Books, 2003.
HARRISON, Thomas. Intranet Data Warehouse: Inclui Data Mining e Extranet,
Ferramentas e Tcnicas Para a Utilizao do Data Warehouse na Internet. So
Paulo: Berkeley, 1998.
HOKAMA, D. D. B. et al. A modelagem de Dados no Ambiente Data Warehouse.
So Paulo: Universidade Presbiteriana Mackenzie, 2004. 121 p. Dissertao
Bacharelado em Sistemas de Informao, So Paulo, 2004.
KIMBALL, Ralph; CASERTA, Joe. The Data Warehouse ETL Toolkit: Practical
Techniques for Extracting, Cleaning, Conforming and Delivering Data. Indianapolis:
Wiley Publishing, 2004.

71

KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: The Complete
Guide to Dimensional Modeling. 2 ed. New York: Wiley Computing Publishing, 2002.
LACY, Miguel. O talento do Talend: Integrao de dados com o ETL Talend. Linux
Magazine, So Paulo, v. 50, n. 16, p. 62-67, janeiro/2009.
LACY, Miguel. SpagoBI Plataforma BI Livre e Aberta. Esprito Livre, Esprito
Santo, v. 15, n. 11, p. 59-65, junho/2010.
LEITE, Marcelo. Uma Palavra Sobre Open Source. So Paulo, 2005. Disponvel
em: <http://www.anysoft.com.br/content/view/13/52/> Acesso em: 5 jun. 2012.
MACHADO, Felipe. Projeto de Data Warehouse: Uma Viso Multidimensional. So
Paulo: rica, 2000.
SMANIOTO, Carlos. Tablespace. So Paulo, 2006. Disponvel em:
<http://www.devmedia.com.br/tablespace/1818> Acesso em: 10 jun. 2012.
SEZES, Carlos; OLIVEIRA, Jos; BAPTISTA, Miguel. Business Intelligence.
Porto, Sociedade Portuguesa de Inovao, S.A., 2006.
SYBASE Data Integration Suite, Installation Guide.
TURBAN, Efraim et al. Business Intelligence: Um Enfoque Gerencial para a
Inteligncia do Negcio. Porto Alegre, Bookman, 2009.
PRIMAK, F. V. Decises com BI (Business Intelligence). Rio de Janeiro, Cincia
Moderna, 2008.

72

ANEXOS

ANEXO A Dicionrio de Dados Data Mart Gesto das Famlias


DM_BAIRRO
ColumnName

DataType

PrimaryKey NotNull Flags

ID_BAIRRO

INTEGER

PK

NN

Default Value

UNSIGNED

Comment

AutoInc

Identificador do bairro

AI

DESC_BAIRRO

VARCHAR(60)

Nome do bairro, sem


abreviaes

SIGLA_UF

CHAR(2)

Sigla da UF

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_BAIRRO

DM_DESTINO_LIXO
ColumnName

DataType

ID_DESTINO_LIXO INTEGER

PrimaryKey NotNull Flags


PK

NN

COD_DESTINO_LIXO INTEGER

Default Value

Comment

AutoInc

UNSIGNED

Identificador de destino do
lixo

AI

UNSIGNED

Cdigo de destino do lixo

DESC_DESTINO_LIXO VARCHAR(13)

Descriode destino do lixo

DT_SCD_INI

DATE

Data inicial de registro

DT_SCD_FIM

DATE

Data final de registro

IND_SCD_ATIVO

CHAR(1)

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_DESTINO_LIXO

DM_INDICADOR
ColumnName

DataType

SIGLA_INDICADOR CHAR(3)
DESC_INDICADOR

PrimaryKey NotNull Flags Default Value

Comment

PK

Sigla do indicador

NN

VARCHAR(13)

AutoInc

Descrio do indicador

IndexName

IndexType

Columns

PRIMARY

PRIMARY

SIGLA_INDICADOR

DM_MUNICIPIO
ColumnName

DataType

PrimaryKey NotNull Flags

ID_MUNICIPIO INTEGER
COD_IBGE

PK

INTEGER

NN
NN

Comment

AutoInc

UNSIGNED

Default Value

Identificador do municpio

AI

UNSIGNED

Cdigo IBGE do muncipio


que contem o bairro.

DESC_MUNICIPIO VARCHAR(50)

Nome do muncipio que


contem o bairro.

SG_UF

CHAR(2)

Sigla da UF

IND_ADESAO

CHAR(1)

Indicador de adeso do
municipio (S/N).

IND_ATIVO

CHAR(1)

Flag para identificar se o


registro do municipio esta
ativo. Valores validos: S/N.

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_MUNICIPIO

DM_SITUACAO_DOMICILIO
ColumnName

DataType

PrimaryKey NotNull Flags

Default
Value

Comment

AutoInc

73

ID_SITUACAO_DOMICILIO INTEGER
COD_SITUACAO_DOMICILIO

PK

INTEGER

NN

UNSIGNED

Identificador da situao
AI
do domiclio

NN

UNSIGNED

Cdigo da situao do
domiclio
Descrio da situao
do domiclio

DESC_SITUACAO_DOMICILIO VARCHAR(13)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_SITUACAO_DOMICILIO

DM_TEMPO
ColumnName

DataType

PrimaryKey NotNull Flags Default Value Comment


NN

ID do registro (DATA
DD/MM/AAAA)

VARCHAR(20)

NN

Nome do dia da semana


(ex.: Segunda)

DIA_SEMANA

NUMERIC(5)

NN

Numero do dia da semana


de 1 a 7

DIA_MES

NUMERIC(5)

NN

Numero do dia do mes de


1 a 31

DIA_ANO

NUMERIC(5)

NN

Numero do dia do ano de


1 a 366

ID_MES

NUMERIC(10)

NN

ID do mes no formato
AAAAMM (ex.: 201001)

ANO_MES

CHAR(7)

NN

String no formato AAAAMM

DESC_ANO_MES

CHAR(8)

NN

Descricao do mes no
formato MMM/AAAA (ex.:
Jan/2010)

MS

NUMERIC(5)

NN

Numero do mes de 1 a 12

DESC_MES

CHAR(10)

NN

Descricao do mes (ex.:


Janeiro)

ID_MES_ANTERIOR

NUMERIC(10)

NN

ID do mes anterior no
formato AAAAMM (ex.:
200912)

ANO_MES_ANTERIOR

CHAR(7)

NN

String com o mes anterior


no formato AAAA-MM

DESC_ANO_MES_ANTERIOR

CHAR(8)

NN

Descricao do mes anterior


no formato MMM/AAAA
(ex.: Dez/2009)

MES_ANTERIOR

NUMERIC(5)

NN

Numero do mes anterior


de 1 a 12

DESC_MES_ANTERIOR

CHAR(10)

NN

Descricao do mes anterior


(ex.: Dezembro)

DATA_

DATE

DESC_DIA

PK

ID_TRIMESTRE

NUMERIC(5)

NN

ID do trimestre no
formato AAAAT (ex.:
20104 para o quarto
semestre de 2010)

TRIMESTRE

NUMERIC(5)

NN

Trimestre de 1 a 4

DESC_TRIMESTRE

CHAR(11)

NN

Descricao do trimestre no
formato No TRI AAAA

ID_TRIMESTRE_ANTERIOR

NUMERIC(5)

NN

ID do trimestre anterior
no formato AAAAT

TRIMESTRE_ANTERIOR

NUMERIC(5)

NN

Trimestre anterior de 1 a
4

DESC_TRIMESTRE_ANTERIOR CHAR(11)

NN

Descricao do trimestre
anterior no formato No
TRI AAAA

ID_SEMESTRE

NN

ID do semestre no
formato AAAAS

NUMERIC(10)

AutoInc

74

DESC_SEMESTRE

CHAR(11)

NN

Descricao do semestre no
formato No SEM AAAA

ID_SEMESTRE_ANTERIOR

NUMERIC(5)

NN

ID do semestre anterior
no formato AAAAS

DESC_SEMESTRE_ANTERIOR CHAR(11)

NN

Descricao do semestre
anterior no formato No
SEM AAAA

ANO

NUMERIC(5)

NN

Ano

ANO_ANTERIOR

NUMERIC(5)

NN

Ano anterior

SEMANA

NUMERIC(5)

NN

Numero da semana no
ano

DIATIPO

VARCHAR(15)

NN

Tipo do dia (ex.: Dia util)

ANO_DIAS_TOTAL

NUMERIC(5)

NN

Total de dias do ano (365


ou 366)

IndexName

IndexType

Columns

PRIMARY

PRIMARY

DATA_

DM_TIPO_ABASTECIMENTO_AGUA
ColumnName

DataType

ID_TIPO_ABASTECIMENTO_AGUA INTEGER

COD_TIPO_ABASTECIMENTO_AGUA

INTEGER

DESC_TIPO_ABASTECIMENTO_AGUA

VARCHAR(13)

DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

Default
Value

PrimaryKey NotNull Flags


PK

Comment

AutoInc

NN

UNSIGNED

Identificador do tipo
de abastecimento da AI
gua

NN

UNSIGNED

Cdigo do tipo de
abastecimento de
gua
Descrio tipo de
abastecimento de
gua
Data inicial de
registro

NN

Data final de registro


NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_TIPO_ABASTECIMENTO_AGUA

DM_TIPO_CONSTRUCAO
ColumnName

DataType

Default
Value

PrimaryKey NotNull Flags

ID_TIPO_CONSTRUCAO INTEGER

PK

COD_TIPO_CONSTRUCAO INTEGER

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

AutoInc
AI

NN

UNSIGNED

Identificador do tipo de
construo

NN

UNSIGNED

Cdigo do tipo de
construo
Descrio do tipo de
construo

DESC_TIPO_CONSTRUCAO VARCHAR(20)
DT_SCD_INI

Comment

NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_TIPO_CONSTRUCAO

DM_TIPO_DOMICILIO
ColumnName

DataType

ID_TIPO_DOMICILIO INTEGER
COD_TIPO_DOMICILIO INTEGER

PrimaryKey NotNull Flags


PK

Default Value

Comment

AutoInc
AI

NN

UNSIGNED

Identificador do tipo de
domiclio

NN

UNSIGNED

Cdigo do tipo de domiclio

75

Descrio do tipo de
domiclio

DESC_TIPO_DOMICILIO VARCHAR(13)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_TIPO_DOMICILIO

DM_TIPO_ESCOAMENTO_SANITARIO
ColumnName

DataType

ID_TIPO_ESCOAMENTO_SANITARIO INTEGER

COD_TIPO_ESCOAMENTO_SANITARIO

INTEGER

DESC_TIPO_ESCOAMENTO_SANITARIO

VARCHAR(16)

DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

Default
Comment
Value

PrimaryKey NotNull Flags


PK

AutoInc

NN

UNSIGNED

Identificador do tipo
de escoamento
AI
sanitrio

NN

UNSIGNED

Cdigo do tipo de
escoamento
sanitrio
Descriao do tipo de
escoamento
sanitrio
Data inicial de
registro

NN

Data final de
registro
Indicador de
ativao

NN

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_TIPO_ESCOAMENTO_SANITARIO

DM_TIPO_ILUMINACAO
ColumnName

DataType

ID_TIPO_ILUMINACAO INTEGER
COD_TIPO_ILUMINACAO

PrimaryKey NotNull Flags


PK

INTEGER

NN

UNSIGNED

Identificador do tipo de
iluminao

NN

UNSIGNED

Cdigo do tipo de
iluminao

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

AutoInc
AI

Descrio do tipo de
iluminao

DESC_TIPO_ILUMINACAO VARCHAR(19)
DT_SCD_INI

Default Value Comment

NN

Data inicial de registro


Data final de registro

NN

Inidcador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_TIPO_ILUMINACAO

DM_TIPO_LOCALIDADE
ColumnName

DataType

PrimaryKey NotNull Flags

Default Value Comment

NN

UNSIGNED

Identificador do tipo de
localidade

COD_TIPO_LOCALIDADE INTEGER

NN

UNSIGNED

Cdigo do tipo de localidade

DESC_TIPO_LOCALIDADE VARCHAR(13)

NN

Descrio do ipo de
localidade

DT_SCD_INI

DATE

NN

Data inicial de registro

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

ID_TIPO_LOCALIDADE INTEGER

PK

Data final de registro


NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_TIPO_LOCALIDADE

AutoInc
AI

76

DM_TIPO_TRATAMENTO_AGUA
ColumnName

DataType

ID_TIPO_TRATAMENTO_AGUA INTEGER
COD_TIPO_TRATAMENTO_AGUA

Default
Value

PrimaryKey NotNull Flags


PK

INTEGER

Comment

NN

UNSIGNED

Identificador do tipo
AI
de tratamento da gua

NN

UNSIGNED

Cdigo do tipo de
tratamento da gua
Descrio do tipo de
tratamento da gua

DESC_TIPO_TRATAMENTO_AGUA VARCHAR(15)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

AutoInc

NN

Data inicial de registro


Data final do registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_TIPO_TRATAMENTO_AGUA

FT_FAMILIA
Default
Comment
Value

ColumnName

DataType PrimaryKey NotNull Flags

ID_FAMILIA

INTEGER PK

NN

Identificador da
familia

COD_FAMILIAR

INTEGER PK

NN

Cdigo da familia

DT_CADASTRO_DOMICILIO

DATE

NN

Data do cadastro
de domicilio

DM_BAIRRO_ID_BAIRRO

INTEGER

NN

DT_EXTRACAO_CADASTRO

DATE

NN

Data da extrao
do cadastro

PK

UNSIGNED

Dimenso bairro
e identificador do
bairro

ID_TIPO_TRATAMENTO_AGUA

INTEGER

NN

UNSIGNED

Identificador do
tipo de
tratamento de
gua

ID_DESTINO_LIXO

INTEGER

NN

UNSIGNED

Identificador do
destino do lixo

ID_TIPO_ESCOAMENTO_SANITARIO

INTEGER

NN

UNSIGNED

Identificador do
tipo de
escoamento
sanitrio

ID_TIPO_ILUMINACAO

INTEGER

NN

UNSIGNED

Identificador do
tipo de
iluminao

ID_TIPO_ABASTECIMENTO_AGUA

INTEGER

NN

UNSIGNED

Identificador do
tipo de
abastecimento de
gua

ID_TIPO_CONSTRUCAO

INTEGER

NN

UNSIGNED

Identificador do
tipo de
construo

ID_TIPO_DOMICILIO

INTEGER

NN

UNSIGNED

Identificador do
tipo de domiclio

ID_SITUACAO_DOMICILIO

INTEGER

NN

UNSIGNED

Identificador da
situao do
domiclio

ID_TIPO_LOCALIDADE

INTEGER

NN

UNSIGNED

Identificador do
tipo de localidade

ID_MUNICIPIO

INTEGER

NN

UNSIGNED

Identificador do
municpio

QTD_PESSOAS_INFORMADA

INTEGER

Quantidade de
pessoas
informadas

QTD_PESSOAS_CALCULADA

INTEGER

Quantidade de

AutoInc

77

pessoas
calculadas
QTD_PESSOAS_EXCLUIDAS

INTEGER

Quantidade de
pessoas excluidas

QTD_MULHERES_GRAVIDAS

INTEGER

Quantidade de
mulheres
grvidas

QTD_MULHERES_GRAVIDAS_CALC

INTEGER

Quantidade de
mulheres
grvidas
calculadas

QTD_MAES_AMAMENTANDO

INTEGER

Quantidade de
mes
amamentando

QTD_MAES_AMAMENTANDO_CALC

INTEGER

Quantidade de
mes
amamentando
calculado

QTD_DEFICIENTES

INTEGER

Quantidade de
deficintes

QTD_DEFICIENTES_CALCULADOS

INTEGER

Quantidade de
deficintes
calculados

QTD_INDIGENAS

INTEGER

Quantidade de
indigenas

QTD_MARCACAO_PETI

INTEGER

Quantidade de
marcao peti

VLR_RENDA_PERCAPITA

DOUBLE
PRECISION

Valor da renda
per capita

VLR_RENDA_FAMILIA_PESSOAS_CALCULADAS

DOUBLE
PRECISION

Valor da renda da
famlia por
pessoa calculada

VLR_RENDA_FAMILIA_PESSOAS_INFORMADAS

DOUBLE
PRECISION

Valor da renda da
famlia por
pessoa informada

IND_FAMILIA_QUILOMBOLA

CHAR(1)

Identificador da
famlia
quilombola

IND_PERFIL_SAUDE

CHAR(1)

Identificador de
perfil da sade

IND_PERFIL_EDUCACAO

CHAR(1)

Identificador do
perfil da
educao

IND_RESPONSAVEL_LEGAL_INDIGENA

CHAR(1)

Identificador d
responsavel legal
indigena

IND_FAMILIA_SITUACAO_RUA

CHAR(1)

Identificador da
famlia e situao
da rua

IND_BENEFICIO_LEITE

CHAR(1)

Identificador do
benefcio do leite

IND_BENEFICIO_LEITE_PRODUTOR

CHAR(1)

Identificador do
benefcio do leite
e produtor

RF_CARGA

INTEGER

Referencia da
carga

NN

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_FAMILIA
COD_FAMILIAR
DT_CADASTRO_DOMICILIO

IN_FAMILIA_MUNICIPIO

Index

ID_MUNICIPIO

IN_FAMILIA_TIPO_LOCALIDADE

Index

ID_TIPO_LOCALIDADE

IN_FAMILIA_SITUACAO_DOMICILIO

Index

ID_SITUACAO_DOMICILIO

IN_FAMILIA_TIPO_DOMICILIO

Index

ID_TIPO_DOMICILIO

IN_FAMILIA_TIPO_CONSTRUCAO

Index

ID_TIPO_CONSTRUCAO

78

IN_FAMILIA_TIPO_ABASTECIMENTO_AGUA

Index

ID_TIPO_ABASTECIMENTO_AGUA

IN_FAMILIA_TIPO_ILUMINACAO

Index

ID_TIPO_ILUMINACAO

IN_FAMILIA_TIPO_ESCOAMENTO_SANITARIO Index

ID_TIPO_ESCOAMENTO_SANITARIO

IN_FAMILIA_DESTINO_LIXO

Index

ID_DESTINO_LIXO

IN_FAMILIA_DT_CADASTRO_DOMICILIO

Index

DT_CADASTRO_DOMICILIO

IN_FAMILIA_TIPO_TRATAMENTO_AGUA

Index

ID_TIPO_TRATAMENTO_AGUA

FT_FAMILIA_FKIndex14

Index

DT_EXTRACAO_CADASTRO

FT_FAMILIA_FKIndex13

Index

DM_BAIRRO_ID_BAIRRO

STG_FAMILIA
ColumnName

DataType

CD_FAMILIAR

INTEGER

NM_BAIRRO_LOGRADOURO

VARCHAR(40)

Nome do Bairro do
Logradouro

SG_UF_LOGRADOURO

CHAR(2)

Sigla UF do Logradouro

DT_EXTRACAO_CADASTRO

TIMESTAMP

NN

Data de Extrao do
Cadastro

CD_IBGE_CADASTRO

INTEGER

NN

Cdigo do IBGE do
Cadastro

CD_TIPO_LOCALIDADE

INTEGER

CD_SITUACAO_DOMICILIO

INTEGER

NN

Cdigo da Situao do
Domiclio

CD_TIPO_DOMICILIO

INTEGER

NN

Cdigo do Tipo do
Domiclio

NU_COMODOS

INTEGER

CD_CONSTRUCAO

INTEGER

NN

Cdigo do Tipo de
Construo

CD_ABASTECIMENTO_AGUA

INTEGER

NN

Cdigo do Tipo de
Abastecimento da gua

CD_TRATAMENTO_AGUA

INTEGER

NN

Cdigo do Tipo de
Tratamento da gua

CD_ILUMINACAO

INTEGER

NN

Cdigo do Tipo de
Iluminao

CD_ESCOAMENTO_SANITARIO

INTEGER

NN

Cdigo do Tipo de
Escoamento Sanitrio

CD_DESTINO_LIXO

INTEGER

NN

Cdigo do Tipo de
Destino do Lixo

QT_PESSOAS_INFORMADA

INTEGER

Quantidade de Pessoas
Informadas

QT_PESSOAS_CALCULADA

INTEGER

Quantidade de Pessoas
Calculadas

QT_PESSOAS_EXCLUIDAS

INTEGER

Quantidade de Pessoas
Excludas

QT_MULHERES_GRAVIDAS

INTEGER

Quantidade de Mulheres
Grvidas

QT_MULHERES_GRAVIDAS_CALC INTEGER

Quantidade de Mulheres
Grvidas Calculadas

QT_MAES_AMAMENTANDO

Quantidade de Mes
Amamentando

INTEGER

PrimaryKey NotNull Flags Default Value Comment


NN

Cdigo do Familiar

Cdigo do Tipo da
Localidade

Nmero de Comodos

QT_MAES_AMAMENTANDO_CALC INTEGER

Quantidade de Mes
Amamentando Calculada

QT_DEFICIENTES

Quantidade de
Deficientes

INTEGER

QT_DEFICIENTES_CALCULADOS INTEGER

Quantidade de
Deficientes Calculados

DT_CADASTRO_DOMICILIO

TIMESTAMP

Data de Cadastro do
Domiclio

DT_INCLUSAO_DOMICILIO

TIMESTAMP

Data de Incluso do
Domiclio

AutoInc

79

DT_ALTERACAO_DOMICILIO

TIMESTAMP

Data de Alterao do
Domiclio

IN_COMPLEMENTADO_BES

CHAR(1)

Indicao de
Complementado BES

IN_FAMILIA_QUILOMBOLA

CHAR(1)

Indicador de Famlia
Quilombola

VL_RENDA_PERCAPITA

DOUBLE
PRECISION

Valor da Renda Per


capita

NU_NIS_RL

VARCHAR(11)

IN_PERFIL_SAUDE

CHAR(1)

IN_PERFIL_EDUCACAO

CHAR(1)

QT_INDIGENAS

INTEGER

IN_RL_INDIGENA

CHAR(1)

QT_MARCACAO_PETI

INTEGER

IN_FAMILIA_SITUACAO_RUA

CHAR(1)

IN_BENEF_LEITE

CHAR(1)

IN_BENEF_LEITE_PRODUTOR

CHAR(1)

STG_MUNICIPIO
ColumnName

DataType

PrimaryKey NotNull Flags

CD_IBGE

INTEGER

PK

NM_MUNICIPIO

VARCHAR(40)

Nome do Municpio

SG_UF

VARCHAR(2)

Sigla da UF

IN_ADESAO

CHAR(1)

Indicador de Adeso

ST_ATIVO

CHAR(1)

Indicador de Ativao no
IBGE

NN

Default Value

UNSIGNED

Comment

AutoInc

Cdigo do IBGE

IndexName

IndexType

Columns

PRIMARY

PRIMARY

CD_IBGE

ANEXO B Dicionrio de Dados Data Mart Gesto dos Integrantes


DM_BENEFICIO_PETI
ColumnName

DataType

ID_BENEFICIO_PETI INTEGER

PrimaryKey NotNull Flags


PK

NN

COD_BENEFICIO_PETI VARCHAR(3)

Default Value

UNSIGNED

NN

DESC_BENEFICIO_PETI VARCHAR(13)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

Comment

AutoInc

Identificador do benefcio
peti

AI

Cdigo do benefcio peti


Descruo do benefcio peti

NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_BENEFICIO_PETI

DM_ESTADO_CIVIL
ColumnName

DataType

ID_ESTADO_CIVIL INTEGER
COD_ESTADO_CIVIL VARCHAR(3)

PrimaryKey NotNull Flags Default Value

Comment

AutoInc

PK

NN

Identificador de estador civil

AI

NN

Cdigo do estado civil

DESC_ESTADO_CIVIL VARCHAR(13)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

Descrio do estado civil


NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

80

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_ESTADO_CIVIL

DM_GRAU_INSTRUCAO
ColumnName

DataType

ID_GRAU_INSTRUCAO INTEGER

PrimaryKey NotNull Flags Default Value

Comment

AutoInc

PK

NN

Identificador do grau de
instruo

AI

NN

Cdigo do grau de instruo

COD_GRAU_INSTRUCAO VARCHAR(3)

Descrio do grau de
instruo

DESC_GRAU_INSTRUCAO VARCHAR(50)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_GRAU_INSTRUCAO

DM_INTEGRANTE
ColumnName

DataType

PrimaryKey NotNull Flags Default Value

Comment

AutoInc

ID_INTEGRANTE

INTEGER

PK

NN

Identificador de integrante

AI

NU_NIS_INTEGRANTE

BIGINT

NN

Nmero do NIS de integrante

NOME_INTEGRANTE

VARCHAR(100)

NN

Nome do integrante

NOME_MAE_INTEGRANTE VARCHAR(100)

Nome da me do integrante

NOME_PAI_INTEGRANTE VARCHAR(100)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

Nome do pai do integrante


NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_INTEGRANTE

DM_NACIONALIDADE
ColumnName

DataType

ID_NACIONALIDADE INTEGER

PrimaryKey NotNull Flags Default Value

Comment

AutoInc

PK

NN

Identificador de
nacionalidade

AI

NN

Cdigo da nacionalidade

COD_NACIONALIDADE VARCHAR(3)
DESC_NACIONALIDADE VARCHAR(25)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

Descrio da nacionalidade
NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_NACIONALIDADE

DM_OCUPACAO
ColumnName

DataType

PrimaryKey NotNull Flags Default Value

Comment

AutoInc

ID_OCUPACAO

INTEGER

PK

NN

Indentificador da ocupao

AI

COD_OCUPACAO

VARCHAR(5)

NN

Cdigo da ocupao
Descrio do titulo da
ocupao

DESC_TITULO_OCUPACAO VARCHAR(250)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

81

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_OCUPACAO

DM_PAIS_ORIGEM
ColumnName

DataType

PrimaryKey NotNull Flags Default Value

Comment

AutoInc

PK

NN

Identificador de pas de
origem

AI

COD_PAIS_ORIGEM VARCHAR(3)

NN

Cdigo de pas de origem

DT_SCD_INI

DATE

NN

Data inicial de registro

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

ID_PAIS_ORIGEM INTEGER

Data final de registro


NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_PAIS_ORIGEM

DM_RACA_COR
ColumnName

DataType

ID_RACA_COR

INTEGER

COD_RACA_COR

VARCHAR(3)

PrimaryKey NotNull Flags


PK

NN

Default Value

UNSIGNED

NN

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

AutoInc

Identificador da raa e da
cor

AI

Cdigo da raa e da cor

DESC_RACA_COR VARCHAR(13)
DT_SCD_INI

Comment

Descrio da raa e da cor


NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_RACA_COR

DM_SERIE_ESCOLAR
Default
Value

ColumnName

DataType

PrimaryKey NotNull Flags

ID_SERIE_ESCOLAR

INTEGER

PK

COD_SERIE_ESCOLAR

VARCHAR(3)

DESC_SERIE_ESCOLAR

VARCHAR(200)

Descrio da serie
escolar

DESC_SERIE_ESCOLAR_RESUMIDA VARCHAR(100)

Descrio da serie
escolar resumida

DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

NN

UNSIGNED

NN

Comment

AutoInc

Identificador da serie
escolar

AI

Cdigo da serie escolar

NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_SERIE_ESCOLAR

DM_SEXO
ColumnName

DataType

PrimaryKey NotNull Flags Default Value

Comment

AutoInc

ID_SEXO

INTEGER

PK

Identificador do sexo

AI

SG_SEXO

CHAR(1)

Sigla do sexo

DESC_SEXO

VARCHAR(13)

Descrio do sexo

NN

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_SEXO

DM_SITUACAO_MERCADO_TRABALHO
ColumnName

DataType

PrimaryKey NotNull Flags

Default Comment

AutoInc

82

Value
ID_SITUACAO_MERCADO_TRABALHO INTEGER

COD_SITUACAO_MERCADO_TRABALHO

PK

NN

VARCHAR(3)

UNSIGNED

VARCHAR(40)

DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

AI

Cdigo da situao
do mercado de
trabalho

NN

DESC_SITUACAO_MERCADO_TRABALHO

Identificador da
situao do
mercado de
trabalho

Descrio da
situao do
mercador de
trabalho
Data inicial de
registro

NN

Data final de
registro
Indicador de
ativao

NN

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_SITUACAO_MERCADO_TRABALHO

DM_TIPO_ESCOLA
ColumnName

DataType

ID_TIPO_ESCOLA INTEGER

PrimaryKey NotNull Flags Default Value

Comment

AutoInc

PK

NN

Identificador do tipo de
escola

AI

NN

Cdigo do tipo de escola

COD_TIPO_ESCOLA VARCHAR(3)
DESC_TIPO_ESCOLA VARCHAR(20)
DT_SCD_INI

DATE

DT_SCD_FIM

DATE

IND_SCD_ATIVO

CHAR(1)

Descrio do tipo de escola


NN

Data inicial de registro


Data final de registro

NN

Indicador de ativao

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_TIPO_ESCOLA

FT_INTEGRANTE
ColumnName

DataType

PrimaryKey NotNull Flags

ID_INTEGRANTE

INTEGER

PK

NU_NIS_INTEGRANTE

BIGINT

PK

ID_PAIS_ORIGEM

Default
Value

Comment

AutoInc

NN

Identificador de
integrante

AI

NN

Nmero de NIS do
integrante

INTEGER

NN

Identificador de pas e
origem

DT_EXTRACAO_CADASTRO

DATE

NN

Data de extrao de
cadastro

ID_BENEFICIO_PETI

INTEGER

NN

ID_OCUPACAO

INTEGER

NN

ID_SITUACAO_MERCADO_TRABALHO INTEGER

NN

UNSIGNED

Identificador de
situao do mercador
de trabalho

ID_SERIE_ESCOLAR

INTEGER

NN

UNSIGNED

Identificador de serie
escolar

ID_GRAU_INSTRUCAO

INTEGER

NN

Identificador do grau
de instruo

ID_TIPO_ESCOLA

INTEGER

NN

Identificador do tipo
de escola

ID_NACIONALIDADE

INTEGER

NN

Identificador de
nacionalidade

UNSIGNED

Identificador de
benefcio peti
Identificador de
ocupao

83

ID_ESTADO_CIVIL

INTEGER

NN

Identificador de
estado civil

ID_SEXO

INTEGER

NN

Identificador do sexo

ID_RACA_COR

INTEGER

NN

UNSIGNED

Identificador de raa
e cor

ID_MUNICIPIO

INTEGER

NN

UNSIGNED

Identificador de
municpio

IND_NENHUMA_DEFICIENCIA

CHAR(1)

Indicador de
nenhuma deficincia

IND_DEFICIENCIA_CEGUEIRA

CHAR(1)

Indicador de
deficincia cegueira

IND_DEFICIENCIA_MUDEZ

CHAR(1)

Indicador de
deficincia de mudez

IND_DEFICIENCIA_SURDEZ

CHAR(1)

Indicador de
deficincia de surdez

IND_DEFICIENCIA_MENTAL

CHAR(1)

Indicador de
deficincia mental

IND_DEFICIENCIA_FISICA

CHAR(1)

Indicador de
deficincia fsica

IND_OUTRA_DEFICIENCIA

CHAR(1)

Indicador de outra
deficincia

IND_PARTICIPA_PETI

CHAR(1)

Indicador de
participao peti

IND_PESSOA_EXCLUIDA

CHAR(1)

Indicador de pessoa
excluida

QTD_PESSOAS_INFORMADA

INTEGER

UNSIGNED

Quantidade de
Pessoas Informadas

QTD_PESSOAS_CALCULADA

INTEGER

UNSIGNED

Quantidade de
Pessoas Calculadas

QTD_PESSOAS_EXCLUIDAS

INTEGER

UNSIGNED

Quantidade de
Pessoas Excludas

QTD_MULHERES_GRAVIDAS

INTEGER

UNSIGNED

Quantidade de
Mulheres Grvidas

QTD_MULHERES_GRAVIDAS_CALC

INTEGER

UNSIGNED

Quantidade de
Mulheres Grvidas
Calculadas

QTD_MAES_AMAMENTANDO

INTEGER

UNSIGNED

Quantidade de Mes
Amamentando

QTD_MAES_AMAMENTANDO_CALC

INTEGER

UNSIGNED

Quantidade de Mes
Amamentando
Calculadas

QTD_DEFICIENTES

INTEGER

UNSIGNED

Quantidade de
Deficientes

QTD_DEFICIENTES_CALCULADOS

INTEGER

UNSIGNED

Quantidade de
Deficientes Calculados

VL_RENDA_PERCAPITA

INTEGER

UNSIGNED

Valor da Renda Per


capita

IndexName

IndexType

Columns

PRIMARY

PRIMARY

ID_INTEGRANTE
NU_NIS_INTEGRANTE

IN_INTEGRANTE_MUNICIPIO

Index

ID_MUNICIPIO

IN_INTEGRANTE_RACA_COR

Index

ID_RACA_COR

IN_INTEGRANTE_INTEGRANTE

Index

ID_INTEGRANTE

IN_INTEGRANTE_SEXO

Index

ID_SEXO

IN_INTEGRANTE_ESTADO_CIVIL

Index

ID_ESTADO_CIVIL

IN_INTEGRANTE_NACIONALIDADE

Index

ID_NACIONALIDADE

IN_INTEGRANTE_TIPO_ESCOLA

Index

ID_TIPO_ESCOLA

IN_INTEGRANTE_GRAU_INSTRUCAO

Index

ID_GRAU_INSTRUCAO

IN_INTEGRANTE_SERIE_ESCOLAR

Index

ID_SERIE_ESCOLAR

IN_INTEGRANTE_SITUACAO_MERCADO_TRABALHO Index

ID_SITUACAO_MERCADO_TRABALHO

IN_INTEGRANTE_OCUPACAO

ID_OCUPACAO

Index

84

IN_INTEGRANTE_BENEFICIO_PETI

Index

ID_BENEFICIO_PETI

IN_INTEGRANTE_DT_EXTRACAO_CADASTRO

Index

DT_EXTRACAO_CADASTRO

FT_INTEGRANTE_FKIndex15

Index

ID_PAIS_ORIGEM

STG_INTEGRANTE
ColumnName

DataType

PrimaryKey NotNull Flags Default Value


NN

Comment

AutoInc

Nmero do NIS do
integrantes

AI

NU_NIS_INTEGRANTE

BIGINT

NM_PESSOA

VARCHAR(70)

Nmero de pessoas

CD_IBGE_CADASTRO

INTEGER

Cdigo do cadatro do IBGE

DT_NASCIMENTO

TIMESTAMP

Data de nascimento

CD_RACA_COR

SMALLINT

Cdigo da raa e da cor

CD_SEXO

SMALLINT

Cdigo do sexo

CD_ESTADO_CIVIL

SMALLINT

Cdigo do estado civil

NM_MAE

VARCHAR(70)

Nome da me

NM_PAI

VARCHAR(70)

Nome do pai

IN_NENHUMA_DEFICIENCIA CHAR(1)

Indicador de nenhuma
deficincia

IN_DEFICIENCIA_CEGUEIRA CHAR(1)

Indicador de deficincia de
segueira

IN_DEFICIENCIA_MUDEZ

CHAR(1)

Indicador de deficincia de
mudez

IN_DEFICIENCIA_SURDEZ

CHAR(1)

Indicador de deficincia de
surdez

IN_DEFICIENCIA_MENTAL

CHAR(1)

Indicador de deficincia
mental

IN_DEFICIENCIA_FISICA

CHAR(1)

Indicador de deficincia fsica

IN_OUTRA_DEFICIENCIA

CHAR(1)

Indicador de outra deficincia

CD_NACIONALIDADE

SMALLINT

Cdigo de nacionalidade

CD_PAIS_ORIGEM

SMALLINT

Cdigo do pas de origem

CD_ESCOLA

SMALLINT

Cdigo da escola

CD_GRAU_INSTRUCAO

SMALLINT

Cdigo do grau de instruo

CD_SERIE_ESCOLAR

SMALLINT

Cdigo da serie escolar

CD_MERCADO_TRABALHO

SMALLINT

Cdigo do mercado de
trabalho

CD_OCUPACAO

INTEGER

Cdigo da acupao

IN_PARTICIPA_PETI

CHAR(1)

Indicador de participao peti

CD_BENEFICIO_PETI

SMALLINT

Cdigo do benefcio peti

IN_PESSOA_EXCLUIDA

CHAR(1)

Indicador de pessoa excluida

DT_EXTRACAO_CADASTRO TIMESTAMP

Data da extrao do cadastro

STG_SERIE_ESCOLAR
Default
Value

ColumnName

DataType

PrimaryKey NotNull Flags

CD_SERIE_ESCOLAR

INTEGER

PK

DS_SERIE_ESCOLAR

VARCHAR(200)

Descriminao da serie
escolar

DS_SERIE_ESCOLAR_RESUMIDA VARCHAR(100)

Descriminao da serie
escolar resumida

NN

UNSIGNED

Comment

AutoInc

Cdigo da serie escolar AI

IndexName

IndexType

Columns

PRIMARY

PRIMARY

CD_SERIE_ESCOLAR

Das könnte Ihnen auch gefallen