Sie sind auf Seite 1von 56

Aula 01

Banco de dados e BI p/ DATAPREV (Anlise de Negcios)


Professor: Thiago Rodrigues Cavalcanti

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

AULA 01: Business Intelligence (tcnicas de


modelagem de BI)

Sumrio
Sistemas de suporte deciso (DSS) e Inteligncia de negcio (BI) ......................... 1
1. Conceitos bsicos ............................................................................................................. 2
2. Fundamentos de Gesto do Conhecimento............................................................ 3
3. Fundamentos de Inteligncia Competitiva (CI).................................................... 8
4. Business Intelligence ...................................................................................................... 9
4.1. Componentes de um sistema de Business Intelligence (BI) ..................... 11
5. Data Warehouse ............................................................................................................. 12
5.1. Conceitos e caractersticas ..................................................................................... 12
5.2. Tipos de DW ................................................................................................................. 17
5.3. Processo de DW .......................................................................................................... 19
5.4. Arquitetura de DW ..................................................................................................... 20
5.5. Kimball x Inmon.......................................................................................................... 23
6. Modelagem multidimensional .................................................................................... 24
6.1. Star Schema ................................................................................................................. 26
6.2. Processo de design dimensional ........................................................................... 28
6.3. Revisitando o modelo ............................................................................................... 30
6.4. Esquemas multidimensionais ................................................................................. 36
7. ETL ....................................................................................................................................... 37
7.1. Componentes de ETL ................................................................................................ 38
7.2. Processo de ETL .......................................................................................................... 42
Questes comentadas .............................................................................................................. 43
Questes extras .......................................................................................................................... 53
Consideraes Finais ..................................................................................................................... 63

Sistemas de suporte deciso (DSS) e


Inteligncia de negcio (BI) 51583806784

Comeamos aqui um conjunto de aulas a respeito de Business Intelligence


(BI) ou Sistemas de suporte deciso. A literatura especializada trata esses dois
termos de forma bem semelhante, eles esto associados a um conjunto de
buzzwords ou jarges que esto na moda. Mas ser que eles entregam algum
valor? Como os elementos que fazem parte destas estruturas se relacionam? O
objetivo desta nossa aula fazer uma introduo, apresentando os termos
tcnicos associados ao assunto e seus conceitos.

Esta aula lida com um conjunto de tecnologias que do suporte as


decises gerenciais por meio de informaes internas e externas s
organizaes. Essas tecnologias tem um profundo impacto na estratgia

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 1 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

corporativa, na performance e na competitividade. Esse conjunto de


tecnologias coletivamente conhecido como BUSINESS INTELLIGENCE (BI).

Observem a figura abaixo. Ela nos mostra uma gama de elementos que
est associada ao conceito de BI.

1. Conceitos bsicos
medida que subimos no nvel decisrio das organizaes, as decises
carregam consigo um grande escopo de influncia e impacto financeiro. Isso nos
incentiva a tomar a deciso correta. Neste momento surge a necessidade de
sistemas de informao para assistir ou auxiliar os tomadores de decises. Esses
sistemas foram inicialmente chamados de Sistemas de Suporte a Deciso
(DSS).

O termo DDS, propriamente dito, tem sido utilizado cada vez menos, tanto
em livros e revistas, quanto na internet. Atualmente, podemos dizer que esse
conceito foi modernizado e esses sistemas so denominados de Sistemas de
Business Intelligence (BI). 51583806784

BI um conceito empregado a ferramentas, tecnologias e metodologias,


que tem como objetivo fornecer informaes estratgicas, que apoiam a tomada
de deciso. O termo Business Intelligence foi cunhado por Howard Dresner em
1989, e foi descrito como "conceitos e mtodos para melhorar a tomada de
deciso de negcio utilizando sistemas de suporte baseados em fatos".
Simplificando: BI transformar dados em informaes teis (conhecimento).

Vejamos outra definio de BI: Um conjunto de conceitos, mtodos e


recursos tecnolgicos que habilitam a obteno e distribuio de informaes
geradas a partir de dados operacionais, histricos e externos, visando
proporcionar subsdios para a tomada de decises gerenciais e estratgicas.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 2 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Alguns conhecimentos esto relacionados a BI e no aparecem na figura


apresentada anteriormente. O autor Carlos Barbieri cita em seu livro a gesto do
conhecimento (KM), a inteligncia competitiva (CI) e o BSC - Balanced
ScoreCard. Ele considerar esses conceitos correlatos de BI. Neste curso nos
optamos por apresenta-los primeiro. Vamos falar de KM e CI.

2. Fundamentos de Gesto do
Conhecimento
Vamos, nas prximas pginas, fazer uma introduo ao assunto de gesto
do conhecimento. Esse assunto faz parte da motivao dos sistemas de
inteligncia que veremos em seguida.

Dado, informao, conhecimento e inteligncia.

So mltiplos os desafios de um mundo globalizado, sendo difcil at


mesmo obter consenso sobre quais seriam os prioritrios. Todavia, um deles
tornar o conhecimento acessvel a todos destaca-se como um dos mais
importantes devido aos seus efeitos estruturantes.

com esse texto que se inicia a apresentao do livro Inteligncia,


Informao e Conhecimento, uma coleo de artigos sobre gesto do
conhecimento organizada em 2006 pela UNESCO. Para entender este assunto
preciso conhecer os conceitos bsicos que vo subsidiar nosso entendimento,
so eles: dados, informao, conhecimento e inteligncia.

Dado pode ser definido como sucesses de fatos brutos, que no foram
organizados, processados, relacionados, avaliados ou interpretados,
representando apenas partes isoladas de eventos, situaes ou ocorrncias.
Constituem as unidades bsicas a partir das quais informaes podero ser
elaboradas ou obtidas.

Quando os dados passam por algum tipo relacionamento, avaliao,


51583806784

interpretao ou organizao tem-se a gerao de informao. A partir do


momento em que dados so transformados em informaes, decises podem ser
tomadas.

Conhecimento uma informao contextual, relevante e acionvel.


Segundo Turban, conhecimento a informao em ao. Capital intelectual (ou
recursos intelectuais) outro termo frequentemente usado como sinnimo de
conhecimento. Conhecimento uma informao valiosa da mente, inclui
reflexo, sntese e contexto. difcil de estruturar, difcil de capturar em
computadores, normalmente tcito (no explcito) e sua transparncia
complexa.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 3 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Veja abaixo um quadro comparativo entre conhecimento, informao e


dados:

Faltou apresentar a inteligncia! Para exibi-la de forma contextualizada e


aproveitar para expor algumas caractersticas do processo quem tem inicio na
aglomerao de dados brutos vamos apresentar uma figura abaixo e em seguida
tecer alguns comentrios sobre a mesma.

Dados compreendem a classe mais baixa de informao e incluem os itens


que representam fatos, textos, grficos, imagens estticas, sons, segmentos de
vdeo analgicos ou digitais etc. Os dados so coletados, por meio de processos
organizacionais, nos ambientes interno e externo. Em suma, dados so sinais
que no foram processados, correlacionados, integrados, avaliados ou
51583806784

interpretados de qualquer forma. Esta classe representa a matria-prima a ser


utilizada na produo de informaes.

A prxima classe a da informao propriamente dita. Nesta, os dados


passam por algum tipo de processamento para serem exibidos em uma forma
inteligvel s pessoas que iro utiliz-los. Processar dados inclui a revelao de
fotografias de um filme, as transmisses de rdio transformadas em um formato
de relatrio padronizado, a exibio de arquivos de computador como texto ou
grfico em uma tela, a grade de coordenadas em um mapa etc. O processo de
transformao envolve a aplicao de procedimentos que incluem formatao,
traduo, fuso, impresso e assim por diante. A maior parte deste
processo pode ser executada automaticamente.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 4 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Uma vez que dados tenham sido transformados em informaes, pelo


menos em uma interpretao inicial, possvel refinar as informaes mediante
um processo de elaborao. As informaes resultantes deste processo incluem
caractersticas adicionais do problema, geram hipteses, consequncias das
hipteses, sugerem solues para problemas, explanao e justificativas de
sugestes, crtica de argumentos, entre outras sadas. Portanto, a transformao
de dados em informaes deve ser vista simplificadamente, como um tipo de
pr-processamento de um processo de elaborao.

O prximo nvel o do conhecimento, que pode ser definido como sendo


informaes que foram analisadas e avaliadas sobre a sua confiabilidade,
sua relevncia e sua importncia. Neste caso, o conhecimento obtido pela
interpretao e integrao de vrios dados e informaes para iniciar a
construo de um quadro de situao. O processo de transformao realizado
por meio de avaliao de dados e informaes. Os insumos provenientes das
diversas fontes so analisados e combinados na sntese de um produto final, o
conhecimento. por meio do conhecimento que aqueles que assessoram as
decises buscam uma compreenso mais efetiva da situao problema.

O conhecimento no esttico, modificando-se mediante a interao


com o ambiente, sendo este processo denominado aprendizado. Uma viso
mais ampla que o aprendizado a integrao de novas informaes em
estruturas de conhecimento, de modo a torn-las potencialmente utilizveis em
processos futuros de processamento e de elaborao. Alm disto, conhecimentos
novos podem resultar de um processo de inferncia na prpria estrutura do
conhecimento.

O nvel mais alto desta hierarquia a inteligncia, que pode ser entendida
como sendo a informao como oportunidade, ou seja, o conhecimento
contextualmente relevante que permite atuar com vantagem no
ambiente considerado. Tambm pode ser vista como o conhecimento que foi
sintetizado e aplicado a uma determinada situao, para ganhar maior
profundidade de conscincia da mesma. Portanto, a inteligncia resulta da
51583806784

sntese de corpos de conhecimentos, so usados julgamento e intuio daquele


que toma decises e uma visualizao completa da situao obtida.

Idealmente, o entendimento de uma situao apoia a tomada de deciso na


visualizao do cenrio e cria as condies para que o planejamento possa ser
realizado e as aes efetivadas. Alm disso, podem ser revelados fatores crticos
em qualquer situao, possibilitando a antecipao a eventos, mediante o
reconhecimento das consequncias de novos ou iminentes efeitos de uma
deciso. Por tudo isso, a inteligncia deve ser a base do processo decisrio,
mesmo considerando que raramente possvel alcanar a compreenso total.

A transformao de conhecimento em inteligncia realizada por meio de


sntese, sendo uma habilidade puramente humana baseada em experincia e

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 5 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

intuio, que vai muito alm da capacidade de qualquer sistema especialista ou


de inteligncia artificial. Sntese simplesmente no pode ser reduzida a
procedimentos ou regras, por no considerarem o complexo.

Por fim, a experincia pode ser definida como a efetividade da


inteligncia de uma organizao, que aperfeioada pelas decises tomadas
e consideradas como geradoras de algum tipo de vantagem. Ento, a
experincia uma agregao de valor ao processo decisrio de uma
reorganizao, por refletir toda a sua capacitao para atuar com
competitividade no seu ambiente externo.

Conhecimento tcito e explcito

Observando os conceitos acima apresentados possvel prever que uma


empresa pode gerir de forma eficiente e informatizada o conhecimento.
Devemos, portanto, primeiro viabilizar a converso de conhecimento para em
seguida geri-lo de maneira eficiente. Esse pode ser dividido em tcito,
armazenado nas pessoas e adquirido atravs de experincias de vida,
e explcito ou codificado, encontrado na forma de texto, formalizado e pode ser
facilmente transmitido atravs do um meio fsico. H quatro formas bsicas
pelas quais o conhecimento pode ser transmitido:

1 Socializao que a interao do conhecimento atravs da troca de


ideias e do compartilhamento de experincias, por meio de observao ou/e da
prtica.

2 Externalizao neste caso o conhecimento pessoal passa para o


domnio pblico por meio de uma documentao. Este pode ser reutilizado por
outro, portanto deve ser classificado.

3 Internalizao adquirido a partir de leitura. Vem de alguma publicao


escrita que pode estar disponvel em livro, revistas, na Internet ...

4 Combinao neste caso o conhecimento explcito de diferentes fontes


51583806784

agrupado ou misturado visando agregar valor para gerar um novo


conhecimento.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 6 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Vejam a figura acima as formas de converso do conhecimento.

Dados estruturados e no estruturados.

Quando resolvemos classificar os dados uma das taxonomias possveis


aquela que divide os dados de acordo com a sua estruturao. Neste contexto
segregamos os dados em estruturados, semiestruturados e no estruturados.
Vamos tentar definir cada um deles:

Dados estruturados so aqueles organizados e armazenados em SGBD,


geralmente relacional, que possui como caractersticas possuir uma descrio
sobre os dados, conhecidos como metadados. Os dados estruturados so
definidos por um esquema ou um formato padro para cada um dos atributos.
So organizados em blocos semnticos, no modelo relaciona conhecidos como
relaes.

Podemos, portanto, observar que existe uma mesma estrutura de


representao para cada grupo de item de dados (relao) que rgida e
51583806784

definida previamente por meio de um esquema.

Dados semiestruturados. Essa segunda categoria de dados geralmente


no mantida em SGBDs (embora a maioria dos bancos de dados relacionais
admita o tipo XML, seguindo a recomendao do padro SQL). Os dados
semiestruturados apresentam uma organizao bastante heterognea o que
pode dificultar as consultas a esses dados. Os dados no so estritamente
tipados, mas tambm no so completamente desestruturados. O que ento faz
com que ele seja classificado desta forma?

Os dados semiestruturados so dados onde o esquema de representao


est presente de forma explcita ou implcita, podendo ser, inclusive, auto
descritivo. Uma anlise do dado dever ser feita para que a sua estrutura seja

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 7 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

identificada e extrada. Como exemplos de dados semiestruturados podemos


citar: XML eXtensible Markup Language, RDF Resource Description
Framework, OWL Web Ontology Language.

Como caractersticas destes dados podemos listar: 1. Definio posteriori


os esquemas so definidos aps a existncia dos dados por meio da
investigao de suas estruturas particulares. 2. Estrutura irregular no existe
um esquema padro para os dados, as colees de dados so definidas de
maneiras diferentes, podendo conter informaes incompletas. 3. Estrutura
implcita muitas vezes uma estrutura implcita. 4. Estrutura parcial apenas
parte dos dados disponveis podem ter uma estrutura.

Dados no estruturados. De forma simples so inclusos aqui os dados


que no possuem uma estrutura definida. Podem ser listados como exemplo
documentos, textos, imagens e vdeos. Esses, geralmente, no possuem
descrio para suas estruturas, nem implicitamente. A grande maioria dos dados
disponveis na Web so classificados dentro destes formatos.

Dado a grande quantidade de dados (volume), uma imensa variedade de


dados e a necessidade de processamento cada vez mais rpida (velocidade)
surge o conceito de Big Data, que ser assunto de uma aula posterior (caso seja
um assunto cobrando no seu concurso).

3. Fundamentos de Inteligncia
Competitiva (CI)
Os sistemas de inteligncia competitiva tm por objetivo prover as
organizaes de um processo sistemtico de coleta e anlise de informaes
sobre as atividades correlatas e tendncias de mercado. Eles visam
absorver o maior nmero de informaes que possibilitem melhoria no processo
de tomada de deciso e de desenvolvimento empresarial.

A ideia bsica de CI explorar o outro lado da trincheira, obtendo


51583806784

informaes detalhadas sobre os competidores e o mercado no qual se guerreia


para ser a opo do cliente. Podemos entender CI como um BI aplicado ao
mundo fora de nossas fronteiras empresariais, focando primariamente em
informaes textuais e factuais que dizem respeito aos movimentos do mercado
e dos concorrentes, detectando as suas ameaas e oportunidades. Ou o que se
precisa descobrir para ganhar competitividade

Combs e Moorhead definem inteligncia competitiva como a seleo,


coleo, interpretao e distribuio da informao publicamente segura, que
possui importncia estratgica. Dentre suas principais metas, destacam:
detectar ameaas competitivas, eliminar ou minimizar surpresas, acrescentar
vantagem competitiva, minimizar o tempo de reao e encontrar novas
oportunidades
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 8 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Apresentamos abaixo uma figura que mostra o cenrio no qual encontra-se


a inteligncia competitiva.

Podemos ainda definir um processo com algumas fases para organizar as


tarefas dentro do fluxo de trabalho da inteligncia competitiva. Esse conjunto de
atividades encontra-se na figura a seguir.

51583806784

4. Business Intelligence
J conhecemos o conceito de BI. Agora vamos continuar nosso estudo.
Primeiramente vamos fazer um paralelo entre sistemas operacionais e sistemas
analticos. Os sistemas operacionais tratam das tarefas que fazem parte do dia-
a-dia das organizaes. Quando pensamos neste tipo de sistema o exemplo

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 9 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

clssico um caixa de supermercado. Ele basicamente registra a quantidade de


cada produto, calcula o preo, informa para o cliente e recebe o pagamento. So
tarefas que fazem parte de um fluxo de compras de cada cliente
individualmente.
Quando surge a necessidade de agregar os dados das compras dos
diferentes clientes visando prover informaes aos gestores entramos numa
seara atendida pelos sistemas analticos. E neste contexto que surge o
armazm de dados ou Data Warehouse (DW). Sua funo armazenar os dados
de forma padronizada, capturando informaes dos diversos sistemas
operacionais da empresa.
O Kimball, um dos principais autores de DW sugere alguns objetivos
fundamentais para o DW dentro do contexto de BI. Ele diz que devemos fazer a
informao acessvel mais facilmente, apresentar a informao consistente
(credibilidade), prover um sistema que seja adaptado a mudanas e apresentar
a informao de forma temporal. Alm disso, o DW pode ser considerado um
bastio da segurana que protege os ativos de informao, servindo como
base de autoridade e de confiana para uma melhor tomada de deciso.
Para uma implementao de sucesso um projeto de DW/BI deve ser bem
aceito pela comunidade organizacional. sugerido ento um passo-a-passo para
atender as demandas e estruturar de forma organizada as necessidades do
negcio dentro do sistema.
Primeiramente precisamos compreender os usurios de negcios. Nesta
etapa importante entender as responsabilidades de trabalho, metas e
objetivos. Devemos ento determinar as decises que os usurios de negcios
querem fazer com a ajuda do sistema de DW/BI. Assim podemos identificar os
"melhores" usurios que tomam decises eficazes e de alto impacto, bem como,
encontrar potenciais novos usurios e torn-los conscientes das capacidades do
sistema de DW/BI.
Na etapa subsequente, importante fornecer informaes e anlises de
alta qualidade, relevante e acessvel para os usurios de negcios. Para atingir
esse objetivo escolha as fontes de dados mais robustas para apresentar no
51583806784

sistema de DW/BI, elas devem ser cuidadosamente selecionadas a partir do


universo de possveis fontes de dados em sua organizao.
Neste momento faa interfaces de usurios e aplicaes simples e baseadas
em modelos, explicitamente correspondentes aos perfis de processamento
cognitivo dos usurios. Certifique-se que os dados so precisos e podem ser
confiveis, rotulando-os de forma consistente em toda a empresa. preciso
monitorar continuamente a preciso dos dados e o resultado das anlises.
Adaptar-se s mudanas de perfis de usurio, requisitos e prioridades de
negcios, juntamente com a disponibilidade de novas fontes de dados.
Depois de desenvolver uma estrutura consistente, a prxima etapa do
processo sustentar o ambiente DW/BI. necessrio que se tome uma parte do

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 10 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Anlise de negcios incluem relatrios estticos e dinmicos, todos os tipos


de consultas, a descoberta de informaes, viso multidimensional, drill down,
entre outros. Esses relatrios tambm esto relacionados com BPM.

A minerao de dados, seja estruturado ou no, e outras ferramentas


matemticas e estatsticas sofisticadas fazem parte do segundo grupo de
tcnicas relacionadas a analise de negcios. A minerao de dados um
processo de busca de relaes desconhecidas ou informaes em grandes bases
de dados ou armazns de dados, utilizando ferramentas inteligentes como a
computao neural, tcnicas de anlise preditiva, ou mtodos estatsticos
avanados.

Tambm conhecido como corporate performance management (CPM), o


business performance management (BPM) nos apresenta uma carteira
emergente de aplicativos e metodologias que contm a evoluo da arquitetura
e ferramentas de BI em seu ncleo. BPM amplia o monitoramento, medio e
comparao das vendas, lucro, custos, rentabilidade e outros indicadores de
desempenho, introduzindo o conceito de gesto e feedback. Considera
processos, tais como planejamento e previso, como fundamentais em uma
estratgia de negcios.

Em contraste com os tradicionais DSS, EIS, e BI, que suportam a extrao


bottom-up de informao a partir dos dados, BPM proporciona uma aplicao
top-down da estratgia corporativa. Normalmente sua implementao
combinada com a metodologia Balanced Scorecard (BSC) e dashboards.

O ltimo componente de um sistema de BI a interface com os usurios.


Os dashboards (ou painis) fornecem uma viso abrangente e visual das
medidas de desempenho corporativo (tambm conhecido como indicadores
chave de desempenho - KPI), tendncias e excees. As interfaces integram
informaes de vrias reas de negcio. Apresentam grficos que mostram o
desempenho real em comparao com as mtricas desejadas, assim, um painel
apresenta uma viso geral da sade da organizao.
51583806784

Alm dos painis, outras ferramentas que transmitem informaes so


portais corporativos, cockpits digitais e outras ferramentas de visualizao.
Muitas ferramentas de visualizao, que vo desde apresentao do cubo
multidimensional a realidade virtual, so parte integrante dos sistemas de BI. BI
surgiu de EIS, portanto recursos visuais para os executivos foram transformados
em software de BI. Tecnologias como sistemas de informaes geogrficas (SIG)
desempenham um papel crescente no apoio deciso.

5. Data Warehouse
5.1. Conceitos e caractersticas
Vamos apresentar a definio de DW de trs diferentes autores:
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 12 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Ser integrado refere-se consistncia de nomes, das unidades, das


variveis, etc. importante que os dados armazenados sejam transformados
at um estado uniforme. Por exemplo, considere sexo como um elemento de
dado. Uma aplicao pode codificar sexo como M/F, outra como 1/0 e uma
terceira como H/M. Conforme os dados so inseridos ou repassados para o Data
Warehouse, eles so convertidos para um mesmo padro. O atributo Sexo,
portanto, seria codificado apenas de uma forma.

Da mesma maneira, se um elemento de dado medido em centmetros


em uma aplicao, em polegadas em outra, ele ser convertido para uma
representao nica ao ser colocado no Data Warehouse. Vejam na figura abaixo
a ideia por traz do conceito de integrao.

51583806784

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 14 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

O fato de ser no voltil significa que o Data Warehouse permite apenas


a carga inicial dos dados e consultas a estes dados. Aps serem integrados e
transformados, os dados so carregados em bloco para o Data Warehouse, para
que estejam disponveis aos usurios para acesso.

No ambiente operacional, ao contrrio, os dados so, em geral,


atualizados registro a registro, em mltiplas transaes. Esta volatilidade requer
um trabalho considervel para assegurar integridade e consistncia atravs de
atividades de rollback, recuperao de falhas, commits e bloqueios. Vejam
abaixo uma figura que representa os diferentes ambientes e suas respectivas
operaes sobre os dados.

Ser variante no tempo trata do fato de um registro em um Data


Warehouse referir-se a algum momento especfico, significando que ele no
atualizvel. Enquanto que o dado de produo atualizado de acordo com
mudanas de estado do objeto em questo, refletindo, em geral, o estado do
objeto no momento do acesso, em um DW, a cada ocorrncia de uma mudana,
uma nova entrada criada para marcar esta mudana.

O tratamento de sries temporais apresenta caractersticas especficas,


que adicionam complexidade ao ambiente do Data Warehouse. Deve-se
considerar que no apenas que os dados tenham uma caracterstica temporal,
mas tambm os metadados, que incluem definies dos itens de dados, rotinas
51583806784

de validao, algoritmos de derivao, etc. Sem a manuteno do histrico dos


metadados, as mudanas das regras de negcio que afetam os dados no Data
Warehouse so perdidas, invalidando dados histricos.

Vejam na figura abaixo uma comparao entre os ambientes operacional


e analtico no que se refere a variao dos dados ao longo do tempo.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 15 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Antes de continuarmos falando das caractersticas vamos resolver uma


questo de provas anteriores:

1. Ano: 2013 Banca: CETRO rgo: ANVISA Cargo: Analista


Administrativo - rea 5
Em relao aos DWs (Data warehouses), assinale a alternativa correta.
A) So orientados a objetos.
B) No variam com o tempo.
C) So volteis.
D) Evitam o uso de gerenciadores de bancos de dados tradicionais, reduzindo
custos, mas podem causar impactos significativos nos sistemas operacionais.
E) Seus dados no podem ser alterados, mas podem ser excludos.
Comentrio: Vejam que acabamos de tratar as caractersticas de DW. No geral,
eles so orientados por assunto, no volteis, variantes no tempo e integrados.
Com essas caractersticas conseguimos eliminar as alternativas A, B e C.
No existe risco aos sistemas operacionais com o uso de DWs. Alm do mais,
alguns sistemas gerenciadores de banco de dados tradicionais permitem
armazenamento dos dados em estruturas relacionais (ROLAP), veremos a
51583806784

classificao dos sistemas OLAP na prxima aula.


O aspecto referenciado pela alternativa E, embora parea um pouco exagerado
o fato demonstrado pela no volatilidade na explicao vista anteriormente. O
fato dos dados no serem modificaes ajudam na estruturao fsica do modelo
e no desempenho na recuperao dos dados.
Gabarito: E

A prxima caracterstica que temos nos DW o tratamento da


granularidade dos dados. A granularidade de dados refere-se ao nvel de
sumarizao dos elementos e de detalhe disponveis nos dados, considerado o
mais importante aspecto do projeto de um Data Warehouse. Em um nvel de
granularidade muito alto, o espao em disco e o nmero de ndices necessrios

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 16 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

assunto ou departamento especfico. Um DM um subconjunto de um armazm


de dados, geralmente constitudos por uma nica rea temtica (por exemplo,
marketing, operaes).

O DM pode ser dependente ou independente. Ser dependente ser um


subconjunto que criado diretamente a partir do armazm de dados. Tem as
vantagens de usar um modelo de dados consistente e o fornecimento de dados
de qualidade. DM dependentes apoiam o conceito de um nico modelo de dados
em toda a empresa, mas o data warehouse deve ser construdo primeiro. O DM
dependente garante que o usurio final est vendo a mesma verso dos dados
que acessada por todos os outros usurios de data warehouse. O alto custo de
dados armazns limita seu uso para grandes empresas. Como uma alternativa,
muitas empresas usam uma verso em escala reduzida de um armazm de
dados referida como uma DM independente.

Um Data Mart independente um pequeno armazm concebido para


uma unidade estratgica de negcios ou um departamento, mas sua origem no
um EDW. Percebam que o DM tem como sua principal caracterstica o escopo
reduzido do projeto.

Outra definio importante para Data Mart vem do Date. Ele diz que um
Data Mart deve ser especializado e voltil. Por especializado queremos dizer que
ele possui uma estrutura baseada em um ambiente, tema, situao, rea, setor
ou aplicao especfica. Enquanto o EDW se baseia em vrias fontes de diversas
aplicaes, fontes e situaes para facilitar um suporte a deciso gerencial.

Quando falamos de voltil, segundo o Date, ele quer transmitir que os


dados so alterados frequentemente. Enquanto os dados do DW, por guardarem
histrico, s so alterados quando uma carga foi feita de forma errada, o DM por
ser baseado em aplicaes mais frequentemente modificado.

O armazenamento de dados operacionais (ODS) fornece uma forma


relativamente recente dos arquivos de informaes dos clientes. Este tipo de
banco de dados muitas vezes usado como uma rea de estgio provisrio para
51583806784

um data warehouse. Ao contrrio dos contedos estticos de um armazm de


dados, o contedo de um ODS atualizado durante todo o curso das operaes
de negcios.

Um ODS usado para decises de curto prazo envolvendo aplicaes de


misso crtica, para o mdio e longo prazo as decises devem estar associadas
com o EDW. O ODS semelhante memria de curto prazo, na medida em que
armazena apenas as informaes mais recentes. Em comparao, um armazm
de dados como uma memria de longo prazo, porque ele armazena
informaes permanentes.

O EDW por sua vez um DW de larga escala usado pela organizao


como um todo. Congrega informaes de diversas fontes de dados. Vejam na
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 18 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

processamento de transaes online (OLTP) ou sistema de ERP. Dados da Web


na forma de logs tambm podem alimentar um data warehouse.

Extrao e transformao de dados. (Data extraction and transformation)


- Os dados so extrados e devidamente transformados usando software
personalizado ou comercial chamado de ferramenta de ETL.

Carregamento dos dados. (Data loading) - Os dados so carregados para


uma rea de preparao (staging area), onde eles so transformados e limpos.
Os dados esto, ento, prontos para serem carregado no data warehouse e/ou
data marts.

Banco de dados abrangente. - Essencialmente, este o EDW para apoiar


todas as anlises de suporte deciso, fornecendo uma viso resumida
relevante e informaes detalhadas proveniente de fontes diferentes.

Metadados. - Os metadados so mantidos de forma a que possam ser


avaliados por diferentes pessoas e usurios de TI. Metadados incluem programas
sobre os dados e as regras para a organizao de resumos de dados que so
fceis de indexar e pesquisar, especialmente com as ferramentas da Web.

Ferramentas de middleware. - Ferramentas de middleware habilitam o


acesso ao DW. Usurios avanados, como os analistas de BI, podem escrever
suas prprias consultas SQL. Outros podem empregar um ambiente gerenciador
de consulta, como Business Objects, para acessar os dados. Existem muitas
aplicaes front-end que os usurios podem usar para interagir com os dados
armazenados nos repositrios de dados, incluindo a minerao de dados, OLAP,
ferramentas de relatrios e ferramentas de visualizao de dados.

5.4. Arquitetura de DW
H algumas arquiteturas bsicas de DW. As arquiteturas de 2 e 3
camadas so mais comuns. Hoffer as distingue dividindo o DW em trs partes:
1. O prprio DW, que contm os dados e o software associados, 2. Software
51583806784

de aquisio de dados (back-end), que extrai dados de sistemas legados e


fontes externas, os consolida e resume, e depois os carrega e 3. Software
cliente (front-end), que permite aos usurios acessar e analisar dados a partir
do DW.

H quatro componentes separados e distintos a serem considerados no


ambiente de DW/BI: Sistemas operacionais de origem, Sistema de ETL, rea de
apresentao de dados e Aplicaes de business intelligence.

Quando juntamos os componentes dentro das trs camadas da


arquitetura temos:

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 20 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

1. Sistemas operacionais de origem + Sistema de ETL = Primeira


camada: sistema operacional com os dados e o software para
aquisio.

2. rea de apresentao de dados - Segunda camada: data warehouse.

3. Aplicaes de BI - Terceira camada: servidor de aplicao e cliente.

A figura a seguir mostra os diferentes tipos de arquitetura para sistemas


de DW. Em seguida apresentaremos as definies relacionadas cada uma
delas.

51583806784

Data Marts (DM) independentes. Esta sem dvida a arquitetura mais


simples e menos onerosa. Os DM so desenvolvidos para operar de forma
independente visando atender s necessidades das unidades organizacionais
individuais. Por causa da independncia, eles podem ter definies de dados
inconsistentes, diferentes dimenses e medidas, o que torna difcil analisar os
dados atravs dos Data Marts.

Arquitetura de barramento de Data Mart (KIMBALL). Esta


arquitetura uma alternativa vivel para os data marts independentes. Nela os
Data Marts individuais so ligadas entre si atravs de algum tipo de middleware.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 21 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Como os dados so ligados entre os DM individuais, h uma melhor chance de


manter a consistncia entre os dados de toda a empresa (pelo menos no nvel
de metadados). Mesmo que se permita que consultas complexas utilizem dados
de diversos DMs, o desempenho destes tipos de anlise pode no ser
satisfatrio.

Hub-and-spoke (Inmon). Esta talvez a mais famosa de arquitetura de


DW. Aqui, a ateno est focada na construo de uma infraestrutura escalvel
e sustentvel (muitas vezes desenvolvidas de forma iterativa, assunto por
assunto) que inclui um data warehouse centralizado e vrios data marts
dependentes (um para cada unidade organizacional). Esta arquitetura permite
uma customizao fcil de interfaces de usurio e relatrios. No lado negativo,
esta arquitetura no tem a holstica, e pode levar a redundncia e a latncia de
dados. A latncia dos dados refere-se ao tempo mximo permitido para
disponibilizao dos dados atravs do sistema de BI.

Data warehouse centralizado. A arquitetura centralizada de data


warehouse similar arquitetura hub-and-spoke, exceto que no h Data Marts
dependentes, em vez disso, h um data warehouse da empresa inteira que
serve para a necessidade de todas as unidades organizacionais. Esta abordagem
centralizada fornece aos usurios acesso a todos os dados no warehouse em vez
de limitar-lhes a DM de dados. Adicionalmente, reduz-se a quantidade de dados
que a equipa tcnica tem de transferir, portanto, simplifica-se o gerenciamento e
administrao de dados. Se projetado e implementado corretamente, essa
arquitetura oferece uma viso oportuna e holstica da empresa quem, quando e
onde quer que esteja dentro da organizao. A arquitetura de armazns de
dados central, que defendida principalmente pela Teradata Corporation,
aconselha usar armazns de dados sem data marts.

Armazm de dados federado. A abordagem federada uma concesso


as foras naturais que minam os melhores planos para o desenvolvimento de um
sistema perfeito. Ela usa todos os meios possveis para integrar recursos
analticos de vrias fontes para atender evoluo das necessidades e condies
51583806784

do negcio. Essencialmente, a abordagem envolve a integrao de sistemas


distintos. Em uma arquitetura federada de apoio deciso, estruturas existentes
so deixadas no lugar, e os dados so cedidos a partir dessas fontes, conforme
necessrio. A abordagem federada suportada por fornecedores de middleware
distribudos que propem consultar e juntar capacidades. Estas ferramentas
baseadas em eXtensible Markup Language (XML) oferecem aos usurios uma
viso global das fontes de dados distribudas, incluindo armazns de DM, sites,
documentos e sistemas operacionais.

Quando os usurios escolherem objetos de consulta a partir deste ponto


de vista e pressionarem o boto de enviar, a ferramenta de consulta
automaticamente junta os resultados das fontes distribudas, e apresenta-os ao
usurio. Devido a questes de desempenho e qualidade de dados, a maioria dos

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 22 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

6. Modelagem multidimensional
Um modelo dimensional contm as mesmas informaes que um modelo
normalizado. Os pacotes de dados oferecem um formato com as seguintes
preocupaes: facilidade de compreenso ao usurio, desempenho da consulta e
resilincia s mudanas.
Imagine um executivo que descreve o seu negcio como, "Ns vendemos
produtos em vrios mercados e medimos o nosso desempenho ao longo do
tempo." Projetistas multidimensionais devem ouvir atentamente a nfase no
produto, mercado e tempo.
A modelagem multidimensional, ou dimensional como s vezes
chamada, a tcnica de modelagem de banco de dados para o auxlio s
consultas em um Data Warehouse nas mais diferentes perspectivas. A viso
multidimensional permite o uso mais intuitivo para o processamento analtico
pelas ferramentas OLAP (On-line Analytical Processing).
Toda modelagem dimensional possui dois elementos imprescindveis: as
tabelas Fatos e as tabelas Dimenses. Ambas so obrigatrias e possuem
caracterstica complementares dentro de um Data Warehouse. As Dimenses so
os descritores dos dados oriundos das tabelas Fato. Possui o carter qualitativo
51583806784

da informao e relacionamento de um para muitos com a tabela Fato. a


Dimenso que permite a visualizao das informaes por diversos aspectos e
perspectivas.
As tabelas Fato servem para o armazenamento, medidas (quase sempre)
numricas associadas a eventos de negcio. Uma tabela fato armazena as
medies de desempenho decorrentes de eventos dos processos de negcios de
uma organizao. Basicamente representa uma medida de negcios. Uma tabela
fato contm vrios fatos, correspondentes a cada uma das suas linhas. Cada
linha corresponde a um evento de medio. Os dados em cada linha esto a um
nvel especfico de detalhe, referido como o gro, por exemplo, uma linha por
produto vendido numa operao de venda.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 24 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Uma nica linha da tabela fato tem uma relao um-para-um com o
evento de medio, como descrito pela granularidade da tabela fato. Uma tabela
fato corresponde a um evento fsico observvel, e no s exigncias de um
relatrio especfico. Dentro de uma tabela fatos, apenas fatos consistentes com
a granularidade definida so permitidos. Por exemplo, em uma transao de
vendas no varejo, a quantidade de um produto vendido e seu preo so bons
fatos. Veja a figura abaixo que representa uma tabela fato de vendas:

A ideia de que um evento de medio no mundo fsico tenha uma relao


de um-para-um com uma nica linha na tabela fato um princpio fundamental
para a modelagem dimensional. Tudo o resto constri a partir desta fundao.
Voc vai ver que os fatos so, por vezes aditivos, semi-aditivos ou mesmo no-
aditivos.
Fatos semi-aditivos, tais como saldos de conta, no podem ser resumidos
por meio da dimenso de tempo. Fatos no-aditivos, tais como preos unitrios,
nunca podem ser adicionados. teoricamente possvel que um fato medido seja
textual, no entanto, essa condio raramente aparece.
Na maioria dos casos, uma medio textual uma descrio de algo, e
traada a partir de uma lista de valores discretos. O designer deve fazer todos
os esforos para colocar os dados textuais em dimenses onde podem ser
correlacionadas de forma mais eficaz com os outros atributos de dimenso e
consumirem menos espao em disco.
Voc no deve armazenar informaes textuais redundantes em tabelas
de fatos. A menos que o texto seja exclusivo para cada linha na tabela de fato,
51583806784

ele deve pertencer a tabela de dimenso. Um fato texto verdadeiro raro,


porque o contedo do fato imprevisvel, como um texto de comentrio de forma
livre, faz com que seja quase impossvel de se analisar.
Todas as tabelas fato tm duas ou mais chaves estrangeiras que ligam
para as chaves primrias das tabelas de dimenso. Por exemplo, a chave do
produto na tabela coincide com o fato de sempre uma chave de produto
especfico na tabela de dimenso de produto. Quando todas as chaves na tabela
fato corretamente coincidirem com suas respectivas chaves primrias das
tabelas dimenso correspondentes, as tabelas satisfazem a integridade
referencial. Voc pode acessar a tabela de fatos atravs das tabelas de
dimenses por meio de join.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 25 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

As tabelas dimenses apresentam o contexto descritivo. So


companheiros integrais para uma tabela de fatos e contm o contexto textual
associado a um evento de medio dos processos de negcios. Elas descrevem o
"quem, o que, onde, quando, como e porqu" associado ao evento.
As dimenses contm os atributos descritivos usados pelas aplicaes de
BI para filtrar e agrupar os fatos. Com a granularidade de uma tabela de fato
definida, todas as possveis dimenses podem ser identificadas. Sempre que
possvel, a dimenso deve ter um valor nico associado a uma determinada
linha da tabela fato. Tabelas dimenso so chamadas a "alma" do DW, pois elas
contm os pontos de entrada e rtulos descritivos que permitem ao sistema de
DW/BI ser aproveitado para a anlise de negcios.
Um esforo necessrio para o desenvolvimento e o gerenciamento das
tabelas de dimenso, pois elas so os condutores da experincia de BI do
usurio. Dimenses fornecem os pontos de entrada para os dados, e as
etiquetas finais e os agrupamentos em todas as anlises de DW/BI. Vejam um
exemplo de uma tabela dimenso abaixo.

Ok! Antes de continuarmos nosso estudo e juntarmos as tabelas


dimenses e fatos vamos refletir sobre a seguinte pergunta: Uma quantidade
numrica um fato ou um atributo de dimenso? Geralmente a resposta a esse
questionamento segue a seguinte lgica: observaes numricas continuamente
valorizadas so quase sempre medidas da tabela fato; e observaes numricas
discretas e extradas de uma lista pequena, quase sempre so atributos de
51583806784

dimenso.

6.1. Star Schema


Cada processo de negcio representado por um modelo dimensional que
consiste em uma tabela fato contendo medies numricas do evento e, cercada
por um conjunto de tabelas dimenso que contm o contexto no momento em
que ocorreu o evento. Esta caracterstica de estrutura estrela (star schema)
muitas vezes chamada de juno estrela (star-join), um termo que remonta aos
primrdios de bancos de dados relacionais. Vejamos um exemplo de um modelo:

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 26 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

A primeira coisa a notar sobre o esquema dimensional a sua


simplicidade e simetria. Obviamente, os usurios de negcios se beneficiam da
simplicidade, pois os dados so mais fceis de compreender e navegar. O
charme do desenho na figura acima que altamente reconhecvel para
usurios corporativos. Segundo Kimball: Temos observado, literalmente,
centenas de casos em que os usurios imediatamente concordam que o modelo
dimensional o seu negcio.
Alm disso, a reduo do nmero de tabelas e de a utilizao de
descries gerenciais torna-o mais fcil de navegar e menos suscetvel a erros. A
simplicidade de um modelo multidimensional tambm tem benefcios de
desempenho. Otimizadores de banco de dados processam esses esquemas de
forma mais simples, com menos joins e, portanto, de forma mais eficiente.
Um motor de banco de dados pode fazer suposies fortes sobre a
primeira restrio das tabelas de dimenso que so fortemente indexadas e, em
seguida, atacar a tabela de fatos de uma s vez com o produto cartesiano das
chaves das tabelas dimenses que satisfazem as restries do usurio.
Surpreendentemente, usando essa abordagem, o otimizador pode avaliar
arbitrariamente uma juno para uma tabela fato em uma nica passagem
atravs do ndice da tabela fato.
Finalmente, os modelos dimensionais so graciosamente extensveis para
acomodar a mudana. O framework previsvel de um modelo dimensional resiste
a mudanas inesperadas no comportamento do usurio. Vejam um exemplo de
um relatrio simples, gerado por meio de uma consulta SQL a um modelo.
51583806784

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 27 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

6.2. Processo de design dimensional


O processo de desenvolvimento ou projeto de sistemas multidimensionais
segue basicamente quatro etapas: selecionar o processo de negcio, definir a
granularidade, identificar as dimenses e identificar os fatos. Esse processo
alimentado por informaes a respeito dos requisitos de negcio e da realidade
dos dados. Vamos ento passar pelas etapas e entender o que deve ser
realizado em cada uma delas.
Passo 01: Selecionando o processo de negcio
O primeiro passo decidir o processo de negcio para o modelo,
combinando a compreenso dos requisitos de negcio com a anlise dos dados
de origem disponveis. O primeiro projeto de BI/DW deve se concentrar no
processo de negcio que o mais crtico para os usurios de negcios
A viabilidade do projeto abrange uma srie de consideraes, incluindo a
disponibilidade e qualidade dos dados, e ainda a capacidade organizacional.
51583806784

Suponha que os gestores querem entender melhor as compras dos clientes e o


processo de negcio que voc est modelando baseado nas transaes de
vendas de varejo. Esta informao permite que os usurios de negcios
analisem, por exemplo, quais produtos esto vendendo em que as lojas em que
dias em quais condies promocionais.
Passo 02: Declare a granularidade
Declarar a granularidade um passo fundamental em um projeto
dimensional. Estabelece exatamente o que uma nica linha da tabela fato
representa. Torna-se um contrato vinculativo sobre o design. Deve ser declarada
antes de escolher dimenses ou fatos, porque cada dimenso candidata ou fato
relevante deve ser consistente com a granularidade.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 28 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

multiplicado pelo preo unitrio. Da mesma forma, o valor do desconto a


quantidade de vendas multiplicada pelo valor do desconto unitrio.

6.3. Revisitando o modelo


Vamos agora revisitar as estruturas das tabelas fato e dimenses para
entender alguns conceitos relacionados com cada uma delas. Primeiramente
comearemos pelas tabelas fatos.
Uma tabela fato contm as medidas numricas produzidas por um evento
de medio operacional no mundo real. No nvel mais baixo de granularidade,
uma linha da tabela fato corresponde a um evento de medio (fato) e vice-
versa.
Alm das medidas numricas, uma tabela fato sempre contm chaves
estrangeiras para cada uma das suas dimenses associadas, bem como as
chaves de dimenso degenerados opcionais. As tabelas fatos so o principal alvo
de computaes e agregaes dinmicas decorrentes das consultas.
As medidas numricas em uma tabela de fatos podem ser dividas em trs
categorias. Os fatos mais flexveis e teis so totalmente aditivos. Medidas
aditivas podem ser agrupadas com qualquer das dimenses associadas tabela
de fatos. Medidas semi-aditivas podem ser agrupadas em algumas dimenses,
mas no todas. Valores de saldo so fatos comuns semi-aditivos, porque eles
so aditivos em todas as dimenses, exceto tempo. Finalmente, algumas
medidas so completamente no-aditivas, como ndices.
Medidas com valores nulos se comportam normalmente em tabelas
de fatos. As funes de agregao (SUM, COUNT, MIN, MAX e AVG) todas
fazem a "coisa certa" com fatos nulos. No entanto, os valores nulos devem
ser evitados em chaves estrangeiras da tabela de fatos, porque esses
valores nulos iriam provocar automaticamente uma violao de integridade
referencial. Ao invs de uma chave estrangeira nula, a tabela de dimenso
associado deve ter uma linha padro (com uma surrogate key) que
representa a condio desconhecida ou no aplicvel.
51583806784

Se a mesma medida aparece em tabelas fatos separados, os


cuidados devem ser tomados para garantir que as definies tcnicas dos fatos
so idnticas, se elas podem ser comparadas ou calculadas juntas. Se as
definies de fato separadas so consistentes, os fatos devem ser conformados
com nomes idnticos, mas se eles so incompatveis, devem ser nomeados de
forma diferente para alertar os usurios de negcios e aplicaes de BI.
Vamos agora falar dos tipos de tabelas fatos: tabela fato de transaes
(Transaction Fact Tables), tabela de snapshot peridicos e tabela de snapshot
acumulativos.
A linha em uma tabela de fatos de transaes corresponde a um evento
de medio em um ponto no espao e no tempo. As tabelas fato de

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 30 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Embora a maioria dos eventos de medio capturem resultados


numricos, possvel que o evento apenas registre um conjunto de entidades
dimensionais que se juntam em um momento no tempo, so as conhecidas
tabelas fatos sem fatos. Por exemplo, um aluno assiste a uma aula em um
determinado dia pode no ter um fato numrico associado, mas uma linha fato
com chaves estrangeiras para o dia de calendrio, estudante, professor,
localizao e classe pode ser definida. Da mesma forma, a comunicao com o
cliente so eventos, mas pode no haver mtricas associadas.
Tabelas fato sem fato tambm podem ser usadas para analisar o que
no aconteceu. Essas consultas tm sempre duas partes: uma tabela fato de
cobertura que contm todas as possibilidades de eventos que podem acontecer e
uma tabela fato de atividade que contm os eventos que aconteceram. Quando
a atividade subtrada da cobertura, o resultado o conjunto de
acontecimentos que no aconteceram.
Muitas vezes conveniente combinar fatos de vrios processos em uma
nica tabela fato consolidada caso possam ser expressos na mesma
granularidade. Por exemplo, os valores reais de vendas podem ser consolidados
com as previses de vendas em uma nica tabela fato para tornar a tarefa de
analisar os valores reais contra previses simples e rpida, em comparao com
a montagem de um drill-across usando tabelas de fatos separadas. Tabelas de
fatos consolidados adicionam um peso ao processamento de ETL, mas aliviam a
carga analtica sobre as aplicaes de BI. Elas devem ser consideradas para
mtricas entre processos que so frequentemente analisados em conjunto.
A seguir apresentamos uma figura que mostra a composio bsica de
uma tabela fato:

51583806784

2. CESGRANRIO - 2008 - PETROBRS - ANALISTA DE SISTEMAS JNIOR


- PROCESSOS DE NEGCIOS
A empresa passou a sortear cupons de desconto para alguns clientes, os quais
do direito a um desconto nas compras em uma determinada data. A informao
sobre que clientes possuem cupons para que datas mantida de forma

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 32 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

independente e consolidada no processo de extrao, transformao e carga,


resultando em um campo, na tabela fato, indicando se a venda foi realizada com
o desconto ou no. A soluo parecia atender bem s demandas dos usurios do
data warehouse, at que um deles tentou realizar uma consulta para saber quais
clientes no haviam realizado compras, mesmo tendo um cupom de desconto
para a data. Este tipo de demanda tipicamente ser resolvido introduzindo, no
data warehouse, uma
(a) tabela de fatos complementares (complimentary fact table).
(b) tabela de fatos sem dimenso (dimensionless fact table).
(c) tabela de fatos sem fatos (factless fact table).
(d) dimenso multivalorada (multivalued dimension).
(e) dimenso degenerada (degenerated dimension).
Comentrios: Vamos analisar cada uma das alternativas:
Tabela de fatos - Num esquema estrela, a tabela central com medidas numricas
de desempenho caracterizadas por uma chave composta, cada um dos
elementos uma chave estrangeira trazida de uma tabela de dimenso.
Tabela de fatos sem fatos (factless fact table) - Uma tabela de fatos que no
tem fatos, mas captura alguns relacionamentos muitos-para-muitos entre as
chaves de dimenses. Mais frequentemente usada para representar eventos ou
prover informao de cobertura que no aparece em outras tabelas de fatos.
Dimenso degenerada (degenerated dimension) - Uma chave de dimenso,
como o nmero de uma transao, nmero de fatura, de ticket, ou de bill-of-
lading, que no tenha nenhum atributo associado, portanto no se constitui com
uma tabela de dimenso.
Dimenso multivalorada (multivalued dimension) - Normalmente, uma tabela de
fatos possui conexes somente para dimenses representando um valor simples,
como uma data ou produto. Mas ocasionalmente, vlido conectar um registro
de fato a uma dimenso representando um nmero aberto de valores, como o
nmero de diagnsticos simultneos que um paciente pode ter num momento de
um mesmo tratamento. Neste caso, dizemos que a tabela de fatos tem uma
dimenso multivalorada. Tipicamente manipulada por uma tabela ponte.
Baseado no exposto, podemos concluir que a resposta se encontra na alternativa
C.
51583806784

Gabarito: C
Vamos agora apresentar algumas caractersticas e taxonomia para as
tabelas de dimenses.
Cada tabela de dimenso tem uma nica coluna de chave primria. Esta
chave primria incorporada como uma chave estrangeira em qualquer tabela
de fatos onde a descrio textual presente na linha da dimenso exatamente a
correta para a linha da tabela de fatos. Tabelas de dimenso so geralmente
grandes, desnormalizadas, com muitos atributos de texto de baixa
cardinalidade.
Embora os cdigos operacionais e os indicadores possam ser tratados
como atributos, os atributos de dimenso mais poderosos so preenchidos com
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 33 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

descries verbais. Os atributos da tabela de dimenso so o principal alvo de


especificaes de restries e agrupamento de consultas em aplicaes de BI. Os
rtulos descritivos sobre os relatrios so tipicamente valores de domnio do
atributo da dimenso.
A tabela de dimenso projetada com uma coluna que funciona como
uma chave primria nica. Esta chave primria no pode ser a chave natural do
sistema operacional, pois haver vrias linhas de dimenso para a chave natural
quando as alteraes forem feitas ao longo do tempo. Alm disso, chaves
naturais para uma dimenso podem ser criadas por mais do que um sistema, e
estas chaves naturais podem ser incompatveis ou mal administradas.
O sistema de DW/BI precisa reivindicar o controle das chaves primrias de
todas as dimenses, ao invs de usar chaves naturais explcitas ou chaves
naturais com datas concatenadas, voc deve criar as chaves primrias inteiras
(numricas) annimas para cada dimenso. Essas chaves so conhecidas como
chaves artificiais.
Estas chaves substitutas para dimenso so nmeros inteiros simples,
atribudos em sequncia, comeando com o valor um, a cada vez que uma nova
chave necessria. A dimenso data isenta da regra fundamental da chave
substituta. Esta dimenso altamente previsvel e estvel pode usar uma chave
primria mais significativa.
Chaves naturais criadas pelos sistemas operacionais de origem esto
sujeitos s regras de negcios fora do controle do sistema de DW/BI. Por
exemplo, um nmero de funcionrio (chave natural) pode ser alterado se o
empregado se demite e depois recontratado. Quando o armazm de dados
quer ter uma chave nica para que o empregado, uma nova chave durvel
deve ser criada que seja persistente e no se altere nesta situao.
Esta chave muitas vezes referida como uma chave sobrenatural
durvel. As melhores chaves durveis tem um formato que independente do
processo de negcio original e, portanto, devem ser inteiros simples atribudos
em sequncia comeando de um. Enquanto vrias chaves de substituio
podem ser associadas com um funcionrio ao longo do tempo com as suas
51583806784

alteraes do perfil, a chave durvel nunca muda.


s vezes uma dimenso definida e no tem contedo, exceto a sua
chave primria. Por exemplo, quando uma nota fiscal tem vrios itens de linha,
cada linha da tabela fato herda dados de todas as dimenses descritivas por
meio das chaves estrangeiras da nota fiscal, e nota fica, portanto, sem contedo
exclusivo. Mas o nmero de fatura continua a ser uma chave de dimenso vlida
para as tabelas fatos no nvel de item de linha. Esta dimenso degenerada e
colocada na tabela fato, com o reconhecimento explcito que no h tabela de
dimenso associada. Dimenses degeneradas so mais comuns com tabelas fato
de snapshots e tabelas fato de acumulao.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 34 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Em geral, os designers de modelos dimensionais devem resistir


normalizao, causada por anos de projetos de banco de dados operacionais e,
denormalizar as hierarquias de profundidade fixa em atributos separados em
uma linha de dimenso achatada. A desnormalizao da dimenso apoia os
objetivos individuais de modelagem dimensional de simplicidade e velocidade.
Muitas dimenses contm mais de uma hierarquia natural. Por exemplo, a
dimenso data de calendrio pode ter dias teis por semana na hierarquia de
perodo fiscal, assim como uma hierarquia para dia, ms e ano. Dimenses de
localizao podem ter vrias hierarquias geogrficas. Em todos estes casos, as
hierarquias separadas podem graciosamente coexistir na mesma tabela
dimenso.
Abreviaturas, flags de verdadeiro/falso, e indicadores operacionais devem
ser complementados nas tabelas de dimenso com palavras de texto completo
que tm significado quando vistos de forma independente. Cdigos operacionais
com significado embutido no valor do cdigo devem ser divididos e cada parte
do cdigo deve possuir uma dimenso descritiva separada para seu prprio
atributo (significado). Imagine o cdigo 101.2012.1342.23-1 nele cada subparte
descrever uma caracterstica do produto.
Valores nulos nos atributos da dimenso so resultado de uma
determinada linha de dimenso que no foi totalmente preenchida, ou quando
existem atributos que no so aplicveis a todas as linhas da dimenso. Em
ambos os casos, recomenda-se a substituio por uma sequncia descritiva,
como desconhecido ou no se aplica no lugar do valor nulo. Nulos em
atributos de dimenso devem ser evitados porque lidar com bancos de dados
diferentes, agrupando e restringindo os nulos, , muitas vezes, inconsistente.
Dimenses calendrio ou data esto ligadas a praticamente todas
as tabelas de fatos para permitir a navegao da tabela de fatos atravs de
datas familiares, meses, perodos fiscais, e dias especiais no calendrio. Voc
nunca iria querer calcular o feriado de pscoa usando SQL, mas sim querer
procur-lo na dimenso data do calendrio. A dimenso data do calendrio
normalmente tem muitos atributos que descrevem as caractersticas tais como
51583806784

nmero da semana, o nome do ms, perodo fiscal, e um indicador de feriado


nacional. Para facilitar o particionamento, a chave primria de uma dimenso de
data pode ser mais significativa, como um inteiro representado por AAAAMMDD,
em vez de uma chave substituta sequencialmente atribuda.
Uma nica dimenso fsica pode ser referenciada vrias vezes em uma
tabela de fato, com cada referncia ligando para um papel logicamente distinto
para a dimenso. Por exemplo, uma tabela de dados pode ter vrias datas, cada
uma delas representada por uma chave estrangeira para a dimenso de data.
essencial que cada chave estrangeira se refira a uma viso separada da
dimenso data de modo que as referncias sejam independentes. Estas
dimenses separadas (com nomes exclusivos de colunas de atributo) so
chamadas de papis.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 35 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Processos de negcios transacionais normalmente produzem nmeros


variados, e uma baixa cardinalidade de bandeiras (flags) e indicadores. Ao invs
de fazer dimenses diferentes para cada bandeira (flag) e atributo, voc pode
criar uma nica dimenso junk e combin-las. Esta dimenso, muitas vezes
rotulada como uma dimenso de perfil de transao em um esquema, no
precisa ser o produto cartesiano de todos os valores possveis dos atributos, mas
deve conter apenas a combinao de valores que ocorrem realmente nos dados
de origem.
Quando uma relao hierrquica em uma tabela de dimenso
normalizada, os atributos de baixa cardinalidade aparecem como tabelas
secundrias ligadas tabela de dimenso base, por uma chave de atributo.
Quando este processo repetido com todas as hierarquias da tabela de
dimenso, uma estrutura caracterstica com vrios nveis criada. Chamamos
esse novo modelo de floco de neve.
Embora o floco de neve represente dados hierrquicos com preciso, voc
deve evitar os flocos de neve, porque difcil para os usurios de negcios
compreenderem e navegarem sobre os dados. Eles tambm podem afetar
negativamente o desempenho da consulta. A tabela de dimenso
desnormalizada contm exatamente a mesma informao como uma dimenso
Snowflaked.
A dimenso pode conter uma referncia para outra tabela dimenso. Por
exemplo, uma dimenso conta bancria pode fazer referncia a uma dimenso
separada representando a data em que a conta foi aberta. Estas referncias
dimenso secundria so chamadas dimenses outrigger. Dimenses
Outrigger so permitidas, mas devem ser usados com moderao. Na maioria
dos casos, as correlaes entre as dimenses devem ser rebaixadas para uma
tabela fato, quando as duas dimenses so representadas como chaves
estrangeiras separadas.

6.4. Esquemas multidimensionais


51583806784

Para finalizar o assunto vamos apresentar de forma grfica os esquemas


conhecidos como star schema, snowflake e multiestrela. Apresentaremos
tambm a dimenso conforme, que compartilhada entre diferentes tabelas
fatos. Vejam a figura abaixo.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 36 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

no aceito. A prxima etapa entender os requisitos de segurana e


privacidade.
Aps a definio dos requisitos de segurana importante entender a
forma de integrao dos dados (MDM) e a latncia dos dados, que descreve o
quo rpido os dados das fontes de dados de origem devem ser entregues aos
usurios de negcio por meio do sistema de BI/DW.
Voc deve listar todas as tabelas de fato e dimenso que sero
diretamente expostas as suas ferramentas de BI. Isto deve vir diretamente da
especificao do modelo dimensional. Listar todos os cubos OLAP e estruturas de
dados especiais exigidos por ferramentas de BI. Listar todos os ndices
conhecidos e agregaes que voc concordou em construir para apoiar o
desempenho do sistema de BI.
Voc deve inventariar o seu departamento: o sistema operacional,
ferramentas de ETL, linguagem de programao, SQL, SGBDs e habilidades
OLAP para voc entender como voc est exposto a uma falta ou perda dessas
habilidades. Enumerar as habilidades necessrias para apoiar seus sistemas
atuais e seus sistemas futuros provveis. Voc deve ainda listar os seus
sistemas legados avaliando se o seu uso exclusivo obrigatrio ou meramente
recomendado.

7.1. Componentes de ETL


As etapas do processo tm quatro componentes principais: extrao,
limpeza e conformidade, entrega e gesto. Cada uma dessas etapas dividida
em subsistemas conforme descrito abaixo.
Extrao. Coleta de dados brutos a partir dos sistemas de origem e,
geralmente, gravao em disco no ambiente de ETL antes de qualquer
reestruturao significativa dos dados. Subsistemas de 1 a 3 apoiam o processo
de extrao. (3)
Limpeza e conformidade. O envio de dados de origem atravs de
51583806784

uma srie de etapas de processamento no sistema de ETL para melhorar a


qualidade dos dados recebidos a partir da fonte, e a fuso de dados a partir de
duas ou mais fontes para criar e aplicar as dimenses e mtricas conformes.
Subsistemas de 4 a 8 descrevem a arquitetura necessria para suportar os
processos de limpeza e conformidade (5)
Entrega. Fisicamente corresponde a estruturao e o carregamento dos
dados em modelos multidimensionais de destino no servidor de apresentao.
Subsistemas de 9 a 21 fornecem a capacidade de entregar os dados ao servidor
de apresentao. (12)
Gesto. Gesto dos sistemas e processos relacionados do ambiente de
ETL, de uma forma coerente. Subsistemas de 22 a 34 descrevem os

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 38 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

componentes necessrios para apoiar o gerenciamento contnuo do sistema de


ETL. (13)
Extrao: Trazendo os dados para o DW
1. Sistema de extrao - Obviamente, a extrao de dados dos
sistemas de origem um componente fundamental da arquitetura de ETL. O
sistema de ETL deve esperar dados a partir de uma ampla variedade de
sistemas que envolvem deferentes tipos de dados e outros desafios inerentes.
Se voc extremamente sortudo, todos os dados de origem estaro em um
nico sistema que pode ser facilmente extrado usando uma ferramenta de ETL.
2. Data profiling (perfil de dados) - Tcnica de anlise dos dados para
descrever o seu contedo, consistncia e estrutura. Fornece a equipe de ETL
uma orientao de quanto a limpeza de dados muito importante para o
projeto. Apenas para citar um exemplo, toda vez que voc executar uma
consulta SELECT DISTINCT investigativa em um campo do banco de dados, voc
est traando o perfil de dados.
3. Sistema de captura das alteraes nos dados Trata da
capacidade de transferir apenas as alteraes relevantes da fonte de dados
desde a ltima atualizao. A tarefa de isolar os dados de origem mais recentes
chamada de captura de alterao de dados (CDC). A ideia por trs do CDC
bastante simples: basta transferir os dados que foram alterados desde a ltima
carga.
Existem vrias maneiras de capturar as alteraes de dados de origem,
cada uma delas eficaz para uma determinada situao. Alguns exemplos de
tcnicas so: colunas de auditoria (Audit Columns), extrao de tempo (Timed
Extracts), comparao diferencial total (Full Diff Compare), log do banco de
dados (Database Log Scraping), monitorar a fila de mensagens (Message Queue
Monitoring).
Limpeza e Conformidade de dados
1. Sistema de limpeza de dados - O processo de limpeza de dados do ETL
serve para corrigir dados sujos, mas ao mesmo tempo esperado que o
51583806784

armazm de dados fornecesse um quadro preciso dos dados medida que forem
capturados dos sistemas de produo da organizao. Encontrar o equilbrio
adequado entre estes objetivos conflitantes essencial.
2. Esquema de eventos de erro - O esquema de evento de erro um
esquema dimensional centralizado, cuja finalidade registrar todos os eventos
de erro lanada por uma tela em qualquer lugar do fluxo do mapa ETL. Embora
nosso foco seja no processamento ETL para o DW, esta abordagem pode ser
usada em integrao de dados genricos (DI) que so aplicaes onde os dados
esto sendo transferidos entre aplicaes legadas.
3. Dimenso de auditoria - A dimenso de auditoria contm o contexto
dos metadados no momento em que uma linha especfica da tabela de fatos
criada.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 39 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

4. Sistema de deduplicao - A sobrevivncia do sistema depende do


processo de combinar um conjunto de registros duplicados em uma imagem
unificada, que combina as colunas dos registros pareados em uma linha
conformada. A sobrevivncia envolve o estabelecimento de regras comerciais
claras que definem a sequncia de prioridade para os valores da coluna de todos
os sistemas de origem possveis para permitir a criao de uma nica linha com
os atributos mais relevantes e consistentes.
5. Sistema de conformidade O sistema de conformidade permite fazer
ajuste e verificaes dentro do processo de ETL. Observem a figura a seguir que
mostra um resumo do fluxo do processo de conformidade.

Entrega: Prepare-se para Apresentao


Conforme conversamos anteriormente, a entrega possui 13 subsistemas,
51583806784

vamos nos limitar a lista-los abaixo para no excedermos o contedo necessrio


para provas de concursos.
1. Gesto da alterao lenta da dimenso
2. Gerador de chave substituta
3. Gerencia de hierarquia
4. Gerencia de dimenses especiais
Date/Time Dimensions, Junk(lixo) Dimensions, Mini-Dimensions,
Shrunken Subset Dimensions, Small Static Dimensions
5. Construtores da tabela fato
6. Pipeline da chave substituta

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 40 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

13.Gerenciar repositrio de Metadados

7.2. Processo de ETL


O processo de ETL de forma resumida composto das seguintes etapas:
Primeiramente necessrio desenvolver um plano. Voc deve criar um plano de
alto nvel, escolher a ferramenta de ETL, desenvolver um conjunto de
estratgias padro e fazer o Drill Down by Target Table. Nesta ltima etapa
preciso detalhar as estratgias de transformao necessrias para popular cada
tabela do DW. A prxima fase envolve desenvolver o documento de
especificao do ETL
Agora podemos finalmente partir para a primeira carga dos dados que
deve popular as tabelas dimenso com os dados histricos e executar a carga
histrica da tabela fato. Neste momento j temos o nosso DW devidamente
povoado com dados.
Num momento posterior devemos partir para o processo incremental do
ETL, nesta etapa estamos preocupados com o processamento incremental das
tabelas dimenses e da tabela fato. Alm disso, podemos trabalhar a carga das
tabelas agregadas e dos cubos OLAP.
A ltima etapa do processo incremental a operao e automao do
sistema de ETL, visando um melhor desempenho e resilincia.
Com isso terminamos nossa primeira aula de BI, as prximas pginas
trazem um conjunto de questes comentadas referente ao assunto visto nesta
aula.

51583806784

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 42 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

4. ANO: 2015 BANCA: CESPE RGO: MEC PROVA: TCNICO DE NVEL


SUPERIOR - ANALISTA DE SISTEMAS
Com relao aos passos do processo de projeto de bancos de dados e de
modelagem de dados relacional e dimensional, julgue os itens subsequentes.
[1] Na modelagem dimensional, implementada em sistemas de data warehouse,
o esquema snowflake caracteriza-se por possuir diversas tabelas de fatos e de
dimenses, sendo estas ltimas organizadas hierarquicamente na terceira forma
normal (3FN).
Comentrios: O modelo snowflake caracteriza-se por possuir uma tabela fatos
e um conjunto de tabelas normalizadas para representao de cada dimenso.
Sendo assim a alternativas est errada por dizer que o modelo possui diversas
tabelas fato.
Gabarito: E

5. ANO: 2015 BANCA: CESPE RGO: MEC PROVA: TCNICO DE NVEL


SUPERIOR - ADMINISTRADOR DE DADOS
No que se refere a bancos de dados transacionais (OLTP) e a banco de dados
analticos (OLAP), julgue os itens que se seguem.
[1] Para melhor manter o controle sobre identificadores de registro de
ambientes de data warehouse (armazm de dados), em geral recomenda-se a
gerao de chaves substitutas (surrogate keys). Assim, cada juno entre as
tabelas de dimenso e tabelas fato em um ambiente de data warehouse deve se
basear nessas chaves substitutas, e no nas chaves naturais existentes.
Comentrios: Existem vrios motivos para a utilizao de chaves substitutas ou
artificiais dentro dos nossos modelos de DW. A primeira seria a que a mudana
de estado de um tupla nos modelos operacionais pode gerar uma nova entrada
na tabela de DW. Se tivermos usando a mesma chave primria do objeto no
modelo operacional ns no conseguiramos incluir essa nova linha.
justamente sobre isso que a questo fala. O que torna a alternativa correta.
Gabarito: C
51583806784

6. ANO: 2013 BANCA: ESAF RGO: DNIT PROVA: ANALISTA


ADMINISTRATIVO - TECNOLOGIA DA INFORMAO
O componente nal do processo de Business Intelligence
A Business balance management (BBM).
B Executive ofce team (EOT).
C Business performance management (BPM).
D Priority statement board (PSB).
E Business advisory management (BAM).
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 44 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Comentrios: Essa questo segue os conceitos descritos no livro do Turban que


divide o processo de BI em quatro partes: 1. O ambiente do DW, com as fontes
de dados, que define como os dados so armazenados; 2. O ambiente de anlise
de negcio que fornece um conjunto de ferramentas para minerar, manipular e
analisar os dados; 3. A interface com o usurio que diz como apresentar e
distribuir os dados consolidados; e 4. Performance e estratgia para monitorar e
contribuir com a gesto da organizao.

Aproveitando para falar um pouco mais sobre BPM, ele tambm chamado de
Corporate Performance Management (CPM). BPM um conceito que veio ratificar
a importncia de ter sempre o alinhamento das informaes com a estratgia da
empresa. BPM (Business Performance Management), um conjunto de software,
processos de negcios e medidas de sucesso dos negcios (mtricas e KPI's -
key performance indicators) que, quando combinados, premitem a uma
organizao entender, agir e influenciar a performance de seus negcios.
Gabarito: C

7. ANO: 2010 BANCA: ESAF RGO: 51583806784


MPOG PROVA: ANALISTA -
TECNOLOGIA DA INFORMAO
BI Business Inteligence
A uma tcnica de otimizao da rvore de deciso.
B um mtodo de formao avanada de gestores.
C compreende ferramentas de anlise de dados para otimizar os processos
produtivos de uma empresa.
D so tcnicas, mtodos e ferramentas para minerao de dados na rea de
negcios de uma empresa.
E so tcnicas, mtodos e ferramentas de anlise de dados para subsidiar
processos de deciso de uma empresa.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 45 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Comentrio: Vejam que a alternativa que converge para um dos conceitos de


BI que vimos ao longo da nossa aula a alternativa presente na letra E. Apenas
para lembramos do conceito, vamos exibi-lo abaixo:
BI representa a habilidade de se estruturar, acessar e explorar informaes,
normalmente guardadas em um DW/DM (Data Warehouse/Data Mart), com o
objetivo de desenvolver percepes, entendimentos, conhecimento, os quais
podem produzir um melhor processo de tomada de deciso. Essa definio do
autor brasileiro Carlos Barbieri.
Gabarito: E

8. ANO: 2010 BANCA: ESAF RGO: MPOG PROVA: ANALISTA -


TECNOLOGIA DA INFORMAO
Um ambiente Datawarehouse
A uma coleo de dados volteis, invariantes em termos locais, integrados e
orientados a um assunto, direcionados a decises operacionais.
B ao ser projetado segundo a abordagem bottom-up, fundamenta-se nas
necessidades de informao de todos os nveis gerenciais da empresa.
C para ser implementado, requer a remoo de metadados e a integrao de
dados existentes em um banco de dados.
D ao ser projetado, segundo a abordagem top-down, no comporta
necessidades de informaes gerenciais.
E uma coleo de dados no-volteis, invariantes em termos temporais,
integrados e orientados a um assunto, utilizados no suporte a decises
gerenciais.
Comentrios: Vejam que a questo usa os termos da definio do Inmon para
DW. Apenas para reforar vamos ver novamente a definio do pai do conceito
de DW: uma coleo de dados orientados por assunto, integrados, variveis
com o tempo e no volteis, para dar suporte ao processo de tomada de
deciso. Sendo assim, podemos marcar sem medo a resposta correta na
alternativa E.
51583806784

Gabarito: E

9. ANO: 2013 BANCA: ESAF RGO: DNIT PROVA: ANALISTA


ADMINISTRATIVO - TECNOLOGIA DA INFORMAO
So regras de avaliao de produtos OLAP:
A Transferncia ao usurio. Desempenho consistente na gerao de relatrios.
Dimensionalidade cumulativa. Operaes irrestritas com dimenses cruzadas.
B Viso conceitual multidimensional para restringir consultas. Transparncia ao
usurio. Dimensionalidade genrica. Manipulao dedutiva dos dados.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 46 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Comentrios: A primeira grande caracterstica que precisamos relembrar da


nossa aula o fato de ferramentas OLAP funcionam sobre dados
multidimensionais. Ainda no estudamos a fundo as operaes e outros
conceitos relacionados OLAP, contudo, depois de termos visto todos os
conceitos de modelagem multidimensional, ns sabemos que estamos falando de
dados multidimensionais.
Os atributos de dimenses so aqueles que esto presentes nas tabelas de
dimenses dos nossos modelos e os atributos de medida so aqueles presentes
na tabela fato. Desta forma podemos mais uma vez convergir para a resposta,
presente na nossa alternativa A.
Gabarito: A

11. ANO: 2015 BANCA: FCC RGO: TRT - 4 REGIO (RS) PROVA:
ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
Considere a arquitetura geral de um sistema de BI - Business Intelligence
mostrada na figura abaixo.

Nesta arquitetura 51583806784

A Data Mining se refere ao processo que, na construo do Data Warehouse,


utilizado para composio de anlises e relatrios, armazenando dados
descritivos e qualificando a respectiva mtrica associada.
B Data Marts representam reas de armazenamento intermedirio criadas a
partir do processo de ETL. Auxiliam na transio dos dados das fontes OLTP para
o destino final no Data Warehouse.
C OLAP um subconjunto de informaes extrado do Data Warehouse que pode
ser identificado por assuntos ou departamentos especficos. Utiliza uma
modelagem multidimensional conhecida como modelo estrela.
D os dados armazenados no Data Warehouse so integrados na base nica
mantendo as convenes de nomes, valores de variveis e outros atributos
fsicos de dados como foram obtidos das bases de dados originais.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 48 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

E o Data Warehouse no voltil, permite apenas a carga inicial dos dados e


consultas a estes dados. Alm disso, os dados nele armazenados so precisos
em relao ao tempo, no podendo ser atualizados.
Comentrios: Vamos analisar cada uma das alternativas. Na letra A temos uma
definio equivocada de Data Mining. Apenas para apresentar um conceito
correto, podemos definir Data mining (minerao de dados) o processo de
extrao de conhecimento de grandes bases de dados, convencionais ou no.
Utiliza tcnicas de inteligncia artificial que procuram relaes de similaridade ou
discordncia entre dados. Seu objetivo encontrar padres, anomalias e regras
com o propsito de transformar dados, aparentemente ocultos, em informaes
teis para a tomada de deciso e/ou avaliao de resultados.
A alternativa B trata das reas de armazenamento temporrias, geralmente
conhecidas como Staging Area. Elas so utilizadas para manipulao dos dados
durante a transio do ambiente operacional para os DW. Vejam que Staging
Area no se assemelha de forma alguma com um Data Mart.
A alternativa C define Data Mart, mas associa a definio a OLAP.
A alternativa D trata da manuteno dos atributos como foram obtidos nas
bases originais. Se voc se lembrar da transformao de chaves naturais em
chaves artificiais tratada durante a aula vai visualizar o erro da alternativa.
Por fim, temos a letra E que se trata da nossa resposta.
Gabarito: E

12. ANO: 2015 BANCA: FCC RGO: TRT - 15 REGIO (CAMPINAS-


SP) PROVA: ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
No contexto de Business Intelligence, os sistemas OLAP e OLTP se diferenciam
em diversas caractersticas. Na tabela abaixo, no que diz respeito s
caractersticas, est INCORRETO:

51583806784

A Letra A
B Letra B
C Letra C
D Letra D
E Letra E

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 49 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Comentrios: Vamos falar um pouco mais sobre OLAP na prxima aula. Mas se
lembrarmos do que vimos at aqui, podemos verificar que o texto presente na
caracterstica foco est trocado. OLAP foca no nvel estratgico da organizao,
enquanto OLTP visa atender as demandas operacionais. Desta forma a
alternativa E encontra-se incorreta. Como a questo pede para marcarmos a
incorreta, temos a nossa resposta.
Gabarito: E

13. ANO: 2015 BANCA: FCC RGO: TRE-RR PROVA: ANALISTA


JUDICIRIO - ANLISE DE SISTEMAS
Os dados de sistemas OLAP se baseiam nas informaes contidas nos diversos
softwares utilizados pela empresa (ERPs, planilhas, arquivos texto, arquivos XML
etc.). Estes sistemas possuem uma camada onde esto os dados originais e
outra camada onde esto os dados tratados (um gigantesco repositrio de dados
sobre assuntos diversos preparados para serem consultados por um sistema
OLAP), que chamamos de
A Data Mining.
B Online Transactional Database.
C Data Mart.
D Datawarehouse.
E Big Data.
Comentrios: Vejam que a questo trata de um gigantesco repositrio de
dados que sabemos que o DW Data warehouse.
Gabarito: D

14. ANO: 2015 BANCA: FCC RGO: CNMP PROVA: ANALISTA DO


CNMP - DESENVOLVIMENTO DE SISTEMAS
51583806784

Solues informatizadas de Business Intelligence (BI) geralmente contm


sistemas que podem ser de diversos tipos, dependendo do objetivo das anlises
e do perfil do usurio, como:
A Online Analytical Processing (OLAP), tambm conhecidos como sintticos, que
baseiam-se em transaes, como: Sistemas Contbeis; Aplicaes de Cadastro;
Sistemas de Compra, Estoque, Inventrio; ERPs; CRMs.
B Decision Support Systems (DSS) ou Sistemas de Apoio a Deciso, voltados
para profissionais que atuam no nvel estratgico das empresas, como diretoria
e presidncia. Oferecem, para tanto, um conjunto de indicadores chave de
desempenho como o CMMI.
C Management Information Systems (MIS) ou Sistemas de Informaes
Gerenciais, que permitem anlises mais profundas, com a realizao de
simulaes de cenrios. Por vezes, utilizam-se de ferramentas de Data Mining

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 50 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

para identificao de cruzamentos no triviais. So utilizados por analistas de


negcio no nvel ttico.
D Online Transactional Processing (OLTP) ou Sistemas transacionais, que
fornecem subsdio para tomadas de deciso a partir de anlises realizadas sobre
bases de dados histricas, por vezes com milhes de registros a serem
totalizados.
E Executive Information Systems (EIS) ou Sistemas de Informaes Executivas,
que so baseados em relatrios analticos, normalmente utilizados por usurios
de nvel operacional.
Comentrios: Vamos ver o que tem de errado nas alternativas distintas a
resposta da questo. Na alternativa A listado um conjunto de sistemas
operacionais e associado essa lista a sistemas OLAP, que trata-se da sigla para
sistemas analticos.
Sabemos que CMMI no um conjunto de indicadores bsicos de desempenho.
um certificado do nvel de maturidade no desenvolvimento de software de uma
determinada organizao. Sendo assim a alternativa B tambm est errada.
A alternativa C a nossa resposta, trata dos Sistemas de informaes gerenciais
de forma correta.
Na alternativa D o erro est em associar os sistemas transacionais com subsdio
para tomada de decises.
Por fim, a alternativa E diz que relatrios analticos so utilizados por usurios
operacionais, o que est incorreto.
Gabarito: C

15. ANO: 2010 BANCA: FCC RGO: TCE-SP PROVA: AGENTE DA


FISCALIZAO FINANCEIRA - CONHECIMENTOS BSICOS
Os conceitos de inteligncia empresarial ou organizacional esto intimamente
relacionados com o PETI que considera
A o planejamento de sistemas de informao, apenas.
B o planejamento de sistemas de informao e conhecimentos, apenas.
51583806784

C a informtica e os conhecimentos, apenas.


D a informtica, apenas.
E o planejamento de sistemas de informao, conhecimentos e informtica.
Comentrios: O Planejamento Estratgico da Tecnologia da Informao (PETI)
um processo dinmico e interativo para estruturar estratgica, ttica e
operacionalmente as informaes organizacionais, a TI (e seus recursos:
hardware, software, sistemas de telecomunicao, gesto de dados e
informao), os sistemas de informao e do conhecimento, as pessoas
envolvidas e a infraestrutura necessria para o atendimento de todas as
decises, aes e respectivos processos da organizao.
O PETI deve estar alinhado aos negcios. Para que esse alinhamento acontea, o
maior desafio dos gestores ainda fazer com que a TI desempenhe seu
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 51 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

relevante papel estratgico nas organizaes, agregando valores aos seus


produtos e/ou servios e auxiliando a promoo das inteligncias competitiva e
empresarial. fundamental, portanto, que os recursos computacionais da TI
disponibilizem informaes oportunas e conhecimentos personalizados que
possibilitem a gerao de cenrios decisrios.
Gabarito: E

51583806784

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 52 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Gabarito: E

18. ANO: 2015 BANCA: FCC RGO: TRT - 3 REGIO (MG) PROVA:
TCNICO JUDICIRIO - TECNOLOGIA DA INFORMAO
Um tcnico de TI precisa utilizar um subconjunto de dados de um Data
Warehouse direcionado rea administrativa de um Tribunal. Esses dados sero
armazenados em um banco de dado modelado multidimensionalmente, que ser
criado capturando-se dados diretamente de sistemas transacionais, buscando as
informaes relevantes para os processos de negcio da rea administrativa.
Esse banco de dados ser um
A Big Data.
B Data Mart.
C OLAP.
D MOLAP.
E Data Mining.

Gabarito: B

19. ANO: 2014 BANCA: FCC RGO: TCE-RS PROVA: AUDITOR


PBLICO EXTERNO - TCNICO EM PROCESSAMENTO DE DADOS
A granularidade de dados uma questo crtica no projeto de um Data
Warehouse (DW), pois afeta o volume de dados que reside no DW e, ao mesmo
tempo, afeta o tipo de consulta que pode ser atendida. Considere:
I. Quanto mais detalhe existir, mais baixo ser o nvel de granularidade. Quanto
menos detalhe existir, mais alto ser o nvel de granularidade.
II. Quando h um nvel de granularidade muito alto, o espao em disco e o
nmero de ndices necessrios se tornam bem menores, mas h uma
51583806784

correspondente diminuio da possibilidade de utilizao dos dados para atender


a consultas detalhadas.
correto afirmar que a afirmativa I
A equivalente a: quanto menos detalhes h nos dados, menor a
granularidade, consequentemente, quanto mais detalhes existem, maior a
granularidade.
B e a afirmativa II esto corretas e coerentes em relao ao nvel de
granularidade, espao em disco e tipos de consultas em um DW.
C est correta. A afirmativa II est incorreta, pois apresenta incoerncia em
relao ao nvel de granularidade, espao em disco e tipos de consultas em um
DW.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 54 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

D e a afirmativa II esto incorretas. Ambas apresentam incoerncia em relao


ao nvel de granularidade, espao em disco e tipos de consultas em um DW.
E est incorreta. A afirmativa II est correta, pois coerente em relao ao nvel
de granularidade, espao em disco e tipos de consultas em um DW.

Gabarito: B

20. ANO: 2015 BANCA: FCC RGO: CNMP PROVA: ANALISTA DO


CNMP - DESENVOLVIMENTO DE SISTEMAS
Considere que a equipe de Analistas de Desenvolvimento de Sistemas do CNMP
est projetando a arquitetura para o Data Warehouse (DW) da instituio,
conforme mostra a figura abaixo:

correto afirmar que esta arquitetura


51583806784

A bottom-up, pois primeiro a equipe cria um DW e depois parte para a


segmentao, ou seja, divide o DW em reas menores gerando pequenos bancos
orientados por assuntos aos departamentos.
B bottom-up. Permite um rpido desenvolvimento, pois a construo dos Data
Marts altamente direcionada. Normalmente um Data Mart pode ser colocado
em produo em um perodo de 2 a 3 meses.
C top-down. A partir do DW so extrados os dados e metadados para os Data
Marts. Nos Data Marts as informaes esto em maior nvel de sumarizao e,
normalmente, no apresentam o nvel histrico encontrado no DW.
D top-down, pois possui um retorno de investimento muito rpido ou um
faster pay back. O propsito desta arquitetura a construo de um DW
incremental a partir de Data Marts independentes.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 55 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

E bottom-up. Garante a existncia de um nico conjunto de aplicaes para


ETL, ou seja, extrao, limpeza e integrao dos dados, embora os processos de
manuteno e monitorao fiquem descentralizados.

Gabarito: C

21. ANO: 2015 BANCA: FCC RGO: TCM-GO PROVA: AUDITOR DE


CONTROLE EXTERNO - INFORMTICA
O Serpro relatou assim uma parceria com o Tribunal de Contas da Unio TCU:
O funcionamento do Sntese, simplificadamente, se dar da seguinte forma:
sero realizadas extraes de dados dos sistemas de informaes mantidos por
diversos rgos pblicos; esses dados sofrero transformaes para
compatibilizar codificaes e formatos, realizar classificaes, agrupar registros e
agregar valores; as informaes modificadas alimentaro o repositrio de dados
modelado especificamente para consultas analticas. O acesso ao repositrio ser
realizado pelo usurio final por meio de ferramentas que possuem uma interface
amigvel para elaborar consultas ou relatrios. A apresentao das consultas
pode ser em forma de matriz, grfico, documento de editor de texto ou planilha
eletrnica.
O repositrio de dados e as ferramentas, em destaque no texto, referem-se,
respectivamente, a
A ERP e SQL Server Reporting Service.
B SQL Server Reporting Service e Data Mining.
C Data Warehouse e OLAP.
D SQL Server Reporting Service e Business Intelligence.
E Data Warehouse e SQL Server Reporting Service.

Gabarito: C
51583806784

22. ANO: 2014 BANCA: FCC RGO: TJ-AP PROVA: ANALISTA


JUDICIRIO - BANCO DE DADOS - DBA
Os sistemas de Data Warehouse utilizam-se de um modelo de dados diferente
dos bancos de dados tradicionais, que proporciona ganhos de desempenho nas
consultas. Esse modelo conhecido como modelagem
A dinmica.
B dimensional.
C fixa.
D online.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 56 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

E transacional.

Gabarito: B

23. ANO: 2015 BANCA: FCC RGO: TRT - 3 REGIO (MG) PROVA:
TCNICO JUDICIRIO - TECNOLOGIA DA INFORMAO
A modelagem multidimensional utilizada especialmente para sumarizar e
reestruturar dados e apresent-los em vises que suportem a anlise dos
valores desses dados. Um modelo multidimensional formado por dimenses, e
por uma coleo de itens de dados composta de dados de medidas e de
contexto, denominada
A schema.
B pivot.
C slice.
D fato.
E verso.

Gabarito: D

24. ANO: 2015 BANCA: FCC RGO: TCM-GO PROVA: AUDITOR DE


CONTROLE EXTERNO - INFORMTICA
Quando o modelo de dados multidimensionais comea a ser definido, elementos
bsicos de representao precisam ter sido estabelecidos, de modo a se criar um
padro de modelagem. Considere um modelo em que as dimenses e fatos so
representados em tabelas, podendo haver mltiplas dimenses e mltiplas
tabelas de fatos.
51583806784

Ao modelar cada tabela _____I_____ devem ser considerados os seguintes


pontos:
A chave primria composta, sendo um elemento da chave para cada
dimenso;
Cada elemento chave para a dimenso deve ser representado e descrito
na tabela _____II_____ correspondente (para efetuar a juno);
A dimenso tempo sempre representada como parte da chave
primria.
Deve haver uma tabela _____III_____ para cada dimenso do modelo,
contendo
Uma chave artificial (ou gerada) genrica;
Uma coluna de descrio genrica para a dimenso;

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 57 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Colunas que permitam _____IV_____;


Um indicador nvel que indica o nvel da hierarquia a que se refere a
linha da tabela.
As lacunas de I a IV so corretas, e respectivamente, preenchidas com:
A dimenso de fatos de tempo efetuar os filtros.
B dimenso de fatos de fatos a juno com as tabelas de fatos.
C de fatos de tempo dimenso sinalizar a presena de fatos para o
perodo de tempo indicado na linha.
D de fatos dimenso dimenso efetuar os filtros.
E de tempo dimenso de fatos a juno com as tabelas de dimenso.

Gabarito: D

25. ANO: 2013 BANCA: FCC RGO: MPE-MA PROVA: ANALISTA


JUDICIRIO - BANCO DE DADOS
Considerando um data warehouse, podem ser utilizadas, para sua consulta, as
ferramentas MOLAP (Multidimensional OLAP), cuja caracterstica principal fazer
o acesso a um conjunto de dados previamente calculados, denominado
A matriz de dados.
B lista ligada.
C matriz hash.
D milestone.
E cubo de dados.

Gabarito: E

51583806784

26. ANO: 2013 BANCA: FCC RGO: MPE-MA PROVA: ANALISTA


JUDICIRIO - BANCO DE DADOS
Na modelagem de um data warehouse, pode ser feito o snowflaking, que
significa
A criptografar as tabelas fato e dimenso.
B normalizar as tabelas dimenso.
C excluir atributos do tipo binrio.
D indexar as tabelas dimenso por todos seus atributos.
E duplicar a tabela fato.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 58 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

29. ANO: 2012 BANCA: FCC RGO: TST PROVA: ANALISTA


JUDICIRIO - ANALISTA DE SISTEMAS
O processo de ETL em uma Data Warehouse possui vrias fases. Em uma destas
fases efetuada a
A extrao dos dados dos sistemas de origem.
B introduo de novos produtos no mercado.
C validao das interfaces de usurio.
D criao de diagramas estticos e comportamentais das classes e atributos.
E definio dos custos e prazos.

Gabarito: A

30. ANO: 2010 BANCA: FCC RGO: TRT - 22 REGIO (PI) PROVA:
ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
No mbito dos DWs, uma outra concepo do ODS (Staging Area) est sendo
estabelecida por alguns autores. Trata-se de
A OLAP.
B Drill throught.
C ETL.
D Data Mining.
E Dynamic Data Storage.

Gabarito: E

51583806784

31. ANO: 2011 BANCA: FCC RGO: TRT - 14 REGIO (RO E AC)
PROVA: ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
No contexto de DW, uma categoria de ferramentas de anlise denominada
open-end e que permite ao usurio avaliar tendncias e padres no conhecidos
entre os dados. Trata-se de
A slice.
B star schema.
C ODS.
D ETL.
E data mining.

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 60 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Gabarito: E

51583806784

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 62 de 63

51583806784 - carla peretro


Tcnicas de modelagem de BI
Prof. Thiago Rodrigues Cavalcanti Aula 01

Consideraes Finais

Chegamos ao final da nossa aula introdutria de business intelligence ou


inteligncia de negcios!

Outros assuntos dentro deste tema podem estar presentes nas prximas
aulas.

At a prxima!

Thiago Cavalcanti

51583806784

Prof. Thiago Rodrigues Cavalcanti


www.estrategiaconcursos.com.br 63 de 63

51583806784 - carla peretro

Das könnte Ihnen auch gefallen