Sie sind auf Seite 1von 2

BUSINESS INTELLIGENCE (INTELIGNCIA DE

NEGCIO)
um mtodo que visa ajudar as empresas a tomar
decises inteligentes, por meio de dados e informaes
recolhidas por diversos sistemas de informao.

Seu objetivo encontrar, automaticamente, padres,


anomalias e regras com o propsito de transformar dados,
aparentemente ocultos, em informaes teis para a
tomada de deciso e/ou avaliao de resultados.
Tcnicas de Mining

DATA MINING (MINERAO DE DADOS)


O Data Mining pode fazer parte de um processo maior,
chamado Processo de Descoberta do Conhecimento em
Bancos de Dados (KDD). PS compreende a descoberta
de padres teis em Bases de Dados.
O KDD composto por cinco fases: Seleo, prprocessamento (limpeza de dados), transformao, Mining
e interpretao.
PS mnemnico SP-TMI.
PS cuidado para nao confundir transformao com prprocessamento. Em pre-processamento vc mantm o
mesmo valor dos dados para somente ajustar/padronizar
os dados para fins de mining; na transformao modificase o valor dos dados para fim de mining.
PS Em estatstica, outlier, valor aberrante ou valor
atpico, uma observao que apresenta um grande
afastamento das demais da srie 1 (que esta "fora" dela),
ou que inconsistente; os outliers devem ser retirados
para q no prejudiquem todo o universo dos dados (na
fase de pr-processamento).
Data Mining
Data Mining, como o nome indica, se refere minerao
ou a descoberta de informaes em funo de padres ou
regras em grande quantidade de dados, sejam elas bases
de dados convencionais ou no.
O DM utiliza tcnicas de inteligncia artificial que procuram
relaes de similaridade ou discordncia entre dados.

Associao (x influencia Y)
Classificao (exemplifica-se dados ao sistema e ele
segue o padro de classificao)
Agrupamento(clustering) similar classificao, porm o
sistema trabalha sem o auxlio do elemento humano.
Padres sequenciais
Padres temporais
Regresso anlise de diversas variveis para prever uma
prxima. (como estatsticas)
Redes Neurais uma extenso da regresso (regresso
generalizada), utilizando princpios da inteligncia artificial
Algoritmos genticos so tcnicas de busca utilizadas na
cincia da computao para achar solues aproximadas
em problemas de otimizao e busca, sendo uma classe
particular de algoritmos evolutivos que usam tcnicas
inspiradas pela biologia evolutiva como hereditariedade,
mutao, seleo natural e recombinao.
DATA WAREHOUSE
um repositrio de informaes colhidas de vrias
origens, armazenadas sob um esquema unificado, em um
nico local.O Data Warehouse possibilita a anlise de
grandes volumes de dados, coletados dos sistemas
transacionais (OLTP).
Diferenas do Banco de Dados comum(VIOV)
voltil
Integrado

Orientado por assuntos


Variante no tempo
Data Mart
Setorizado
Abordagem Bottom up e top Down
Comparao entre Datamining e Datawarehouse
Data Mining
Tcnica de BI que
extrai padres teis
em bancos de dados

Data Warehouse
Repositrio histrico
de dados, montado
de forma a facilitar
a extrao de
conhecimento
Pode ser aplicado
Diversas
em bancos de dados
ferramentas podem
comuns, sistemas
ser utilizadas sobre
legados, e tambm
um Data
em Data Warehouse
Warehouse, como
(onde,
ferramenas OLAP,
provavelmente,
geradores de
melhores resultados
relatrios e Data
sero obtidos)
Mining
Ambas esto inseridas no contexto de Business
Intelligence, com o objetivo de extrair
conhecimento til para a tomada de decises
empresariais!

Arquitetura OLAP
ELT(Extrao, Transformao e Carga)

MOLAP
ROLAP
HOLAP
DOLAP
WOLAP
Operaes OLAP
Drill Down (- granulao)
Drill Up/Roll Up (+ granulao)
Drill throught (de 1 dimenso p/ outra)
Drill Across (pula nvel intermedirio dentro de uma
mesa dimenso

So ferramentas de software cuja funo a extrao


de dados de diversos sistemas, transformao
desses dados conforme regras de negcios e, por
fim, a carga dos dados em um Data Mart ou um Data
Warehouse.
Extrao; Transformao (aplicao de
regras/funes); Carga ( so carregados em tempo
real, temporizada.
Ferramentas OLAP
OLAP um termo utilizado para descrever a anlise de
dados complexos apartir do Data Warehouse. Esta
tecnologia permite aos analistas de negcios, gerentes
executivos analisar e visualizar dados corporativos de
forma rpida, consistente e interativa.
A funcionalidade OLAP inicialmente caracterizada pela
anlise dinmica
e multidimensional dos dados consolidados de uma
organizao.
As ferramentas de OLAP qm trazem as informaes
de maneira navegvel, com melhor visualizao dos
dados; manipulao humana.
Tabelas de Fato dados multidimensionais
Tabelas de Dimenso explicam o universo da
dimenso
Modelagem Dimensional
Estrela todas as tabelas de dimenso se relacionam
diretamente com os fatos;
H um aumento do espao de armazenamento e maior
velocidade, pois as informaes estaro diretamente
contidas na tabela de fato.
Floco de Neve as tabelas de fato se relacionam com
outras dimenses q tbm podem se relacionar com outras
dimenses; H menos espao de armazenamento e
menor velocidade de processamento.

Slice and Dice (Slice/Fatiar 1 dimenso de um cubo;


Dice/Repartir 1 subcubo; so duas operaes)
Cross-Join (os dados so unidos e colunas e linhas so
invertidas)
Pivot (similar ao cross-join, mas apenas rotacional-se o
cubo, sem juno dos dados)

Das könnte Ihnen auch gefallen