Sie sind auf Seite 1von 30

Informatique dcisionnelle

Welcome
Informatique dcisionnelle :
Solutions IT permettant danalyser les informations
facilement et rapidement afin de prendre la bonne dcision.

Contenu

1. Dfinition ID
2. Utilit
3. Architecture

Intro

ETL
3. Dfinition
4, Processus ETL

5. Entrepot de donnes
6. Types d ED

Entrepot de
donnes

Exercice
dapplication

Introduction

| Dfinition

Gartner
un terme gnrique qui englobe les applications, les infrastructures et les outils, mais
aussi les bonnes pratiques qui permettent l'accs aux informations et leur analyse,
dans le but d'amliorer et d'optimiser les dcisions et les performances.

CIO.com
La BI est plus qu'une mthode de reporting d'entreprise et plus qu'un
ensemble d'outils qui permet de soutirer des donnes des systmes
d'entreprises.

La Business Intelligence se dfinit comme l'ensemble des technologies permettant de


collecter, consolider, modliser et restituer les donnes des fins de comprhension,
danalyse et de dcision

| Exemple de requete relevant de lID

| Architecture

ETL

| ETL : Extract, Transform, Load

Extraction

identifier et extraire les donnes de sources


ayant subi une modification depuis la dernire
excution.
Transformation
appliquer diverses transformations aux
donnes pour les nettoyer, les intgrer et les
agrger.
Chargement
insrer les donnes transformes dans
lentrept et grer les changements aux
donnes existantes

10

Extraction des donnes

Identification des sources:


numrer les items cibles (mtriques et attributs de dimension) ncessaires l'entrept de donnes;
Pour chaque item cible, trouver la source et l'item correspondant de cette source;
Si plusieurs sources sont trouves, choisir la plus pertinente;
Si l'item cible exige des donnes de plusieurs sources, former des rgles de consolidation;
Si l'item source referme plusieurs items cibles (ex: un seul champs pour le nom et l'adresse du client),
dfinir des rgles de dcoupage;
Inspecter les sources pour des valeurs manquantes.

11

Extraction des donnes

11
11
11

Extraction complte
Capture l'ensemble des donnes un certain instant (snapshot de l'tat oprationnel);

Normalement employe dans deux situations:


1. Chargement initial des donnes;
2. Rafrachissement complet des donnes (ex: modification d'une source).
Peut tre trs coteuse en temps (ex: plusieurs heures/jours).

12

Extraction des donnes

12
12
12

Extraction incrmentale
Capture uniquement les donnes qui ont changes ou ont t ajoutes depuis la dernire
extraction;

Peut tre faite de deux faons:


1. Extraction temps-rel;
2. Extraction diffre (en lot).

13

Transformation des donnes


Types de transformation:
Rvision de format:
Ex: Changer le type ou la longueur de champs individuels.
Dcodage de champs:
Consolider les donnes de sources multiples. Ex: ['homme', 'femme'] vs ['M', 'F'] vs [1,2].
Traduire les valeurs cryptiques Ex: 'AC', 'IN', 'SU' pour les statuts actif, inactif et suspendu.
Pr-calcul des valeurs drives:
Ex: profit calcul partir de ventes et cots.
Dcoupage de champs complexes:

Ex: extraire les valeurs prnom, secondPrnomet nomFamille partir d'une seule chane de
caractres nomComplet.

14

Chargement des donnes

Considration additionnelles:
Faire les chargements en lot dans une priode creuse (entrept de donnes non
utilis);
Considrer la bande passante requise pour le chargement;
Avoir un plan pour valuer la qualit des donnes charges dans l'entrept;

Commencer par charger les donnes des tables de dimension.

Questions ?

Data Warehouse

| Dfinition

17

Data Warehouse, ou entrept de donnes, est une base de donnes ddie au


stockage de l'ensemble des donnes utilises dans le cadre de la prise de dcision et
de l'analyse dcisionnelle.

Le Data Warehouse est exclusivement rserv cet usage.

Il est aliment en donnes depuis les bases de production grce notamment


aux outils d'ETL Extract Transform Load.

18

| Caractristiques
Data Warehouse est une collection de donnes orientes sujet, intgres, non volatiles et historises, organises
pour la prise de dcision. - Bill Inmon 1996

Orients sujet:
Les donnes sont organises par sujet (ex: clients, produits, ventes, etc.).

Intgrs:
Les donnes, qui proviennent de diverses sources htrognes, sont
consolides et intgres dans lentrept.

Historiques:

Les donnes ont trs souvent une composante temporelle (ex: date et
heure dune transaction).

Non-volatiles:
Une fois insres dans lentrept, les donnes ne sont jamais modifies
ou effaces; elle sont conserves pour des analyses futures.

19

| Modlisation des ED

Nouveaux types de table:


Table de faits
Table de dimensions

Nouveaux modles:
Modle en toile
Modle en flocon
Modle en constellation

20

|Table de faits
Table principale du modle dimensionnel
Contient les donnes observables (les faits) sur le sujet tudi selon divers axes danalyse (les dimensions)

Fait:

Ce que lon souhaite mesurer


Quantits vendues, montant des ventes
Contient les cls trangres des axes danalyse

(dimension)
Date, produit, magasin

21

|Table de dimension
Axe danalyse selon lequel vont tre tudies les donnes observables (faits)
Contient le dtail sur les faits

Dimension = axe danalyse


Client, produit, priode de temps
Contient souvent un grand nombre de colonnes
Lensemble des informations descriptives des faits

Contient en gnral beaucoup moins


denregistrements quune table de faits

22

| La dimension du temps

Commune lensemble du DW
Relie toute table de faits

23

| Le modle en toile

23
23
23

24

| Le modle en toile

Une table de fait centrale et des dimensions

Les dimensions nont pas de liaison entre elles


Avantages:
Facilit de navigation
Nombre de jointures limit

Inconvnients:
Redondance dans les dimensions
Toutes les dimensions ne concernent pas les mesures

24
24
24

25

| Le modle en flacon

25
25
25

26

| Le modle en flacon

Une table de fait et des dimensions dcomposes en sous hirarchies


On a un seul niveau hirarchique dans une table de dimension
Avantages:
Normalisation des dimensions

conomie despace disque

Inconvnients:
Modle plus complexe (jointure)
Requtes moins performantes

26
26
26

27

| Le modle en constellation

Ce modle est un ensemble de schmas en toiles et/ou en flocon dans lesquels les tables de faits se partagent
certaines tables de dimensions. Cest de cette accumulation que dcoule un modle en constellation.

27
27
27

28

Exercice dapplication
Il sagit de modliser lentrept de donnes (ED) des ventes dune entreprise
commerciale.
produit, caractris par : code_produit, code_famille
client, caractris par : code_client, nom, (catgorie socio-professionnelle)
vente, caractrise par : date, code_produit, code montant_de_vente
vendeur, caractris par : code_vendeur, nom, code_service
date, caractrise par : semaine, mois, anne

Tracer le schma appropri de lED, en prcisant pour


chaque table sa nature dimensionnelle (table de faits ou
table de dimension) et ses cls.

28
28
28

Questions ?

OLAP

Das könnte Ihnen auch gefallen