Beruflich Dokumente
Kultur Dokumente
Welcome
Informatique dcisionnelle :
Solutions IT permettant danalyser les informations
facilement et rapidement afin de prendre la bonne dcision.
Contenu
1. Dfinition ID
2. Utilit
3. Architecture
Intro
ETL
3. Dfinition
4, Processus ETL
5. Entrepot de donnes
6. Types d ED
Entrepot de
donnes
Exercice
dapplication
Introduction
| Dfinition
Gartner
un terme gnrique qui englobe les applications, les infrastructures et les outils, mais
aussi les bonnes pratiques qui permettent l'accs aux informations et leur analyse,
dans le but d'amliorer et d'optimiser les dcisions et les performances.
CIO.com
La BI est plus qu'une mthode de reporting d'entreprise et plus qu'un
ensemble d'outils qui permet de soutirer des donnes des systmes
d'entreprises.
| Architecture
ETL
Extraction
10
11
11
11
11
Extraction complte
Capture l'ensemble des donnes un certain instant (snapshot de l'tat oprationnel);
12
12
12
12
Extraction incrmentale
Capture uniquement les donnes qui ont changes ou ont t ajoutes depuis la dernire
extraction;
13
Ex: extraire les valeurs prnom, secondPrnomet nomFamille partir d'une seule chane de
caractres nomComplet.
14
Considration additionnelles:
Faire les chargements en lot dans une priode creuse (entrept de donnes non
utilis);
Considrer la bande passante requise pour le chargement;
Avoir un plan pour valuer la qualit des donnes charges dans l'entrept;
Questions ?
Data Warehouse
| Dfinition
17
18
| Caractristiques
Data Warehouse est une collection de donnes orientes sujet, intgres, non volatiles et historises, organises
pour la prise de dcision. - Bill Inmon 1996
Orients sujet:
Les donnes sont organises par sujet (ex: clients, produits, ventes, etc.).
Intgrs:
Les donnes, qui proviennent de diverses sources htrognes, sont
consolides et intgres dans lentrept.
Historiques:
Les donnes ont trs souvent une composante temporelle (ex: date et
heure dune transaction).
Non-volatiles:
Une fois insres dans lentrept, les donnes ne sont jamais modifies
ou effaces; elle sont conserves pour des analyses futures.
19
| Modlisation des ED
Nouveaux modles:
Modle en toile
Modle en flocon
Modle en constellation
20
|Table de faits
Table principale du modle dimensionnel
Contient les donnes observables (les faits) sur le sujet tudi selon divers axes danalyse (les dimensions)
Fait:
(dimension)
Date, produit, magasin
21
|Table de dimension
Axe danalyse selon lequel vont tre tudies les donnes observables (faits)
Contient le dtail sur les faits
22
| La dimension du temps
Commune lensemble du DW
Relie toute table de faits
23
| Le modle en toile
23
23
23
24
| Le modle en toile
Inconvnients:
Redondance dans les dimensions
Toutes les dimensions ne concernent pas les mesures
24
24
24
25
| Le modle en flacon
25
25
25
26
| Le modle en flacon
Inconvnients:
Modle plus complexe (jointure)
Requtes moins performantes
26
26
26
27
| Le modle en constellation
Ce modle est un ensemble de schmas en toiles et/ou en flocon dans lesquels les tables de faits se partagent
certaines tables de dimensions. Cest de cette accumulation que dcoule un modle en constellation.
27
27
27
28
Exercice dapplication
Il sagit de modliser lentrept de donnes (ED) des ventes dune entreprise
commerciale.
produit, caractris par : code_produit, code_famille
client, caractris par : code_client, nom, (catgorie socio-professionnelle)
vente, caractrise par : date, code_produit, code montant_de_vente
vendeur, caractris par : code_vendeur, nom, code_service
date, caractrise par : semaine, mois, anne
28
28
28
Questions ?
OLAP