Beruflich Dokumente
Kultur Dokumente
COURS
DATAWAREHOUSE DATAMINING
Niveau : 2LFIG
PLAN DATAWAREHOUSE
Contexte Les entrepts de donnes Les entrepts de donnes vs les bases de donnes Les datamarts Architecture Modlisation Alimentation Les bases de donnes multidimensionnelles Les oprations OLAP
CONTEXTE
Besoin: prise de dcisions stratgiques et tactiques Pourquoi: besoin de ractivit Qui: les dcideurs (non informaticiens) Comment: rpondre aux demandes danalyse des donnes, dgager des informations qualitatives nouvelles
Pourquoi et comment le chiffre daffaire a baiss? A combien slvent mes ventes journalires?
3
CONTEXTE
LES DONNES UTILISABLES PAR LES DCIDEURS
Caractristiques
y y y
de ces donnes:
y y
Distribues: systmes parpills Htrognes: systmes et structures de donnes diffrents Dtailles: organisation des donnes selon les processus fonctionnels, donnes surabondantes pour lanalyse Peu/pas adaptes lanalyse : les requtes lourdes peuvent bloquer le systme transactionnel Volatiles: pas dhistorisation systmatique
4
CONTEXTE
Enjeux :
Les ventes locales : amliorer le chiffre daffaires local
Amliorer les ventes locales
PROBLMATIQUE
Comment rpondre aux demandes des dcideurs?
En donnant un accs rapide et simple linformation stratgique En donnant du sens aux donnes
PROBLMATIQUE
un ensemble organis d'lments qui permet de regrouper, de classifier, de traiter et de diffuser de l'information
SI SID
un ensemble organis d'lments qui permet de regrouper, de classifier, de traiter et de diffuser de l'information en vue d'offrir une aide la dcision
Mettre en place un systme dinformation ddi aux applications dcisionnelles: un data warehouse
7
DATAWAREHOUSE
DFINITION
y Collection de donnes : 1. intgres, 2. orientes sujet, 3. non volatiles, 4. historises, 5. rsumes 6. et disponibles pour linterrogation et lanalyse => Pour aider aux prises de dcisions
(Inmon 96).
8
DATAWAREHOUSE
DFINITION
y Collection de donnes : 1. intgres, provenant de sources 2. orientes sujet, diffrentes et 3. non volatiles, ventuellement 4. historises, htrognes. 5. rsumes 6. et disponibles pour linterrogation et lanalyse
(Inmon 96).
9
DATAWAREHOUSE
DFINITION
y Collection de donnes : 1. intgres, rorganises autour des 2. orientes sujet, sujets majeurs de lentreprise de 3. non volatiles, faon tre plus 4. historises, facilement manipulables. 5. rsumes 6. et disponibles pour linterrogation et lanalyse
(Inmon 96).
10
DATAWAREHOUSE
DFINITION
y Collection de donnes : 1. intgres, en lecture seule, 2. orientes sujet, utilises seulement en mode de consultation et 3. non volatiles, ne sont que trs 4. historises, rarement modifies. 5. rsumes 6. et disponibles pour linterrogation et lanalyse
(Inmon 96).
11
DATAWAREHOUSE
DFINITION
y Collection de donnes : 1. intgres, elles sont enregistres 2. orientes sujet, en considrant leur 3. non volatiles, volution (spatio4. historises, temporelle). 5. rsumes 6. et disponibles pour linterrogation et lanalyse
(Inmon 96).
12
DATAWAREHOUSE
DFINITION
y Collection de donnes : 1. intgres, elles sont rorganises 2. orientes sujet, afin de faciliter les analyses et 3. non volatiles, les processus de prise de 4. historises, dcision. 5. rsumes 6. et disponibles pour linterrogation et lanalyse
(Inmon 96).
13
Banque
y y
Sant
pidmiologie y Risque alimentaire
ou DB (Database)
3. 4. 5.
Partages par de multiples utilisateurs Assurant la fiabilit et scurit des donnes Gre par un SGBD sur un serveur
16
Service Financier
BD prod
Service livraison
BD prod
Clientle
H I S T O R I Q U E
Data Warehouse
OLAP: On-Line Analytical Processing Clientle
OLTP
Orient transaction Orient application Donnes courantes Donnes dtailles Donnes volutives
OLAP
Orient analyse Orient sujet Donnes historises Donnes agrges Donnes statiques
Utilisateurs nombreux, Utilisateurs peu nombreux, administrateurs/oprationn manager els Temps dexcution: court Temps dexcution: long
DATAMART
Sous-ensemble dun entrept de donnes Destin rpondre aux besoins dun secteur ou dune fonction particulire de lentreprise Point de vue spcifique selon des critres mtiers
DW de lentreprise
environnement structur et format en fonction des besoins dun mtier ou dun usage particulier Moins de donnes que DW
Plus facile comprendre, manipuler y Amlioration des temps de rponse
y
Utilisateurs
24
ARCHITECTURE FONCTIONNELLE DU DW
Sources de Alimentation Entrept donnes de donnes
Mta-donnes
Ciblage
Bases de donnes
excel
Entrepts de donnes Data mining Cube
25
Phase dalimentation
Phase de modlisation
Phase danalyse
Data warehouse
1. Motivations et architecture 2. Conception de la BD support 3. Alimentation du DW 4. Exploitation OLAP 5. Conclusion
26
accder toutes les donnes de lentreprise regrouper les informations dissmines analyser et prendre des dcisions rapidement (OLAP) Grande distribution : marketing, maintenance, ...
produits succs, modes, habitudes dachat prfrences par secteurs gographiques
y y
mailing cibls pour le marketing classification des clients, dtection fraudes, fuites de clients
27
OLAP
ETL
OLTP
DW
DM
Aides la dcision
28
2. CONCEVOIR LE DW
Htrognes et varies Fichiers, BD patrimoniales, Web, Dfinition des vues exportes Intgre les donnes utiles S'appuie sur le modle relationnel Description des sources Description des vues exportes Description du schma global
29
Conception DW
Sujet
y y
= faits + dimensions
30
Conception DW
DW- MODLISATION
-Schma entit-relation (classique) - Schma en toile (star schema) - Schma en flocon (snowflake schema) tables de faits : nombreux champs, tables centrales dimensions : peu de champs, permettent dinterprter les faits
Tout indicateur est modlis sous la forme dune toile ou dun flocon
31
SCHMA EN TOILE
Structure simple utilisant le modle entit-relation Une entit centrale (faits) - objet de lanalyse Des entits priphriques (1seul niveau) - dimensions de lanalyse
32
Periode
Key_periode anne trimestre mois jour
Table de faits ventes Key_periode Key_produit Key_magasin units_vendues montant_vente amount of s sales
Magasins
Key_mag nom ville dpartement 33 pays
SCHMA EN TOILE
Tuples de la table des faits cls trangres formant une cl primaire des valeurs associes chaque cl primaire
34
EXEMPLE DE SCHNEMA EN
FLOCONS
time
time_key day day_of_the_week month quarter year item
location
location_key street city_key
city
city_key city province_or_street 35 country
SCHMA EN FLOCONS
Evolution du star schema Normalisation des tables de dimensions 1 table Fait Plusieurs niveaux de tables de dimensions
36
SCHMA EN FLOCONS
Ventes
37
BILAN CONCEPTION
Le datawarehouse regroupe, historise, rsume les donnes de l'entreprise Le concepteur dfinit schma exports et intgrs
y y
38
Conception DW
LAnalyse MultiDimensionnell
Objectif
Obtenir des informations dj agrges selon les besoins de lutilisateur : simplicit et rapidit daccs
HyperCube OLAP
Reprsentation de linformation dans un hypercube N dimensions
DW
Base Multidimensionnell
De la relation au Cube
agrgations
40
Modlisation multidimensionnelle
Gnralisation des tableurs Notion de Cube de donnes : Data Cube Reprsentation de N attributs extraits d une table sous forme d un cube, N-k attributs composant les dimensions le long desquelles des groupements sont possibles, les k autres tant des mesures rsultant de fonctions d agrgations. Exemple : Dfinition d un cube sur quantit selon les axes NumPro, NumFou et Date partir de la table Ventes: Ventes ( NV, NUMPRO, NUMFOU, DATE, QTE, PRIX)
41
CUBE DE DONNES
2005
NumPro
2004
200
F1 P3
F2
42
Exploitation multidimensionnelle
Intrt d un cube : Possibilit des raliser des coupes par slection selon une dimension. Vue d un cube : Vue dfinie partir d un cube de donnes par agrgation des quantits selon un sous-ensemble des attributs. Pour un cube de dimension k, il existe 2k vues avec NumPro, NumFou, Date une fonction d agrgat. NumPro, Date NumPro, NumFou
NumFou, Date
NumPro
NumFou
Date
43
Variables analyses: Nb units, CA, marge... Axe d'analyse: Les produits (classe, produit) Axe d'analyse: Le temps (Anne, trimestre, mois, semaine) Axes d'analyse: dimensions 44 Variables analyses: indicateurs
Le multidimensionnel
Dimensions:
Indicateurs:
45
Analyse multidimensionnelle
Capacit manipuler des donnes qui ont t agr Selon diffrentes dimensions
Exemple : analyse des ventes / catgorie de produit + /anne + /zone gographique + /dpartement commercial 3 dim. 4 dim. 1 dim. 2 dim.
46
Temps
Jours
Mois
Trimestres
Annes
Gographie
Villes
Rgions
Pays
Produits
Numros
Types
Gammes
Marques
47
EXEMPLE
Produit
Produit
Ville
Magasin
Mois
LA NAVIGATION
MULTIDIMENSIONNELLE
Zoom selon une dimension Coupe d un cube
Produits pour une rgion donne
CA
France Est Lyon Sud Ouest Nice
Temps en semaines
Marseille
49
85
15
20
50
10
10 10
20
30
50
agrgation
Zoom avant/arrire
15
20
50
10
10 10
20
30
51
La navigation
3 catgories doprations
Catgorie Restructuration Granularit Ensembliste Concerne Reprsentation Niveau de dtail Extraction
52
Restructuration
Rorientation de la vue multidimensionnelle * slection graphique * flexibilit du schma
-Rotate/Pivot
54
-Switch
55
-Split
56
-Nest
57
Granularit
Navigation entre les niveaux * groupements * agrgation
Cuboids
58
-Roll-up
Rduction d une dimension du cube en la remplaant par une dimension grain plus large, donc en allant du dtail vers le global. Exemple : CUBE (Produits, Date, Ville) * Oprateur de pliage sur l axe Date : Rollup (Anne Mois), Rollup(Anne) * Possibilit de faire l agrgat total selon une dimension axe date : Rollup ( ) : supprime la dimension date et somme pour toute date
59
-Roll-up :
-dune vue dtaille une vue globale
60
-Drill-down
Dpliage : Extension d une dimension du cube en la remplaant par une dimension grains plus fins, donc en allant du global vers le dtail. Exemple : Pour le cube CUBE (Fournisseurs, Anne, Pays) * oprateur de Dpliage sur l axe anne : Drilldown (Anne Mois), Drilldown (Anne Mois Jour)
62
Granularit
Pour faciliter : Drill-down Roll-up Mmorisation de certaines vues concrtes Mais lesquelles?? Problme de recherche : -Maximiser la rutilisation des rsultats des cubes prcdents pour calculer des cubes plus globaux. -La fonction dagrgation change aussi la nature du pbm
Fonction additive : sum, min, max Fonction algbrique : avg, Fonction holistique : mdiane,
63
Manipulations ensemblistes
-Slection
65
-Projection
66
-Jointure
67
68
Exemple
Cube
Exemple de calcul :
Slice ( Paris ) [Drilldown (Ville) [Rollup (anne , mois) [ Slice (>2005 AND < 2006) [Cube] ] ] ].
69
Mois
Pivot :
70
Le multidimensionnel
FIN
BILAN GESTION
La modlisation multidimensionnelle est adapte l analyse de donnes Le datacube est au centre du processus dcisionnel
y y y
transformation et visualisation 3D une algbre du cube De multiples techniques d'optimisation Combien de datacubes partir de N variables ?
Questions ?
y
72
Le multidimensionnel
5. IMPLMENTATION
implmentent les cubes comme des matrices en mmoire implmentent les cubes comme des tables relationnelles certaines donnes en matrices en mmoires, d'autres en tables sur disques
73
Implmentation
* Donnes stockes en tables * Donnes exploites par des fonctions OLAP spciales (Group by et Cube)
75
MOLAP
Technologie de bases de donnes multidimensionnelles * structure de stockage = tableaux *MOLAP : Technique implmentant les fonctions OLAP de type calcul du cube de donnes directement en mmoire virtuelle , avec des structures de donnes persistantes adaptes * SGBD multidimensionnel : SGBD ddi aux calculs de cubes - implmentation de type tableau : CUBE [1:M, 1:N, 1:P]
76
MOLAP
Correspondance directe avec la vue MD Gestion de la faible densit (sparsity) * structure dindex = dimensions peu denses * donnes = tableaux des dimensions denses Problme dextensibilit
77
Oprateurs dcisionnels
SQL
Cache Cube
78
Implmentation
HOLAP
Combinaison des technologies ROLAP et MOLAP * donnes dtailles dans BDR * donnes agrges dans BDMD
SGBD Relationnel avec des oprateurs et algorithmes adquats : -GROUP BY CUBE -StarJoin, Index Bitmap
79
MOLAP
ROLAP
HOLAP
Stockage Relationnel Restitution multidimension. Optimisation du volume stock par mise en uvre de mcanismes de calculs dynamiques dagrgats
Stockage multidimension Et relationnel Restitution Multidimension. avec gestion dynamique du dcrochage vers la base de dtail relationnel
80
Rank, Moving Average, Rollup, Cube, ... Pivot, Standard dviation, Covariance, Corrlation
Fonctions statistiques:
81
Implmentation
VUES CONCRTES
CREATE MATERIALIZED VIEW <Table> (column_list) AS SELECT La vue est pr-calcule par le SGBD
y
Elle est maintenue lors des mises jour Les requtes sont reformules contre la vue d'une manire transparente pour l'usager
82
Implmentation
EXEMPLE
Table:
Emp(#emp, job, salary)
Dfinition de la vue:
CREATE MATERIALIZEDVIEW job_avg_sal AS select job, avg(sal) avg_sal FROM emp GROUP BY job;
Interrogation de la vue:
SELECT job FROM job_avg_sal WHERE avg_sal > 10000
83
Implmentation
EXTENSION DE SQL
ROLLUP:
SELECT <column list> y FROM <table> y GROUP BY ROLLUP(column_list);
y
CUBE:
SELECT <column list> y FROM <table> y GROUP BY CUBE(column_list);
y
Implmentation
EXEMPLE CUBE
Qua ntite 12 18 4 14 9 5 1
SELECT Animal, Lieu, SUM(Quantite) as Quantite FROM Animaux GROUP BY Animal, Magasin WITH CUBE
Ani mal Chat Chat Chat Chien Chien Chien Chien Tortue Tortue Tortue -
Lie u Paris Naples Paris Naples Rome Naples Rome Paris Naples Rome
Qua ntite 18 9 27 12 5 14 31 1 4 5 63 30 85 15 18
Implmentation
EXEMPLE ROLLUP
Qu ant ite 12 18 4 14 9 5 1
SELECT Animal, Lieu, SUM(Quantite) as Quantite FROM Animaux GROUP BY Animal,Magasin WITH ROLLUP
Animal Chat Chat Chat Chien Chien Chien Chien Tortue Tortue Tortue -
Quantite 18 9 27 12 5 14 31 1 4 5 63
86
Implmentation
MTA-DONNES
Mta-mta-modle
MOF
Constructions de base: classe (attribut, operation), association, package, type de donnes, contraintes Extensions: mtaclasses, mtarelations
Mta-modle
UML
CWM
EJB
Modle
Mta-donnes
Objet
87
Implmentation
Warehouse Operation Data Information Business Mining Visualization Nomenclature RecordOriented Multi Dimensional XML
Relational
Foundation
Business Data Keys Type Software Expressions Information Types Index Mapping Deployment
ObjectModel
(Core, Behavioral, Relationships, Instance)
88
Oracle
y y y
Cognos
y y y
Impromptu = Reporting Powerplay = Datacube Query = Requtage ESS Base = Base MOLAP ESS Analysis= Analyse + Datacube
Business Object
y y
Hyperion
y y
89
Implmentation
6. LE MARCH DU BI
BI= Business Intelligence
Conclusion
Datawarehouse
y
entrept des donnes historises de l'entreprise magasin de donnes cibl sur un ou plusieurs sujets exploration des donnes afin de dcouvrir des connaissances cube de prsentation d'units selon 3 dimensions entrept des donnes collectes sur le web
91
Datamart
y
Datamining
y
Datacube
y
Datawebhouse
y
Conclusion
Information processing
supports querying, basic statistical analysis, and reporting using crosstabs, tables, charts and graphs multidimensional analysis of data warehouse data supports basic OLAP operations, slice-dice, drilling, pivoting knowledge discovery from hidden patterns supports associations, constructing analytical models, performing classification and prediction, and presenting the mining results using visualization tools.
92
Analytical processing
Data mining
High quality of data in data warehouses DW contains integrated, consistent, cleaned data Available information processing structure surrounding data warehouses ODBC, OLEDB, Web accessing, service facilities, reporting and OLAP tools OLAP-based exploratory data analysis mining with drilling, dicing, pivoting, etc. On-line selection of data mining functions integration and swapping of multiple mining functions, 93 algorithms, and tasks.
Architecture of OLAM
An OLAM Architecture
Mining query Mining result
Layer3 OLAP/OLAM
MDDB
Filtering&Integrati on
Database API
Data cleaning Data integration
Databas es
Data Warehou se
Conclusion
Data warehouse
A subject-oriented, integrated, time-variant, and nonvolatile collection of data in support of managements decision-making process Star schema, snowflake schema, fact constellations A data cube consists of dimensions & measures
OLAP operations: drilling, rolling, slicing, dicing and pivoting OLAP servers: ROLAP, MOLAP, HOLAP Efficient computation of data cubes
Partial vs. full vs. no materialization Multiway array aggregation Bitmap index and join index implementations Discovery-drive and multi-feature cubes From OLAP to OLAM (on-line analytical mining)
95
3. Alimenter le DW
Outils dalimentation pour extraire transformer stocker dans DWH Donnes sources
96
Alimenter le DW
ETL = Extracteur + Intgrateur
Extraction
Push = rgles (triggers) Pull = requtes (queries) Dater ou marquer les donnes envoyes Ne pas perturber les applications OLTP
97
Priodique et rpte
Difficult
L'alimentation
Extraction
1re Phase : extraction des donnes utiles
-Eviter de perturber les Syst.de production -1 ou +srs passes * donnes en tps rel * donnes mensuelles
98
Transformer
Nettoyer /Intgrer/Structurer
99
TRANSFORMATION
Traduction de fichiers, BD rseaux, annuaires en tables Evolution vers XML (modle d'change) plus riche Rowset, SQL limit, SQL complet,
Appeler pareil les mmes choses et diffremment les choses diffrentes Application des "business rules"
y y
L'alimentation
-Isoler les pics de certaines valeurs dans une distribution statistiques. -Dfinir un espace compris entre la moyenne et un certain nombre dcart type, et exclure ou plafonner toutes les valeurs > seuil (du type moyenne + 3 carts types).
101
les valeurs manquantes - exclure les enregistrements incomplets - saisir manuellement ces valeurs manquantes - remplacer ces donnes par la moyenne -utiliser une constante globale unknown
les valeurs nulles : valeur conventionnelle pour une information inconnue ou inapplicable
102
103
Intgration/Restructuration
Suppression des incohrences smantiques entre les sources - diffrents noms/longueurs/types pour un mme attribut
Systmes oprationnels Application 1 Application 2 Application 3 Application 4 m,f 1,0 x,y homme,femme
Intgration/Restructuration (suite)
diffrence de normalisation/structure des tables (normalisation/dnormalisation) Le champ adresse est dcoup en n champs cibles: numro , rue , codepostal , pays , particularits ville ,
conversions -
105
Intgration/monovariable
Agrgation : les donnes des ventes journalires sont agrges pour calculer les montants totaux mensuels et annuels.
Transformation des dates en dures: (ractivit dun client : diffrence entre une date denvoi dun catalogue et une date de commande). Modification des donnes gographiques en coordonnes: (ajouter les coordonnes de longitude et latitude pour intgrer les contraintes de proximit dans le raisonnement).
106
Intgration/multivariable
Les ratios : Exemple : montant des achats relatifs une famille de produits sera rapport au montant global des achats (degr dimplication du client pour ce type darticles) La frquence : Exemple : nombre de commandes sur les x dernires priodes
107
Intgration/multivariable (suite)
Les tendances No 1 2 3 Priode 1 235 200 Priode 2 536 203 Tendance ++ =
108
Data Cleaning
Valeurs manquantes (nulles)
Ignorer le tuple Remplacer par une valeur fixe ou par la moyenne Gnres en prsence de bruits Dtecter par une analyse de voisinage
109
CHARGEMENT
Pas
y
de mise jour
gros volumes
Priodicit parfois longue y Chargement en blocs (bulk load) y Mise jour des index et rsums
Problmes
L'alimentation
Charger
Matrialisation des vues Plus Tris Consolidation Normalisation Vrification des contraintes dintgrit et Partitionnement des donnes (si plusieurs datamarts) Cration des indexes
111
Business Objects
ActaWorks
ETI
ETI.Extract
Ascential Software
DataStage XE
Plus de 40 connecteurs natifs vers des sources de donnes, dont IBM/Informix, Oracle, Sybase, Teradata et IBM DB2. Package complet ddi SAP et la collection de modules MySAP. Partie analytique: Brio, Business Objects, SPSS et Crystal Decisions.
Hummingbird
Genio Suite 5
Computer Associates
DecisionBase
Connecteurs en direct pour extraire les donnes en temps rel depuis SAP, PeopleSoft et des systmes mainframes. Accs de nombreuses sources de donnes dont IBM/Informix, Oracle, Sybase, IBM DB2, HTML et fichiers txt.
Informatica
PowerCenter 5
112
http://solutions.journaldunet.com/0208/020827_bi_panorama1.shtml
4. GRER L'ENTREPT
Base
y
relationnelle
Support de larges volumes (qq 100 gigas qq tras) y Historisation des donnes (fentres) y Importance des agrgats et chargements en blocs
Base
y
spcialise
support parallle
113
NCR
Teradata Database
Entrept de donnes multi-dimensionnel avec des extensions de divers types dont des formules de data mining. Rput notamment pour ses capacits de monte en charge sous Unix et Windows 2000. Dernire version de la base de donnes relationnelle de l'diteur, Oracle 9i est retaille dans une optique qui approfondit les fonctions ddies la business intelligence. Peut galement fonctionner comme entrept de donnes OLAP. IQ est la version dcline de la base de donnes relationnelle de Sybase, pour des besoins en rapport avec la business intelligence, donc aussi le CRM analytique.
Les solutions qui accdent Teradata sont a priori un peu moins nombreuses que pour Hyperion Essbase, Microsoft, IBM DB2, Oracle et Sybase.
IBM
DB2/UDB, Informix XPS et Red Brick
DB2/Universal DataBase est la base de donnes relationnelle d'IBM. En rachetant Informix et son activit bases de donnes, Big Blue a rcupr ses entrepts de donnes multidimensionnels: XPS (datawarehouse), et Red Brick (datamart).
Mme remarque que pour Hyperion, en particulier pour DB2 qui est relativement rpandue. Se renseigner sur les solutions qui peuvent accder nativement aux diffrents SGBD OLAP propritaires d'Informix.
Oracle
Oracle 9i
Mme remarque que pour Hyperion et Microsoft, car Oracle 8i est encore trs rpandue.
Microsoft
SQL Server 2000
La version la plus rcente de la SGBDR (base de donnes relationnelle) de Microsoft. A enrichi ses fonctions OLAP avec Analysis Services. Parmi celles-ci: l'accs direct aux cubes via le web, et une extension data mining.
Mme remarque que pour Hyperion. SQL Server est trs rpandue, mais souvent encore en version 7.0 qui peut aussi tre attaque par la plupart des solutions du commerce qui fonctionnent sous Windows
Sybase
Adaptive Server IQ
114
http://solutions.journaldunet.com/0110/011025_crm_tableau2.shtml
SELECT couleur, SUM(prix) FROM Ventes, Produits WHEREVentes.codeProduit = Produits.codeProduit AND modle = vis GROUP BY couleur
115
SELECT couleur, mois, SUM(prix) FROM Ventes, Produits, Temps WHEREVentes.codeProduit = Produits.codeProduit AND Ventes.date = Temps.jour AND modle = vis GROUP BY couleur, mois
116
SELECT vendeur, mois, SUM(prix) FROM Ventes, Produits, Temps WHEREVentes.codeProduit = Produits.codeProduit AND Ventes.date = Temps.jour AND modle = vis AND couleur = rose GROUP BY mois, vendeur
117
SELECT vendeur, anne, SUM(prix) FROM Ventes, Produits, Temps WHEREVentes.codeProduit = Produits.codeProduit AND Ventes.date = Temps.jour AND modle = vis AND couleur = rose GROUP BY anne, vendeur
118
Problmatique
Chaudhuri et Dayal 97
Supporter des oprations tableur sur des BD de plusieurs GO. Besoins spcifiques
langages de manipulation organisation des donnes mthodes daccs
119
Modle
Forme proche des abstractions de lanalyste Organisation des donnes selon plusieurs dimensions selon diffrents niveaux de dtail en ensemble Donne = point dans lespace associe des valeurs
120