Beruflich Dokumente
Kultur Dokumente
d'intgration de donnes
Dan VODISLAV
Universit de Cergy-Pontoise
Master Informatique M1
Cours IED
Plan
Intgration de donnes
Objectifs, principes, caractristiques
Schmas d'intgration
Intgration de schma
Mapping
Architectures distribues
Architectures k-tiers
Services web
Page 2
Intgration de donnes
Gestion de donnes traditionnelle
Bases de donnes homognes (modle/schma uniques)
Architecture centralise ou distribue, transparente au niveau logique
Objectif gnral : utiliser ces donnes comme si elles constituaient une seule
base de donnes homogne
Page 3
Objectif
Plus particulirement, lintgration de donnes doit fournir
Page 4
Exemple
SQL
tuples OQL objets
SGBD
relationnel
SGBD
objet
Agence
Chaine
de voyage htelire
Moteur de
XQuery
XML recherche
SGBD
Semi-Structur
Site horaire
des vols
HTML
API
instances
Fichiers
Fichiers
Fichiers
texte
texte
texte
Application
Informations
Pays
Mto
Page 5
Enjeux
Dans lentreprise
Donnes disperses dans une grande varit de sources htrognes:
internes lentreprise (protges)
externes, chez des fournisseurs, des partenaires ou des clients
Grand public
Accs simple, rapide et efficace aux informations disponibles sur le web
Page 6
Applications
Donnes dentreprise
Donnes scientifiques
+ le Web !
Page 7
La diffrence
Page 8
Page 9
Distribution
Donnes stockes sur des supports rpartis sur plusieurs sites
Caractristique importante: lchelle
Avantages
Disponibilit: ne tombent pas en panne en mme temps
Temps daccs: partage de la charge, paralllisme
Problmes
Page 10
Autonomie
Conception : les sources dcident de leur propre
modle de donnes,
langage dinterrogation,
smantique des donnes.
Page 11
Htrognit
Concerne les donnes, les modles, les langages,
Systme homogne :
mme logiciel grant les donnes sur tous les sites
mme modle de donnes / langage daccs
mme univers de discours / smantique
Page 12
rponse
Modle global
Donnes
matrialises
Niveau d intgration
Adaptateur1
Modle S1
Source1
Adaptateurn
........
Modle Sn
Sourcen
Page 13
Deux approches
Intgration matrialise
entrept de donnes
Intgration virtuelle
mdiateur
Page 14
Architecture dentrept
Entrept
D1++Dn
D1
Dn
Chargeur1
Chargeurn
........
Source1
Sourcen
Migration de donnes
Page 15
Architecture de mdiation
R=f(R1, , Rn)
Q1
R1
Qn
Adaptateur1
Source1
Rn
Adaptateurn
........
Migration de requtes
Mdiateur
Sourcen
Page 16
Entrept ou mdiateur?
Mdiateur : accs direct aux sources
approche paresseuse , pas de matrialisation
migration de requtes vers les sources
avantages : donnes toujours fraches, plus facile dajouter de nouvelles
sources, plus grande chelle, distribution de leffort
inconvnients : performances, traduction de requtes, capacits
diffrentes des sources
Page 17
Entrepts de donnes
Lapproche la plus populaire dintgration de donnes
Gros avantage: performances
Autre gros avantage: contrle plus facile de lhtrognit des donnes
Page 18
Mdiateurs
Bien que moins utiliss en pratique, ils ont plus de potentiel
Meilleur passage lchelle
Acceptent mieux les changements dynamiques (nouvelles sources)
Page 19
Schmas dintgration
Problmes
Intgration de schma: comment dfinir un schma (modle) global
dintgration partir des schmas (modles) des sources?
Fusion de donnes: comment rendre compatibles, transformer les
donnes en provenance des sources?
Mappings/vue dintgration: comment dcrire le lien entre le schma
global et les schmas des sources?
Page 20
Intgration de schma
Le lien entre schma global et schmas locaux est dfini
travers un mapping (correspondance structurelle)
Schma global M
Schma des sources Si
global as view
local as view
Page 21
Mapping
Mapping = correspondance entre le schma global et les schmas des sources
utilis pour la traduction des requtes et la structuration des rsultats
Diversit
les schmas : relationnel, XML, orient-objet, entit-association
le mapping : couples dlments correspondants, fonctions, contraintes, degrs de
similarit
Objectifs contradictoires
mapping complexe : prcision, pouvoir dexpression
mapping simple : dcouverte automatique, composition, maintenance simplifie
Page 22
Exemples de mapping
S1 : Client
Numro
Socit
Nom
Prnom
S2 : Acheteur
ID
Compagnie
Contact
Tlphone
Ma : Client Acheteur
Client.Numro Acheteur.ID
Client.Socit Acheteur.Compagnie
Client.Nom Acheteur.Contact
Client.Prnom Acheteur.Contact
Mb : Client Acheteur
Client.Numro Acheteur.ID
Client.Socit Acheteur.Compagnie
concat(Client.Nom, Client.Prnom)
Acheteur.Contact
Page 23
Page 24
Architectures distribues
Intgration de donnes
architectures distribues
Page 25
S
S
P
P
Pair pair
Mdiateur
services
P
P
Rparti gnral
Cours IED (UCP/M1): Architectures d'intgration de donnes
Page 26
Applications rparties
Applications rparties
Accs plusieurs ressources / applications individuelles
Sparation entre clients et serveurs
Architectures k-tiers
1-tier : centralis
2-tiers: un serveur, plusieurs clients (client - serveur)
3-tiers: plusieurs serveurs, plusieurs clients (avec middleware)
n-tiers: spcifique la diffusion sur le web
Ex: serveurs web avec architecture 3-tiers + clients web
Clients n-tiers serveurs (n+1) - tiers
Page 27
Architectures
Client
Niveau
prsentation
Client
...
Niveau
prsentation
Client
...
Niveau
prsentation
...
...
Niveau
application
Niveau
application
Niveau
application
Niveau
gestion donnes
Niveau
gestion donnes
Serveur
Middleware
...
Niveau
gestion donnes
...
Serveur
1-tier
2-tiers
3-tiers
Page 28
Communication
Application rpartie communication entre les tiers qui
ralisent des traitements
Moyens de communication traditionnels
Middleware
Page 29
Services web
Sur le web: contraintes qui napparaissent pas dans les
environnements dentreprise
Objectif:
Raliser des applications distribues (architectures k-tiers) avec les
contraintes imposes par le web
services web
Page 30
Web homme-machine
web
web machine-machine
Page 31
Web machine-machine
Web dynamique homme-machine
HTML + HTTP + scripts
Scripts: tches excutes par un serveur web
HTML: contenu gnr dynamiquement par les scripts
HTTP: utilisation manuelle travers un navigateur web
Interface informelle
Paramtres de type texte
Rsultat: HTML
Web machine-machine
XML + SOAP + code
Code: programme/fonction appel distance
XML: format dchange gnral
SOAP: utilisation par des programmes (automatique)
Page 32
Page 33
Page 34