Beruflich Dokumente
Kultur Dokumente
U N I V E R S I T
D E
F R A N C H E - C O M T
! Laurent MOALIC
Soutenue le : 12/12/2013
A Belfort
Jury
Rapporteur
Rapporteur
Examinateur
Directeurs de thse
1.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.2
11
1.2.1
12
1.2.2
16
1.2.3
17
1.3
1.4
. . . . . . . . . .
28
1.3.1
. . . . . . . . . . . . . .
29
1.3.2
29
1.3.3
33
Synthse et perspectives . . . . . . . . . . . . . . . . . . . . . . . . .
36
39
2.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
2.2
41
2.2.1
. . . . . .
41
2.2.2
45
46
2.3.1
47
2.3
ii
2.5
II
55
Rsultats et analyse . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
2.4.1
Environment danalyse . . . . . . . . . . . . . . . . . . . . . .
58
2.4.2
60
2.4.3
Exprimentation et rsultats . . . . . . . . . . . . . . . . . .
63
2.4.4
70
2.4.5
73
Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
77
79
3.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
3.2
81
3.2.1
Optimisation mono-objectif . . . . . . . . . . . . . . . . . . .
81
3.2.2
82
3.2.3
82
3.2.4
83
3.2.5
85
87
3.3.1
87
3.3.2
87
3.3.3
92
3.3.4
93
3.3.5
3.3
3.5
iii
3.4.2
3.4.3
3.4.4
Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
111
4.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2
4.3
4.4
4.5
4.2.1
4.2.2
4.2.3
4.3.2
4.3.3
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.4.2
4.4.3
4.5.2
iv
4.6
4.7
4.5.3
4.5.4
4.5.5
4.6.2
4.6.3
4.6.4
Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
171
175
Bibliographie
177
52
2.2
53
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
144
11
1.2
13
1.3
14
15
16
1.6
19
1.7
1.8
. . . . . . . . . . . . .
21
1.9
27
1.4
1.5
28
31
32
35
2.1
40
2.2
Maillage et PPC . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.3
Couverture radio . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.4
44
2.5
44
2.6
47
viii
2.7
48
2.8
Organisation du sursol . . . . . . . . . . . . . . . . . . . . . . . . . .
49
2.9
51
55
57
58
59
60
61
62
63
67
68
68
69
71
2.25 Signature Territoriale pour les zones priurbaines - pour deux mardis
et jeudis diffrents . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
ix
3.1
82
3.2
86
3.3
88
3.4
89
3.5
90
3.6
92
3.7
95
3.8
Indicateur hypervolume IH
3.9
4.1
4.2
4.3
4.4
4.5
4.6
4.7
Equilibre des flux entrants / flux sortants linstant t pour la station s132
4.8
4.9
. . . . . . . . . . . . . . . . . . . . . . . 106
. . . . . . . . 131
NSGA-II . . . . . . . . . . . . . . . . . . . . . .
PLS . . . . . . . . . . . . . . . . . . . . . . . .
HSO : Hypervolume by Slicing Objectives . . .
Algorithme mmtique gnrique MOGLS . . .
NSGA-II . . . . . . . . . . . . . . . . . . . . . .
Local Search : FIHC . . . . . . . . . . . . . . .
MEMO . . . . . . . . . . . . . . . . . . . . . .
Fast Local Search for Multiobjective Problems .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
95
99
107
114
118
122
124
146
Introduction gnrale
Contexte
Ce travail de thse sest droul sous la tutelle du laboratoire FEMTO de lUniversit de Franche-Comt.
Les problmes de transport et la recherche oprationnelle (RO) constituent deux
domaines souvent lis. De nombreux problmes cits en rfrence au sein de la communaut RO concernent en effet des applications lies au transport, telles que les
problmes de tournes de vhicules ou encore les problmes de logistique urbaine.
Rciproquement, en matire de transport, de nombreuses dcisions sont prises en
sappuyant sur des outils doptimisation, tel que pour planifier laffectation des bus
et chauffeurs lors du graphicage de lignes de bus. Ce lien troit sexplique essentiellement par deux aspects. Dune part, en matire de transport les problmes sont
souvent trs complexes. Il y a gnralement de nombreuses donnes prendre en
compte et lespace de recherche est immense tant il y a de solutions potentiellement
ralisables. Cest le cas par exemple avec les problmes de tournes de vhicules o
la taille de lespace de recherche crot de faon exponentielle avec le nombre de sites
visiter. Dautre part, les problmes de transport ont des consquences financires
considrables. Les investissements en jeu en matire de construction dinfrastructures routires par exemple, ou de dploiement de services de transport en commun,
slvent trs rapidement plusieurs millions deuros.
De ce lien troit entre transport et recherche oprationnelle nous identifions
deux enjeux majeurs qui doivent permettre daboutir une prise de dcision. Le
premier concerne lidentification des besoins, quelle demande doit-on rpondre. Le
deuxime concerne la rponse apporter, quelle solution doit-on retenir et mettre
en oeuvre. Chacun de ces enjeux est abord dans ce mmoire de thse : le premier,
travers une nouvelle approche qui permet dapprhender les besoins en matire
de service de mobilit ; le deuxime travers de nouveaux outils et algorithmes
doptimisation et daide la dcision.
Motivations et objectifs
Llaboration de modles permettant didentifier la faon dont les personnes se
dplacent sur un territoire doit constituer un lment de rponse essentiel au premier
enjeu. En effet, des modles mme de reflter les besoins en services de mobilit
au cours de la journe et dun jour lautre font partie intgrante du processus
Introduction gnrale
Introduction gnrale
intressante. On distingue deux niveaux dheuristiques selon leur aptitude tre gnralises. Les heuristiques simples et les mtaheuristiques. Les heuristiques simples
sont ddies un problme et nont pas vocation tre gnriques, mme sil est
parfois possible de les adapter dautres types de problme. Les mtaheuristiques
dfinissent un cadre gnral qui leur permet dtre appliques plusieurs types de
problme. Les algorithmes gntiques et les Recherches Tabou font partie de cette
classe.
Par ailleurs, il est frquent que les problmes rassemblent plusieurs objectifs
optimiser simultanment, gnralement contradictoires entre eux. Loptimisation
multiobjectif sadresse ce type de problme en proposant diffrentes approches, par
transformation du problme en un problme mono-objectif par exemple. Mais les
algorithmes les plus efficaces prennent en considration toutes les fonctions objectif
simultanment travers les approches dites Pareto. Le rsultat de ces approches
est alors non pas une solution unique, qui soit la meilleure pour tous les objectifs,
mais un ensemble de solutions de meilleur compromis. Une telle prise en compte
de diffrents objectifs en mme temps entraine bien entendu une complexit accrue.
Une des principales difficults rencontres avec ce type dapproches vient du fait que
cet ensemble nest pas connu lorsque lon aborde un problme rel et cest le cas du
problme de transport que nous avons trait.
Dans le cadre de ce mmoire de thse, nous nous intressons la chaine complte
qui permet de guider une dcision multicritre dans le domaine de lamnagement du
territoire et du transport. Nous traitons ainsi les deux phases principales impliques
dans le processus de dcision : la modlisation des dplacements de la population en
sappuyant sur la tlphonie mobile dune part, et llaboration dune mtaheuristique hybride pour rsoudre un problme doptimisation multiobjectif dautre part.
Les traces que laissent les tlphones portables peuvent tre vues comme des empreintes lectromagntiques. Nous proposons dans ce travail dexploiter ces donnes
pour construire une information sur la faon dont la population se rpartit dans
lespace et dans le temps. Puis laccent est mis sur la rsolution du problme de la
localisation de stations pour un service dauto-partage lectrique en contexte multicritre. Nous prsentons en particulier la dmarche qui nous a permis de modliser
le problme puis de concevoir une heuristique nouvelle, mlant thorie volutionnaire et recherche locale travers llaboration dun algorithme mmtique. Les
deux phases principales de modlisation et doptimisation ont t exprimentes et
valides dans un contexte rel.
Organisation du mmoire
Ce mmoire de thse est organis en deux parties, organises autour des deux
enjeux prsents. Chaque partie est compose de deux chapitres que nous prsentons
Introduction gnrale
brivement.
Introduction gnrale
combinatoire hybride incorporant une recherche locale dans un schma volutionnaire en contexte multiobjectif. Les principales caractristiques des algorithmes mmtiques sont dans un premier dcrites. Puis nous dveloppons lalgorithme propos
en montrant comment les oprateurs gntiques et la recherche locale sarticulent.
Une phase dexprimentation est alors propose pour rsoudre le problme de localisation de stations pour un service dauto-partage lectrique, que nous avons formalis
sous forme dun problme doptimisation multiobjectif combinatoire. Les rsultats
obtenus sont compars aux rsultats issus de trois autres algorithmes. Enfin, la dernire partie de ce chapitre prsente la plate-forme daide la dcision geoLogic que
nous avons dveloppe notamment pour le problme de lauto-partage.
Ce mmoire se termine par une conclusion qui revient sur les principales contributions apportes dans cette thse. Finalement, une ouverture est propose avec la
prsentation de plusieurs perspectives qui nous semblent particulirement intressantes poursuivre.
Premire partie
Modlisation dynamique de la
densit de population via les
rseaux cellulaires
Chapitre 1
Ce chapitre permet de situer le contexte dans lequel sinscrit cette premire partie de notre mmoire de thse, savoir la modlisation dynamique de la mobilit.
En effet, pour situer la contribution apporte dans le chapitre suivant, ce chapitre
prsente dabord un chantillon reprsentatif de modles existants sous forme dune
taxinomie : alatoires, dterministes, ou hybrides. Laccent sera mis sur les modles
hybrides, qui apportent le meilleur niveau de ralisme et sapparente de fait au modle que nous proposerons dans le chapitre 2. Puis, sur la ligne de nos travaux,
les rcentes contributions de la littrature qui utilisent la tlphonie mobile comme
marqueur de mobilit sont prsentes.
Sommaire
1.1
1.2
Introduction . . . . . . . . . . . . . . . . . . . . . . .
Taxinomie des modles . . . . . . . . . . . . . . . . .
1.2.1 Modles de mobilit alatoires . . . . . . . . . . . .
1.2.2 Modles de mobilit dterministes . . . . . . . . . .
1.2.3 Modles de mobilit hybrides . . . . . . . . . . . . .
1.3 Cas de la tlphonie comme marqueur de mobilit
1.3.1 Le projet CAPITAL [Systems 1997] . . . . . . . . .
1.3.2 Les travaux du MIT : une source de rfrence . . . .
1.3.3 Autres travaux utilisant la tlphonie mobile . . . .
1.4 Synthse et perspectives . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
11
12
16
17
28
29
29
33
36
10
1.1
Introduction
Une connaissance prcise de la faon dont la population se dplace sur un territoire apparait aussi complexe dterminer que primordiale. Les modles de trafic
et plus gnralement de mobilit dvelopps au cours de ces soixante dernires annes reposent sur diverses thories, impliquant notamment la prise en compte des
activits ralises au cours de la journe ou encore loccupation du sol.
A lorigine, les besoins en infrastructures trs coteuses, construites dans le cadre
de projets long terme, ont pouss les collectivits disposer de prvisions de trafic.
Selon les besoins, diffrents modles ont t proposs. A lchelle macroscopique,
un flux entre deux villes (trafic interurbain) peut tre estim par un modle dit
"gravitaire" [PREDIT 1999]. Ds lors que lon sintresse du trafic intra-urbain,
un niveau de complexit plus important est intgrer. Dautre part, les priorits
en termes durbanisation voluent en fonction des contextes conomiques, sociaux
et environnementaux. Ces modles ont d tre affins et repenss pour rpondre
cette complexit dune urbanisation instable.
Cest tout dabord aux tats-Unis dans les annes 1950, avec lapparition de
linformatique, que les premiers modles capables de reprsenter le trafic urbain
sont labors [PREDIT 1999]. Apparat alors une premire gnration de modles,
dits modles "classiques" ou " 4 tapes". Ils permettent de raliser une prvision
de trafic suivant une procdure linaire dcoupe en quatre tapes : la gnration,
la distribution, le choix du mode et laffectation. Ils sont calibrs pour une ville
dtermine partir de donnes de comptages. Par leur approche agrge, ces modles
permettent des prvisions globales de trafic entre groupements de zones, notamment
aux heures de pointe, afin de dimensionner les infrastructures et ainsi planifier les
investissements.
Les besoins en planification court terme ont donn naissance une approche
"dsagrge" base de plus en plus sur lindividu ou sur le mnage. Des volutions
du modle classique en ce sens ont donc t proposes. Mais pour aller plus loin, ces
nouveaux modles dsagrgs galement appels " choix discret", sont capables de
prdire le mode de dplacement au niveau individuel. Ces derniers sont calibrs
partir denqutes de plus en plus fines.
Dans ce chapitre, on se propose de parcourir les principaux modles de mobilit
rencontrs dans la littrature, qui en fonction de leurs caractristiques permettent
de rpondre des enjeux de nature diverse. Les modles seront prsents autour
dune taxinomie en trois familles : les modles alatoires, les modles dterministes,
et les modles hybrides. Alors que les modles alatoires sont gnralement apprcis
pour leur simplicit, ds lors que le niveau de ralisme souhait devient un critre
prpondrant les modles hybrides sont prfrs. Outre les modles classiques, une
tendance trs rcente vise utiliser la tlphonie mobile pour en dduire une infor-
11
mation de rpartition de la population sur un territoire. Bien quil ny ait pas encore
de modles proprement parler dans les travaux prsents dans la littrature, il y
a l une nouvelle source de donnes trs fort potentiel. Aussi, nous introduirons
travers plusieurs projets les travaux ayant t effectus ces dernires annes sur
cette thmatique. Cela permettra de positionner notre approche qui sera prsente
dans le chapitre suivant.
Ce chapitre est organis autour de deux sections principales. La premire sera
consacre lnumration et lexplicitation des diffrents modles rencontrs dans
la littrature, des plus arbitraires o lalatoire joue un grand rle, aux plus ralistes tenant compte du type de mobile, de la gographie ainsi que des activits des
personnes. La deuxime section permettra de recenser de faon prcise les travaux
ayant port sur lutilisation de la tlphonie mobile pour en dduire une information
sur la faon dont les utilisateurs de portables se dplacent.
1.2
12
Ces modles demeurent peu ralistes du fait quil est peu probable que les mobiles
se dispersent alatoirement dans tout un secteur comme un btiment ou une ville.
A lchelle individuelle, les trajectoires sont compltement chaotiques et traduisent
des "stop and go" irrels. Les paramtres de mouvement changent constamment au
cours dune simulation, produisant un dplacement alatoire. Par contre, lchelle
de masse ces incohrences peuvent tre masques. Ce type de modlisation pourrait rvler et prvenir des situations plausibles sur lesquelles un dcideur devrait
sinterroger.
Les modles dterministes reprsentent les traces relles de chaque mouvement
de personnes dans une zone de simulation. Ces modles gnrent des trajectoires
ralistes mais ne sont valables que dans les zones tudies et refltent la ralit avec
un certain degr de rptitivit. La traabilit de ces trajectoires implique beaucoup
de moyens sur le terrain, comme lacquisition de donnes partir denqutes, de
comptages de passages des endroits cls, de questionnaires, etc.
Concrtement, le dplacement des personnes nest ni totalement alatoire, ni
toujours le mme. Nos dplacements suivent un certain schma tout en conservant un
degr de libert. Ainsi un compromis doit tre trouv entre le totalement alatoire,
et la combinaison dterministe de traces. Cest ce quapportent les modles hybrides
qui visent se rapprocher au mieux des dplacements ralistes.
1.2.1
Ces modles ont t introduits notamment pour raliser des simulations de fonctionnement de rseaux mobiles. Ils ont servi laborer des scnarii de mobilit
afin destimer les cellules radio visites par un usager [Jeon 2000], [Akyildiz 2000],
[Akyildiz 1996], [Ho 1995]. De tels modles peuvent tre appliqus sur un axe (1D)
ou dans le plan (2D), selon les cas envisags. En particulier, pour simuler les dplacements le long dune route, la version 1D sera privilgie. Dans ce cas chaque cellule
est connecte deux voisins : un prcdent et un suivant. Ds quon sintresse aux
mouvements de pitons par exemple, caractriss par des changements de direction
frquents, un modle 2D est envisager. Dans ce cas, chaque cellule dispose de 4
voisins (cellules carres) ou 6 voisins (cellules hexagonales).
1.2.1.1
Dans ce modle de mobilit dcrit dans [Camp 2002], un mobile se dplace vers
une destination avec un angle et une vitesse prises de faon quiprobable entre
des valeurs minimales et maximales. Chaque mouvement seffectue sur un intervalle
de temps constant. Les valeurs dangle et de vitesse sur un intervalle de temps
tant indpendantes de celles de lintervalle prcdent, ce mouvement traduit des
13
changements brusques dangle et de vitesse, ce qui est peu raliste. A chaque instant,
le mobile se dirige donc vers une cellule voisine avec une probabilit p, ou reste dans
la mme cellule avec une probabilit (1 p).
1.2.1.2
Plusieurs auteurs utilisent ce modle dans le cadre 1D [Burulitisz 2004], ou encore [Bar-Noy 1994]. Il est une extension du "Random Walk", dcrit par le diagramme dtat Figure 1.3 et une matrice 3x3 de probabilit de transition :
q 1qv v
P = p
1 2p
p
v 1qv q
(1.1)
Daprs le diagramme dtat, un usager peut tre dans lun des trois tats suivants (Figure 1.3) :
L : tat de dplacement vers la gauche partir de la cellule courante
R : tat de dplacement vers la droite partir de la cellule courante
S : tat stationnaire (reste dans la cellule courante)
14
1.2.1.3
Voici une autre extension du "Random Walk", qui tient compte cette fois du
mouvement prcdent pour dterminer le mouvement courant. Ce modle intgre
le fait que la plupart des dplacements rels suivent soit le chemin le plus court
pour rejoindre sa destination, soit une route pseudo-linaire entre lorigine et la
destination [Tsai 1999].
Un angle de rotation dtermine une des six directions possibles dune cellule
hexagonale. La probabilit associe cet angle est distribue selon une loi normale
avec une moyenne de 0et un cart-type variant de [5,90] : N(0, 2 ). Ainsi cette
loi favorisera les dplacements rectilignes tout en acceptant des courbures de trajectoire [Tsai 1999][Tuan 2003]. La Figure 1.4 montre trois exemples de trajectoires
pour diffrentes valeurs de pouvant caractriser trois environnements diffrents
(rural, suburbain, urbain). Il est ainsi constat que plus est petit, plus les trajectoires seront douces, linaires et surtout tendues sur de plus grandes zones.
15
Figure 1.4 Trois trajectoires de 2000 pas du modle "Normal Walk" pour
=15,30 et 60 (extrait de [Tuan 2003])
1.2.1.4
Ce modle est semblable au Random Walk Mobility, mais il intgre des temps
de pause entre les instants de changements dangle et de vitesse. Il est beaucoup
utilis dans la communaut des rseaux Ad hoc [Bettstetter 2003] et est implment
dans une large majorit de simulateurs MANET (Mobile Ad hoc NETworks). A
linitialisation chaque mobile est positionn alatoirement. Une destination de la
zone de simulation ainsi quune vitesse de dplacement V [Vmin , Vmax ] sont galement choisies alatoirement. Au point de destination, le mobile y reste un certain
temps t [tmin , tmax ], puis un nouveau couple (destination, vitesse) est choisi,
sans aucune corrlation avec les valeurs prcdentes. A tout moment un mobile est
dcrit par sa position (x(t), y(t)), sa vitesse courante V (t) et son point de destination
courant (xd (t), yd (t)).
Ce type de modle est galement tendu pour simuler des dplacements de
groupes de noeuds formant un rseau PAN (Personal Area Networks) [Cano 2004a]
[Cano 2004b] [Hong 1999]. Ceux-ci exploitent le concept de "piconets", qui sont de
petits rseaux, normalement constitus dau plus 8 noeuds, o un des noeuds est le
matre dans la topologie.
16
1.2.1.5
1.2.2
17
part et darrive des dplacements, ainsi que le motif (travail, scolaire, accompagner
quelquun, achats, loisirs, retour chez soi).
Des matrices sont ralises pour reflter la dure des activits lies chaque
dplacement, ainsi que les transitions entre activits. Ces matrices dfinissent le
comportement obtenu lors du processus de simulation.
Bien que lauteur mette en avant lintrt dun tel modle, le travail demand
est particulirement fastidieux, ce qui limite sa porte.
1.2.3
Bien que les modles alatoires et dterministes fournissent des trajectoires plausibles, ils restent loigns des dplacements rels ou sont trs coteux construire
et ne peuvent pleinement tre utiliss pour laborer des politiques damnagement,
en matire de transport par exemple. Les modles de mobilit hybrides rpondent
cette exigence, en combinant mouvements alatoires et rgularit de dplacements.
1.2.3.1
Les modles prsents ici permettent de reproduire les principales caractristiques des mouvements de personne. Ils sont largement utiliss dans les modles de
mobilit dits "intgrs" prsents section 1.2.3.2.
Fluid flow model : Il sagit de modles qui sappuient sur des thories physiques
issues de lhydrodynamique [Lam 1997]. Laccent nest pas mis sur le dplacement
individuel mais au contraire sur une analyse du nombre moyen de personnes traversant la rgion tudie.
Ces modles sont particulirement utiliss pour des tudes de transport, afin
didentifier le taux dutilisation dun axe routier [Markoulidakis 1997]. Dans ce modle les mobiles appartenant un mme flux suivent la mme direction la mme
vitesse. Ce type de modles a galement t utilis pour tudier limpact du trafic
autoroutier sur les rseaux mobiles [Lizee 2001], lors dun ralentissement d un
accident par exemple.
Gravity model : L encore il sagit de modles directement inspirs de la physique. Cette famille de modles est trs souvent utilise dans les modles "intgrs"
pour simuler les dplacements entre diffrentes rgions gographiques. Un des avantages lis ces modles est quils permettent de simuler des flux diffrentes chelles,
18
Ti,j = ki,j Pi Pj
(1.2)
1.2.3.2
19
Le modle global a ainsi permis de simuler les transferts intercellulaires alors que le
modle local sattachait simuler les mobilits intracellulaires.
On notera que dautres modles de complexit variables ont t proposs, tels
que [Erbas 2001, Erbas 2002] qui intgrent dans leurs modles une prdiction des
dplacements venir. Ils sappuient pour ce faire sur laspect rgulier et rptitif de
nos dplacement dun jour lautre.
Figure 1.6 Squence de cellules dun profil usager (extrait de [Erbas 2001])
Ces algorithmes laissent entrevoir les possibilits que peut apporter la tlphonie
mobile pour caractriser les dplacements des personnes.
1.2.3.3
20
(1.3)
21
1.2.3.4
Le modle 4 tapes
Le modle quatre tapes est le modle "classique" des tudes de trafic. Dans
[Bonnel 2002] ce modle est longuement dvelopp et chacun de ses composants est
analys. Il sagit dun modle qui est utilis dans de nombreux projets de simulation
de flux. Contrairement aux modles habituels, il sagit ici plutt dun schma gnral
suivre. Son application suppose dans un premier temps de diviser le secteur dtude
en diffrentes zones gographiques ou logiques, gnralement partir de donnes
socio-conomiques, permettant dagrger les diffrentes donnes. Ce modle dcrit
les quatre tapes principales que nous rappelons succinctement.
La gnration : Cette premire tape a pour but de dterminer le nombre de
dplacements, cest--dire quantifier les flux entre les diffrentes zones. Il sagit donc
de savoir si les individus se dplacent ou non et si oui dans quelles zones. On cherche
alors modliser ces choix en se plaant du point de vue dune zone. On obtient
alors dune part, lensemble des dplacements mis par une zone donne et dautre
part lensemble des dplacements dont la destination se situe dans cette mme zone.
On parle alors dmission et dattraction dune zone qui constitue la gnration. Ce
nombre de dplacements entrants ou sortants est fonction de nombreux paramtres,
notamment les caractristiques doccupation du sol des zones : les services, la population, lemploi, etc. Il y a deux moyens de calculer les missions et attractions
par zone : une mthode statistique (rgression linaire) ou une utilisation de taux
22
23
les premiers modles ont une approche agrge et plutt dterministe. Orients automobile aux tats-Unis, ils subissent de lgres adaptations pour rpondre au besoin
grandissant du transport en commun dans les grandes villes de France, qui continueront cependant lexploiter dans sa dimension agrge. Le modle GLOBAL
[RATP 2010] de la RATP est ainsi conserv (modle classique 4 tapes agrg). Il
correspond la zone dtude Rgion Ile-de-France et sud de lOise.
Par la suite les modles dsagrgs ont permis de tenir compte de lhtrognit
des comportements individuels. En effet, il existe plusieurs manires de modliser
les individus des chelles diffrentes en fonction des besoins. Pour comprendre,
lchelle microscopique, qui correspond au niveau de dsagrgation maximum,
on sintresse lindividu et au dtail qui le caractrise. On parle alors de donnes
dsagrges. Une chelle intermdiaire consiste en une agrgation des donnes prcdentes suivant des caractristiques individuelles communes (classe sociale, modalits
identiques, agrgation gographique, etc.). A lchelle macroscopique, on sintresse
alors une population entire (nombre total de dplacements, moyenne dge, etc.).
Il est donc intressant de constater que les niveaux dagrgation peuvent soprer diffrents niveaux ou modules et peuvent tre de plusieurs types (agrgation
temporelle, agrgation gographique, etc.). Daprs les recherches et les exemples de
modles trouvs il nest pas dmontr quun niveau dagrgation soit meilleur que
les autres, par contre il est tabli qu chaque niveau dagrgation, le modle perd en
consistance mais gagne en stabilit. On peut alors envisager pour toutes les phases
dun modle quatre tapes dutiliser au choix des donnes agrges ou dsagrges
en fonction de lutilit finale du modle.
Ainsi par rapport au modle classique agrg, quelques amliorations ont t
apportes par une approche plus dsagrge dans les diffrentes tapes dcrites prcdemment [Nguyen-Luong 2000a]. On parlera alors de modle quatre tapes hybrides (ex : logiciels EMME2, MINUTP ou TRIPS utiliss en France) par opposition
au modle quatre tapes classique. De plus en plus, les diteurs prsentent souvent
une suite de logiciels adaptables et modulaires (un module pour la gnration, un
pour laffectation, etc.). De mme une suite de logiciels base sur un modle statique
agrg peut comporter des modules dynamiques dsagrgs.
En ce qui concerne les amliorations dans la gnration, il faut trouver le bon
compromis, entre un systme entirement dsagrg dans lequel chaque demande
de dplacement est tudie individu par individu pour tre additionne sur une
population la fin du processus, et un systme agrg dans lequel tous les individus dans une zone sont supposs tre moyens. Daprs le rapport de lIAURIF
[Nguyen-Luong 2000b], il semble que la segmentation de march soit un compromis
trs intressant lorsquon ne dispose pas de moyens de dvelopper un modle dsagrg. Cest une approche par exemple exploite dans le logiciel VISEM-DAVISUM
(PTV). Cependant elle se trouve vite limite en termes de prvisions dans le temps
24
25
1.2.3.5
Daprs les recherches, les comportements de mobilit reposent sur des composantes sociales et des contraintes spatio-temporelles, do la notion despace-tempsactivit. Si lapproche classique tendait rduire la mobilit un simple dplacement, lapproche activit-centre quant elle, base sur lactivit individuelle, introduit la complexit relle du dplacement au niveau de lindividu. Elle impose une
segmentation plus dtaille de lactivit et un traitement plus labor des dcisions
de dplacement et des lieux associs.
Les comportements humains sont individuellement modliss en reprsentant la
faon dont chaque individu choisit entre plusieurs options suivant ses perceptions
propres (prfrence, habitude, incertitude, alternative, limite de temps ou dargent,
manque dinformation, etc.). Les donnes dentres sont obligatoirement de plus en
plus fines.
Les modles de transport bass sur lactivit sont en dveloppement dans plusieurs pays et sont gnralement considrs comme les modles de transport du futur
(URBANSIM).
Par ailleurs, ce nouveau modle de demande permet de simuler une chane de
dplacements ou plus exactement une suite dactivits (changement dtat des individus un autre) et savre donc intressant dans la modlisation microscopique de
la mobilit urbaine pour notre cas dtude. On distingue 2 types de reprsentations
pour les suites dactivits, les suites temporelles et les suites vnementielles.
Les disparits avec le modle classique sont nombreuses et peuvent tre rsumes
comme suit (cf. p8 [PREDIT 2007]) :
26
Objectif du modle
Unit dobservation
gographique
Unit dobservation
du dplacement
Sources de donnes
Interaction donnes
socio-conomiques et
dplacements
Rsultats des analyses
Modle 4 tapes
Prvisions de trafic pour planifier les investissements
Approche agrge : groupement
dilots ou communes
Lorigine et la destination sont
prises en compte
Les donnes socio-conomiques
proviennent denqutes varies :
recensement (RGP), enqute
transport (ETC), Enqutes Mnages/Dplacements
(EMD),
enqutes cordon.
Relation indirecte entre les donnes de population et de trafic
Modle activit-centre
Comprendre les comportements
de dplacement
Approche dsagrge lchelle
de lindividu ou du mnage
Dcomposition en squences
dactivits
Ncessite des donnes sur les
activits individuelles partir
denqutes ralises localement
(EMD)
1.2.3.6
Kim & al. proposent un modle de mouvement 3D dans des immeubles avec cage
descalier [Kim 1998] et avec ascenseurs [Kim 2000].
Les usagers se dplacent de faon rectiligne sur un tage jusqu ce quils changent
de direction (gauche, droite, arrire suivant une distribution de Poisson) puis continuent tout droit, ainsi de suite. Si le point o ils tournent est dans la zone de cage
descalier ou dascenseur, les abonns bougent horizontalement ou verticalement
selon certaines probabilits. La vitesse du dplacement horizontal ou vertical est
uniformment rparti entre [0, Vmin ] et [0, Vmax ] respectivement pour les pitons.
Tian & al. [Tian 2002] proposent un modle de mobilit bas sur les graphes. Un
centre ville est approxim par un graphe, dont les sommets reprsentent les lieux
frquents par les usagers et les arcs les connexions entre ces lieux. Les mouvements
des usagers sont donc limits aux arcs entre les sommets. Chaque sommet a le
mme poids, cest--dire quaucun point nest plus attractif quun autre pour lusager
mobile.
Les sommets origine et destination de chaque mobile sont choisis alatoirement.
27
28
peut tre trs complexe pour les systmes radio-mobiles couvrant des zones gographiques trs largies. Des niveaux de hirarchisations pourraient tre envisags
suivant le type et la taille des zones tudier.
Pour information, Jardosh & al. [Jardosh 2005] proposent lutilisation des mmes
modles de mobilit alatoire (RWP...) pour les rseaux Ad Hoc, bass cette fois sur
un graphe de Vorono afin de dfinir les chemins rels entre obstacles physiques.
Figure 1.10 Terrain simul par un graphe de Vorono (extrait de [Jardosh 2005])
1.3
29
dans lespace et dans le temps des socits urbaines. Contrairement au principe des
applications de type Location Based Services (LBS) [Ahas 2005], ici on ne sadresse
pas directement lutilisateur du mobile. Il sagit donc dexploiter les donnes tlphoniques sans intervention de lutilisateur, en observant uniquement le fonctionnement du rseau lui-mme.
Depuis 2006, plusieurs travaux de recherches ont ainsi t mens pour exploiter
les informations qui transitent en permanence par les rseaux de tlcommunications
afin dobserver les mouvements de la ville diffrents moments de la journe. Alors
que pendant longtemps un des principaux freins lutilisation de cette source de
donnes tait la difficult daccs aux donnes elles-mmes, la libralisation actuelle
des donnes notamment au travers de lOpen Data, incite (bien que trs timidement
encore !) les oprateurs mettre disposition certaines informations sur la faon
dont leur rseau est utilis. La localisation obtenue est bien moins prcise quavec
un GPS, cependant la masse de donnes lie la prsence gnralise des relais
tlphoniques et au grand nombre dutilisateurs permet denvisager une exploitation
trs pertinente.
1.3.1
1.3.2
Le laboratoire SENSEable City du MIT publie les premiers rsultats de visualisation dynamique de la mobilit partir des tlphones portables en 2006. Les
techniques dtude de la mobilit ont ainsi t dveloppes et exprimentes dans
des contextes varis de diffrentes villes travers le monde. A lorigine de ces travaux un architecte italien, Carlo Ratti, un passionn des interactions pouvant exister
entre la ville et les nouvelles technologies. Nous citons ci-aprs une suite de travaux
mens au MIT sur ce sujet.
30
1.3.2.1
1.3.2.2
A la mme priode que le projet men Milan, le MIT prsente le projet Real
Time Rome la Biennale de Venise. Il sagit de lun des premiers exemples dun
systme de surveillance urbaine temps rel qui permet de cartographier les dplacements des tlphones portables en y ajoutant dautres donnes de mobilit issues des
rseaux de transport (bus et taxis). Les projections issues de ce travail fournissent
un point de vue sur le fonctionnement de la ville de Rome, dun point de vue gographique et socio-conomique. Les cartes projetes lors cet vnement permettent
de montrer :
la rpartition de diffrents groupes sociaux dans la ville tels que les touristes
et les rsidents
loccupation des zones de la ville et le dplacement des personnes dans les
zones pendant les vnements spciaux
les endroits les plus attractifs Rome
le niveau de corrlation entre la distribution du transport public (taxi, bus)
et la densit de la population
La Figure 1.11 propose une illustration de ce qui est observable. La couleur
jaune reprsente les lignes autobus et la couleur rouge correspond la densit de
population en temps rel.
Quelques annes aprs, Calabrese et al. [Calabrese 2009] ont enrichi les rsultats
de 2006 travers le projet WikiCity. Les donnes utilises dans WikiCity sont :
localisation des bus et taxis par GPS
bruit de la circulation (traffic noise) partir de capteurs sans fil installs
Rome
intensit du trafic (traffic intensity)
densit des touristes obtenue partir de lanalyse de lIMSI des utilisateurs
localiss
densit des pitons obtenue partir des donnes de localisation des utilisateurs
supposs marcher faible vitesse
vitesse des vhicules
31
1.3.2.3
32
1.3.2.4
Il sagit dun projet ralis en collaboration avec SMART (Singapore MIT Alliance for Research and Technology). Les rsultats ont t prsents lors dune exposition organise au "Muse dArt de Singapour" en 2011. Lobjectif de ce travail
est le dveloppement dune plate-forme qui permette de visualiser lactivit de la
ville de Singapour, dans un contexte dynamique et fonctionnant en temps rel. La
Figure 1.12 montre les diffrentes vues proposes dans ce projet. A gauche se trouve
une cartographie de la temprature. La temprature dans les villes est gnralement
plus leve qu la campagne, et plus il fait chaud, plus le recours la climatisation
est important, et donc plus il y a de production de chaleur. Cette image permet
de se rendre compte des lieux les plus chauds et les plus nergivores. On aperoit ensuite une carte isochrone qui permet, en fonction du moment de la journe,
didentifier les lieux o lon peut se rendre par dure de trajet (en 5min, en 10min,
etc.) La troisime vue rend compte du taux dutilisation de la tlphonie mobile.
Lintensit de chaque maille traduit le niveau dutilisation des tlphones. La vue
suivante traduit le taux dutilisation des taxis, selon les lieux mais aussi selon la
pluviomtrie. Lavant-dernire illustration montre les changes de fret, en bateau et
en avion, entre Singapour et lensemble du monde. Enfin, la dernire vue permet de
se rendre compte des rpercutions que peut avoir un vnement comme le Grand
prix de Singapour sur la faon dont la population se dplace et utilise son tlphone
portable.
33
1.3.2.5
Dautres contributions...
Afin dtre complet on citera encore quelques travaux mens par le MIT, et
ouvrant des pistes intressantes dans le domaine :
Etude des choix modaux en matire de transport partir des donnes tlphoniques croises avec des donnes de transport [Holleczek 2013]
Estimation de lerreur faite lors de lutilisation des mobiles pour identifier les
trajectoires des utilisateurs [Hoteit 2013]
Proposition dune mthodologie permettant dutiliser les donnes tlphoniques appliques aux problmes de transport [Calabrese 2013]. Cette mthodologie comprend les filtres appliquer aux donnes issues de millions dutilisateurs pour donner un maximum de pertinence aux rsultats. La validation
propose repose sur une comparaison entre la mobilit dduite du modle et
des mesures odomtriques ralises par linspection de la scurit de la rgion
concerne.
1.3.3
1.3.3.1
Une tude grande chelle est ralise par Gonzalez et al. [Gonzalez 2008],
publie en 2008 dans Nature. Elle portait sur ltude des dplacements de 100.000
personnes anonymes partir de leurs tlphones mobiles durant 6 mois. Chaque fois
quun utilisateur a mis ou reu un appel ou un SMS lantenne de rattachement
a t enregistre. Ceci a permis de reconstruire les dplacements quotidiens de ces
personnes. Par ailleurs 206 tlphones ont t enregistrs toutes les 2 heures durant
une semaine. Cette tude a permis de constater et de quantifier le haut degr de
rgularit de la faon dont les gens se dplacent, tant dans lespace que dans le
temps.
1.3.3.2
Suite la premire tude de 1994 avec le projet CAPITAL, quelques travaux ont
t faits pour tenter de construire de linformation sur le trafic routier en temps rel
[Pan 2006][Steenbruggen 2011][Caceres 2012]. Cette nouvelle approche applique
linfotrafic a notamment t utilise pour quantifier le flux quengendre un vnement
tel quun concert [Reades 2007][Calabrese 2010].
34
1.3.3.3
Les travaux les plus rcents dans ce domaine visent gnrer des matrices Origine/Destination des dplacements (matrices O/D) [Caceres 2007] [Calabrese 2011]
[Frias-Martinez 2012] [Duan 2011]. Il sagit l dun lment important dans les domaines de lingnierie des transports. En effet ces donnes sont habituellement collectes grce des enqutes trs chres et donc renouveles que trs rarement (au
mieux tous les dix ans). Se pose donc galement le problme de la dure de validit
de ces enqutes, qui ont pour effet de figer le trafic un instant donn. Le recours
la tlphonie mobile pour laborer les matrices O/D a montr son efficacit. Les
rsultats ont en effet t compars aux rsultats obtenus par les mthodes conventionnelles [Caceres 2007] [Calabrese 2011]. Il sagit certainement dune exploitation
majeure lavenir, en raison du faible cot de collecte de la donne.
1.3.3.4
1.3.3.5
Les opportunits quapportent ces nouvelles sources de donnes ont ces 5 dernires annes intress galement les sociologues. Ainsi des travaux sattachent
utiliser les donnes tlphoniques pour identifier des comportements sociaux, tels
que les mouvements selon les moments de la journe [Ahas 2010][Pulselli 2008] ainsi
que la rgularit des dplacements dun jour lautre [Sevtsuk 2010][Song 2010]. Ici
les tlphones ne sont pas utiliss pour construire une donne directement exploitable dun service prcis mais plus pour comprendre comment nos vies ont volu
au cours des dernires annes.
On notera particulirement le travail de [Phithakkitnukoon 2012] qui portait
sur plus dun million dutilisateurs de tlphones mobiles au Portugal. Les auteurs
35
Figure 1.13 Illustration du rseau de bus actuel (en jaune) et des prconisations
de nouvelles lignes
ont mesur le rayon go-social des utilisateurs, rayon dans lequel vit et se dplace
lutilisateur. Ils ont ainsi pu tablir les liens existant entre le rayon go-social et
la densit dhabitation de la zone concerne, ainsi quavec le lien social (niveau
dactivit tlphonique).
Alors que ces travaux se dveloppent, il reste la question de la fiabilit des
donnes utilises et de leur reprsentativit. Couronn et al. [Couronne 2011] ont
dfini une nouvelle mtrique permettant de caractriser lintensit de la mobilit et
sa fiabilit.
Nous proposons dans nos travaux exposs dans le chapitre suivant daller plus
loin en intgrant la connaissance de la nature socio-conomique du territoire. Ceci
permettra de dterminer la reprsentativit des vnements tlphoniques, en fonction notamment des caractristiques des lieux et du temps.
36
1.4
Synthse et perspectives
37
bilit ? Nous avons vu que des travaux rcents utilisent la tlphonie mobile pour
construire une meilleure connaissance de la mobilit. Les premires exprimentations datant de 1994 se sont rvles peu concluantes. En effet, le faible nombre de
donnes disponibles et la localisation au niveau de la cellule nont pas permis dobtenir un niveau de prcision suffisant pour construire une information pertinente.
Cest partir de 2006, en mme temps que nous avons initi le projet Territoire
Mobile, que les premiers rsultats significatifs sont apparus avec le projet Real Time
Rome men par le MIT. Les rsultats prsents dans ce projet, et les suivants mens Graz (2007) et Singapour (2013), semblent prometteurs. En particulier, ces
projets montrent lavantage considrable quapporte la tlphonie en proposant un
chantillon de la population jamais tudi dans le cadre denqutes, et un cot
significativement moindre. Cependant, ces tudes sattachent essentiellement prsenter des rsultats sous forme de calques visuels, de faon macroscopique. Il est
possible ainsi de superposer diffrentes sources de donnes, telles que la position des
bus ou des taxis en mme temps que lutilisation des rseaux cellulaires. Mais le
niveau de prcision ne permet pas de dterminer le nombre de personnes se trouvant dans un secteur gographique fin. Seule une tendance de rpartition peut tre
perue. Les travaux les plus aboutis, prsents cette anne, explorent les possibilits
existantes pour traduire quantitativement les donnes tlphoniques en nombre de
dplacements. Ainsi, pour des applications de transport, certains travaux visent
reconstituer des matrices Origine/Destination partir des donnes tlphoniques.
Pour linstant, les rsultats obtenus nont permis que didentifier les dplacements
domicile/travail, en fonction du lieu de rattachement du tlphone le jour et la nuit.
Mais ces travaux laissent entrevoir le trs grand potentiel que reclent les donnes
tlphoniques.
Les modles de mobilit classiques permettent donc destimer de faon quantitative le nombre de dplacements effectus entre diffrentes zones dun territoire. Ils
prsentent toutefois linconvnient dtre approximatif en raison du faible nombre
de donnes et de la raret des collections car elles sont extrmement chres. Les
modles de mobilit sappuyant sur la tlphonie permettent quant eux de bnficier dun grand nombre de donnes, dont lactualisation peut se faire facilement. Ils
prsentent toutefois linconvnient dtre gographiquement trs peu prcis et de ne
pas tre facilement gnralisables lensemble des territoires.
Dans le chapitre suivant nous proposons daffiner la faon dont se rpartissent
gographiquement les utilisateurs de mobiles avec une dynamique spatio-temporelle.
Le modle propos intgre la description du territoire pour construire un schma
complet de la mobilit associant gographie, activits et dplacements dans un rseau
cellulaire. Ce modle ouvre la voie une nouvelle faon dapprhender la mobilit,
afin de bnficier des avantages proposs par les modles classiques qui considrent
le triplet espace-temps-activit, et des avantages quapporte la tlphonie mobile
travers la quantit de donnes disponibles notamment.
Chapitre 2
La tlphonie mobile : un
marqueur de prsence
Sommaire
2.1
2.2
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . .
La tlphonie mobile : une nouvelle source de donnes .
2.2.1 Structure et fonctionnement dun rseau cellulaire . . . .
2.2.2 Quelles donnes sont disponibles ? . . . . . . . . . . . . .
2.3 Un nouveau modle de distribution de la population . .
2.3.1 Mobilit et caractrisation socio-conomique du territoire
2.3.2 Modle de distribution spatio-temporelle des mobiles . . .
2.4 Rsultats et analyse . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Environment danalyse . . . . . . . . . . . . . . . . . . . .
2.4.2 Constitution des donnes de rfrence . . . . . . . . . . .
2.4.3 Exprimentation et rsultats . . . . . . . . . . . . . . . .
2.4.4 Construction dune Signature Territoriale . . . . . . . . .
2.4.5 Gnralisation de la Signature Territoriale . . . . . . . . .
2.5 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
40
41
41
45
46
47
55
58
58
60
63
70
73
73
40
2.1
Introduction
Alors que jusqu prsent le dploiement des rseaux mobiles sappuyait sur une
41
2.2
2.2.1
42
stations de base (metteurs radio) sur le territoire couvrir par lesquelles les appels
ou les donnes pourront tre transfrs vers les mobiles. Lorsquun mobile tablit
une communication, un vnement de localisation est gnr sur la station de base
qui gre la communication.
Dfinition 1 (Station) Une station, galement appele station de base, est un relai
radio permettant dacheminer toute forme de communication avec un mobile. A une
station est toujours associe une zone de couverture qui dpend des caractristiques
de la station (paramtrage de lantenne) et de lenvironnement (relief, construction,
etc.).
Dfinition 2 (Site) Un site est le lieu gographique repr par ses coordonnes o
est place une station. Un mme site peut regrouper plusieurs stations permettant
de couvrir des orientations diffrentes, de proposer diverses technologies (UMTS,
GSM) et ventuellement plusieurs oprateurs.
Dfinition 3 (Cellule) On appelle cellule la zone de couverture radio dune station. Il sagit de la portion de territoire sur laquelle les communications peuvent tre
achemines par la station associe.
Pour permettre aux personnes dtre continuellement connects lorsquelles se
dplacent, la majeure partie du territoire est couverte par plusieurs cellules. Afin de
calculer, visualiser et grer les recouvrements entre cellules, les oprateurs utilisent
des mthodes et des logiciels de planification de rseaux. En particulier, ils ont recours des modles de propagation des ondes radio leur permettant de dterminer
en chaque lieu quelles sont les antennes susceptibles dacheminer une communication, et avec quelle probabilit. Cest ce que nous appellerons la probabilit de prise
de communications (PPC) 1 . La Figure 2.2 montre sur un schma thorique comment ces superpositions cellulaires oprent, avec sous forme maille les PPC de trois
antennes.
La Figure 2.3 est une illustration de lenchevtrement rel de cellules o chaque
couleur reprsente une cellule et lintensit de la couleur est le reflet de lintensit
de la probabilit de prise de communication (PPC) de la station.
Lorsquun mobile se dplace, il dtecte successivement les stations de base en
fonction de la couverture de chacune delles, de leur niveau de saturation et de
paramtres sur les antennes qui grent ladmission des terminaux. Ce dplacement
a un effet rduit sur le rseau si le tlphone est en veille (pas dappel, pas de
transfert de donnes) car celui-ci fait une mise jour de la localisation par groupe
de cellules (Location Area - LA). Par contre dans le cas o le tlphone est en
1. Ce concept est la proprit dOrange et ne sera pas dtaill dans cette thse.
43
44
tapes :
1. La personne 1 initie, depuis la cellule A, un appel la personne 2 prsente dans
la cellule B (Figure 2.4). Un appel sortant est comptabilis pour la station ou
antenne A, et un appel entrant est comptabilis pour la station B.
45
2.2.2
Tout ce qui se passe sur un rseau cellulaire nest pas enregistr pour des questions de technologie, de volume de donnes, de stratgie oprateur, de protection des
libertes(CNIL), etc. Pour des raisons de limitation de ressources sur le lien radio, il
nest pas possible de connaitre tout moment la station de rattachement de chaque
tlphone. Toutefois les oprateurs captent et conservent les vnements suivants :
les communications entrantes (information de communications) : ce sont les
appels/SMS/transfert de donnes reus par la personne se trouvant dans la
cellule, cest un marqueur de prsence.
les communications sortantes (information de communications) : ce sont les
appels/SMS/transfert de donnes mis par la personne se trouvant dans la
cellule, cest un marqueur de prsence.
les "handover" (information de signalisation) : cest un marqueur de mobilit
tant donn quil sagit de communications ayant dbut dans une cellule et
qui se poursuivent dans une autre cellule.
Les donnes de trafic et de signalisation se prsentent en gnral sous la forme
dune matrice individus/variables o les individus sont les stations, caractrises par
leur identifiant, assurant la couverture de la zone tudie, et les variables sont les
vnements. Dans notre travail sur lutilisation de ces donnes pour modliser la
mobilit, nous avons regroup les vnements par 1/4 dheure de 6h00 23h45, soit
71 plages horaires. Ce pas est tout fait ajustable pour augmenter ou diminuer la
prcision temporelle du modle. Voici la liste des donnes utilises par le modle que
nous proposons :
Le nombre dappels sortants. Celui-ci indique le nombre de personnes se trouvant dans la cellule c durant le quart dheure t ayant initi une communication
depuis leur tlphone mobile.
Le nombre dappels entrants. Celui-ci indique le nombre de personnes se trouvant dans la cellule c durant le quart dheure t ayant reu une communication
46
De plus, pour faire le lien entre les communications et le territoire, nous utiliserons une matrice de couverture radio pour lensemble des antennes du territoire
tudi. Les donnes de couverture radio utilises ici sont des donnes mailles un
pas de 25m. Cette matrice contient pour chaque maille la valeur de puissance reue et
provenant de lantenne considre. Elles permettent de localiser les zones couvertes
par chaque antenne et de connaitre la PPC associe. Enfin cette matrice permet par
superposition de faire le lien entre les cellules et les donnes gographiques (parcelles,
communes, btiments, routes) du territoire.
2.3
Dans cette section nous prsentons notre approche permettant de modliser les
dplacements, qui sappuie sur trois lments essentiels :
lutilisation des rseaux tlphoniques sans fil
les caractristiques du sursol
les objectifs de dplacements des personnes
Ce modle a t mis au point et expriment dans le cadre dun projet labellis par le Ple de Comptitivit "Vhicule du Futur" [Lamrous 2008] avec comme
partenaire le SMTC Belfort, la socit Orange, lAgence dUrbanisme et les collectivits territoriales du Territoire de Belfort. La vocation du projet est de proposer
une modlisation et une vision via un logiciel informatique des dplacements de
lensemble de la population dun territoire afin de planifier des services de transport en commun. Cette approche constitue ainsi une nouvelle faon dapprhender
lenvironnement urbain. Ce modle se place dans la catgorie des modles bass sur
lactivit coupl avec des donnes issues des rseaux de tlphonie cellulaire.
Afin de permettre de visualiser les rsultats, nous avons dvelopp la plate-forme
logicielle "geoLogic" proposant un tableau de bord ayant pour fond une carte gographique (cf. Figure 2.6) laquelle se superpose plusieurs calques de couleur pour
scruter les dplacements des individus. Ce tableau de bord permet de visualiser les
47
dplacements sur le territoire couvert sur une journe complte au quart dheure
prs et un pas de 25 mtres. Tous les moyens de zoom et de slection sont disponibles lutilisateur. Une prsentation plus dtaille de geoLogic est propose dans
le chapitre 4. Nous utiliserons des sorties graphiques de geoLogic pour illustrer des
composants du modle de mobilit de ce chapitre.
2.3.1
48
Classification maille
du territoire
Maillage
Prolage
horaire
HP
Pondra0on
Spa0o-temporelle
Poids dattraction de
chaque maille
HC
49
Les sections suivantes dcrivent de faon dtaille ce processus qui mne la description du territoire. Nous prsenterons ensuite (cf. section 2.3.2) comment cette
description est couple au rseau de communications (PPC) pour distribuer les mobiles dans les mailles du territoire.
2.3.1.1
Le territoire est caractris par linformation dite de sursol qui indique loccupation du sol (route, bti, eau, etc.). Une approche hirarchique nous permet de
structurer cette information en diffrentes classes de terrain.
Le terrain est dans un premier temps divis en grandes catgories (cf. Figure 2.8) :
commerce, activit, habitat, etc. Seuls les lieux pouvant significativement dfinir une
concentration de population seront importants dans la suite du travail mais tous
les types sont pris en compte. Ces catgories sont couramment utilises dans les
tudes traitant de la mobilit. Cest le cas des enqutes mnages/dplacements par
exemple, qui recensent les motifs de dplacement directement lis ces catgories. La
catgorie commerce contient ainsi toutes activits non professionnelles de type achat,
loisir, etc. La catgorie activit contient toutes activits professionnelles ou lies
la scolarit. Et la catgorie voirie concerne toutes activits lies aux dplacements.
Terrain
Commerce
Grand
Pe-t
Ac-vit
Entreprise
Ecole
Habitat
Maison
Pe-t
immeuble
Voirie
Grand
immeuble
Route
Rail
Autres
Eau
Fort
50
Ainsi, la description du territoire selon cette arborescence est tout dabord disponible sous forme vectorielle, puis la premire tape du traitement est le maillage
et la classification de ces donnes. Cette opration relve dun go-traitement
base dintersection de polygones. Il ne sera pas dtaill ici mais est publi dans
[Lamrous 2008]. Voyons prsent comment est attribu un profil horaire chaque
classe de terrain, soit comment inclure une dimension temporelle aux donnes spatiales.
2.3.1.2
Selon ses caractristiques socio-conomiques, un lieu attire des personnes diffremment chaque moment de la journe et dun jour lautre. Pour rendre compte
de ce phnomne nous procdons un dcoupage du temps en plages horaires qui
sera associ au dcoupage gographique du territoire en mailles de ltape prcdente. Une bonne connaissance de loccupation du sursol du territoire nous permettra ainsi de distribuer les mobiles rattachs un relai tlphonique diffremment
selon lheure de la dtection. Nous pouvons citer lexemple dun plan deau urbain
interdit la baignade et la navigation, ou encore dun tablissement scolaire pouvant recevoir des personnes en journe mais pas la nuit. Nous laborons ainsi un
schma temporel de caractrisation du sursol.
Chaque classe lmentaire de terrain reprsente Figure 2.8 a un pouvoir dattraction trois tats qui dpend du jour et du moment de la journe. Nous dfinissons un tel profil horaire pour une classe de la manire suivante : chaque plage
horaire t (gnralement de 15 minutes) peut prendre la valeur 0 lorsquun nombre
non significatif de personnes peut se trouver dans cette classe, 1 lorsque la classe
est considre en heure creuse (faiblement frquente) et 2 lorsquun nombre important de personnes peut se trouver dans cette classe. Cette approche trois niveaux (absence, faible prsence, forte prsence) apporte une grande souplesse dans
la construction et dans lvolution de la matrice dappartenance horaire. Il sagit
donc dun compromis entre une approche binaire du tout ou rien et une approche
continue qui complexifierait la construction de ces profils.
Un extrait de la table de profilage temporel du sursol trois tats est donn
Figure 2.9 de 6h 7h (en colonnes). Chaque ligne correspond une classe de terrain
pour un lundi dune priode travaille. Le profil change dun jour lautre de la
semaine et ventuellement dune semaine lautre pour reflter au plus prs la
ralit.
Plus formellement, la table de profilage temporel est associe la matrice A, qui
est dfinie de la faon suivante :
Ecole
1,$%(-%&234)
!"#$#%&$))"567"%&2&84)
+*,-.%&$))"567"%&9&84)
:(5#"%
:,$7
;,*.$-%&<&!,*'%
=(*>#
/,5
&
&
&
&
?())"*'"
("
@'#$A$#B
/-#*"0*$%"
!"'$
C,6$#,#
+*,-.%&'())"*'"%
!"%&
D($*$"
!"#$#%&'())"*'"%
!"#$
@5#*"%
!"
51
A = (aij )1ip,1jn
avec :
p : le nombre de classes lmentaires de sursol
n : le nombre de plages horaires dans une journe
HP
la priode j
aij =
si la classe i est considre en
1
HC
la priode j
(2.1)
Cette tape nous a permis de dfinir une matrice dcrivant le profil temporel
trois tats de chaque classe de terrain. Il sagit maintenant de convertir cette matrice
en poids dattraction spatio-temporelle variables dans le temps pour chaque classe,
avant den dduire un poids dattraction pour chaque maille.
2.3.1.3
Nous abordons maintenant la phase qui permet de dfinir la faon dont la nature
du sursol influence la rpartition des mobiles sur le territoire. Cette rpartition se
droule en deux temps. Tout dabord, il sagit de dterminer un poids dattraction
global pour chaque classe dfinie dans le tableau 2.8 ; puis une deuxime tape
52
Enqute brute
Enqute modifie
Commerce
25%
30,49%
Activit
25%
30,49%
Habitat
22%
26,83%
Voirie
10%
12,2%
Autres
18%
0%
% catgorie
Commerce
30,49%
Activit
30,49%
Habitat
26,83%
Voirie
12,2%
53
Classe de sursol g
pour ground
% classe
Rpartition globale g
petit commerce
grand commerce
entreprise
cole
maison
pt immeuble <20m
gd immeuble >20m
route
rail
30%
70%
67%
33%
6,25%
31,25%
62,5%
75%
25%
9,15%
21,34%
20,43%
10,06%
1,68%
8,38%
16,77%
9,15%
3,05%
54
Pour une classe donne g, la matrice A contient les valeurs 0, 1 ou 2 selon les
plages horaires. Le poids g est alors rparti linairement sur lensemble des plages
absence, HC et HP de la journe, avec une proportion x dfinir entre HC et HP
selon le territoire.
Calculons prsent les poids ghp et ghc de la classe g en heure pleine et en heure
creuse respectivement. Ils vrifient :
hp hp
hc hc
0 0
g ng + g ng + g ng = g
(2.2)
hp = x hc
g
g
Avec g0 = 0, il sen suit que les poids dattraction des classe de sursol sont
donns par :
hc =
g
hc
xnhp
g +ng
(2.3)
ghp = x
g
hc
xnhp
g +ng
t
m
=
gt .pm,g
(2.4)
gG
avec :
t le poids dattraction spatio-temporelle de
m
gt le poids de la classe de sursol g linstant
gHP
t
g =
gHC
la maille m linstant t
t
si ag,t = 2
si ag,t = 1
(2.5)
si ag,t = 0
2.3.2
55
Dans cette partie nous rassemblons les lments prsents jusquici, les donnes
tlphoniques et les poids dattraction spatio-temporelle, pour aboutir la rpartition des mobiles sur lensemble du territoire. La Figure 2.10 illustre ce qui est
prsent dans cette section.
Mobile
Vecteur
da8rac-ons
spa-o-temporelles
de
chaque
maille
Vecteur
de
probabilits
de
prise
de
communica-on
de
chaque
maille
Module
de
distribu-on
des
mobiles
2.3.2.1
Modle de distribution de mobiles selon la cartographie des Probabilits de Prise de Communication (PPC)
Comme nous lavons vu, les cellules radio sont dcoupes en mailles carres qui
dfinissent le niveau de prcision que lon souhaite atteindre. Ainsi, pour chaque
maille est gnre une structure multicouche qui intgre toutes les cellules qui la
recouvre ainsi que les PPC associes. De la mme faon, la journe est dcoupe en
plages horaires de t. Pour lapplication numrique nous fixons le pas de maillage
pdm 25m de ct et le pas de temps t 15 minutes. La rpartition des mobiles sur
les mailles dune cellule radio pendant lintervalle t est faite proportionnellement
aux PPC de chaque maille. Ainsi la densit des mobiles sur chaque maille m est
dtermine en fonction de la reprsentation de la PPC de la maille relativement
56
lensemble des PPC de toutes les mailles m0 de la cellule. Pour une station s sur une
maille m linstant t (pour simplifier la notation, t sera assimile la priode de
temps t) nous avons la rpartition suivante :
ppcm,s
ntm,s = X
.nts
ppcm0 ,s
(2.6)
m0 Cs
avec :
ntm,s le nombre de mobiles rattachs la station s rparti sur la maille m linstant
t
Cs lensemble des mailles appartenant la zone de couverture de la station s i.e.
lensemble des mailles du territoire pour lesquelles la PPC associe s est non
nulle
ppcm,s la probabilit lorsquun mobile est sur la maille m que son appel soit achemin par la station s
ppcm0 ,s la probabilit lorsquun mobile est sur la maille m0 que sa communication
soit achemine par la station s
nts le nombre de mobiles rattachs la station s linstant t
Remarquons dans le modle (2.6) que les PPC sont invariantes dans le temps,
seule lapparition des mobiles est variable.
Nous avons ainsi dfini la distribution des mobiles lintrieur dune cellule radio
indpendamment des proprits spatio-temporelles du sursol. Ce mme traitement
est appliqu lensemble des cellules, puis nous dfinissons pour chaque maille un
cumul de prsences issues de lensemble des cellules qui contiennent cette maille i.e.
pour lesquelles la PPC est non nulle. Ainsi pour chaque maille m linstant t nous
obtenons la rpartition globale de lensemble des mobiles de la faon suivante :
ntm =
nm,s
(2.7)
sSm
57
Figure 2.11 Distribution des mobiles un instant t sans prise en compte des
proprits du sursol
2.3.2.2
58
ntm =
t
X
Xppcm,s .m
.nts
t
ppcm0 ,s .m0
sSm
(2.8)
m0 Cs
Lintgration des poids dattraction spatio-temporelle avec le modle de distribution de mobiles a pour effet de rorganiser la distribution des mobiles de faon plus
raliste. Pour sen rendre compte la Figure 2.12 prsente le rsultat de lapplication
de ce modle, gauche sans prise en compte de ces poids et droite en les intgrant.
En reprenant notre exemple prcdent, nous pouvons ainsi remarquer que la partie
de la population qui tait affecte un plan deau lorsque seules les PPC taient
considres se retrouve raffecte dans des mailles plus appropries.
Figure 2.12 Distribution des mobiles un instant t sans et avec prise en compte
des poids dattraction spatio-temporelle
La visualisation de la rpartition des mobiles avec et sans prise en compte des
poids dattraction spatio-temporelle donne une nouvelle visibilit de la prsence des
personnes. Toutefois, une analyse numrique des rsultats doit permettre de vrifier
cette approche. Ce point est abord dans la section suivante.
2.4
2.4.1
Rsultats et analyse
Environment danalyse
Une bonne analyse de la mobilit ncessite de disposer dun outil efficace pour
reprsenter les rsultats des calculs sur les dplacements. Une plate-forme logicielle
59
capable de grer la fois des donnes spatiales telles que des donnes gographiques
ou de localisation, ainsi que des donnes temporelles refltant la mobilit apparait
alors comme un lment essentiel.
60
2.4.2
Les donnes utilises pour constituer la base de rfrence sont lEnqute Mnages/Dplacements (EMD) ainsi que les donnes INSEE du territoire. Les rsultats de lenqute effectue en 2004/2005 (enqute redresse) fournissent une base
de donnes contenant notamment les 435 360 enregistrements correspondant aux
rponses apportes par chaque personne enqute sur les dplacements de la veille,
redresses lensemble de la population. Les dplacements contenus dans la base
sont ceux ayant pour origine ou destination une zone prdfinie de la CAB et ayant
t effectus en semaine. Ainsi lEMD nous permet de connaitre les dplacements
des habitants du territoire tudi tout au long de la journe.
LEMD est donc riche dinformations sur la manire dont la population se dplace
sur le territoire. Les traitements que nous avons effectus sur ces donnes ont deux
objectifs : dune part fournir des rsultats visualisables dans le logiciel dvelopp afin
de se rendre compte de la faon dont la population volue (avec une information
variable dans lespace et dans le temps diffrente chelle spatiale i.e. pour une
zone particulire ou pour tout le territoire de lEMD) et dautre part de constituer
la base de rfrence pour comprendre le lien pouvant exister entre dplacements et
activit tlphonique.
2.4.2.1
Agrgation temporelle
61
tape consiste donc affecter chacun des 435 360 enregistrements la plage horaire (le 1/4 dheure) lui correspondant pour pouvoir agglomrer ces affectations et
disposer dune information globale par priode.
2.4.2.2
Agrgation gographique
2.4.2.3
Lvolution de la population dans les zones au cours de la journe est une information utile que lon peut calculer partir de lvolution de lattractivit de chaque
zone au cours du temps. Pour cela, il faut prendre en considration non seulement
les flux entrants et sortants linstant considr, mais y ajouter galement tous les
flux entrants oprs depuis le dbut de la journe (cumul des arrives) et retrancher
de la mme manire la somme des flux sortants depuis le dbut de la journe (cumul
des dparts). Le point de rfrence temporel considr est 6h du matin.
62
2.4.2.4
Dans le cadre de cette section nous nous intressons la mise au point dun
procd pour fournir une information pertinente sur la localisation de la population
au cours de la journe.
Afin de faire un parallle entre les donnes tlphoniques et lenqute mnages
dplacements, nous devons donc traduire les donnes de lEMD en termes de population prsente chaque instant et en chaque endroit du territoire reprsent
par les zones. Ce calcul qui fournit une information utile en soi sera galement la
base de comparaison utilise pour valider la localisation identifie par les tlphones
portables, ces rsultats tant construits de manire totalement indpendante.
63
2.4.3
Exprimentation et rsultats
64
65
4000
3500
3000
Nb de personnes
2500
2000
EMD Techn'hom
1500
8Moy.
mobile
sur
pr.
(Orange
Techn'hom
x100)
1000
500
0
-500
-1000
6h 7h 8h 9h 10h 11h 12h 13h 14h 15h 16h 17h 18h 19h 20h 21h 22h 23h
Temps
66
6000
Nb de personnes
5000
4000
3000
2000
1000
0
6h
7h
8h
9h
10h
11h
12h
13h
14h
15h
16h
17h
18h
19h
20h
21h
22h
23h
Temps
Figure 2.19 Comparaison EMD / modle en centre ville avec habitats et commerces
67
700
600
Nb de personnes
500
400
EMD Andelnans
300
200
100
0
6h
7h
8h
9h
10h
11h
12h
13h
14h
15h
16h
17h
18h
19h
20h
21h
22h
23h
Temps
68
7000
6000
Nb de personnes
5000
4000
EMD Bavilliers
3000
2000
700
600
Nb de personnes
500
400
EMD Andelnans
300
8Moy.
mobile
sur
pr.
(Orange
invers
Andelnans)
200
100
0
6h
7h
8h
9h
10h
11h
12h
13h
14h
15h
16h
17h
18h
19h
20h
21h
22h
23h
Temps
Figure 2.22 Symtrie du modle en secteur priurbain 1 avec habitat et trs peu
de commerce
69
7000
6000
Nb de personnes
5000
4000
EMD Bavilliers
3000
8Moy.
mobile
sur
pr.
(Orange
invers
Bavilliers)
2000
Figure 2.23 Symtrie du modle en secteur priurbain 2 avec habitat et trs peu
de commerce
70
2.4.4
Les rsultats prcdents ont illustr le fait que la faon de tlphoner dpend
directement du type de lieu (lespace) et du moment (la journe, lheure). Il apparait donc fondamental dtudier le niveau de stabilit des communications, non
pas au cours de la journe mais dune semaine lautre. En effet, si lutilisation
du tlphone varie de faon significative pour un mme type de jour, dans la mme
zone et au mme moment de la journe, aucune conclusion sur la reprsentativit des
communications ne peut tre tire. A lchelle de lensemble des personnes, lactivit
tlphonique serait chaotique et ne laisserait aucun espoir den tirer une information
sur la rpartition de la population. Au contraire, si pour une mme zone, le mme
jour et au mme moment, nous pouvons observer un comportement stable dune
semaine lautre, cela montre que la faon de tlphoner est directement et troitement lie au lieu. A ce titre les communications constitueraient un bon marqueur
de la prsence dans une zone.
Pour vrifier ceci, nous introduisons la notion de Signature Territoriale. Nous
la dfinissons comme tant le coefficient multiplicateur qui, pour chaque jour type
et chaque moment, permet de passer du nombre dvnements tlphoniques au
nombre de prsents issus de lEMD. Ce coefficient devrait certainement tre important le soir par exemple, tant donn quun appel 22h reprsente certainement
beaucoup plus de monde prsent quun appel 12h. Il sobtient naturellement par
la division euclidienne du nombre de personnes comptes par lEMD par le nombre
dvnements tlphoniques.
Dfinition 5 (Signature Territoriale) On appelle Signature Territoriale dune
zone la matrice caractristique permettant didentifier pour chaque type de jour et
chaque horaire le nombre de personnes que reprsente un vnement tlphonique.
Afin dtudier la stabilit et donc la pertinence de cette signature, reprenons
les zones utilises prcdemment. Nous allons nous focaliser sur les journes connues
pour tre la fois semblables et de plus forte mobilit, le mardi et le jeudi [Jeannic 2011].
Par ailleurs, pour renforcer cette validation, nous comparons ces journes au cours
de deux semaines diffrentes. La figure 2.24 illustre les rsultats obtenus pour les
zones que nous avons identifies comme tant en phase (centre ville et zone dactivit industrielle). Les courbes hautes concernent le centre ville et les courbes basses
la zone dactivit industrielle.
En abscisse est reprsente lheure de la journe, et en ordonne le coefficient
permettant de passer du nombre de personnes issu du modle propos au nombre de
personnes issu de lEMD. Concernant les courbes de la zone dactivit industrielle
(courbes basses), on constate quelles sont 0 pass 19h. Etant donn quil sagit
dune zone sans habitat, cela signifie que, daprs lEMD, il y a plus de personnes
71
60
50
40
30
20
10
0
6h
7h
8h
9h
10h
11h
12h
13h
14h
15h
16h
17h
18h
19h
20h
21h
22h
23h
Temps
Figure 2.24 Signature Territoriale pour le centre ville (courbes hautes) et la zone
dactivit industrielle (courbes basses) - pour deux mardis et jeudis diffrents
qui sont parties depuis le dbut de la journe (6h du matin) que de personnes
qui sont arrives. LEMD indique donc un nombre ngatif de personnes pass 19h.
Cela montre les limites de ces enqutes, qui sont la meilleure rfrence que lon ait
aujourdhui mais qui comportent de nombreuses incertitudes quant leurs rsultats.
Les 4 courbes de chaque zone se rvlent tre trs fortement semblables. De plus,
dune zone lautre les courbes sont bien distinctes. La signature se rvle tre un
identifiant propre chaque zone et stable dun jour lautre.
Nous avons de la mme faon construit les signatures correspondant aux zones
priurbaines. Le rsultat observable sur la Figure 2.25 rvle une tendance trs
semblable ce que nous venons de commenter. La signature permet didentifier
clairement chaque zone, avec en haut les courbes de la signature de Bavillers, et en
bas celles dAndelnans.
Nous identifions donc trs nettement une tendance stable propre chaque zone
pour les 4 jours observs, quel que soit le type de zone. A ce titre nous montrons ici
que la faon dont nous avons utilis les vnements du rseau cellulaire conduit un
marqueur fiable de la prsence des personnes. De plus, lobservation gnralement
faite dans les tudes de transport que le mardi et le jeudi ont des profils de mobilit
trs semblables est ici galement vrifie.
Enfin, la lecture dtaille des graphiques fournit des indicateurs sur la reprsentativit des communications mobiles. Un pic bas 12h prcise au centre ville
(Figure 2.24) montre que, proportionnellement au nombre de personnes prsentes,
on appelle beaucoup plus. Le ratio descend alors 15 ce qui signifie quun vnement
72
60
Bavilliers
en
haut
Andelnans
en
bas
50
40
jeudi1
Bavilliers
jeudi1
Andelnans
30
jeudi2
Bavilliers
jeudi2
Andelnans
20
mardi1
Bavilliers
mardi1
Andelnans
10
mardi2
Bavilliers
mardi2
Andelnans
0
6h
7h
8h
9h
10h
11h
12h
13h
14h
15h
16h
17h
18h
19h
20h
21h
22h
23h
Temps
Figure 2.25 Signature Territoriale pour les zones priurbaines - pour deux mardis
et jeudis diffrents
2.5. Synthse
2.4.5
73
Nous avons montr que la faon dutiliser le tlphone mobile est globalement
trs stable dune semaine lautre pour une mme zone, au mme jour et au mme
moment. Par contre, elle peut diffrer significativement dune zone lautre. Nous
avons ainsi pu quantifier pour chaque zone le nombre de personnes reprsentes par
lactivit tlphonique. La question qui se pose est de savoir dans quelle mesure
cette signature peut tre dduite de la constitution de la zone, en termes de donnes de sursol et socio-conomiques. Est-il possible didentifier des caractristiques
territoriales qui permettent destimer la signature correspondante ?
Malgr nos efforts dans ce sens, il apparait que cette signature territoriale suit
des rgles particulirement subtiles que nous navons pas encore clairement identifies. Nous avons eu recours une approche base de rgression linaire et dun
estimateur des moindres carrs pour tenter didentifier la manire dont contribue
chaque classe de terrain la pondration globale des zones. Or nous avons constat
que la faon de communiquer via les mobiles nest pas toujours directement corrle
la constitution territoriale des zones (habitat, voirie, commerces, etc.) mais quelle
intgre dautres facteurs, peut-tre sociaux. Il apparait ainsi que lusage des mobiles
dans les habitations diffre dun quartier un autre. De la mme faon les tlphones sont utiliss diffremment dans les entreprises selon les zones de localisation
des entreprises concernes ; l encore il faudrait regarder dautres facteurs tels que
la nature de lactivit de lentreprise.
Une orientation qui nous semble prometteuse est le recours aux techniques de
classification (souvent appeles clustering) telles que lanalyse en composante principale (ACP) afin de regrouper les zones ayant des profils semblables. Nous laissons
cette partie en perspective pour des travaux futurs.
2.5
Synthse
Le modle propos dans ce chapitre sinscrit dans un triptyque tlphonie - mobilit - territoire. Les travaux prsents sont novateurs plusieurs titres, tout dabord,
de part les donnes utilises. Contrairement ce que font les outils classiques de modlisation de la mobilit partir denqutes et destimations, notre approche vise
fournir des rsultats qui sont des mesures de dplacements issus du terrain. Ensuite,
ces travaux sont novateurs travers lunification de donnes de dplacement et de
donnes du territoire. Contrairement ce qui commence tre fait travers lutilisation des donnes issues de la tlphonie mobile, le modle que nous proposons
sappuie sur la localisation des ples attracteurs/gnrateurs de mobilit constitus
des habitations, des commerces, des entreprises, des coles etc., tout ce qui constitue
une activit humaine, et ce titre est un modle de la catgorie activit-centre.
74
2.5. Synthse
75
Deuxime partie
Optimisation combinatoire
multiobjectif de lauto-partage
Chapitre 3
Optimisation combinatoire
multiobjectif : tat de lart
Dans ce chapitre est introduit le problme de loptimisatiton combinatoire multiobjectif. Dans un premier temps les principaux concepts lis au sujet sont prsents, ainsi que les principales dfinitions. En particulier, le problme de noncomparabilit des solutions multiobjectif constitue un fil conducteur de ce chapitre.
Dans une deuxime partie un inventaire des heuristiques couramment utilises est
propos. Elles sont prsentes regroupes en trois grandes catgories : les approches
par transformation en problme mono-objectif, les approches non-Pareto et enfin
les approches Pareto. Une prsentation est ensuite faite des heuristiques hybrides,
qui combinent des heuristiques provenant des diffrentes catgories prcdentes. Enfin, pour apprhender lvaluation dun ensemble de solutions Pareto optimales, un
inventaire des principaux indicateurs dvaluation est propos.
Sommaire
3.1
3.2
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Notions de base et dfinitions . . . . . . . . . . . . . . . . . .
3.2.1 Optimisation mono-objectif . . . . . . . . . . . . . . . . . . .
3.2.2 Formulation dun problme doptimisation multiobjectif . . .
3.2.3 Espace de dcision vs espace objectif . . . . . . . . . . . . . .
3.2.4 Optimisation combinatoire et mtaheuristiques . . . . . . . .
3.2.5 Dominance et Pareto optimalit (le problme de la relation
dordre) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Mtaheuristiques pour les problmes multiobjectifs . . . . .
3.3.1 Classification des principales approches . . . . . . . . . . . .
3.3.2 Les approches par transformation mono-objectif . . . . . . .
3.3.3 Les approches non-Pareto . . . . . . . . . . . . . . . . . . . .
3.3.4 Les approches Pareto . . . . . . . . . . . . . . . . . . . . . .
3.3.5 Les approches hybrides . . . . . . . . . . . . . . . . . . . . .
3.4 Evaluation des algorithmes multiobjectifs : une approche
base dindicateurs . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Indicateur de contribution . . . . . . . . . . . . . . . . . . . .
3.4.2 Indicateur -additif . . . . . . . . . . . . . . . . . . . . . . . .
3.4.3 Indicateur hypervolume . . . . . . . . . . . . . . . . . . . . .
3.4.4 Indicateur de distance gnrationnelle . . . . . . . . . . . . .
3.5 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
81
81
82
82
83
85
87
87
87
92
93
101
104
104
105
105
108
108
80
3.1
Introduction
81
3.2
3.2.1
(3.2)
Souvent, lors de la rsolution de problmes rels, il nest pas possible de garantir quune solution est loptimum global sur lensemble de lespace de recherche.
On explore alors un sous-espace X1 X de lespace de recherche pour trouver
loptimum global x1 de X1 , vrifiant f (x ) f (x1 ) toujours pour un problme de
maximisation.
82
Nous le voyons ici, le contexte mono-objectif permet toujours didentifier la solution optimale, au moins sur X1 . Lorsque le problme doptimisation devient multiobjectif, nous verrons quil en est tout autre chose.
3.2.2
La formulation gnrale dun problme doptimisation multiobjectif (Multiobjective Optimization Problem - MOP) est de la forme :
z = f (x)
max
M OP
o
f (x) = (f1 (x), f2 (x), ..., fn (x))
tel que : x X
(3.3)
3.2.3
Lespace de dcision regroupant les variables x = (x1 , ..., xk ) X est de dimension k. Il sagit de lespace dans lequel sont reprsentes les solutions.
83
3.2.4
Le cadre dans lequel sinscrit les travaux de cette thse concerne loptimisation
combinatoire. La fonction optimiser, souvent appele fonction cot ou fonction
objectif, est dfinie sur un ensemble discret. Il sagit donc de trouver loptimum
(maximum ou minimum) parmi un ensemble fini. Bien que dans la thorie il suffirait
dnumrer toutes les solutions possibles et de retenir la meilleure, il nest bien souvent matriellement pas possible deffectuer cet inventaire exhaustif dans un temps
"raisonnable". Le temps de calcul constitue alors une contrainte forte prendre en
compte. Selon le problme considr, une dure acceptable pour que le programme
propose une solution sera de quelques millisecondes - dans une situation durgence
bord dun vhicule par exemple - quelques semaines lorsquil sagit de planifier
une nouvelle ligne de production dans un site industriel par exemple.
3.2.4.1
Le but de cette section nest pas de dtailler la notion de complexit, qui est
largement traite par ailleurs. Pour une introduction plus complte ce domaine le
lecteur est renvoy au clbre ouvrage de Garey et Johnson [Garey 1979]. Lobjet
de cette partie est de rappeler quelques fondamentaux de la complexit qui sont lis
aux problmes de dcision.
La rsolution dun problme passe par la mise au point dun algorithme. Bien que
la notion dalgorithme remonte lantiquit dans la dmarche, elle na t formalise
rellement quavec lapparition de la machine de Turing. Nous ne reviendrons pas
ici sur ces fondements de linformatique, qui sont remarquablement remis en perspective dans louvrage de Gilles Dowek Les mtamorphoses du calcul [Dowek 2007]
Un algorithme est ainsi gnralement considr comme efficace si sa complexit est
borne par une fonction polynomiale en la taille de linstance rsoudre.
Dfinition 8 (Problme de classe P) La classe P regroupe lensemble des pro-
84
blmes de dcision dont la solution est atteignable en un temps polynomial par une
machine de Turing dterministe.
Il existe toutefois un grand nombre de problmes de dcision pour lesquels il ny
a pas dalgorithme polynomial connu.
Dfinition 9 (Problme de classe NP) La classe NP regroupe lensemble des
problmes de dcision pouvant tre rsolus en un temps polynomial par une machine
de Turing non dterministe.
Remarque : Un problme appartenant la classe P ne signifie pas ncessairement quil sera rsolvable par un programme dterministe en temps "raisonnable".
Inversement, certains problmes de la classe NP admettront des instances pouvant
tre rsolues par un algorithme dterministe.
On parle galement souvent de problmes NP-complets. Il sagit des problmes
les plus difficiles de la classe NP, qui sont au moins aussi difficiles que tous les
problmes NP. De fait tout problme de la classe NP doit pouvoir se ramener un
problme NP-complet par rduction polynomiale.
3.2.4.2
85
Lorsque le recours un algorithme exact nest pas possible pour rsoudre un problme en raison dun temps de calcul trop lev, le recours un algorithme approch
permet toutefois de proposer une solution. Ces algorithmes approchs sont galement appels heuristiques. Le principe est ici de proposer une solution approche
de la meilleure qualit possible dans un temps limit, en exploitant notamment la
structure du problme considr. Les heuristiques prsentent lavantage de pouvoir
rsoudre un problme N P en un temps polynomial. Parmi les heuristiques les plus
simples figurent les algorithmes gloutons. Le principe est de construire la solution
itrativement en effectuant des choix optimaux localement. Cette dmarche gnrique est adapter selon la structure du problme pos. Cest l la caractrisation
dune heuristique : elle est dfinie par les spcificits du problme.
Bien que les heuristiques soient souvent des approches stochastiques, il est important de noter quelles peuvent tre dterministes.
Les mtaheuristiques se distinguent des heuristiques par leur niveau dabstraction. Alors que les heuristiques sont destines rsoudre un type de problme
spcifique, une mtaheuristique peut tre adapte une large varit de problmes.
Ainsi la recherche locale ou encore les algorithmes gntiques sont considrs comme
des mtaheuristiques.
3.2.5
86
solution dans lespace des critres. On dit que z est non-domine ssi z 0 Z, z 0 z.
De mme soit x X une solution dans lespace de dcision. On dit que x est nondomine ssi x0 X, x0 x. De telles solutions sont dites Pareto optimales.
Dfinition 12 (Incomparabilit) Soient z, z 0 Z deux solutions dans lespace
des critres. z et z 0 sont dites incomparables ssi z z 0 et z 0 z. Par extension on
dira que x et x0 (lments de X) sont incomparables ssi f (x) et f (x0 ) sont incomparables.
Dfinition 13 (Ensemble Pareto optimal) Sous les notations prcdentes, lensemble Pareto optimal est dfini comme suit : XP = {x X|@x0 X, x0 x}.
Dfinition 14 (Front de Pareto) Etant donn un ensemble Pareto optimal XP ,
le front de Pareto est dfini comme suit : ZP = {f (x)|x XP }.
87
3.3
3.3.1
Depuis que les MOP sont abords par la communaut scientifique, diffrentes approches de rsolution ont t proposes. Dans la littrature on retrouve frquemment
une classification des mthodes en trois grandes familles :
les approches bases sur la transformation du MOP en un problme monoobjectif. On trouvera dans cette catgorie les mthodes bases sur lagrgation
des fonctions objectif fi en une seule fonction f . Ceci impose, outre une bonne
connaissance du problme traiter, dtre en mesure de quantifier lapport
recherch pour chaque objectif.
les approches non-Pareto. Il sagit dapproches qui considrent tous les objectifs mais de faon dsagrge, indpendamment les uns des autres.
les approches Pareto. Pour cette classe dalgorithmes, toutes les fonctions
objectif sont considres en mme temps en exploitant le principe de nondominance.
Les diffrents travaux mens dans le domaine ont montr que les approches
Pareto sont gnralement les plus performantes.
Nous utiliserons ce dcoupage dans cette section, lequel est synthtis dans la
Figure 3.3.
De faon transversale ces diffrentes classes, les approches hybrides offrent de
nombreux avantages et permettent de bnficier des mcanismes prouvs dans les
heuristiques classiques. Bien souvent, tout comme dans le cas mono-objectif, les approches hybrides surpassent les mtaheuristiques pures, comme dans [Knowles 2000],
[Jaszkiewicz 2002] ou encore [Deb 2001].
Cest dans cette dernire classe que sinscrit nos travaux prsents dans cette
thse.
3.3.2
Ces approches fournissent des moyens souvent assez simples daborder un MOP.
La complexit lie la prise en compte simultane de diffrents objectifs contra-
88
3.3.2.1
La mthode dagrgation
F (x) =
n
X
(3.4)
i fi (x)
i=1
Pn
i=1 i
= 1.
89
F (x) =
n
X
ci i fi (x)
(3.5)
i=1
o les ci sont des constantes de mise lchelle des objectifs. Pour fixer les valeurs
de ces constantes on a souvent recours au vecteur idal.
Une fois les objectifs agrgs, toutes les approches habituellement rencontres
pour rsoudre des problmes mono-objectif peuvent tre appliques. On rencontre
90
notamment la recherche locale, simple avec la mthode TPLS [Paquete 2003], mais
aussi impliquant des mcanismes Tabou [Gandibleux 1997] et lintroduction de la
mthode Tabou MOTS [Hansen 1997]. La mthode MOSA [Ulungu 1999] repose
quant elle sur un recuit simul. Enfin de nombreux algorithmes gntiques sont
galement utiliss conjointement la mthode dagrgation, tels que [Yang 1994]
pour le problme bi-critre de transport.
3.3.2.2
La mthode -contrainte
Avec cette approche, un seul objectif est retenu pour tre optimis. Par contre
des contraintes sont appliques aux autres objectifs pour assurer un niveau de qualit
suffisant. Le problme initial (M OP ) devient alors :
z = fk (x)
max
M OPk ()
tel que : x X
s.c.
fj (x) j , j = 1, ..., n o j 6= k
(3.6)
est ainsi le vecteur des contraintes sur chaque objectif : = (1 , ..., k1 , k+1 , n )
Nous illustrons sur la Figure 3.5 le cas dun problme de maximisation. La
contrainte 2 est applique la fonction objectif 2 : la solution acceptable ne
peut tre infrieure cette valeur. De fait la solution optimale sur f1 devient la
solution z .
91
Avec cette approche limportant est de pouvoir classer les objectifs par ordre de
priorit et surtout dtre capable de fixer les valeurs souhaites. Une dmarche
peut tre dcrite comme suit :
rsoudre le problme pour la fonction objectif principale fi seule ;
dfinir la valeur i associe. Elle correspond au taux de dgradation acceptable
(ex. on veut au moins 80% de loptimalit) ;
rsoudre le problme pour la fonction objectif secondaire fj avec la contrainte
i sur fi ;
dfinir la valeur j associe. Ainsi de suite...
Les travaux ayant recours la mthode -contrainte sont nombreux. L encore, le
MOP tant ramen un problme mono-objectif, les approches courantes telles que
les algorithmes gntiques, les recherches locales, etc. sont frquemment utilises.
3.3.2.3
Ici le principe est de dfinir un point artificiel atteindre dans lespace objectif. Ainsi le dcideur fixe le but vis pour chaque objectif. Le MOP initial est
ensuite transform en un problme mono-objectif qui intgre, dans la formulation
du problme lui-mme, la notion de but atteindre. A titre dexemple un nouveau
problme peut tre de minimiser la dviation au but. Le problme devient alors :
M OP (z B )
n
X
|fj (x)
j=1
tel que : x X
min
zjB |p
(3.7)
Dans cette nouvelle formulation du MOP le but atteindre est dfini par z B .
La distance au but utilise ici est la mtrique de Tchebycheff avec 1 p . Dans
le cas o p = 2 on retrouve la distance euclidienne. De mme lorsque p on
retrouve un Min-Max.
La Figure 3.6 illustre le dplacement dune solution vers le but z B . L encore le
choix des paramtres est dterminant pour la bonne marche de lalgorithme. Un but
mal positionn peut altrer considrablement le rsultat obtenu. En particulier si le
but est situ lintrieur du domaine ralisable, lalgorithme ne pourra pas trouver
une solution Pareto optimale. Or le choix du but dpend du dcideur et ncessite
une trs bonne connaissance du problme trait.
Souvent le but est fix en utilisant l encore le point idal. Parmi les travaux
utilisant la mthode programmation par but on citera lalgorithme gntique de
[Coello Coello 1998] qui utilise une fonction min-max relativement au point idal.
92
3.3.3
Cette catgorie dapproches regroupe les mthodes qui considrent tous les objectifs dans le mme algorithme, sans passer par la transformation du MOP en un
problme mono-objectif. Par contre, contrairement aux approches Pareto qui sont
bien plus rpandues, les approches non-Pareto traitent chaque fonction objectif indpendamment les unes des autres.
On ne prsentera ici que lalgorithme VEGA (Vector Evaluated Genetic Algorithm) [Schaffer 1985], qui est le premier AG rellement multiobjectif. Dans cet
algorithme, loprateur de slection est bas sur un objectif seulement, indpendamment des autres. A chaque gnration la population est divise en autant de groupes
quil y a de fonctions objectif. Chaque groupe est valu suivant lobjectif correspondant. Ainsi les individus du groupe i sont valus selon la fonction objectif fi .
Laffectation de chaque individu un groupe se fait alatoirement et chaque gnration. Ainsi chaque individu appartiendra un groupe potentiellement diffrent
chaque gnration, et sera valu sur chaque objectif.
Une des principales limites lies cette approche vient du fait mme que chaque
objectif est considr indpendamment des autres. La slection ne tient en effet
compte que dun objectif, ce qui a tendance favoriser les meilleurs individus pour
cet objectif. De fait les solutions de compromis sont pnalises. Pour pallier ce
problmes, la prise en compte simultane de tous les objectifs savre tre ncessaire.
Cest ce que permettent les approches de type Pareto.
3.3.4
93
Ces approches utilisent la relation de dominance lintrieur mme des algorithmes. Ainsi les solutions ne sont plus values vis vis dune fonction objectif
mais vis vis dun compromis impliquant toutes les fonctions objectif. Depuis les
premiers travaux bass sur la notion de Pareto, o [Goldberg 1989] introduit la notion de rang de dominance dune solution, de nombreux algorithmes sont apparus.
Du fait que la notion mme de Pareto implique la prise en compte dune population, on retrouve naturellement de nombreux AG appartenant cette famille. Mais
comme nous le verrons, il y a galement des recherches locales bases sur la notion
de Pareto, ainsi que des approches hybrides. Plus rcemment, les mthodes base
dindicateurs sont apparues. Au lieu de considrer les solutions de la population,
cest la population elle-mme qui est value au travers dindicateurs choisis.
3.3.4.1
Les oprateur de "ranking" Ds lors quune solution nest plus value par
rapport ses fonctions objectif, il importe de dfinir une mtrique capable de reprsenter le niveau de qualit dune solution. Ainsi plusieurs mthodes ont t proposes
et sont souvent associes des AG couramment utiliss. Les trois principales rpertories dans [Zitzler 2004] sont prsentes ici.
Le rang de dominance : Il est dfini, pour une solution s donne, par le nombre
de solutions qui domine s incrment de 1 [Fonseca 1993]. Ainsi les solutions
de rang 1 sont les solutions non-domines et plus une solution est domine
par un nombre important de solutions de la population, plus son rang se
dtriore. Le rang de dominance a t appliqu lorigine dans la mthode
MOGA (Multiobjective Genetic Algorithm) [Fonseca 1993].
Le compte de dominance : Ici, linverse du rang de dominance, cest le nombre
de solutions domines par la solution s qui dtermine son rang. Ainsi un rang
lev traduit une bonne qualit de la solution.
La profondeur de dominance : Dans cette approche les solutions sont regroupes par fronts de Pareto [Goldberg 1989], les solutions non-domines de la
population reoivent la valeur 1 puis sont retires de la population. Les nouvelles solutions non-domines reoivent alors la valeur 2 puis sont galement
retires de la population. Et ainsi de suite jusqu avoir class toutes les solutions. Comme on le verra plus tard, toutes les solutions dun mme front
ayant la mme valeur impose de recourir des mcanismes complmentaires
pour les distinguer. Cette dfinition de la profondeur de dominance est utilise dans les algorithmes NSGA (Non-dominated Sorting Genetic Algorithm)
[Srinivas 1994] et NSGA-II [Deb 2002].
94
95
Algorithm 1 NSGA-II
Require: population size N , generation number nbIter /*nbIter can be replaced
by a time limit*/
1: P init(N ) /*init population P with N random individuals*/
2: Q /*init an empty children population*/
3: eval(P ) /*eval objectives for each individual */
4: for i = 1 to nbIter do
5:
P P Q
6:
assignRank(P ) /*based on Pareto dominance*/
7:
for each non-dominated front f P do
8:
setCrowdingDist(f )
9:
end for
10:
sort(P ) /*by rank and in each rank by the crowding dist */
11:
P P [0 : N ]
12:
Q buildNextGeneration(P ) /*Binary Tournament Selection, Recombination and Mutation*/
13: end for
SPEA2 (Strenght Pareto Evolutionary Algorithm) [Zitzler 2001] est une version
amliore de SPEA. En plus de la population P servant slectionner les parents
de lAG, cette approche utilise une archive complmentaire A, de taille fixe, pour
stocker NA solutions non-domines au cours de la recherche. Au cas o le nombre de
96
solutions non-domines est infrieur NA , larchive est complte avec les meilleurs
individus domins de la population P , en utilisant le critre de compte de dominance.
Pour ce faire, chaque solution s de la population P A est attribue la valeur g(s)
correspondant au nombre de solutions de P A que s domine :
g(s) = |{s0 : s0 P A et s s0 }|
(3.8)
La valeur de fitness h(s) attribue la solution s est gale la somme des g(s0 )
pour tout s0 dominant s :
h(s) =
g(s0 )
(3.9)
s0 P A,s0 s
Ainsi une solution s non domine est telle que h(s) = 0. Inversement, plus h(s)
augmente, moins bonne est la solution s.
Bien que le compte de dominance ait tendance permettre une certaine diversit, il met surtout en avant lintensification. Pour distinguer les solutions ayant
le mme compte de dominance, SPEA2 intgre un deuxime mcanisme ddi au
"sharing" pour favoriser la diversit. Il sagit dune adaptation de la mthode du
kme plus proche voisin [Silverman 1986], o la densit dun point est inversement
proportionnelle la distance le sparant du kme plus proche voisin. La densit
dune solution s est dcrite par :
D(s) =
1
sk + 2
(3.10)
(3.11)
97
plus une solution. Ce principe permet de garantir une bonne couverture de lespace
de recherche.
L encore deux populations voluent paralllement. La population P pour lalgorithme gntique lui-mme, et la population archive A pour stocker les solutions
non-domines rencontres. A chaque itration deux individus a et p sont slectionns, respectivement de A et P , et sont utiliss pour crer k enfants ci , avec i = 1...k.
On notera que la slection de a se fait alatoirement alors que pour p un tournoi
binaire est utilis.
Les enfants ci ont la possibilit dintgrer les deux populations, selon des critres
diffrents. Le critre retenu pour intgrer P est la dominance au sens de Pareto. Par
contre pour intgrer larchive le critre est plus slectif : cest l-dominance qui est
utilise.
Ds lors on distingue trois cas pour lintgration de ci dans P :
si ci domine au moins une solution de P , elle remplace dans P alatoirement
une des solutions domines
si ci est domine par au moins une solution de P , elle est rejete
sinon, ci remplace une solution de P choisie alatoirement
De mme on distingue trois cas pour lintgration de ci dans A :
si ci domine au moins une solution de A, elle remplace dans A toutes les
solutions domines
si ci est domine par au moins une solution de A, elle est rejete
sinon, ci remplace une solution de A choisie alatoirement
SEEA (Simple Elitist Evolutionary Algorithm) propos par [Liefooghe 2010] est
une approche gntique qui ne ncessite pas de fixer de paramtres. Elle est particulirement adapte pour rsoudre des problmes pour lesquels lvaluation des
solutions ne demande que peu de temps. Dans ce cas, elle prsente lavantage de
converger rapidement.
Dans cette approche les parents sont directement issus de larchive A. Il ny
a donc pas dautres populations que larchive. A chaque gnration, N solutions
de A sont choisies alatoirement. Elles fournissent les parents pour y appliquer les
oprateurs de croisement et de mutation.
Les enfants ci obtenus sont intgrs larchive selon le critre de dominance :
si ci est domin par un lment de A, il est rejet
si ci domine des solutions de A, il remplace dans A toutes les solutions domines
sinon ci est intgr A
98
3.3.4.2
Contrairement aux AG trs rpandus pour rsoudre des MOP, les recherche locales sont plus rares, du moins pour ce qui est des approches Pareto. En effet, comme
nous lavons vu la notion mme de Pareto suppose de considrer une population ce
qui la rend particulirement adapte aux AG. Mais il est tout de mme possible
deffectuer une recherche locale, donc solution unique, sur la base dune relation
de dominance, donc par rapport une population.
Les recherches locales, dans leur mode de fonctionnement, requirent une structure de voisinage.
Dfinition 17 (Structure de voisinage) Une structure de voisinage N est une
fonction de X 2N qui, toute solution x X, attribue un certain nombre de
solution N (x) X. De fait, N (x) est le voisinage de x, x0 N (x) est un voisin de
x.
Les approches par transformation dun MOP en problme mono-objectif prsentes en section 3.3.2 peuvent tre utilises conjointement larchivage des solutions non-domines rencontres. De ce fait on pourra faire voluer la recherche locale
mono-objectif en fonction de la construction de larchive. Par exemple, les poids permettant de combiner les fonctions objectif dans la mthode par agrgation peuvent
tre fixs pour permettre la recherche de sloigner de larchive dj constitue.
Nous nous focaliserons ici uniquement sur les recherches locales qui intgrent la
notion de dominance. Il sagit de la classe de problmes appele dans [Liefooghe 2012]
DMLS (Dominance-based Multiobjective Local Search).
Les approches de type DMLS prsentent la caractristique commune de reposer
sur une archive de solutions non-domines que lon cherche amliorer. Dune faon
gnrale, lide est de considrer les solutions de larchive, dexplorer leurs voisinages,
et de mettre jour larchive avec les nouvelles solutions non-domines rencontres.
Larchive est donc ici de taille variable. Lalgorithme sarrte spontanment lorsquil
ne reste plus de solution de larchive avec de nouveau voisin non-domin.
PLS (Pareto Local Search) [Paquete 2004] a une archive A qui est initialise avec
une premire solution alatoire, marque comme non-exploite. A chaque itration,
une solution s A est choisie alatoirement parmi les solutions non-exploites.
Le voisinage complet de s est alors explor, toutes les solutions s0 V (s) sont
candidates pour lintgration larchive. Si aucune solution de A ne domine s0 , s0
est ajoute A. Toute solution de A domine par s0 est alors retire de larchive.
Cette recherche locale particulirement rpandue pour aborder les MOP est uti-
99
PAES (Pareto Archived Evolution Strategy) [Knowles 1999] prsente une recherche
locale relativement diffrente de PLS. L encore une solution initiale est gnre alatoirement, value pour chaque objectif, et intgre larchive A. lci larchive est
de taille borne. A chaque cycle lalgorithme choisit une solution s A, la recopie
dans s0 , puis applique un oprateur de mutation s0 . A ce titre cet algorithme est
parfois class dans la famille des AG. Toutefois il ny a ni croisement, ni slection
de parents. En fait la mutation dfinit loprateur de la recherche locale. Il y a alors
une comparaison entre s et s0 .
Si s0 domine s, elle la remplace dans A. Si s domine s0 , s0 est rejete. Par contre si
s et s0 sont non-comparables, s0 est compare larchive. Si elle domine une solution
de A elle est intgre. Si elle est domine par une solution de A elle est rejete. Sinon
(il sagit dun meilleur compromis), lintroduction ou non dans larchive se fait sur
la base dune hyper-grille, de faon favoriser la diversit de larchive.
3.3.4.3
Les approches base dindicateur constituent incontestablement une des orientations phare de ces dernires annes. Alors que les indicateurs sont souvent utiliss
pour valuer le niveau de performance des ensembles de solutions (cf section 3.4),
ici ils sont incorpors au sein mme de lalgorithme. Les approches de ce type sont
IBEA (Indicator Based Evolutionary Algorithm) propos par [Zitzler 2004] est
un algorithme volutionnaire base dindicateur. Jusque-l nous avons vu des approches gntiques bases sur des oprateurs de ranking qui taient trs efficaces en
matire dintensification, mais qui ncessitaient des mcanismes complmentaires
pour bien grer la diversit des solutions. Ici le problme est rgl en considrant
un indicateur binaire I. Il est dfinir en fonction des orientations donner
lalgorithme, pour quilibrer selon les besoins les phases dintensification et de diversification. I reprsente ainsi le but global que lon souhaite viser. Il permet de
dterminer pour chaque solution x de la population P ce quelle apporte pour atteindre cet objectif. De ce fait la fitness F (x) attribue x correspond la perte de
qualit quengendrerait son absence, plus F (x) est grande plus x a de limportance
dans la population. La formulation de F (x) retenue dans IBEA est :
F (x) =
eI(x ,x)/k
(3.12)
x0 P \{x}
i{1,...,n}
(3.13)
Cet indicateur calcule ainsi la translation minimale ncessaire pour que z domine
faiblement z 0 . Un autre indicateur est galement propos : lindicateur hypervolume
diffrentiel IHD [Zitzler 1999]. Mais il est noter que tout autre indicateur peut tre
utilis selon leffet recherch.
101
cateur, celui-ci ntant pas impos par lalgorithme. Cest donc chacun de dfinir,
selon le but atteindre, lindicateur appropri.
IBMOLS prend en entre un indicateur I et une population initiale P de taille k
(qui peut tre compose de k solutions alatoires). A chaque itration, le voisinage
complet de toutes les solutions de P est explor. Tous les voisins sont candidats
lintgration dans P . Les solutions non-domines par P y sont ajoutes. Les solutions
de P domines par une solution nouvellement intgre sont supprimes. A ce stade
la taille de la population peut avoir considrablement grossi. Une rduction de P est
ralise en retirant successivement la solution ayant la plus mauvaise contribution
au sens de lindicateur. Cette rduction est faite jusqu ce que P soit nouveau de
taille k.
Lalgorithme IBMOLS sarrte spontanment lorsquaucun voisin de larchive
ne peut plus tre ajout. Les auteurs prcisent que cet algorithme dcrit un cadre
gnral, mais quil est possible de dfinir des variantes.
Approches base de lindicateur hypervolume Parmi les indicateurs actuellement trs utilis, lindicateur hypervolume ressort tout particulirement. Dans
[Brockhoff 2008], une analyse approfondie de ces approches est propos. On renverra
notamment SMS-EMOA [Beume 2007]. Dans cet AG, loprateur de slection est
bas sur lindicateur hypervolume (maximisation de lhypervolume domin) combin
un tri selon la non-domination. On trouvera galement lapproche MO-CMA-ES
(MultiObjective-Covariance Matrix Adaptation-Evolution Strategy) [Igel 2007], qui
sappuie sur lalgorithme mono-objectif CMA-ES [Hansen 2001]. Enfin [Zitzler 2007]
propose une mthodologie permettant de dfinir une mesure de la qualit qui sappuie sur la mesure de lhypervolume.
3.3.5
Afin de rsoudre un MOP, nous avons prsent jusqu prsent les mthodes
par transformation dun problme mono-objectif, les mthodes dvolution parallle, galement appeles non-Pareto, et les approches Pareto bases sur la relation
de dominance. Ces approches dites "pures" ont t les seules mtaheuristiques dveloppes jusque dans les annes 1990. Les premire approches hybrides apparurent
cette poque. Elles consistent incorporer lintrieur dun de ces algorithmes
des lments provenant dune autre mthode. De ce fait elles ont la particularit
de fournir des algorithmes pouvant appartenir une des classes prsentes, mais
aussi ventuellement plusieurs. De plus il est galement possible de coupler une
approche de type heuristique avec une mthode exacte.
Avec les approches base dindicateurs, les approches hybrides connaissent au-
3.3.5.1
3.3.5.2
103
3.3.5.3
3.3.5.4
3.4
Nous lavons vu, une des principales sources de difficult lorsque lon aborde un
MOP vient du fait que le problme admet potentiellement un trs grand nombre de
solutions. Cest une difficult pour rsoudre le problme doptimisation et pour valuer le niveau de performance dun algorithme travers lvaluation de lensemble
des rsultats. Alors quen mono-objectif lefficacit dun algorithme dcoule immdiatement de lvaluation de la solution gnre, lors de la rsolution dun MOP ce
nest gnralement pas le cas. Prenons deux ensembles A et B, les seuls cas triviaux
sont lorsque toutes les solutions de A sont domines par des solutions de B ou inversement. Dans tous les autres cas, o des solutions de A sont non-domines par
des solutions de B ou des solutions de B sont non-domines par des solutions de
A, il apparait difficile de dterminer quel ensemble est le meilleur, cest--dire quel
ensemble apporte les solutions les plus intressantes. Le recours des indicateurs de
performance est donc primordial.
On distinguera deux types dindicateurs : les indicateurs unaires (ou absolus),
capables dattribuer directement une note un ensemble, et les indicateurs binaires
(ou relatifs), qui prennent deux ensembles en paramtres et attribuent une note
un ensemble par rapport un autre. Nous prsentons les indicateurs principaux de
la littrature.
3.4.1
Indicateur de contribution
Il sagit peut-tre de lindicateur le plus intuitif. Lindicateur binaire de contribution [Meunier 2000], gnralement not IC (A, B), dtermine quel ensemble de A
ou B apporte le plus de solutions non-domines par lautre ensemble. Il rejoint la
mtrique C propose par [Zitzler 1999] peu de temps avant.
Plus formellement IC (A, B) revient calculer :
IC (A, B) =
|AB|
2
+ |WA | + |NA |
|N D(A B)|
(3.14)
3.4.2
Indicateur -additif
Cet indicateur binaire propos dans [Zitzler 2003] est particulirement intressant. Il dtermine la translation minimale appliquer toutes les solutions de A,
et sur tous les objectifs, pour dominer B. Formellement a revient calculer :
I+ (A, B) = min{x B, x0 A : x + x0 }
R
(3.15)
3.4.3
Indicateur hypervolume
La fonction slice prend une liste pl de points pour les objectifs k...n et renvoie
un ensemble de listes de points issus de pl pour les objectifs k + 1...n. La Figure 3.9
illustre cette dcomposition. La liste des solutions a, b, c, d est trie par ordre dcroissant selon laxe des x (objectif f1 ). On aperoit en-haut de la figure gauche
lhypervolume total. La construction de la premire tranche slice1 est ralise partir de a jusqu b (sur laxe des x). Elle est reprsente en-bas droite. La deuxime
tranche part de b et de la projection de a dans le plan normal f1 contenant b, jusqu c. Lalgorithme continue partir du plan contenant c jusquau plan contenant
d, puis du plan contenant d jusquau plan contenant le point de rfrence.
Ce mcanisme est appliqu nouveau mais selon laxe y (objectif f2 ). Il permet
de dcomposer chaque ensemble de points issu de la dcomposition selon f1 .
3.4.4
IG (A, B) =
!1/p
dpi
i=1
(3.16)
3.5
Synthse
Dans ce chapitre ont t prsents les nombreux concepts permettant dapprhender la rsolution dun problme multiobjectif (MOP). La complexit que soulve
cette classe de problme impose en effet de dfinir une formalisation mathmatique
approprie, ainsi que des mthodes de rsolution efficaces.
Dans un premier temps, nous avons prsent les principales notions impliques
dans la rsolution dun MOP. En particulier la notion de Pareto optimalit apparait
3.5. Synthse
109
Chapitre 4
Algorithmes mmtiques et
optimisation multiobjectif
Ce chapitre est consacr llaboration dune mtaheuristique multiobjectif hybride. Elle a t exprimente sur un problme rel de localisation de stations pour
un service dauto-partage.
Dans un premier temps, une prsentation des caractristiques propres aux algorithmes mmtiques est faite. Ensuite, nous dtaillons llaboration et le fonctionnement de lalgorithme propos MEMO. La troisime partie de ce chapitre traite dun
cas dtude : la localisation de stations dauto-partage. Dans cette partie est prsent
le problme, ainsi que sa modlisation sous la forme dun problme multiobjectif. La
partie suivante fournit une analyse comparative dtaille entre les approches de rfrence NSGA-II, PLS et FLSMO, et lalgorithme MEMO. Enfin une dernire partie
aborde le problme de laide la dcision en contexte multiobjectif, avec la proposition de la plate-forme logicielle geoLogic.
Sommaire
4.1
Introduction
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2
4.3
4.4
4.5
4.6
4.7
Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
4.1
Introduction
Aprs avoir prsent un tat de lart des approches permettant de rsoudre des
problmes multiobjectifs (Multiobjective Optimization Problem - MOP), puis la
faon de modliser la manire dont les personnes se dplacent sur un territoire, nous
nous attachons dans ce chapitre dfinir une heuristique de type mmtique pour
rsoudre des problmes multiobjectifs. Le cas dtude retenu ici est la localisation de
stations pour un service dauto-partage, problme mlant modlisation de la mobilit
et optimisation.
Lquation 4.1 rappelle la formulation gnrale dun problme multiobjectif dj
prsente en section 3.2.2 :
z = f (x)
max
(4.1)
M OP
o
f (x) = (f1 (x), f2 (x), ..., fn (x))
tel que : x X
Parmi les nombreuses difficults que posent les MOP, une des principales est lie
au fait que cette classe de problmes donne lieu une varit de solutions. En effet,
il existe rarement une solution optimale unique, qui soit la meilleure sur tous les
objectifs. Le rsultat est donc un ensemble de solutions, dites de meilleur compromis. Ds lors il apparait indispensable de distinguer deux tapes dans la rsolution
dun MOP : la construction de lensemble des solutions non-domines (processus
doptimisation multicritre) puis le choix de la solution retenir (processus daide
la dcision multicritre). Dans ce chapitre nous nous focaliserons dans un premier
temps sur la construction de lensemble Pareto [Coello 2004], ensemble qui a pour
image dans lespace des critres le front de Pareto (Pareto Front - FP). La faon
daider le dcideur choisir la solution implmenter fait lobjet de la fin de ce
chapitre.
Les approches de type hybride tel que les algorithmes mmtiques ont dj fait
leurs preuves dans le domaine mono-objectif en permettant de rsoudre de nombreux problmes. Le concept mme de mmtique fut introduit par Pablo Moscato [Moscato 1989] pour parler dune heuristique base de population incluant
une recherche locale. Parmi les problmes o lapproche mmtique fournit de trs
bon rsultats, on citera lexemple du problme acadmique de coloriage de graphe,
connu pour tre trs difficile, et qui est rsolu avec de trs bonnes performances
[Galinier 2013].
Les rsultats obtenus par les approches mmtiques en mono-objectif ont incit
les chercheurs transposer ce mcanisme dhybridation au contexte multiobjectif
[Talbi 2001][Jaszkiewicz 2002]. Le mcanisme consistant introduire une recherche
locale dans un algorithme gntique (AG) est alors gnralement utilis pour acclrer le droulement de lalgorithme, mais pas uniquement. Lhybridation joue ga-
113
lement un rle dans la faon dexplorer lespace de recherche ; le but tant de fournir
de nouvelles proprits permettant damliorer lensemble des solutions trouves.
En effet les AG utiliss seuls ont souvent tendance faire progresser la population
dans certaines rgions de lespace de recherche, ce qui a pour consquence de crer
des clusters. Lintroduction de la recherche locale permet quant elle de se focaliser
sur une direction, souvent choisie vers le front de Pareto (meilleure intensification),
mais parfois aussi de faon obtenir une meilleure rpartition sur le font de Pareto
(meilleure diversification). La recherche locale dans un AG permet ainsi de guider
la progression de la population pour garantir les proprits souhaites. Ds lors
que sont hybrides deux mtaheuristiques, recherche locale et algorithme gntique,
connues pour tre trs performantes toutes les deux, se pose la question de lapport
de chacune delles. Aussi nous nous intresserons galement dans ce chapitre identifier si, travers lhybridation, lalgorithme mmtique bnficie des avantages de
chaque mtaheuristique, ou si de nouvelles proprits sont engendres.
Nous prsenterons tout dabord le principe fondateur des algorithmes mmtiques. Dans une deuxime partie, lalgorithme hybride MEMO que nous proposons
sera dtaill. Ensuite nous introduirons le problme auquel nous avons appliqu lalgorithme MEMO, un problme de localisation de stations pour un service dautopartage de type autoLib. La section suivante sera consacre une comparaison
entre les rsultats obtenus avec lapproche hybride et les rsultats issus de mtaheuristiques pures, que ce soit des approches gntiques ou des recherches locales. Enfin,
une dernire partie introduira le problme de laide la dcision dans un contexte
multiobjectif, avec une prsentation de la plate-forme geoLogic.
4.2
La faon dont intervient la recherche locale dans lAG peut varier selon les approches. Ainsi la recherche locale peut, comme souvent la mutation, survenir alatoirement avec une certaine probabilit, ou encore aprs un certain nombre de gnrations. Mais il est galement possible de lappliquer chaque nouvel individu rsultant
dun croisement. Lquilibre entre recherche globale (gntique) et recherche locale
est primordial pour obtenir de bons rsultats.
4.2.1
115
4.2.2
4.2.3
LS
AG
Mmtique
Recherche Locale
Descente Tabou Recuit
int
div
div
int
div
div
Algorithme volutionnaire
Slec. Crois. Mut. Rempl.
int
int
div
int
int
div
int
int
Pour rpondre ces questions revenons au fonctionnement de chaque mtaheuristique prise sparment afin dtudier leur fonctionnement. En particulier le
point central de tout algorithme doptimisation, que ce soit en mono-objectif ou
en multiobjectif, est la faon dont squilibrent lintensification et la diversification,
concepts galement connus sous les termes dexploitation et dexploration respectivement.
Nous tentons dans le tableau 4.1 une synthse de linfluence des diffrentes composantes des AG et recherches locales, en matire de diversification et intensification. Chaque ligne reprsente une heuristique (Locale, Gntique, Mmtique), et
chaque colonne un oprateur (de la famille des recherches locales gauche et des
AG droite). Les cases contiennent le rle dominant correspondant loprateur
de la colonne pour lalgorithme de la ligne, en matire dintensification (int) et de
diversification (div).
Ainsi dans la recherche locale la descente joue un rle dintensification, alors
que les paramtres de la Recherche Tabou ou du Recuit Simul jouent un rle de
diversification.
De mme dans le cas dun AG, la slection, le croisement et le remplacement
tendent intensifier la population et la mutation la diversifier. Bien entendu ce
tableau nest pas exhaustif mais traduit une tendance gnralement constate. En
particulier il est possible de nuancer linfluence des oprateurs, en introduisant une
certaine dose dalas dans la slection par exemple.
Llment particulirement intressant remarquer est linversion des rles entre
croisement et mutation selon que lon ait faire un AG ou un algorithme
mmtique. En effet, alors que le croisement est loprateur dintensification cl pour
un AG (cest gnralement suite un croisement que de nouvelles bonnes solutions
mergent), il a un rle de diversification dans le contexte mmtique. Inversement la
mutation qui introduit souvent de la diversit en gntique, lorsquelle est remplace
par une descente en mmtique, elle devient un oprateur dintensification.
Ainsi nous sommes tents de considrer quun algorithme mmtique nest ni
plus ni moins quune recherche locale base de population, dans laquelle le croisement joue un rle doprateur de diversification. Ce nest pas le croisement qui
117
4.3
4.3.1
LAG choisi pour servir de base lalgorithme MEMO est NSGA-II [Deb 2002]
propos par Deb et al. Il sagit certainement de lAG le plus utilis pour rsoudre des
problmes multi-objectifs, bien quil existe des algorithmes plus efficaces. NSGA-II
prsente lavantage de proposer un trs bon compromis entre performance et simplicit de fonctionnement. Il sagit ainsi encore aujourdhui dun algorithme souvent
utilis comme rfrence, pour comparer les performances des nouvelles approches
proposes.
4.3.1.1
Elle fait partie des lments dfinis dans lalgorithme NSGA-II. Il sagit dun
tournoi binaire permettant de favoriser les meilleures solutions sans pour autant
liminer totalement les autres solutions. Le tournoi est bas sur le rang des solutions
dont le calcul est dtaill dans le chapitre 3. NSGA-II implique le recours un tournoi
binaire, mettant en comptition deux solutions uniquement. On notera toutefois que
plus gnralement il est possible de mettre plus de deux solutions en comptition.
La Figure 4.1 montre la slection de la solution s2 suite la mise en tournoi de
s2 et s6 . Dans cette illustration plus le cercle est grand, meilleure est la solution.
Dans le cas dun tournoi, les individus mis en comptition sont quant eux choisis
alatoirement. On voit ainsi que s2 est choisie sans tre la meilleure, simplement
parce quelle est meilleure que s6 .
La slection peut ainsi tre vue comme un oprateur dintensification, dans la
,%-&.**%+#
!"#
/.(01*%+#
!"#
!"#
!%#
!%#
!(#
!%#
!(#
!'#
!(#
!'#
!$#
!*#
119
!$#
!*#
!)#
!&#
!'#
!$#
!*#
!)#
!&#
!)#
!&#
4.3.1.2
Le croisement
Contrairement la slection des parents, loprateur de croisement nest pas dfini dans NSGA-II. Ceci sexplique par le fait que le croisement peut tre troitement
li au problme et dpend donc du cas de figure.
Sans connaitre le problme rsoudre il apparait ainsi dlicat de prconiser
un oprateur de croisement plutt quun autre. Cest pourquoi nous proposons ici
denvisager deux oprateurs de croisement, avec deux niveaux dlitisme. Le choix
dun oprateur ou de lautre se fera au regard des rsultats obtenus dans les deux
cas.
Un croisement litiste Nous choisissons pour ce croisement de prendre les meilleurs
gnes de chaque parent. Toutefois ds lors que lon parle de meilleur gne il faut tre
en mesure dattribuer une valeur chaque gne, ce qui soulve deux problmes.
Dune part cela suppose que lon puisse identifier la contribution de chaque gne
lvaluation globale de la solution, ce qui nest pas forcment le cas. Dautre part
nous sommes dans un contexte multiobjectif. Il nexiste donc pas de relation dordre
total entre les solutions et par consquence entre les gnes contributeurs la solution,
chaque gne possdant une contribution chacun des objectifs.
Il apparait alors ncessaire de dfinir la faon dont on va comparer les gnes
Figure 4.2 Croisement litiste : chaque parent fournit ses meilleurs gnes
Malgr le caractre litiste du croisement propos, on notera que cette opration
dans le contexte mmtique peut tre vue comme un oprateur de diversification. En
effet le croisement a pour effet de dstructurer les solutions pour fournir un nouveau
point de dpart pour la recherche locale.
121
4.3.1.3
La gestion de population
4.3.1.4
Et la mutation...
4.3.2
Chaque solution rencontre lors de la recherche locale qui nest pas domine par
larchive est ajoute cette dernire. Larchive est ainsi construite et alimente par
la recherche locale.
La solution s la fin de la recherche locale, qui correspond loptimum local, est
ajoute la population utilise pour la partie gntique. Elle sert donc construire
les gnrations suivantes.
On notera quil aurait galement t possible de choisir nimporte quelle autre
solution non-domine rencontre au cours de la recherche locale. En effet, en termes
de dominance la dernire solution nest a priori pas meilleure que nimporte quelle
123
autre solution non-domine. Il aurait alors t possible de dfinir dautres critres tel
que celui de diversit en appliquant une fonction de sharing pour choisir la solution
intgrer la population pour lAG. Ici nous avons choisi de donner la priorit la
direction choisie qui nadmet quune meilleure solution : la dernire trouve.
La recherche locale choisie ici repose donc sur lagrgation des fonctions objectif. Elle prsente lavantage dtre simple et rapide. Il aurait galement t envisageable de choisir une recherche locale de type Pareto, telle quun algorithmes
DMLS [Liefooghe 2012]. Ceci aurait permis de conserver le caractre multi-objectif
du problme. Toutefois ce type dapproches, dans le cadre dune hybridation, pose
la question de larchive servant de rfrence. En effet, si la recherche locale applique
chaque enfant part dune archive vide, la recherche locale base sur le critre de
dominance prendrait un temps considrable, bien souvent pour r-explorer des parties de lespace de recherche dj explores prcdemment. A linverse, si larchive
initiale de chaque recherche locale est constitue de larchive globale de lalgorithme
mmtique, le risque est que les enfants soient directement domins par une solution
de larchive ce qui arrterait la recherche avant mme quelle nait commenc.
4.3.3
La figure 4.3 illustre les trois tapes principales : la slection des parents p1 et p2 ,
leur croisement pour donner naissance la solution s, suivi dune recherche locale
4.4
4.4.1
4.4.2
4.4.3
4.4.3.1
4.4.3.2
Afin de rpondre aux enjeux poss prcdemment, nous proposons trois objectifs
optimiser. Ces fonctions ont pour rle didentifier parmi les sites candidats lesquels
retenir afin dy placer une station.
Dfinition 18 (Site candidat) On appelle site candidat une maille carre pouvant
fmin (sti ) =
min
stj s\{sti }
f (stj , sti , t)
stj s\{sti }
entre flux entrant et flux sortant tout au long de la journe pour sti .
!
fmax (sti ) =
P
t
max
P
stj s\{sti }
P
stj s\{sti }
f (stj , sti , t)
mum entre flux entrant et flux sortant tout au long de la journe pour sti .
La fonction correspond au flux demand total.
Maximiser les flux de dplacement Il sagit de lobjectif qui semble tre le plus
intuitif. En effet les stations doivent tre positionnes de faon tre lorigine et
la destination dun maximum de besoins en termes de dplacement. Il ne sagit donc
pas simplement de mettre les stations dans les zones attractives comportant le plus
de personnes mais de faon satisfaire un maximum dchanges origine/destination.
La Figure 4.6 montre que mettre simplement les stations dans les zones les plus
attractives ne suffit pas forcment. On y voit en particulier des zones (A F ) avec
les changes existants entre chaque zone. Lpaisseur de la flche traduit le nombre
de dplacements existants. Les zones rouges sont les zones slectionnes pour mettre
une station.
Dans cet exemple il sagit de placer deux stations dans les zones les plus intressantes. Sur la figure de gauche on place les stations sur les zones les plus attractives
(A et B). On remarque toutefois que bien que lattractivit soit forte, les changes
entre A et B sont trs faibles ce qui est dfavorable au fonctionnement de lautopartage. Sur la figure de droite au contraire les stations sont positionnes de faon
maximiser les flux (A et E sont choisies). Cela montre un fonctionnement favorable.
Cela revient tudier un graphe totalement connect, non pas en termes de
sommet (attractivit) mais en termes dartes (dplacements). Ce problme est dj
de nature combinatoire.
On dfinit alors la fonction f1 maximiser qui a pour objectif de favoriser le
flux de dplacements entre les stations :
f1 (s) =
f (sti , stj )
(4.3)
Figure 4.7 Equilibre des flux entrants / flux sortants linstant t pour la station
s
X fmin (sti )
f
(sti )
st s max
(4.4)
f3 (s) =
X
sti s
4.4.3.3
1 X
(f (sti , t) f(sti ))2
|T | t
(4.5)
(4.6)
max
z = f (s)
s
o
f (s) = (f1 (s), f2 (s), f3 (s))
LOC
tel
que
:
s = {st1 , ..., stn }
(4.7)
(4.8)
4.5
Dans cette section sont prsents les rsultats obtenus ainsi que les mthodes permettant de positionner lalgorithme MEMO par rapport aux approches existantes.
En effet, la comparaison des performances dalgorithmes multiobjectifs est particulirement dlicate. Pour cause, le rsultat ntant pas une solution unique mais un
ensemble de solutions non-domines entre elles, il importe de dfinir des lments
de comparaison, tels que des indicateurs qui permettent dattribuer une valeur de
fitness un ensemble de solution.
La non-comparabilit de deux ensembles est illustre avec la figure 4.9. On voit
dans cet exemple que toutes les solutions dun ensemble ne sont pas domines par
135
4.5.1
Parmi les indicateurs prsents au chapitre 3, nous en avons retenu trois pour
tudier les rsultats fournis par MEMO :
lindicateur additif [Zitzler 2003]
lindicateur de contribution [Meunier 2000]
lindicateur hypervolume [Zitzler 1999]
On notera galement le nombre de solutions non-domines trouves par les algorithmes tudis, ce qui constituera galement un indicateur.
4.5.1.1
Indicateur -additif
Cet indicateur donne la translation minimale appliquer dans chaque dimension lensemble A pour quil domine lensemble B.
I+ (A, B) = min{x B, x0 A : x + x0 }
R
(4.9)
4.5.1.2
Indicateur de contribution
Lors de la comparaison de deux ensembles rsultats A et B, lindicateur de contribution not IC (A, B) dtermine la proportion de solutions non domines apporte
par A dans N D(A B), avec N D retournant les solutions non-domines.
IC (A, B) =
|AB|
2
+ |WA | + |NA |
|N D(A B)|
(4.10)
4.5.1.3
Indicateur hypervolume
137
Pour normaliser les objectifs nous pouvons dterminer les valeurs extrmes sur
chaque objectif pour les ensembles Pareto obtenus au cours de nombreux runs de
diverses mthodes. De cette faon chaque objectif normalis est compris entre 0
et 1. Il nest pas exclu de trouver une valeur normalise < 0 (solution pire que la
pire solution trouve au cours des nombreux runs) ou encore > 1 (on amliore la
meilleure solution trouve) lors dune nouvelle excution.
En thorie, pour lobjectif n, s S, fnmin fn (s) fnmax . Il sen suit que
nous avons la normalisation :
0
4.5.2
fn (s) fnmin
1
fnmax fnmin
(4.11)
Il ne fait aucun doute que les rsultats obtenus lors dune excution dun algorithme stochastique ne permettent pas de conclure sur les performances de lalgorithme en question. En effet la nature alatoire de ces algorithmes fait quune
excution peut tre bonne et la suivante mdiocre. Pour pallier ce problme, une
moyenne est gnralement calcule sur plusieurs excutions. Dans notre situation
nous avons ralis pour chaque test une srie de 5 excutions afin de dterminer
des valeurs moyennes, que ce soit pour lvaluation des fonctions objectifs ou des
indicateurs.
Bien que nous jugerons de la performance dun algorithme sur les valeurs moyennes
obtenues au cours des 5 excutions, on remarquera que dautres critres dvaluation
pourraient tre utiliss. En particulier il serait possible de considrer lcart type des
rsultats obtenus afin de dterminer le niveau de stabilit de lalgorithme, ou encore
le meilleur rsultat sur 5 excutions si lon souhaite privilgier un algorithme trs
efficace de temps en temps, et en acceptant quil soit peu performant le reste du
temps.
Ltude de la performance dun algorithme suppose de dfinir des critres de
comparaison comme nous lavons prsent en introduction, mais aussi de disposer
dun ensemble de rfrence auquel se comparer. Pour permettre davoir le meilleur
recul sur les rsultats fournis par diffrentes approches, nous allons comparer les
rsultats obtenus avec un grand nombre de configurations dalgorithmes, pour des
recherches locales et des approches volutionnaires, avant dintgrer notre algorithme
mmtique.
Etant donn que MEMO repose dessus, lalgorithme gntique de rfrence sera
NSGA-II. Pour la recherche locale nous allons comparer deux algorithmes. PLS
qui prsente lavantage de ncessiter peu de paramtrage et qui fait rfrence en
4.5.2.1
Croisement alatoire / mutation alatoire Il sagit l de lAG dans ses mcanismes les plus simples. Seuls les mcanismes de NSGA-II (slection des meilleurs
parents et remplacement des moins bons individus) agissent pour faire converger la
population vers le front de Pareto. Le croisement alatoire prend successivement un
139
gne alatoire non encore pris de chaque parent. De mme la mutation qui intervient avec une probabilit de 10% prend alatoirement un gne (une station) et le
fait muter vers une valeur alatoire (emplacement disponible).
Pop 600
min
max
mean
std
21975.203
22787.135
22448.830
-
1179.223
1225.583
1196.253
-
-26.693
-26.115
-26.402
-
3865
4115
3979
-
0.284
0.292
0.289
0.003
Pop 800
min
max
mean
std
21300.516
22787.135
22339.576
-
1189.853
1360.691
1226.781
-
-27.115
-26.013
-26.508
-
4070
4370
4265
-
0.289
0.324
0.297
0.014
Pop 1000
Pop 400
min
max
mean
std
21975.203
22718.160
22285.594
-
1184.091
1379.408
1264.523
-
-26.413
-25.870
-26.119
-
4031
4608
4406
-
0.285
0.331
0.306
0.021
Pop 400
min
max
mean
std
f1
22787.135
22787.135
22787.135
-
f2
1031.162
1196.755
1163.636
-
f3
-26.765
-25.840
-26.478
-
NbSol
2958
4113
3828
-
Hypervolume
0.236
0.292
0.281
0.022
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.755
1196.755
1196.755
-
-27.002
-26.167
-26.396
-
4281
4395
4358
-
0.292
0.293
0.293
0.000
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.200
1196.755
1196.644
-
-26.272
-25.956
-26.164
-
4537
4701
4615
-
0.292
0.294
0.293
0.000
Pop 1000
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.755
1379.408
1269.816
-
-26.389
-26.018
-26.169
-
4706
5150
4863
-
0.293
0.339
0.311
0.022
141
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.755
1196.755
1196.755
-
-27.123
-26.366
-26.765
-
3634
3922
3771
-
0.291
0.292
0.291
0.000
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1189.853
1196.755
1195.374
-
-26.686
-25.933
-26.281
-
3931
4187
4061
-
0.291
0.293
0.292
0.000
Pop 1000
Pop 400
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.755
1196.755
1196.755
-
-26.863
-26.362
-26.614
-
3855
4206
3963
-
0.290
0.292
0.291
0.001
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1077.372
1184.555
1143.831
-
-26.768
-26.590
-26.708
-
2125
3223
2781
-
0.240
0.289
0.269
0.023
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1068.192
1266.107
1201.474
-
-26.978
-26.478
-26.799
-
2385
3618
3197
-
0.239
0.297
0.284
0.022
Pop 1000
Pop 400
min
max
mean
std
22787.135
22787.135
22787.135
-
1087.381
1379.408
1223.906
-
-27.016
-26.689
-26.847
-
2484
3963
3408
-
0.244
0.337
0.292
0.030
143
Pop 400
min
max
mean
std
f1
22787.135
22787.135
22787.135
-
f2
1031.162
1256.312
1172.886
-
f3
-27.230
-26.790
-26.940
-
NbSol
2251
3524
3151
-
Hypervolume
0.237
0.296
0.282
0.023
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1028.761
1217.010
1122.358
-
-26.891
-26.590
-26.722
-
2246
3682
2882
-
0.237
0.294
0.262
0.026
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1077.942
1256.312
1187.050
-
-26.872
-26.362
-26.708
-
2370
3819
3232
-
0.243
0.298
0.276
0.026
Pop 1000
min
max
mean
std
22787.135
22787.135
22787.135
-
1031.162
1266.107
1185.167
-
-26.962
-26.355
-26.785
-
2661
3877
3426
-
0.237
0.297
0.283
0.023
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1184.555
1256.312
1211.669
-
-26.923
-26.729
-26.845
-
2749
3010
2891
-
0.292
0.299
0.295
0.003
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1031.162
1256.312
1185.407
-
-27.039
-26.435
-26.817
-
2063
3201
2893
-
0.237
0.297
0.283
0.023
Pop 1000
Pop 400
min
max
mean
std
22787.135
22787.135
22787.135
-
1087.381
1256.312
1205.781
-
-26.885
-26.651
-26.768
-
2222
3369
2982
-
0.244
0.299
0.287
0.021
145
4.5.2.2
PLS
Cette approche locale base de Pareto est dcrite de faon dtaille dans le
chapitre 3. Nous rappelons galement en section 4.5.2.3 quelques lments qui caractrisent PLS. Les rsultats obtenus sont synthtiss dans le tableau 4.8. Le premier
lment marquant concerne le nombre de solutions non-domines trouves par PLS.
Alors que NSGA-II atteint une seule fois les 5000 solutions trouves parmis toutes
les configurations testes, PLS atteint les 6400 solutions. Par ailleurs, la meilleure
valeur de lindicateur IH trouve par PLS est significativement moins bonne que
celle trouve pour NSGA-II. Ainsi PLS permet de trouver beaucoup de solutions
mais elles apportent souvent peu de diversit.
min
max
mean
std
Lalgorithme FLSMO (Fast Local Search Multiobjective) est une recherche locale base sur la notion de Pareto optimalit. Nous lavons propose dbut 2013
[Moalic 2013a] pour rsoudre ce problme de lauto-partage. Il sagit dun algorithme proche de PLS [Paquete 2004] et qui sest rvl tre particulirement efficace. Comme nous le verrons sur les Figures 4.12 et 4.13, il prsente lavantage de
converger plus rapidement que PLS.
Le principe est le suivant. Lalgorithme dmarre avec une premire solution gnre alatoirement qui est marque comme non exploite. Elle est alors ajoute
une population archive. Tant quil y a des solutions dans larchive qui ne sont pas
exploites, lalgorithme en choisit une alatoirement, note s, et explore son voisinage jusqu trouver un voisin s0 non-domin par larchive. s0 est alors ajoute
larchive et devient la nouvelle solution courante. Son voisinage est explor jusqu
trouver un nouveau voisin non domin par larchive. Ce processus est appliqu rcursivement jusqu tre dans un optimum local. Toute solution non domine par
larchive rencontre au cours de cette descente est ainsi ajoute larchive. Il sagit
de fait dune descente ralise partir de s. Lalgorithme 8 dcrit formellement ce
processus.
Algorithm 8 Fast Local Search for Multiobjective Problems
1: S init() /*init the solution set S with a random individual */
2: s select(S) /*select randomly a not explored solution from S*/
3: while s 6= do
4:
repeat
5:
s0 selectNeighbor(s) /*select randomly a neighbor of s not dominated by
S*/
6:
if s0 6= then
7:
s s0
8:
addNotDominated(s) /*add s in S and remove all dominated solutions*/
9:
end if
10:
until s0 =
11:
mark s as explored
12:
s select(S) /*select randomly a not explored solution from S*/
13: end while
Cet algorithme prsente lavantage dassurer une bonne intensification en exploitant les solutions non-domines dj trouves, tout en assurant une bonne diversit.
Pour rappel PLS fonctionne de faon assez semblable. Toutefois au lieu deffectuer une descente partir dune solution non exploite de larchive, PLS choisit une
147
solution s de larchive et explore son voisinage complet pour ajouter tous les voisins
non-domins larchive. La solution s est alors marque comme exploite.
FLSMO peut ainsi tre vu comme un algorithme avec recherche en profondeur dabord, puis en largeur. PLS par contre sapparente un parcours en largeur dabord, puis en profondeur. La Figure 4.11 illustre ce principe pour les deux
algorithmes.
FLSMO
Les rsultats de la mthode FLSMO sur 5 excutions sont reports dans le tableau 4.9. Le nombre de solutions trouves avec FLSMO est significativement plus
faible quavec PLS, en moyenne, en minimum et en maximum. Lhypervolume est
galement plus petit mais trs lgrement seulement. Les solutions de FLSMO apportent en moyenne plus de diversit que celles de PLS.
min
max
mean
std
4.5.2.4
Table 4.9
f1
22787.135
22787.135
22787.135
-
4.5.3
De la mme faon que pour NSGA-II, nous analysons limpact des lments
ayant une influence sur le droulement de lalgorithme mmtique. En particulier
les rsultats suivants sont obtenus en faisant varier le croisement, qui comme avec
NSGA-II sera soit litiste soit alatoire, ainsi que la taille de la population.
149
4.5.3.1
Pop 10
min
max
mean
std
22787.135
22787.135
22787.135
-
1783.407
1874.759
1857.137
-
-25.432
-24.989
-25.210
-
2399
2749
2619
-
0.348
0.352
0.350
0.001
Pop 15
min
max
mean
std
22787.135
22787.135
22787.135
-
1520.241
1874.759
1832.427
-
-25.540
-25.088
-25.245
-
2457
2862
2700
-
0.346
0.352
0.351
0.002
Pop 20
min
max
mean
std
22787.135
22787.135
22787.135
-
1783.407
1874.759
1853.190
-
-25.561
-25.088
-25.234
-
2664
2853
2758
-
0.350
0.353
0.351
0.001
Pop 25
Pop 5
valeurs pour IH avec moins de solutions implique que les solutions trouves sont
rellement de meilleure qualit.
min
max
mean
std
22787.135
22787.135
22787.135
-
1473.509
1874.759
1825.475
-
-25.522
-25.088
-25.293
-
2140
2908
2763
-
0.314
0.353
0.350
0.008
4.5.3.2
Le croisement litiste avait donn pour NSGA-II des rsultats moins bons que le
croisement alatoire. Nous souhaitons vrifier si cette observation se confirme dans
le cas mmtique.
Nous voyons dans le tableau 4.11 que les tailles de populations optimales sont
galement 15 et 20. Par contre, lindicateur IH est globalement moins bon que
lorsque le croisement se fait alatoirement. Nous retiendrons donc le croisement
alatoire qui apporte un gain sur la diversification de la recherche.
Pop 10
min
max
mean
std
22787.135
22787.135
22787.135
-
1520.241
1874.759
1756.767
-
-25.778
-25.192
-25.334
-
2435
3104
2861
-
0.339
0.353
0.348
0.003
Pop 15
Rsultats
f2
1517.531
1874.759
1746.403
-
min
max
mean
std
22787.135
22787.135
22787.135
-
1313.459
1874.759
1801.014
-
-25.610
-25.116
-25.316
-
2418
3174
2937
-
0.301
0.353
0.349
0.011
Pop 20
Table 4.11
f1
min
22787.135
max 22787.135
mean 22787.135
std
-
151
min
max
mean
std
22787.135
22787.135
22787.135
-
1415.791
1874.759
1716.701
-
-25.685
-25.022
-25.337
-
2338
3264
3064
-
0.338
0.354
0.349
0.004
Pop 25
Pop 5
min
max
mean
std
22787.135
22787.135
22787.135
-
1473.509
1874.759
1676.512
-
-25.777
-25.033
-25.390
-
2629
3315
3060
-
0.311
0.354
0.346
0.011
4.5.3.3
Lalgorithme MEMO a montr que, tout comme NSGA-II, le meilleur fonctionnement est obtenu avec un croisement alatoire. De plus une population de taille
20 fournit les meilleurs rsultats pour les deux types de croisement. On voit ainsi
quun croisement trop intensif nuit la recherche globale de lalgorithme. Il sagit
dun quilibre subtil trouver entre diversification et intensification.
Pour la suite de lanalyse nous utiliserons donc cette configuration de lalgorithme
en comparaison avec les algorithmes de rfrence.
4.5.4
-1%
-8%
-2%
-
43.309
35.647
39.185
2.980
+7%
+47%
+8%
-
0.378
0.437
0.416
0.021
-9%
-12%
-6%
-
4706
5150
4863
-
0.293
0.339
0.311
0.022
+22%
+28%
+27%
-
15.078
0.649
9.330
6.731
-62%
-97%
-74%
-
0.118
0.309
0.189
0.081
-71%
-38%
-57%
-
2664
2853
2758
-
0.350
0.353
0.351
0.001
+46%
+33%
+43%
-
2.097
1.544
1.815
0.178
-94%
-93%
-95%
-
0.237
0.266
0.248
0.007
-43%
-46%
-44%
-
PLS
0.235
0.243
0.239
0.003
min
max
mean
std
0.239
0.264
0.245
0.011
FLSMO
IC
0.417
0%
0.499
0%
0.442
0%
0.033
-
min
max
mean
std
3992
4405
4246
-
NSGA-II
0%
0%
0%
-
I+
40.276
0%
24.261
0%
36.173
0%
6.878
-
min
max
mean
std
MEMO
IH
NbSol
4146
6401
4808
-
min
max
mean
std
153
Figure 4.15 Solutions PLS et MEMO projetes sur f1 -f2 ; f1 -f3 et f2 -f3
155
Figure 4.16 Solutions NSGA-II et MEMO projetes sur f1 -f2 ; f1 -f3 et f2 -f3
4.5.5
157
dune heure pour PLS ce qui est une performance extrmement intressante.
4.6
4.6.1
Lorsque lon aborde un problme multiobjectif (MOP), trois phases peuvent tre
identifies. Il y a tout dabord la modlisation du problme, mathmatiquement,
avec la dfinition des fonctions objectifs. Ensuite, il y a la phase de recherche des
solutions. Cest l que se concentre la grande majorit des travaux et publications
scientifiques, travers llaboration de mtaheuristiques, capables de trouver une
solution optimale ou plus souvent aujourdhui un ensemble de solutions de meilleur
compromis. Enfin, il y a la prise de dcision qui doit conduire le dcideur faire le
meilleur choix pour son problme.
On se rend compte que gnrer lensemble Pareto nest pas suffisant. Lorsquun
algorithme retourne 1.000 solutions ou plus, aussi bonnes soient-elles en termes de
Pareto optimalit, la personne qui doit en retenir une peut rapidement tre perdue.
Choisir une solution est un processus complexe et dont le rsultat est risqu.
Selon les approches, la prise en compte des prfrences du dcideur peut intervenir de diffrentes faons. On distingue ainsi gnralement trois schmas : lexpression
du choix a priori, lexpression du choix a posteriori, et enfin lexpression du choix
interactif. Comme nous lavons vu dans le chapitre 3, certaines approches de rsolution des MOP intgrent directement les prfrences du dcideur. Cest le cas
notamment lorsque le MOP est transform en problme mono-objectif. Dans la mthode dagrgation [Cohon 1978] par exemple, le dcideur dfinit le vecteur de poids
qui donne limportance souhaite chaque objectif dans la fonction agrge. Le
choix est dans ce cas a priori et cela suppose non seulement que le dcideur sait ce
quil veut mais quen plus lalgorithme est capable de le fournir. Mais souvent dans
les approches Pareto aucune prfrence du dcideur nest intgre. Cest ce qui fait
la force de ces mthodes, mais cest galement ce qui peut poser certaines difficults.
En particulier un algorithme peut trouver de nombreuses solutions non-domines,
qui pourtant ne rpondront peut-tre pas aux attentes du dcideur. Les prfrences
du dcideur ne sont prises en compte quune fois lensemble des solutions gnr.
Le choix est exprim a posteriori. Enfin, lorsque les prfrences de lutilisateur sont
exprimes durant la recherche on parle de choix interactif.
Quelque soit le moment o intervient le dcideur, la prise en compte de ses
prfrences pour laider choisir une solution est un lment fondamental. Dans
cette section nous proposons notre approche pour aborder laide la dcision. Pour
plus de dtails sur les approches classiques daide la dcision, nous renvoyons le
4.6.2
La plate-forme geoLogic
159
les habitations, ou encore des objets de type ligne (polyline) pour reprsenter les
axes routiers. Ensuite nous voyons le rsultat obtenu aprs application dune grille
de maillage sur les donnes vectorielles. Chaque couleur reprsente une catgorie
de sol, avec en bleu les habitations, en orange les commerces, etc. Lillustration
suivante montre les dplacements sortant de la zone slectionne un moment donn.
Lorientation des flches indique les destinations et leur paisseur le nombre de
personnes faisant ce dplacement. Enfin, la vue de droite reprsente sous forme de
"vaisseaux sanguins" les axes de rue avec une intensit sur la mobilit observe. Par
effet de transparence les axes les plus emprunts ressortent plus intensment.
4.6.3
161
163
4.6.4
4.6.4.1
4.6.4.2
Le projet EcoTaxi
165
4.6.4.3
Le projet PUMDP
Figure 4.25 PUMDP : adquation entre offre et demande pour une mobilit
vlo
La Figure 4.25 montre ainsi en jaune, les rseaux adapts aux vlos et emprunts,
en blanc, les tronons adapts aux vlos mais peu emprunts, et surtout en rouge, les
axes non amnags qui sont emprunts par des vlos. Cet outil permet notamment
dattirer lattention des collectivits concernes sur les axes quil faudrait amnager
en priorit.
Les donnes utilises pour dterminer la faon dont les cyclistes se dplacent sont
de diffrentes natures. Elles vont denqutes ralises sur le terrain des relevs GPS
effectus par des volontaires, tout en passant par des comptages faits au niveau des
stations de vlo en libre service (lieu et moment de prise dun vlo, lieu et moment
de dpose du vlo).
4.6.4.4
Outre les projets prcdents, deux nouveaux projets sinscrivent dans la continuit du travail ralis durant cette thse et sappuieront sur la plate-forme geoLogic : SYSMO, un projet Investissement dAvenir de lADEME (appel projets
2011), et NORM-ATIS, un projet de lANR (appel projet 2013). Leur dmarrage
est prvu pour janvier 2014.
Le projet Investissement dAvenir traite de la mobilit et notamment de lutilisation de la tlphonie mobile pour modliser les dplacements. En ce sens il sagit
dune suite directe du travail prsent dans le chapitre 2. Alors que dans le cas trait
dans cette thse les informations tlphoniques ne permettent que de construire des
densits de prsence dynamiques, avec ce nouveau projet les donnes tlphoniques
167
4.6.4.5
Les travaux que nous avons raliss dans le cadre de cette thse, et plus gnralement autour de la plate-forme geoLogic, nous amnent actuellement un transfert
technologique vers une PME, la socit Web Geo Services, qui apporte la structure et
les comptences permettant de les valoriser. En effet, la tlphonie comme nouveau
marqueur de mobilit ouvre certes des portes mais ncessite beaucoup de traitements
appropris pour leur donner du sens. Les modles, qui incluent donnes de mobilit
(tlphoniques, enqutes ou autres) mais aussi les composantes gographiques et
socio-conomiques pour construire une information pertinente sur les dplacements
de la population, constituent une plus value certaine pour les collectivits.
4.7
Synthse
Dans ce chapitre nous avons prsent le processus complet permettant de traiter un problme doptimisation multiobjectif rel (MOP), de la dfinition du problme, la conception dune heuristique permettant de le rsoudre en passant par la
modlisation du problme et des fonctions objectifs associes. Les problmes combinatoires multiobjectifs rencontrs dans la littrature peuvent tre abords sous
plusieurs angles, en fonction du besoin de prcision, du temps de dveloppement
ncessaire ou encore du temps de calcul. Parmi les diffrentes approches permettant
dapprhender un MOP, les algorithmes mmtiques ont montr leur efficacit sur
de nombreux problmes. Ces approches hybrides, incorporant une recherche locale
lintrieur dun algorithme gntique, ont par ailleurs t souvent utilises pour rsoudre des problmes mono-objectifs et fournissent encore aujourdhui les meilleures
performances sur de nombreux problmes. Ltude de ces approches nous a permis
de dfinir notre propre algorithme mmtique, MEMO (Memetic Evolutionary MultiObjective).
Lalgorithme MEMO est une hybridation de NSGA-II, algorithme certainement
le plus rpandu parmi les approches gntiques pour rsoudre un MOP, avec une
descente simple du type Hill Climbing. Alors que NSGA-II est un algorithme multiobjectif, et donc directement prvu pour fonctionner sur ce type de problme, lalgorithme de descente simple est adapt aux problmes mono-objectifs. Pour cause,
un tel algorithme repose sur le fait quune transition vers un voisin nest acceptable
que si elle permet damliorer la fitness. Or comme nous lavons montr, une telle
valeur de fitness ne peut tre dtermine en contexte multiobjectif. Les solutions
dun MOP ont une valuation distincte pour chaque objectif, et trs souvent ne sont
pas comparables entre elles. Dans les seuls cas o tous les objectifs de s1 sont soit
meilleurs, soit moins bons, que ceux de s2 , une relation dordre existe entre s1 et s2 .
Mais dans le cas largement majoritaire o certains objectifs seulement de s1 sont
meilleurs que ceux de s2 et les autres moins bons, il nest plus possible de dterminer
qui de s1 et s2 est la meilleure. Il nest donc pas possible dappliquer un algorithme
de descente directement.
Nous avons propos alors de procder une agrgation des fonctions objectifs
pour rassembler les diffrents objectifs en une valeur de fitness unique lors de la
recherche locale. La faon dagrger les objectifs est dterminante dans le droulement de lalgorithme. Il est possible de simplement faire la somme des objectifs,
aprs stre assur de la normalisation des objectifs pour les ramener un domaine
de valeurs comparables. Ainsi on considre que tous les objectifs sont favoriser
de la mme faon. Il est par ailleurs possible dattribuer un poids chaque objectif
selon limportance quon souhaite lui donner. On tend alors vers des approches de
type lexicographique o lon est capable dordonner prioritairement les objectifs.
Dans notre approche nous proposons de gnrer une agrgation selon une pondra-
4.7. Synthse
169
tion alatoire, recalcule pour chaque recherche locale. Cette approche permet de ne
pas favoriser une direction de recherche (direction dfinie par la pondration), mais
au contraire dexplorer au maximum lespace de recherche.
Pour appliquer lalgorithme propos, nous avons prsent le problme particulier de la localisation optimale des stations pour un service dauto-partage. Alors
que jusqu prsent les approches rencontres dans la littrature pour rsoudre ce
problme taient des approches exactes, qui ne permettaient de rsoudre quune version simplifie du problme (maillage du territoire en maille dun kilomtre carr),
lintroduction dune approche heuristique a permis doffrir de nouvelles perspectives. Nous avons propos une modlisation du problme sous forme de MOP qui
permet de construire des configurations diverses du service, o chaque configuration est une faon de localiser n stations. Les solutions retournes par lalgorithme
sont les solutions rencontres appartenant lensemble Pareto, non pas rel car
cet ensemble nest pas connu, mais lensemble Pareto compos de toutes les solutions non-domines entre elles que peut trouver lalgorithme. La constitution de cet
ensemble Pareto suppose la dfinition des fonctions objectifs du problme. Nous
avons propos et formalis trois fonctions permettant de trouver les configurations
qui (1) sadressent au maximum de flux de dplacements, (2) permettent une autorgulation du service maximisant lquilibre entre flux entrant / flux sortant une
mme plage horaire et (3) favorisent un fonctionnement tout au long de la journe
et non uniquement aux heures de pointe.
Lapplication dune heuristique un problme donn ncessite souvent de dfinir
certains paramtres. Il peut sagir de paramtres numriques, mais cela peut galement tre des oprateurs part entire. Afin dobtenir le meilleur fonctionnement
de lalgorithme MEMO nous avons procd une srie de tests en faisant varier
la taille de la population et loprateur de croisement de lalgorithme mmtique.
Nous avons montr travers ces tests quune population de 20 individus couple
un croisement alatoire fournissait les meilleurs rsultats. Le niveau de performance
dun algorithme ne peut tre dfini quen le comparant dautres approches. Cest
pourquoi nous avons propos de recourir trois approches, dont deux reconnues
pour tre performantes en multiobjectif, afin de confronter notre algorithme. Nous
avons choisi une approche locale, PLS, et une approche gntique, NSGA-II. Une
deuxime recherche locale, FLSMO, est un algorithme que nous avons propos et
galement test dans ce chapitre.
Lalgorithme mmtique MEMO que nous proposons sest rvl tre de loin le
plus performant. Plus performant que la recherche locale PLS sans grande surprise,
mais galement significativement plus performant que NSGA-II qui a t paramtr
pour fournir les meilleurs rsultats possibles. La comparaison entre les algorithmes
a ncessit lintroduction des indicateurs de distance I+ , de contribution IC et
surtout lindicateur hypervolume IH qui est le meilleur reflet de la qualit dun
ensemble de solutions. Ces indicateurs nous ont permis de quantifier le gain apport
Conclusion gnrale et
perspectives
Ce mmoire de thse traite de deux aspects essentiels dans le domaine du transport : lidentification des besoins en mobilit, savoir la demande, et loptimisation
des infrastructures permettant de rpondre cette demande, savoir loffre. Ces
deux volets sont abords sous un regard novateur. La construction de la demande
tout dabord, o un modle est propos pour identifier comment au cours de la
journe la population se rpartie sur un territoire. Ce modle original repose sur des
donnes issues du fonctionnement dun rseau cellulaire et sur une caractrisation
spatio-temporelle du sursol. La construction de loffre ensuite, o le cas dtude retenu est la localisation de stations pour un service dauto-partage. Une approche
heuristique est propose pour rsoudre ce problme combinatoire, modlis sous la
forme dun problme multiobjectif.
Principales contributions
La modlisation de la mobilit Nous avons dans une premire partie de ce
mmoire abord le thme de la modlisation de la mobilit des personnes. Pour permettre une analyse pertinente de la mobilit, nous avons propos une taxinomie des
modles existants en fonction de leur niveau de ralisme. Trois familles de modle
ont t identifies : les modles alatoires, les modles dterministes, et les modles
hybrides. Les modles hybrides se sont rvls tre les plus mme de modliser
finement la mobilit, suffisamment finement pour permettre des applications en ingnierie du transport. Ils reposent sur des donnes denqutes ou de comptages routiers
pour identifier la demande ; mais ils intgrent galement des processus stochastiques
permettant de reflter les fluctuations pouvant survenir dun jour lautre. Ces modles hybrides, tels quils sont utiliss par les experts de la mobilit, sont eux-mmes
rpartis en trois grandes classes : les modles agrgs, les modles dsagrgs et les
modles activit-centr. Cette dernire classe qui sappuie sur la notion dactivit,
permet de rendre compte du chainage des dplacements. Les travaux les plus rcents
dans ce domaine ont montr que les modles de transport du futur seront de cette
nature, certes complexe modliser mais traduisant le plus justement les besoins en
mobilit.
Pour complter les approches existantes en matire de modlisation de la mobilit, nous avons vu que la tlphonie mobile pouvait tre utilise comme un marqueur
de prsence sur le territoire. Nous avons propos un modle de distribution spatiotemporel des mobiles bas sur les donnes tlphoniques et sur la description du
172
sursol. La prise en compte du sursol est latout majeur du modle propos par rapport aux approches qui existaient jusqualors. Les quelques rares travaux sappuyant
sur la tlphonie mobile pour marquer la prsence des personnes sur un territoire
ne permettent pas un niveau de prcision au-del de la cellule radio. Lassociation
dun vecteur de poids dattraction spatio-temporel un dcoupage fin du territoire,
nous a permis dintgrer la notion dactivit notre modle. A ce titre il sinscrit
dans les modles davenir identifis par les experts du transport.
173
174
les vhicules entre stations bloques reste indispensable et constitue une perspective
intressante prendre en compte. Il sagit dintroduire cet aspect dans la modlisation mathmatique du problme en termes de cot de personnel et de gain sur
lutilisation des vhicules.
Evidemment les perspectives sont nombreuses. Parmi celles envisager court
terme, nous pensons aussi une gnralisation du modle afin de ltendre au cas
des vlos en libre service. En effet, de plus en plus de villes travers le monde (la
France est prcurseur dans le domaine) envisagent ce service sans recourir de tels
modles qui permettraient pourtant de rationaliser les investissements. Il sagit l
certainement de quelque chose approfondir.
Bibliographie
[Ahas 2005] Rein Ahas et Ular Mark. Location based services - new challenges for
planning and public administration? Futures, vol. 37, no. 6, pages 547 561,
2005. (Cit en page 29.)
[Ahas 2010] Rein Ahas, Anto Aasa, Siiri Silm et Margus Tiru. Daily rhythms of suburban commuters movements in the Tallinn metropolitan area: Case study
with mobile positioning data. Transportation Research Part C: Emerging
Technologies, vol. 18, no. 1, pages 45 54, 2010. (Cit en page 34.)
[Ait Ali 2010a] K. Ait Ali, A. Gondran, A. Caminada et L. Moalic. Vehicular radio connectivity in urban environment. In Wireless Communication Systems
(ISWCS), 2010 7th International Symposium on, pages 305 309, sept. 2010.
(Cit en page 41.)
[Ait Ali 2010b] K. Ait Ali, M. Lalam, L. Moalic et O. Baala. V-MBMM: Vehicular
Mask-Based Mobility Model. In Networks (ICN), 2010 Ninth International
Conference on, pages 243 248, april 2010. (Cit en pages 21 et 41.)
[Akyildiz 1996] I.F. Akyildiz, J.S.M. Ho et Yi-Bing Lin. Movement-based location
update and selective paging for PCS networks. Networking, IEEE/ACM
Transactions on, vol. 4, no. 4, pages 629638, 1996. (Cit en page 12.)
[Akyildiz 2000] Ian F. Akyildiz, Yi bing Lin, Wei ru Lai et Rong jaye Chen. A new
random walk model for PCS networks. IEEE Journal of Selected Areas in
Communications, pages 12541260, 2000. (Cit en page 12.)
[Azarm 1994] K. Azarm et G. Schmidt. Integrated mobile robot motion planning
and execution in changing indoor environments. In Intelligent Robots and
Systems 94. Advanced Robotic Systems and the Real World, IROS 94.
Proceedings of the IEEE/RSJ/GI International Conference on, volume 1,
pages 298305 vol.1, 1994. (Cit en page 19.)
[Bar-Noy 1994] A. Bar-Noy, I. Kessler et M. Sidi. Mobile users: to update or not to
update? In INFOCOM 94. Networking for Global Communications., 13th
Proceedings IEEE, pages 570576 vol.2, 1994. (Cit en pages vii, 13 et 14.)
[Barth 2002] Matthew Barth et Susan Shaheen. Shared-Use Vehicle Systems:
Framework for Classifying Carsharing, Station Cars, and Combined Approaches. Transportation Research Record: Journal of the Transportation
Research Board, vol. 1791, no. -1, pages 105112, 01 2002. (Cit en page 125.)
[Basseur 2003] Matthieu Basseur, Franck Seynhaeve et El-Ghazali Talbi. Adaptive
mechanisms for multi-objective evolutionary algorithms. In IMACS multiconference, Computational Engineering in Systems Applications (CESA03),
pages 7286, Lille, France, July 2003. (Cit en page 103.)
178
Bibliographie
Bibliographie
179
180
Bibliographie
Bibliographie
181
182
Bibliographie
[Ho 1995] Joseph S. M. Ho et Ian F. Akyildiz. Mobile user location update and
paging under delay constraints. Wirel. Netw., vol. 1, no. 4, pages 413425,
Dcembre 1995. (Cit en page 12.)
[Holleczek 2013] Thomas Holleczek, Liang Yu, Joseph K Lee, Oliver Senn, Kristian
Kloeckl, Carlo Ratti et Patrick Jaillet. Digital breadcrumbs: Detecting urban
mobility patterns and transport mode choices from cellphone networks. arXiv
preprint arXiv:1308.6705, 2013. (Cit en page 33.)
[Hong 1999] Xiaoyan Hong, Mario Gerla, Guangyu Pei et Ching-Chuan Chiang. A
group mobility model for ad hoc wireless networks. In Proceedings of the
2nd ACM international workshop on Modeling, analysis and simulation of
wireless and mobile systems, MSWiM 99, pages 5360, New York, NY, USA,
1999. ACM. (Cit en page 15.)
[Hoteit 2013] Sahar Hoteit, Stefano Secci, Stanislav Sobolevsky, Guy Pujolle et
Carlo Ratti. Estimating Real Human Trajectories through Mobile Phone
Data. In Mobile Data Management (MDM), 2013 IEEE 14th International
Conference on, volume 2, pages 148153. IEEE, 2013. (Cit en page 33.)
[Igel 2007] Christian Igel, Nikolaus Hansen et Stefan Roth. Covariance Matrix
Adaptation for Multi-objective Optimization. Evolutionary Computation,
vol. 15, no. 1, pages 128, 2013/10/09 2007. (Cit en page 101.)
[Ishibuchi 1998] H. Ishibuchi et T. Murata. A multi-objective genetic local search
algorithm and its application to flowshop scheduling. Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, vol. 28,
no. 3, pages 392403, 1998. (Cit en pages 89 et 102.)
[Jardosh 2005] A.P. Jardosh, E.M. Belding-Royer, K.C. Almeroth et S. Suri. Realworld environment models for mobile network evaluation. Selected Areas in
Communications, IEEE Journal on, vol. 23, no. 3, pages 622632, 2005. (Cit
en pages vii et 28.)
[Jaszkiewicz 2002] Andrzej Jaszkiewicz. Genetic local search for multi-objective
combinatorial optimization. European Journal of Operational Research,
vol. 137, no. 1, pages 50 71, 2002. (Cit en pages 87, 103 et 112.)
[Jeannic 2011] Thomas Le Jeannic, Philippe Roussel et Dominique Francois. LamobilitdesFranais,panoramaissudelenqutenationale transports et dplacements 2008. La Revue du Service de lObservation et des Statistiques (SOeS)
du Commissariat Gnral au Dveloppement Durable (CGDD), 2011. (Cit
en page 70.)
[Jeon 2000] Wha Sook Jeon et Dong Geun Jeong. Performance of improved probabilistic location update scheme for cellular mobile networks. Vehicular Technology, IEEE Transactions on, vol. 49, no. 6, pages 21642173, 2000. (Cit
en page 12.)
[Joumaa 2007] C. Joumaa, A. Caminada et S. Lamrous. Mask Based Mobility Model
A new mobility model with smooth trajectories. In Modeling and Optimiza-
Bibliographie
183
tion in Mobile, Ad Hoc and Wireless Networks and Workshops, 2007. WiOpt
2007. 5th International Symposium on, pages 16, 2007. (Cit en page 20.)
[Joumaa 2009a] C. Joumaa, L. Moalic, S. Lamrous et A. Caminada. Mobility models
comparative study. In Computers Industrial Engineering, 2009. CIE 2009.
International Conference on, pages 1798 1803, july 2009. (Cit en page 41.)
[Joumaa 2009b] C. Joumaa, L. Moalic, S. Lamrous et A. Caminada. A simulation based mobility models comparative study. In Proceedings of the 2nd
International Conference on Simulation Tools and Techniques, Simutools09,
pages 41:141:2, ICST, Brussels, Belgium, Belgium, 2009. ICST (Institute
for Computer Sciences, Social-Informatics and Telecommunications Engineering). (Cit en page 41.)
[Kammann 2003] J. Kammann, M. Angermann et B. Lami. A new mobility model
based on maps. In Vehicular Technology Conference, 2003. VTC 2003-Fall.
2003 IEEE 58th, volume 5, pages 30453049 Vol.5, 2003. (Cit en pages vii,
19 et 20.)
[Kang 2013] Chaogui Kang, Stanislav Sobolevsky, Yu Liu et Carlo Ratti. Exploring
Human Movements in Singapore: A Comparative Analysis Based on Mobile
Phone and Taxicab Usages. UrbComp13, Chicago, Illinois, USA., August
11-14 2013. (Cit en page 32.)
[Kim 1998] Tai Suk Kim, Min Young Chung, Dan Keun Sung et M. Sengoku. Mobility modeling and traffic analysis in three-dimensional indoor environments.
Vehicular Technology, IEEE Transactions on, vol. 47, no. 2, pages 546557,
1998. (Cit en page 26.)
[Kim 2000] Tai Suk Kim, Jae Kyun Kwon et Dan Keun Sung. Mobility modeling
and traffic analysis in three-dimensional high-rise building environments. Vehicular Technology, IEEE Transactions on, vol. 49, no. 5, pages 16331640,
2000. (Cit en page 26.)
[Knowles 1999] J. Knowles et D. Corne. The Pareto archived evolution strategy:
a new baseline algorithm for Pareto multiobjective optimisation. In Evolutionary Computation, 1999. CEC 99. Proceedings of the 1999 Congress on,
volume 1, pages 3 vol. (xxxvii+2348), 1999. (Cit en page 99.)
[Knowles 2000] J.D. Knowles et D.W. Corne. M-PAES: a memetic algorithm for
multiobjective optimization. In Evolutionary Computation, 2000. Proceedings of the 2000 Congress on, volume 1, pages 325 332 vol.1, 2000. (Cit en
pages 87 et 114.)
[Lam 1997] D. Lam, D.C. Cox et J. Widom. Teletraffic modeling for personal communications services. Communications Magazine, IEEE, vol. 35, no. 2, pages
7987, 1997. (Cit en pages 17 et 18.)
[Lamrous 2008] Sid Lamrous, Alexandre Caminada, Laurent Moalic et Chibli
Joumaa. Cartographie de dplacements De la ralit la modlisation. In
4me Symposium international Images, Multimdia, Applications graphiques
184
Bibliographie
et Environnements (IMAGE), Guelma, Algeria, november 2008. (Cit en
pages 46 et 50.)
[Lee 1961] C. Y. Lee. An Algorithm for Path Connections and Its Applications.
Electronic Computers, IRE Transactions on, vol. EC-10, no. 3, pages 346
365, 1961. (Cit en page 19.)
[Liang 2003] Ben Liang et Zygmunt J. Haas. Predictive distance-based mobility
management for multidimensional PCS networks. IEEE/ACM Trans. Netw.,
vol. 11, no. 5, pages 718732, Octobre 2003. (Cit en page 16.)
[Liefooghe 2010] Arnaud Liefooghe, Laetitia Jourdan et El-Ghazali Talbi. Metaheuristics and cooperative approaches for the Bi-objective Ring Star Problem.
Computers & Operations Research, vol. 37, no. 6, pages 1033 1044, 2010.
(Cit en page 97.)
[Liefooghe 2012] Arnaud Liefooghe, Jrmie Humeau, Salma Mesmoudi, Laetitia
Jourdan et El-Ghazali Talbi. On dominance-based multiobjective local search:
design, implementation and experimental analysis on scheduling and traveling salesman problems. Journal of Heuristics, vol. 18, pages 317352, 2012.
10.1007/s10732-011-9181-3. (Cit en pages 98, 114 et 123.)
[Liu 1998] Tong Liu, P. Bahl et I. Chlamtac. Mobility modeling, location tracking,
and trajectory prediction in wireless ATM networks. Selected Areas in Communications, IEEE Journal on, vol. 16, no. 6, pages 922936, 1998. (Cit en
page 18.)
[Lizee 2001] G. Lizee et A.O. Fapojuwo. Highway traffic models for wireless networks. In Vehicular Technology Conference, 2001. VTC 2001 Spring. IEEE
VTS 53rd, volume 4, pages 27662770 vol.4, 2001. (Cit en page 17.)
[M.-H. 2000] MASSOT M.-H. PRAXITELE : Un concept, un service, une exprimentation, 2000. (Cit en page 128.)
[Markoulidakis 1997] J.G. Markoulidakis, G.L. Lyberopoulos, D.F. Tsirkas et E.D.
Sykas. Mobility modeling in third-generation mobile telecommunications systems. Personal Communications, IEEE, vol. 4, no. 4, pages 4156, 1997.
(Cit en pages 17 et 18.)
[Melab 2013] Nouredine Melab, Th Van Luong, Karima Boufaras et El-Ghazali
Talbi. ParadisEO-MO-GPU: a Framework for Parallel GPU-based Local
Search Metaheuristics. In ACM GECCO2013, Amsterdam, Pays-Bas, Juillet
2013. (Cit en page 103.)
[Meunier 2000] Herv Meunier, El-Ghazali Talbi et Philippe Reininger. A Multiobjective Genetic Algorithm for Radio Network Optimization. In In Proceedings
of the 2000 Congress on Evolutionary Computation, pages 317324. IEEE
Press, 2000. (Cit en pages 104 et 135.)
[Moalic 2012] Laurent Moalic, Sid Lamrous et Alexandre Caminada. Multiobjective
Tabu Algorithm for Optimizing Carsharing Systems. In International Conference on Metaheuristics and Nature Inspired Computing, META12, Sousse,
Tunisia, october 2012. (Cit en page 160.)
Bibliographie
185
[Moalic 2013a] Laurent Moalic, Alexandre Caminada et Sid Lamrous. A Fast Local Search Approach For Multiobjective problems. In LION - Learning and
Intelligent Optimization Conference, Catania, Italy, january 2013. (Cit en
pages 146 et 160.)
[Moalic 2013b] Laurent Moalic, Sid Lamrous et Alexandre Caminada. A memetic
algorithm for multiobjective problems. In GECCO - Genetic and Evolutionary
Computation Conference, pages 9394, Amsterdam, Netherlands, july 2013.
(Cit en page 160.)
[Molina 2009] Julin Molina, Luis V. Santana, Alfredo G. Hernndez-Daz, Carlos
A. Coello Coello et Rafael Caballero. g-dominance: Reference point based
dominance for multiobjective metaheuristics. European Journal of Operational Research, vol. 197, no. 2, pages 685 692, 2009. (Cit en page 94.)
[Moscato 1989] Pablo Moscato. On evolution, search, optimization, genetic algorithms and martial arts: Towards memetic algorithms. Caltech concurrent
computation program, C3P Report, vol. 826, page 1989, 1989. (Cit en
page 112.)
[Nguyen-Luong 2000a] D. Nguyen-Luong. Modeles de prvisions de trafic aux EtatsUnis : Application llaboration des plans de transports rgionaux. Rapport
technique, IAURIF, Janv. 2000. (Cit en pages 22 et 23.)
[Nguyen-Luong 2000b] D. Nguyen-Luong. Recherche sur le choix modal en milieu
urbain. Rapport technique, IAURIF, Juin 2000. (Cit en page 23.)
[Nguyen-Luong 2008] D. Nguyen-Luong. Projet SIMAURIF Perfectionnement et
valorisation - PREDIT Rf : n 06MTE053. Rapport technique, IAURIF,
Juil. 2008. (Cit en page 24.)
[Pan 2006] Changxuan Pan, Jiangang Lu, Shan Di et Bin Ran. Cellular-Based DataExtracting Method for Trip Distribution. Transportation Research Record:
Journal of the Transportation Research Board, vol. 1945, no. -1, pages 3339,
01 2006. (Cit en page 33.)
[Paquete 2003] Luis Paquete et Thomas Sttzle. A Two-Phase Local Search for the
Biobjective Traveling Salesman Problem. In CarlosM. Fonseca, PeterJ. Fleming, Eckart Zitzler, Lothar Thiele et Kalyanmoy Deb, editeurs, Evolutionary
Multi-Criterion Optimization, volume 2632 of Lecture Notes in Computer
Science, pages 479493. Springer Berlin Heidelberg, 2003. (Cit en page 90.)
[Paquete 2004] Luis Paquete, Marco Chiarandini et Thomas Sttzle. Pareto Local
Optimum Sets in the Biobjective Traveling Salesman Problem: An Experimental Study. In Xavier Gandibleux, Marc Sevaux, Kenneth Srensen, Vincent Tkindt, G. Fandel et W. Trockel, editeurs, Metaheuristics for Multiobjective Optimisation, volume 535 of Lecture Notes in Economics and Mathematical Systems, pages 177199. Springer Berlin Heidelberg, 2004. (Cit en
pages 98, 146 et 160.)
[Pareto 1896] Vilfredo Pareto. Cours dEconomie Politique. Droz, Genve, 1896.
(Cit en page 85.)
186
Bibliographie
[Perera 2002] Ranjit Perera, Andreas Eisenbltter, Erik Fledderus, Carmelita Grg,
Michael Scheutzow et Stefan Verwijmeren. Pixel Oriented Mobility Modelling
for UMTS Network Simulations. presented at IST Mobile and Wireless Telecommunications, 2002. (Cit en page 14.)
[Phithakkitnukoon 2012] Santi Phithakkitnukoon, Zbigniew Smoreda et Patrick
Olivier. Socio-Geography of Human Mobility: A Study Using Longitudinal
Mobile Phone Data. PLoS ONE, vol. 7, no. 6, page e39253, 06 2012. (Cit
en page 34.)
[PREDIT 1999] PREDIT. La modlisation dans les transports terrestres, prsid
par Gilles Kahn, directeur scientifique INRIA. Rapport du groupe de travail,
PREDIT, Juin 1999. (Cit en page 10.)
[PREDIT 2007] PREDIT. Miro Rapport Final PREDIT Groupe oprationnel
n 1 Mobilit territoires et dveloppement durable. Rapport technique,
Laboratoire dInformatique de lUniversit de Franche-Comt, Laboratoire
Thoriser et Modliser pour Amnager, Laboratoire PACTE, Laboratoire
Image et Ville, GEODES, Laboratoire CEDETE, Septembre 2007. (Cit en
pages 24 et 25.)
[Pulselli 2006] R M Pulselli, C Ratti et E Tiezzi. City out of Chaos: Social Patterns
and Organization in Urban Systems. International Journal of Ecodynamics,
vol. 1, no. 2, pages 125134, 2006. (Cit en page 30.)
[Pulselli 2008] R M Pulselli, P Romano, S Magaudda et Tiezzi E. Monitoring human
mobility in urban systems: a new technique based on cell-phone activity. In
13th International Conference on Urban Planning in Information and Knowledge Society (REAL CORP), pages 629635. CORP Competence Center
of Urban and Regional Planning, May 2008. (Cit en page 34.)
[RATP 2010] RATP. Mtro Grand Paris tude de prvision de trafic. Rapport
technique, Dpartement du Dveloppement et de lAction Territoriale, Oct.
2010. (Cit en pages 23 et 24.)
[Ratti 2006] C Ratti, R M Pulselli, S Williams et D Frenchman. Mobile Landscapes:
using location data from cell phones for urban analysis. Environment and
Planning B: Planning and Design, vol. 33, no. 5, pages 727748, 2006. (Cit
en page 28.)
[Ratti 2007] Carlo Ratti, Andres Sevtsuk, Sonya Huang et Rudolf Pailer. Mobile
Landscapes: Graz in Real Time. In Georg Gartner, William Cartwright,
Michael P. Peterson, William Cartwright, Georg Gartner, Liqiu Meng et
Michael P. Peterson, editeurs, Location Based Services and TeleCartography,
Lecture Notes in Geoinformation and Cartography, pages 433444. Springer
Berlin Heidelberg, 2007. (Cit en page 31.)
[Reades 2007] J. Reades, F. Calabrese, A. Sevtsuk et C. Ratti. Cellular Census:
Explorations in Urban Data Collection. Pervasive Computing, IEEE, vol. 6,
no. 3, pages 30 38, july-sept. 2007. (Cit en page 33.)
Bibliographie
187
[Rheingold 2002] H. Rheingold. Smart mobs: the next social revolution. Perseus
Pub., 2002. (Cit en page 40.)
[Roy 1985] B. Roy. Mthodologie multicritre daide la dcision. Economica,
Paris, 1985. (Cit en page 158.)
[Schaffer 1985] J. David Schaffer. Multiple Objective Optimization with Vector Evaluated Genetic Algorithms. In Proceedings of the 1st International Conference
on Genetic Algorithms, pages 93100, Hillsdale, NJ, USA, 1985. L. Erlbaum
Associates Inc. (Cit en pages 92 et 109.)
[Scourias 1999] John Scourias et Thomas Kunz. An activity-based mobility model
and location management simulation framework. In Proceedings of the 2nd
ACM international workshop on Modeling, analysis and simulation of wireless and mobile systems, MSWiM 99, pages 6168, New York, NY, USA,
1999. ACM. (Cit en page 16.)
[Sevtsuk 2010] Andres Sevtsuk. Does Urban Mobility Have a Daily Routine? Learning from the Aggregate Data of Mobile Networks. Journal of urban technology,
vol. 17, no. 1, page 41, 2010. (Cit en page 34.)
[Shaheen 2008] Susan A. Shaheen et Adam P Cohen. Worldwide Carsharing
Growth: An International Comparison, 2008. (Cit en page 125.)
[Silverman 1986] B. W. Silverman. Density estimation for statistics and data analysis. Chapman & Hall, London, 1986. (Cit en page 96.)
[Song 2010] Chaoming Song, Zehui Qu, Nicholas Blumm et Albert-Lszl Barabsi.
Limits of Predictability in Human Mobility. Science, vol. 327, no. 5968, pages
10181021, 2010. (Cit en page 34.)
[Srinivas 1994] N. Srinivas et Kalyanmoy Deb. Multiobjective Optimization Using
Nondominated Sorting in Genetic Algorithms. Evolutionary Computation,
vol. 2, pages 221248, 1994. (Cit en pages 93 et 94.)
[Steenbruggen 2011] John Steenbruggen, Maria Borzacchiello, Peter Nijkamp et
Henk Scholten. Mobile phone data from GSM networks for traffic parameter
and urban spatial pattern assessment: a review of applications and opportunities. GeoJournal, pages 121, May 2011. 10.1007/s10708-011-9413-y. (Cit
en pages 28 et 33.)
[Systems 1997] Raytheon Systems et P. B. Farradyne. FINAL EVALUATION REPORT For The CAPITAL-ITS Operational Test and Demonstration Program, May 1997. (Cit en pages i, 9 et 29.)
[Tabbane 2002] S. Tabbane. Ingnierie des rseaux cellulaires. Collection Rseaux
et tlcommunications. Herms science publications, 2002. (Cit en page 45.)
[Talbi 2001] El-Ghazali Talbi, Malek Rahoual, Mohamed Hakim Mabed et Clarisse
Dhaenens. A Hybrid Evolutionary Approach for Multicriteria Optimization
Problems: Application to the Flow Shop. In EMO, pages 416428, 2001.
(Cit en pages 103 et 112.)
188
Bibliographie
[Talbi 2009] El-Ghazali Talbi. Metaheuristics: from design to implementation. Wiley, 2009. (Cit en page 80.)
[Talbi 2013] El-Ghazali Talbi. Hybrid metaheuristics. Springer, 2013. (Cit en
pages 102 et 113.)
[Tian 2002] J. Tian, J. Hhner, C. Becker, I. Stepanov et K. Rothermel. Graphbased mobility model for mobile ad hoc network simulation. In Simulation
Symposium, 2002. Proceedings. 35th Annual, pages 337344, 2002. (Cit en
pages vii, 26 et 27.)
[Tsai 1999] I-Fei Tsai et Rong-Hong Jan. The lookahead strategy for distance-based
location tracking in wireless cellular networks. SIGMOBILE Mob. Comput.
Commun. Rev., vol. 3, no. 4, pages 2738, Octobre 1999. (Cit en page 14.)
[Tuan 2003] Chiu-Ching Tuan et Chen-Chau Yang. A compact normal walk model
for PCS networks. SIGMOBILE Mob. Comput. Commun. Rev., vol. 7, no. 4,
pages 2031, Octobre 2003. (Cit en pages vii, 14 et 15.)
[Ulungu 1999] E.L. Ulungu, J. Teghem, P.H. Fortemps et D. Tuyttens. MOSA
method: a tool for solving multiobjective combinatorial optimization problems. Journal of Multi-Criteria Decision Analysis, vol. 8, no. 4, pages 221
236, 1999. (Cit en page 90.)
[While 2006] L. While, P. Hingston, L. Barone et S. Huband. A faster algorithm
for calculating hypervolume. Evolutionary Computation, IEEE Transactions
on, vol. 10, no. 1, pages 2938, 2006. (Cit en pages ix, 106 et 108.)
[Wu 2002] Chien-Hsing Wu, Huang-Pao Lin et Leu-Shing Lan. A new analytic
framework for dynamic mobility management of PCS networks. Mobile Computing, IEEE Transactions on, vol. 1, no. 3, pages 208220, 2002. (Cit en
page 14.)
[Yang 1994] Xiaofeng Yang et Mitsuo Gen. Evolution program for bicriteria transportation problem. Computers & Industrial Engineering, vol. 27, no. 14,
pages 481 484, 1994. <ce:title>16th Annual Conference on Computers
and Industrial Engineering</ce:title>. (Cit en page 90.)
[Zitzler 1999] E. Zitzler et L. Thiele. Multiobjective evolutionary algorithms: a comparative case study and the strength Pareto approach. Evolutionary Computation, IEEE Transactions on, vol. 3, no. 4, pages 257 271, nov 1999. (Cit
en pages 94, 100, 104, 105, 135 et 136.)
[Zitzler 2001] Eckart Zitzler, Marco Laumanns et Lothar Thiele. SPEA2: Improving
the Strength Pareto Evolutionary Algorithm. TIK-Report 103, 2001. (Cit
en pages 94, 95, 109 et 115.)
[Zitzler 2003] E. Zitzler, L. Thiele, M. Laumanns, C.M. Fonseca et V.G. da Fonseca. Performance assessment of multiobjective optimizers: an analysis and
review. Evolutionary Computation, IEEE Transactions on, vol. 7, no. 2,
pages 117 132, april 2003. (Cit en pages 105 et 135.)
Bibliographie
189
[Zitzler 2004] Eckart Zitzler et Simon Knzli. Indicator-based selection in multiobjective search. In in Proc. 8th International Conference on Parallel Problem
Solving from Nature (PPSN VIII, pages 832842. Springer, 2004. (Cit en
pages 93, 96 et 100.)
[Zitzler 2007] Eckart Zitzler, Dimo Brockhoff et Lothar Thiele. The Hypervolume Indicator Revisited: On the Design of Pareto-compliant Indicators
Via Weighted Integration. In Shigeru Obayashi, Kalyanmoy Deb, Carlo
Poloni, Tomoyuki Hiroyasu et Tadahiko Murata, editeurs, Evolutionary
Multi-Criterion Optimization, volume 4403 of Lecture Notes in Computer
Science, pages 862876. Springer Berlin Heidelberg, 2007. (Cit en page 101.)