These Mo Alic

Thse de Doctorat
cole doctorale sciences pour lingnieur et microtechniques
U N I V E R S I T
D E
F R A N C H E - C O M T
MODLISATION DYNAMIQUE DE LA DENSIT

DE POPULATION VIA LES RSEAUX
CELLULAIRES ET OPTIMISATION
MULTIOBJECTIF DE L'AUTO-PARTAGE
! Laurent MOALIC

Soutenue le : 12/12/2013

A Belfort

Jury
Rapporteur
Rapporteur
Examinateur
Directeurs de thse
TALBI El-Ghazali, Professeur, Universit de Lille

NOEL Thomas, Professeur, Universit de Strasbourg
CUNG Van Dat, Professeur, INP Grenoble
SPIES Franois, Professeur, UFC
CAMINADA Alexandre, Professeur, UTBM
LAMROUS Sid, Matre de Confrence, UTBM
Table des matires

Introduction gnrale
I Modlisation dynamique de la densit de population via les

rseaux cellulaires
7
1 Modlisation de la mobilit, tat de lart
1.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.2
Taxinomie des modles . . . . . . . . . . . . . . . . . . . . . . . . . .
11
1.2.1
Modles de mobilit alatoires . . . . . . . . . . . . . . . . . .
12
1.2.2
Modles de mobilit dterministes . . . . . . . . . . . . . . .
16
1.2.3
Modles de mobilit hybrides . . . . . . . . . . . . . . . . . .
17
1.3
1.4
Cas de la tlphonie comme marqueur de mobilit
. . . . . . . . . .
28
1.3.1
Le projet CAPITAL [Systems 1997]
. . . . . . . . . . . . . .
29
1.3.2
Les travaux du MIT : une source de rfrence . . . . . . . . .
29
1.3.3
Autres travaux utilisant la tlphonie mobile . . . . . . . . .
33
Synthse et perspectives . . . . . . . . . . . . . . . . . . . . . . . . .
36
2 La tlphonie mobile : un marqueur de prsence
39
2.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
2.2
La tlphonie mobile : une nouvelle source de donnes . . . . . . . .
41
2.2.1
Structure et fonctionnement dun rseau cellulaire
. . . . . .
41
2.2.2
Quelles donnes sont disponibles ? . . . . . . . . . . . . . . .
45
Un nouveau modle de distribution de la population . . . . . . . . .
46
2.3.1
47
2.3
Mobilit et caractrisation socio-conomique du territoire . .
ii
Table des matires

2.3.2
2.4
2.5
II
Modle de distribution spatio-temporelle des mobiles . . . . .
55
Rsultats et analyse . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
2.4.1
Environment danalyse . . . . . . . . . . . . . . . . . . . . . .
58
2.4.2
Constitution des donnes de rfrence . . . . . . . . . . . . .
60
2.4.3
Exprimentation et rsultats . . . . . . . . . . . . . . . . . .
63
2.4.4
Construction dune Signature Territoriale . . . . . . . . . . .
70
2.4.5
Gnralisation de la Signature Territoriale . . . . . . . . . . .
73
Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
Optimisation combinatoire multiobjectif de lauto-partage
3 Optimisation combinatoire multiobjectif : tat de lart
77
79
3.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
3.2
Notions de base et dfinitions . . . . . . . . . . . . . . . . . . . . . .
81
3.2.1
Optimisation mono-objectif . . . . . . . . . . . . . . . . . . .
81
3.2.2
Formulation dun problme doptimisation multiobjectif . . .
82
3.2.3
Espace de dcision vs espace objectif . . . . . . . . . . . . . .
82
3.2.4
Optimisation combinatoire et mtaheuristiques . . . . . . . .
83
3.2.5
Dominance et Pareto optimalit (le problme de la relation

dordre) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
Mtaheuristiques pour les problmes multiobjectifs . . . . . . . . . .
87
3.3.1
Classification des principales approches . . . . . . . . . . . . .
87
3.3.2
Les approches par transformation mono-objectif . . . . . . . .
87
3.3.3
Les approches non-Pareto . . . . . . . . . . . . . . . . . . . .
92
3.3.4
Les approches Pareto . . . . . . . . . . . . . . . . . . . . . . .
93
3.3.5
Les approches hybrides . . . . . . . . . . . . . . . . . . . . . . 101
3.3
Table des matires

3.4
3.5
iii
Evaluation des algorithmes multiobjectifs : une approche base dindicateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

3.4.1
Indicateur de contribution . . . . . . . . . . . . . . . . . . . . 104
3.4.2
Indicateur -additif . . . . . . . . . . . . . . . . . . . . . . . . 105
3.4.3
Indicateur hypervolume . . . . . . . . . . . . . . . . . . . . . 105
3.4.4
Indicateur de distance gnrationnelle . . . . . . . . . . . . . 108
Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4 Algorithmes mmtiques et optimisation multiobjectif
111
4.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2
Schma directeur dun algorithme mmtique . . . . . . . . . . . . . 113
4.3
4.4
4.5
4.2.1
La recherche locale dans un contexte multiobjectif . . . . . . 114
4.2.2
Loprateur gntique dans un contexte multiobjectif . . . . . 115
4.2.3
Lalgorithme mmtique, une recherche locale amliore ? . . 115
MEMO : un algorithme mmtique multiobjectif . . . . . . . . . . . 117

4.3.1
NSGA-II comme oprateur gntique . . . . . . . . . . . . . . 117
4.3.2
Loprateur de recherche locale . . . . . . . . . . . . . . . . . 121
4.3.3
Droulement de lalgorithme mmtique . . . . . . . . . . . . 123
Optimisation applique la planification urbaine : localisation de

stations dauto-partage . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.4.1
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.4.2
Enjeu de la localisation des stations . . . . . . . . . . . . . . 126
4.4.3
Description formelle du problme . . . . . . . . . . . . . . . . 127
Application de lalgorithme mmtique MEMO . . . . . . . . . . . . 134

4.5.1
Introduction des indicateurs de comparaison . . . . . . . . . . 135
4.5.2
Dfinition dun ensemble de rfrence avec NSGA-II, PLS et

FLSMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
iv
Table des matires
4.6
4.7
4.5.3
Dfinition du paramtrage de MEMO . . . . . . . . . . . . . 148
4.5.4
Analyse des solutions de MEMO . . . . . . . . . . . . . . . . 151
4.5.5
Analyse de la progression de lalgorithme MEMO . . . . . . . 156
De loptimisation laide la dcision multiobjectif . . . . . . . . . . 157

4.6.1
Contexte de laide la dcision . . . . . . . . . . . . . . . . . 157
4.6.2
La plate-forme geoLogic . . . . . . . . . . . . . . . . . . . . . 158
4.6.3
Aide la dcision multiobjectif . . . . . . . . . . . . . . . . . 160
4.6.4
Les projets sappuyant sur la plate-forme geoLogic . . . . . . 163
Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Conclusion gnrale et perspectives
171
Liste des publications
175
Bibliographie
177
Liste des tableaux

2.1
Temps moyen pass par catgorie . . . . . . . . . . . . . . . . . . . .
52
2.2
Rpartition de la population par thme . . . . . . . . . . . . . . . . .
53
4.1
Rles des oprateurs selon le type dalgorithme . . . . . . . . . . . . 116
4.2
NSGA-II : croisement alatoire et mutation alatoire . . . . . . . . . 139
4.3
NSGA-II : croisement alatoire et mutation premier voisin amliorant 140
4.4
NSGA-II : croisement alatoire et mutation meilleur voisin amliorant 141
4.5
NSGA-II : croisement litiste et mutation alatoire . . . . . . . . . . 142
4.6
NSGA-II : croisement litiste et mutation premier voisin amliorant . 143
4.7
NSGA-II : croisement litiste et mutation meilleur voisin amliorant
4.8
Rsultats de la recherche locale PLS . . . . . . . . . . . . . . . . . . 145
4.9
Rsultats de la recherche locale FLSMO . . . . . . . . . . . . . . . . 147
144
4.10 Rsultats de MEMO avec croisement alatoire . . . . . . . . . . . . . 150

4.11 Rsultats de MEMO avec croisement litiste . . . . . . . . . . . . . . 151
4.12 Synthse des rsultats obtenus avec les algorithmes prsents . . . . 152
Table des figures

1.1
Taxinomie des modles de mobilit . . . . . . . . . . . . . . . . . . .
11
1.2
Exemple de mouvements obtenus avec le modle "Random Walk" . .
13
1.3
Diagramme dtat du modle de chane de Markov une dimension

(extrait de [Bar-Noy 1994]) . . . . . . . . . . . . . . . . . . . . . . .
14
Trois trajectoires de 2000 pas du modle "Normal Walk" pour

=15,30 et 60 (extrait de [Tuan 2003]) . . . . . . . . . . . . . . . .
15
Exemple de motif de dplacement dun mobile utilisant le modle de

mobilit Gauss-Markov (extrait de [Camp 2002]) . . . . . . . . . . .
16
1.6
Squence de cellules dun profil usager (extrait de [Erbas 2001]) . . .
19
1.7
Mthodes de dtermination des chemins (extrait de [Kammann 2003]) 20
1.8
MBMM : grille des probabilits de transition
. . . . . . . . . . . . .
21
1.9
Graphe du centre ville de Stuttgart (extrait de [Tian 2002]) . . . . .
27
1.4
1.5
1.10 Terrain simul par un graphe de Vorono (extrait de [Jardosh 2005])
28
1.11 Vue de Rome en temps rel . . . . . . . . . . . . . . . . . . . . . . .
31
1.12 Illustration des vues de la mobilit Singapour . . . . . . . . . . . .
32
1.13 Illustration du rseau de bus actuel (en jaune) et des prconisations

de nouvelles lignes . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
2.1
Evolution du nombre dabonnements tlphoniques dans le monde .
40
2.2
Maillage et PPC . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.3
Couverture radio . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
2.4
Gnration dun vnement de communication . . . . . . . . . . . . .
44
2.5
Gnration dun vnement de transfert intercellulaire . . . . . . . .
44
2.6
Cartographie temporelle de la distribution de la population belfortaine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
viii
Table des figures
2.7
Process complet de la pondration spatio-temporelle du territoire . .
48
2.8
Organisation du sursol . . . . . . . . . . . . . . . . . . . . . . . . . .
49
2.9
Table de profilage temporel du sursol . . . . . . . . . . . . . . . . . .
51
2.10 Module de distribution des mobiles . . . . . . . . . . . . . . . . . . .
55
2.11 Distribution des mobiles un instant t sans prise en compte des

proprits du sursol . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
2.12 Distribution des mobiles un instant t sans et avec prise en compte

des poids dattraction spatio-temporelle . . . . . . . . . . . . . . . .
58
2.13 Plate-forme geoLogic . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
2.14 Informations vectorielles : SIG shapefile . . . . . . . . . . . . . . . .
60
2.15 Zonage et attractivit des zones 17h . . . . . . . . . . . . . . . . .
61
2.16 Diffrence cumule 6h30, 10h et 22h . . . . . . . . . . . . . . . . .
62
2.17 Prsence 3 priodes de temps . . . . . . . . . . . . . . . . . . . . .
63
2.18 Comparaison EMD / modle en zone dactivit industrielle sans habitat 65

2.19 Comparaison EMD / modle en centre ville avec habitats et commerces 66
2.20 Comparaison EMD / modle en secteur priurbain 1 avec habitat et
trs peu de commerce . . . . . . . . . . . . . . . . . . . . . . . . . .
67
2.21 Comparaison EMD / modle en secteur priurbain 2 avec habitat et

trs peu de commerce . . . . . . . . . . . . . . . . . . . . . . . . . .
68
2.22 Symtrie du modle en secteur priurbain 1 avec habitat et trs peu

de commerce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
2.23 Symtrie du modle en secteur priurbain 2 avec habitat et trs peu

de commerce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
2.24 Signature Territoriale pour le centre ville (courbes hautes) et la zone

dactivit industrielle (courbes basses) - pour deux mardis et jeudis
diffrents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
2.25 Signature Territoriale pour les zones priurbaines - pour deux mardis
et jeudis diffrents . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
Table des figures
ix
3.1
Espace de dcision / espace objectif . . . . . . . . . . . . . . . . . . .
82
3.2
Pareto dominance et incomparabilit . . . . . . . . . . . . . . . . . .
86
3.3
Classification des mthodes de rsolution dun MOP . . . . . . . . .
88
3.4
Approche par agrgation des objectifs . . . . . . . . . . . . . . . . .
89
3.5
Approche par methode -contrainte . . . . . . . . . . . . . . . . . . .
90
3.6
Approche par but . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
92
3.7
Distance de crowding : moyenne des cts de lhypercube . . . . . . .
95
3.8
Indicateur hypervolume IH
3.9
Dcomposition dhypervolume de dimension 3 par HSO (extrait de

[While 2006]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.1
Slection par tournoi binaire . . . . . . . . . . . . . . . . . . . . . . . 119
4.2
Croisement litiste : chaque parent fournit ses meilleurs gnes . . . . 120
4.3
Slection et croisement suivis dune recherche locale . . . . . . . . . . 124
4.4
Illustration des sites pouvant accueillir une station . . . . . . . . . . 128
4.5
Stations et zone de capture . . . . . . . . . . . . . . . . . . . . . . . 129
4.6
Implantation des stations selon lattraction vs les flux
4.7
Equilibre des flux entrants / flux sortants linstant t pour la station s132
4.8
Deux fonctionnements dune station au cours de la journe . . . . . . 133
4.9
Problme multiobjectif de maximisation . . . . . . . . . . . . . . . . 135
. . . . . . . . . . . . . . . . . . . . . . . 106
. . . . . . . . 131
4.10 Evolution des indicateurs hypervolumes moyens de 6 configurations

NSGA-II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.11 Parcours PLS vs FLSMO . . . . . . . . . . . . . . . . . . . . . . . . 147
4.12 Progression des algorithmes de rfrence . . . . . . . . . . . . . . . . 148
4.13 Premires itrations des algorithmes de rfrence . . . . . . . . . . . 149
4.14 Comparaison de deux ensembles pour IC . . . . . . . . . . . . . . . . 153
Table des figures

4.15 Solutions PLS et MEMO projetes sur f1 -f2 ; f1 -f3 et f2 -f3 . . . . . 154
4.16 Solutions NSGA-II et MEMO projetes sur f1 -f2 ; f1 -f3 et f2 -f3 . . . 155
4.17 Progression de PLS, NSGA-II et MEMO . . . . . . . . . . . . . . . . 156
4.18 Plate-forme geoLogic . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
4.19 Vues issues de la plate-fome geoLogic . . . . . . . . . . . . . . . . . . 159
4.20 Outil daide la dcision de geoLogic . . . . . . . . . . . . . . . . . . 161
4.21 Filtres sur lespace des critres . . . . . . . . . . . . . . . . . . . . . 162
4.22 Filtres sur lespace de dcision . . . . . . . . . . . . . . . . . . . . . . 162
4.23 Territoire Mobile : analyse dun rseau de bus . . . . . . . . . . . . . 164
4.24 ecoTaxi : optimisation dinfrastructures de stations dchange automatique de batteries . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
4.25 PUMDP : adquation entre offre et demande pour une mobilit vlo 166
Liste des algorithmes

1
2
3
4
5
6
7
8
NSGA-II . . . . . . . . . . . . . . . . . . . . . .
PLS . . . . . . . . . . . . . . . . . . . . . . . .
HSO : Hypervolume by Slicing Objectives . . .
Algorithme mmtique gnrique MOGLS . . .
NSGA-II . . . . . . . . . . . . . . . . . . . . . .
Local Search : FIHC . . . . . . . . . . . . . . .
MEMO . . . . . . . . . . . . . . . . . . . . . .
Fast Local Search for Multiobjective Problems .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
95
99
107
114
118
122
124
146
Introduction gnrale
Contexte
Ce travail de thse sest droul sous la tutelle du laboratoire FEMTO de lUniversit de Franche-Comt.
Les problmes de transport et la recherche oprationnelle (RO) constituent deux
domaines souvent lis. De nombreux problmes cits en rfrence au sein de la communaut RO concernent en effet des applications lies au transport, telles que les
problmes de tournes de vhicules ou encore les problmes de logistique urbaine.
Rciproquement, en matire de transport, de nombreuses dcisions sont prises en
sappuyant sur des outils doptimisation, tel que pour planifier laffectation des bus
et chauffeurs lors du graphicage de lignes de bus. Ce lien troit sexplique essentiellement par deux aspects. Dune part, en matire de transport les problmes sont
souvent trs complexes. Il y a gnralement de nombreuses donnes prendre en
compte et lespace de recherche est immense tant il y a de solutions potentiellement
ralisables. Cest le cas par exemple avec les problmes de tournes de vhicules o
la taille de lespace de recherche crot de faon exponentielle avec le nombre de sites
visiter. Dautre part, les problmes de transport ont des consquences financires
considrables. Les investissements en jeu en matire de construction dinfrastructures routires par exemple, ou de dploiement de services de transport en commun,
slvent trs rapidement plusieurs millions deuros.
De ce lien troit entre transport et recherche oprationnelle nous identifions
deux enjeux majeurs qui doivent permettre daboutir une prise de dcision. Le
premier concerne lidentification des besoins, quelle demande doit-on rpondre. Le
deuxime concerne la rponse apporter, quelle solution doit-on retenir et mettre
en oeuvre. Chacun de ces enjeux est abord dans ce mmoire de thse : le premier,
travers une nouvelle approche qui permet dapprhender les besoins en matire
de service de mobilit ; le deuxime travers de nouveaux outils et algorithmes
doptimisation et daide la dcision.
Motivations et objectifs
Llaboration de modles permettant didentifier la faon dont les personnes se
dplacent sur un territoire doit constituer un lment de rponse essentiel au premier
enjeu. En effet, des modles mme de reflter les besoins en services de mobilit
au cours de la journe et dun jour lautre font partie intgrante du processus
Introduction gnrale
de dcision qui prcde la ralisation damnagements divers. Des modles existent

pour aborder ce problme, tel que le modle quatre tapes ou encore des modles
dits dsagrgs. Ils permettent de construire les grand flux de dplacements raliss
sur un territoire. Toutefois, ces modles supposent de disposer de donnes dentre acquises travers des campagnes de collectes, des comptages ou des enqutes.
Les enqutes mnages/dplacements constituent actuellement souvent llment de
rfrence utilis par les collectivits pour prendre des dcisions damnagement.
Les tlphones portables qui quipent aujourdhui une trs large majorit de
personnes fournissent un nouveau moyen pour percevoir les dplacements de la population. Bien que les tlphones mobiles existent depuis un certain temps, seul un
nombre limit de travaux rcents tentent de les exploiter pour en tirer une information utile sur les dplacements des personnes. Il y a pourtant l une formidable
source dinformations appuye sur un chantillon de personnes jamais atteint dans
les enqutes. De plus, cette donne continuellement renouvele offre des possibilits
dactualisation des connaissances selon les besoins. Les rseaux de tlphonie mobile
apportent en ce sens une rponse aux enjeux poss en matire de comprhension et
de modlisation de la mobilit.
En effet, les enqutes, trs couteuses, ne sont actualises que trs rarement (en
gnral tous les 10 ans). De plus, elles sont bases sur un chantillon trs rduit
(environ 1% de la population), et fournissent une vue fige, un instantan des dplacements. La tlphonie mobile vient pallier ces trois problmes : linformation
est actualise en permanence, lchantillon disponible concerne la quasi-totalit de
la population, et ces donnes fournissent une vue dynamique des dplacements, au
cours de la journe mais aussi pour chaque jour de la semaine, pour tout type
de semaine. Par contre, les donnes tlphoniques souffrent de deux inconvnients
principaux : la faible frquence des relevs dvnements et lapproximation gographique de la position. La frquence des relevs est faible car les vnements relevs
par le rseau cellulaire ne sont pas gnrs en continu mais uniquement lorsque le
mobile est utilis (appel, SMS, etc.), ou lorsque le mobile se dplace (changement
de zone de localisation). La localisation est approxime car, autant il est possible de
savoir quelle station radio est rattach un tlphone, autant il nest pas possible de
savoir o le mobile se trouve dans la zone de couverture de lantenne. Des modles
adquats sont alors inventer pour palier ces problmes et bnficier des avantages
offerts.
Le deuxime enjeu que nous avons identifi concerne les problmes de dcision.
Les problmes rencontrs dans le domaine du transport, et plus gnralement dans de
nombreuses situations relles, relvent dune complexit telle que des algorithmes
exacts ne peuvent les rsoudre dans un temps raisonnable. Le concept mme de
temps raisonnable est trs variable en fonction du problme. Il peut aller de la seconde (voire moins) plusieurs semaines. Ds lors quune approche exacte ne peut
sappliquer, les approches de type heuristique fournissent souvent une alternative
Introduction gnrale
intressante. On distingue deux niveaux dheuristiques selon leur aptitude tre gnralises. Les heuristiques simples et les mtaheuristiques. Les heuristiques simples
sont ddies un problme et nont pas vocation tre gnriques, mme sil est
parfois possible de les adapter dautres types de problme. Les mtaheuristiques
dfinissent un cadre gnral qui leur permet dtre appliques plusieurs types de
problme. Les algorithmes gntiques et les Recherches Tabou font partie de cette
classe.
Par ailleurs, il est frquent que les problmes rassemblent plusieurs objectifs
optimiser simultanment, gnralement contradictoires entre eux. Loptimisation
multiobjectif sadresse ce type de problme en proposant diffrentes approches, par
transformation du problme en un problme mono-objectif par exemple. Mais les
algorithmes les plus efficaces prennent en considration toutes les fonctions objectif
simultanment travers les approches dites Pareto. Le rsultat de ces approches
est alors non pas une solution unique, qui soit la meilleure pour tous les objectifs,
mais un ensemble de solutions de meilleur compromis. Une telle prise en compte
de diffrents objectifs en mme temps entraine bien entendu une complexit accrue.
Une des principales difficults rencontres avec ce type dapproches vient du fait que
cet ensemble nest pas connu lorsque lon aborde un problme rel et cest le cas du
problme de transport que nous avons trait.
Dans le cadre de ce mmoire de thse, nous nous intressons la chaine complte
qui permet de guider une dcision multicritre dans le domaine de lamnagement du
territoire et du transport. Nous traitons ainsi les deux phases principales impliques
dans le processus de dcision : la modlisation des dplacements de la population en
sappuyant sur la tlphonie mobile dune part, et llaboration dune mtaheuristique hybride pour rsoudre un problme doptimisation multiobjectif dautre part.
Les traces que laissent les tlphones portables peuvent tre vues comme des empreintes lectromagntiques. Nous proposons dans ce travail dexploiter ces donnes
pour construire une information sur la faon dont la population se rpartit dans
lespace et dans le temps. Puis laccent est mis sur la rsolution du problme de la
localisation de stations pour un service dauto-partage lectrique en contexte multicritre. Nous prsentons en particulier la dmarche qui nous a permis de modliser
le problme puis de concevoir une heuristique nouvelle, mlant thorie volutionnaire et recherche locale travers llaboration dun algorithme mmtique. Les
deux phases principales de modlisation et doptimisation ont t exprimentes et
valides dans un contexte rel.
Organisation du mmoire
Ce mmoire de thse est organis en deux parties, organises autour des deux
enjeux prsents. Chaque partie est compose de deux chapitres que nous prsentons
Introduction gnrale
brivement.
Partie I Modlisation dynamique de la densit de population via les rseaux cellulaires.

Le premier chapitre est ddi ltat de lart sur les modles de mobilit, et de la
tlphonie mobile comme marqueur de mobilit. Nous y prsentons tout dabord une
taxinomie des modles issus de la littrature autour de trois familles : les modles
alatoires, les modles dterministes et les modles hybrides. Les modles hybrides
sont eux-mmes regroups selon trois classes, les modles agrgs, les modles dsagrgs, et enfin les modles dits activit-centr. Ces derniers modles qui sappuient
sur un chainage dactivits sont particulirement adapts modliser finement les
besoins en mobilit. La tlphonie mobile est galement prsente comme une nouvelle source de donnes permettant de marquer une prsence sur un territoire. Nous
prsentons les travaux ayant attrait ce domaine et qui laissent entrevoir le potentiel
que peuvent apporter ces donnes.
Le deuxime chapitre prsente le modle de distribution spatio-temporelle des
mobiles que nous proposons. Nous nous attachons dans un premier temps prsenter le fonctionnement dun rseau cellulaire ainsi que les donnes pouvant servir
marquer la prsence sur un territoire. Puis nous dcrivons le fonctionnement du
modle propos. Laccent est mis sur la faon dont la description du sursol est utilise pour dfinir une attraction spatio-temporelle du territoire. Enfin, une phase de
validation taye sur un cas dtude rel est prsente associant une collectivit et
un oprateur tlphonique.
Partie II Optimisation combinatoire multiobjectif de lauto-partage.

Le chapitre 3, premier chapitre de cette deuxime partie, dcrit un tat de lart
des mtaheuristiques combinatoires permettant de rsoudre des problmes multiobjectifs. Dans un premier temps, nous prsentons les principaux concepts permettant
dapprhender le domaine des problmes multiobjectifs ; puis les principaux modles sont dcrits, organiss autour de quatre grandes familles. La premire regroupe
les approches par transformation du problme multiobjectif en un problme monoobjectif. La deuxime dfinie les approches dites non-Pareto, qui considrent tous
les objectifs mais sparment les uns des autres. La troisime famille, dite Pareto,
regroupe les algorithmes qui sappuient sur la relation de dominance pour construire
des populations de solutions. La dernire famille consiste en une hybridation de mcanismes issus des familles prcdentes. Ce chapitre se termine sur une prsentation
des mcanismes permettant dvaluer des ensembles de solutions, en se basant sur
des indicateurs de qualit.
Enfin, le dernier chapitre de ce mmoire de thse prsente un nouvel algorithme
Introduction gnrale
combinatoire hybride incorporant une recherche locale dans un schma volutionnaire en contexte multiobjectif. Les principales caractristiques des algorithmes mmtiques sont dans un premier dcrites. Puis nous dveloppons lalgorithme propos
en montrant comment les oprateurs gntiques et la recherche locale sarticulent.
Une phase dexprimentation est alors propose pour rsoudre le problme de localisation de stations pour un service dauto-partage lectrique, que nous avons formalis
sous forme dun problme doptimisation multiobjectif combinatoire. Les rsultats
obtenus sont compars aux rsultats issus de trois autres algorithmes. Enfin, la dernire partie de ce chapitre prsente la plate-forme daide la dcision geoLogic que
nous avons dveloppe notamment pour le problme de lauto-partage.
Ce mmoire se termine par une conclusion qui revient sur les principales contributions apportes dans cette thse. Finalement, une ouverture est propose avec la
prsentation de plusieurs perspectives qui nous semblent particulirement intressantes poursuivre.
Premire partie
Modlisation dynamique de la
densit de population via les
rseaux cellulaires
Chapitre 1
Modlisation de la mobilit, tat

de lart
Ce chapitre permet de situer le contexte dans lequel sinscrit cette premire partie de notre mmoire de thse, savoir la modlisation dynamique de la mobilit.
En effet, pour situer la contribution apporte dans le chapitre suivant, ce chapitre
prsente dabord un chantillon reprsentatif de modles existants sous forme dune
taxinomie : alatoires, dterministes, ou hybrides. Laccent sera mis sur les modles
hybrides, qui apportent le meilleur niveau de ralisme et sapparente de fait au modle que nous proposerons dans le chapitre 2. Puis, sur la ligne de nos travaux,
les rcentes contributions de la littrature qui utilisent la tlphonie mobile comme
marqueur de mobilit sont prsentes.
Sommaire
1.1
1.2
Introduction . . . . . . . . . . . . . . . . . . . . . . .
Taxinomie des modles . . . . . . . . . . . . . . . . .
1.2.1 Modles de mobilit alatoires . . . . . . . . . . . .
1.2.2 Modles de mobilit dterministes . . . . . . . . . .
1.2.3 Modles de mobilit hybrides . . . . . . . . . . . . .
1.3 Cas de la tlphonie comme marqueur de mobilit
1.3.1 Le projet CAPITAL [Systems 1997] . . . . . . . . .
1.3.2 Les travaux du MIT : une source de rfrence . . . .
1.3.3 Autres travaux utilisant la tlphonie mobile . . . .
1.4 Synthse et perspectives . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
11
12
16
17
28
29
29
33
36
10
1.1
Chapitre 1. Modlisation de la mobilit, tat de lart
Introduction
Une connaissance prcise de la faon dont la population se dplace sur un territoire apparait aussi complexe dterminer que primordiale. Les modles de trafic
et plus gnralement de mobilit dvelopps au cours de ces soixante dernires annes reposent sur diverses thories, impliquant notamment la prise en compte des
activits ralises au cours de la journe ou encore loccupation du sol.
A lorigine, les besoins en infrastructures trs coteuses, construites dans le cadre
de projets long terme, ont pouss les collectivits disposer de prvisions de trafic.
Selon les besoins, diffrents modles ont t proposs. A lchelle macroscopique,
un flux entre deux villes (trafic interurbain) peut tre estim par un modle dit
"gravitaire" [PREDIT 1999]. Ds lors que lon sintresse du trafic intra-urbain,
un niveau de complexit plus important est intgrer. Dautre part, les priorits
en termes durbanisation voluent en fonction des contextes conomiques, sociaux
et environnementaux. Ces modles ont d tre affins et repenss pour rpondre
cette complexit dune urbanisation instable.
Cest tout dabord aux tats-Unis dans les annes 1950, avec lapparition de
linformatique, que les premiers modles capables de reprsenter le trafic urbain
sont labors [PREDIT 1999]. Apparat alors une premire gnration de modles,
dits modles "classiques" ou " 4 tapes". Ils permettent de raliser une prvision
de trafic suivant une procdure linaire dcoupe en quatre tapes : la gnration,
la distribution, le choix du mode et laffectation. Ils sont calibrs pour une ville
dtermine partir de donnes de comptages. Par leur approche agrge, ces modles
permettent des prvisions globales de trafic entre groupements de zones, notamment
aux heures de pointe, afin de dimensionner les infrastructures et ainsi planifier les
investissements.
Les besoins en planification court terme ont donn naissance une approche
"dsagrge" base de plus en plus sur lindividu ou sur le mnage. Des volutions
du modle classique en ce sens ont donc t proposes. Mais pour aller plus loin, ces
nouveaux modles dsagrgs galement appels " choix discret", sont capables de
prdire le mode de dplacement au niveau individuel. Ces derniers sont calibrs
partir denqutes de plus en plus fines.
Dans ce chapitre, on se propose de parcourir les principaux modles de mobilit
rencontrs dans la littrature, qui en fonction de leurs caractristiques permettent
de rpondre des enjeux de nature diverse. Les modles seront prsents autour
dune taxinomie en trois familles : les modles alatoires, les modles dterministes,
et les modles hybrides. Alors que les modles alatoires sont gnralement apprcis
pour leur simplicit, ds lors que le niveau de ralisme souhait devient un critre
prpondrant les modles hybrides sont prfrs. Outre les modles classiques, une
tendance trs rcente vise utiliser la tlphonie mobile pour en dduire une infor-
1.2. Taxinomie des modles
11
mation de rpartition de la population sur un territoire. Bien quil ny ait pas encore
de modles proprement parler dans les travaux prsents dans la littrature, il y
a l une nouvelle source de donnes trs fort potentiel. Aussi, nous introduirons
travers plusieurs projets les travaux ayant t effectus ces dernires annes sur
cette thmatique. Cela permettra de positionner notre approche qui sera prsente
dans le chapitre suivant.
Ce chapitre est organis autour de deux sections principales. La premire sera
consacre lnumration et lexplicitation des diffrents modles rencontrs dans
la littrature, des plus arbitraires o lalatoire joue un grand rle, aux plus ralistes tenant compte du type de mobile, de la gographie ainsi que des activits des
personnes. La deuxime section permettra de recenser de faon prcise les travaux
ayant port sur lutilisation de la tlphonie mobile pour en dduire une information
sur la faon dont les utilisateurs de portables se dplacent.
1.2
Taxinomie des modles
Les modles existants prsentent des caractristiques bien distinctes. On peut

identifier diffrentes familles de modles selon que lon sattache davantage simuler
le dplacement des individus, ou bien simuler les effets de groupe. De plus, tous
les modles naccordent pas la mme importance la topologie du terrain. Cette
section prsente une taxinomie des diffrentes approches de modlisation selon le
contexte dtude (cf. Figure 1.1).
Figure 1.1 Taxinomie des modles de mobilit

Les modles de mobilit alatoires simulent des mouvements et directions arbitraires sur une zone de terrain. Ces modles ont pour avantage la simplicit dimplmentation. En radio mobile, ils sont souvent utiliss pour simuler et anticiper
sur le pire des scnarios par rapport loccupation spatio-temporelle du terrain.
12
Ces modles demeurent peu ralistes du fait quil est peu probable que les mobiles
se dispersent alatoirement dans tout un secteur comme un btiment ou une ville.
A lchelle individuelle, les trajectoires sont compltement chaotiques et traduisent
des "stop and go" irrels. Les paramtres de mouvement changent constamment au
cours dune simulation, produisant un dplacement alatoire. Par contre, lchelle
de masse ces incohrences peuvent tre masques. Ce type de modlisation pourrait rvler et prvenir des situations plausibles sur lesquelles un dcideur devrait
sinterroger.
Les modles dterministes reprsentent les traces relles de chaque mouvement
de personnes dans une zone de simulation. Ces modles gnrent des trajectoires
ralistes mais ne sont valables que dans les zones tudies et refltent la ralit avec
un certain degr de rptitivit. La traabilit de ces trajectoires implique beaucoup
de moyens sur le terrain, comme lacquisition de donnes partir denqutes, de
comptages de passages des endroits cls, de questionnaires, etc.
Concrtement, le dplacement des personnes nest ni totalement alatoire, ni
toujours le mme. Nos dplacements suivent un certain schma tout en conservant un
degr de libert. Ainsi un compromis doit tre trouv entre le totalement alatoire,
et la combinaison dterministe de traces. Cest ce quapportent les modles hybrides
qui visent se rapprocher au mieux des dplacements ralistes.
1.2.1
Modles de mobilit alatoires
Ces modles ont t introduits notamment pour raliser des simulations de fonctionnement de rseaux mobiles. Ils ont servi laborer des scnarii de mobilit
afin destimer les cellules radio visites par un usager [Jeon 2000], [Akyildiz 2000],
[Akyildiz 1996], [Ho 1995]. De tels modles peuvent tre appliqus sur un axe (1D)
ou dans le plan (2D), selon les cas envisags. En particulier, pour simuler les dplacements le long dune route, la version 1D sera privilgie. Dans ce cas chaque cellule
est connecte deux voisins : un prcdent et un suivant. Ds quon sintresse aux
mouvements de pitons par exemple, caractriss par des changements de direction
frquents, un modle 2D est envisager. Dans ce cas, chaque cellule dispose de 4
voisins (cellules carres) ou 6 voisins (cellules hexagonales).
1.2.1.1
Random Walk Mobility Model
Dans ce modle de mobilit dcrit dans [Camp 2002], un mobile se dplace vers
une destination avec un angle et une vitesse prises de faon quiprobable entre
des valeurs minimales et maximales. Chaque mouvement seffectue sur un intervalle
de temps constant. Les valeurs dangle et de vitesse sur un intervalle de temps
tant indpendantes de celles de lintervalle prcdent, ce mouvement traduit des
13
changements brusques dangle et de vitesse, ce qui est peu raliste. A chaque instant,
le mobile se dirige donc vers une cellule voisine avec une probabilit p, ou reste dans
la mme cellule avec une probabilit (1 p).
Figure 1.2 Exemple de mouvements obtenus avec le modle "Random Walk"

Les mouvements du mobile sont formaliss par des chanes de Markov, dcrites
par leurs tats et une matrice de probabilit de transition P . Chaque lment Pij
reprsente la probabilit de passer dun tat i ltat j.
Ce modle traduit des changements de direction frquents. Sur une autoroute,
il est inconcevable quun mobile marque frquemment des allers-retours comme le
montre la Figure 1.2. Cest tout le dfaut de ce type de modles lchelle de
trajectoires individuelles.
1.2.1.2
Markovian Movement Model
Plusieurs auteurs utilisent ce modle dans le cadre 1D [Burulitisz 2004], ou encore [Bar-Noy 1994]. Il est une extension du "Random Walk", dcrit par le diagramme dtat Figure 1.3 et une matrice 3x3 de probabilit de transition :
q 1qv v
P = p
1 2p
p
v 1qv q
(1.1)
Daprs le diagramme dtat, un usager peut tre dans lun des trois tats suivants (Figure 1.3) :
L : tat de dplacement vers la gauche partir de la cellule courante
R : tat de dplacement vers la droite partir de la cellule courante
S : tat stationnaire (reste dans la cellule courante)
14
Figure 1.3 Diagramme dtat du modle de chane de Markov une dimension

(extrait de [Bar-Noy 1994])
Wu & al. [Wu 2002] proposent une version 2D de ce modle en dfinissant des
distributions non uniformes des probabilits de transition entre cellules (HO). Ce
type dapproches a notamment t utilis par Perera & al. [Perera 2002] en 2002
pour simuler lutilisation des rseaux UMTS, avec lintroduction de comportements
de mobilit en fonction de la cellule et du type de mobile. Dans ce dernier article,
les auteurs prsentent les conditions de stationnarit et le calcul du nombre moyen
de mobiles par maille en termes de taux darrive, de probabilit de transition et de
temps de sjour moyen.
En conclusion, ces modles, appropris pour modliser le mouvement de pitons
de cellules cellules, ne sont pas ralistes. Aucun point de destination nest dfini,
cela conduit des dplacements assez chaotiques et sans objectif.
1.2.1.3
Normal Walk model
Voici une autre extension du "Random Walk", qui tient compte cette fois du
mouvement prcdent pour dterminer le mouvement courant. Ce modle intgre
le fait que la plupart des dplacements rels suivent soit le chemin le plus court
pour rejoindre sa destination, soit une route pseudo-linaire entre lorigine et la
destination [Tsai 1999].
Un angle de rotation dtermine une des six directions possibles dune cellule
hexagonale. La probabilit associe cet angle est distribue selon une loi normale
avec une moyenne de 0et un cart-type variant de [5,90] : N(0, 2 ). Ainsi cette
loi favorisera les dplacements rectilignes tout en acceptant des courbures de trajectoire [Tsai 1999][Tuan 2003]. La Figure 1.4 montre trois exemples de trajectoires
pour diffrentes valeurs de pouvant caractriser trois environnements diffrents
(rural, suburbain, urbain). Il est ainsi constat que plus est petit, plus les trajectoires seront douces, linaires et surtout tendues sur de plus grandes zones.
15
Figure 1.4 Trois trajectoires de 2000 pas du modle "Normal Walk" pour
=15,30 et 60 (extrait de [Tuan 2003])
1.2.1.4
Random Waypoint Mobility model
Ce modle est semblable au Random Walk Mobility, mais il intgre des temps
de pause entre les instants de changements dangle et de vitesse. Il est beaucoup
utilis dans la communaut des rseaux Ad hoc [Bettstetter 2003] et est implment
dans une large majorit de simulateurs MANET (Mobile Ad hoc NETworks). A
linitialisation chaque mobile est positionn alatoirement. Une destination de la
zone de simulation ainsi quune vitesse de dplacement V [Vmin , Vmax ] sont galement choisies alatoirement. Au point de destination, le mobile y reste un certain
temps t [tmin , tmax ], puis un nouveau couple (destination, vitesse) est choisi,
sans aucune corrlation avec les valeurs prcdentes. A tout moment un mobile est
dcrit par sa position (x(t), y(t)), sa vitesse courante V (t) et son point de destination
courant (xd (t), yd (t)).
Ce type de modle est galement tendu pour simuler des dplacements de
groupes de noeuds formant un rseau PAN (Personal Area Networks) [Cano 2004a]
[Cano 2004b] [Hong 1999]. Ceux-ci exploitent le concept de "piconets", qui sont de
petits rseaux, normalement constitus dau plus 8 noeuds, o un des noeuds est le
matre dans la topologie.
16
1.2.1.5

Dautres modles alatoires
De nombreux autres travaux ont trait des modles alatoires. On notera en

particulier le "Smooth Mobility Model" [Bettstetter 2001] qui permet de lisser les
changements de vitesse et de direction. Cest le premier modle alatoire faisant
apparatre des notions de classe de mobilit (par exemple pitons, voitures en centre
ville, vlos) en dfinissant diffrents jeux de paramtres : vitesse max, probabilit des
vitesses de prfrences... De mme Liang et Haas [Liang 2003] prsentent le modle
de mobilit "Gauss-Markov". Ce modle intgre la notion de vitesse pour estimer la
position future. Il est notamment utilis par Camp & al. [Camp 2002] et fournit la
simulation illustre Figure 1.5.
Figure 1.5 Exemple de motif de dplacement dun mobile utilisant le modle de

mobilit Gauss-Markov (extrait de [Camp 2002])
1.2.2
Modles de mobilit dterministes
La seconde classe de modles prsente ici, dite dterministe, vise construire

des rgles partir de donnes dentre telles que des enqutes, des questionnaires et
des comptages.
Le seul article [Scourias 1999] qui traite de cette approche prsente une tude
ralise dans la rgion de Waterloo. Lobjet de cette tude tait de simuler des
trajectoires de mobilit partir des donnes collectes. Les informations utilises
pour construire ces trajectoires sont :
la connaissance des motifs de dplacement au cours de la journe
le chainage des activits ralises
Afin dalimenter le modle prsent dans [Scourias 1999], une enqute a t ralise sur les dplacements des personnes de 5 ans et plus. Cette enqute, du type
Enqute Mnages/Dplacements (EMD), contient en particulier les heures de d-
17
part et darrive des dplacements, ainsi que le motif (travail, scolaire, accompagner
quelquun, achats, loisirs, retour chez soi).
Des matrices sont ralises pour reflter la dure des activits lies chaque
dplacement, ainsi que les transitions entre activits. Ces matrices dfinissent le
comportement obtenu lors du processus de simulation.
Bien que lauteur mette en avant lintrt dun tel modle, le travail demand
est particulirement fastidieux, ce qui limite sa porte.
1.2.3
Modles de mobilit hybrides
Bien que les modles alatoires et dterministes fournissent des trajectoires plausibles, ils restent loigns des dplacements rels ou sont trs coteux construire
et ne peuvent pleinement tre utiliss pour laborer des politiques damnagement,
en matire de transport par exemple. Les modles de mobilit hybrides rpondent
cette exigence, en combinant mouvements alatoires et rgularit de dplacements.
1.2.3.1
Modlisation des flux : approches issues des systmes de transport
Les modles prsents ici permettent de reproduire les principales caractristiques des mouvements de personne. Ils sont largement utiliss dans les modles de
mobilit dits "intgrs" prsents section 1.2.3.2.
Fluid flow model : Il sagit de modles qui sappuient sur des thories physiques
issues de lhydrodynamique [Lam 1997]. Laccent nest pas mis sur le dplacement
individuel mais au contraire sur une analyse du nombre moyen de personnes traversant la rgion tudie.
Ces modles sont particulirement utiliss pour des tudes de transport, afin
didentifier le taux dutilisation dun axe routier [Markoulidakis 1997]. Dans ce modle les mobiles appartenant un mme flux suivent la mme direction la mme
vitesse. Ce type de modles a galement t utilis pour tudier limpact du trafic
autoroutier sur les rseaux mobiles [Lizee 2001], lors dun ralentissement d un
accident par exemple.
Gravity model : L encore il sagit de modles directement inspirs de la physique. Cette famille de modles est trs souvent utilise dans les modles "intgrs"
pour simuler les dplacements entre diffrentes rgions gographiques. Un des avantages lis ces modles est quils permettent de simuler des flux diffrentes chelles,
18
du niveau local jusquau niveau national et international [Lam 1997]. Formalisons

maintenant le fonctionnement de ce modle. Soit Ti,j la quantit de trafic se dplaant dune rgion i vers une rgion j. On a alors :
Ti,j = ki,j Pi Pj
(1.2)
Avec : Pi la population habitant dans la rgion i

(ki,j ) les coefficients caractrisant les dplacements pour aller de i j.
La matrice K peut tre construite de diffrentes manires pour dfinir les diffrentes variantes de ces modles. En particulier, pour se rapprocher de la loi de la
gravit de Newton, K peut tre calcule proportionnellement linverse du carr
de la distance entre les zones i et j, do le nom de ces modles. Dans des versions
plus complexes, cette matrice peut galement intgrer des donnes de trafic telles
que des comptages routiers.
Bien que lquation 1.2 dcrive un trafic agrg, il est possible de modliser des
dplacements par individu. En effet, en fixant lattraction Pi de la rgion i, et la
probabilit Ti,j daller de i vers j, on peut agir sur des mobiles pour simuler leurs
dplacements.
1.2.3.2
Modles de mobilit intgrs
Ces modles ont la particularit de regrouper en leur sein diffrents modles

adapts diffrents niveaux dchelle. On distingue souvent dans ces modles trois
niveaux de prcision, et donc trois stratgies de simulation.
Selon le type dapplication, les modles utiliss chaque niveau dchelle vont
diffrer. Ainsi, dans [Lam 1997] est propos un modle de mobilit pour simuler limpact des dplacements sur le fonctionnement des rseaux 3G. On distingue le niveau
local, sappuyant sur un modle Markovien (cf 1.2.1.2), et les niveaux nationaux et
internationaux qui sappuient sur des approches gravitaires 1.2.3.1.
Dans [Markoulidakis 1997], le modle de mobilit concerne lchelle urbaine. Les
trois niveaux de ce modle sont donc beaucoup plus fins. Ainsi on distingue le niveau
"rue", le niveau "quartier" et le niveau "agglomration".
Mais dautres approches considrent deux niveaux uniquement. Cest le cas par
exemple dans [Liu 1998], o lapproche "Global-Local mobility model" (GLMM)
est propose. Alors quau niveau global un modle dterministe est propos, au
niveau local cest un modle stochastique qui est choisi. Cette approche a permis de
simuler le fonctionnement dun rseau mobile, selon les dplacements des personnes.
19
Le modle global a ainsi permis de simuler les transferts intercellulaires alors que le
modle local sattachait simuler les mobilits intracellulaires.
On notera que dautres modles de complexit variables ont t proposs, tels
que [Erbas 2001, Erbas 2002] qui intgrent dans leurs modles une prdiction des
dplacements venir. Ils sappuient pour ce faire sur laspect rgulier et rptitif de
nos dplacement dun jour lautre.
Figure 1.6 Squence de cellules dun profil usager (extrait de [Erbas 2001])
Ces algorithmes laissent entrevoir les possibilits que peut apporter la tlphonie
mobile pour caractriser les dplacements des personnes.
1.2.3.3
Modles bass sur la gographie
On rencontre dans la littrature des modles de mobilit sappuyant sur une

description fine du territoire.
Kammann & al. [Kammann 2003] proposent un modle de mobilit bas sur des
cartes gographiques. Ils ont en particulier propos deux mthodes de dplacement,
lune utilisant lalgorithme de Lee [Lee 1961], dvelopp lorigine pour la constitution automatique de circuit imprim, et lautre reposant sur la diffusion des gaz dans
lespace vue en thermodynamique et utilise pour trouver les chemins que peuvent
prendre des robots [Azarm 1994].
Aprs avoir dtermin les chemins, un modle de vitesse est appliqu. La vitesse
20
Figure 1.7 Mthodes de dtermination des chemins (extrait de [Kammann 2003])

v(t + Ts ) est calcule suivant la valeur prcdente v(t) et une valeur dacclration
a(t). Cette dernire est gnre par un processus alatoire. La vitesse est comprise
ente [vmin , vmax ] et 0m.s1 vmin vmax :
v(t + Ts ) = min(max(v(t) + a(t).Ts , vmin ) , vmax )
(1.3)
Dautres modles galement bass sur la gographie intgrent, en plus du rseau

routier, une information sur la localisation des btiments. Dans ces modles, la
nature des btiments permet dy associer une attractivit variant selon lheure de
la journe. Dans [Joumaa 2007] est prsent le modle Mask-Based Mobility Model
(MBMM).
Il sagit dune approche maille o chaque maille (cellule carre) a un poids
dattraction dpendant de la gographie et du moment de la journe. A chaque
tape, le mobile se dplace vers une des 8 mailles voisines (cf. 1.8). La direction est
choisie chaque tape en fonction dune chaine de Markov de 9 tats. La probabilit
21
Figure 1.8 MBMM : grille des probabilits de transition

de transition est calcule en fonction du poids de chaque maille voisine.
Le modle V-MBMM [Ait Ali 2010b] est une adaptation de MBMM pour la
simulation des dplacements de vhicules, toujours par une chaine de Markov qui
prend en compte la topologie et les poids dattraction, mais cette fois des routes.
1.2.3.4
Le modle 4 tapes
Le modle quatre tapes est le modle "classique" des tudes de trafic. Dans
[Bonnel 2002] ce modle est longuement dvelopp et chacun de ses composants est
analys. Il sagit dun modle qui est utilis dans de nombreux projets de simulation
de flux. Contrairement aux modles habituels, il sagit ici plutt dun schma gnral
suivre. Son application suppose dans un premier temps de diviser le secteur dtude
en diffrentes zones gographiques ou logiques, gnralement partir de donnes
socio-conomiques, permettant dagrger les diffrentes donnes. Ce modle dcrit
les quatre tapes principales que nous rappelons succinctement.
La gnration : Cette premire tape a pour but de dterminer le nombre de
dplacements, cest--dire quantifier les flux entre les diffrentes zones. Il sagit donc
de savoir si les individus se dplacent ou non et si oui dans quelles zones. On cherche
alors modliser ces choix en se plaant du point de vue dune zone. On obtient
alors dune part, lensemble des dplacements mis par une zone donne et dautre
part lensemble des dplacements dont la destination se situe dans cette mme zone.
On parle alors dmission et dattraction dune zone qui constitue la gnration. Ce
nombre de dplacements entrants ou sortants est fonction de nombreux paramtres,
notamment les caractristiques doccupation du sol des zones : les services, la population, lemploi, etc. Il y a deux moyens de calculer les missions et attractions
par zone : une mthode statistique (rgression linaire) ou une utilisation de taux
22
de mobilit obtenus par enqute-mnages [Nguyen-Luong 2000a]. En sortie de cette

tape, on obtient par zone deux vecteurs, un pour les missions E, lautre pour les
attractions A. La gnration attribue donc chaque zone ses vecteurs E/A.
La distribution : Dans cette seconde tape, on sintresse cette fois la situation
o les individus se dplacent, dune zone O origine une zone D destination. Il sagit
en fait de lier les missions et les attractions prcdemment obtenues par couple
de zone O/D tous modes confondus. Cette tape consiste donc reconstituer les
matrices reprsentatives des flux pour tous les couples de zones O/D en sajustant au
mieux aux observations de laire dtude. A cette tape les volumes de dplacement
entre les diffrentes zones du dcoupage initial sont connus. Plusieurs modles sont
utiliss ce niveau comme le maximum dentropie ou le modle gravitaire.
Le choix modal ou la rpartition modale : On sintresse dans cette tape
au choix du mode de transport des individus cest--dire par quel moyen ils se
dplacent. La matrice "tous modes" produite prcdemment est clate en matrices
par modes. Il en ressort une estimation des volumes de dplacement pour chaque
moyen de transport prendre en compte. Les matrices O/D pour les diffrents modes
modliser sont gnres lissue de cette tape. Les mthodes mathmatiques
gnralement utilises sont la rgression multiple, les tables de parts modales par
segment de population, ou encore des courbes sigmodales pour des modles agrgs.
Laffectation : Cette dernire tape consiste modliser le choix de litinraire
des individus pour se rendre dune zone O une zone D. Concrtement, il sagit
ici daffecter toutes les matrices prcdemment gnres sur le rseau laide de
techniques oprationnelles (algorithme du plus court chemin, optimisation, etc.). A
la fin de cette tape, on obtient des rseaux chargs, cest--dire que les prvisions
(telles que par exemple le nombre de vhicules, de voyageurs ou encore la vitesse
et le temps de parcours) sont distribues et connues sur chaque arc. Pour les rseaux routiers, une technique daffectation statique avec contrainte de capacit est
gnralement employe. Pour les rseaux de transport en commun on voit plus communment une affectation "tout ou rien". Dans les recherches effectues, plusieurs
projets se basent sur le logiciel DAVISUM pour effectuer cette tape.
En rsum, ce modle se base sur loffre et la demande. Les trois premires
tapes dfinissent le calcul de la demande, la quatrime tape calcule laffectation
sur loffre. Lensemble de ces quatre tapes permet ainsi une affectation modale
des flux de dplacements. Par ailleurs, ce modle localise toutes les activits une
priode de temps donne (heure de pointe par exemple).
Les premiers modles quatre tapes sont dvelopps aux tats-Unis dans les
annes 1950. Ils sont imports en France partir des annes 1960. Historiquement,
23
les premiers modles ont une approche agrge et plutt dterministe. Orients automobile aux tats-Unis, ils subissent de lgres adaptations pour rpondre au besoin
grandissant du transport en commun dans les grandes villes de France, qui continueront cependant lexploiter dans sa dimension agrge. Le modle GLOBAL
[RATP 2010] de la RATP est ainsi conserv (modle classique 4 tapes agrg). Il
correspond la zone dtude Rgion Ile-de-France et sud de lOise.
Par la suite les modles dsagrgs ont permis de tenir compte de lhtrognit
des comportements individuels. En effet, il existe plusieurs manires de modliser
les individus des chelles diffrentes en fonction des besoins. Pour comprendre,
lchelle microscopique, qui correspond au niveau de dsagrgation maximum,
on sintresse lindividu et au dtail qui le caractrise. On parle alors de donnes
dsagrges. Une chelle intermdiaire consiste en une agrgation des donnes prcdentes suivant des caractristiques individuelles communes (classe sociale, modalits
identiques, agrgation gographique, etc.). A lchelle macroscopique, on sintresse
alors une population entire (nombre total de dplacements, moyenne dge, etc.).
Il est donc intressant de constater que les niveaux dagrgation peuvent soprer diffrents niveaux ou modules et peuvent tre de plusieurs types (agrgation
temporelle, agrgation gographique, etc.). Daprs les recherches et les exemples de
modles trouvs il nest pas dmontr quun niveau dagrgation soit meilleur que
les autres, par contre il est tabli qu chaque niveau dagrgation, le modle perd en
consistance mais gagne en stabilit. On peut alors envisager pour toutes les phases
dun modle quatre tapes dutiliser au choix des donnes agrges ou dsagrges
en fonction de lutilit finale du modle.
Ainsi par rapport au modle classique agrg, quelques amliorations ont t
apportes par une approche plus dsagrge dans les diffrentes tapes dcrites prcdemment [Nguyen-Luong 2000a]. On parlera alors de modle quatre tapes hybrides (ex : logiciels EMME2, MINUTP ou TRIPS utiliss en France) par opposition
au modle quatre tapes classique. De plus en plus, les diteurs prsentent souvent
une suite de logiciels adaptables et modulaires (un module pour la gnration, un
pour laffectation, etc.). De mme une suite de logiciels base sur un modle statique
agrg peut comporter des modules dynamiques dsagrgs.
En ce qui concerne les amliorations dans la gnration, il faut trouver le bon
compromis, entre un systme entirement dsagrg dans lequel chaque demande
de dplacement est tudie individu par individu pour tre additionne sur une
population la fin du processus, et un systme agrg dans lequel tous les individus dans une zone sont supposs tre moyens. Daprs le rapport de lIAURIF
[Nguyen-Luong 2000b], il semble que la segmentation de march soit un compromis
trs intressant lorsquon ne dispose pas de moyens de dvelopper un modle dsagrg. Cest une approche par exemple exploite dans le logiciel VISEM-DAVISUM
(PTV). Cependant elle se trouve vite limite en termes de prvisions dans le temps
24
notamment dans ltape de choix modal.

Concernant lamlioration dans le choix modal, beaucoup de modles mathmatiques ont t dvelopps. Avec la dsagrgation, plusieurs modles de choix discrets
ont t proposs (LOGIT, PROBIT, DOGIT). Probabiliste et bas sur la thorie
dutilit dun certain mode pour un dplacement donn, cest le modle LOGIT qui
est utilis dans la plupart des cas de modles dsagrgs au niveau de la modalit
(mise en oeuvre par le logiciel HIELLOW).
Au final, tant bas sur la distinction des dplacements par motif de dplacement, cette approche quatre tapes suppose lindpendance de ces motifs dans un
dcoupage gographique donn. Les modles daffectation conventionnels sont statiques (affectation des dplacements sur le rseau en utilisant une matrice agrge
sur une priode moyenne) et il ny a pas de chargement graduel dans le temps.
Pourtant daprs les recherches effectues, le modle quatre tapes classique
ou hybride est un modle reconnu et satisfaisant dans la simulation des transports
notamment lchelle macroscopique (encore utilis aujourdhui). En effet, les modles existant (ex : GLOBAL RATP [RATP 2010]) semblent bien adapts ltude
des infrastructures routires ou de transport en commun lchelle macroscopique
et remplissent parfaitement leur rle en matire de dimensionnement des infrastructures et de calcul de leur rentabilit socio-conomique.
Cependant, il faut ajouter un bmol car la modlisation des transports aujourdhui impose de sintresser galement lurbanisation notamment avec les modles
doccupation des sols tels que les modles "LUTI" (Land-Use Transport Integrated
models). En termes durbanisation, la modlisation de trafic classique (statique)
quatre tapes est dpasse mme si elle est encore largement utilise par dfaut en
France dans la pratique. Cest partir de ce constat quest n le projet SIMAURIF
[Nguyen-Luong 2008] liant un modle durbanisation URBANSIM et un modle dynamique de prvision de trafic DAVISUM-METROPOLIS, vritable projet pionnier
en France dans le domaine de la modlisation de linteraction urbanisation-transport
(cf. p11 [PREDIT 2007]).
La ralit de la mobilit urbaine une chelle plus microscopique introduit une
problmatique diffrente. La focalisation au niveau de lindividu devient ncessaire.
Cette complexit nouvelle rside dans la prise en considration de facteurs du comportement des individus. Dans ce domaine, les modles quatre tapes classiques
sont dpasss. Pour cause, avec la plupart de ces modles, laffectation en pratique
est statique. Consquence, chaque mobile apparat simultanment sur chaque arc de
litinraire, dfiant la notion relle despace-temps. Face cette approche dterministe, apparat alors une notion plus stochastique despace, de temps et dactivits
qui insiste sur les ressorts de la mobilit plutt que sur les volumes de trafic et
fait apparaitre le concept de "Time-geography" (cf. p12 [PREDIT 2007]). On parle
alors dapproche "activit-centre" mettant en avant le comportement des individus
25
dilus plus finement dans le temps.
1.2.3.5
Modles bass sur lactivit
Daprs les recherches, les comportements de mobilit reposent sur des composantes sociales et des contraintes spatio-temporelles, do la notion despace-tempsactivit. Si lapproche classique tendait rduire la mobilit un simple dplacement, lapproche activit-centre quant elle, base sur lactivit individuelle, introduit la complexit relle du dplacement au niveau de lindividu. Elle impose une
segmentation plus dtaille de lactivit et un traitement plus labor des dcisions
de dplacement et des lieux associs.
Les comportements humains sont individuellement modliss en reprsentant la
faon dont chaque individu choisit entre plusieurs options suivant ses perceptions
propres (prfrence, habitude, incertitude, alternative, limite de temps ou dargent,
manque dinformation, etc.). Les donnes dentres sont obligatoirement de plus en
plus fines.
Les modles de transport bass sur lactivit sont en dveloppement dans plusieurs pays et sont gnralement considrs comme les modles de transport du futur
(URBANSIM).
Par ailleurs, ce nouveau modle de demande permet de simuler une chane de
dplacements ou plus exactement une suite dactivits (changement dtat des individus un autre) et savre donc intressant dans la modlisation microscopique de
la mobilit urbaine pour notre cas dtude. On distingue 2 types de reprsentations
pour les suites dactivits, les suites temporelles et les suites vnementielles.
Les disparits avec le modle classique sont nombreuses et peuvent tre rsumes
comme suit (cf. p8 [PREDIT 2007]) :
26
Objectif du modle
Unit dobservation
gographique
Unit dobservation
du dplacement
Sources de donnes
Interaction donnes
socio-conomiques et
dplacements
Rsultats des analyses
Modle 4 tapes
Prvisions de trafic pour planifier les investissements
Approche agrge : groupement
dilots ou communes
Lorigine et la destination sont
prises en compte
Les donnes socio-conomiques
proviennent denqutes varies :
recensement (RGP), enqute
transport (ETC), Enqutes Mnages/Dplacements
(EMD),
enqutes cordon.
Relation indirecte entre les donnes de population et de trafic
Modle activit-centre
Comprendre les comportements
de dplacement
Approche dsagrge lchelle
de lindividu ou du mnage
Dcomposition en squences
dactivits
Ncessite des donnes sur les
activits individuelles partir
denqutes ralises localement
(EMD)
Le nombre de dplacements est

consign dans une matrice zone
zone
Les dplacements sont analyss

dans lespace et le temps
Relation directement issue de

lenqute
Cette confrontation avec lapproche classique met non seulement en vidence le

niveau de prcision des donnes dentre mais galement le niveau de complexit
mthodologique en termes de modlisation informatique. Cest pour rpondre ce
dernier point que sopre le vrai changement avec lapparition des systmes multiagents dans les annes 1980. Dans un contexte de puissance informatique grandissant, il constituera un vritable bon en avant dans la modlisation de la mobilit.
1.2.3.6
Autres modles hybrides
Kim & al. proposent un modle de mouvement 3D dans des immeubles avec cage
descalier [Kim 1998] et avec ascenseurs [Kim 2000].
Les usagers se dplacent de faon rectiligne sur un tage jusqu ce quils changent
de direction (gauche, droite, arrire suivant une distribution de Poisson) puis continuent tout droit, ainsi de suite. Si le point o ils tournent est dans la zone de cage
descalier ou dascenseur, les abonns bougent horizontalement ou verticalement
selon certaines probabilits. La vitesse du dplacement horizontal ou vertical est
uniformment rparti entre [0, Vmin ] et [0, Vmax ] respectivement pour les pitons.
Tian & al. [Tian 2002] proposent un modle de mobilit bas sur les graphes. Un
centre ville est approxim par un graphe, dont les sommets reprsentent les lieux
frquents par les usagers et les arcs les connexions entre ces lieux. Les mouvements
des usagers sont donc limits aux arcs entre les sommets. Chaque sommet a le
mme poids, cest--dire quaucun point nest plus attractif quun autre pour lusager
mobile.
Les sommets origine et destination de chaque mobile sont choisis alatoirement.
27
La vitesse de dplacement est comprise entre [Vmin , Vmax ]. Le mouvement se fait

toujours par le chemin le plus court. A larrive au point de destination, le mobile
reste un certain temps sur place [tPmin , tPmax ], avant de partir vers un nouveau
sommet alatoire.
Ce modle est proche du "Random Waypoint" (cf. 1.2.1.4). La seule diffrence
pour le rendre plus raliste est de contraindre les mouvements sur un graphe construit
partir de la connaissance de la gographie.
Une amlioration de ce type de modle serait dallouer une certaine attraction
des sommets.
Figure 1.9 Graphe du centre ville de Stuttgart (extrait de [Tian 2002])

A nouveau pour les rseaux Ad Hoc, dans [Bittner 2005] est prsente une modlisation base sur des zones connectes de diffrentes densits par un graphe. Les
auteurs affirment que ce modle nest pas aussi spcifique que la plupart des modles les plus ralistes qui permettent de simuler certains scnarii de mobilit. Cette
modlisation permet de prserver cette structure htrogne, cest--dire la rpartition du trafic htrogne de forte densit sur certaines zones ou cluster associ et
de faible densit sur dautres zones ou des axes. Le poids des arcs du graphe dfinit
la probabilit quun mobile choisisse ce chemin lorsquil quitte une zone constituant
le sommet. Pour chaque sommet, un intervalle de temps de sjour dans la zone
est donn. Ce dernier est ensuite distribu uniformment dans cet intervalle. Le
dplacement est modlis de deux manires diffrentes selon o se situe le mobile :
A lintrieur des sommets par un "Random Waypoint Mobility model"
Sur les artes, le dplacement se fait sur des choix alatoires respectant les
poids de chaque arte et la vitesse.
La difficult de cette modlisation est la dfinition des zones et du graphe qui
28
peut tre trs complexe pour les systmes radio-mobiles couvrant des zones gographiques trs largies. Des niveaux de hirarchisations pourraient tre envisags
suivant le type et la taille des zones tudier.
Pour information, Jardosh & al. [Jardosh 2005] proposent lutilisation des mmes
modles de mobilit alatoire (RWP...) pour les rseaux Ad Hoc, bass cette fois sur
un graphe de Vorono afin de dfinir les chemins rels entre obstacles physiques.
Figure 1.10 Terrain simul par un graphe de Vorono (extrait de [Jardosh 2005])
1.3
Cas de la tlphonie comme marqueur de mobilit
Les tlphones mobiles sont lorigine de nouvelles formes de connexion, tant

entre les personnes quavec les lieux et les infrastructures urbaines. Le lien troit
existant entre lutilisateur de mobile et son tlphone a ds 1994 incit des chercheurs
tudier les dplacements de ces appareils : si lon est capable de comprendre
les mouvements des tlphones on en dduira une information pertinente sur la
mobilit des personnes. Les premires exprimentations se sont pourtant rvles
peu concluantes, en particulier en raison de la faible prcision des donnes et du
faible nombre dabonns jusquau dbut des annes 2000.
Alors que jusquen 2006 quelques rares exprimentations seulement ont t ralises [Steenbruggen 2011], les premiers travaux significatifs ont t mens par une
quipe du Massachusetts Institute of Technology (MIT), au laboratoire SENSEable
City. Ils ont ainsi ralis plusieurs exprimentations utilisant ces nouvelles technologies pour tudier ce quils appellent le Paysage Mobile [Ratti 2006], comportement
1.3. Cas de la tlphonie comme marqueur de mobilit
29
dans lespace et dans le temps des socits urbaines. Contrairement au principe des
applications de type Location Based Services (LBS) [Ahas 2005], ici on ne sadresse
pas directement lutilisateur du mobile. Il sagit donc dexploiter les donnes tlphoniques sans intervention de lutilisateur, en observant uniquement le fonctionnement du rseau lui-mme.
Depuis 2006, plusieurs travaux de recherches ont ainsi t mens pour exploiter
les informations qui transitent en permanence par les rseaux de tlcommunications
afin dobserver les mouvements de la ville diffrents moments de la journe. Alors
que pendant longtemps un des principaux freins lutilisation de cette source de
donnes tait la difficult daccs aux donnes elles-mmes, la libralisation actuelle
des donnes notamment au travers de lOpen Data, incite (bien que trs timidement
encore !) les oprateurs mettre disposition certaines informations sur la faon
dont leur rseau est utilis. La localisation obtenue est bien moins prcise quavec
un GPS, cependant la masse de donnes lie la prsence gnralise des relais
tlphoniques et au grand nombre dutilisateurs permet denvisager une exploitation
trs pertinente.
1.3.1
Le projet CAPITAL [Systems 1997]
Ce premier projet ralis dans la rgion de Washington DC (USA) fut initi en

1994 pour une dure de 27 mois. Il sagissait dutiliser la tlphonie mobile pour
apporter une meilleure comprhension de la mobilit urbaine. Le projet CAPITAL
(Cellular Applied to ITS Tracking And Location) avait ainsi pour objectif de fournir
une information temps rel sur ltat du trafic routier, travers lobservation de
donnes provenant directement dun oprateur tlphonique. En raison de la taille
trop importante des cellules radios et certainement du manque dexprience de ce
type, les rsultats se sont avrs peu concluants. Le niveau de prcision de lordre
dune centaine de mtres ne permettait pas de construire une information fiable sur
ltat du trafic.
1.3.2
Les travaux du MIT : une source de rfrence
Le laboratoire SENSEable City du MIT publie les premiers rsultats de visualisation dynamique de la mobilit partir des tlphones portables en 2006. Les
techniques dtude de la mobilit ont ainsi t dveloppes et exprimentes dans
des contextes varis de diffrentes villes travers le monde. A lorigine de ces travaux un architecte italien, Carlo Ratti, un passionn des interactions pouvant exister
entre la ville et les nouvelles technologies. Nous citons ci-aprs une suite de travaux
mens au MIT sur ce sujet.
30
1.3.2.1
City out of Chaos : Social Patterns and Organization in Urban

Systems [Pulselli 2006]
Ce travail est men avec lUniversity of Siena et en partenariat avec un oprateur

tlphonique dans la rgion de Milan sur un territoire de 20km x 20km. Les rsultats
obtenus sur 16 jours dobservation ont permis de faire ressortir des cartes de chaleur
qui refltent le niveau dutilisation des tlphones portables en fonction des lieux et
des moments de la journe.
1.3.2.2
Real Time Rome [Francesco 2006]
A la mme priode que le projet men Milan, le MIT prsente le projet Real
Time Rome la Biennale de Venise. Il sagit de lun des premiers exemples dun
systme de surveillance urbaine temps rel qui permet de cartographier les dplacements des tlphones portables en y ajoutant dautres donnes de mobilit issues des
rseaux de transport (bus et taxis). Les projections issues de ce travail fournissent
un point de vue sur le fonctionnement de la ville de Rome, dun point de vue gographique et socio-conomique. Les cartes projetes lors cet vnement permettent
de montrer :
la rpartition de diffrents groupes sociaux dans la ville tels que les touristes
et les rsidents
loccupation des zones de la ville et le dplacement des personnes dans les
zones pendant les vnements spciaux
les endroits les plus attractifs Rome
le niveau de corrlation entre la distribution du transport public (taxi, bus)
et la densit de la population
La Figure 1.11 propose une illustration de ce qui est observable. La couleur
jaune reprsente les lignes autobus et la couleur rouge correspond la densit de
population en temps rel.
Quelques annes aprs, Calabrese et al. [Calabrese 2009] ont enrichi les rsultats
de 2006 travers le projet WikiCity. Les donnes utilises dans WikiCity sont :
localisation des bus et taxis par GPS
bruit de la circulation (traffic noise) partir de capteurs sans fil installs
Rome
intensit du trafic (traffic intensity)
densit des touristes obtenue partir de lanalyse de lIMSI des utilisateurs
localiss
densit des pitons obtenue partir des donnes de localisation des utilisateurs
supposs marcher faible vitesse
vitesse des vhicules
31
Figure 1.11 Vue de Rome en temps rel
1.3.2.3
Mobile Landscapes : Graz in Real Time [Ratti 2007]
A Graz, en Autriche, Ratti et al. [Ratti 2007] ont cartographi le remplissage

des zones de la ville en temps rel, ainsi que les dplacements des utilisateurs. Afin
dviter des problmes de confidentialit, la collecte des trajets a eu lieu lors de
lexposition M-City auprs de volontaires. Les personnes souhaitant participer
lvnement se sont enregistres par SMS et ont t suivies durant 24h. Lors de lexposition, le public a ainsi pu voir sanimer les cartes dintensit du trafic tlphonique
en direct. Le projet ralis Graz a permis aux auteurs daborder les rapports entre
ville, technologie de communication et individu. Il sagit dun travail de fond qui
aborde les questions fondamentales que lon se pose lorsquon souhaite aborder ce
sujet. En particulier sont abords les apports de la tlphonie en tant que nouvel
outil : linfluence de la tlphonie sur notre perception de la ville, lutilisation de
la tlphonie en tant quoutil denqute et danalyse (comment les citoyens peuvent
travers ces outils participer activement la construction de leur environnement),
etc. Mais les auteurs vont plus loin en sinterrogeant sur les modes de reprsentation
cartographique inventer pour retranscrire les informations construites ou encore
sur limpact en matire de vie prive : comment peut-on concilier information de
mobilit et libert individuelle, vie prive ?
32
1.3.2.4

Live Singapore [Kang 2013]
Il sagit dun projet ralis en collaboration avec SMART (Singapore MIT Alliance for Research and Technology). Les rsultats ont t prsents lors dune exposition organise au "Muse dArt de Singapour" en 2011. Lobjectif de ce travail
est le dveloppement dune plate-forme qui permette de visualiser lactivit de la
ville de Singapour, dans un contexte dynamique et fonctionnant en temps rel. La
Figure 1.12 montre les diffrentes vues proposes dans ce projet. A gauche se trouve
une cartographie de la temprature. La temprature dans les villes est gnralement
plus leve qu la campagne, et plus il fait chaud, plus le recours la climatisation
est important, et donc plus il y a de production de chaleur. Cette image permet
de se rendre compte des lieux les plus chauds et les plus nergivores. On aperoit ensuite une carte isochrone qui permet, en fonction du moment de la journe,
didentifier les lieux o lon peut se rendre par dure de trajet (en 5min, en 10min,
etc.) La troisime vue rend compte du taux dutilisation de la tlphonie mobile.
Lintensit de chaque maille traduit le niveau dutilisation des tlphones. La vue
suivante traduit le taux dutilisation des taxis, selon les lieux mais aussi selon la
pluviomtrie. Lavant-dernire illustration montre les changes de fret, en bateau et
en avion, entre Singapour et lensemble du monde. Enfin, la dernire vue permet de
se rendre compte des rpercutions que peut avoir un vnement comme le Grand
prix de Singapour sur la faon dont la population se dplace et utilise son tlphone
portable.
Figure 1.12 Illustration des vues de la mobilit Singapour

Lensemble des cartes proposes est intgr un systme dinformation gographique qui fournit une nouvelle faon de voir la ville. Laccent est ici mis sur la
reprsentation des rsultats, afin de rendre compte de la faon la plus juste des
33
tendances sociales, conomiques et de mobilit dans une ville.
1.3.2.5
Dautres contributions...
Afin dtre complet on citera encore quelques travaux mens par le MIT, et
ouvrant des pistes intressantes dans le domaine :
Etude des choix modaux en matire de transport partir des donnes tlphoniques croises avec des donnes de transport [Holleczek 2013]
Estimation de lerreur faite lors de lutilisation des mobiles pour identifier les
trajectoires des utilisateurs [Hoteit 2013]
Proposition dune mthodologie permettant dutiliser les donnes tlphoniques appliques aux problmes de transport [Calabrese 2013]. Cette mthodologie comprend les filtres appliquer aux donnes issues de millions dutilisateurs pour donner un maximum de pertinence aux rsultats. La validation
propose repose sur une comparaison entre la mobilit dduite du modle et
des mesures odomtriques ralises par linspection de la scurit de la rgion
concerne.
1.3.3
1.3.3.1
Autres travaux utilisant la tlphonie mobile

Understanding individual human mobility patterns
Une tude grande chelle est ralise par Gonzalez et al. [Gonzalez 2008],
publie en 2008 dans Nature. Elle portait sur ltude des dplacements de 100.000
personnes anonymes partir de leurs tlphones mobiles durant 6 mois. Chaque fois
quun utilisateur a mis ou reu un appel ou un SMS lantenne de rattachement
a t enregistre. Ceci a permis de reconstruire les dplacements quotidiens de ces
personnes. Par ailleurs 206 tlphones ont t enregistrs toutes les 2 heures durant
une semaine. Cette tude a permis de constater et de quantifier le haut degr de
rgularit de la faon dont les gens se dplacent, tant dans lespace que dans le
temps.
1.3.3.2
De la tlphonie mobile pour de linfotrafic
Suite la premire tude de 1994 avec le projet CAPITAL, quelques travaux ont
t faits pour tenter de construire de linformation sur le trafic routier en temps rel
[Pan 2006][Steenbruggen 2011][Caceres 2012]. Cette nouvelle approche applique
linfotrafic a notamment t utilise pour quantifier le flux quengendre un vnement
tel quun concert [Reades 2007][Calabrese 2010].
34
1.3.3.3

Elaboration de matrices Origine/Destination
Les travaux les plus rcents dans ce domaine visent gnrer des matrices Origine/Destination des dplacements (matrices O/D) [Caceres 2007] [Calabrese 2011]
[Frias-Martinez 2012] [Duan 2011]. Il sagit l dun lment important dans les domaines de lingnierie des transports. En effet ces donnes sont habituellement collectes grce des enqutes trs chres et donc renouveles que trs rarement (au
mieux tous les dix ans). Se pose donc galement le problme de la dure de validit
de ces enqutes, qui ont pour effet de figer le trafic un instant donn. Le recours
la tlphonie mobile pour laborer les matrices O/D a montr son efficacit. Les
rsultats ont en effet t compars aux rsultats obtenus par les mthodes conventionnelles [Caceres 2007] [Calabrese 2011]. Il sagit certainement dune exploitation
majeure lavenir, en raison du faible cot de collecte de la donne.
1.3.3.4
Peut-on identifier des trajectoires de dplacements ?
En 2012, des chercheurs dIBM (International Business Machines) ont labor un

modle pour optimiser les transports en commun en Cte-dIvoire. Ltude mene
avec Orange dans le cadre du projet D4D (Data for Development) sest appuye sur
les relevs de cinq millions dabonns, soit 2,5 milliards denregistrements collects
entre dcembre 2011 et avril 2012. Ceci a donn lieu au projet nomm African Bus
Routes Redrawn Using Cell-Phone Data dont une capture de la fentre de contrle
est donne en Figure 1.13.
Cette tude a permis dapporter des prconisations pour faire voluer le rseau
de transport en commun dAbidjan, la plus grande ville du pays, comptant 539 bus,
5000 minibus et 11000 taxis. Limpact estim de ces modifications est une rduction
du temps de dplacement de 10%.
1.3.3.5
Que nous disent nos mobiles sur notre faon de vivre ?
Les opportunits quapportent ces nouvelles sources de donnes ont ces 5 dernires annes intress galement les sociologues. Ainsi des travaux sattachent
utiliser les donnes tlphoniques pour identifier des comportements sociaux, tels
que les mouvements selon les moments de la journe [Ahas 2010][Pulselli 2008] ainsi
que la rgularit des dplacements dun jour lautre [Sevtsuk 2010][Song 2010]. Ici
les tlphones ne sont pas utiliss pour construire une donne directement exploitable dun service prcis mais plus pour comprendre comment nos vies ont volu
au cours des dernires annes.
On notera particulirement le travail de [Phithakkitnukoon 2012] qui portait
sur plus dun million dutilisateurs de tlphones mobiles au Portugal. Les auteurs
35
Figure 1.13 Illustration du rseau de bus actuel (en jaune) et des prconisations
de nouvelles lignes
ont mesur le rayon go-social des utilisateurs, rayon dans lequel vit et se dplace
lutilisateur. Ils ont ainsi pu tablir les liens existant entre le rayon go-social et
la densit dhabitation de la zone concerne, ainsi quavec le lien social (niveau
dactivit tlphonique).
Alors que ces travaux se dveloppent, il reste la question de la fiabilit des
donnes utilises et de leur reprsentativit. Couronn et al. [Couronne 2011] ont
dfini une nouvelle mtrique permettant de caractriser lintensit de la mobilit et
sa fiabilit.
Nous proposons dans nos travaux exposs dans le chapitre suivant daller plus
loin en intgrant la connaissance de la nature socio-conomique du territoire. Ceci
permettra de dterminer la reprsentativit des vnements tlphoniques, en fonction notamment des caractristiques des lieux et du temps.
36
1.4
Synthse et perspectives
Les modlisations de la mobilit prsentes dans ce chapitre possdent chacune

des caractristiques propres lies la prise en compte de la spcificit des individus,
de lenvironnement, de la vitesse de dplacement, etc. Selon ces caractristiques, ils
sont plus ou moins disposs modliser compltement et correctement la mobilit.
Cette aptitude concerne aussi bien les trajectoires que les dplacements de masses
de population sous la forme de nuages. Les inspirations de ces modles sont mathmatiques avec une grande part pour les probabilits. Ces modles dcrivent des
phnomnes alatoires, communment appels processus stochastiques.
Parmi les modles prsents, trois approches ont t particulirement dveloppes dans ce chapitre : les approches agrges, les approches dsagrges et les
approches activit-centre. Il sagit dans les trois cas dapproches orientes vers
les domaines du transport, domaines qui ncessitent de traduire le plus fidlement
possible les dplacements sur un territoire. Les modles agrgs, tel que le modle
classique quatre tapes, sont les modles les plus anciens et les plus simples
apprhender. Leur principale caractristique est de reposer sur une agrgation des
flux de dplacement : lindividu est masqu derrire un volume de trafic zone zone.
Aussi, leur faible degr de finesse les rend essentiellement adapts aux modlisations
des dplacements interurbains. Parce quils sont particulirement simples mettre
en oeuvre, ce sont encore aujourdhui des modles largement utiliss pour dfinir
des politiques de transport. Les modles dsagrgs permettent un niveau de finesse supplmentaire, en considrant lindividu lui-mme lors de la modlisation des
dplacements. Ceci permet une meilleure prise en compte des lments qui caractrisent chaque individu, dans la modlisation de ses dplacements. Ainsi, des facteurs
tels que le niveau de salaire peuvent tre pris en compte pour amliorer le niveau
de prcision des dplacements modliss. On notera quun niveau dagrgation intermdiaire, entre agrg et dsagrg, est parfois utilis. Une agrgation par classe
est alors effectue, telle quun regroupement par catgorie socio-professionnelle par
exemple. Enfin, toujours dans un souci de fournir des modles les plus proches possible de la ralit, les modles activit-centre ont t introduits rcemment.
Alors que les deux premires classes de modle refltent la mobilit de faon fige
dans le temps, en heure de pointe par exemple, cette dernire classe considre le triplet espace-temps-activit. Il sagit incontestablement de la classe la plus complexe
mettre en oeuvre, mais galement de la classe la plus prcise. Les modles de cette
nature permettent de considrer le chainage des activits tout au long de la journe,
et par l mme, les dplacements impliqus au cours du temps. Ils sappuient en
gnral sur des enqutes dtailles telles que les Enqutes Mnages/Dplacements.
Les travaux actuels tendent montrer que les modles de transport du futur seront
de cette nature.
Quen est-il de lutilisation de la tlphonie mobile comme marqueur de mo-
1.4. Synthse et perspectives
37
bilit ? Nous avons vu que des travaux rcents utilisent la tlphonie mobile pour
construire une meilleure connaissance de la mobilit. Les premires exprimentations datant de 1994 se sont rvles peu concluantes. En effet, le faible nombre de
donnes disponibles et la localisation au niveau de la cellule nont pas permis dobtenir un niveau de prcision suffisant pour construire une information pertinente.
Cest partir de 2006, en mme temps que nous avons initi le projet Territoire
Mobile, que les premiers rsultats significatifs sont apparus avec le projet Real Time
Rome men par le MIT. Les rsultats prsents dans ce projet, et les suivants mens Graz (2007) et Singapour (2013), semblent prometteurs. En particulier, ces
projets montrent lavantage considrable quapporte la tlphonie en proposant un
chantillon de la population jamais tudi dans le cadre denqutes, et un cot
significativement moindre. Cependant, ces tudes sattachent essentiellement prsenter des rsultats sous forme de calques visuels, de faon macroscopique. Il est
possible ainsi de superposer diffrentes sources de donnes, telles que la position des
bus ou des taxis en mme temps que lutilisation des rseaux cellulaires. Mais le
niveau de prcision ne permet pas de dterminer le nombre de personnes se trouvant dans un secteur gographique fin. Seule une tendance de rpartition peut tre
perue. Les travaux les plus aboutis, prsents cette anne, explorent les possibilits
existantes pour traduire quantitativement les donnes tlphoniques en nombre de
dplacements. Ainsi, pour des applications de transport, certains travaux visent
reconstituer des matrices Origine/Destination partir des donnes tlphoniques.
Pour linstant, les rsultats obtenus nont permis que didentifier les dplacements
domicile/travail, en fonction du lieu de rattachement du tlphone le jour et la nuit.
Mais ces travaux laissent entrevoir le trs grand potentiel que reclent les donnes
tlphoniques.
Les modles de mobilit classiques permettent donc destimer de faon quantitative le nombre de dplacements effectus entre diffrentes zones dun territoire. Ils
prsentent toutefois linconvnient dtre approximatif en raison du faible nombre
de donnes et de la raret des collections car elles sont extrmement chres. Les
modles de mobilit sappuyant sur la tlphonie permettent quant eux de bnficier dun grand nombre de donnes, dont lactualisation peut se faire facilement. Ils
prsentent toutefois linconvnient dtre gographiquement trs peu prcis et de ne
pas tre facilement gnralisables lensemble des territoires.
Dans le chapitre suivant nous proposons daffiner la faon dont se rpartissent
gographiquement les utilisateurs de mobiles avec une dynamique spatio-temporelle.
Le modle propos intgre la description du territoire pour construire un schma
complet de la mobilit associant gographie, activits et dplacements dans un rseau
cellulaire. Ce modle ouvre la voie une nouvelle faon dapprhender la mobilit,
afin de bnficier des avantages proposs par les modles classiques qui considrent
le triplet espace-temps-activit, et des avantages quapporte la tlphonie mobile
travers la quantit de donnes disponibles notamment.
Chapitre 2
La tlphonie mobile : un
marqueur de prsence
Dans ce chapitre est prsent un nouveau modle de rpartition dynamique de la

population partir de donnes tlphoniques. Nous tentons de rpondre un besoin
toujours plus marqu de modliser finement les dplacements de la population. Cette
modlisation constitue llment essentiel pour permettre danalyser et comprendre
les besoins en services de mobilit. Lutilisation de la tlphonie comme marqueur
de prsence apparait alors comme une nouvelle approche, permettant dimager autrement la distribution spatio-temporelle de population. La premire partie de ce
chapitre est destine prsenter de faon dtaille le modle propos. Laccent sera
mis sur la faon dont sarticulent dans ce modle les donnes tlphoniques dune
part, et la structure du territoire dautre part, travers les donnes gographiques
et socio-conomiques. Dans la deuxime partie du chapitre, une phase de validation
taye sur un cas dtude rel est prsente associant une collectivit et un oprateur
tlphonique, une force pour cette tude.
Sommaire
2.1
2.2
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . .
La tlphonie mobile : une nouvelle source de donnes .
2.2.1 Structure et fonctionnement dun rseau cellulaire . . . .
2.2.2 Quelles donnes sont disponibles ? . . . . . . . . . . . . .
2.3 Un nouveau modle de distribution de la population . .
2.3.1 Mobilit et caractrisation socio-conomique du territoire
2.3.2 Modle de distribution spatio-temporelle des mobiles . . .
2.4 Rsultats et analyse . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Environment danalyse . . . . . . . . . . . . . . . . . . . .
2.4.2 Constitution des donnes de rfrence . . . . . . . . . . .
2.4.3 Exprimentation et rsultats . . . . . . . . . . . . . . . .
2.4.4 Construction dune Signature Territoriale . . . . . . . . .
2.4.5 Gnralisation de la Signature Territoriale . . . . . . . . .
2.5 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
40
41
41
45
46
47
55
58
58
60
63
70
73
73
40
Chapitre 2. La tlphonie mobile : un marqueur de prsence
2.1
Introduction
Dans le souci de fournir des informations de plus en plus prcises et un cot

maitris, de nouvelles sources dinformation sont inventer pour localiser des individus et identifier les flux de mobilit au fil du temps. Une meilleure prise en compte
des dplacements des habitants dun territoire doit ainsi permettre de dployer des
offres de transports en commun de meilleure qualit, ou encore damnager des voiries ddies aux cyclistes, de construire des stations de vlo ou de voitures partages.
A lheure o les voitures lectriques constituent une nouvelle faon de se dplacer,
de grands investissements en matire dinfrastructures de recharges sont prvoir.
Pour accompagner toutes ces volutions, il apparait indispensable damliorer notre
connaissance de la mobilit des personnes.
Les tlphones portables constituent sans aucun doute une source de donnes
avre pour un retour informatif sur les dplacements de personnes. Les donnes
de rseau de tlphonie mobile : appels entrants et sortants pour chaque cellule,
les transferts intercellulaires (handover), etc. fournissent de nouveaux marqueurs de
la mobilit. Leur pertinence est dautant plus forte que le tlphone portable est
devenu en quelques annes omniprsent [Rheingold 2002]. LInternational Telecommunication Union (ITU), agence des nations unies en charge des Technologies de
lInformation et de la Communication (TIC) indique que le nombre dabonns dans
le monde est pass de moins d1 milliard plus de 5 milliards au cours de ces dernires annes. La figure 2.1 reprsente cette tendance au niveau mondial. Par ailleurs,
toujours selon lITU, en 2010 90% de la population mondiale tait couverte par un
signal cellulaire contre 61% en 2003. Nous assistons bien une volution rapide qui
a des rpercutions fortes sur notre vie quotidienne : travail, loisirs, dplacements,
etc. [Campbell 2008]
Figure 2.1 Evolution du nombre dabonnements tlphoniques dans le monde
Alors que jusqu prsent le dploiement des rseaux mobiles sappuyait sur une
2.2. La tlphonie mobile : une nouvelle source de donnes
41
connaissance des dplacements de la population, les tlphones portables peuvent

maintenant galement amliorer la comprhension sur la faon dont les personnes
se dplacent. La tlphonie sans fil devient alors un traceur de mobilit, disponible
tout au long de la journe, tous les jours de la semaine, pour des jours travaills ou
de vacances.
Dans ce chapitre nous proposons dlaborer une caractrisation spatio-temporelle
du terrain base sur une analyse statistique des donnes de dplacements et lusage
de la tlphonie mobile. Un modle de distribution de la population "multicritre"
est ainsi prsent. Il tient compte la fois de critres gographiques, sociologiques,
vnementiels, et temporels. Ce modle est complt par un tableau de bord permettant dimager la rpartition dynamique des individus travers une carte gographique. Nous visons fournir un nouveau moyen dapprhender la mobilit tout
au long de la journe. Un cas dtude a permis de valider la modlisation sur des
donnes relles appartenant au dpartement du Territoire de Belfort, en France, et
la socit Orange.
Enfin, on notera que le modle que nous proposons a servi alimenter divers travaux de recherche, pour simuler le dplacement dindividus afin de valider des protocoles de communication inter-vhiculaires ou vhicule infrastructure
[Ait Ali 2010a] [Ait Ali 2010b], pour laborer un nouveau modle de simulation de
la mobilit [Joumaa 2009a] [Joumaa 2009b] ou encore pour proposer une nouvelle
approche de configuration des rseaux cellulaires eux-mmes, pour le dveloppement
de la 4G notamment [Chariete 2013].
La section suivante nous permet de prsenter les lments cls du fonctionnement
dun rseau de tlphonie mobile et didentifier les lments disponibles pour une
modlisation de la mobilit. Ensuite, la section 2.3 est consacre la prsentation de
notre modle, bas en premier lieu sur la tlphonie mobile mais intgrant galement
une connaissance fine de la caractrisation spatio-temporelle du terrain. Enfin, la
troisime section fournit une analyse des rsultats dans un contexte rel, rsultats
qui ont t valids dans le cadre du projet Territoire Mobile, labellis par le ple de
comptitivit Vhicule du Futur, de 2006 2009.
2.2
2.2.1
La tlphonie mobile : une nouvelle source de donnes

Structure et fonctionnement dun rseau cellulaire
La principale caractristique dun systme radio mobile est de permettre aux

personnes de se dplacer librement tout en assurant une continuit de service sur
lensemble du territoire couvert. Pour rpondre ce besoin loprateur rpartit des
42
stations de base (metteurs radio) sur le territoire couvrir par lesquelles les appels
ou les donnes pourront tre transfrs vers les mobiles. Lorsquun mobile tablit
une communication, un vnement de localisation est gnr sur la station de base
qui gre la communication.
Dfinition 1 (Station) Une station, galement appele station de base, est un relai
radio permettant dacheminer toute forme de communication avec un mobile. A une
station est toujours associe une zone de couverture qui dpend des caractristiques
de la station (paramtrage de lantenne) et de lenvironnement (relief, construction,
etc.).
Dfinition 2 (Site) Un site est le lieu gographique repr par ses coordonnes o
est place une station. Un mme site peut regrouper plusieurs stations permettant
de couvrir des orientations diffrentes, de proposer diverses technologies (UMTS,
GSM) et ventuellement plusieurs oprateurs.
Dfinition 3 (Cellule) On appelle cellule la zone de couverture radio dune station. Il sagit de la portion de territoire sur laquelle les communications peuvent tre
achemines par la station associe.
Pour permettre aux personnes dtre continuellement connects lorsquelles se
dplacent, la majeure partie du territoire est couverte par plusieurs cellules. Afin de
calculer, visualiser et grer les recouvrements entre cellules, les oprateurs utilisent
des mthodes et des logiciels de planification de rseaux. En particulier, ils ont recours des modles de propagation des ondes radio leur permettant de dterminer
en chaque lieu quelles sont les antennes susceptibles dacheminer une communication, et avec quelle probabilit. Cest ce que nous appellerons la probabilit de prise
de communications (PPC) 1 . La Figure 2.2 montre sur un schma thorique comment ces superpositions cellulaires oprent, avec sous forme maille les PPC de trois
antennes.
La Figure 2.3 est une illustration de lenchevtrement rel de cellules o chaque
couleur reprsente une cellule et lintensit de la couleur est le reflet de lintensit
de la probabilit de prise de communication (PPC) de la station.
Lorsquun mobile se dplace, il dtecte successivement les stations de base en
fonction de la couverture de chacune delles, de leur niveau de saturation et de
paramtres sur les antennes qui grent ladmission des terminaux. Ce dplacement
a un effet rduit sur le rseau si le tlphone est en veille (pas dappel, pas de
transfert de donnes) car celui-ci fait une mise jour de la localisation par groupe
de cellules (Location Area - LA). Par contre dans le cas o le tlphone est en
1. Ce concept est la proprit dOrange et ne sera pas dtaill dans cette thse.
43
Figure 2.2 Maillage et PPC
Figure 2.3 Couverture radio

cours de communication, tout changement de cellule implique un dialogue avec le
rseau pour changer la connexion du terminal dune station une autre (transfert
intercellulaire ou Handover).
Dfinition 4 (Handover) On appelle Handover ou Handoff (HO) le transfert intercellulaire dun mobile.
Plusieurs vnements sont gnrs sur le rseau lorsquun mobile en cours de
communication se dplace de faon le raccrocher la station la plus adapte au
contexte. Ainsi un terminal peut tre trac au sein de plusieurs cellules en fonction
de sa mobilit en cours dappel et gnrer un ensemble dvnements sur le rseau.
Les paragraphes suivants illustrent ce phnomne au travers dun exemple en deux
44
tapes :
1. La personne 1 initie, depuis la cellule A, un appel la personne 2 prsente dans
la cellule B (Figure 2.4). Un appel sortant est comptabilis pour la station ou
antenne A, et un appel entrant est comptabilis pour la station B.
Figure 2.4 Gnration dun vnement de communication

2. La personne 1 se dplace alors, pendant la communication, dans la cellule
C. Le mobile de la personne 1 doit donc oprer un transfert intercellulaire
(Figure 2.5). Ce type dvnement fait comptabiliser un HO sortant pour la
cellule A et un HO entrant pour la cellule C.
Figure 2.5 Gnration dun vnement de transfert intercellulaire
45
Le HO permet de localiser la prsence de personnes, par contre ce nest pas

un indicateur de la direction des flux. Lorsquun HO entrant est comptabilis pour
une cellule, nous pouvons affirmer quune personne est entre dans celle-ci, mais
nous ignorons sa provenance. De mme, si nous comptabilisons un HO sortant pour
une cellule, nous pouvons affirmer quune personne a quitt cette cellule, mais nous
ignorons sa destination. Bien entendu, le rseau identifie le besoin de transfert intercellulaire mais cette information nest pas stocke, seuls les vnements anonymes
dentre ou de sortie de cellules sont archivs.
Nous ne dtaillerons pas ici les mcanismes impliqus dans le choix de la station
de rattachement, ni dans le dclenchement dun transfert intercellulaire. Le lecteur
souhaitant plus de dtails pourra se rfrer au livre [Tabbane 2002].
2.2.2
Quelles donnes sont disponibles ?
Tout ce qui se passe sur un rseau cellulaire nest pas enregistr pour des questions de technologie, de volume de donnes, de stratgie oprateur, de protection des
libertes(CNIL), etc. Pour des raisons de limitation de ressources sur le lien radio, il
nest pas possible de connaitre tout moment la station de rattachement de chaque
tlphone. Toutefois les oprateurs captent et conservent les vnements suivants :
les communications entrantes (information de communications) : ce sont les
appels/SMS/transfert de donnes reus par la personne se trouvant dans la
cellule, cest un marqueur de prsence.
les communications sortantes (information de communications) : ce sont les
appels/SMS/transfert de donnes mis par la personne se trouvant dans la
cellule, cest un marqueur de prsence.
les "handover" (information de signalisation) : cest un marqueur de mobilit
tant donn quil sagit de communications ayant dbut dans une cellule et
qui se poursuivent dans une autre cellule.
Les donnes de trafic et de signalisation se prsentent en gnral sous la forme
dune matrice individus/variables o les individus sont les stations, caractrises par
leur identifiant, assurant la couverture de la zone tudie, et les variables sont les
vnements. Dans notre travail sur lutilisation de ces donnes pour modliser la
mobilit, nous avons regroup les vnements par 1/4 dheure de 6h00 23h45, soit
71 plages horaires. Ce pas est tout fait ajustable pour augmenter ou diminuer la
prcision temporelle du modle. Voici la liste des donnes utilises par le modle que
nous proposons :
Le nombre dappels sortants. Celui-ci indique le nombre de personnes se trouvant dans la cellule c durant le quart dheure t ayant initi une communication
depuis leur tlphone mobile.
Le nombre dappels entrants. Celui-ci indique le nombre de personnes se trouvant dans la cellule c durant le quart dheure t ayant reu une communication
46
sur leur tlphone mobile.

Le nombre dappels total = le nombre dappels entrants + le nombre dappels
sortants.
Les handover sortants. Ils indiquent le nombre de personnes quittant la cellule
c pour une cellule voisine durant le quart dheure t.
Les handover entrants. Ils indiquent le nombre de personnes entrant dans la
cellule c depuis une cellule voisine durant le quart dheure t.
La somme et la diffrence des handover sortants et entrants. Ces calculs seront utiles pour la dtection de ples plus ou moins attracteurs sur la zone
gographique tudie.
De plus, pour faire le lien entre les communications et le territoire, nous utiliserons une matrice de couverture radio pour lensemble des antennes du territoire
tudi. Les donnes de couverture radio utilises ici sont des donnes mailles un
pas de 25m. Cette matrice contient pour chaque maille la valeur de puissance reue et
provenant de lantenne considre. Elles permettent de localiser les zones couvertes
par chaque antenne et de connaitre la PPC associe. Enfin cette matrice permet par
superposition de faire le lien entre les cellules et les donnes gographiques (parcelles,
communes, btiments, routes) du territoire.
2.3
Un nouveau modle de distribution de la population
Dans cette section nous prsentons notre approche permettant de modliser les
dplacements, qui sappuie sur trois lments essentiels :
lutilisation des rseaux tlphoniques sans fil
les caractristiques du sursol
les objectifs de dplacements des personnes
Ce modle a t mis au point et expriment dans le cadre dun projet labellis par le Ple de Comptitivit "Vhicule du Futur" [Lamrous 2008] avec comme
partenaire le SMTC Belfort, la socit Orange, lAgence dUrbanisme et les collectivits territoriales du Territoire de Belfort. La vocation du projet est de proposer
une modlisation et une vision via un logiciel informatique des dplacements de
lensemble de la population dun territoire afin de planifier des services de transport en commun. Cette approche constitue ainsi une nouvelle faon dapprhender
lenvironnement urbain. Ce modle se place dans la catgorie des modles bass sur
lactivit coupl avec des donnes issues des rseaux de tlphonie cellulaire.
Afin de permettre de visualiser les rsultats, nous avons dvelopp la plate-forme
logicielle "geoLogic" proposant un tableau de bord ayant pour fond une carte gographique (cf. Figure 2.6) laquelle se superpose plusieurs calques de couleur pour
scruter les dplacements des individus. Ce tableau de bord permet de visualiser les
2.3. Un nouveau modle de distribution de la population
47
dplacements sur le territoire couvert sur une journe complte au quart dheure
prs et un pas de 25 mtres. Tous les moyens de zoom et de slection sont disponibles lutilisateur. Une prsentation plus dtaille de geoLogic est propose dans
le chapitre 4. Nous utiliserons des sorties graphiques de geoLogic pour illustrer des
composants du modle de mobilit de ce chapitre.
Figure 2.6 Cartographie temporelle de la distribution de la population belfortaine

Dans les projets issus de la littrature, le niveau de prcision est celui de la
couverture radio, or ces tailles peuvent varier de faon significative. Alors que dans
un contexte urbain dense, elles peuvent couvrir un rayon de 300m, elles peuvent
hors agglomration stendre des rayons de plusieurs kilomtres. Selon les besoins,
ce niveau de dcoupage du territoire peut tre suffisant, mais dans beaucoup de
situations un niveau plus fin est ncessaire. Lintroduction ici dune connaissance
de la topographie permettra destimer de faon probabiliste comment les mobiles
se rpartissent lintrieur des zones de couverture des antennes considres, grce
aux donnes socio-conomiques et gographiques.
2.3.1
Mobilit et caractrisation socio-conomique du territoire
Les informations sur le trafic tlphonique reportent le volume global de trafic

coul (communications et signalisations) sur chacune des cellules. A ce stade la
connaissance du trafic est imprcise et macroscopique puisque les cellules de loprateur ne permettent pas de savoir o le mobile se trouve lintrieur de celle-ci. Les
procds de localisation que nous proposons permettent de calculer la distribution
non uniforme des appels lintrieur de chacune des cellules en exploitant toutes les
informations spatiales et temporelles disponibles. En gnral, de telles donnes dcrivant la gographie dun territoire sont disponibles dans les services des collectivits
traitant des Systmes dInformation Gographique (SIG). En France, ces donnes
48
sont souvent issues de lIGN qui go-rfrence de nombreuses caractristiques ; elles

sont compltes par les collectivits elles-mmes qui disposent dune connaissance
trs prcise de leur territoire. Notons galement qu lheure du dveloppement de
lOpen Data, des outils tels que OpenStreetMap constituent une nouvelle source de
donnes en plein essor.
Description vectorielle
du territoire
Classification maille
du territoire
Maillage
Prolage
horaire
HP
Pondra0on
Spa0o-temporelle
Poids dattraction de
chaque maille
HC
Profil trois tats

par classe
Figure 2.7 Process complet de la pondration spatio-temporelle du territoire

A partir des donnes gographiques et socio-conomiques, lobjectif est dtablir
un profil dattraction temporelle propre chaque maille du territoire. Ce profil
ne peut tre envisag que dans un contexte dynamique. A chaque maille est ainsi
attribu un vecteur dcrivant son attraction au cours du temps (poids dattraction
spatio-temporelle). De cette manire, il est possible dassocier diffrents profils pour
diffrents types de jours (semaine, weekend, vacances, etc.). La Figure 2.7 dcrit le
processus complet permettant daboutir cette pondration. Ainsi, partir dune
description vectorielle du territoire, une premire tape consiste appliquer une
grille de maillage ces donnes. Chaque maille contient alors la proportion que
reprsente chaque classe de terrain qui la compose. Dans la figure chaque carr de
couleur en haut droite indique la classe dominante. Un profil horaire trois tats
est alors associ aux classes de sursol, pour dcrire en fonction du temps si une
classe est attractive de faon forte (Heure Pleine - HP), faible (Heure Creuse - HC)
ou non attractive (). Ce profil est alors coupl des donnes statistiques issues
de lINSEE pour attribuer un poids dattraction spatio-temporelle final chaque
maille. Ce poids est donc variable dans lespace et dans le temps.
49
Les sections suivantes dcrivent de faon dtaille ce processus qui mne la description du territoire. Nous prsenterons ensuite (cf. section 2.3.2) comment cette
description est couple au rseau de communications (PPC) pour distribuer les mobiles dans les mailles du territoire.
2.3.1.1
Donnes spatiales socio-conomiques et gographiques
Le territoire est caractris par linformation dite de sursol qui indique loccupation du sol (route, bti, eau, etc.). Une approche hirarchique nous permet de
structurer cette information en diffrentes classes de terrain.
Le terrain est dans un premier temps divis en grandes catgories (cf. Figure 2.8) :
commerce, activit, habitat, etc. Seuls les lieux pouvant significativement dfinir une
concentration de population seront importants dans la suite du travail mais tous
les types sont pris en compte. Ces catgories sont couramment utilises dans les
tudes traitant de la mobilit. Cest le cas des enqutes mnages/dplacements par
exemple, qui recensent les motifs de dplacement directement lis ces catgories. La
catgorie commerce contient ainsi toutes activits non professionnelles de type achat,
loisir, etc. La catgorie activit contient toutes activits professionnelles ou lies
la scolarit. Et la catgorie voirie concerne toutes activits lies aux dplacements.
Terrain
Commerce
Grand
Pe-t
Ac-vit
Entreprise
Ecole
Habitat
Maison
Pe-t
immeuble
Voirie
Grand
immeuble
Route
Rail
Autres
Eau
Fort
Figure 2.8 Organisation du sursol

Chaque catgorie est subdivise en plusieurs classes afin dapporter plus de finesse lors de la distribution des mobiles. Lhabitat sera par exemple dcompos
en maison, petit immeuble et grand immeuble, ce qui permettra lors daffectation
de personnes au domicile daffecter plus ou moins de personnes selon la taille du
btiment. De la mme faon, les commerces sont distingus selon leur taille : un
petit commerce de proximit naura pas le mme pouvoir dattraction quun centre
commercial.
50
Ainsi, la description du territoire selon cette arborescence est tout dabord disponible sous forme vectorielle, puis la premire tape du traitement est le maillage
et la classification de ces donnes. Cette opration relve dun go-traitement
base dintersection de polygones. Il ne sera pas dtaill ici mais est publi dans
[Lamrous 2008]. Voyons prsent comment est attribu un profil horaire chaque
classe de terrain, soit comment inclure une dimension temporelle aux donnes spatiales.
2.3.1.2
Un profil temporel des classes de terrain trois tats
Selon ses caractristiques socio-conomiques, un lieu attire des personnes diffremment chaque moment de la journe et dun jour lautre. Pour rendre compte
de ce phnomne nous procdons un dcoupage du temps en plages horaires qui
sera associ au dcoupage gographique du territoire en mailles de ltape prcdente. Une bonne connaissance de loccupation du sursol du territoire nous permettra ainsi de distribuer les mobiles rattachs un relai tlphonique diffremment
selon lheure de la dtection. Nous pouvons citer lexemple dun plan deau urbain
interdit la baignade et la navigation, ou encore dun tablissement scolaire pouvant recevoir des personnes en journe mais pas la nuit. Nous laborons ainsi un
schma temporel de caractrisation du sursol.
Chaque classe lmentaire de terrain reprsente Figure 2.8 a un pouvoir dattraction trois tats qui dpend du jour et du moment de la journe. Nous dfinissons un tel profil horaire pour une classe de la manire suivante : chaque plage
horaire t (gnralement de 15 minutes) peut prendre la valeur 0 lorsquun nombre
non significatif de personnes peut se trouver dans cette classe, 1 lorsque la classe
est considre en heure creuse (faiblement frquente) et 2 lorsquun nombre important de personnes peut se trouver dans cette classe. Cette approche trois niveaux (absence, faible prsence, forte prsence) apporte une grande souplesse dans
la construction et dans lvolution de la matrice dappartenance horaire. Il sagit
donc dun compromis entre une approche binaire du tout ou rien et une approche
continue qui complexifierait la construction de ces profils.
Un extrait de la table de profilage temporel du sursol trois tats est donn
Figure 2.9 de 6h 7h (en colonnes). Chaque ligne correspond une classe de terrain
pour un lundi dune priode travaille. Le profil change dun jour lautre de la
semaine et ventuellement dune semaine lautre pour reflter au plus prs la
ralit.
Plus formellement, la table de profilage temporel est associe la matrice A, qui
est dfinie de la faon suivante :
Ecole
1,$%(-%&234)
!"#$#%&$))"567"%&2&84)
+*,-.%&$))"567"%&9&84)
:(5#"%
:,$7
;,*.$-%&<&!,*'%
=(*>#
/,5
&
&
&
&
?())"*'"
("
@'#$A$#B
/-#*"0*$%"
!"'$
C,6$#,#
+*,-.%&'())"*'"%
!"%&
D($*$"
!"#$#%&'())"*'"%
!"#$
@5#*"%
!"
51
Figure 2.9 Table de profilage temporel du sursol
A = (aij )1ip,1jn
avec :
p : le nombre de classes lmentaires de sursol
n : le nombre de plages horaires dans une journe
si la classe i est considre en
HP
la priode j
aij =
si la classe i est considre en
1
HC
la priode j
0 sinon (pas de personne affecte)
(2.1)
Cette tape nous a permis de dfinir une matrice dcrivant le profil temporel
trois tats de chaque classe de terrain. Il sagit maintenant de convertir cette matrice
en poids dattraction spatio-temporelle variables dans le temps pour chaque classe,
avant den dduire un poids dattraction pour chaque maille.
2.3.1.3
Un poids dattraction spatio-temporelle pour le territoire
Nous abordons maintenant la phase qui permet de dfinir la faon dont la nature
du sursol influence la rpartition des mobiles sur le territoire. Cette rpartition se
droule en deux temps. Tout dabord, il sagit de dterminer un poids dattraction
global pour chaque classe dfinie dans le tableau 2.8 ; puis une deuxime tape
52
Enqute brute
Enqute modifie
Commerce
25%
30,49%
Activit
25%
30,49%
Habitat
22%
26,83%
Voirie
10%
12,2%
Autres
18%
0%
Table 2.1 Temps moyen pass par catgorie

consiste distribuer les poids globaux sur les plages de la journe en tenant compte
des trois niveaux possibles de prsence de personnes (absence, faible prsence, forte
prsence).
Rpartition globale des poids de chaque classe de terrain Pour procder

cette tape nous avons considr les donnes statistiques fournies par lINSEE pour
la France sur la priode 2007-2009, afin de dfinir une estimation du temps moyen
pass dans chaque classe. Remarquons que ces poids constituent une donne dentre
de lalgorithme, et peuvent tre modifis, pour tenir compte de caractristiques
propres chaque territoire.
La priode de nuit nest pas prise en compte, toutes les personnes sont considres appartenant la classe habitat. Pour la priode de la journe (6h - 0h), nous
considrons le pourcentage de temps moyen pass par catgorie (ramen lensemble
de la population) tel que dcrit dans le tableau 2.1. La premire ligne du tableau
issue de lINSEE donne la rpartition entre les catgories commerce, activit, habitat, voirie et autre. On remarque que 18% du temps (catgorie autre) ne peut
tre attribue une classe identifie. On choisit alors de rpartir cette proportion
de temps entre les classe identifies au prorata de celles-ci, ce qui donne la nouvelle
rpartition de la deuxime ligne du tableau. La rpartition au prorata est arbitraire
mais neutre ; elle pourrait tre faite autrement selon le territoire. Cette rpartition
est dfinie pour un jour travaill (hors vacances scolaires).
Pour dfinir la proportion de temps pass dans chaque classe de sursol du tableau 2.8, les catgories sont elles-mmes rparties selon des proportions guides
par des statistiques de lINSEE. Le tableau 2.2 synthtise cette rpartition. Les
deux premires colonnes qui dcrivent les catgories sont directement issues du tableau 2.1. Les colonnes suivantes concernent les classes de sursol et donnent, dabord
la rpartition interne entre les classes de sursol dans chaque catgorie, puis la rpartition globale par rapport lensemble du temps pass qui croise les catgories et les
classes de sursol. Prenons lexemple de la catgorie activit qui reprsente 30,49%
du temps pass. 33% de ce temps est attribu la classe cole, et 67% la classe
entreprise, soit 33% de 30,49% =10,06% de temps pour la classe cole et de mme
20,43% de temps pour la classe entreprise. La rpartition attribue aux classes de
sursol provient dune estimation de la proportion de population concerne ; elle doit
tre affine par territoire dtude.

Catgorie
% catgorie
Commerce
30,49%
Activit
30,49%
Habitat
26,83%
Voirie
12,2%
53
Classe de sursol g
pour ground
% classe
Rpartition globale g
petit commerce
grand commerce
entreprise
cole
maison
pt immeuble <20m
gd immeuble >20m
route
rail
30%
70%
67%
33%
6,25%
31,25%
62,5%
75%
25%
9,15%
21,34%
20,43%
10,06%
1,68%
8,38%
16,77%
9,15%
3,05%
Table 2.2 Rpartition de la population par thme

La rpartition du temps global par classe de sursol est ainsi donne dans la
dernire colonne du tableau 2.2. Il sagit des poids g de chaque classe de sursol g
quil faut prsent rpartir dans le temps.
Rpartition temporelle de chaque classe de terrain La dernire tape de

la caractrisation temporelle des classes de terrain consiste dterminer le poids
dattraction de chacune delles tout au long de la journe pour un type de jour
donn. Cest ce poids final qui permettra de distribuer statistiquement les mobiles
lintrieur de la cellule radio. Cette tape consiste donc rpartir les poids calculs
globalement pour chaque classe sur lensemble des plages horaires de la journe, en
sappuyant sur la matrice A qui dcrit le profil des classes en trois tats.
Soient les dfinitions suivantes :
G lensemble des classes de sursol (G pour ground )
g une classe de sursol, g G
ghp le poids de la classe g en heure pleine
ghc le poids de la classe g en heure creuse
g le poids global de la classe g calcul prcdemment
g0 = 0 le poids de la classe g en heure dabsence (ce poids peut tre mis une
valeur diffrente de 0 si on veut traduire une trs faible prsence).
nhp
g le nombre de plages horaires en heure pleine pour la classe g
nhc
g le nombre de plages horaires en heure creuse pour la classe g
n0g le nombre de plages horaires dabsence pour la classe g
54
Pour une classe donne g, la matrice A contient les valeurs 0, 1 ou 2 selon les
plages horaires. Le poids g est alors rparti linairement sur lensemble des plages
absence, HC et HP de la journe, avec une proportion x dfinir entre HC et HP
selon le territoire.
Calculons prsent les poids ghp et ghc de la classe g en heure pleine et en heure
creuse respectivement. Ils vrifient :
hp hp
hc hc
0 0
g ng + g ng + g ng = g
(2.2)
hp = x hc
g
g
Avec g0 = 0, il sen suit que les poids dattraction des classe de sursol sont
donns par :
hc =
g
hc
xnhp
g +ng
(2.3)
ghp = x
g
hc
xnhp
g +ng
Chaque maille m est prsent caractrise par un vecteur dattraction m =

construit partir des classes de sursol couvrant la maille en respectant
t , avec t [1...n],
la proportion de couverture de chacune. Chaque composante m
est dfinie par :
1 , ..., n ],
[m
m
t
m
=
gt .pm,g
(2.4)
gG
avec :
t le poids dattraction spatio-temporelle de
m
gt le poids de la classe de sursol g linstant
gHP
t
g =
gHC
la maille m linstant t
t
si ag,t = 2
si ag,t = 1
(2.5)
si ag,t = 0
pm,g la proportion de classe de sursol g dans la maille m

Ltape suivante de notre modle consiste distribuer les mobiles sur un territoire.
2.3.2
55
Modle de distribution spatio-temporelle des mobiles
Dans cette partie nous rassemblons les lments prsents jusquici, les donnes
tlphoniques et les poids dattraction spatio-temporelle, pour aboutir la rpartition des mobiles sur lensemble du territoire. La Figure 2.10 illustre ce qui est
prsent dans cette section.
Mobile
Vecteur da8rac-ons
spa-o-temporelles de
chaque maille
Vecteur de
probabilits de prise
de communica-on de
chaque maille
Module de distribu-on
des mobiles
Figure 2.10 Module de distribution des mobiles

Nous procderons une rpartition en deux temps. Dans un premier temps les
poids dattraction spatio-temporelle ne sont pas intgrs. Ceci permettra de vrifier
quune rpartition des mobiles sans prise en compte du territoire a une forte tendance
tre homogne. Puis dans un deuxime temps les poids dattraction seront intgrs
pour raliser une distribution des mobiles plus raliste.
2.3.2.1
Modle de distribution de mobiles selon la cartographie des Probabilits de Prise de Communication (PPC)
Comme nous lavons vu, les cellules radio sont dcoupes en mailles carres qui
dfinissent le niveau de prcision que lon souhaite atteindre. Ainsi, pour chaque
maille est gnre une structure multicouche qui intgre toutes les cellules qui la
recouvre ainsi que les PPC associes. De la mme faon, la journe est dcoupe en
plages horaires de t. Pour lapplication numrique nous fixons le pas de maillage
pdm 25m de ct et le pas de temps t 15 minutes. La rpartition des mobiles sur
les mailles dune cellule radio pendant lintervalle t est faite proportionnellement
aux PPC de chaque maille. Ainsi la densit des mobiles sur chaque maille m est
dtermine en fonction de la reprsentation de la PPC de la maille relativement
56
lensemble des PPC de toutes les mailles m0 de la cellule. Pour une station s sur une
maille m linstant t (pour simplifier la notation, t sera assimile la priode de
temps t) nous avons la rpartition suivante :
ppcm,s
ntm,s = X
.nts
ppcm0 ,s
(2.6)
m0 Cs
avec :
ntm,s le nombre de mobiles rattachs la station s rparti sur la maille m linstant
t
Cs lensemble des mailles appartenant la zone de couverture de la station s i.e.
lensemble des mailles du territoire pour lesquelles la PPC associe s est non
nulle
ppcm,s la probabilit lorsquun mobile est sur la maille m que son appel soit achemin par la station s
ppcm0 ,s la probabilit lorsquun mobile est sur la maille m0 que sa communication
soit achemine par la station s
nts le nombre de mobiles rattachs la station s linstant t
Remarquons dans le modle (2.6) que les PPC sont invariantes dans le temps,
seule lapparition des mobiles est variable.
Nous avons ainsi dfini la distribution des mobiles lintrieur dune cellule radio
indpendamment des proprits spatio-temporelles du sursol. Ce mme traitement
est appliqu lensemble des cellules, puis nous dfinissons pour chaque maille un
cumul de prsences issues de lensemble des cellules qui contiennent cette maille i.e.
pour lesquelles la PPC est non nulle. Ainsi pour chaque maille m linstant t nous
obtenons la rpartition globale de lensemble des mobiles de la faon suivante :
ntm =
nm,s
(2.7)
sSm
avec : Sm lensemble des stations couvrant, PPC non nulle, la maille m.

La Figure 2.11 illustre la rpartition des mobiles sur un territoire sans prise en
compte des proprits du sursol. Nous apercevons les limites dune telle approche
qui est base uniquement sur les caractristiques du rseau travers la PPC. En
effet, mme si en ingnierie de rseaux on cherche avoir une bonne qualit de
signal dans les lieux de forte frquentation, la rciproque nest toutefois pas vraie.
Ce nest pas parce quil y a un bon signal (une bonne PPC) en un lieu donn que
ncessairement il y a beaucoup de personnes en ce lieu.
57
Figure 2.11 Distribution des mobiles un instant t sans prise en compte des
proprits du sursol
La Figure 2.11 illustre bien ce phnomne. On aperoit notamment que, sans

prise en compte du sursol, le modle distribue autant de mobiles dans un plan deau
que dans les habitations voisines, de faon trs uniforme.
2.3.2.2
Modle de distribution spatio-temporelle intgrant les proprits du sursol
Le modle vu jusquici ne tenait compte que de la couverture radio. Ltape

suivante consiste intgrer dans le calcul les vecteurs de poids dattraction spatiotemporelle m de chaque maille tels que dfinis dans la section 2.3.1.3.
En appliquant cette pondration au modle de distribution des mobiles prcdent, nous obtenons pour la maille m linstant t laffectation suivante :
58
ntm =
t
X
Xppcm,s .m
.nts
t
ppcm0 ,s .m0
sSm
(2.8)
m0 Cs
Lintgration des poids dattraction spatio-temporelle avec le modle de distribution de mobiles a pour effet de rorganiser la distribution des mobiles de faon plus
raliste. Pour sen rendre compte la Figure 2.12 prsente le rsultat de lapplication
de ce modle, gauche sans prise en compte de ces poids et droite en les intgrant.
En reprenant notre exemple prcdent, nous pouvons ainsi remarquer que la partie
de la population qui tait affecte un plan deau lorsque seules les PPC taient
considres se retrouve raffecte dans des mailles plus appropries.
Figure 2.12 Distribution des mobiles un instant t sans et avec prise en compte
des poids dattraction spatio-temporelle
La visualisation de la rpartition des mobiles avec et sans prise en compte des
poids dattraction spatio-temporelle donne une nouvelle visibilit de la prsence des
personnes. Toutefois, une analyse numrique des rsultats doit permettre de vrifier
cette approche. Ce point est abord dans la section suivante.
2.4
2.4.1
Rsultats et analyse
Environment danalyse
Une bonne analyse de la mobilit ncessite de disposer dun outil efficace pour
reprsenter les rsultats des calculs sur les dplacements. Une plate-forme logicielle
2.4. Rsultats et analyse
59
capable de grer la fois des donnes spatiales telles que des donnes gographiques
ou de localisation, ainsi que des donnes temporelles refltant la mobilit apparait
alors comme un lment essentiel.
Figure 2.13 Plate-forme geoLogic

De nombreux outils existent dans le domaine des SIG (Systmes dInformation
Gographiques) pour reprsenter des donnes go-localises. Toutefois la prise en
compte simultanment de lespace et du temps est rare.
Afin de permettre une grande souplesse dutilisation nous avons donc dvelopp
notre propre plate-forme de reprsentation des rsultats. Elle dispose des fonctionnalits habituellement prsentes dans les outils SIG classiques, telles que laffichage
de fonds de carte ainsi que de donnes vectorielles ou ponctuelles de type shapefile
(cf. Figure 2.14). Il est par ailleurs possible de se dplacer dans cet environnement,
de zoomer sur un lieu prcis, etc. Chaque objet charg, tel que les limites de communes ou les contours des btiments, constitue un calque quil est possible dafficher
ou masquer selon les besoins.
Les donnes peuvent tre statiques ou dynamiques. Alors que les lments topographiques tels que les axes routiers ou les btiments ne varient pas dans le
temps, mais leurs proprits quant elles peuvent voluer au cours de la journe.
En particulier un supermarch sera toujours au mme endroit mais aura un pouvoir
dattraction diffrent 9h, 16h ou 23h et cela suivant le jour considr. De mme la
localisation de la population, tant au niveau macroscopique, sous forme de masse,
quau niveau microscopique, sous forme ponctuelle ou de trajectoire, varie dans le
60
Figure 2.14 Informations vectorielles : SIG shapefile

temps. Pour rendre compte de cette dynamique lapplication que nous proposons
permet de dfinir la journe de ltude et le moment de la journe observer. Enfin
il est possible de faire dfiler le temps entre 2 plages horaires, de faire varier la vitesse
de dfilement du temps, ou encore de mettre lapplication en pause.
2.4.2
Constitution des donnes de rfrence
Les donnes utilises pour constituer la base de rfrence sont lEnqute Mnages/Dplacements (EMD) ainsi que les donnes INSEE du territoire. Les rsultats de lenqute effectue en 2004/2005 (enqute redresse) fournissent une base
de donnes contenant notamment les 435 360 enregistrements correspondant aux
rponses apportes par chaque personne enqute sur les dplacements de la veille,
redresses lensemble de la population. Les dplacements contenus dans la base
sont ceux ayant pour origine ou destination une zone prdfinie de la CAB et ayant
t effectus en semaine. Ainsi lEMD nous permet de connaitre les dplacements
des habitants du territoire tudi tout au long de la journe.
LEMD est donc riche dinformations sur la manire dont la population se dplace
sur le territoire. Les traitements que nous avons effectus sur ces donnes ont deux
objectifs : dune part fournir des rsultats visualisables dans le logiciel dvelopp afin
de se rendre compte de la faon dont la population volue (avec une information
variable dans lespace et dans le temps diffrente chelle spatiale i.e. pour une
zone particulire ou pour tout le territoire de lEMD) et dautre part de constituer
la base de rfrence pour comprendre le lien pouvant exister entre dplacements et
activit tlphonique.
2.4.2.1
Agrgation temporelle
Lenqute ralise contient lhorodatage prcis des dplacements de la population

sonde. Dans le cadre du projet nous avons chantillonn les journes en priodes de
15 minutes qui correspondent une prcision temporelle exploitable pour lanalyse
des dplacements dans le cadre dune tude sur le transport urbain. Une premire
61
tape consiste donc affecter chacun des 435 360 enregistrements la plage horaire (le 1/4 dheure) lui correspondant pour pouvoir agglomrer ces affectations et
disposer dune information globale par priode.
2.4.2.2
Agrgation gographique
Une classe de dplacements est un ensemble zone dorigine, zone de destination,

plage horaire, motif de dplacement au sens de lEMD. Le motif est facultatif car les
dplacements pourront tre distingus ou non selon le motif. Il faut donc calculer
pour chaque classe ainsi dfinie le nombre denregistrements correspondant. Ce calcul
rpond donc la question : Combien de personnes sont parties de la zone A pour
aller la zone B au cours du 1/4 dheure t (ventuellement pour le motif m) ?
Figure 2.15 Zonage et attractivit des zones 17h

La Figure 2.15 illustre gauche le dcoupage du territoire en diffrentes zones
(chaque couleur reprsente une zone). A droite est reprsente lattractivit selon
lEMD de chaque zone. Un niveau de couleur allant du blanc au rouge traduit le
niveau dattractivit de la zone. Ainsi les zones rouges fonces indiquent des lieux
forte attractivit.
2.4.2.3
Calcul de la diffrence cumule au cours de la journe
Lvolution de la population dans les zones au cours de la journe est une information utile que lon peut calculer partir de lvolution de lattractivit de chaque
zone au cours du temps. Pour cela, il faut prendre en considration non seulement
les flux entrants et sortants linstant considr, mais y ajouter galement tous les
flux entrants oprs depuis le dbut de la journe (cumul des arrives) et retrancher
de la mme manire la somme des flux sortants depuis le dbut de la journe (cumul
des dparts). Le point de rfrence temporel considr est 6h du matin.
62
Cette information sexprime de la faon suivante : un moment donn, est-ce que

la zone sest remplie (teintes rouges) ou vide (teintes bleues) depuis 6h00 du matin
par rapport la population initiale ? Et quel est le solde en nombre de personnes
arrives ou parties ?
Les teintes claires expriment un faible solde dans un sens ou dans un autre, soit
un quilibre des arrives et des dparts. Les teintes fonces prsentent toutes un
solde positif dans les rouges et ngatif dans les bleues.
Figure 2.16 Diffrence cumule 6h30, 10h et 22h

La Figure 2.16 prsente la diffrence cumule 6h30, 10h et 22h. Alors que le
matin 6h30 il ny a encore eu que trs peu de mouvements, 10h nous observons
que les zones industrielles et de centre ville se sont particulirement remplies au
dtriment des zones priurbaines. A 22h la tendance se rapproche de la situation de
6h30, marquant un retour au domicile.
2.4.2.4
De la diffrence cumule la prsence
Dans le cadre de cette section nous nous intressons la mise au point dun
procd pour fournir une information pertinente sur la localisation de la population
au cours de la journe.
Afin de faire un parallle entre les donnes tlphoniques et lenqute mnages
dplacements, nous devons donc traduire les donnes de lEMD en termes de population prsente chaque instant et en chaque endroit du territoire reprsent
par les zones. Ce calcul qui fournit une information utile en soi sera galement la
base de comparaison utilise pour valider la localisation identifie par les tlphones
portables, ces rsultats tant construits de manire totalement indpendante.
63
Pour ce traitement nous considrons la diffrence cumule prsente en 2.4.2.3.

Pour chaque zone nous ajoutons la population rsidante issue de lINSEE et nous
obtenons ainsi une approximation du nombre de personnes prsentes chaque 1/4
dheure de la journe. Il ny a en effet que les dplacements effectus entre minuit
et 6h00 qui ne sont pas pris en considration. Linformation produite revient donc
reprendre les rsultats de la diffrence cumule translats du nombre dhabitants
de chaque zone tout moment de la journe.
Figure 2.17 Prsence 3 priodes de temps

Les rsultats de prsence sont reprsents Figure 2.17 pour des calculs effectus
6h, 10h et 22h. La carte de gauche reprsentant le rsultat 6h00 correspond au
recensement INSEE ramen aux zones de lEMD. A 10h00 nous pouvons observer
la nouvelle rpartition de la population en fonction des activits de chacun. Enfin
la carte de droite montre la rpartition 22h00 qui est semblable celle observe le
matin 6h00 : la population a presque repris sa distribution initiale.
2.4.3
Exprimentation et rsultats
La comparaison des rsultats tlphoniques avec lEMD a pour but dtablir le

lien pouvant exister entre lactivit tlphonique, la mobilit des personnes et le territoire. A cette fin nous proposons ici de comparer la rpartition spatiale des mobiles
daprs notre modle expos en section 2.3.1 lEMD, ce qui doit nous permettre
didentifier dans quelle mesure les personnes utilisant des tlphones portables sont
reprsentatives de lensemble de la population selon le moment de la journe et le
lieu. Le principe de validation emploie les zones de lenqute mnage : pour une zone
donne, lexprimentation doit montrer comment la prsence des personnes localises par les tlphones portables reflte la prsence des personnes issues de lenqute
sur cette mme zone. Il faut donc dans un premier temps agglomrer dans les zones
les prsences dtectes via les tlphones sur lensemble des mailles du territoire
par lapplication de notre modle de rpartition spatio-temporelle du trafic tlphonique. Nous pouvons alors comparer les tendances des courbes issues de lEMD et
de la localisation.
64
Les rsultats de localisation doivent tre observs quasi obligatoirement dans

des contextes de variation spatiale et temporelle. Par exemple, comment volue au
cours dune journe travaille la prsence de population sur les zones industrielles ?
Ou sur les zones commerciales les samedis ? Etc. Il faut donc la fois regarder le
lieu et le moment.
Nous prsentons ci-aprs les comparaisons entre les courbes de prsences de
lenqute EMD et les courbes de prsences issues du modle de rpartition du trafic
tlphonique (les identifiants des zones sont ceux issus de lenqute). Nous montrons
ces comparaisons sur 4 cas de figure reprsentatifs des phnomnes que nous avons
observ sur lensemble des 47 zones.
2 zones urbaines : zone dactivit industrielle (Technhom) et zone du Centre
Ville avec de nombreux petits commerces et habitat de type immeuble.
2 zone priurbaines : Andelnans et Bavilliers qui sont deux villages avec population rsidente (500 habitants Andelnans et 5400 Bavilliers) et quelques
commerces.
Les courbes sur les 4 graphiques (Figures 2.18 2.21) indiquent :
En rouge, les rsultats de lenqute EMD, cest--dire les donnes de rfrence.
Lordonne tient compte de la population qui habite sur les lieux observs donc
le point dpart dpend de la zone ; par exemple 0 pour la zone dactivit et 3000
pour la zone centre ville. La zone dactivit fournit une trs bonne rfrence
de traage de la mobilit puisquelle ninclut pas de rsidents.
En bleu, les rsultats de notre modle de distribution spatio-temporelle, cest-dire les donnes valider. Les donnes sont multiplies par 100 pour que
lamplitude de ces courbes soient dans le mme champ de lecture que les
courbes de rfrence et faciliter la comparaison (sauf les donnes dAndelnans
qui sont multiplies par 10). Le point initial est toujours 0 cest--dire que
lon ninclut pas la population rsidante dans la mesure.
Une moyenne mobile sur 8 valeurs est calcule sur chaque courbe pour donner
les tendances et faciliter lanalyse.
La zone dactivit sans rsident initial montre Figure 2.18 deux courbes dont
les tendances sont bien corrles. Il en est de mme pour la zone de centre ville (cf.
Figure 2.19). Les autres zones qui sont essentiellement des zones dhabitation ont des
courbes qui semblent suivre une corrlation en opposition de phase tel quillustr en
Figures 2.20 et 2.21. Pour mieux observer linversion de phase des zones dhabitation,
nous avons retourn les courbes correspondantes. Les Figures 2.22 et 2.23 montrent
cette symtrie des donnes issues du modle par rapport laxe f (x) = 150 et
f (x) = 2500 respectivement.
65
4000
3500
3000
Nb de personnes
2500
Orange Techn'hom x100
2000
EMD Techn'hom
1500
8Moy. mobile sur pr. (Orange
Techn'hom x100)
1000
500
8Moy. mobile sur pr. (EMD

Techn'hom)
0
-500
-1000
6h 7h 8h 9h 10h 11h 12h 13h 14h 15h 16h 17h 18h 19h 20h 21h 22h 23h
Temps
Figure 2.18 Comparaison EMD / modle en zone dactivit industrielle sans

habitat
Des types de zones apparaissent donc selon limpact du sursol, rsidentiel ou
pas, et avec activits conomiques ou pas. On peut ainsi identifier deux catgories
de zones, caractrises par les points suivants :
Sur les 2 zones urbaines, les courbes sont trs corrles : la prsence des personnes distribues par le modle suit troitement celle des personnes vues par
lEMD. Il sagit principalement de zones non habites (Technhom) ou faiblement habites (centre ville) o les personnes se rendent pour travailler ou faire
leurs courses du fait dune typologie dactivits conomiques. Lemploi des tlphones mobiles est bien corrl la prsence des personnes en dplacement
sur ces zones.
Sur les 2 zones pri-urbaines, les courbes sont inverses ou corrles en inversion de phase. Quand les personnes sont chez elles des heures de faible
mobilit (dans la matine, lheure du djeuner et le soir aprs 21h30), elles
utilisent peu leur tlphone mobile ; dans les priodes de transitions o des
dplacements sont effectus (arrives pour midi, arrives en fin de journe
entre 17h00 et 21h30), les personnes utilisent leur tlphone mobile. Les deux
courbes sont harmonieusement inverses. L aussi le primtre horaire propice
aux dplacements est dtectable par lactivit tlphonique.
Notons que les 4 zones prsentent un glissement sur les pics issus de notre modle
par rapport ceux de lEMD. Ce glissement est homogne : il se produit vers 12h12h30 et vers 17h30-19h30 et toujours en dcalage dune heure plus tard avec notre
modle (2h pour la zone centre ville). Ce qui est intressant dans ce phnomne est
quil est visible quel que soit le type de zones, on peut donc supposer que le modle
66
6000
Nb de personnes
5000
4000
Orange Centre Ville x100
3000
EMD Centre Ville
2000
8Moy. mobile sur pr. (Orange Centre

Ville x100)
1000
8Moy. mobile sur pr. (EMD Centre

Ville)
0
Temps
Figure 2.19 Comparaison EMD / modle en centre ville avec habitats et commerces
pourrait tre calibr. Cependant, il sagit de priodes mobilit forte. Ct trafic

tlphonique cela signifie un fort usage du tlphone sur ces priodes. Ct EMD
cela signifie plus dincertitude sur les rsultats enregistrs pendant lenqute. En
effet, lors de lenqute, les personnes enqutes sexpriment sur ce quelles ont fait
comme dplacement la veille. Ainsi, de faon assez conventionnelle, pour prendre
un exemple, une personne aura dclar quelle part du travail 17h-17h30 et rentre
son domicile. Lenqute traduit cela par le fait de marquer une zone dorigine
17h (zone de travail) et une zone de destination 17h30 (zone du domicile). En
pratique, lenqute exclut donc trs facilement une priode de temps, entre le travail
et le domicile, pendant laquelle il y a une forte variation dun jour lautre, la plus
forte en ralit. Un jour, la personne va rentrer cette heure-l ; le lendemain, 1h30
plus tard car elle aura fait des courses ; le surlendemain, 30 min plus tard car elle
aura travaill un peu plus, etc. Ces phnomnes sont visibles lorsque les contraintes
de mobilit sont souples, en gnral quand on sort du travail plutt que quand on
y va, soit plutt aux heures o nous avons observ un glissement des rsultats du
modle par rapport lEMD. On ne peut donc pas en conclure dfinitivement quil
faut calibrer le modle mais plutt que cest la partie la plus stochastique du comportement humain et quune enqute sur une journe, comme cest fait pour lEMD,
ne traduit pas forcment correctement cette dimension alatoire des comportements.
Ces hypothses demanderaient tre vrifies sur dautres villes, pour ce qui est des
donnes issues de lEMD, et sur plusieurs semaines pour ce qui est de donnes issues
de la tlphonie.
Par ailleurs, nous voyons quune simple lecture nave de lactivit tlphonique
ne permet pas en gnral de conclure sur le nombre de personnes prsentes dans
67
700
600
Nb de personnes
500
Orange Andelnans x10
400
EMD Andelnans
300

Andelnans x10)
200

Andelnans)
100
0
Temps
Figure 2.20 Comparaison EMD / modle en secteur priurbain 1 avec habitat et

trs peu de commerce
une zone. Et pour cause, les tlphones ne sont pas utiliss de faon linaire tout
au long de la journe. Il est vraisemblable que nous appelons plus facilement 12h
qu 23h. De mme le lieu semble avoir un effet direct sur lutilisation du tlphone
portable. En zone trs rsidentielle, on favorisera sans doute le tlphone fixe tant
la maison, alors que dans les commerces ou au travail, le portable sera privilgi.
Il apparait alors ncessaire de ne pas se contenter de traduire lactivit tlphonique directement en niveau de prsence mais de dterminer la reprsentativit de
lactivit tlphonique dans un contexte spatio-temporel.
68
7000
6000
Nb de personnes
5000
Orange Bavilliers x100
4000
EMD Bavilliers
3000

Bavilliers x100)
2000
8Moy. mobile sur pr. (EMD Bavilliers)

1000
0
Temps
Figure 2.21 Comparaison EMD / modle en secteur priurbain 2 avec habitat et

trs peu de commerce
700
600
Nb de personnes
500
Orange invers Andelnans
400
EMD Andelnans
300
invers Andelnans)
200

Andelnans)
100
0
Temps
Figure 2.22 Symtrie du modle en secteur priurbain 1 avec habitat et trs peu
de commerce
69
7000
6000
Nb de personnes
5000
Orange invers Bavilliers
4000
EMD Bavilliers
3000
8Moy. mobile sur pr. (Orange invers
Bavilliers)
2000
8Moy. mobile sur pr. (EMD Bavilliers)

1000
0
Temps
Figure 2.23 Symtrie du modle en secteur priurbain 2 avec habitat et trs peu
de commerce
70
2.4.4
Construction dune Signature Territoriale
Les rsultats prcdents ont illustr le fait que la faon de tlphoner dpend
directement du type de lieu (lespace) et du moment (la journe, lheure). Il apparait donc fondamental dtudier le niveau de stabilit des communications, non
pas au cours de la journe mais dune semaine lautre. En effet, si lutilisation
du tlphone varie de faon significative pour un mme type de jour, dans la mme
zone et au mme moment de la journe, aucune conclusion sur la reprsentativit des
communications ne peut tre tire. A lchelle de lensemble des personnes, lactivit
tlphonique serait chaotique et ne laisserait aucun espoir den tirer une information
sur la rpartition de la population. Au contraire, si pour une mme zone, le mme
jour et au mme moment, nous pouvons observer un comportement stable dune
semaine lautre, cela montre que la faon de tlphoner est directement et troitement lie au lieu. A ce titre les communications constitueraient un bon marqueur
de la prsence dans une zone.
Pour vrifier ceci, nous introduisons la notion de Signature Territoriale. Nous
la dfinissons comme tant le coefficient multiplicateur qui, pour chaque jour type
et chaque moment, permet de passer du nombre dvnements tlphoniques au
nombre de prsents issus de lEMD. Ce coefficient devrait certainement tre important le soir par exemple, tant donn quun appel 22h reprsente certainement
beaucoup plus de monde prsent quun appel 12h. Il sobtient naturellement par
la division euclidienne du nombre de personnes comptes par lEMD par le nombre
dvnements tlphoniques.
Dfinition 5 (Signature Territoriale) On appelle Signature Territoriale dune
zone la matrice caractristique permettant didentifier pour chaque type de jour et
chaque horaire le nombre de personnes que reprsente un vnement tlphonique.
Afin dtudier la stabilit et donc la pertinence de cette signature, reprenons
les zones utilises prcdemment. Nous allons nous focaliser sur les journes connues
pour tre la fois semblables et de plus forte mobilit, le mardi et le jeudi [Jeannic 2011].
Par ailleurs, pour renforcer cette validation, nous comparons ces journes au cours
de deux semaines diffrentes. La figure 2.24 illustre les rsultats obtenus pour les
zones que nous avons identifies comme tant en phase (centre ville et zone dactivit industrielle). Les courbes hautes concernent le centre ville et les courbes basses
la zone dactivit industrielle.
En abscisse est reprsente lheure de la journe, et en ordonne le coefficient
permettant de passer du nombre de personnes issu du modle propos au nombre de
personnes issu de lEMD. Concernant les courbes de la zone dactivit industrielle
(courbes basses), on constate quelles sont 0 pass 19h. Etant donn quil sagit
dune zone sans habitat, cela signifie que, daprs lEMD, il y a plus de personnes
71
60
centre ville en haut

Techn'hom en bas
Rapport EMD / modle
50
40
jeudi1 Centre Ville

jeudi1 Techn'hom
30
jeudi2 Centre Ville

jeudi2 Techn'hom
20
mardi1 Centre Ville

mardi1 Techn'hom
10
mardi2 Centre Ville

mardi2 Techn'hom
0
6h
7h
8h
9h 10h 11h 12h 13h 14h 15h 16h 17h 18h 19h 20h 21h 22h 23h
Temps
Figure 2.24 Signature Territoriale pour le centre ville (courbes hautes) et la zone
dactivit industrielle (courbes basses) - pour deux mardis et jeudis diffrents
qui sont parties depuis le dbut de la journe (6h du matin) que de personnes
qui sont arrives. LEMD indique donc un nombre ngatif de personnes pass 19h.
Cela montre les limites de ces enqutes, qui sont la meilleure rfrence que lon ait
aujourdhui mais qui comportent de nombreuses incertitudes quant leurs rsultats.
Les 4 courbes de chaque zone se rvlent tre trs fortement semblables. De plus,
dune zone lautre les courbes sont bien distinctes. La signature se rvle tre un
identifiant propre chaque zone et stable dun jour lautre.
Nous avons de la mme faon construit les signatures correspondant aux zones
priurbaines. Le rsultat observable sur la Figure 2.25 rvle une tendance trs
semblable ce que nous venons de commenter. La signature permet didentifier
clairement chaque zone, avec en haut les courbes de la signature de Bavillers, et en
bas celles dAndelnans.
Nous identifions donc trs nettement une tendance stable propre chaque zone
pour les 4 jours observs, quel que soit le type de zone. A ce titre nous montrons ici
que la faon dont nous avons utilis les vnements du rseau cellulaire conduit un
marqueur fiable de la prsence des personnes. De plus, lobservation gnralement
faite dans les tudes de transport que le mardi et le jeudi ont des profils de mobilit
trs semblables est ici galement vrifie.
Enfin, la lecture dtaille des graphiques fournit des indicateurs sur la reprsentativit des communications mobiles. Un pic bas 12h prcise au centre ville
(Figure 2.24) montre que, proportionnellement au nombre de personnes prsentes,
on appelle beaucoup plus. Le ratio descend alors 15 ce qui signifie quun vnement
72
60
Bavilliers en haut
Andelnans en bas
Rapport EMD / modle
50
40
jeudi1 Bavilliers
jeudi1 Andelnans
30
jeudi2 Bavilliers
jeudi2 Andelnans
20
mardi1 Bavilliers
mardi1 Andelnans
10
mardi2 Bavilliers
mardi2 Andelnans
0
6h
7h
8h
9h 10h 11h 12h 13h 14h 15h 16h 17h 18h 19h 20h 21h 22h 23h
Temps
Figure 2.25 Signature Territoriale pour les zones priurbaines - pour deux mardis
et jeudis diffrents
gnr au cours du 1/4 dheure correspond 15 personnes prsentes. Au contraire,

un pic haut vers 15h avec un ratio de 35 signifie quun vnement tlphonique reprsente 35 personnes prsentes. On constate des pics bas galement 17h et 18h
mais pas entre les deux. Sur la zone dactivit le pic de 12h est moins marqu :
on tlphone de manire plus tale dans le temps avec un lger pic 12h30. On
peut galement constater un pic haut entre 13h et 14h sur la zone dactivit. Il
sagit dun moment o le nombre de communications par personne diminue, cest
lheure du djeuner. Lensemble de ces observations demanderait bien entendu tre
confront des relevs sur plusieurs semaines mais nous ne disposons pas dautres
relevs actuellement.
La comparaison des deux profils de zone permet didentifier deux tendances distinctes. Alors que les zones de centre ville et dactivit industrielle ont une volution
forte entre 12h et 14h (pic bas suivi de pic haut), ce phnomne est nettement
moindre dans les zones priurbaines. De plus, alors que dans les zones priurbaines
le niveau de la signature est trs semblable le matin et laprs-midi, dans les zones
dactivit ce niveau est diffrenci, nettement plus lev le matin quen fin daprsmidi. Cela montre que dans les zones dactivit lutilisation du mobile est trs dpendante de lheure et du couplage entre lheure et lactivit territoriale. Dans les
zones dhabitation, nous observons une tendance beaucoup plus linaire en journe.
Entre 9h et 20h, lutilisation du tlphone se fait de faon assez uniforme, quelle que
soit lheure.
Ltude approfondie de ces signatures territoriales se rvle tre riche de sens,
et fournit de nombreuses informations sur le fonctionnement du territoire.
2.5. Synthse
2.4.5
73
Gnralisation de la Signature Territoriale
Nous avons montr que la faon dutiliser le tlphone mobile est globalement
trs stable dune semaine lautre pour une mme zone, au mme jour et au mme
moment. Par contre, elle peut diffrer significativement dune zone lautre. Nous
avons ainsi pu quantifier pour chaque zone le nombre de personnes reprsentes par
lactivit tlphonique. La question qui se pose est de savoir dans quelle mesure
cette signature peut tre dduite de la constitution de la zone, en termes de donnes de sursol et socio-conomiques. Est-il possible didentifier des caractristiques
territoriales qui permettent destimer la signature correspondante ?
Malgr nos efforts dans ce sens, il apparait que cette signature territoriale suit
des rgles particulirement subtiles que nous navons pas encore clairement identifies. Nous avons eu recours une approche base de rgression linaire et dun
estimateur des moindres carrs pour tenter didentifier la manire dont contribue
chaque classe de terrain la pondration globale des zones. Or nous avons constat
que la faon de communiquer via les mobiles nest pas toujours directement corrle
la constitution territoriale des zones (habitat, voirie, commerces, etc.) mais quelle
intgre dautres facteurs, peut-tre sociaux. Il apparait ainsi que lusage des mobiles
dans les habitations diffre dun quartier un autre. De la mme faon les tlphones sont utiliss diffremment dans les entreprises selon les zones de localisation
des entreprises concernes ; l encore il faudrait regarder dautres facteurs tels que
la nature de lactivit de lentreprise.
Une orientation qui nous semble prometteuse est le recours aux techniques de
classification (souvent appeles clustering) telles que lanalyse en composante principale (ACP) afin de regrouper les zones ayant des profils semblables. Nous laissons
cette partie en perspective pour des travaux futurs.
2.5
Synthse
Le modle propos dans ce chapitre sinscrit dans un triptyque tlphonie - mobilit - territoire. Les travaux prsents sont novateurs plusieurs titres, tout dabord,
de part les donnes utilises. Contrairement ce que font les outils classiques de modlisation de la mobilit partir denqutes et destimations, notre approche vise
fournir des rsultats qui sont des mesures de dplacements issus du terrain. Ensuite,
ces travaux sont novateurs travers lunification de donnes de dplacement et de
donnes du territoire. Contrairement ce qui commence tre fait travers lutilisation des donnes issues de la tlphonie mobile, le modle que nous proposons
sappuie sur la localisation des ples attracteurs/gnrateurs de mobilit constitus
des habitations, des commerces, des entreprises, des coles etc., tout ce qui constitue
une activit humaine, et ce titre est un modle de la catgorie activit-centre.
74
Dans une premire partie a t prsent le fonctionnement gnral dun rseau

de tlphonie mobile. Lobjet de cette partie tait de fournir un clairage sur les
donnes issues de cette technologie qui peuvent tre utiles une modlisation de la
mobilit. Deux types de donnes ont t identifis, les donnes de couverture radio
et les donnes de trafic. Alors que les donnes de couverture radio sattachent
dfinir la portion de territoire couverte par chaque antenne, avec une probabilit de
prise de communication pour chaque maille (PPC), les donnes de trafic rendent
compte du nombre dvnements enregistrs par chaque station, vnements lis
des communications. Les donnes de couverture sont des donnes statiques, fixes
par la topographie et le paramtrage des stations. Les donnes de trafic sont quant
elles dynamiques, variant au cours de la journe et dun jour lautre.
La deuxime partie de ce chapitre contient la description du modle propos pour
une rpartition spatiale et temporelle des personnes. Ce modle qui vise affiner les
connaissances actuelles sur la mobilit regroupe des donnes tlphoniques et des
donnes de description du territoire. Il sappuie sur la notion de classe dattraction
qui, chaque classe de sursol, attribut un vecteur dynamique de pondrations dpendant du type de jour et du moment de la journe. La mise en correspondance de
la cartographie des PPC, de la cartographie des poids dattraction spatio-temporelle,
et du trafic tlphonique dans notre modle a donn lieu une distribution spatiotemporelle des personnes. La mise en oeuvre du modle propos dans la plate-forme
geoLogic a donn lieu au dveloppement dun logiciel danalyse visuelle de la mobilit. Il offre la possibilit dtudier des moments et des lieux prcis, en continu ou
en arrt sur image sur la carte. Il est ainsi possible den tirer des informations utiles
pour lamnagement dun service. Cela permet par exemple de fixer les frquences de
passage des bus, ou encore de dterminer les meilleurs emplacements pour des arrts
des bus. Sur le territoire considr, ltude est base sur la prsence de personnes
dtectes par leurs communications tlphoniques au cours de la journe.
Enfin, afin dexprimenter notre modle, une tude comparative est propose.
Ainsi la distribution des personnes issue de notre modle est mise en regard de donnes de localisation construites partir dune enqute mnages/dplacements, ainsi
que de donnes statistiques issues du recensement de lINSEE. Deux types de zones
territoriales ont ainsi t identifis, avec deux types dutilisation des tlphones portables bien distincts. Dune part il y a les zones de forte attractivit, tel que le
centre ville, ou les zones dactivit. Il sagit des zones particulirement intressantes
tudier car elles engendrent une forte mobilit. Dautre part il y a les zones de
type rsidentiel. On y retrouve les quartiers dhabitation ou les communes priphriques. Ces zones faiblement attractives sont souvent plus difficiles tudier. Elles
suivent un schma de prsence et de mobilit plus variable. Lapproche propose a
permis de montrer que dans les zones de forte attractivit la prsence de personnes
partir denqutes est troitement corrle avec lactivit tlphonique. Dans ce
cas, lactivit tlphonique est un bon marqueur direct de la population prsente.
Dans les zones dhabitation par contre, lactivit tlphonique sest rvle tre en
2.5. Synthse
75
opposition de phase. Paradoxalement, plus il y a de personnes dans ces zones, moins

il y a dactivit tlphonique via les mobiles. Le phnomne mis en vidence est
quune forte frquentation de ces zones signifie quil sagit de rsidents, qui utilisent
de faon prfre le tlphone fixe, et ne gnre ainsi que peu dactivit tlphonique
sur le rseau mobile. Une tude complmentaire savre alors ncessaire pour permettre deffectuer la transcription de lactivit tlphonique en nombre de personnes
prsentes. Pour tudier de faon plus fine le lien existant entre lusage du tlphone
et la prsence de personnes, le concept de signature territoriale a t propos. Il a
permis de mettre en vidence ce lien, de faon diffrencie pour chaque zone tudie.
Cette signature a galement permis de vrifier le trs bon niveau de stabilit de lindicateur tlphonique dune semaine lautre, ce qui renforce lintrt du modle
que nous avons propos.
Une modlisation prcise des dplacements est un lment essentiel pour guider
une dcision en matire damnagement territorial. Mais souvent, savoir comment
une population se dplace nest pas suffisant. En sappuyant sur des donnes de
mobilit, la seconde partie de ce mmoire est consacre la dfinition et lutilisation dalgorithmes permettant doptimiser les amnagements au sein dun territoire.
Le cas dtude rel prsent concerne le dploiement dun service dauto-partage
pour une collectivit. Mais pour introduire cette seconde partie, le chapitre suivant sattache tout dabord prsenter les lments permettant de comprendre les
mtaheuristiques combinatoires en contexte multiobjectif.
Deuxime partie
Optimisation combinatoire
multiobjectif de lauto-partage
Chapitre 3
Optimisation combinatoire
multiobjectif : tat de lart
Dans ce chapitre est introduit le problme de loptimisatiton combinatoire multiobjectif. Dans un premier temps les principaux concepts lis au sujet sont prsents, ainsi que les principales dfinitions. En particulier, le problme de noncomparabilit des solutions multiobjectif constitue un fil conducteur de ce chapitre.
Dans une deuxime partie un inventaire des heuristiques couramment utilises est
propos. Elles sont prsentes regroupes en trois grandes catgories : les approches
par transformation en problme mono-objectif, les approches non-Pareto et enfin
les approches Pareto. Une prsentation est ensuite faite des heuristiques hybrides,
qui combinent des heuristiques provenant des diffrentes catgories prcdentes. Enfin, pour apprhender lvaluation dun ensemble de solutions Pareto optimales, un
inventaire des principaux indicateurs dvaluation est propos.
Sommaire
3.1
3.2
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Notions de base et dfinitions . . . . . . . . . . . . . . . . . .
3.2.1 Optimisation mono-objectif . . . . . . . . . . . . . . . . . . .
3.2.2 Formulation dun problme doptimisation multiobjectif . . .
3.2.3 Espace de dcision vs espace objectif . . . . . . . . . . . . . .
3.2.4 Optimisation combinatoire et mtaheuristiques . . . . . . . .
3.2.5 Dominance et Pareto optimalit (le problme de la relation
dordre) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Mtaheuristiques pour les problmes multiobjectifs . . . . .
3.3.1 Classification des principales approches . . . . . . . . . . . .
3.3.2 Les approches par transformation mono-objectif . . . . . . .
3.3.3 Les approches non-Pareto . . . . . . . . . . . . . . . . . . . .
3.3.4 Les approches Pareto . . . . . . . . . . . . . . . . . . . . . .
3.3.5 Les approches hybrides . . . . . . . . . . . . . . . . . . . . .
3.4 Evaluation des algorithmes multiobjectifs : une approche
base dindicateurs . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Indicateur de contribution . . . . . . . . . . . . . . . . . . . .
3.4.2 Indicateur -additif . . . . . . . . . . . . . . . . . . . . . . . .
3.4.3 Indicateur hypervolume . . . . . . . . . . . . . . . . . . . . .
3.4.4 Indicateur de distance gnrationnelle . . . . . . . . . . . . .
3.5 Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
81
81
82
82
83
85
87
87
87
92
93
101
104
104
105
105
108
108
80
Chapitre 3. Optimisation combinatoire multiobjectif : tat de lart
3.1
Introduction
De nombreux domaines tant scientifiques, conomiques quindustriels ou encore

issus de la vie de tous les jours ncessitent de prendre les bonnes, voire les meilleures
dcisions. Alors que nous effectuons quotidiennement des choix partir de simples
raisonnements, tel que choisir un itinraire en voiture, de nombreux problmes,
industriels notamment, sont bien trop complexes pour tre abords sans outils efficaces. Loptimisation intervient comme branche issue des mathmatiques pour rsoudre de tels problmes. La quantit de travaux publis ces dernires annes atteste
dune discipline en pleine volution, dans laquelle de nombreux axes restent encore
explorer.
Alors que dans certaines situations il est possible didentifier un objectif unique
optimiser, un grand nombre de problmes rels imposent de considrer plusieurs objectifs la fois, souvent contradictoires entre eux. Loptimisation multiobjectif vise
ainsi optimiser ces problmes complexes. Une des grandes difficults vient du fait
que la meilleure solution pour un objectif est rarement la meilleure sur lensemble
des objectifs. De ce fait, contrairement loptimisation mono-objectif qui admet
une solution optimale unique, la solution dun problme doptimisation multiobjectif (Multiobjective Optimization Problem - MOP) est en ralit un ensemble de
solutions de compromis connu sous le nom de Pareto optimal. Toute solution de cet
ensemble est telle quil nexiste aucune solution ralisable amliorant simultanment
tous les critres. On parle alors dune solution non-domine.
Lensemble Pareto optimal peut dans certains cas tre de trs grande taille. De
plus pour la plupart des problmes rels un tel ensemble nest pas connu. Ainsi lun
des enjeux principaux en optimisation combinatoire est de fournir un algorithme qui
permette dapprocher au mieux cet ensemble Pareto optimal.
Ce chapitre prsente les diffrents concepts ncessaires la bonne comprhension
de ce domaine. Ils fournit en particulier les lments permettant dapprhender
le chapitre 4. En plus des concepts principaux, nous faisons ici un historique des
principales mtaheuristiques permettant de rsoudre un MOP. Ces mthodes sont
organises autour de trois grandes familles : les approches par transformation en
mono-objectif, les algorithmes non-Pareto, et enfin les approches de type Pareto.
Dans cette dernire catgorie nous prsenterons, en plus des approches classiques,
les techniques visant hybrider des algorithmes issus de diffrentes familles, et les
approches base dindicateurs.
Une partie des dfinitions, concepts et algorithmes prsents dans ce chapitre
est notamment inspire des livres [Talbi 2009] et [Coello 2007]. La thse dArnaud
Liefooghe est galement une rfrence en la matire.
La premire section de ce chapitre nous permet de revenir sur les principales d-
3.2. Notions de base et dfinitions
81
finitions et notions de base rencontres dans le domaine de la rsolution dun MOP.

Dans la deuxime section nous prsentons les principales mtaheuristiques rencontres dans ce domaine. La section 3.4 prsente les approches permettant dvaluer le
niveau de performance dun algorithme. Laccent est mis sur les indicateurs rencontrs pour reflter le niveau de qualit dun ensemble de solutions. Enfin la dernire
section traite de lintervention du dcideur face un problme multiobjectif.
3.2
3.2.1
Notions de base et dfinitions

Optimisation mono-objectif
La recherche oprationnelle sest dans un premier temps adresse aux problmes

doptimisation mono-objectif (Optimization Problem - OP). Aujourdhui encore de
nombreux travaux de recherche concerne ce type de problmes, notamment en proposant de nouvelles thories volutionnaires ou encore des approches coopratives.
De plus, dans le cas de loptimisation multiobjectif certaines approches visent
rduire le nombre dobjectifs pour appliquer les algorithmes, souvent plus simples,
disponibles pour rsoudre les problmes doptimisation mono-objectif.
Dfinition 6 (Problme doptimisation mono-objectif ) Dans le cas gnral,
un problme doptimisation mono-objectif consiste maximiser (ou minimiser) une
fonction f (x) :

max
z = f (x)
OP
(3.1)
tel que : x X
x est ici le vecteur de n variables de dcision x = (x1 , x2 , ..., xn )t , avec t loprateur de transposition. X dsigne lespace de recherche regroupant toutes les solutions
ralisables.
Dfinition 7 (Optimum global) Etant donn un problme doptimisation, la solution x est dite maximum global ssi :
x X : f (x ) f (x)
(3.2)
Souvent, lors de la rsolution de problmes rels, il nest pas possible de garantir quune solution est loptimum global sur lensemble de lespace de recherche.
On explore alors un sous-espace X1 X de lespace de recherche pour trouver
loptimum global x1 de X1 , vrifiant f (x ) f (x1 ) toujours pour un problme de
maximisation.
82
Nous le voyons ici, le contexte mono-objectif permet toujours didentifier la solution optimale, au moins sur X1 . Lorsque le problme doptimisation devient multiobjectif, nous verrons quil en est tout autre chose.
3.2.2
Formulation dun problme doptimisation multiobjectif
La formulation gnrale dun problme doptimisation multiobjectif (Multiobjective Optimization Problem - MOP) est de la forme :
z = f (x)
max
M OP
o
f (x) = (f1 (x), f2 (x), ..., fn (x))
tel que : x X
(3.3)
avec n 2 le nombre de fonctions objectif, X lensemble des solutions ralisables

dans lespace de dcision, x = (x1 , ..., xk ) X est le vecteur regroupant les variables
de dcision. Dans le cadre de problmes combinatoires X est un ensemble discret.
De plus soit Z Rn tel que Z = f (X), Z est lensemble des solutions ralisables
dans lespace objectif.
Lunique diffrence avec les problmes doptimisation mono-objectif rside dans
le fait que f (x) ne prend plus ses valeurs dans R mais dans Rn .
3.2.3
Espace de dcision vs espace objectif
Lespace de dcision regroupant les variables x = (x1 , ..., xk ) X est de dimension k. Il sagit de lespace dans lequel sont reprsentes les solutions.
Figure 3.1 Espace de dcision / espace objectif
83
Lespace objectif, galement appel espace des critres, de dimension n permet

de projeter lvaluation des solutions. La Figure 3.1 illustre ces deux espaces, avec
gauche lespace de dcision de taille k = 3 dans lequel est reprsente la solution
x. A droite se trouve lvaluation correspondante pour n = 2 fonctions optimiser.
Sur cette figure reprsentant un problme de maximisation z = f (x) appartient au
front de Pareto : x est une solution Pareto optimale.
Dans la plupart des situations en optimisation le choix dune solution se fait
sur la base de ltude de lespace objectif. Il apparait cependant parfois intressant
dobserver galement les solutions dans lespace de dcision.
3.2.4
Optimisation combinatoire et mtaheuristiques
Le cadre dans lequel sinscrit les travaux de cette thse concerne loptimisation
combinatoire. La fonction optimiser, souvent appele fonction cot ou fonction
objectif, est dfinie sur un ensemble discret. Il sagit donc de trouver loptimum
(maximum ou minimum) parmi un ensemble fini. Bien que dans la thorie il suffirait
dnumrer toutes les solutions possibles et de retenir la meilleure, il nest bien souvent matriellement pas possible deffectuer cet inventaire exhaustif dans un temps
"raisonnable". Le temps de calcul constitue alors une contrainte forte prendre en
compte. Selon le problme considr, une dure acceptable pour que le programme
propose une solution sera de quelques millisecondes - dans une situation durgence
bord dun vhicule par exemple - quelques semaines lorsquil sagit de planifier
une nouvelle ligne de production dans un site industriel par exemple.
3.2.4.1
Complexit dun problme et NP-compltude
Le but de cette section nest pas de dtailler la notion de complexit, qui est
largement traite par ailleurs. Pour une introduction plus complte ce domaine le
lecteur est renvoy au clbre ouvrage de Garey et Johnson [Garey 1979]. Lobjet
de cette partie est de rappeler quelques fondamentaux de la complexit qui sont lis
aux problmes de dcision.
La rsolution dun problme passe par la mise au point dun algorithme. Bien que
la notion dalgorithme remonte lantiquit dans la dmarche, elle na t formalise
rellement quavec lapparition de la machine de Turing. Nous ne reviendrons pas
ici sur ces fondements de linformatique, qui sont remarquablement remis en perspective dans louvrage de Gilles Dowek Les mtamorphoses du calcul [Dowek 2007]
Un algorithme est ainsi gnralement considr comme efficace si sa complexit est
borne par une fonction polynomiale en la taille de linstance rsoudre.
Dfinition 8 (Problme de classe P) La classe P regroupe lensemble des pro-
84
blmes de dcision dont la solution est atteignable en un temps polynomial par une
machine de Turing dterministe.
Il existe toutefois un grand nombre de problmes de dcision pour lesquels il ny
a pas dalgorithme polynomial connu.
Dfinition 9 (Problme de classe NP) La classe NP regroupe lensemble des
problmes de dcision pouvant tre rsolus en un temps polynomial par une machine
de Turing non dterministe.
Remarque : Un problme appartenant la classe P ne signifie pas ncessairement quil sera rsolvable par un programme dterministe en temps "raisonnable".
Inversement, certains problmes de la classe NP admettront des instances pouvant
tre rsolues par un algorithme dterministe.
On parle galement souvent de problmes NP-complets. Il sagit des problmes
les plus difficiles de la classe NP, qui sont au moins aussi difficiles que tous les
problmes NP. De fait tout problme de la classe NP doit pouvoir se ramener un
problme NP-complet par rduction polynomiale.
3.2.4.2
Rsolution exacte : approche dterministe
Lorsque les problmes le permettent, le choix de loptimum peut se faire suite

une exploration complte de lespace de recherche. Ces approches, souvent bases sur
le parcours darbres, ont lavantage de fournir de faon certaine la solution optimale
du problme. Sans faire lexploration complte, dautres algorithmes sappuient sur
les proprits du problme pour garantir la solution optimale.
Ainsi, lalgorithme du simplexe par exemple permet de rsoudre un problme souvent de faon efficace, en parcourant la fermeture convexe de lensemble de recherche.
Cet algorithme sapplique toutefois aux problmes garantissant cette proprit de
convexit : problmes en variable continue, ou problmes en variables entires avec
une matrice des contraintes unimodulaire.
De mme, lalgorithme de Branch and Bound repose sur une numration implicite o le problme est dcoup en sous-problmes (sparation) valus laide
dune relaxation, gnralement continue ou lagrangienne.
On citera galement les approches de type programmation dynamique qui permettent de rsoudre un problme de la mme famille puis de trouver une relation de
rcurrence liant les solutions de ces deux problmes, ou encore les mthodes polydrales dans lesquelles des contraintes sont ajoutes pour rendre convexe le domaine
de solutions admissibles.

3.2.4.3
85
Rsolution approche : (mta)heuristiques
Lorsque le recours un algorithme exact nest pas possible pour rsoudre un problme en raison dun temps de calcul trop lev, le recours un algorithme approch
permet toutefois de proposer une solution. Ces algorithmes approchs sont galement appels heuristiques. Le principe est ici de proposer une solution approche
de la meilleure qualit possible dans un temps limit, en exploitant notamment la
structure du problme considr. Les heuristiques prsentent lavantage de pouvoir
rsoudre un problme N P en un temps polynomial. Parmi les heuristiques les plus
simples figurent les algorithmes gloutons. Le principe est de construire la solution
itrativement en effectuant des choix optimaux localement. Cette dmarche gnrique est adapter selon la structure du problme pos. Cest l la caractrisation
dune heuristique : elle est dfinie par les spcificits du problme.
Bien que les heuristiques soient souvent des approches stochastiques, il est important de noter quelles peuvent tre dterministes.
Les mtaheuristiques se distinguent des heuristiques par leur niveau dabstraction. Alors que les heuristiques sont destines rsoudre un type de problme
spcifique, une mtaheuristique peut tre adapte une large varit de problmes.
Ainsi la recherche locale ou encore les algorithmes gntiques sont considrs comme
des mtaheuristiques.
3.2.5
Dominance et Pareto optimalit (le problme de la relation

dordre)
Comme cela a t prsent en introduction, il nexiste pas une solution unique

un problme multiobjectif mais un ensemble de solutions de meilleur compromis.
Labsence dordre total entre les solutions dun problme multiobjectif a conduit
laborer une relation dordre partielle. Ainsi Pareto [Pareto 1896] proposa une
approche hirarchique permettant de dterminer si une solution est de meilleur
compromis. Dans les dfinitions suivantes nous considrons un problme de maximisation.
Dfinition 10 (Pareto Dominance) Soit z, z 0 Z deux solutions dans lespace
des critres. On dit que z domine z 0 ssi i {1, 2, ..., n}, zi zi0 et j {1, 2, ..., n}
tel que zj > zj0 . La relation "z domine z 0 " sera note z z 0 . Cette relation de
dominance est tendue lespace de dcision : soient x, x0 X deux solutions de
lespace de dcision vrifiant f (x) f (x0 ). On dira alors que x domine x0 ou encore
x x0 .
Dfinition 11 (Solution non-domine ou Pareto optimale) Soit z Z une
86
solution dans lespace des critres. On dit que z est non-domine ssi z 0 Z, z 0 z.
De mme soit x X une solution dans lespace de dcision. On dit que x est nondomine ssi x0 X, x0 x. De telles solutions sont dites Pareto optimales.
Dfinition 12 (Incomparabilit) Soient z, z 0 Z deux solutions dans lespace
des critres. z et z 0 sont dites incomparables ssi z z 0 et z 0 z. Par extension on
dira que x et x0 (lments de X) sont incomparables ssi f (x) et f (x0 ) sont incomparables.
Dfinition 13 (Ensemble Pareto optimal) Sous les notations prcdentes, lensemble Pareto optimal est dfini comme suit : XP = {x X|@x0 X, x0 x}.
Dfinition 14 (Front de Pareto) Etant donn un ensemble Pareto optimal XP ,
le front de Pareto est dfini comme suit : ZP = {f (x)|x XP }.
Figure 3.2 Pareto dominance et incomparabilit

La Figure 3.2 illustre un ensemble de solutions, avec en rouge les solutions nondomines (dans le cas dun problme de maximisation sur les objectifs f1 et f2 ), et en
bleu les solutions domines. A partir de la solution bleue au centre, le rectangle gris
(en bas) contient les solutions quelle domine et celui vert clair (en haut) les solutions
qui la dominent. Un tel ensemble fait apparaitre deux points virtuels frquemment
utiliss, le point idal, compos des meilleurs lments de toutes les solutions et le
point nadir, compos des plus mauvais lments de toutes les solutions.
Dfinition 15 (Point idal) Le point idal, frquemment not z , est compos des
meilleures valeurs de chaque objectif : z = (z1 , ..., zn ) tel que zi = maxxX fi (x), i
{1, ..., n}.
3.3. Mtaheuristiques pour les problmes multiobjectifs
87
Dfinition 16 (Point nadir) Le point nadir, frquemment not z n , est compos

des plus mauvaises valeurs de chaque objectif : z n = (z1n , ..., znn ) tel que zin =
minxX fi (x), i {1, ..., n}.
3.3
3.3.1
Mtaheuristiques pour les problmes multiobjectifs

Classification des principales approches
Depuis que les MOP sont abords par la communaut scientifique, diffrentes approches de rsolution ont t proposes. Dans la littrature on retrouve frquemment
une classification des mthodes en trois grandes familles :
les approches bases sur la transformation du MOP en un problme monoobjectif. On trouvera dans cette catgorie les mthodes bases sur lagrgation
des fonctions objectif fi en une seule fonction f . Ceci impose, outre une bonne
connaissance du problme traiter, dtre en mesure de quantifier lapport
recherch pour chaque objectif.
les approches non-Pareto. Il sagit dapproches qui considrent tous les objectifs mais de faon dsagrge, indpendamment les uns des autres.
les approches Pareto. Pour cette classe dalgorithmes, toutes les fonctions
objectif sont considres en mme temps en exploitant le principe de nondominance.
Les diffrents travaux mens dans le domaine ont montr que les approches
Pareto sont gnralement les plus performantes.
Nous utiliserons ce dcoupage dans cette section, lequel est synthtis dans la
Figure 3.3.
De faon transversale ces diffrentes classes, les approches hybrides offrent de
nombreux avantages et permettent de bnficier des mcanismes prouvs dans les
heuristiques classiques. Bien souvent, tout comme dans le cas mono-objectif, les approches hybrides surpassent les mtaheuristiques pures, comme dans [Knowles 2000],
[Jaszkiewicz 2002] ou encore [Deb 2001].
Cest dans cette dernire classe que sinscrit nos travaux prsents dans cette
thse.
3.3.2
Les approches par transformation mono-objectif
Ces approches fournissent des moyens souvent assez simples daborder un MOP.
La complexit lie la prise en compte simultane de diffrents objectifs contra-
88
Figure 3.3 Classification des mthodes de rsolution dun MOP

dictoires est ainsi lude. Parmi les mthodes de transformation couramment rencontres on remarquera particulirement les mthodes dagrgation, les mthodes
-contrainte, et les mthodes de programmation par but. Il sagit encore aujourdhui
dapproches intressantes pour commencer tudier un MOP. De plus, de part leur
simplicit tant dans limplmentation que lexcution, ces mthodes fournissent une
bonne base pour laborer des mthodes hybrides, notamment en les couplant avec
des algorithmes gntiques.
3.3.2.1
La mthode dagrgation
Il sagit incontestablement dune des premires mthodes utilise pour approcher

les MOP. Ici le problme initial (M OP ) est transform en un problme (M OP ) o
les fonctions objectif fi sont combines pour aboutir une seule fonction F . Le plus
souvent il sagit dune agrgation linaire :
F (x) =
n
X
(3.4)
i fi (x)
i=1
o les poids i sont tels que i [0..1] et
Pn
i=1 i
= 1.
Remarquons quune des principales caractristiques de la mthode dagrgation

provient du fait que la solution optimale dpend directement de la pondration
choisie. La Figure 3.4 illustre ce principe pour deux objectifs f1 et f2 .
Le vecteur de poids dfinit un hyperplan (en pointill sur la figure) de pro-
89
Figure 3.4 Approche par agrgation des objectifs

gression dans lespace objectif (une droite dans un espace deux dimensions). La
solution optimale z est obtenue au point de tangence entre cet hyperplan et lespace
ralisable du problme. Lorsque le front de Pareto est concave, plusieurs solutions
optimales peuvent exister.
Comme nous lavons dj voqu, la principale difficult lie cette approche
rside dans le choix du vecteur . Cela suppose de bien connaitre le problme trait
et dtre capable dexprimer et de quantifier des prfrences associes aux objectifs.
De plus, le fait de fixer restreint fortement et prmaturment lespace de recherche. Cest pourquoi cette mthode est souvent utilise en faisant varier les valeurs
de . En particulier dans [Ishibuchi 1998] la mthode dagrgation est utilise dans
un algorithme hybride mlant gntique et recherche locale. A chaque slection de
parents le vecteur est regnr alatoirement.
Le dernier point remarquer propos de cette mthode concerne la commensurabilit des objectifs. En effet, pour viter quun objectif soit sur-reprsent ou
sous-reprsent dans la fonction agrge, il importe de sassurer que tous les objectifs soient dans la mme plage de valeurs. Aussi la fonction dagrgation peut selon
les besoins tre transforme sous la forme :
F (x) =
n
X
ci i fi (x)
(3.5)
i=1
o les ci sont des constantes de mise lchelle des objectifs. Pour fixer les valeurs
de ces constantes on a souvent recours au vecteur idal.
Une fois les objectifs agrgs, toutes les approches habituellement rencontres
pour rsoudre des problmes mono-objectif peuvent tre appliques. On rencontre
90
notamment la recherche locale, simple avec la mthode TPLS [Paquete 2003], mais
aussi impliquant des mcanismes Tabou [Gandibleux 1997] et lintroduction de la
mthode Tabou MOTS [Hansen 1997]. La mthode MOSA [Ulungu 1999] repose
quant elle sur un recuit simul. Enfin de nombreux algorithmes gntiques sont
galement utiliss conjointement la mthode dagrgation, tels que [Yang 1994]
pour le problme bi-critre de transport.
3.3.2.2
La mthode -contrainte
Avec cette approche, un seul objectif est retenu pour tre optimis. Par contre
des contraintes sont appliques aux autres objectifs pour assurer un niveau de qualit
suffisant. Le problme initial (M OP ) devient alors :
z = fk (x)
max
M OPk ()
tel que : x X
s.c.
fj (x) j , j = 1, ..., n o j 6= k
(3.6)
est ainsi le vecteur des contraintes sur chaque objectif : = (1 , ..., k1 , k+1 , n )
Nous illustrons sur la Figure 3.5 le cas dun problme de maximisation. La
contrainte 2 est applique la fonction objectif 2 : la solution acceptable ne
peut tre infrieure cette valeur. De fait la solution optimale sur f1 devient la
solution z .
Figure 3.5 Approche par methode -contrainte
91
Avec cette approche limportant est de pouvoir classer les objectifs par ordre de
priorit et surtout dtre capable de fixer les valeurs souhaites. Une dmarche
peut tre dcrite comme suit :
rsoudre le problme pour la fonction objectif principale fi seule ;
dfinir la valeur i associe. Elle correspond au taux de dgradation acceptable
(ex. on veut au moins 80% de loptimalit) ;
rsoudre le problme pour la fonction objectif secondaire fj avec la contrainte
i sur fi ;
dfinir la valeur j associe. Ainsi de suite...
Les travaux ayant recours la mthode -contrainte sont nombreux. L encore, le
MOP tant ramen un problme mono-objectif, les approches courantes telles que
les algorithmes gntiques, les recherches locales, etc. sont frquemment utilises.
3.3.2.3
La programmation par but
Ici le principe est de dfinir un point artificiel atteindre dans lespace objectif. Ainsi le dcideur fixe le but vis pour chaque objectif. Le MOP initial est
ensuite transform en un problme mono-objectif qui intgre, dans la formulation
du problme lui-mme, la notion de but atteindre. A titre dexemple un nouveau
problme peut tre de minimiser la dviation au but. Le problme devient alors :
M OP (z B )
n
X
|fj (x)
j=1
tel que : x X
min
zjB |p
(3.7)
Dans cette nouvelle formulation du MOP le but atteindre est dfini par z B .
La distance au but utilise ici est la mtrique de Tchebycheff avec 1 p . Dans
le cas o p = 2 on retrouve la distance euclidienne. De mme lorsque p on
retrouve un Min-Max.
La Figure 3.6 illustre le dplacement dune solution vers le but z B . L encore le
choix des paramtres est dterminant pour la bonne marche de lalgorithme. Un but
mal positionn peut altrer considrablement le rsultat obtenu. En particulier si le
but est situ lintrieur du domaine ralisable, lalgorithme ne pourra pas trouver
une solution Pareto optimale. Or le choix du but dpend du dcideur et ncessite
une trs bonne connaissance du problme trait.
Souvent le but est fix en utilisant l encore le point idal. Parmi les travaux
utilisant la mthode programmation par but on citera lalgorithme gntique de
[Coello Coello 1998] qui utilise une fonction min-max relativement au point idal.
92
Figure 3.6 Approche par but
3.3.3
Les approches non-Pareto
Cette catgorie dapproches regroupe les mthodes qui considrent tous les objectifs dans le mme algorithme, sans passer par la transformation du MOP en un
problme mono-objectif. Par contre, contrairement aux approches Pareto qui sont
bien plus rpandues, les approches non-Pareto traitent chaque fonction objectif indpendamment les unes des autres.
On ne prsentera ici que lalgorithme VEGA (Vector Evaluated Genetic Algorithm) [Schaffer 1985], qui est le premier AG rellement multiobjectif. Dans cet
algorithme, loprateur de slection est bas sur un objectif seulement, indpendamment des autres. A chaque gnration la population est divise en autant de groupes
quil y a de fonctions objectif. Chaque groupe est valu suivant lobjectif correspondant. Ainsi les individus du groupe i sont valus selon la fonction objectif fi .
Laffectation de chaque individu un groupe se fait alatoirement et chaque gnration. Ainsi chaque individu appartiendra un groupe potentiellement diffrent
chaque gnration, et sera valu sur chaque objectif.
Une des principales limites lies cette approche vient du fait mme que chaque
objectif est considr indpendamment des autres. La slection ne tient en effet
compte que dun objectif, ce qui a tendance favoriser les meilleurs individus pour
cet objectif. De fait les solutions de compromis sont pnalises. Pour pallier ce
problmes, la prise en compte simultane de tous les objectifs savre tre ncessaire.
Cest ce que permettent les approches de type Pareto.
3.3.4
93
Les approches Pareto
Ces approches utilisent la relation de dominance lintrieur mme des algorithmes. Ainsi les solutions ne sont plus values vis vis dune fonction objectif
mais vis vis dun compromis impliquant toutes les fonctions objectif. Depuis les
premiers travaux bass sur la notion de Pareto, o [Goldberg 1989] introduit la notion de rang de dominance dune solution, de nombreux algorithmes sont apparus.
Du fait que la notion mme de Pareto implique la prise en compte dune population, on retrouve naturellement de nombreux AG appartenant cette famille. Mais
comme nous le verrons, il y a galement des recherches locales bases sur la notion
de Pareto, ainsi que des approches hybrides. Plus rcemment, les mthodes base
dindicateurs sont apparues. Au lieu de considrer les solutions de la population,
cest la population elle-mme qui est value au travers dindicateurs choisis.
3.3.4.1
Les algorithmes gntiques Pareto
Les oprateur de "ranking" Ds lors quune solution nest plus value par
rapport ses fonctions objectif, il importe de dfinir une mtrique capable de reprsenter le niveau de qualit dune solution. Ainsi plusieurs mthodes ont t proposes
et sont souvent associes des AG couramment utiliss. Les trois principales rpertories dans [Zitzler 2004] sont prsentes ici.
Le rang de dominance : Il est dfini, pour une solution s donne, par le nombre
de solutions qui domine s incrment de 1 [Fonseca 1993]. Ainsi les solutions
de rang 1 sont les solutions non-domines et plus une solution est domine
par un nombre important de solutions de la population, plus son rang se
dtriore. Le rang de dominance a t appliqu lorigine dans la mthode
MOGA (Multiobjective Genetic Algorithm) [Fonseca 1993].
Le compte de dominance : Ici, linverse du rang de dominance, cest le nombre
de solutions domines par la solution s qui dtermine son rang. Ainsi un rang
lev traduit une bonne qualit de la solution.
La profondeur de dominance : Dans cette approche les solutions sont regroupes par fronts de Pareto [Goldberg 1989], les solutions non-domines de la
population reoivent la valeur 1 puis sont retires de la population. Les nouvelles solutions non-domines reoivent alors la valeur 2 puis sont galement
retires de la population. Et ainsi de suite jusqu avoir class toutes les solutions. Comme on le verra plus tard, toutes les solutions dun mme front
ayant la mme valeur impose de recourir des mcanismes complmentaires
pour les distinguer. Cette dfinition de la profondeur de dominance est utilise dans les algorithmes NSGA (Non-dominated Sorting Genetic Algorithm)
[Srinivas 1994] et NSGA-II [Deb 2002].
94
Remarque 1 : On notera quil est possible de combiner plusieurs valuations de

la dominance. Cest ce qui est notamment fait dans SPEA [Zitzler 1999] et SPEA2
[Zitzler 2001] o sont utiliss conjointement la profondeur et le rang de dominance.
Remarque 2 : Des travaux rcents introduisent dautres types de dominance,
tels l-dominance dans [Deb 2005], ou encore la g-dominance [Molina 2009].
Nous abordons maintenant quelques algorithmes en dtail parmi les plus connus.
NSGA-II (Non-dominated Sorting Genetic Algorithm) [Deb 2002] est lalgorithme
gntique le plus souvent rencontr dans la littrature pour rsoudre des MOP. Cette
deuxime version de NSGA [Srinivas 1994] utilise deux critres pour affecter la valeur de fitness aux solutions. Dans un premier temps les solutions sont regroupes
par front en utilisant la profondeur de dominance [Goldberg 1989]. Ce premier critre reflte la qualit des solutions vis vis de la convergence. Dans un deuxime
temps, chaque solution dun front est value en fonction de la densit de solutions
se trouvant proximit, grce la fonction de crowding. Ce deuxime critre reflte
la qualit des solutions vis vis de la divergence.
Ainsi NSGA-II peut tre caractris par :
un tri rapide des solutions non-domines selon la profondeur de dominance
une estimation de la densit lie lenvironnement de chaque solution, gnralement appele distance de crowding
un tri deux niveaux : selon la profondeur de dominance dabord, puis pour
les solutions dun mme niveau selon la distance de crowding
Pour ce qui est du fonctionnement, deux populations sont utilises, celle des
parents P et celle des enfants Q, toutes deux de taille N . On notera R la population
qui rsulte de lunion de P et Q, avec |R| = 2N . Les lments de chaque population
voluant au cours du temps, on notera Pt , Qt , et Rt , ltat des ensembles linstant
t. Les populations sont utilises comme suit :
1. Rduction de Rt . Les solutions de Rt sont rparties dans les fronts de dominance Fi , puis les solutions de chaque front sont ordonnes selon la distance de
crowding. Les N meilleures solutions du meilleur au plus mauvais front sont
conserves dans Pt+1 .
2. Slection des parents. Les parents sont choisis par tournoi binaire avec remise
parmi les solutions de Pt+1 , bas sur la double fitness tablie.
3. Cration de Qt+1 . Les enfants sont gnrs par croisement et mutation dfinir
selon le problme trait.
Lalgorithme 1, qui sera utilis dans la suite de cette thse, formalise ces diffrentes tapes.
95
Algorithm 1 NSGA-II
Require: population size N , generation number nbIter /*nbIter can be replaced
by a time limit*/
1: P init(N ) /*init population P with N random individuals*/
2: Q /*init an empty children population*/
3: eval(P ) /*eval objectives for each individual */
4: for i = 1 to nbIter do
5:
P P Q
6:
assignRank(P ) /*based on Pareto dominance*/
7:
for each non-dominated front f P do
8:
setCrowdingDist(f )
9:
end for
10:
sort(P ) /*by rank and in each rank by the crowding dist */
11:
P P [0 : N ]
12:
Q buildNextGeneration(P ) /*Binary Tournament Selection, Recombination and Mutation*/
13: end for
Remarque : La distance de crowding dune solution s est calcule comme la

longueur moyenne des cts de lhypercube (cf. Figure3.7) dfini par les plus proches
solutions suivantes et prcdentes dans lespace des critres et appartenant au mme
front.
Figure 3.7 Distance de crowding : moyenne des cts de lhypercube
SPEA2 (Strenght Pareto Evolutionary Algorithm) [Zitzler 2001] est une version
amliore de SPEA. En plus de la population P servant slectionner les parents
de lAG, cette approche utilise une archive complmentaire A, de taille fixe, pour
stocker NA solutions non-domines au cours de la recherche. Au cas o le nombre de
96
solutions non-domines est infrieur NA , larchive est complte avec les meilleurs
individus domins de la population P , en utilisant le critre de compte de dominance.
Pour ce faire, chaque solution s de la population P A est attribue la valeur g(s)
correspondant au nombre de solutions de P A que s domine :
g(s) = |{s0 : s0 P A et s s0 }|
(3.8)
La valeur de fitness h(s) attribue la solution s est gale la somme des g(s0 )
pour tout s0 dominant s :
h(s) =
g(s0 )
(3.9)
s0 P A,s0 s
Ainsi une solution s non domine est telle que h(s) = 0. Inversement, plus h(s)
augmente, moins bonne est la solution s.
Bien que le compte de dominance ait tendance permettre une certaine diversit, il met surtout en avant lintensification. Pour distinguer les solutions ayant
le mme compte de dominance, SPEA2 intgre un deuxime mcanisme ddi au
"sharing" pour favoriser la diversit. Il sagit dune adaptation de la mthode du
kme plus proche voisin [Silverman 1986], o la densit dun point est inversement
proportionnelle la distance le sparant du kme plus proche voisin. La densit
dune solution s est dcrite par :
D(s) =
1
sk + 2
(3.10)
avec : sk la distance entre la solution s et son kme plus proche voisin.
On notera que k est gnralement fix k = N + NA , o N est la taille de

la population P et NA la taille de larchive A. La valeur de fitness globale utilise
dans SPEA2 est alors :
F (s) = h(s) + D(s)
(3.11)
-MOEA (-MultiObjective Evolutionary Algorithm). Cet algorithme propos

dans [Deb 2003] se rapproche de SPEA, avec lintgration du principe d-dominance.
Ainsi, tout comme avec IBEA que lon verra plus loin [Zitzler 2004], lide est denrichir la notion de rang en y ajoutant la notion de diversit. Lespace de recherche
est dcoup en sous-espaces, dfinis comme des hyper-boites, comportant chacun au
97
plus une solution. Ce principe permet de garantir une bonne couverture de lespace
de recherche.
L encore deux populations voluent paralllement. La population P pour lalgorithme gntique lui-mme, et la population archive A pour stocker les solutions
non-domines rencontres. A chaque itration deux individus a et p sont slectionns, respectivement de A et P , et sont utiliss pour crer k enfants ci , avec i = 1...k.
On notera que la slection de a se fait alatoirement alors que pour p un tournoi
binaire est utilis.
Les enfants ci ont la possibilit dintgrer les deux populations, selon des critres
diffrents. Le critre retenu pour intgrer P est la dominance au sens de Pareto. Par
contre pour intgrer larchive le critre est plus slectif : cest l-dominance qui est
utilise.
Ds lors on distingue trois cas pour lintgration de ci dans P :
si ci domine au moins une solution de P , elle remplace dans P alatoirement
une des solutions domines
si ci est domine par au moins une solution de P , elle est rejete
sinon, ci remplace une solution de P choisie alatoirement
De mme on distingue trois cas pour lintgration de ci dans A :
si ci domine au moins une solution de A, elle remplace dans A toutes les
solutions domines
si ci est domine par au moins une solution de A, elle est rejete
sinon, ci remplace une solution de A choisie alatoirement
SEEA (Simple Elitist Evolutionary Algorithm) propos par [Liefooghe 2010] est
une approche gntique qui ne ncessite pas de fixer de paramtres. Elle est particulirement adapte pour rsoudre des problmes pour lesquels lvaluation des
solutions ne demande que peu de temps. Dans ce cas, elle prsente lavantage de
converger rapidement.
Dans cette approche les parents sont directement issus de larchive A. Il ny
a donc pas dautres populations que larchive. A chaque gnration, N solutions
de A sont choisies alatoirement. Elles fournissent les parents pour y appliquer les
oprateurs de croisement et de mutation.
Les enfants ci obtenus sont intgrs larchive selon le critre de dominance :
si ci est domin par un lment de A, il est rejet
si ci domine des solutions de A, il remplace dans A toutes les solutions domines
sinon ci est intgr A
98
3.3.4.2
Les approches base de recherche locale
Contrairement aux AG trs rpandus pour rsoudre des MOP, les recherche locales sont plus rares, du moins pour ce qui est des approches Pareto. En effet, comme
nous lavons vu la notion mme de Pareto suppose de considrer une population ce
qui la rend particulirement adapte aux AG. Mais il est tout de mme possible
deffectuer une recherche locale, donc solution unique, sur la base dune relation
de dominance, donc par rapport une population.
Les recherches locales, dans leur mode de fonctionnement, requirent une structure de voisinage.
Dfinition 17 (Structure de voisinage) Une structure de voisinage N est une
fonction de X 2N qui, toute solution x X, attribue un certain nombre de
solution N (x) X. De fait, N (x) est le voisinage de x, x0 N (x) est un voisin de
x.
Les approches par transformation dun MOP en problme mono-objectif prsentes en section 3.3.2 peuvent tre utilises conjointement larchivage des solutions non-domines rencontres. De ce fait on pourra faire voluer la recherche locale
mono-objectif en fonction de la construction de larchive. Par exemple, les poids permettant de combiner les fonctions objectif dans la mthode par agrgation peuvent
tre fixs pour permettre la recherche de sloigner de larchive dj constitue.
Nous nous focaliserons ici uniquement sur les recherches locales qui intgrent la
notion de dominance. Il sagit de la classe de problmes appele dans [Liefooghe 2012]
DMLS (Dominance-based Multiobjective Local Search).
Les approches de type DMLS prsentent la caractristique commune de reposer
sur une archive de solutions non-domines que lon cherche amliorer. Dune faon
gnrale, lide est de considrer les solutions de larchive, dexplorer leurs voisinages,
et de mettre jour larchive avec les nouvelles solutions non-domines rencontres.
Larchive est donc ici de taille variable. Lalgorithme sarrte spontanment lorsquil
ne reste plus de solution de larchive avec de nouveau voisin non-domin.
PLS (Pareto Local Search) [Paquete 2004] a une archive A qui est initialise avec
une premire solution alatoire, marque comme non-exploite. A chaque itration,
une solution s A est choisie alatoirement parmi les solutions non-exploites.
Le voisinage complet de s est alors explor, toutes les solutions s0 V (s) sont
candidates pour lintgration larchive. Si aucune solution de A ne domine s0 , s0
est ajoute A. Toute solution de A domine par s0 est alors retire de larchive.
Cette recherche locale particulirement rpandue pour aborder les MOP est uti-
99
lise dans le chapitre 4. Elle servira de rfrence pour rsoudre un problme de

localisation de stations dauto-partage. Aussi nous dtaillons dans lalgorithme 2
son fonctionnement.
Algorithm 2 PLS
1: t 0
2: st GenerateInitSol() /*init the solution st with a random individual */
3: A {st }
4: repeat
5:
for all s0t Neighborhood(st ) do
6:
eval(s0t )
7:
if s0t is not dominated by any r A then
8:
A UpdateArchive(s0t ) /*add s0t in A and remove all dominated solutions*/
9:
end if
10:
end for
11:
mark st as explored
12:
tt+1
13:
st select(A) /*select randomly a not explored solution from A */
14: until all solutions in A are explored
PAES (Pareto Archived Evolution Strategy) [Knowles 1999] prsente une recherche
locale relativement diffrente de PLS. L encore une solution initiale est gnre alatoirement, value pour chaque objectif, et intgre larchive A. lci larchive est
de taille borne. A chaque cycle lalgorithme choisit une solution s A, la recopie
dans s0 , puis applique un oprateur de mutation s0 . A ce titre cet algorithme est
parfois class dans la famille des AG. Toutefois il ny a ni croisement, ni slection
de parents. En fait la mutation dfinit loprateur de la recherche locale. Il y a alors
une comparaison entre s et s0 .
Si s0 domine s, elle la remplace dans A. Si s domine s0 , s0 est rejete. Par contre si
s et s0 sont non-comparables, s0 est compare larchive. Si elle domine une solution
de A elle est intgre. Si elle est domine par une solution de A elle est rejete. Sinon
(il sagit dun meilleur compromis), lintroduction ou non dans larchive se fait sur
la base dune hyper-grille, de faon favoriser la diversit de larchive.
3.3.4.3
Optimisation base dindicateur
Les approches base dindicateur constituent incontestablement une des orientations phare de ces dernires annes. Alors que les indicateurs sont souvent utiliss
pour valuer le niveau de performance des ensembles de solutions (cf section 3.4),
ici ils sont incorpors au sein mme de lalgorithme. Les approches de ce type sont
100 Chapitre 3. Optimisation combinatoire multiobjectif : tat de lart

particulirement apprcies car elles permettent de prendre en compte, dans les
mcanismes de la recherche, les prfrences de lutilisateur. Parmi les heuristiques
base dindicateur, il existe des approches gntiques ou locales. Nous les avons
toutefois regroupes dans une section part en raison de leur originalit.
IBEA (Indicator Based Evolutionary Algorithm) propos par [Zitzler 2004] est
un algorithme volutionnaire base dindicateur. Jusque-l nous avons vu des approches gntiques bases sur des oprateurs de ranking qui taient trs efficaces en
matire dintensification, mais qui ncessitaient des mcanismes complmentaires
pour bien grer la diversit des solutions. Ici le problme est rgl en considrant
un indicateur binaire I. Il est dfinir en fonction des orientations donner
lalgorithme, pour quilibrer selon les besoins les phases dintensification et de diversification. I reprsente ainsi le but global que lon souhaite viser. Il permet de
dterminer pour chaque solution x de la population P ce quelle apporte pour atteindre cet objectif. De ce fait la fitness F (x) attribue x correspond la perte de
qualit quengendrerait son absence, plus F (x) est grande plus x a de limportance
dans la population. La formulation de F (x) retenue dans IBEA est :
F (x) =
eI(x ,x)/k
(3.12)
x0 P \{x}
avec : k un facteur dchelle.

Loprateur de slection des parents est un tournoi binaire bas sur la fitness
F . Aprs gnration des enfants, la population est rduite pour retrouver sa taille
initiale N . Cette rduction se fait par suppression successive des plus mauvais individus, avec mise jour des valeurs de fitness aprs chaque suppression.
Bien que la mthode nimpose pas dindicateur particulier, dans [Zitzler 2004]
est propos lindicateur -additif :
I+ (z, z 0 ) =
max {zi zi0 }
i{1,...,n}
(3.13)
Cet indicateur calcule ainsi la translation minimale ncessaire pour que z domine
faiblement z 0 . Un autre indicateur est galement propos : lindicateur hypervolume
diffrentiel IHD [Zitzler 1999]. Mais il est noter que tout autre indicateur peut tre
utilis selon leffet recherch.
IBMOLS (Indicator-Based evolutionary Multi-Objective Local Search) sappuie

sur la mthode IBEA [Zitzler 2004] pour dfinir une recherche locale base dindi-
101
cateur, celui-ci ntant pas impos par lalgorithme. Cest donc chacun de dfinir,
selon le but atteindre, lindicateur appropri.
IBMOLS prend en entre un indicateur I et une population initiale P de taille k
(qui peut tre compose de k solutions alatoires). A chaque itration, le voisinage
complet de toutes les solutions de P est explor. Tous les voisins sont candidats
lintgration dans P . Les solutions non-domines par P y sont ajoutes. Les solutions
de P domines par une solution nouvellement intgre sont supprimes. A ce stade
la taille de la population peut avoir considrablement grossi. Une rduction de P est
ralise en retirant successivement la solution ayant la plus mauvaise contribution
au sens de lindicateur. Cette rduction est faite jusqu ce que P soit nouveau de
taille k.
Lalgorithme IBMOLS sarrte spontanment lorsquaucun voisin de larchive
ne peut plus tre ajout. Les auteurs prcisent que cet algorithme dcrit un cadre
gnral, mais quil est possible de dfinir des variantes.
Approches base de lindicateur hypervolume Parmi les indicateurs actuellement trs utilis, lindicateur hypervolume ressort tout particulirement. Dans
[Brockhoff 2008], une analyse approfondie de ces approches est propos. On renverra
notamment SMS-EMOA [Beume 2007]. Dans cet AG, loprateur de slection est
bas sur lindicateur hypervolume (maximisation de lhypervolume domin) combin
un tri selon la non-domination. On trouvera galement lapproche MO-CMA-ES
(MultiObjective-Covariance Matrix Adaptation-Evolution Strategy) [Igel 2007], qui
sappuie sur lalgorithme mono-objectif CMA-ES [Hansen 2001]. Enfin [Zitzler 2007]
propose une mthodologie permettant de dfinir une mesure de la qualit qui sappuie sur la mesure de lhypervolume.
3.3.5
Les approches hybrides
Afin de rsoudre un MOP, nous avons prsent jusqu prsent les mthodes
par transformation dun problme mono-objectif, les mthodes dvolution parallle, galement appeles non-Pareto, et les approches Pareto bases sur la relation
de dominance. Ces approches dites "pures" ont t les seules mtaheuristiques dveloppes jusque dans les annes 1990. Les premire approches hybrides apparurent
cette poque. Elles consistent incorporer lintrieur dun de ces algorithmes
des lments provenant dune autre mthode. De ce fait elles ont la particularit
de fournir des algorithmes pouvant appartenir une des classes prsentes, mais
aussi ventuellement plusieurs. De plus il est galement possible de coupler une
approche de type heuristique avec une mthode exacte.
Avec les approches base dindicateurs, les approches hybrides connaissent au-

jourdhui un vritable attrait. En effet, lhybridation dheuristiques a montr dans
le contexte mono-objectif les amliorations quelle pouvait apporter, et maintenant
galement pour aborder les MOP. Lorsque lhybridation consiste intgrer une
recherche locale lintrieur dun algorithme gntique, souvent la place de loprateur de mutation, mais pas ncessairement, on parle dalgorithmes mmtiques.
Dans le chapitre 4 un algorithme de ce type sera propos.
Dans cette section nous listons uniquement les classes de modles rencontres et
connues pour tre efficaces. Le livre [Talbi 2013] consacre notamment un chapitre
ce sujet. Nous suivrons la classification que Talbi propose.
3.3.5.1
Low-Level Relay Hybrids (LRH)
Seules quelques hybridations de ce type existent. Il sagit ici dincorporer une

mtaheuristique dans une S-mtaheuristique (mtaheuristique base de solution
unique telle une recherche locale). Comme nous lavons vu plus haut, les approches
base de solution unique ne sont pas bien adaptes la rsolution dun MOP qui
admet un ensemble de solutions. Aussi ce type dhybridation nest pas souvent utilis
3.3.5.2
Low-Level Teamwork Hybrids (LTH)
Ici au contraire une mtaheuristique est intgre dans une P-mtaheuristique

(mtaheuristique base de population tel un AG). Il sagit de lhybridation la plus
utilise. En effet, comme nous lavons vu dans la section 3.3.4, les approches
base de population telles que les approches Pareto prsentent le rel avantage de
considrer la population complte lors de la recherche. Elles ont toutefois le dfaut
de leur qualit : elles convergent plus lentement que les S-mtaheuristiques. Ainsi
lhybridation LTH vise rassembler les avantages des P-mtaheuristques et des Smtaheurisiques au sein dun mme algorithme, les premires apportant la diversit
alors que les deuximes apportent lintensit.
Les S-mtaheuristiques utilises dans ce cadre peuvent tre de diffrentes natures,
allant de la recherche locale au recuit simul, en passant par une Recherche Tabou.
Les algorithmes mmtiques sont donc de cette nature.
Parmi les plus connus on rencontre [Ishibuchi 1998]. Il sagit dun AG par transformation du MOP en mono-objectif par agrgation. Sa particularit est que le
vecteur de poids servant lagrgation est gnr alatoirement et pour chaque slection de parents. Ainsi deux parents ne sont pas slectionns sur la base de la
mme fonction agrge. Par la suite une recherche locale sur un voisinage rduit est
applique chaque enfant.
103
On citera galement [Jaszkiewicz 2002] qui repose sur un mcanisme particulier.

A chaque itration une fonction dutilit Ft est construite alatoirement. Elle permet
de slectionner une sous-population compose des meilleurs individus au sens de
cette dfinition de la fitness. Cest sur cet ensemble quest appliqu lAG. Chaque
enfant est alors intensifi par une recherche locale.
Dans [Basseur 2003] une approche hybride est elle-mme hybride avec un AG.
En fait cela se fait sous la forme dune alternance entre une phase dAG (utilisant
une mutation adaptative), suivi dune phase mmtique.
Enfin une gnralisation des approches mmtiques est propose dans [Talbi 2001],
o plusieurs stratgies de slection et de maintien de la diversit sont prsentes.
3.3.5.3
High-Level Relay Hybrids (HRH)
Ces approches reposent sur une succession de mtaheuristiques. Il y a ainsi une

alternance de diffrentes mthodes, ce qui permet de faire ressortir plusieurs comportements. Souvent les HRH sont composes dune phase dintensification avec une
S-mtaheuristique, suivie dune phase de diversification avec une P-mtaheuristique.
3.3.5.4
High-Level Teamwork Hybrids (HTH)
Les algorithmes considrs ici reposent galement sur plusieurs mtaheuristiques

mais qui voluent en parallle tout en cooprant. En effet, nous voyons bien que les
processeurs on tendance stagner en vitesse de calcul. Les principales marges de
progression concernent la mise en parallle de plusieurs units de calcul. Cela peut
se faire plusieurs niveaux, en faisant cooprer des machines sous forme de clusters,
en faisant cooprer les units de calcul dune mme machine, ou encore en utilisant
les coeurs massivement parallliss des GPU (Graphics Processing Unit) en ayant
recours au GPGPU (General-purpose processing on graphics processing units).
Le domaine de la recherche oprationnelle tant souvent gros consommateur
en ressources de calcul, et donc en temps, la paralllisation des calculs constitue un
vaste champ dexploration. Lintgration du GPGPU dans la plate-forme ParadisEO
[Melab 2013] au travers de lenvironnement ParadisEO-MO-GPU en tmoigne.
3.4
Evaluation des algorithmes multiobjectifs : une approche base dindicateurs
Nous lavons vu, une des principales sources de difficult lorsque lon aborde un
MOP vient du fait que le problme admet potentiellement un trs grand nombre de
solutions. Cest une difficult pour rsoudre le problme doptimisation et pour valuer le niveau de performance dun algorithme travers lvaluation de lensemble
des rsultats. Alors quen mono-objectif lefficacit dun algorithme dcoule immdiatement de lvaluation de la solution gnre, lors de la rsolution dun MOP ce
nest gnralement pas le cas. Prenons deux ensembles A et B, les seuls cas triviaux
sont lorsque toutes les solutions de A sont domines par des solutions de B ou inversement. Dans tous les autres cas, o des solutions de A sont non-domines par
des solutions de B ou des solutions de B sont non-domines par des solutions de
A, il apparait difficile de dterminer quel ensemble est le meilleur, cest--dire quel
ensemble apporte les solutions les plus intressantes. Le recours des indicateurs de
performance est donc primordial.
On distinguera deux types dindicateurs : les indicateurs unaires (ou absolus),
capables dattribuer directement une note un ensemble, et les indicateurs binaires
(ou relatifs), qui prennent deux ensembles en paramtres et attribuent une note
un ensemble par rapport un autre. Nous prsentons les indicateurs principaux de
la littrature.
3.4.1
Indicateur de contribution
Il sagit peut-tre de lindicateur le plus intuitif. Lindicateur binaire de contribution [Meunier 2000], gnralement not IC (A, B), dtermine quel ensemble de A
ou B apporte le plus de solutions non-domines par lautre ensemble. Il rejoint la
mtrique C propose par [Zitzler 1999] peu de temps avant.
Plus formellement IC (A, B) revient calculer :
IC (A, B) =
|AB|
2
+ |WA | + |NA |
|N D(A B)|
(3.14)
avec : WA lensemble des solutions de A qui dominent au moins une solution de

B et NA lensemble des solutions de A non-comparables avec B.
Llment particulirement intressant avec cet indicateur est que IC (A, B) +
IC (B, A) = 1 et si A = B alors IC (A, B) = IC (B, A) = 0.5. De plus il est rapide
calculer. On notera galement que plus A est bon, plus lindicateur IC (A, B) est
lev.
3.4. Evaluation des algorithmes multiobjectifs : une approche base

dindicateurs
105
Par contre comme nous le montrerons dans le chapitre 4, IC nest pas un bon
marqueur de la diversit.
3.4.2
Indicateur -additif
Cet indicateur binaire propos dans [Zitzler 2003] est particulirement intressant. Il dtermine la translation minimale appliquer toutes les solutions de A,
et sur tous les objectifs, pour dominer B. Formellement a revient calculer :
I+ (A, B) = min{x B, x0 A : x + x0 }
R
(3.15)
Lintrt de I+ est de reflter la qualit dun ensemble par rapport un autre

en terme dintensit dabord, mais galement en terme de diversit. Ici plus I+ est
petit, meilleur est lensemble A par rapport B.
Remarques :
1) Pour que cet indicateur ait un sens il est indispensable de normaliser les
fonctions objectif. En effet, si lobjectif f1 prend ses valeurs dans lintervalle [0, 10]
et lobjectif f2 dans lintervalle [0, 1000], les variations de f1 seront crases par
celles de f2 .
2) Si une seule solution de B domine assez nettement A et que toutes les autres
solutions de B sont lgrement domines par A, alors B sera considr comme
meilleur. Cela revient dire que cet indicateur considre la translation du pire des
cas. Une variante qui semble intressante serait de considrer la translation moyenne
appliquer.
3.4.3
Indicateur hypervolume
Il sagit dun indicateur incontournable depuis sa proposition par [Zitzler 1999].

Lindicateur hypervolume IH prsente en effet lavantage de reflter la qualit dun
ensemble, tant en terme dintensit que de diversit.
Cet indicateur connait deux variantes, une version unaire et une version binaire.
La version unaire de cet indicateur permet de fournir, pour un ensemble de solutions,
son niveau de qualit sans ncessiter le recours un ensemble de rfrence. Toutefois
deux conditions sont indispensables une bonne interprtation :
de disposer dune normalisation des objectifs pour quun objectif ne soit pas
sur-reprsent ou sous-reprsent, tout comme avec lindicateur -additif
didentifier un point de rfrence pour le calcul de lhypervolume

La version binaire permet, par diffrence, de dterminer ce quapporte un ensemble et qui nest pas apport par un autre ensemble.
La version unaire nous intressera tout particulirement puisque cest elle qui
est utilise dans le chapitre 4.
La Figure 3.8 illustre ce que reprsente lhypervolume, ramen une surface dans
le cas dun problme bi-objectif. Dans cet exemple dun problme de maximisation
le point de rfrence est ramen lorigine du repre. Il peut toutefois tre pris
ailleurs. Il peut tre dfini comme le point nadir dun ensemble de rfrence, point
virtuel constitu de la moins bonne valeur sur chaque objectif des de lensemble.
Figure 3.8 Indicateur hypervolume IH
Lindicateur IH est particulirement utilis aujourdhui en raison de son niveau

de pertinence pour reprsenter la qualit dun ensemble, autant en diversit quen
intensit. Par contre, il prsente le gros dsavantage dtre complexe calculer : ds
que le nombre dobjectifs et de solutions est important, il ncessite un temps de
calcul significatif. Plusieurs algorithmes ont t proposs dans la littrature, dont
des mthodes dapproximation, pour acclrer rellement les calculs.
Cet indicateur que nous utilisons dans le chapitre 4 est calcul de faon exacte
en utilisant lalgorithme HSO (Hypervolume by Slicing Objectives) [While 2006].
Lalgorithme 3 prsente les tapes principales de HSO.
3.4. Evaluation des algorithmes multiobjectifs : une approche base

dindicateurs
107
Algorithm 3 HSO : Hypervolume by Slicing Objectives
Require: ps /*ps is a Pareto set*/
Require: n /*the number of objective functions*/
1: pl sort(ps, 1) /*sort ps worsening on objective 1 */
2: s {(1, pl)} /*the ordered Pareto set pl has level 1 */
3: for k 1 to n 1 do
4:
s0 {}
5:
for each (x, ql) in s do
6:
/*at first loop ql contains pl, at second loop ql contains successively each
slice as described in Figure 3.9, and so on... */
7:
for each (x0 , ql0 ) in slice(ql, k) do
8:
/*each set is sliced for the next level and added into s0 */
9:
add(x x0 , ql0 ) into s0
10:
end for
11:
end for
12:
s s0
13: end for
14: vol 0
15: for each (x, ql) in s do
16:
vol vol + x |head(ql)[n] ref P oint[n]|
17: end for
18: return vol
La fonction slice prend une liste pl de points pour les objectifs k...n et renvoie
un ensemble de listes de points issus de pl pour les objectifs k + 1...n. La Figure 3.9
illustre cette dcomposition. La liste des solutions a, b, c, d est trie par ordre dcroissant selon laxe des x (objectif f1 ). On aperoit en-haut de la figure gauche
lhypervolume total. La construction de la premire tranche slice1 est ralise partir de a jusqu b (sur laxe des x). Elle est reprsente en-bas droite. La deuxime
tranche part de b et de la projection de a dans le plan normal f1 contenant b, jusqu c. Lalgorithme continue partir du plan contenant c jusquau plan contenant
d, puis du plan contenant d jusquau plan contenant le point de rfrence.
Ce mcanisme est appliqu nouveau mais selon laxe y (objectif f2 ). Il permet
de dcomposer chaque ensemble de points issu de la dcomposition selon f1 .
Figure 3.9 Dcomposition dhypervolume de dimension 3 par HSO (extrait de

[While 2006])
3.4.4
Indicateur de distance gnrationnelle
Cet indicateur binaire ncessite un ensemble de rfrence, dfinissant le but

atteindre. Dans le meilleur des cas cet ensemble de rfrence est lensemble Pareto
optimal ce qui nest videmment jamais le cas lorsque lon aborde des problmes
rels.
Lindicateur de distance gnrationnelle IG propos dans [Collette 2002] est dcrit de la faon suivante :
n
X
IG (A, B) =
!1/p
dpi
i=1
(3.16)
avec : n le nombre dlments de A et di la distance entre la i-me solution de

A et la solution de B la plus proche. On notera que gnralement on choisi p = 2,
soit la distance euclidienne.
3.5
Synthse
Dans ce chapitre ont t prsents les nombreux concepts permettant dapprhender la rsolution dun problme multiobjectif (MOP). La complexit que soulve
cette classe de problme impose en effet de dfinir une formalisation mathmatique
approprie, ainsi que des mthodes de rsolution efficaces.
Dans un premier temps, nous avons prsent les principales notions impliques
dans la rsolution dun MOP. En particulier la notion de Pareto optimalit apparait
3.5. Synthse
109
comme un lment essentiel de cette classe de problme. En effet, les objectifs

optimiser tant gnralement contradictoires (lamlioration de f1 se fait souvent
au dtriment de f2 ), le rsultat dun MOP est constitu dun ensemble de solutions
de meilleur compromis. Labsence dordre total entre les solution fait apparaitre la
relation de dominance, qui a t dtaille dans cette premire partie.
Aprs avoir dfini ces notions de base, nous avons propos un inventaire des
mtaheuristiques les plus couramment utilises. Nous avons ainsi identifi quatre
classes de mthode.
La premire classe consiste transformer le MOP en problme mono-objectif.
Par exemple, la mthode par agrgation des fonctions objectif selon une pondration choisie est souvent utilise pour rduire lensemble des fonctions objectif en
une seule. Cette transformation modifie le problme initial en le simplifiant. Lapparition dune seule fonction objectif optimiser prsente lavantage de permettre
lutilisation des heuristiques classiques, disponibles en contexte mono-objectif. Toutefois cette approche soulve un problme essentiel, elle ne reflte pas la diversit
des solutions situes dans le front de Pareto.
La deuxime classe de mthode que nous avons prsente concerne les approches
non-Pareto. Il sagit dheuristiques considrant toutes les fonctions objectif mais
sparment les unes des autres. Lalgorithme gntique VEGA [Schaffer 1985] en est
une illustration. Par rapport aux mthodes de la classe prcdente, les approches
non-Pareto permettent dexplorer une plus grande partie de lespace de recherche.
Elles ont toutefois tendance, en optimisant une fonction objectif la fois, pnaliser
les solutions de compromis.
La troisime classe concerne les approches Pareto. Il sagit dheuristiques qui
sappuient sur la relation de dominance entre les solutions. Elles visent ainsi
construire le meilleur ensemble de solutions toutes non-domines entre elles. La
prise en compte simultane des fonctions objectif permet une trs bonne exploration de lespace de recherche. Parmi ces approches de type Pareto, les algorithmes
gntiques tel que NSGA-II [Deb 2002] ou SPEA-II [Zitzler 2001] tiennent une place
importante. Mais les travaux les plus rcents concernent des heuristiques base dindicateur. SMS-EMOA [Beume 2007] propose par exemple une approche gntique
base sur lindicateur hypervolume.
La quatrime classe prsente dans ce chapitre est la classe des approches hybrides. Elles ont la particularit de combiner des mthodes issues des classes prcdentes afin de bnficier des avantages de chacune. Selon le type dheuristiques
combines, et la faon dont elles le sont, quatre familles dapproche hybride ont t
prsentes. Le niveau de performances des heuristiques hybrides se rvle tre en
gnral trs bon.
Enfin, la dernire partie de ce chapitre concerne lvaluation des algorithmes dans

le domaine des MOP. En effet, le fait de disposer dun ensemble de solutions, avec
une valuation diffrente sur chaque objectif, rend la comparaison des algorithmes
dlicate. Les approches base dindicateur rpondent cette problmatique, les
principales tant dcrites dans ce chapitre. Nous avons prsent notamment lindicateur hypervolume qui rend bien compte de la performance tant en intensit quen
diversit dun ensemble.
Comme nous lavons vu, lorsque lon aborde un MOP, les approches hybrides
fournissent de trs bons rsultats. En particulier, pour traiter un problme combinatoire de grande taille, elles permettent souvent datteindre un ensemble de solutions
non-domines de bonne qualit, tant en diversit quen intensit, dans un temps fix.
Le chapitre suivant propose une telle approche hybride, base de recherche locale
et dalgorithme gntique, applique loptimisation de limplantation de stations
pour un service dauto-partage lectrique qui est modlis sous la forme dun MOP.
Lalgorithme hybride propos, appel MEMO pour Memetic Evolutionary MultiObjective, sera compar des approches gntiques et locales classiques.
Chapitre 4
Algorithmes mmtiques et
optimisation multiobjectif
Ce chapitre est consacr llaboration dune mtaheuristique multiobjectif hybride. Elle a t exprimente sur un problme rel de localisation de stations pour
un service dauto-partage.
Dans un premier temps, une prsentation des caractristiques propres aux algorithmes mmtiques est faite. Ensuite, nous dtaillons llaboration et le fonctionnement de lalgorithme propos MEMO. La troisime partie de ce chapitre traite dun
cas dtude : la localisation de stations dauto-partage. Dans cette partie est prsent
le problme, ainsi que sa modlisation sous la forme dun problme multiobjectif. La
partie suivante fournit une analyse comparative dtaille entre les approches de rfrence NSGA-II, PLS et FLSMO, et lalgorithme MEMO. Enfin une dernire partie
aborde le problme de laide la dcision en contexte multiobjectif, avec la proposition de la plate-forme logicielle geoLogic.
Sommaire
4.1
Introduction
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2
Schma directeur dun algorithme mmtique . . . . . . . . 113
4.3
MEMO : un algorithme mmtique multiobjectif . . . . . . 117
4.4
Optimisation applique la planification urbaine : localisation de stations dauto-partage . . . . . . . . . . . . . . . . 125
4.5
Application de lalgorithme mmtique MEMO . . . . . . . 134
4.6
De loptimisation laide la dcision multiobjectif . . . . 157
4.7
Synthse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
112 Chapitre 4. Algorithmes mmtiques et optimisation multiobjectif
4.1
Introduction
Aprs avoir prsent un tat de lart des approches permettant de rsoudre des
problmes multiobjectifs (Multiobjective Optimization Problem - MOP), puis la
faon de modliser la manire dont les personnes se dplacent sur un territoire, nous
nous attachons dans ce chapitre dfinir une heuristique de type mmtique pour
rsoudre des problmes multiobjectifs. Le cas dtude retenu ici est la localisation de
stations pour un service dauto-partage, problme mlant modlisation de la mobilit
et optimisation.
Lquation 4.1 rappelle la formulation gnrale dun problme multiobjectif dj
prsente en section 3.2.2 :
z = f (x)
max
(4.1)
M OP
o
f (x) = (f1 (x), f2 (x), ..., fn (x))
tel que : x X
Parmi les nombreuses difficults que posent les MOP, une des principales est lie
au fait que cette classe de problmes donne lieu une varit de solutions. En effet,
il existe rarement une solution optimale unique, qui soit la meilleure sur tous les
objectifs. Le rsultat est donc un ensemble de solutions, dites de meilleur compromis. Ds lors il apparait indispensable de distinguer deux tapes dans la rsolution
dun MOP : la construction de lensemble des solutions non-domines (processus
doptimisation multicritre) puis le choix de la solution retenir (processus daide
la dcision multicritre). Dans ce chapitre nous nous focaliserons dans un premier
temps sur la construction de lensemble Pareto [Coello 2004], ensemble qui a pour
image dans lespace des critres le front de Pareto (Pareto Front - FP). La faon
daider le dcideur choisir la solution implmenter fait lobjet de la fin de ce
chapitre.
Les approches de type hybride tel que les algorithmes mmtiques ont dj fait
leurs preuves dans le domaine mono-objectif en permettant de rsoudre de nombreux problmes. Le concept mme de mmtique fut introduit par Pablo Moscato [Moscato 1989] pour parler dune heuristique base de population incluant
une recherche locale. Parmi les problmes o lapproche mmtique fournit de trs
bon rsultats, on citera lexemple du problme acadmique de coloriage de graphe,
connu pour tre trs difficile, et qui est rsolu avec de trs bonnes performances
[Galinier 2013].
Les rsultats obtenus par les approches mmtiques en mono-objectif ont incit
les chercheurs transposer ce mcanisme dhybridation au contexte multiobjectif
[Talbi 2001][Jaszkiewicz 2002]. Le mcanisme consistant introduire une recherche
locale dans un algorithme gntique (AG) est alors gnralement utilis pour acclrer le droulement de lalgorithme, mais pas uniquement. Lhybridation joue ga-
4.2. Schma directeur dun algorithme mmtique
113
lement un rle dans la faon dexplorer lespace de recherche ; le but tant de fournir
de nouvelles proprits permettant damliorer lensemble des solutions trouves.
En effet les AG utiliss seuls ont souvent tendance faire progresser la population
dans certaines rgions de lespace de recherche, ce qui a pour consquence de crer
des clusters. Lintroduction de la recherche locale permet quant elle de se focaliser
sur une direction, souvent choisie vers le front de Pareto (meilleure intensification),
mais parfois aussi de faon obtenir une meilleure rpartition sur le font de Pareto
(meilleure diversification). La recherche locale dans un AG permet ainsi de guider
la progression de la population pour garantir les proprits souhaites. Ds lors
que sont hybrides deux mtaheuristiques, recherche locale et algorithme gntique,
connues pour tre trs performantes toutes les deux, se pose la question de lapport
de chacune delles. Aussi nous nous intresserons galement dans ce chapitre identifier si, travers lhybridation, lalgorithme mmtique bnficie des avantages de
chaque mtaheuristique, ou si de nouvelles proprits sont engendres.
Nous prsenterons tout dabord le principe fondateur des algorithmes mmtiques. Dans une deuxime partie, lalgorithme hybride MEMO que nous proposons
sera dtaill. Ensuite nous introduirons le problme auquel nous avons appliqu lalgorithme MEMO, un problme de localisation de stations pour un service dautopartage de type autoLib. La section suivante sera consacre une comparaison
entre les rsultats obtenus avec lapproche hybride et les rsultats issus de mtaheuristiques pures, que ce soit des approches gntiques ou des recherches locales. Enfin,
une dernire partie introduira le problme de laide la dcision dans un contexte
multiobjectif, avec une prsentation de la plate-forme geoLogic.
4.2
Schma directeur dun algorithme mmtique
Un algorithme mmtique, dans un contexte multiobjectif, sattache construire

le "meilleur" ensemble de solutions non-domines. Dans le cas gnral la notion
densemble Pareto est alors utilise pour faire rfrence lensemble des solutions
ralisables non-domines, couvrant la totalit de lespace de recherche. Or dans la
plupart des cas, ds lors que lon a faire un problme combinatoire rel, un tel
ensemble compos de toutes les solutions non-domines sur la totalit de lespace
de recherche nest pas connu et ne peut tre connu. Aussi par abus de langage
nous parlerons par la suite de front de Pareto pour dcrire lensemble des solutions
non-domines connues un moment donn de lexcution dun algorithme.
Selon la littrature plusieurs acronymes sont utiliss pour parler dalgorithmes
mmtiques en contexte multiobjectif. Nous retiendrons le terme de MOGLS (MultiObjective Genetic Local Search) utilis notamment par Talbi dans [Talbi 2013].
Le droulement dun MOGLS sarticule autour des deux principaux oprateurs :
loprateur volutionnaire, source dexploration, et la recherche locale, garantissant

lintensification. Lalgorithme 4 dcrit ce fonctionnement gnral.
Algorithm 4 Algorithme mmtique gnrique MOGLS
by a time limit or any termination condition*/
1: P0 init(N ) /*init population P with N random individuals*/
2: P00 /*init an empty children population*/
3: eval(P0 ) /*eval objectives for each individual */
5:
Select Pi0 from Pi1 based on fitness value
6:
Apply genetic operator on Pi0 Pi00
7:
Apply local search on Pi00 Pi000
8:
eval(Pi00 , Pi000 )
9:
Select Pi from (Pi1 Pi00 Pi000 )
10: end for
La faon dont intervient la recherche locale dans lAG peut varier selon les approches. Ainsi la recherche locale peut, comme souvent la mutation, survenir alatoirement avec une certaine probabilit, ou encore aprs un certain nombre de gnrations. Mais il est galement possible de lappliquer chaque nouvel individu rsultant
dun croisement. Lquilibre entre recherche globale (gntique) et recherche locale
est primordial pour obtenir de bons rsultats.
4.2.1
La recherche locale dans un contexte multiobjectif
De nombreuses heuristiques permettent deffectuer une recherche locale dans

un contexte multiobjectif. Un aperu des possibilits est donn dans le chapitre 3.
En particulier les recherches locales de type Pareto DLMS (Dominance-Based Local
Search Approaches for Multiobjective Combinatorial Optimization) [Liefooghe 2012]
fournissent de trs bons rsultats. On retrouve ainsi parfois ces approches dans des
algorithmes mmtiques. Par exemple PAES est adapt pour donner lalgorithme
mmtique M-PAES [Knowles 2000]. Toutefois lorsque la recherche locale est associe un algorithme volutionnaire, il est possible denvisager une recherche locale
plus simple, tant en termes dimplmentation que dexcution. En effet une recherche
locale simple peut tre rendue trs performante ds lors quon y ajoute des mcanismes gntiques. Ainsi la version la plus simple consiste considrer successivement chaque objectif, sans tenir compte des autres objectifs. Mais il est possible de
complexifier les traitements en prenant en compte lensemble de la population pour
orienter la recherche locale vers le front de Pareto ou pour favoriser certaines proprits de la population. En particulier dans le cas dune optimisation avec a priori
sur le type de solutions souhaites, le dcideur peut choisir de focaliser la recherche
dans un sous-espace de lespace de recherche complet.
4.2. Schma directeur dun algorithme mmtique
115
La recherche locale est susceptible de fournir un certain nombre de nouvelles

solutions non-domines par la population. Se pose alors la question de savoir ce
qui doit tre fait de ces solutions non-domines. Elles sont dune part archives
pour tre retournes par lalgorithme la fin de lexcution, mais quen est-il de
leur introduction dans la population courante ? Dans certains travaux elles sont
toutes intgres la population. Mais cela risque trs vite de poser des problmes
de diversit de la population. Aussi dautres approches introduisent des critres
complmentaires, tels que lajout de la dernire solution trouve uniquement. Ou
encore des mthodes imposent une distance minimale avec les solutions prsentes
dans la population pour accepter lajout dune nouvelle solution.
Enfin la dure de la recherche locale peut tre un lment variant dune mthode
lautre. Ainsi certains algorithmes ont recours quelques itrations seulement de
recherche locale. Dans dautres cas, la recherche locale se fait de faon complte,
jusqu loptimum local, ou encore jusqu ce que la progression ne soit plus suffisamment significative.
4.2.2
Loprateur gntique dans un contexte multiobjectif
Les nombreuses approches gntiques dfinies dans un contexte multiobjectif

(Multi-Objective Evolutionary Algorithm - MOEA) peuvent tre hybrides avec une
recherche locale. Ainsi les mtaheuristiques souvent utilises seules, telles que SPEA
[Zitzler 2001] ou encore NSGA-II [Deb 2002], se retrouvent galement frquemment
utilises dans des algorithmes mmtiques. Dans leur livre [Coello 2007] Coello et
al. prsentent de faon dtaille un certain nombre dapproches et la faon dont les
MOEA sont utiliss.
Dune faon gnrale le MOEA fournit un cadre permettant la recherche locale
de sappliquer dans un contexte de population. En particulier on retrouve dans tous
les cas les oprateurs de slection, de croisement et de remplacement. La mutation
est sans doute loprateur le plus gnralement remis en cause, puisquil est souvent
remplac par la recherche locale. On retrouve donc un principe trs semblable ce
qui se fait en mono-objectif, avec des oprateurs adapts au contexte multiobjectif.
4.2.3
Lalgorithme mmtique, une recherche locale amliore ?
Aprs avoir vu ce que peuvent tre la recherche locale et loprateur gntique

dans le contexte mmtique, il apparait intressant de sinterroger sur la faon dont
agit chaque oprateur sur le fonctionnement global de lalgorithme. En effet, lhybridation de deux mtaheuristiques connues pour tre trs performantes permet-elle
de bnficier des avantages de chacune ? Ou au contraire est-ce que de nouveaux
comportements apparaissent ?
Table 4.1 Rles des oprateurs selon le type dalgorithme
LS
AG
Mmtique
Recherche Locale
Descente Tabou Recuit
int
div
div
int
div
div
Algorithme volutionnaire
Slec. Crois. Mut. Rempl.
int
int
div
int
int
div
int
int
Pour rpondre ces questions revenons au fonctionnement de chaque mtaheuristique prise sparment afin dtudier leur fonctionnement. En particulier le
point central de tout algorithme doptimisation, que ce soit en mono-objectif ou
en multiobjectif, est la faon dont squilibrent lintensification et la diversification,
concepts galement connus sous les termes dexploitation et dexploration respectivement.
Nous tentons dans le tableau 4.1 une synthse de linfluence des diffrentes composantes des AG et recherches locales, en matire de diversification et intensification. Chaque ligne reprsente une heuristique (Locale, Gntique, Mmtique), et
chaque colonne un oprateur (de la famille des recherches locales gauche et des
AG droite). Les cases contiennent le rle dominant correspondant loprateur
de la colonne pour lalgorithme de la ligne, en matire dintensification (int) et de
diversification (div).
Ainsi dans la recherche locale la descente joue un rle dintensification, alors
que les paramtres de la Recherche Tabou ou du Recuit Simul jouent un rle de
diversification.
De mme dans le cas dun AG, la slection, le croisement et le remplacement
tendent intensifier la population et la mutation la diversifier. Bien entendu ce
tableau nest pas exhaustif mais traduit une tendance gnralement constate. En
particulier il est possible de nuancer linfluence des oprateurs, en introduisant une
certaine dose dalas dans la slection par exemple.
Llment particulirement intressant remarquer est linversion des rles entre
croisement et mutation selon que lon ait faire un AG ou un algorithme
mmtique. En effet, alors que le croisement est loprateur dintensification cl pour
un AG (cest gnralement suite un croisement que de nouvelles bonnes solutions
mergent), il a un rle de diversification dans le contexte mmtique. Inversement la
mutation qui introduit souvent de la diversit en gntique, lorsquelle est remplace
par une descente en mmtique, elle devient un oprateur dintensification.
Ainsi nous sommes tents de considrer quun algorithme mmtique nest ni
plus ni moins quune recherche locale base de population, dans laquelle le croisement joue un rle doprateur de diversification. Ce nest pas le croisement qui
4.3. MEMO : un algorithme mmtique multiobjectif
117
permet de trouver de meilleures solutions mais la recherche locale. Dans un AG en

gnral ce nest pas la mutation qui permet de trouver de meilleures solutions mais
le croisement.
4.3
MEMO : un algorithme mmtique multiobjectif
Dans cette section nous proposons un nouvel algorithme hybride, lalgorithme

Memetic Evolutionary MultiObjective (MEMO). Le fait mme que lalgorithme soit
mmtique fournit une trame gnrale bien identifie, comme nous lavons vu, mais
il reste un certain nombre de caractristiques dfinir :
choix de la recherche locale
choix de loprateur gntique
quelle slection des parents ?
quel croisement ?
quelle gestion de population ? Quelle solution remplacer lors de la mise
jour de population ? Quelles solutions archiver ?
choix de lenchainement de ces deux oprateurs : effectuer une recherche locale
aprs chaque croisement, aprs chaque gnration, ou de faon plus espace
(une fois de temps en temps)
gnration de la population initiale : alatoirement, laide dun algorithme
glouton, etc.
dfinition dun critre darrt : nombre ditrations, temps de calcul, etc.
Par ailleurs les rsultats obtenus dpendront galement fortement dune srie de
paramtres, tels que la taille de la population, et qui seront dfinir.
Rappelons que llment cl qui doit guider le choix des oprateurs lintrieur
du schma gnral de la recherche repose sur lquilibre entre :
une exploration de lespace de recherche grce lAG
une intensification de la population obtenue travers la stratgie locale
4.3.1
NSGA-II comme oprateur gntique
LAG choisi pour servir de base lalgorithme MEMO est NSGA-II [Deb 2002]
propos par Deb et al. Il sagit certainement de lAG le plus utilis pour rsoudre des
problmes multi-objectifs, bien quil existe des algorithmes plus efficaces. NSGA-II
prsente lavantage de proposer un trs bon compromis entre performance et simplicit de fonctionnement. Il sagit ainsi encore aujourdhui dun algorithme souvent
utilis comme rfrence, pour comparer les performances des nouvelles approches
proposes.

Notons que NSGA-II servira non seulement construire loprateur gntique de
MEMO, mais galement seul pour fournir des lments de comparaison afin dvaluer
les apports de lhybridation que nous proposons.
Lalgorithme 5 rappelle le fonctionnement de NSGA-II prsent section 3.3.4.1
du chapitre 3.
Algorithm 5 NSGA-II
by a time limit*/
5:
P P Q
6:
7:
8:
setCrowdingDist(f )
9:
end for
10:
sort(P ) /*by rank and in each rank by the crowding distance*/
11:
P P [0 : N ]
12:
Q buildNextGeneration(P ) /*Binary Tournament Selection, Recombination and Mutation*/
13: end for
Dfinissons maintenant les diffrents oprateurs intervenant dans NSGA-II.
4.3.1.1
La slection des parents
Elle fait partie des lments dfinis dans lalgorithme NSGA-II. Il sagit dun
tournoi binaire permettant de favoriser les meilleures solutions sans pour autant
liminer totalement les autres solutions. Le tournoi est bas sur le rang des solutions
dont le calcul est dtaill dans le chapitre 3. NSGA-II implique le recours un tournoi
binaire, mettant en comptition deux solutions uniquement. On notera toutefois que
plus gnralement il est possible de mettre plus de deux solutions en comptition.
La Figure 4.1 montre la slection de la solution s2 suite la mise en tournoi de
s2 et s6 . Dans cette illustration plus le cercle est grand, meilleure est la solution.
Dans le cas dun tournoi, les individus mis en comptition sont quant eux choisis
alatoirement. On voit ainsi que s2 est choisie sans tre la meilleure, simplement
parce quelle est meilleure que s6 .
La slection peut ainsi tre vue comme un oprateur dintensification, dans la

$%&'()*%+#
,%-&.**%+#
!"#
/.(01*%+#
!"#
!"#
!%#
!%#
!(#
!%#
!(#
!'#
!(#
!'#
!$#
!*#
119
!$#
!*#
!)#
!&#
!'#
!$#
!*#
!)#
!&#
!)#
!&#
Figure 4.1 Slection par tournoi binaire

mesure o elle favorise les meilleures solutions. Il apparait de faon immdiate que
plus on met de solutions en comptition, plus la slection sera litiste. Le cas extrme
consiste mettre en comptition toute la population, ce qui reviendrait choisir la
meilleure solution (litisme extrme).
4.3.1.2
Le croisement
Contrairement la slection des parents, loprateur de croisement nest pas dfini dans NSGA-II. Ceci sexplique par le fait que le croisement peut tre troitement
li au problme et dpend donc du cas de figure.
Sans connaitre le problme rsoudre il apparait ainsi dlicat de prconiser
un oprateur de croisement plutt quun autre. Cest pourquoi nous proposons ici
denvisager deux oprateurs de croisement, avec deux niveaux dlitisme. Le choix
dun oprateur ou de lautre se fera au regard des rsultats obtenus dans les deux
cas.
Un croisement litiste Nous choisissons pour ce croisement de prendre les meilleurs
gnes de chaque parent. Toutefois ds lors que lon parle de meilleur gne il faut tre
en mesure dattribuer une valeur chaque gne, ce qui soulve deux problmes.
Dune part cela suppose que lon puisse identifier la contribution de chaque gne
lvaluation globale de la solution, ce qui nest pas forcment le cas. Dautre part
nous sommes dans un contexte multiobjectif. Il nexiste donc pas de relation dordre
total entre les solutions et par consquence entre les gnes contributeurs la solution,
chaque gne possdant une contribution chacun des objectifs.
Il apparait alors ncessaire de dfinir la faon dont on va comparer les gnes

les uns aux autres, ce qui suppose de rtablir un ordre total. Pour ce faire nous
appliquerons une mthode dagrgation des objectifs. Le croisement se fera ainsi
dans une direction = (1 , ..., k ), avec k le nombre de fonctions objectifs, tel
P
que i 0 et ki=1 i = 1. La pondration des objectifs nest pas fige. Elle est
tire alatoirement lors de la cration de chaque enfant. On notera quici aucune
direction nest privilgie. On ne cherchera donc pas guider les solutions issues du
croisement vers le front de Pareto ou vers une meilleure rpartition des solutions le
long du front. Au contraire, on laissera lala jouer son rle et apporter une plus
grande diversit.
Le recours cette agrgation f des objectifs sous forme dune somme pondre
des fi prsente lavantage de fournir temporairement une valeur de fitness unique
chaque solution, et dans notre cas une valeur de contribution unique de chaque gne
la solution globale.
k
X
f=
i fi
(4.2)
i=1
De plus la recherche locale prsente section 4.3.2 utilisera galement ce procd

dagrgation, ce qui permettra dutiliser les mcanismes simples disponibles dans le
contexte mono-objectif.
La figure 4.2 illustre la faon dont chaque parent fournit ses meilleurs gnes
lenfant, ici chacun pour moiti. Selon la faon dont est cod le problme, le
dcoupage se fera diffremment. Un exemple sera prsent dans la section 4.4.3.3.
!"#$%&'(
)%*"%&
!"#$%&'+
Figure 4.2 Croisement litiste : chaque parent fournit ses meilleurs gnes
Malgr le caractre litiste du croisement propos, on notera que cette opration
dans le contexte mmtique peut tre vue comme un oprateur de diversification. En
effet le croisement a pour effet de dstructurer les solutions pour fournir un nouveau
point de dpart pour la recherche locale.
Un croisement alatoire Du fait quil nest pas toujours possible de dfinir un

croisement litiste, et parce que llitisme peut impliquer des convergences prmatures de lalgorithme, nous gardons comme alternative galement le croisement
alatoire. Cela peut tre un croisement un point classique, si la squence des gnes
a une importance dans le codage de la solution. Cest le cas par exemple pour des
121
problmes dordonnancement o chaque gne code une tche excuter et o la

solution dcrit la succession de lensemble des tches.
Mais dans dautres cas, il peut tre au contraire ncessaire de casser la succession
des gnes. En particulier dans les codages binaires des solutions o chaque gne
reprsente toujours la mme chose, avec linformation "on prend" ou "on ne prend
pas", lala comme nous le verrons plus loin peut tre obtenu de manire adapte.
4.3.1.3
La gestion de population
NSGA-II dfinit la faon dont la population volue, en conservant les meilleures

solutions selon le rang de dominance dabord, et selon la distance de crowding ensuite. Toutefois dans le cadre de lalgorithme Memetic Evolutionary MultiObjective
(MEMO), nous considrons deux populations. La population P G de taille fixe qui
est celle utilise par lalgorithme gntique. Et une deuxime population P A de taille
variable qui sert darchive. Afin de limiter la taille de larchive de nombreux mcanismes sont souvent utiliss, pour supprimer notamment les individus trop proches
les uns des autres. Les fonctions de partage (sharing) permettent ainsi de conserver
une archive de taille raisonnable avec une bonne diversit dindividus. Dans le cas
prsent nous nimposons pas de taille limite pour archiver les solutions rencontres.
Nous acceptons ainsi toute nouvelle solution qui nest domine par aucune solution
dj prsente dans larchive.
A la fin de la recherche, lalgorithme retourne un ensemble contenant toutes les
solutions non-domines rencontres au cours de la recherche. Le fait de ne pas borner
cet ensemble risque dengendrer un nombre considrable de solutions, ventuellement
souvent proches les unes des autres. Nous prsenterons dans le chapitre 4.6 une faon
daider le dcideur choisir la solution qui lintresse parmi toutes les possibles.
4.3.1.4
Et la mutation...
Comme nous lavons indiqu certains algorithmes mmtiques conservent en plus

de la recherche locale un oprateur de mutation. Toutefois dans de nombreux cas
de figure la recherche locale vient en remplacement de la mutation. Ici la mutation
gnralement prsente dans lalgorithme NSGA-II est simplement remplace par la
recherche locale.
4.3.2
Loprateur de recherche locale
Afin de rpondre aux attentes prsentes prcdemment, la recherche locale doit

fournir un quilibre entre rapidit et exhaustivit. Nous proposons ici une approche

de type First Improvement Hill Climbing (FIHC) qui accepte successivement le
premier voisin de meilleure fitness, partir dun point de dpart tir alatoirement.
De cette faon une exploration partielle du voisinage est effectue chaque itration.
La condition darrt de la recherche est constitue de loptimum local, solution
nadmettant aucune solution de meilleure fitness dans son voisinage.
Plus formellement la recherche locale est dfinie par le couple (, V ) o
est lensemble des solutions ralisables (il sagit de lespace de recherche) et V la
structure de voisinage V : 2 qui attribue chaque solution s un ensemble
de voisins V (s). De fait, la condition darrt de la recherche locale est loptimum local
s , atteint si et seulement si s V (s ), f (s) f (s ) (dans le cas dun problme de
maximisation).
On notera que dans le cadre de la recherche locale le problme est ramen un
problme mono-objectif, la valeur de fitness dune solution tant la somme pondre
des diffrents critres dans la direction choisie alatoirement et dfinie par le vecteur de poids, tel que dcrit section 4.3.1. Lalgorithme 6 prsente la faon dont la
recherche est ralise.
Algorithm 6 Local Search : FIHC
Require: s the child coming from crossover operator
Pk
1: fs
i=1 i fi (s)
2: repeat
3:
s0 selectNeighbor(s) /*select randomly the first neighbor of s such that
fs0 > fs */
4:
if s0 6= then
5:
s s0
P
6:
fs ki=1 i fi (s)
7:
addNotDominated(s) /*add s in the archive if not dominated inside it and
remove all dominated solutions from the archive*/
8:
end if
9: until s is a local optimum (i.e. s0 = )
Chaque solution rencontre lors de la recherche locale qui nest pas domine par
larchive est ajoute cette dernire. Larchive est ainsi construite et alimente par
la recherche locale.
La solution s la fin de la recherche locale, qui correspond loptimum local, est
ajoute la population utilise pour la partie gntique. Elle sert donc construire
les gnrations suivantes.
On notera quil aurait galement t possible de choisir nimporte quelle autre
solution non-domine rencontre au cours de la recherche locale. En effet, en termes
de dominance la dernire solution nest a priori pas meilleure que nimporte quelle
123
autre solution non-domine. Il aurait alors t possible de dfinir dautres critres tel
que celui de diversit en appliquant une fonction de sharing pour choisir la solution
intgrer la population pour lAG. Ici nous avons choisi de donner la priorit la
direction choisie qui nadmet quune meilleure solution : la dernire trouve.
La recherche locale choisie ici repose donc sur lagrgation des fonctions objectif. Elle prsente lavantage dtre simple et rapide. Il aurait galement t envisageable de choisir une recherche locale de type Pareto, telle quun algorithmes
DMLS [Liefooghe 2012]. Ceci aurait permis de conserver le caractre multi-objectif
du problme. Toutefois ce type dapproches, dans le cadre dune hybridation, pose
la question de larchive servant de rfrence. En effet, si la recherche locale applique
chaque enfant part dune archive vide, la recherche locale base sur le critre de
dominance prendrait un temps considrable, bien souvent pour r-explorer des parties de lespace de recherche dj explores prcdemment. A linverse, si larchive
initiale de chaque recherche locale est constitue de larchive globale de lalgorithme
mmtique, le risque est que les enfants soient directement domins par une solution
de larchive ce qui arrterait la recherche avant mme quelle nait commenc.
4.3.3
Droulement de lalgorithme mmtique
La figure 4.3 illustre les trois tapes principales : la slection des parents p1 et p2 ,
leur croisement pour donner naissance la solution s, suivi dune recherche locale
dans la direction donne par le vecteur

v pour aboutir la solution s . On notera
si les solutions successives de la recherche locale. La direction de

v est directement
dtermine par le vecteur des pondrations = (1 , ..., k ).
Remarque : Le vecteur directeur de la progression de la recherche locale autorise
toutefois un certain degr de libert dans lespace de recherche. En effet le vecteur
v et la solution courante si dfinissent un hyperplan orthogonal

v et passant par
si . Lors de la recherche locale toutes les solutions si+1 se trouvant au-dessus de cet
hyper plan amliorent la fitness agrge et sont donc acceptes.
Lalgorithme 7 prsente ces tapes.
Figure 4.3 Slection et croisement suivis dune recherche locale

Algorithm 7 MEMO
by a time limit*/
3: A /*init an empty archive*/
6:
P P Q
7:
8:
9:
setCrowdingDist(f )
10:
end for
11:
sort(P ) /*by rank and in each rank by the crowding distance*/
12:
P P [0 : N ]
13:
Q buildChildren(P )
14:
improveChildren(Q) /*following the local search FIHC */
15: end for
La principale caractristique de cet algorithme par rapport NSGA-II est lin-
4.4. Optimisation applique la planification urbaine : localisation de

stations dauto-partage
125
troduction de la fonction improveChildren. Elle a en effet la charge dappliquer la
recherche locale lensemble des individus de la population des enfants Q. De fait
dans cet algorithme la fonction buildChildren effectue la slection et le croisement
mais pas la mutation qui est remplace par la recherche locale.
Lapproche algorithmique tant prsente, nous allons passer un cas dapplication avec le problme de lauto-partage.
4.4
4.4.1
Optimisation applique la planification urbaine :

localisation de stations dauto-partage
Introduction
Le service de lauto-partage a t introduit en 1940 [Shaheen 2008]. Depuis,

plusieurs approches ont t proposes dont les trois principales sont :
le service station unique : les voitures sont mises disposition dans une
station, et le retour se fait dans la mme station.
le service sans station : les vhicules sont dploys dans la ville sur des places
de stationnement classique. Un vhicule est alors emprunt o il se trouvait
et dpos nimporte o dans la zone dutilisation.
le service stations multiples : les voitures sont rparties dans des stations,
sont empruntes dans une station et restitues dans nimporte quelle autre
station du service.
Le cadre dapplication qui nous intresse est cette troisime version. Il sagit
notamment du mode de fonctionnement adopt par autolib Paris, ainsi que pour
le partage de vlo avec vlib Paris ou vloV Lyon. Un des enjeux majeur est
alors de positionner les stations afin de fournir le meilleur service au moindre cot.
Un dsquilibre important du service est certainement llment principal pouvant poser problme. On distingue les deux situations extrmes suivantes :
le cas o une station est vide. Une demande de retrait de vhicule cette
station sera alors rejete.
le cas o une station est pleine. Une demande de dpt sera galement rejete.
Les demandes non satisfaites posent deux problmes : dune part elles constituent
un manque gagner direct pour lexploitant, dautre part elles entrainent une perte
de confiance dans le service, ce qui est terme prjudiciable.
Divers travaux ont donn lieu plusieurs approches pour optimiser le fonctionnement de lauto-partage et rduire les situations de blocage. Notamment dans
[Barth 2002] laccent est mis sur la participation de lusager lui-mme pour red-

ployer les vhicules, en lincitant aller vers certaines stations. Mais lefficacit de
lauto-partage passe certainement par une conception optimale en amont. Ainsi des
travaux ont dj t raliss pour rpondre cette problmatique de localisation des
stations en appliquant des mthodes doptimisation exactes. [de Almeida Correia 2012]
propose de placer les stations en rsolvant un Problme Linaire Mixte. Nous notons toutefois que le principal inconvnient de ces approches est quelles considrent
une version trs simplifie du problme. En particulier le dcoupage du territoire
se fait en grande zone de 1km2 . En effet, la complexit du problme nautorise pas
de conserver des approches exactes ds lors que lon souhaite analyser finement le
territoire. Le recours une heuristique savre alors tre ncessaire.
4.4.2
Enjeu de la localisation des stations
Avant toute formalisation dun problme doptimisation, il apparait ncessaire de

comprendre le problme lui-mme afin didentifier les lments cls qui dfinissent les
fonctions objectifs. En particulier dans le cas prsent, cela revient caractriser les
lments ayant limpact le plus significatif sur le fonctionnement du service dautopartage.
Quest-ce quun service dauto-partage qui fonctionne bien ? Afin de rendre
compte des divers facteurs traduisant le "bon" fonctionnement du service, nous
identifions que les principaux lments optimiser simultanment doivent permettre
de :
rpondre un maximum de besoins en termes de dplacements
ncessiter la plus faible intervention humaine pour redployer les vhicules en
cas de saturation du service
assurer une utilisation du service tout au long de la journe et non uniquement
aux heures de pointe
De plus le niveau de prcision gographique semble tre primordial. En effet indiquer quune station serait efficace dans une certaine zone 1km prs ne contient pas
le mme degr dinformation que dindiquer une position 100m prs. En corollaire
on imagine bien quappliquer un algorithme doptimisation sur un maillage 1km
ou 100m nimplique pas la mme complexit de lespace de recherche lui-mme.
On voit alors que le choix du dcoupage territorial est un enjeu non ngligeable.

127
4.4.3
4.4.3.1
Description formelle du problme

Donnes dentre : description et modlisation
Limplantation de stations dans un environnement urbain suppose la prise en

compte dun grand nombre de paramtres lis tant la disponibilit du foncier qu
une connaissance fine du besoin en termes de mobilit.
Caractrisation de la disponibilit foncire La disponibilit du foncier peut

tre vue comme un cot associ chaque emplacement pouvant recevoir techniquement une station. Lintroduction de ce cot prsente comme avantage dapporter
un degr de finesse important dans la caractrisation de chaque emplacement. Dans
cette optique un emplacement ne pouvant hberger une station se verrait associer un
cot infini. Toutefois linconvnient majeur de cette approche est quelle impose de
calculer une fonction cot gnralise intgrant le prix du foncier, le gain financier
apport par lemplacement et le gain en matire de service rendu.
A loppos la disponibilit du foncier peut tre vue comme une fonction binaire
indiquant les emplacements disponibles pour recevoir une station. Bien que dans ce
cas il ny ait plus la finesse apporte par lassociation dun cot chaque emplacement, ce qui a pour effet de ramener tous les emplacements au mme niveau, une
telle approche prsente lavantage dtre beaucoup plus souple mettre en oeuvre.
En particulier la localisation des stations dans ce cas se fait en considrant la demande (le besoin en mobilit) sans lui associer un gain montis qui est souvent une
question dapprciation.
Cest cette dernire caractrisation du foncier que nous avons pris en compte
dans la modlisation du problme afin de limiter les erreurs susceptibles dtre
introduites par une approche montise. Toutefois, afin dintgrer le fait que des
emplacements puissent tre plus contraignants que dautres, puissent imposer des
travaux plus lourds et plus coteux que dautres, nous proposons de laisser la possibilit au dcideur, lorsquune solution lui est propose, de rejeter un emplacement
choisi. Le rejet a posteriori permet au dcideur de voir toutes les solutions proposes
par loutil doptimisation, danalyser le gain apport par chaque emplacement dune
solution, et ventuellement de rejeter un emplacement et de relancer lalgorithme
pour trouver un emplacement de substitution.
La figure 4.4 montre un dcoupage du territoire en mailles de 300m de ct, avec
en gris les mailles o il nest pas possible de disposer une station. Dans les mailles
non grises il nest pas forcment possible de mettre une station nimporte o mais il
existe des possibilits. Le choix de 300m est guid par les mthodes de dploiement
de transports en commun dont la zone de capture des pitons autour dun arrt est
en gnral dun rayon de 300m.
Figure 4.4 Illustration des sites pouvant accueillir une station
Identification de la demande Aprs lidentification des sites pouvant recevoir

un amnagement tel quune station pour vhicules lectriques partags, la deuxime
donne dentre ncessaire la localisation des stations est une connaissance prcise
du besoin. Cela implique dtre en mesure de :
caractriser et modliser lensemble des flux de dplacements tels quils soprent
sur le territoire
filtrer parmi tous les flux ceux qui sont susceptibles dtre effectus en vhicule
partag
Modliser lensemble des flux ncessite de disposer dun maximum de donnes
dentre pour se trouver au plus prs de la ralit. Les donnes peuvent provenir des
administrations territoriales elles-mmes et sont constitues de comptages aux carrefours, aux gares, dEnqutes Mnages/Dplacements (EMD), denqutes diverses,
etc. Elles sont galement construites au niveau national, notamment par lINSEE
travers le recensement, ou encore des grandes enqutes telles que lEnqute Nationale
Transports et Dplacements (ENTD), la dernire remontant 2008.
Les donnes issues de la tlphonie mobile permettent de complter celles dj
disponibles en fournissant un chantillon de taille trs importante et ractualisable
en continu.
Ltape consistant filtrer les utilisateurs potentiels prsente de nombreuses
difficults. Il ne sagit plus de modliser au plus juste une situation connue mais
danticiper sur ce que va tre lutilisation des vhicules en auto-partage. Pour ce
faire il faut tre en mesure destimer qui utilisera le service en fonction de critres
tels que le type de personne (ge, sexe, catgorie socio-professionnelle, etc.) ainsi
que le motif du dplacement.
A ceci sajoutent les dplacements dits "induits" par lintroduction de ce nouveau
service. En effet toutes les expriences passes (Praxitle La Rochelle [M.-H. 2000],
etc.) ont montr que lintroduction dun nouveau mode de dplacement entrainait
non seulement un report modal des autres modes vers ce dernier, ceci pour des
dplacements qui taient dj effectus, mais en plus que ce nouveau mode gnrait
de nouveaux dplacements.

129
Afin de ne pas biaiser les rsultats en introduisant de mauvaises hypothses,
nous avons laiss la possibilit lutilisateur dintroduire ses propres hypothses sur
les critres de filtres, caractriss par une pondration des dplacements actuels :
par tranche dge, sexe et moyen de transport avant introduction du nouveau mode.
Ceci permet de considrer diffrents scnarios et dtudier les rpercutions sur les
solutions fournies par lalgorithme de localisation.
Cette tape laisse aux mains de lutilisateur aurait galement pu tre intgre
lalgorithme doptimisation. Une approche robuste ou encore stochastique pourrait
tre envisage dans ce cas de figure mais ne sera pas considre ici.
Ces deux tapes de modlisation des dplacements puis filtrage des utilisateurs
pressentis aboutissent la cration de la demande.
Figure 4.5 Stations et zone de capture

La figure 4.5 prsente la localisation des stations (centre du cercle), ainsi que la
zone de capture (aire du disque). Nous considrons donc ici une aire de capture dun
rayon de 300m, pouvant toutefois tre paramtre par lutilisateur. Le flux des dplacements pouvant tre servi par une station sera ainsi lensemble des dplacements
ayant pour origine ou destination la zone de capture associe. On notera que les flux
peuvent tre pris partiellement par une station (maille non entirement couverte)
et/ou rpartis entre plusieurs stations (zones dintersection entre plusieurs aires).
4.4.3.2
Modlisation des fonctions objectifs
Afin de rpondre aux enjeux poss prcdemment, nous proposons trois objectifs
optimiser. Ces fonctions ont pour rle didentifier parmi les sites candidats lesquels
retenir afin dy placer une station.
Dfinition 18 (Site candidat) On appelle site candidat une maille carre pouvant

recevoir une station. Cette maille est elle-mme caractrise par une position (x, y)
et un pas de maillage (longueur de ct).
Dfinissons les variables intervenant dans les fonctions objectifs.
: lensemble des solutions ralisables
s : une solution lment de lensemble . Notons quune solution ralisable est une
faon de placer n stations sur le territoire (choix de n sites candidats), sachant
quun site candidat ne peut accueillir quune station.
sti : la station i du service. Son domaine de dfinition est lensemble des sites candidats du territoire.
T : lensemble des plages horaires dune journe pour prendre ou dposer un vhicule, T = {t1 , ..., tp }.
t : une plage horaire, lment de T . On prendra gnralement des plages de 15
minutes, soit p = 96.
f (sti , stj ) : nombre de personnes allant de sti stj au cours de la journe
f (sti , stj , t) : nombre de personnes allant de sti stj au cours de la priode t
f (sti , t) : nombre de dplacements ayant pour origine ou destination sti au cours
de la priode t
f (sti ) : nombre moyen de dplacements ayant pour origine ou destination sti au

cours de la journe
!
fmin (sti ) =
min
f (sti , stj , t),
stj s\{sti }
f (stj , sti , t)
stj s\{sti }
est le cumul du minimum
entre flux entrant et flux sortant tout au long de la journe pour sti .
!
fmax (sti ) =
P
t
max
P
stj s\{sti }
f (sti , stj , t),
P
stj s\{sti }
f (stj , sti , t)
est le cumul du maxi-
mum entre flux entrant et flux sortant tout au long de la journe pour sti .
La fonction correspond au flux demand total.
Maximiser les flux de dplacement Il sagit de lobjectif qui semble tre le plus
intuitif. En effet les stations doivent tre positionnes de faon tre lorigine et
la destination dun maximum de besoins en termes de dplacement. Il ne sagit donc
pas simplement de mettre les stations dans les zones attractives comportant le plus
de personnes mais de faon satisfaire un maximum dchanges origine/destination.
La Figure 4.6 montre que mettre simplement les stations dans les zones les plus
attractives ne suffit pas forcment. On y voit en particulier des zones (A F ) avec
les changes existants entre chaque zone. Lpaisseur de la flche traduit le nombre
de dplacements existants. Les zones rouges sont les zones slectionnes pour mettre
une station.
Dans cet exemple il sagit de placer deux stations dans les zones les plus intressantes. Sur la figure de gauche on place les stations sur les zones les plus attractives

131
Figure 4.6 Implantation des stations selon lattraction vs les flux
(A et B). On remarque toutefois que bien que lattractivit soit forte, les changes
entre A et B sont trs faibles ce qui est dfavorable au fonctionnement de lautopartage. Sur la figure de droite au contraire les stations sont positionnes de faon
maximiser les flux (A et E sont choisies). Cela montre un fonctionnement favorable.
Cela revient tudier un graphe totalement connect, non pas en termes de
sommet (attractivit) mais en termes dartes (dplacements). Ce problme est dj
de nature combinatoire.
On dfinit alors la fonction f1 maximiser qui a pour objectif de favoriser le
flux de dplacements entre les stations :
f1 (s) =
f (sti , stj )
(4.3)
sti s stj s\{sti }
Maximiser lquilibre des stations Ce deuxime objectif vise rduire les

situations de saturation. On cherche ici viter quune station soit sans voiture ou
au contraire sans place disponible pour y dposer une voiture. Il semble vident que
le fonctionnement du service est amen varier dun jour lautre. Il est en effet
impossible didentifier coup sr le nombre de voitures qui arrivent chaque instant
ou partent vers une autre station. Aussi plutt que de chercher minimiser le nombre
de rejets sur un scnario de simulation, nous souhaitons maximiser lquilibre entre
les flux entrants et les flux sortants de chaque site choisi pour y mettre une station,
tout au long de la journe.
La Figure 4.7 illustre un cas favorable linstant t pour la station s. En effet les
flux entrants (verts) et sortants (oranges) sont parfaitement quilibrs.
La station s conserve un nombre stable de voitures et de places disponibles.
On dfinit la fonction f2 maximiser pour favoriser la proportion de flux qui-
Figure 4.7 Equilibre des flux entrants / flux sortants linstant t pour la station
s
librs au cours du temps.

f2 (s) =
X fmin (sti )
f
(sti )
st s max
(4.4)
Maximiser lutilisation tout au long de la journe Cette dernire fonction

objectif a pour rle de favoriser le fonctionnement de lauto-partage tout au long
de la journe. La principale motivation ceci est que lauto-partage na de sens
que sil permet de rpondre de nombreuses demandes, et donc dtre utilis au
cours dun maximum de plages horaires. Lauto-partage est en effet une solution de
transport alternative qui part du principe que les voitures personnelles ne sont que
trs peu utilises au cours dune journe. Il sagit donc de mutualiser les moyens
de transport. Pour que ce soit efficace il est indispensable de disposer galement
dun fonctionnement en dehors des heures de pointe. Par ailleurs pour rpondre
des demandes en heures de pointe, les approches de type transport en commun
semblent plus appropries.
La Figure 4.8 illustre deux niveaux dutilisation au long de la journe, en vert
une situation favorable vis--vis de cet objectif et en rouge un cas dfavorable.
Pour formaliser cette fonction f3 nous proposons de minimiser lcart type du
nombre de dplacements ayant pour origine ou destination chaque station, au cours
de la journe. Ainsi cette fonction sera le reflet du niveau de stabilit. On notera
galement que pour viter leffet de facteur dchelle entre les diffrents sites, nous
utiliserons un cart type relatif la moyenne des dplacements. De plus, afin dobtenir une fonction f3 maximiser (comme f1 et f2 ), nous considrerons pour f3
loppos de lcart type.

133
Figure 4.8 Deux fonctionnements dune station au cours de la journe
f3 (s) =
X
sti s
4.4.3.3
1 X
(f (sti , t) f(sti ))2
|T | t
(4.5)
Modlisation du problme doptimisation
La dmarche mene pour rsoudre ce problme suit une approche bi-niveaux.

Lors du placement dune station la premire tape consiste slectionner le site
candidat, en tenant compte des fonctions objectifs dcrites prcdemment. Une fois
le site candidat identifi, la seconde tape consiste placer la station plus finement
lintrieur de la zone couverte par le site candidat (que nous appellerons site fin).
Ce traitement en deux temps permet dacclrer considrablement les calculs algorithmiques en rduisant de faon significative la quantit de donnes manipuler.
En effet dans la pratique nous choisissons pour sites candidats des mailles carres
de 300m de ct, alors que le site fin est dfini par un maillage de 25m de ct. Il y
a donc 144 sites fins dans un site candidat, soit 144 fois plus demplacements pour
positionner une station lors de la recherche. De plus la matrice de flux contenant la
demande en mobilit de site site augmente avec le carr du nombre de sites, soit
dun facteur 1442 = 20736. En considrant une ville dune taille moyenne la quantit
de donnes considrer ne peut tre traite par les machines actuelles.
Alors que le choix des sites candidats dune solution au problme se fait par
optimisation combinatoire (en optimisant les fonctions objectifs dfinies prcdemment), le positionnement fin de la station lintrieur du site candidat est fait de
faon ce que la station soit proximit dun maximum de personnes. Il sagit dans

cette deuxime phase dappliquer un simple algorithme de p-mdian. Aussi dans la
suite nous ne tiendrons pas compte de cette deuxime phase mais uniquement de
lapproche combinatoire permettant de choisir n sites candidats pour positionner n
stations.
Soit n stations dployer sur le territoire. Une solution s admissible est un
ensemble de n sites candidats soumis la contrainte suivante :
s = {st1 , ..., stn } tel que i, j [1, n], sti = stj i = j
(4.6)
Comme dfini prcdemment on notera lensemble des solutions admissibles.

Par suite le problme doptimisation LOC visant localiser les stations devient :
max
z = f (s)
s
o
f (s) = (f1 (s), f2 (s), f3 (s))
LOC
tel
que
:
s = {st1 , ..., stn }
i, j [1, n]sti = stj i = j
(4.7)
Le problme doptimisation tant pos, il reste dfinir la relation de voisinage

a utiliser pour la recherche locale. Ainsi le voisinage dune solution s est compos de
toutes les solutions qui peuvent tre atteintes en dplaant une station quelconque
vers nimporte quel autre site disponible. La relation de voisinage scrit donc :
v(s) = {s0 |dist(s, s0 ) = 1}
(4.8)
La fonction dist dsigne la distance de Hamming entre s et s0 .
4.5
Application de lalgorithme mmtique MEMO
Dans cette section sont prsents les rsultats obtenus ainsi que les mthodes permettant de positionner lalgorithme MEMO par rapport aux approches existantes.
En effet, la comparaison des performances dalgorithmes multiobjectifs est particulirement dlicate. Pour cause, le rsultat ntant pas une solution unique mais un
ensemble de solutions non-domines entre elles, il importe de dfinir des lments
de comparaison, tels que des indicateurs qui permettent dattribuer une valeur de
fitness un ensemble de solution.
La non-comparabilit de deux ensembles est illustre avec la figure 4.9. On voit
dans cet exemple que toutes les solutions dun ensemble ne sont pas domines par
4.5. Application de lalgorithme mmtique MEMO
135
Figure 4.9 Problme multiobjectif de maximisation

des solutions de lautre ensemble, seule condition permettant de considrer quun
ensemble est meilleur que lautre.
Nous prsenterons tout dabord les indicateurs retenus pour valuer notre algorithme, ce qui ne nous permettra pas de dire quune solution est meilleure que
lautre en gnral mais quelle est meilleure relativement lindicateur considr.
4.5.1
Introduction des indicateurs de comparaison
Parmi les indicateurs prsents au chapitre 3, nous en avons retenu trois pour
tudier les rsultats fournis par MEMO :
lindicateur additif [Zitzler 2003]
lindicateur de contribution [Meunier 2000]
lindicateur hypervolume [Zitzler 1999]
On notera galement le nombre de solutions non-domines trouves par les algorithmes tudis, ce qui constituera galement un indicateur.
4.5.1.1
Indicateur -additif
Cet indicateur donne la translation minimale appliquer dans chaque dimension lensemble A pour quil domine lensemble B.
I+ (A, B) = min{x B, x0 A : x + x0 }
R
(4.9)

Etant donn que la valeur est la mme dans chaque dimension (une dimension
est une fonction objectif), il apparait immdiatement que lindicateur I+ est sensible
aux plages de valeurs de chaque objectif. En effet si un objectif admet comme valeurs
possible v [0, 1] alors quun autre objectif a pour domaine de dfinition [0, 10000],
on remarquera que le deuxime objectif risque de masquer totalement le premier.
Cest pourquoi une phase de normalisation des valeurs est indispensable avant de
calculer lindicateur I+ .
Une valeur de I+ proche de 0 est le reflet de deux ensembles de qualit semblable.
Si la valeur devient ngative alors lensemble mesur A est significativement meilleur
que lensemble de rfrence B.
4.5.1.2
Indicateur de contribution
Lors de la comparaison de deux ensembles rsultats A et B, lindicateur de contribution not IC (A, B) dtermine la proportion de solutions non domines apporte
par A dans N D(A B), avec N D retournant les solutions non-domines.
IC (A, B) =
|AB|
2
+ |WA | + |NA |
|N D(A B)|
(4.10)
WA dsigne lensemble des solutions de A qui dominent au moins une solution

de B et NA lensemble des solutions de A non-comparables avec B.
De faon vidente une valeur de IC la plus grande possible est souhaite.
4.5.1.3
Indicateur hypervolume
Il sagit dun indicateur incontournable depuis sa proposition par Zitzler et Thiele

[Zitzler 1999]. Lindicateur hypervolume IH prsente en effet lavantage de reflter la
qualit dun ensemble, tant en termes dintensit (bonnes solutions) que de diversit
(bonne couverture du front de Pareto). De plus cet indicateur prsente lavantage
dtre unaire : il fournit le niveau de qualit dun ensemble de solutions sans ncessiter le recours un ensemble de rfrence. Lindicateur doit fournir lhypervolume
le plus vaste possible pour une bonne population. Toutefois deux conditions sont
indispensables une bonne interprtation :
de disposer dune normalisation des objectifs pour quun objectif ne soit pas
sur-reprsent ou sous-reprsent
didentifier un point de rfrence pour le calcul de lhypervolume
137
Pour normaliser les objectifs nous pouvons dterminer les valeurs extrmes sur
chaque objectif pour les ensembles Pareto obtenus au cours de nombreux runs de
diverses mthodes. De cette faon chaque objectif normalis est compris entre 0
et 1. Il nest pas exclu de trouver une valeur normalise < 0 (solution pire que la
pire solution trouve au cours des nombreux runs) ou encore > 1 (on amliore la
meilleure solution trouve) lors dune nouvelle excution.
En thorie, pour lobjectif n, s S, fnmin fn (s) fnmax . Il sen suit que
nous avons la normalisation :
0
4.5.2
fn (s) fnmin
1
fnmax fnmin
(4.11)
Dfinition dun ensemble de rfrence avec NSGA-II, PLS et

FLSMO
Il ne fait aucun doute que les rsultats obtenus lors dune excution dun algorithme stochastique ne permettent pas de conclure sur les performances de lalgorithme en question. En effet la nature alatoire de ces algorithmes fait quune
excution peut tre bonne et la suivante mdiocre. Pour pallier ce problme, une
moyenne est gnralement calcule sur plusieurs excutions. Dans notre situation
nous avons ralis pour chaque test une srie de 5 excutions afin de dterminer
des valeurs moyennes, que ce soit pour lvaluation des fonctions objectifs ou des
indicateurs.
Bien que nous jugerons de la performance dun algorithme sur les valeurs moyennes
obtenues au cours des 5 excutions, on remarquera que dautres critres dvaluation
pourraient tre utiliss. En particulier il serait possible de considrer lcart type des
rsultats obtenus afin de dterminer le niveau de stabilit de lalgorithme, ou encore
le meilleur rsultat sur 5 excutions si lon souhaite privilgier un algorithme trs
efficace de temps en temps, et en acceptant quil soit peu performant le reste du
temps.
Ltude de la performance dun algorithme suppose de dfinir des critres de
comparaison comme nous lavons prsent en introduction, mais aussi de disposer
dun ensemble de rfrence auquel se comparer. Pour permettre davoir le meilleur
recul sur les rsultats fournis par diffrentes approches, nous allons comparer les
rsultats obtenus avec un grand nombre de configurations dalgorithmes, pour des
recherches locales et des approches volutionnaires, avant dintgrer notre algorithme
mmtique.
Etant donn que MEMO repose dessus, lalgorithme gntique de rfrence sera
NSGA-II. Pour la recherche locale nous allons comparer deux algorithmes. PLS
qui prsente lavantage de ncessiter peu de paramtrage et qui fait rfrence en

optimisation combinatoire multi-objectif, et FLSMO qui est un algorithme que nous
avons propos et qui est galement simple mettre en oeuvre.
Remarque : Un algorithme doptimisation a pour vocation de livrer une solution (ou un ensemble de solutions). Il est alors ncessaire quil soit fini, ce qui
passe par la dfinition dun critre darrt. Lors dun algorithme de descente un
tel critre darrt peut tre loptimum local, solution nadmettant aucune solution
amliorante dans son voisinage. Dans le cas multi-objectif il sagirait dune solution nadmettant aucun voisin non-domin par une solution prcdemment trouve.
Avec des approches volutionnaires il est toujours possible de croiser des individus
pour construire de nouvelles gnrations. Le critre darrt nest donc pas directement inclus dans lalgorithme de recherche. Il faut alors dfinir une porte de sortie.
Le critre que nous choisissons est un critre de temps dexcution. Nous remarquons quen moyenne lalgorithme PLS de rfrence atteint un optimum local aprs
2 heures dexcution. Nous choisissons donc cette dure comme dure de rfrence
pour arrter notre algorithme MEMO ainsi que NSGA-II.
Conditions de test des algorithmes :
chaque configuration est teste sur 5 runs.
le temps limite dexcution dun run est fix 2h.
4.5.2.1
Rfrence avec NSGA-II
Plusieurs facteurs agissent sur les performances de cet algorithme. Il apparait

alors ncessaire de fixer au mieux ces lments. Nous avons agi sur les trois principaux leviers :
la taille de la population : 400, 600, 800, 1000.
loprateur de croisement : alatoire, litiste.
loprateur de mutation : alatoire, premier voisin amliorant, meilleur voisin
amliorant.
Nous avons test les six combinaisons doprateurs pour chaque taille de population. Chacune des configurations a t excute cinq fois afin de fournir la
performance moyenne, le minimum, le maximum et lcart type.
Les rsultats sont prsents chaque fois dans un tableau indiquant les valeurs
sur les trois objectifs, le nombre de solutions non-domines trouves, et lindicateur
hypervolume.
Croisement alatoire / mutation alatoire Il sagit l de lAG dans ses mcanismes les plus simples. Seuls les mcanismes de NSGA-II (slection des meilleurs
parents et remplacement des moins bons individus) agissent pour faire converger la
population vers le front de Pareto. Le croisement alatoire prend successivement un
139
gne alatoire non encore pris de chaque parent. De mme la mutation qui intervient avec une probabilit de 10% prend alatoirement un gne (une station) et le
fait muter vers une valeur alatoire (emplacement disponible).
Pop 600
min
max
mean
std
21975.203
22787.135
22448.830
-
1179.223
1225.583
1196.253
-
-26.693
-26.115
-26.402
-
3865
4115
3979
-
0.284
0.292
0.289
0.003
Pop 800
Table 4.2 NSGA-II : croisement alatoire et mutation alatoire

f1
f2
f3
NbSol Hypervolume
min
22209.086 1184.555 -27.141
3316
0.280
max 22787.135 1196.755 -26.033
3871
0.290
mean 22517.829 1191.554 -26.639
3565
0.286
std
0.004
min
max
mean
std
21300.516
22787.135
22339.576
-
1189.853
1360.691
1226.781
-
-27.115
-26.013
-26.508
-
4070
4370
4265
-
0.289
0.324
0.297
0.014
Pop 1000
Pop 400
Le meilleur choix en termes dhypervolume moyen est la population de taille 1000

comme le montre le tableau 4.2. De manire gnrale, on note que la qualit des
rsultats vue par IH augmente avec la taille de la population. De mme le nombre
de solutions du front augmente avec la taille de la population.
min
max
mean
std
21975.203
22718.160
22285.594
-
1184.091
1379.408
1264.523
-
-26.413
-25.870
-26.119
-
4031
4608
4406
-
0.285
0.331
0.306
0.021
Croisement alatoire / mutation premier voisin amliorant Le croisement

alatoire est conserv alors que la mutation joue un rle plus litiste. La mutation
intervient toujours avec une probabilit de 10% mais cette fois-ci le gne ayant la
plus faible contribution lvaluation globale est choisi pour tre mut. Pour dfinir
la plus faible contribution les valeurs fitness sont agrges selon une pondration
alatoire. Une fois le gne muter choisi il prend la premire valeur proposant une
amlioration de la fitness gnrale selon la mme pondration alatoire des objectifs.
On notera que pour ne favoriser aucune agrgation, et donc aucune direction, pour
chaque enfant une nouvelle valeur alatoire est retenue. Cet oprateur de mutation
revient prendre le premier voisin amliorant.
Le meilleur hypervolume moyen observ dans le tableau 4.3 est l encore obtenu avec la population de taille 1000 et les comportements sont semblables ceux
observs prcdemment.
Pop 400
min
max
mean
std
f1
22787.135
22787.135
22787.135
-
f2
1031.162
1196.755
1163.636
-
f3
-26.765
-25.840
-26.478
-
NbSol
2958
4113
3828
-
Hypervolume
0.236
0.292
0.281
0.022
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.755
1196.755
1196.755
-
-27.002
-26.167
-26.396
-
4281
4395
4358
-
0.292
0.293
0.293
0.000
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.200
1196.755
1196.644
-
-26.272
-25.956
-26.164
-
4537
4701
4615
-
0.292
0.294
0.293
0.000
Pop 1000
Table 4.3 NSGA-II : croisement alatoire et mutation premier voisin amliorant
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.755
1379.408
1269.816
-
-26.389
-26.018
-26.169
-
4706
5150
4863
-
0.293
0.339
0.311
0.022
Croisement alatoire / mutation meilleur voisin amliorant Pour cette

srie de tests le croisement reste inchang, mais la mutation transforme le gne
la plus mauvaise contribution vers la valeur fournissant la meilleure fitness agrge
possible. Lvaluation des solutions se fait galement par agrgation des fitness selon
une pondration alatoire. Cela revient choisir le meilleur voisin.
Le tableau 4.4 montre que les meilleurs rsultats sont obtenus avec la population de taille 800 ainsi quavec la population de taille 400. Toutefois aucun cas ne
permet datteindre le seuil de 0,3 pour IH alors que les populations de taille 1000
latteignaient en moyenne dans les deux versions prcdentes.
On remarque que les carts types sont rduits pour toutes les tailles de population ; le choix du meilleur voisin en mutation rend lalgorithme plus dterministe et
donc plus prvisible, mais moins bon en termes dexploration.
141
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.755
1196.755
1196.755
-
-27.123
-26.366
-26.765
-
3634
3922
3771
-
0.291
0.292
0.291
0.000
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1189.853
1196.755
1195.374
-
-26.686
-25.933
-26.281
-
3931
4187
4061
-
0.291
0.293
0.292
0.000
Pop 1000
Pop 400
Table 4.4 NSGA-II : croisement alatoire et mutation meilleur voisin amliorant

f1
f2
f3
NbSol Hypervolume
min
22787.135 1196.755 -26.932
3356
0.291
max 22787.135 1225.583 -26.691
3571
0.297
mean 22787.135 1202.520 -26.767
3492
0.292
std
0.003
min
max
mean
std
22787.135
22787.135
22787.135
-
1196.755
1196.755
1196.755
-
-26.863
-26.362
-26.614
-
3855
4206
3963
-
0.290
0.292
0.291
0.001
Croisement litiste / mutation alatoire Le croisement litiste est prsent

en section 4.3.1.2. Contrairement au croisement alatoire dans lequel chaque parent
transmet au hasard la moiti de ses gnes lenfant, dans le cas litiste les gnes
transmis sont choisis en fonction de leur qualit. Pour dterminer ce niveau de
qualit, une agrgation de la contribution des gnes chaque objectif est ralise,
suivant la pondration choisie alatoirement. La mutation alatoire est identique
celle prsente prcdemment.
Cette combinaison savre moins performante que la mthode avec croisement
alatoire et mutation alatoire (cf. 4.2) sur IH , avec en plus un algorithme plus
instable (cart type de IH plus grand).
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1077.372
1184.555
1143.831
-
-26.768
-26.590
-26.708
-
2125
3223
2781
-
0.240
0.289
0.269
0.023
Pop 800
Table 4.5 NSGA-II : croisement litiste et mutation alatoire

f1
f2
f3
NbSol Hypervolume
min
22787.135 1077.372 -27.001
2004
0.239
max 22787.135 1238.517 -26.562
3180
0.293
mean 22787.135 1163.751 -26.742
2590
0.271
std
0.025
min
max
mean
std
22787.135
22787.135
22787.135
-
1068.192
1266.107
1201.474
-
-26.978
-26.478
-26.799
-
2385
3618
3197
-
0.239
0.297
0.284
0.022
Pop 1000
Pop 400
min
max
mean
std
22787.135
22787.135
22787.135
-
1087.381
1379.408
1223.906
-
-27.016
-26.689
-26.847
-
2484
3963
3408
-
0.244
0.337
0.292
0.030
Croisement litiste / mutation premier voisin amliorant Les rsultats

sont issus de la combinaison des oprateurs de croisement et mutation dfinis audessus.
L aussi, la combinaison de ces oprateurs est moins performante que la mme
mutation combine avec le croisement alatoire. Linstabilit de lalgorithme se
confirme sur lanalyse des carts types de IH .
143
Pop 400
min
max
mean
std
f1
22787.135
22787.135
22787.135
-
f2
1031.162
1256.312
1172.886
-
f3
-27.230
-26.790
-26.940
-
NbSol
2251
3524
3151
-
Hypervolume
0.237
0.296
0.282
0.023
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1028.761
1217.010
1122.358
-
-26.891
-26.590
-26.722
-
2246
3682
2882
-
0.237
0.294
0.262
0.026
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1077.942
1256.312
1187.050
-
-26.872
-26.362
-26.708
-
2370
3819
3232
-
0.243
0.298
0.276
0.026
Pop 1000
Table 4.6 NSGA-II : croisement litiste et mutation premier voisin amliorant
min
max
mean
std
22787.135
22787.135
22787.135
-
1031.162
1266.107
1185.167
-
-26.962
-26.355
-26.785
-
2661
3877
3426
-
0.237
0.297
0.283
0.023
Croisement litiste / mutation meilleur voisin amliorant L encore les

rsultats sont issus de la combinaison des oprateurs de croisement et mutation
dfinis au-dessus.
Cette combinaison offre peu prs les mmes performances quavec le croisement
alatoire, mais avec plus dinstabilit sur lcart type de IH .
Pop 600
min
max
mean
std
22787.135
22787.135
22787.135
-
1184.555
1256.312
1211.669
-
-26.923
-26.729
-26.845
-
2749
3010
2891
-
0.292
0.299
0.295
0.003
Pop 800
min
max
mean
std
22787.135
22787.135
22787.135
-
1031.162
1256.312
1185.407
-
-27.039
-26.435
-26.817
-
2063
3201
2893
-
0.237
0.297
0.283
0.023
Pop 1000
Pop 400
Table 4.7 NSGA-II : croisement litiste et mutation meilleur voisin amliorant

f1
f2
f3
NbSol Hypervolume
min
22787.135 1196.200 -27.206
2540
0.291
max 22787.135 1237.517 -26.846
3097
0.298
mean 22787.135 1211.265 -27.015
2733
0.294
std
0.003
min
max
mean
std
22787.135
22787.135
22787.135
-
1087.381
1256.312
1205.781
-
-26.885
-26.651
-26.768
-
2222
3369
2982
-
0.244
0.299
0.287
0.021
Synthse des rsultats NSGA-II Il apparait aprs observation des rsultats

que les meilleures performances sont obtenues avec un croisement alatoire, combin avec une mutation vers le premier voisin amliorant pour une population de
1000 individus, et combin avec la mutation alatoire pour une population de 800
individus.
Pour les populations de petite taille (400 et 600 individus), la mthode la plus
performante est le croisement litiste avec une mutation vers le meilleur voisin amliorant (cf. tableau 4.7), mais elle reste infrieure au croisement alatoire appliqu
sur 1000 individus. On voit donc que la taille de la population a un impact trs fort
sur la mthode. Les grandes populations compensent les marches alatoires du fait
de la diversit des solutions ; au contraire les petites populations ne sont efficaces
quavec des marches plus dterministes car il ny a pas assez de diversit dans la
population.
La Figure 4.10 prsente la faon dont volue lindicateur IH pendant la recherche
pour diffrentes configurations de NSGA-II. Ceci permet de savoir comment la population se rapproche du front de Pareto au cours du temps, en fonction des oprateurs
gntiques et pour la meilleure taille de population. On rappelle quun hypervolume
grand est gage de qualit.
On remarque que la meilleure version de NSGA-II (croisement alatoire, mutation vers le premier voisin amliorant et taille de population 1000) fournit les
145
Figure 4.10 Evolution des indicateurs hypervolumes moyens de 6 configurations

NSGA-II
meilleurs rsultats trs rapidement. On voit notamment quaprs moins de 200.105

itrations elle surpasse toutes les autres configurations.
4.5.2.2
Rfrence avec PLS
PLS
Cette approche locale base de Pareto est dcrite de faon dtaille dans le
chapitre 3. Nous rappelons galement en section 4.5.2.3 quelques lments qui caractrisent PLS. Les rsultats obtenus sont synthtiss dans le tableau 4.8. Le premier
lment marquant concerne le nombre de solutions non-domines trouves par PLS.
Alors que NSGA-II atteint une seule fois les 5000 solutions trouves parmis toutes
les configurations testes, PLS atteint les 6400 solutions. Par ailleurs, la meilleure
valeur de lindicateur IH trouve par PLS est significativement moins bonne que
celle trouve pour NSGA-II. Ainsi PLS permet de trouver beaucoup de solutions
mais elles apportent souvent peu de diversit.
min
max
mean
std
Table 4.8 Rsultats de la recherche locale PLS

f1
f2
f3
NbSol Hypervolume
22787.135 1024.459 -25.184
4146
0.239
22787.135 1417.612 -25.047
6401
0.264
22787.135 1126.099 -25.081
4808
0.245
0.011

4.5.2.3
Rfrence avec FLSMO : un nouvel algorithme de recherche locale
Lalgorithme FLSMO (Fast Local Search Multiobjective) est une recherche locale base sur la notion de Pareto optimalit. Nous lavons propose dbut 2013
[Moalic 2013a] pour rsoudre ce problme de lauto-partage. Il sagit dun algorithme proche de PLS [Paquete 2004] et qui sest rvl tre particulirement efficace. Comme nous le verrons sur les Figures 4.12 et 4.13, il prsente lavantage de
converger plus rapidement que PLS.
Le principe est le suivant. Lalgorithme dmarre avec une premire solution gnre alatoirement qui est marque comme non exploite. Elle est alors ajoute
une population archive. Tant quil y a des solutions dans larchive qui ne sont pas
exploites, lalgorithme en choisit une alatoirement, note s, et explore son voisinage jusqu trouver un voisin s0 non-domin par larchive. s0 est alors ajoute
larchive et devient la nouvelle solution courante. Son voisinage est explor jusqu
trouver un nouveau voisin non domin par larchive. Ce processus est appliqu rcursivement jusqu tre dans un optimum local. Toute solution non domine par
larchive rencontre au cours de cette descente est ainsi ajoute larchive. Il sagit
de fait dune descente ralise partir de s. Lalgorithme 8 dcrit formellement ce
processus.
Algorithm 8 Fast Local Search for Multiobjective Problems
1: S init() /*init the solution set S with a random individual */
2: s select(S) /*select randomly a not explored solution from S*/
3: while s 6= do
4:
repeat
5:
s0 selectNeighbor(s) /*select randomly a neighbor of s not dominated by
S*/
6:
if s0 6= then
7:
s s0
8:
addNotDominated(s) /*add s in S and remove all dominated solutions*/
9:
end if
10:
until s0 =
11:
mark s as explored
12:
s select(S) /*select randomly a not explored solution from S*/
13: end while
Cet algorithme prsente lavantage dassurer une bonne intensification en exploitant les solutions non-domines dj trouves, tout en assurant une bonne diversit.
Pour rappel PLS fonctionne de faon assez semblable. Toutefois au lieu deffectuer une descente partir dune solution non exploite de larchive, PLS choisit une
147
solution s de larchive et explore son voisinage complet pour ajouter tous les voisins
non-domins larchive. La solution s est alors marque comme exploite.
FLSMO peut ainsi tre vu comme un algorithme avec recherche en profondeur dabord, puis en largeur. PLS par contre sapparente un parcours en largeur dabord, puis en profondeur. La Figure 4.11 illustre ce principe pour les deux
algorithmes.
Figure 4.11 Parcours PLS vs FLSMO
FLSMO
Les rsultats de la mthode FLSMO sur 5 excutions sont reports dans le tableau 4.9. Le nombre de solutions trouves avec FLSMO est significativement plus
faible quavec PLS, en moyenne, en minimum et en maximum. Lhypervolume est
galement plus petit mais trs lgrement seulement. Les solutions de FLSMO apportent en moyenne plus de diversit que celles de PLS.
min
max
mean
std
4.5.2.4
Table 4.9
f1
22787.135
22787.135
22787.135
-
Rsultats de la recherche locale FLSMO

f2
f3
NbSol Hypervolume
1012.214 -25.168
3992
0.235
1077.372 -25.047
4405
0.243
1044.340 -25.104
4246
0.239
0.003
Synthse des rfrences calcules
Les rsultats obtenus avec lalgorithme gntique NSGA-II, la recherche locale

PLS, et la nouvelle recherche locale que nous proposons FLSMO, permettent dextraire un certain nombre denseignements.

Premier enseignement : les approches locales sont significativement moins performantes que lapproche gntique. Mme la moins bonne configuration gntique en
matire dhypervolume moyen (0.262 pour le croisement litiste avec une mutation
vers le premier voisin amliorant et une population de taille 600) reste meilleure que
les rsultats obtenus par les recherches locales.
Deuxime enseignement : on se propose de regarder la faon dont convergent les
algorithmes. La Figure 4.12 montre comment en moyenne progressent les valeurs
de IH au cours du droulement de lalgorithme. On remarque que FLSMO labore
trs rapidement une bonne archive, et nest rattrap que tardivement par PLS.
Ici la contrainte de temps de calcul nest pas importante mais dans le cas o le
temps est un critre prendre en compte, FLSMO se rvle tre une approche trs
comptitive. Le zoom sur les 2.106 premires itrations de la Figure 4.13 montre en
effet que FLSMO est meilleur que NSGA-II jusqu 500.000 itrations et continue
tre nettement meilleur que PLS aprs 2.106 itrations.
Figure 4.12 Progression des algorithmes de rfrence

Pour confronter notre algorithme mmtique MEMO nous choisirons donc comme
rfrence les solutions trouves par NSGA-II. Lensemble sera compos de toutes les
solutions non-domines rencontres au cours des cinq excutions de lalgorithme, ce
qui en fait une rfrence a priori solide.
4.5.3
Dfinition du paramtrage de MEMO
De la mme faon que pour NSGA-II, nous analysons limpact des lments
ayant une influence sur le droulement de lalgorithme mmtique. En particulier
les rsultats suivants sont obtenus en faisant varier le croisement, qui comme avec
NSGA-II sera soit litiste soit alatoire, ainsi que la taille de la population.
149
Figure 4.13 Premires itrations des algorithmes de rfrence

Remarque : comme souvent dans le cadre dalgorithmes mmtiques, la taille
des populations est significativement plus petite que pour des algorithmes gntiques. Ceci sexplique par le rle que joue la population dans les deux cas. Comme
nous lavons vu, dans le cadre gntique cest le croisement qui joue un rle dintensificateur (on espre que les enfants soient globalement meilleurs que les parents). De
ce fait la population doit contenir une diversit suffisante pour limiter la "consanguinit" et viter que la population converge trop vite vers un mme individu. Au
contraire dans le cas dun algorithme mmtique le croisement joue un rle de diversificateur. Or une population trop grande a pour effet de dstructurer ce que
la recherche locale a fait (elle apporte trop de diversification). Il est ainsi frquent
de rencontrer des populations de taille comprise entre 5 et 20 selon les problmes
traits.
4.5.3.1
Croisement alatoire / mutation recherche locale
Le tableau 4.10 montre ce que donne le croisement alatoire en fonction du

nombre dindividus dans la population.
Comme nous pouvons le voir les populations de taille 15 et 20 fournissent le
meilleur indicateur hypervolume moyen. La population de taille 20 a trouv les
meilleurs rsultats pour les 3 mesures de IH , en minimum, maximum et moyenne.
Mais nous avons globalement de trs bons rsultats moyens, tous suprieurs 0,34
pour lensemble des populations. Lalgorithme est donc relativement peu sensible
pour des populations de 5 25 individus.
Remarquons galement que le nombre de solutions du front est beaucoup plus
petit avec MEMO quavec les trois autres approches. Le fait dobtenir de meilleures
Pop 10
min
max
mean
std
22787.135
22787.135
22787.135
-
1783.407
1874.759
1857.137
-
-25.432
-24.989
-25.210
-
2399
2749
2619
-
0.348
0.352
0.350
0.001
Pop 15
min
max
mean
std
22787.135
22787.135
22787.135
-
1520.241
1874.759
1832.427
-
-25.540
-25.088
-25.245
-
2457
2862
2700
-
0.346
0.352
0.351
0.002
Pop 20
Table 4.10 Rsultats de MEMO avec croisement alatoire

f1
f2
f3
NbSol Hypervolume
min
22787.135 1780.146 -25.571
2029
0.323
max 22787.135 1874.759 -25.123
2652
0.350
mean 22787.135 1838.390 -25.258
2443
0.345
std
0.006
min
max
mean
std
22787.135
22787.135
22787.135
-
1783.407
1874.759
1853.190
-
-25.561
-25.088
-25.234
-
2664
2853
2758
-
0.350
0.353
0.351
0.001
Pop 25
Pop 5
valeurs pour IH avec moins de solutions implique que les solutions trouves sont
rellement de meilleure qualit.
min
max
mean
std
22787.135
22787.135
22787.135
-
1473.509
1874.759
1825.475
-
-25.522
-25.088
-25.293
-
2140
2908
2763
-
0.314
0.353
0.350
0.008
4.5.3.2
Croisement litiste / mutation recherche locale
Le croisement litiste avait donn pour NSGA-II des rsultats moins bons que le
croisement alatoire. Nous souhaitons vrifier si cette observation se confirme dans
le cas mmtique.
Nous voyons dans le tableau 4.11 que les tailles de populations optimales sont
galement 15 et 20. Par contre, lindicateur IH est globalement moins bon que
lorsque le croisement se fait alatoirement. Nous retiendrons donc le croisement
alatoire qui apporte un gain sur la diversification de la recherche.
Pop 10
de MEMO avec croisement litiste

f3
NbSol Hypervolume
-25.685
2076
0.309
-25.088
2912
0.349
-25.332
2590
0.340
0.014
min
max
mean
std
22787.135
22787.135
22787.135
-
1520.241
1874.759
1756.767
-
-25.778
-25.192
-25.334
-
2435
3104
2861
-
0.339
0.353
0.348
0.003
Pop 15
Rsultats
f2
1517.531
1874.759
1746.403
-
min
max
mean
std
22787.135
22787.135
22787.135
-
1313.459
1874.759
1801.014
-
-25.610
-25.116
-25.316
-
2418
3174
2937
-
0.301
0.353
0.349
0.011
Pop 20
Table 4.11
f1
min
22787.135
max 22787.135
mean 22787.135
std
-
151
min
max
mean
std
22787.135
22787.135
22787.135
-
1415.791
1874.759
1716.701
-
-25.685
-25.022
-25.337
-
2338
3264
3064
-
0.338
0.354
0.349
0.004
Pop 25
Pop 5
min
max
mean
std
22787.135
22787.135
22787.135
-
1473.509
1874.759
1676.512
-
-25.777
-25.033
-25.390
-
2629
3315
3060
-
0.311
0.354
0.346
0.011
4.5.3.3
Synthse de lalgorithme mmtique MEMO
Lalgorithme MEMO a montr que, tout comme NSGA-II, le meilleur fonctionnement est obtenu avec un croisement alatoire. De plus une population de taille
20 fournit les meilleurs rsultats pour les deux types de croisement. On voit ainsi
quun croisement trop intensif nuit la recherche globale de lalgorithme. Il sagit
dun quilibre subtil trouver entre diversification et intensification.
Pour la suite de lanalyse nous utiliserons donc cette configuration de lalgorithme
en comparaison avec les algorithmes de rfrence.
4.5.4
Analyse des solutions de MEMO
La slection de lensemble de rfrence et de la configuration MEMO est base

sur lindicateur hypervolume. Toutefois comme nous lavons vu dautres indicateurs
existent et demeurent intressants tudier. Dans le tableau 4.12 nous reprenons
les rsultats de PLS, NSGA-II et MEMO en considrant galement les indicateurs

I+ et IC . Rappelons que I+ est dautant meilleur quil est petit, contrairement
IH et IC .
Table 4.12 Synthse des rsultats obtenus avec les algorithmes prsents
-1%
-8%
-2%
-
43.309
35.647
39.185
2.980
+7%
+47%
+8%
-
0.378
0.437
0.416
0.021
-9%
-12%
-6%
-
4706
5150
4863
-
0.293
0.339
0.311
0.022
+22%
+28%
+27%
-
15.078
0.649
9.330
6.731
-62%
-97%
-74%
-
0.118
0.309
0.189
0.081
-71%
-38%
-57%
-
2664
2853
2758
-
0.350
0.353
0.351
0.001
+46%
+33%
+43%
-
2.097
1.544
1.815
0.178
-94%
-93%
-95%
-
0.237
0.266
0.248
0.007
-43%
-46%
-44%
-
PLS
0.235
0.243
0.239
0.003
min
max
mean
std
0.239
0.264
0.245
0.011
FLSMO
IC
0.417
0%
0.499
0%
0.442
0%
0.033
-
min
max
mean
std
3992
4405
4246
-
NSGA-II
0%
0%
0%
-
I+
40.276
0%
24.261
0%
36.173
0%
6.878
-
min
max
mean
std
MEMO
IH
NbSol
4146
6401
4808
-
min
max
mean
std
Lindicateur I+ se rvle tre trs corrl avec IH . Ainsi lalgorithme mmtique

obtient la meilleure valeur pour IH et pour I+ .
Par contre lindicateur de contribution est nettement meilleur avec PLS quavec
MEMO ou mme NSGA-II. Tentons une explication. La recherche locale a tendance
trouver beaucoup de solutions proches les unes des autres. Cest le principe mme
de la progression par tude du voisinage. Ainsi si beaucoup de solutions se trouvent
dans une zone non-domine par les solutions de rfrence cela a pour effet daugmenter la valeur de IC , mme si ces solutions ne semblent pas trs intressantes.
La Figure 4.14 montre ainsi deux populations pour un problme bi-objectif de
maximisation. Bien que la population rouge soit plus intressante que la population
verte, en tout cas en termes de qualit des solutions du front, la population verte a
le meilleur indicateur de contribution. En effet, lorsque nous considrons toutes les
solutions (rouges et vertes) non-domines, il reste une majorit de solutions vertes.
Dans notre cas PLS retient 4808 solutions non-domines contre 2758 pour MEMO ;
sur cet indicateur cela donne un avantage certain PLS. Par contre, mme avec
4863 sur le front, NSGA-II reste plus mauvais que MEMO sur cet indicateur.
Cela montre bien que le choix dun indicateur pour tudier la qualit dune population en optimisation multiobjectif est primordial. Si seul lindicateur de contribu-
153
Figure 4.14 Comparaison de deux ensembles pour IC

tion avait t retenu on aurait conclu que PLS tait lapproche la plus performante,
alors quelle explore une partie moindre de lespace de recherche et que sur tous les
objectifs elle trouve globalement de moins bonnes valeurs.
La visualisation des nuages de solutions dans lespace des critres de la Figure 4.15 montre quen effet MEMO est bien meilleur que PLS, en considrant les
projections sur chacun des objectifs. Chaque couleur correspond un algorithme :
en bleu les rsultats de MEMO et en rouge les rsultats de rfrence obtenus avec
PLS.
Il est ainsi possible de voir que PLS reste cantonn une petite partie de lespace
de recherche alors que MEMO trouve des solutions bien mieux diversifies : MEMO
permet de trouver des solutions dans des sous-espaces de recherche inexplors par
PLS. De plus, en termes dintensification PLS trouve plus de solutions proches les
unes des autres mais de moins bonne qualit. Notamment pour f2 MEMO trouve
des solutions bien meilleures que PLS.
Comparons maintenant les projections des solutions de MEMO et de NSGAII. Dans un premier temps la Figure 4.16 montre ce que rvlaient les indicateurs
I+ et IH , savoir que MEMO construit un ensemble de solutions meilleur que
NSGA-II, tant en termes de diversit que dintensit. Mais en comparant galement
les solutions rouges des Figures 4.15 et 4.16 (PLS et NSGA-II), on vrifie bien que
NSGA-II propose des solutions mieux diversifies que PLS.
Figure 4.15 Solutions PLS et MEMO projetes sur f1 -f2 ; f1 -f3 et f2 -f3
155
Figure 4.16 Solutions NSGA-II et MEMO projetes sur f1 -f2 ; f1 -f3 et f2 -f3
4.5.5
Analyse de la progression de lalgorithme MEMO
Pour bien comprendre le fonctionnement dun algorithme il est intressant de

disposer doutils permettant de suivre sa progression. Dans cette section nous proposons dtudier comment volue la valeur de IH au cours du droulement de lalgorithme. Comme nous lavons fait pour les algorithmes de rfrence, cela permettra
didentifier comment convergent les algorithmes vers lensemble final de solutions.
Nous avons calcul la valeur IH de larchive des solutions non-domines toutes les
100.000 itrations, durant lexcution de lalgorithme. Prcisons quune itration
correspond une configuration, cest--dire au dplacement dune station.
La Figure 4.17 traduit lvolution de IH pour PLS en bleu, NSGA-II en rouge et
MEMO en vert. Comme nous lavions dj remarqu lors de lanalyse des rsultats de
rfrence, NSGA-II dpasse trs rapidement PLS, aprs quelques minutes seulement.
Mais ici nous voyons galement lapport de MEMO en comparaison NSGA-II. Nous
pouvons voir notamment qu partir de 20.106 itrations NSGA-II tend stagner
alors que MEMO continue progresser.
Figure 4.17 Progression de PLS, NSGA-II et MEMO

De plus on peut constater une progression de MEMO plus continue que NSGAII. En effet NSGA-II en bleu commence par tre moins bon que MEMO, mais trs
rapidement passe lgrement au-dessus avant de repasser sous la courbe de MEMO.
Enfin il semble intressant de remarquer que PLS converge en moyenne vers une
valeur de 0,245 aprs 60.106 itrations. Ce niveau de IH = 0, 245 est atteint par
MEMO aprs quelques itrations seulement, soit en quelques secondes contre plus
4.6. De loptimisation laide la dcision multiobjectif
157
dune heure pour PLS ce qui est une performance extrmement intressante.
4.6
4.6.1
De loptimisation laide la dcision multiobjectif

Contexte de laide la dcision
Lorsque lon aborde un problme multiobjectif (MOP), trois phases peuvent tre
identifies. Il y a tout dabord la modlisation du problme, mathmatiquement,
avec la dfinition des fonctions objectifs. Ensuite, il y a la phase de recherche des
solutions. Cest l que se concentre la grande majorit des travaux et publications
scientifiques, travers llaboration de mtaheuristiques, capables de trouver une
solution optimale ou plus souvent aujourdhui un ensemble de solutions de meilleur
compromis. Enfin, il y a la prise de dcision qui doit conduire le dcideur faire le
meilleur choix pour son problme.
On se rend compte que gnrer lensemble Pareto nest pas suffisant. Lorsquun
algorithme retourne 1.000 solutions ou plus, aussi bonnes soient-elles en termes de
Pareto optimalit, la personne qui doit en retenir une peut rapidement tre perdue.
Choisir une solution est un processus complexe et dont le rsultat est risqu.
Selon les approches, la prise en compte des prfrences du dcideur peut intervenir de diffrentes faons. On distingue ainsi gnralement trois schmas : lexpression
du choix a priori, lexpression du choix a posteriori, et enfin lexpression du choix
interactif. Comme nous lavons vu dans le chapitre 3, certaines approches de rsolution des MOP intgrent directement les prfrences du dcideur. Cest le cas
notamment lorsque le MOP est transform en problme mono-objectif. Dans la mthode dagrgation [Cohon 1978] par exemple, le dcideur dfinit le vecteur de poids
qui donne limportance souhaite chaque objectif dans la fonction agrge. Le
choix est dans ce cas a priori et cela suppose non seulement que le dcideur sait ce
quil veut mais quen plus lalgorithme est capable de le fournir. Mais souvent dans
les approches Pareto aucune prfrence du dcideur nest intgre. Cest ce qui fait
la force de ces mthodes, mais cest galement ce qui peut poser certaines difficults.
En particulier un algorithme peut trouver de nombreuses solutions non-domines,
qui pourtant ne rpondront peut-tre pas aux attentes du dcideur. Les prfrences
du dcideur ne sont prises en compte quune fois lensemble des solutions gnr.
Le choix est exprim a posteriori. Enfin, lorsque les prfrences de lutilisateur sont
exprimes durant la recherche on parle de choix interactif.
Quelque soit le moment o intervient le dcideur, la prise en compte de ses
prfrences pour laider choisir une solution est un lment fondamental. Dans
cette section nous proposons notre approche pour aborder laide la dcision. Pour
plus de dtails sur les approches classiques daide la dcision, nous renvoyons le

lecteur au diffrents ouvrages de Bernard Roy, et particulirement [Roy 1985]. Nous
prsentons ici la plate-forme geoLogic que nous avons dveloppe pour aiguiller
le dcideur dans sa comprhension dun problme de mobilit et de dploiement
dinfrastructures. Cet outil sinscrit clairement dans la catgorie des approches dites
a posteriori. En effet, lalgorithme de recherche que nous avons propos sattache
construire lensemble Pareto le plus exhaustif. Par contre le dcideur nintervient
pas pour guider la construction de cet ensemble.
4.6.2
La plate-forme geoLogic
Elle constitue un socle commun de nombreux projets. Nous lavons dvelopp

paralllement cette thse en vue de pouvoir y intgrer les diffrents projets caractre gographique, en cours et venir. La Figure 4.18 prsente une vue densemble
de lorganisation de cette plate-forme.
Figure 4.18 Plate-forme geoLogic

Il sagit dune plate-forme de type SIG (Systme dInformation Gographique)
qui intgre, en plus dun module de gestion des donnes gographiques, diffrents
modules orients mtier. Parmi les lments de base on retrouve le maillage des
donnes gographiques, la prise en compte des flux de dplacements entre zones
gographiques, entre mailles plus fines, ou encore suivant les rseaux routiers. Toutes
les donnes intgres cette plate-forme peuvent tre considres comme statiques
ou dynamiques, avec pour les donns dynamiques la possibilit de dfinir le pas de
temps. La Figure 4.19 illustre quelques vues issues de cet outil. De gauche droite,
cette figure montre tout dabord la description vectorielle du territoire sur fond de
carte. On distingue notamment des objets de type polygone (en bleu) qui localisent
159
les habitations, ou encore des objets de type ligne (polyline) pour reprsenter les
axes routiers. Ensuite nous voyons le rsultat obtenu aprs application dune grille
de maillage sur les donnes vectorielles. Chaque couleur reprsente une catgorie
de sol, avec en bleu les habitations, en orange les commerces, etc. Lillustration
suivante montre les dplacements sortant de la zone slectionne un moment donn.
Lorientation des flches indique les destinations et leur paisseur le nombre de
personnes faisant ce dplacement. Enfin, la vue de droite reprsente sous forme de
"vaisseaux sanguins" les axes de rue avec une intensit sur la mobilit observe. Par
effet de transparence les axes les plus emprunts ressortent plus intensment.
Figure 4.19 Vues issues de la plate-fome geoLogic

La plate-forme propose est ralise en C++ standard, et sappuie particulirement sur la STL (Standard Template Library). Elle peut ainsi tre dploye sur
les OS existants tels que Linux, Mac OS et Windows. Pour permettre laffichage
des calques gographiques de faon particulirement efficace, en termes de fluidit
et de quantit de donnes, cette partie est dporte sur la carte graphique travers
lutilisation de la bibliothque OpenGL (Open Graphics Library).
Enfin, lintgration de modules projets est facilite grce au recours un canevas
gnrique, la classe virtuelle geoM odule, qui permet de renseigner de faon aise
les trois composants dun module : la partie contrle, la partie calcul et la partie
visualisation.
4.6.3
Aide la dcision multiobjectif
Lorsquune dcision doit tre prise, en matire de cration dinfrastructures ou

de localisation de services, elle ne peut se baser uniquement sur un niveau de performance des solutions. En effet, la prise en compte des ralits du terrain, des
orientations politiques vises, et de lexpertise du dcideur, sont autant de facteurs
agissant sur la dcision finale. Ds lors, la mise en regard de lespace de dcision (implantation des solutions) et de lespace des critres (valuation des solutions) savre
tre essentielle. Limportant dans le problme de lauto-partage que nous optimisons,
est de montrer au dcideur comment une faon dimplanter les stations se situe en
termes dvaluation, et rciproquement comment un niveau de performance se situe
en termes de solutions correspondantes.
Le choix que nous avons fait est donc de proposer au dcideur une vue globale de toutes les solutions non-domines, afin de lui laisser le soin de les analyser
et den extraire la solution de son choix. Encore faut-il le guider au mieux dans
cette tche. Pour rpondre ce besoin nous avons ralis un module spcifique aux
problmes doptimisation multiobjectif caractre gographique. Il permet son
utilisateur dappliquer les diffrents algorithmes ddis aux MOP prsents dans ce
chapitre, tels que PLS [Paquete 2004], FLSMO [Moalic 2013a], NSGA-II [Deb 2002]
et MEMO [Moalic 2013b], ainsi que des approches Tabou [Moalic 2012] ou encore des
variantes de PLS. De plus il permet galement de visualiser les solutions proposes
simultanment dans les deux espaces, lespace de dcision qui est ici lenvironnement
cartographique, et lespace des critres qui est lvaluation des fonctions objectif.
Loutil permet cette mise en correspondance, en plus de la fonctionnalit permettant de filtrer les solutions. La Figure 4.20 propose un aperu de linterface de
cet outil. La fentre principale permet de visualiser lenvironnement cartographique,
o sont affichs les calques souhaits tels que la carte, la description vectorielle du
territoire (shapefile), la description maille du territoire, les flux de dplacements,
et limplantation des stations pour les solutions calcules par lalgorithme doptimisation. Il sagit donc de lespace de dcision. La fentre du bas permet quant
elle dafficher les solutions Pareto optimales dans lespace des critres. Les solutions
de lespace trois dimensions (trois fonctions objectif) sont projetes sur les axes
considrs deux deux (f1 f2 , f1 f3 , f2 f3 ). Enfin, le panel de droite permet lutilisateur de choisir les calques afficher, les diffrents paramtres pour
loptimisation, etc. Il sagit du panel de contrle.
Le nuage de points dans lespace objectif permet de disposer de la vue densemble
des solutions non domines trouves par le module doptimisation. Parmi toutes ces
solutions, la solution slectionne est reprsente en rouge. Ceci permet dune part
de dterminer o elle se situe dans lespace objectif vis vis de chaque critre,
mais aussi didentifier quelle configuration physique correspond cette solution en
rfrence la localisation de stations. Dans la Figure 4.20 chaque disque rouge
161
Figure 4.20 Outil daide la dcision de geoLogic
correspond limplantation dune station et les trois fentres du dessous montrent

la distribution des solutions dans lespace des trois critres f1 , f2 et f3 pris deux
deux.
Nous lavons indiqu, parmi toutes les solutions Pareto optimales il est vraisemblable que de nombreuses solutions ne soient pas acceptables : toutes les rgions de
lespace des critres ne sont pas intressantes pour le dcideur. Pour laider dans son
choix, nous avons mis en place des filtres qui lui permettent de cibler certaines parties de lespace des critres. Cela peut tre vu comme une approche -contrainte a
posteriori, avec lavantage de proposer au dcideur une vue densemble des solutions,
et ainsi utiliser ces paramtres de faon interactive.
Sur la Figure 4.21 les filtres sont appliqus. Ils consistent donc fixer des valeurs
minimales pour f1 , f2 et f3 dans lespace des critres. Les solutions dsactives
(exclues par les filtres) par lutilisateur apparaissent en bleu et les solutions actives
(qui respectent les filtres) apparaissent en vert. Ainsi le dcideur peut se focaliser sur
les solutions satisfaisant les valeurs seuils quil fixe, et identifier les emplacements
correspondants sur lespace gographique. La solution entoure dun cercle blanc
dans lespace des critres correspond limplantation prsente sur la carte.
Rciproquement il est possible de choisir un site de lespace de dcision pour
visualiser comment se rpartissent les solutions ayant une station sur ce site dans
lespace objectif. La Figure 4.22 prsente les solutions dans lespace des critres
ayant une station sur le site du cercle rouge. A gauche, on prsente les solutions
Figure 4.21 Filtres sur lespace des critres

dans lespace f1 (abscisse), f2 (ordonnes) ; au centre dans lespace f1 (abscisse),
f3 (ordonnes) et droite dans lespace f2 (abscisse), f3 (ordonnes). Lintensit
du violet de chaque site traduit le nombre de solutions ayant une station cet
emplacement. On voit notamment que le site slectionn est utilis dans beaucoup
de solutions efficaces pour f1 . En effet, dans la vue de gauche de lespace des critres,
les solutions slectionnes (en vert) sont regroupes essentiellement vers la droite
(bonne valeur de f1 ). Mais on distingue galement quelques bonnes configurations
pour f2 . Elles se retrouvent toujours dans la vue de gauche vers le haut (f2 est sur
laxe des ordonnes). Par contre le fait de choisir ce site pour y mettre une station
ne fournit pas de bons rsultats pour f3 .
Figure 4.22 Filtres sur lespace de dcision

Ainsi si un site intresse particulirement le dcideur, il peut le slectionner et
tudier sil appartient des solutions dont lvaluation peut lui convenir. A linverse,
cette dmarche peut permettre de justifier labsence de station sur certains sites, en
163
montrant quil sagit de sites nappartenant aucune solution satisfaisante.

Il sagit bien ici dun outil permettant de comprendre le problme trait et de
guider la prise de dcision quant la solution dployer.
4.6.4
Les projets sappuyant sur la plate-forme geoLogic
Au cours de ces dernires annes, paralllement aux travaux prsents jusqu

maintenant, nous avons mis en oeuvre la plate-forme geoLogic dans divers projets,
toujours pour des problmes daide la dcision en matire de transport. Ici laide
la dcision ne sentend pas forcment comme une phase dun processus doptimisation. On tend la dfinition daide la dcision aux outils permettant un
utilisateur de mieux comprendre son problme, o se situent les besoins, en vue de
guider ses choix en matire de dploiement dinfrastructures sans forcment faire
appel un algorithme doptimisation ensuite.
4.6.4.1
Le projet Territoire Mobile
Collaborations : SMTC Belfort (socit mixte dexploitation du rseau de

bus), socit Orange, Agence dUrbanisme, collectivits territoriales du Territoire
de Belfort (2006-2009)
Ce projet labellis par le ple de comptitivit Vhicules du Futur a t prsent
dans le chapitre 2. Cest en effet dans le cadre de ce projet que nous avons pu exprimenter et mettre en oeuvre nos modles de prsence sappuyant sur les tlphones
portables. Ce projet, novateur quant lutilisation de la tlphonie mobile pour
comprendre comment volue la population sur le territoire au cours de la journe,
tait destin amliorer loffre en transport en commun.
La mise en relation du fonctionnement du rseau dalors, et de la localisation de
la population issue de notre modle, devait faire ressortir les ventuels dysfonctionnements du service. La Figure 4.23 en propose une illustration. Elle propose une vue
densemble du Territoire de Belfort avec la rpartition de la population construite
partir de la tlphonie mobile. Le zoom sur le centre ville rvle la mise en correspondance entre la localisation des personnes et le rseau de bus. Les disques de
chaque arrt traduisent le nombre de montes ayant eu lieu dans les bus ce moment de la journe. Cet outil a notamment permis de se rendre compte de zones
ne se trouvant pas proximit dun arrt de bus mais o de nombreuses personnes
se rendaient. Lobjet ntait donc pas doptimiser le rseau de transport mais de
permettre lexploitant danalyser par lui-mme ce qui pouvait tre amlior.
Figure 4.23 Territoire Mobile : analyse dun rseau de bus
4.6.4.2
Le projet EcoTaxi
Collaborations : Renault Technocentre, Taxis G7, Taxis Gescop, assureur

MMA (2009-2010)
Ce projet men avec le Technocentre de Renault (centre de recherche et de
conception Renault) avait pour vocation de permettre une meilleure comprhension
de la faon dont les taxis se dplacent Paris, et par extension quels sont les besoins
en mobilit. Ce travail sest inscrit dans la politique actuelle du constructeur automobile visant dvelopper les vhicules lectriques. Lobjectif de ce projet, outre de
rvler comment les taxis se dplacent tout au long de la journe, tait de proposer
un module doptimisation pour la localisation et le dimensionnement de stations
dchange automatique de batteries pour des taxis lectriques.
Lenjeu ici est de placer les stations de faon ce quun maximum de taxis
puissent tre convertis en vhicules lectriques sans rencontrer de problme dautonomie et donc de panne.
Les donnes de mobilit utilises dans ce cadre provenaient directement des
socits de taxis. Des relevs de positions de plus de 5000 taxis ont t fait durant
trois semaines partir de leurs GPS embarqus. La Figure 4.24 montre sous forme
de carte de chaleur o se situent les taxis ayant besoin de se recharger selon les
hypothses dautonomie dfinies par lutilisateur. Les zones rouges en particulier
indiquent les lieux o les besoins sont les plus importants.
165
Figure 4.24 ecoTaxi : optimisation dinfrastructures de stations dchange automatique de batteries

Lapproche utilise pour raliser loptimisation est une approche constructive qui
fonctionne avec un algorithme de descente. Le logiciel, en sappuyant sur les relevs
de trajectoires et sur les hypothses de fonctionnement des vhicules lectriques,
propose successivement lemplacement optimal pour placer la prochaine station en
tenant compte des stations places aux tapes prcdentes et des taxis en besoin
dchange de batterie. Libre au dcideur de suivre la recommandation de loutil ou
de la positionner ailleurs. En rsultat, le logiciel fournit une analyse complte des
performances estimes avec le rseau de stations dchange propos : nombre de taxis
venant se recharger par plage horaire et par station, nombre de taxis pouvant passer
en lectrique sans rencontrer de problme, nombre de taxis en panne dautonomie
au cours de leurs courses, etc.
4.6.4.3
Le projet PUMDP
Collaborations : Bureau sociologique du transport Chronos, La FING, Club

des Villes et Territoires Cyclables, cabinet davocats 11.100.34, Socit Keolis Groupe,
Communauts dAgglomrations de Rennes et Angers, ville de Lorient (2010-2012).
Le projet ANR PUMDP (Partages, Usages et Modlisations de la Donne Publique) tait galement labellis par le ple de comptitivit Vhicule du Futur.
Lobjectif de ce projet tait de fournir des outils de diagnostic, dvaluation et de
planification urbaine. Le cas dtude retenu concernait les modes de dplacements
dits actifs, la marche et le vlo. Le logiciel dvelopp dans le cadre de ce projet est

un outil daide la dcision qui ne propose pas directement de solution optimale
mettre en oeuvre mais qui prsente le niveau dadquation entre les dplacements
actifs (la demande) et les infrastructures disponibles tels que les amnagements cyclables (loffre).
Figure 4.25 PUMDP : adquation entre offre et demande pour une mobilit
vlo
La Figure 4.25 montre ainsi en jaune, les rseaux adapts aux vlos et emprunts,
en blanc, les tronons adapts aux vlos mais peu emprunts, et surtout en rouge, les
axes non amnags qui sont emprunts par des vlos. Cet outil permet notamment
dattirer lattention des collectivits concernes sur les axes quil faudrait amnager
en priorit.
Les donnes utilises pour dterminer la faon dont les cyclistes se dplacent sont
de diffrentes natures. Elles vont denqutes ralises sur le terrain des relevs GPS
effectus par des volontaires, tout en passant par des comptages faits au niveau des
stations de vlo en libre service (lieu et moment de prise dun vlo, lieu et moment
de dpose du vlo).
4.6.4.4
Les projets venir
Outre les projets prcdents, deux nouveaux projets sinscrivent dans la continuit du travail ralis durant cette thse et sappuieront sur la plate-forme geoLogic : SYSMO, un projet Investissement dAvenir de lADEME (appel projets
2011), et NORM-ATIS, un projet de lANR (appel projet 2013). Leur dmarrage
est prvu pour janvier 2014.
Le projet Investissement dAvenir traite de la mobilit et notamment de lutilisation de la tlphonie mobile pour modliser les dplacements. En ce sens il sagit
dune suite directe du travail prsent dans le chapitre 2. Alors que dans le cas trait
dans cette thse les informations tlphoniques ne permettent que de construire des
densits de prsence dynamiques, avec ce nouveau projet les donnes tlphoniques
167
permettront de construire des itinraires. Ce niveau de finesse supplmentaire doit

nous inciter faire voluer les modles prsents ici, afin de reconstituer des matrices de dplacements origines/destinations sur un territoire, et pour caractriser
ces dplacements, en termes de vitesse par exemple.
Par ailleurs, ce projet comporte un volet consacr aux nouveaux usages de mobilit et loptimisation dans les transports. Laccent est mis sur la construction
dune offre de transport multimodale optimise, appuye sur larticulation entre les
diffrents modes disponibles tels que les transports en commun, lauto-partage, les
vhicules individuels, etc. Il sagit donc non seulement dune extension du travail
prsent dans le chapitre 2 mais galement du travail prsent dans ce chapitre.
Ce projet, labellis par les ples de comptitivit Systematic, Moveo et Advancity, va aboutir notamment la mise au point dun logiciel de planification et de
gouvernance de la mobilit.
Le deuxime projet, financ par lANR et soutenu par les ples de comptitivit Moveo et Vhicule du Futur, sattache tablir des normes sur les donnes
impliques dans la modlisation de la mobilit et de linformation trafic. Il sagit
donc dun travail de fond sur les faons de modliser les dplacements, de manire
standardiser les donnes et les modles entre les diffrents territoires, en France
dans un premier temps, mais avec lobjectif clair dtablir de nouveaux standards
europens. Ce projet sinscrit galement dans la continuit du travail ralis dans
cette thse.
Notons que ces deux nouveaux projets porteront sur des volumes de donnes
beaucoup plus importants que ceux que nous avons traits jusqualors, permettant
une validation des modles et algorithmes prsents dans cette thse une chelle
bien plus large.
4.6.4.5
Un transfert technologique en cours
Les travaux que nous avons raliss dans le cadre de cette thse, et plus gnralement autour de la plate-forme geoLogic, nous amnent actuellement un transfert
technologique vers une PME, la socit Web Geo Services, qui apporte la structure et
les comptences permettant de les valoriser. En effet, la tlphonie comme nouveau
marqueur de mobilit ouvre certes des portes mais ncessite beaucoup de traitements
appropris pour leur donner du sens. Les modles, qui incluent donnes de mobilit
(tlphoniques, enqutes ou autres) mais aussi les composantes gographiques et
socio-conomiques pour construire une information pertinente sur les dplacements
de la population, constituent une plus value certaine pour les collectivits.
4.7
Synthse
Dans ce chapitre nous avons prsent le processus complet permettant de traiter un problme doptimisation multiobjectif rel (MOP), de la dfinition du problme, la conception dune heuristique permettant de le rsoudre en passant par la
modlisation du problme et des fonctions objectifs associes. Les problmes combinatoires multiobjectifs rencontrs dans la littrature peuvent tre abords sous
plusieurs angles, en fonction du besoin de prcision, du temps de dveloppement
ncessaire ou encore du temps de calcul. Parmi les diffrentes approches permettant
dapprhender un MOP, les algorithmes mmtiques ont montr leur efficacit sur
de nombreux problmes. Ces approches hybrides, incorporant une recherche locale
lintrieur dun algorithme gntique, ont par ailleurs t souvent utilises pour rsoudre des problmes mono-objectifs et fournissent encore aujourdhui les meilleures
performances sur de nombreux problmes. Ltude de ces approches nous a permis
de dfinir notre propre algorithme mmtique, MEMO (Memetic Evolutionary MultiObjective).
Lalgorithme MEMO est une hybridation de NSGA-II, algorithme certainement
le plus rpandu parmi les approches gntiques pour rsoudre un MOP, avec une
descente simple du type Hill Climbing. Alors que NSGA-II est un algorithme multiobjectif, et donc directement prvu pour fonctionner sur ce type de problme, lalgorithme de descente simple est adapt aux problmes mono-objectifs. Pour cause,
un tel algorithme repose sur le fait quune transition vers un voisin nest acceptable
que si elle permet damliorer la fitness. Or comme nous lavons montr, une telle
valeur de fitness ne peut tre dtermine en contexte multiobjectif. Les solutions
dun MOP ont une valuation distincte pour chaque objectif, et trs souvent ne sont
pas comparables entre elles. Dans les seuls cas o tous les objectifs de s1 sont soit
meilleurs, soit moins bons, que ceux de s2 , une relation dordre existe entre s1 et s2 .
Mais dans le cas largement majoritaire o certains objectifs seulement de s1 sont
meilleurs que ceux de s2 et les autres moins bons, il nest plus possible de dterminer
qui de s1 et s2 est la meilleure. Il nest donc pas possible dappliquer un algorithme
de descente directement.
Nous avons propos alors de procder une agrgation des fonctions objectifs
pour rassembler les diffrents objectifs en une valeur de fitness unique lors de la
recherche locale. La faon dagrger les objectifs est dterminante dans le droulement de lalgorithme. Il est possible de simplement faire la somme des objectifs,
aprs stre assur de la normalisation des objectifs pour les ramener un domaine
de valeurs comparables. Ainsi on considre que tous les objectifs sont favoriser
de la mme faon. Il est par ailleurs possible dattribuer un poids chaque objectif
selon limportance quon souhaite lui donner. On tend alors vers des approches de
type lexicographique o lon est capable dordonner prioritairement les objectifs.
Dans notre approche nous proposons de gnrer une agrgation selon une pondra-
4.7. Synthse
169
tion alatoire, recalcule pour chaque recherche locale. Cette approche permet de ne
pas favoriser une direction de recherche (direction dfinie par la pondration), mais
au contraire dexplorer au maximum lespace de recherche.
Pour appliquer lalgorithme propos, nous avons prsent le problme particulier de la localisation optimale des stations pour un service dauto-partage. Alors
que jusqu prsent les approches rencontres dans la littrature pour rsoudre ce
problme taient des approches exactes, qui ne permettaient de rsoudre quune version simplifie du problme (maillage du territoire en maille dun kilomtre carr),
lintroduction dune approche heuristique a permis doffrir de nouvelles perspectives. Nous avons propos une modlisation du problme sous forme de MOP qui
permet de construire des configurations diverses du service, o chaque configuration est une faon de localiser n stations. Les solutions retournes par lalgorithme
sont les solutions rencontres appartenant lensemble Pareto, non pas rel car
cet ensemble nest pas connu, mais lensemble Pareto compos de toutes les solutions non-domines entre elles que peut trouver lalgorithme. La constitution de cet
ensemble Pareto suppose la dfinition des fonctions objectifs du problme. Nous
avons propos et formalis trois fonctions permettant de trouver les configurations
qui (1) sadressent au maximum de flux de dplacements, (2) permettent une autorgulation du service maximisant lquilibre entre flux entrant / flux sortant une
mme plage horaire et (3) favorisent un fonctionnement tout au long de la journe
et non uniquement aux heures de pointe.
Lapplication dune heuristique un problme donn ncessite souvent de dfinir
certains paramtres. Il peut sagir de paramtres numriques, mais cela peut galement tre des oprateurs part entire. Afin dobtenir le meilleur fonctionnement
de lalgorithme MEMO nous avons procd une srie de tests en faisant varier
la taille de la population et loprateur de croisement de lalgorithme mmtique.
Nous avons montr travers ces tests quune population de 20 individus couple
un croisement alatoire fournissait les meilleurs rsultats. Le niveau de performance
dun algorithme ne peut tre dfini quen le comparant dautres approches. Cest
pourquoi nous avons propos de recourir trois approches, dont deux reconnues
pour tre performantes en multiobjectif, afin de confronter notre algorithme. Nous
avons choisi une approche locale, PLS, et une approche gntique, NSGA-II. Une
deuxime recherche locale, FLSMO, est un algorithme que nous avons propos et
galement test dans ce chapitre.
Lalgorithme mmtique MEMO que nous proposons sest rvl tre de loin le
plus performant. Plus performant que la recherche locale PLS sans grande surprise,
mais galement significativement plus performant que NSGA-II qui a t paramtr
pour fournir les meilleurs rsultats possibles. La comparaison entre les algorithmes
a ncessit lintroduction des indicateurs de distance I+ , de contribution IC et
surtout lindicateur hypervolume IH qui est le meilleur reflet de la qualit dun
ensemble de solutions. Ces indicateurs nous ont permis de quantifier le gain apport

par lalgorithme mmtique sur les autres approches testes.
Lensemble des solutions Pareto optimales tant construit, nous nous sommes
attachs ensuite guider le dcideur vers la solution retenir, en fonction de ses
besoins et de son expertise. Cette tape, essentielle dans la rsolution dun MOP,
sinscrit dans le domaine de laide la dcision. Lobjet ici ntait pas de proposer
un algorithme capable de dterminer la meilleure solution parmi lensemble des
solutions non-domines, mais plutt de fournir au dcideur des outils efficaces qui
lui permettent de mieux comprendre son problme et de choisir par lui-mme la
solution la plus approprie.
Pour rpondre ce besoin, et plus gnralement aux problmes poss lorsque
lon traite de mobilit, nous avons dvelopp la plate-forme geoLogic. Elle permet,
travers la gestion dun environnement cartographique et des panels de contrle, de
prsenter simultanment les rsultats issus des heuristiques dans les deux espaces :
lespace de dcision (localisation des stations) et lespace des critres (front de Pareto). Lajout doutils tels que des filtres sur les donnes permet au dcideur de se
focaliser sur les rgions de lespace de recherche qui lintressent.
Enfin, nous avons prsent quelques projets daide la dcision que nous avons
dvelopp sur la plate-forme geoLogic ainsi que des projets venir.
Conclusion gnrale et
perspectives
Ce mmoire de thse traite de deux aspects essentiels dans le domaine du transport : lidentification des besoins en mobilit, savoir la demande, et loptimisation
des infrastructures permettant de rpondre cette demande, savoir loffre. Ces
deux volets sont abords sous un regard novateur. La construction de la demande
tout dabord, o un modle est propos pour identifier comment au cours de la
journe la population se rpartie sur un territoire. Ce modle original repose sur des
donnes issues du fonctionnement dun rseau cellulaire et sur une caractrisation
spatio-temporelle du sursol. La construction de loffre ensuite, o le cas dtude retenu est la localisation de stations pour un service dauto-partage. Une approche
heuristique est propose pour rsoudre ce problme combinatoire, modlis sous la
forme dun problme multiobjectif.
Principales contributions
La modlisation de la mobilit Nous avons dans une premire partie de ce
mmoire abord le thme de la modlisation de la mobilit des personnes. Pour permettre une analyse pertinente de la mobilit, nous avons propos une taxinomie des
modles existants en fonction de leur niveau de ralisme. Trois familles de modle
ont t identifies : les modles alatoires, les modles dterministes, et les modles
hybrides. Les modles hybrides se sont rvls tre les plus mme de modliser
finement la mobilit, suffisamment finement pour permettre des applications en ingnierie du transport. Ils reposent sur des donnes denqutes ou de comptages routiers
pour identifier la demande ; mais ils intgrent galement des processus stochastiques
permettant de reflter les fluctuations pouvant survenir dun jour lautre. Ces modles hybrides, tels quils sont utiliss par les experts de la mobilit, sont eux-mmes
rpartis en trois grandes classes : les modles agrgs, les modles dsagrgs et les
modles activit-centr. Cette dernire classe qui sappuie sur la notion dactivit,
permet de rendre compte du chainage des dplacements. Les travaux les plus rcents
dans ce domaine ont montr que les modles de transport du futur seront de cette
nature, certes complexe modliser mais traduisant le plus justement les besoins en
mobilit.
Pour complter les approches existantes en matire de modlisation de la mobilit, nous avons vu que la tlphonie mobile pouvait tre utilise comme un marqueur
de prsence sur le territoire. Nous avons propos un modle de distribution spatiotemporel des mobiles bas sur les donnes tlphoniques et sur la description du
172
sursol. La prise en compte du sursol est latout majeur du modle propos par rapport aux approches qui existaient jusqualors. Les quelques rares travaux sappuyant
sur la tlphonie mobile pour marquer la prsence des personnes sur un territoire
ne permettent pas un niveau de prcision au-del de la cellule radio. Lassociation
dun vecteur de poids dattraction spatio-temporel un dcoupage fin du territoire,
nous a permis dintgrer la notion dactivit notre modle. A ce titre il sinscrit
dans les modles davenir identifis par les experts du transport.
La modlisation du problme de lauto-partage Modliser la mobilit na de

sens que si cela permet damliorer le fonctionnement de diffrents services et daider
prendre des dcisions en matire de dploiement dinfrastructures notamment.
Dans la deuxime partie de ce mmoire nous nous sommes intresss au service
de lauto-partage lectrique. Pour choisir lemplacement optimal de chaque station
o seront emprunts et rendus les vhicules, il apparait primordial didentifier les
critres intervenant sur le bon fonctionnement du service. Nous avons cette fin
identifi trois fonctions objectif, qui traduisent trois caractristiques importantes.
Tout dabord les stations doivent tre localises de faon satisfaire un maximum
de demande de dplacements. Un deuxime objectif est de maximiser lautonomie du
service en limitant les situations de saturation, telles que des stations sans vhicule,
ou au contraire sans place disponible pour dposer un vhicule. Enfin, un tel service
doit permettre de satisfaire des demandes rgulirement rparties sur la journe,
pas uniquement aux priodes de pointe. Cette faon novatrice dapprhender ce
problme a t exprimente et valide dans un contexte rel.
MEMO, une mtaheuristique multiobjectif hybride Enfin, notre troisime

contribution concerne loptimisation combinatoire applique aux problmes multiobjectifs (MOP). Afin de rsoudre des problmes doptimisation complexes, nous
avons vu que les heuristiques apportaient des rponses particulirement efficaces. En
particulier, trois classes de mthodes ont t prsentes : la premire regroupe les
approches par transformation du MOP en un problme mono-objectif, la deuxime
concerne les approches non-Pareto, et enfin la troisime est compose des approches
Pareto. Une quatrime classe, qui fournit souvent les meilleures performances, repose
sur lhybridation de composantes issues des trois classes principales. Lalgorithme
MEMO (Memetic Evolutionary MultiObjective) propos dans ce mmoire fait partie de ces approches hybrides. Il repose sur lalgorithme gntique NSGA-II, qui fait
rfrence dans le domaine de la rsolution des MOP, dans lequel la mutation est
remplace par une recherche locale. Lalgorithme mmtique ainsi propos a t expriment sur le problme de localisation de stations pour le service dauto-partage
prsent prcdemment. Il a montr de trs bonnes performances en comparaison
aux approches classiques NSGA-II, PLS et FLSMO.
173
Perspectives et travaux en cours

Chaque champ explor dans ce mmoire laisse entrevoir de nombreuses perspectives pour amliorer les performances obtenues ou encore pour rsoudre dautres
types de problme. Nous proposons quelques aspects qui nous semblent particulirement intressant approfondir et que nous avons parfois dj commenc tudier.
Ces perspectives sont prsentes autour de trois axes correspondant aux trois contributions prsentes.
La modlisation de la mobilit base sur la tlphonie mobile La tlphonie mobile peut tre vue comme un formidable rseau de capteurs, ne ncessitant aucun investissement dinfrastructure complmentaire ce qui existe dj. Les
donnes gnres et enregistres chaque communication contiennent une richesse
dinformations sous exploites lheure actuelle. Le dfi qui sinscrit dans la ligne
des travaux que nous avons prsents concerne la smantique que lon sera capable
dattribuer ces donnes.
Le modle de rpartition spatio-temporel des mobiles que nous avons propos
sattache rpartir statistiquement un nombre de mobiles dans une cellule radio.
Ce nombre fournit une information de prsence, mais ne permet pas de suivre le
cheminement dun mobile individuellement. Pour cette raison, lapproche propose
sapparente ce qui se fait dans les modles de mobilit de type agrg. La distribution effectue par le modle sur le territoire en fonction des caractristiques
du sursol introduit cependant la notation dactivit associe. Il semble trs prometteur de pousser plus loin ce concept dactivit mais il ncessite de nouveaux types
de donnes issues des rseaux cellulaires. Depuis lanne dernire en France, de
nouvelles donnes tlphoniques permettent didentifier chaque mobile individuellement et anonymement. Cela ne remet pas en cause le modle que nous proposons,
au contraire cela va permettre de lenrichir en intgrant plus finement la notion
dactivit. Le fait de pouvoir identifier un chainage de dplacements doit en effet
permettre de prciser la caractrisation du profil de mobilit de chaque mobile. Cette
perspective fait partie intgrante des projets SYSMO (Investissement dAvenir de
lADEME) et NORM-ATIS (ANR) prsents en section 4.6.4.4.
La modlisation du problme de lauto-partage Le problme de localisation de stations pour un service dauto-partage lectrique est abord sous un nouvel
angle dans ce mmoire. Comme nous lavons dcrit, outre le fait de positionner les
stations pour rpondre la plus forte demande, un des points essentiels est dviter
les situations de blocage rencontres lorsquune station ne contient plus de vhicule
ou au contraire lorsque plus aucune place nest disponible. Pour rpondre cette
problmatique nous avons dfini des fonctions objectif qui tendent limiter ces phnomnes de blocage. Mais lintroduction dun service de jockeyage pour redployer
174
les vhicules entre stations bloques reste indispensable et constitue une perspective
intressante prendre en compte. Il sagit dintroduire cet aspect dans la modlisation mathmatique du problme en termes de cot de personnel et de gain sur
lutilisation des vhicules.
Evidemment les perspectives sont nombreuses. Parmi celles envisager court
terme, nous pensons aussi une gnralisation du modle afin de ltendre au cas
des vlos en libre service. En effet, de plus en plus de villes travers le monde (la
France est prcurseur dans le domaine) envisagent ce service sans recourir de tels
modles qui permettraient pourtant de rationaliser les investissements. Il sagit l
certainement de quelque chose approfondir.
Une mtaheuristique multiobjectif hybride avec gestion de lincertitude

Lalgorithme MEMO tel que nous lavons appliqu pour localiser des stations dautopartage sappuie sur une matrice fixe qui dcrit la demande en service de mobilit au
cours dune journe moyenne. La constitution de cette matrice revt une importance
primordiale quant aux rsultats que peut fournir lalgorithme doptimisation. Or,
dans la ralit, la demande est une donne instable, qui suit des lois stochastiques.
La matrice de mobilit utilise dcrit donc une estimation de la demande moyenne.
La prise en compte de lincertitude sur les donnes, mais aussi de la variabilit
de lutilisation du service dun jour lautre, mriterait quune approche robuste
soit envisage. Nous ne lavons pas abord dans ce travail mais il sagit l dune
perspective qui nous semble intressante.
Des perspectives pour les mtaheuristiques hybrides Enfin, parmi les nombreux champs qui souvrent suite ce travail, nous portons un intrt tout particulier
aux mtaheuristiques hybrides. Elles ont t tudies dans ce mmoire pour rsoudre
des problmes multiobjectifs, mais elles constituent encore un formidable objet de
recherche en contexte mono-objectif galement. Lintgration dune recherche locale
au sein dun algorithme gntique telle que nous lavons prsente a montre les trs
bons niveaux de performance quil tait possible datteindre. Nous avons appliqu
des mcanismes similaires pour rsoudre le problme acadmique de coloriage de
graphe, un problme mono-objectif connu pour tre trs difficile. Lquilibre entre
intensification et diversification fait partie des lments critiques lorsque lon a recours des approches heuristiques. Afin den assurer une meilleure maitrise, nous
avons propos un algorithme mmtique trs particulier [Gondran 2013] qui sappuie
sur une population deux individus seulement. Ce travail nous a permis de diminuer
le nombre de couleurs ncessaires pour rsoudre certaines instances DIMACS, par
rapport aux approches les plus performantes prsentes dans [Galinier 2013]. Cet
algorithme laisse entrevoir de nouveaux axes de recherche que nous ne manquerons
pas dexplorer.
Liste des publications

Confrences internationales avec comit de lecture
[1] Laurent Moalic, Sid Lamrous, and Alexandre Caminada. A memetic algorithm
for multiobjective problems. In GECCO - Genetic and Evolutionary Computation Conference, pages 9394, Amsterdam, Netherlands, july 2013.
[2] Laurent Moalic, Sid Lamrous, and Alexandre Caminada. A multiobjective
memetic algorithm for solving the carsharing problem. In WORLDCOMP13
- The 2013 World Congress in Computer Science, Computer Engineering, and
Applied Computing, Las Vegas, USA, july 2013.
[3] Alexandre Gondran and Laurent Moalic. Analysis of memetic approaches for
graph coloring problem. In 26th European Conference on Operational Research,
Rome, Italy, june 2013.
[4] Laurent Moalic, Alexandre Caminada, and Sid Lamrous. A fast local search
approach for multiobjective problems. In LION - Learning and Intelligent Optimization Conference, Catania, Italy, january 2013.
[5] Laurent Moalic, Sid Lamrous, and Alexandre Caminada. Multiobjective tabu
algorithm for optimizing carsharing systems. In International Conference on
Metaheuristics and Nature Inspired Computing, META12, Sousse, Tunisia, october 2012.
[6] K. Ait Ali, A. Gondran, A. Caminada, and L. Moalic. Vehicular radio connectivity in urban environment. In Wireless Communication Systems (ISWCS),
2010 7th International Symposium on, pages 305 309, sept. 2010.
[7] K. Ait Ali, M. Lalam, L. Moalic, and O. Baala. V-mbmm : Vehicular maskbased mobility model. In Networks (ICN), 2010 Ninth International Conference
on, pages 243 248, april 2010.
[8] C. Joumaa, L. Moalic, S. Lamrous, and A. Caminada. Mobility models comparative study. In Computers Industrial Engineering, 2009. CIE 2009. International Conference on, pages 1798 1803, july 2009.
[9] C. Joumaa, L. Moalic, S. Lamrous, and A. Caminada. A simulation based
mobility models comparative study. In Proceedings of the 2nd International
Conference on Simulation Tools and Techniques, Simutools09, pages 41 :1
41 :2, ICST, Brussels, Belgium, Belgium, 2009. ICST (Institute for Computer
Sciences, Social-Informatics and Telecommunications Engineering).
[10] Sid Lamrous, Alexandre Caminada, Laurent Moalic, and Chibli Joumaa. Cartographie de dplacements de la ralit la modlisation. In 4me Symposium
international Images, Multimdia, Applications graphiques et Environnements
(IMAGE), Guelma, Algeria, november 2008.
Confrences et communications nationales

[1] Laurent Moalic, Sid Lamrous, and Alexandre Caminada. Aide la dcision
dans un contexte multi-objectifs. In 14e congrs annuel de la Socit franaise
de Recherche Oprationnelle et dAide la Dcision, Troyes, France, feb. 2013.
[2] Rabih Zakaria, Mohammad Dib, Alexandre Caminada, Laurent Moalic, and
Omar Rifi. Cars relocation method for a carsharing system. In 14e congrs annuel de la Socit franaise de Recherche Oprationnelle et dAide la Dcision,
Troyes, France, feb. 2013.
[3] Sid Lamrous, Laurent Moalic, and Alexandre Caminada. Analyse des carts
entre loffre dinfrastructures et les pratiques des cyclistes. In Forum Chronos
le vlo en continu, Paris, France, octobre 2012.
[4] Alexandre Caminada, Laurent Moalic, and Sid Lamrous. Connatre, valuer,
promouvoir, booster. . . les modes actifs : quelles donnes ? In 19me Congrs
du Club des Villes et Territoires Cyclabes, Dijon, France, octobre 2011.
[5] Alexandre Caminada, Laurent Moalic, and Sid Lamrous. Les enqutes mnages
dplacements. In Atelier mtier. 32e Rencontre des agences durbanisme, Paris,
France, octobre 2011.
[6] Laurent Moalic, Sid Lamrous, and Alexandre Caminada. Analyse de sensibilit
dun algorithme glouton pour des services go-localiss. In 12e congrs annuel
de la Socit franaise de Recherche Oprationnelle et dAide la Dcision,
Saint-Etienne, France, Mars 2011.
[7] Sid Lamrous, Laurent Moalic, Chibli Joumaa, and Alexandre Caminada. Observation dynamique de la population partir de la tlphonie mobile. In
Journes du CERTU sur la mobilit urbaine Les recueils et les sources de
donnes sur les dplacements, Paris, France, Janvier 2010.
[8] Laurent Moalic, Sid Lamrous, and Alexandre Caminada. Utilisation des rseaux cellulaires pour localiser une population. In Journe thmatique Gopositionnement et mobilits intelligentes, Belfort, France, mars 2010.
[9] Laurent Moalic, Alexandre Caminada, and Sid Lamrous. Une vision dynamique
(spatiale et temporelle) de la mobilit urbaine en se basant sur le rseau de
tlphonie mobile et les flux de dplacements dans le territoire. In Dplacements
et trafics : enqutes, donnes, exploitations. FNAU - Club Transport et Mobilit,
Paris, France, fvrier 2009.
[10] Chibli Joumaa, Laurent Moalic, Sid Lamrous, and Alexandre Caminada. Mobility models comparative study. In Journes non thmatiques ResCom, Strasbourg, France, octobre 2008.
Bibliographie
[Ahas 2005] Rein Ahas et Ular Mark. Location based services - new challenges for
planning and public administration? Futures, vol. 37, no. 6, pages 547 561,
2005. (Cit en page 29.)
[Ahas 2010] Rein Ahas, Anto Aasa, Siiri Silm et Margus Tiru. Daily rhythms of suburban commuters movements in the Tallinn metropolitan area: Case study
with mobile positioning data. Transportation Research Part C: Emerging
Technologies, vol. 18, no. 1, pages 45 54, 2010. (Cit en page 34.)
[Ait Ali 2010a] K. Ait Ali, A. Gondran, A. Caminada et L. Moalic. Vehicular radio connectivity in urban environment. In Wireless Communication Systems
(ISWCS), 2010 7th International Symposium on, pages 305 309, sept. 2010.
(Cit en page 41.)
[Ait Ali 2010b] K. Ait Ali, M. Lalam, L. Moalic et O. Baala. V-MBMM: Vehicular
Mask-Based Mobility Model. In Networks (ICN), 2010 Ninth International
Conference on, pages 243 248, april 2010. (Cit en pages 21 et 41.)
[Akyildiz 1996] I.F. Akyildiz, J.S.M. Ho et Yi-Bing Lin. Movement-based location
update and selective paging for PCS networks. Networking, IEEE/ACM
Transactions on, vol. 4, no. 4, pages 629638, 1996. (Cit en page 12.)
[Akyildiz 2000] Ian F. Akyildiz, Yi bing Lin, Wei ru Lai et Rong jaye Chen. A new
random walk model for PCS networks. IEEE Journal of Selected Areas in
Communications, pages 12541260, 2000. (Cit en page 12.)
[Azarm 1994] K. Azarm et G. Schmidt. Integrated mobile robot motion planning
and execution in changing indoor environments. In Intelligent Robots and
Systems 94. Advanced Robotic Systems and the Real World, IROS 94.
Proceedings of the IEEE/RSJ/GI International Conference on, volume 1,
pages 298305 vol.1, 1994. (Cit en page 19.)
[Bar-Noy 1994] A. Bar-Noy, I. Kessler et M. Sidi. Mobile users: to update or not to
update? In INFOCOM 94. Networking for Global Communications., 13th
Proceedings IEEE, pages 570576 vol.2, 1994. (Cit en pages vii, 13 et 14.)
[Barth 2002] Matthew Barth et Susan Shaheen. Shared-Use Vehicle Systems:
Framework for Classifying Carsharing, Station Cars, and Combined Approaches. Transportation Research Record: Journal of the Transportation
Research Board, vol. 1791, no. -1, pages 105112, 01 2002. (Cit en page 125.)
[Basseur 2003] Matthieu Basseur, Franck Seynhaeve et El-Ghazali Talbi. Adaptive
mechanisms for multi-objective evolutionary algorithms. In IMACS multiconference, Computational Engineering in Systems Applications (CESA03),
pages 7286, Lille, France, July 2003. (Cit en page 103.)
178
Bibliographie
[Bettstetter 2001] Christian Bettstetter. Smooth is better than sharp: a random

mobility model for simulation of wireless networks. In Proceedings of the
4th ACM international workshop on Modeling, analysis and simulation of
wireless and mobile systems, MSWIM 01, pages 1927, New York, NY,
USA, 2001. ACM. (Cit en page 16.)
[Bettstetter 2003] C. Bettstetter, G. Resta et P. Santi. The node distribution of
the random waypoint mobility model for wireless ad hoc networks. Mobile
Computing, IEEE Transactions on, vol. 2, no. 3, pages 257269, 2003. (Cit
en page 15.)
[Beume 2007] Nicola Beume, Boris Naujoks et Michael Emmerich. SMS-EMOA:
Multiobjective selection based on dominated hypervolume. European Journal
of Operational Research, vol. 181, no. 3, pages 1653 1669, 2007. (Cit en
pages 101 et 109.)
[Bittner 2005] S. Bittner, W.-U. Raffel et M. Scholz. The area graph-based mobility
model and its impact on data dissemination. In Pervasive Computing and
Communications Workshops, 2005. PerCom 2005 Workshops. Third IEEE
International Conference on, pages 268272, 2005. (Cit en page 27.)
[Bonnel 2002] Patrick Bonnel. Prvision de la demande de transport. PhD thesis,
Universit Lumire-Lyon II, 2002. (Cit en page 21.)
[Brockhoff 2008] Dimo Brockhoff, Tobias Friedrich et Frank Neumann. Analyzing Hypervolume Indicator Based Algorithms. In Gnter Rudolph, Thomas
Jansen, Simon Lucas, Carlo Poloni et Nicola Beume, editeurs, Parallel Problem Solving from Nature PPSN X, volume 5199 of Lecture Notes in Computer Science, pages 651660. Springer Berlin Heidelberg, 2008. (Cit en
page 101.)
[Burulitisz 2004] A. Burulitisz, S. Imre et S. Szabo. On the accuracy of mobility
modelling in wireless networks. In Communications, 2004 IEEE International
Conference on, volume 4, pages 23022306 Vol.4, 2004. (Cit en page 13.)
[Caceres 2007] N. Caceres, J.P. Wideberg et F.G. Benitez. Deriving origin destination data from a mobile phone network. Intelligent Transport Systems, IET,
vol. 1, no. 1, pages 15 26, march 2007. (Cit en page 34.)
[Caceres 2012] N. Caceres, L. M. Romero, F. G. Benitez et J. M. del Castillo. Traffic
Flow Estimation Models Using Cellular Phone Data. Intelligent Transportation Systems, IEEE Transactions on, vol. 13, no. 3, pages 1430 1441, sept.
2012. (Cit en page 33.)
[Calabrese 2009] Francesco Calabrese. Wikicity: Real-time location-sensitive tools
for the city, pages 390413. IGI Global, Hershey, PA, USA, 2009. (Cit en
page 30.)
[Calabrese 2010] Francesco Calabrese, Francisco Pereira, Giusy Di Lorenzo, Liang
Liu et Carlo Ratti. The Geography of Taste: Analyzing Cell-Phone Mobility
and Social Events. In Patrik Floren, Antonio Krger et Mirjana Spasojevic,
Bibliographie
179
editeurs, Pervasive Computing, volume 6030 of Lecture Notes in Computer

Science, pages 2237. Springer Berlin / Heidelberg, 2010. (Cit en page 33.)
[Calabrese 2011] F. Calabrese, G. Di Lorenzo, Liang Liu et C. Ratti. Estimating Origin-Destination Flows Using Mobile Phone Location Data. Pervasive
Computing, IEEE, vol. 10, no. 4, pages 3644, April 2011. (Cit en page 34.)
[Calabrese 2013] Francesco Calabrese, Mi Diao, Giusy Di Lorenzo, Joseph Ferreira
Jr. et Carlo Ratti. Understanding individual mobility patterns from urban
sensing data: A mobile phone trace example. Transportation Research Part
C: Emerging Technologies, vol. 26, no. 0, pages 301 313, 2013. (Cit en
page 33.)
[Camp 2002] Tracy Camp, Jeff Boleng et Vanessa Davies. A survey of mobility
models for ad hoc network research. Wireless Communications and Mobile
Computing, vol. 2, no. 5, pages 483502, 2002. (Cit en pages vii, 12 et 16.)
[Campbell 2008] Scott W. Campbell et Yong Jin Park. Social Implications of Mobile Telephony: The Rise of Personal Communication Society. Sociology
Compass, vol. 2, no. 2, pages 371387, 2008. (Cit en page 40.)
[Cano 2004a] J.-C. Cano et P. Manzoni. Group mobility impact over TCP and CBR
traffic in mobile ad hoc networks. In Parallel, Distributed and NetworkBased Processing, 2004. Proceedings. 12th Euromicro Conference on, pages
382389, 2004. (Cit en page 15.)
[Cano 2004b] J.-C. Cano, P. Manzoni et M. Sanchez. Evaluating the impact of group
mobility on the performance of mobile ad hoc networks. In Communications,
2004 IEEE International Conference on, volume 7, pages 40394043 Vol.7,
2004. (Cit en page 15.)
[Chariete 2013] Abderrahim Chariete, Oumaya Baala et Alexandre Caminada. The
impact of ground-surfaces on the mobile traffic for LTE cellular networks
deployment. In Wireless Days, Valencia, Spain, november 2013. (Cit en
page 41.)
[Coello Coello 1998] CarlosA. Coello Coello. Using the Min-Max Method to Solve
Multiobjective Optimization Problems with Genetic Algorithms. In Helder
Coelho, editeur, Progress in Artificial Intelligence, IBERAMIA 98, volume
1484 of Lecture Notes in Computer Science, pages 303313. Springer Berlin
Heidelberg, 1998. (Cit en page 91.)
[Coello 2004] C.A.C. Coello et G.B. Lamont. Applications of multi-objective evolutionary algorithms, volume 1. World Scientific Publishing Company Incorporated, 2004. (Cit en page 112.)
[Coello 2007] Carlos A. Coello Coello, Gary B Lamont et David A. Van Veldhuizen.
Evolutionary algorithms for solving multi-objective problems : Second edition. Springer Science+Business Media, LLC, Boston, MA, 2007. (Cit en
pages 80 et 115.)
[Cohon 1978] J. L. Cohon. Multiobjective programming and planning. Academic
Press, New York [etc.], 1978. (Cit en page 157.)
180
Bibliographie
[Collette 2002] Yann Collette et Patrick Siarry. Optimisation multiobjectif. Ed.

Techniques Ingnieur, 2002. (Cit en page 108.)
[Couronne 2011] T. Couronne, A.-M. Olteanu et Z. Smoreda. Urban Mobility: Velocity and Uncertainty in Mobile Phone Data. In Privacy, security, risk and
trust (passat), 2011 ieee third international conference on and 2011 ieee third
international conference on social computing (socialcom), pages 1425 1430,
oct. 2011. (Cit en page 35.)
[de Almeida Correia 2012] Goncalo Homem de Almeida Correia et Antonio Pais Antunes. Optimization approach to depot location and trip selection in one-way
carsharing systems. Transportation Research Part E: Logistics and Transportation Review, vol. 48, no. 1, pages 233 247, 2012. (Cit en page 126.)
[Deb 2001] Kalyanmoy Deb et Tushar Goel. Controlled Elitist Non-dominated
Sorting Genetic Algorithms for Better Convergence. In Proceedings of the
First International Conference on Evolutionary Multi-Criterion Optimization, EMO 01, pages 6781, London, UK, UK, 2001. Springer-Verlag. (Cit
en page 87.)
[Deb 2002] K. Deb, A. Pratap, S. Agarwal et T. Meyarivan. A fast and elitist
multiobjective genetic algorithm: NSGA-2. Evolutionary Computation, IEEE
Transactions on, vol. 6, no. 2, pages 182 197, apr 2002. (Cit en pages 93,
94, 109, 115, 117 et 160.)
[Deb 2003] Kalyanmoy Deb, Manikanth Mohan et Shikhar Mishra. Towards a Quick
Computation of Well-Spread Pareto-Optimal Solutions. In CarlosM. Fonseca,
PeterJ. Fleming, Eckart Zitzler, Lothar Thiele et Kalyanmoy Deb, editeurs,
Evolutionary Multi-Criterion Optimization, volume 2632 of Lecture Notes in
Computer Science, pages 222236. Springer Berlin Heidelberg, 2003. (Cit
en page 96.)
[Deb 2005] Kalyanmoy Deb, Manikanth Mohan et Shikhar Mishra. Evaluating
the epsilon-Domination Based Multi-Objective Evolutionary Algorithm for
a Quick Computation of Pareto-Optimal Solutions. Evolutionary Computation, vol. 13, no. 4, pages 501525, 2013/10/07 2005. (Cit en page 94.)
[Dowek 2007] Gilles Dowek. Les mtamorphoses du calcul : une tonnante histoire
de mathmatiques. Le Pommier 2007 (18-Saint-Amand-Montrond, Paris,
2007. (Cit en page 83.)
[Duan 2011] Zhengyu Duan, Liang Liu et Shang Wang. MobilePulse: Dynamic
profiling of land use pattern and OD matrix estimation from 10 million individual cell phone records in Shanghai. In Geoinformatics, 2011 19th International Conference on, pages 1 6, june 2011. (Cit en page 34.)
[Erbas 2001] F. Erbas, J. Steuer, D. Eggesieker, K. Kyamakya et K. Jobinann. A
regular path recognition method and prediction of user movements in wireless
networks. In Vehicular Technology Conference, 2001. VTC 2001 Fall. IEEE
VTS 54th, volume 4, pages 26722676 vol.4, 2001. (Cit en pages vii et 19.)
Bibliographie
181
[Erbas 2002] F. Erbas, K. Kyamakya, J. Steuer et K. Jobmann. On the user profiles

and the prediction of user movements in wireless networks. In Personal, Indoor and Mobile Radio Communications, 2002. The 13th IEEE International
Symposium on, volume 5, pages 22822286 vol.5, 2002. (Cit en page 19.)
[Fonseca 1993] Carlos M. Fonseca et Peter J. Fleming. Genetic Algorithms for Multiobjective Optimization: Formulation, Discussion and Generalization, 1993.
(Cit en page 93.)
[Francesco 2006] CALABRESE Francesco et RATTI Carlo. Real time Rome. NETCOM, vol. 20, no. 3-4, pages 247257, 2006. (Cit en page 30.)
[Frias-Martinez 2012] Vanessa Frias-Martinez, Cristina Soguero et Enrique FriasMartinez. Estimation of urban commuting patterns using cellphone network
data. In Proceedings of the ACM SIGKDD International Workshop on Urban
Computing, UrbComp 12, pages 916, New York, NY, USA, 2012. ACM.
(Cit en page 34.)
[Galinier 2013] Philippe Galinier, Jean-Philippe Hamiez, Jin-Kao Hao et Daniel Porumbel. Recent Advances in Graph Vertex Coloring. In Ivan Zelinka, Vclav
Snel et Ajith Abraham, editeurs, Handbook of Optimization, volume 38 of
Intelligent Systems Reference Library, pages 505528. Springer Berlin Heidelberg, 2013. (Cit en pages 112 et 174.)
[Gandibleux 1997] Xavier Gandibleux, Nazik Mezdaoui et Arnaud Frville. A Tabu
Search Procedure to Solve MultiObjective Combinatorial Optimization Problems. In Rafael Caballero, Francisco Ruiz et Ralph Steuer, editeurs, Advances
in Multiple Objective and Goal Programming, volume 455 of Lecture Notes
in Economics and Mathematical Systems, pages 291300. Springer Berlin
Heidelberg, 1997. (Cit en page 90.)
[Garey 1979] Michael R. Garey et David S. Johnson. Computers and intractability;
a guide to the theory of np-completeness. W. H. Freeman & Co., New York,
NY, USA, 1979. (Cit en page 83.)
[Goldberg 1989] David E. Goldberg. Genetic algorithms in search, optimization and
machine learning. Addison-Wesley Longman Publishing Co., Inc., Boston,
MA, USA, 1st dition, 1989. (Cit en pages 93 et 94.)
[Gondran 2013] Alexandre Gondran et Laurent Moalic. Analysis of Memetic Approaches for Graph Coloring Problem. In 26th European Conference on Operational Research, Rome, Italy, june 2013. (Cit en page 174.)
[Gonzalez 2008] Marta C. Gonzalez, Cesar A. Hidalgo et Albert-Laszlo Barabasi.
Understanding individual human mobility patterns.
Nature, vol. 453,
no. 7196, pages 779782, 06 2008. (Cit en page 33.)
[Hansen 1997] Michael Pilegaard Hansen. Tabu Search for Multiobjective Optimization: MOTS. In MCDM97. Springer-Verlag, 1997. (Cit en page 90.)
[Hansen 2001] Nikolaus Hansen et Andreas Ostermeier. Completely Derandomized
Self-Adaptation in Evolution Strategies. Evol. Comput., vol. 9, no. 2, pages
159195, Juin 2001. (Cit en page 101.)
182
Bibliographie
[Ho 1995] Joseph S. M. Ho et Ian F. Akyildiz. Mobile user location update and
paging under delay constraints. Wirel. Netw., vol. 1, no. 4, pages 413425,
Dcembre 1995. (Cit en page 12.)
[Holleczek 2013] Thomas Holleczek, Liang Yu, Joseph K Lee, Oliver Senn, Kristian
Kloeckl, Carlo Ratti et Patrick Jaillet. Digital breadcrumbs: Detecting urban
mobility patterns and transport mode choices from cellphone networks. arXiv
preprint arXiv:1308.6705, 2013. (Cit en page 33.)
[Hong 1999] Xiaoyan Hong, Mario Gerla, Guangyu Pei et Ching-Chuan Chiang. A
group mobility model for ad hoc wireless networks. In Proceedings of the
2nd ACM international workshop on Modeling, analysis and simulation of
wireless and mobile systems, MSWiM 99, pages 5360, New York, NY, USA,
1999. ACM. (Cit en page 15.)
[Hoteit 2013] Sahar Hoteit, Stefano Secci, Stanislav Sobolevsky, Guy Pujolle et
Carlo Ratti. Estimating Real Human Trajectories through Mobile Phone
Data. In Mobile Data Management (MDM), 2013 IEEE 14th International
Conference on, volume 2, pages 148153. IEEE, 2013. (Cit en page 33.)
[Igel 2007] Christian Igel, Nikolaus Hansen et Stefan Roth. Covariance Matrix
Adaptation for Multi-objective Optimization. Evolutionary Computation,
vol. 15, no. 1, pages 128, 2013/10/09 2007. (Cit en page 101.)
[Ishibuchi 1998] H. Ishibuchi et T. Murata. A multi-objective genetic local search
algorithm and its application to flowshop scheduling. Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, vol. 28,
no. 3, pages 392403, 1998. (Cit en pages 89 et 102.)
[Jardosh 2005] A.P. Jardosh, E.M. Belding-Royer, K.C. Almeroth et S. Suri. Realworld environment models for mobile network evaluation. Selected Areas in
Communications, IEEE Journal on, vol. 23, no. 3, pages 622632, 2005. (Cit
en pages vii et 28.)
[Jaszkiewicz 2002] Andrzej Jaszkiewicz. Genetic local search for multi-objective
combinatorial optimization. European Journal of Operational Research,
vol. 137, no. 1, pages 50 71, 2002. (Cit en pages 87, 103 et 112.)
[Jeannic 2011] Thomas Le Jeannic, Philippe Roussel et Dominique Francois. LamobilitdesFranais,panoramaissudelenqutenationale transports et dplacements 2008. La Revue du Service de lObservation et des Statistiques (SOeS)
du Commissariat Gnral au Dveloppement Durable (CGDD), 2011. (Cit
en page 70.)
[Jeon 2000] Wha Sook Jeon et Dong Geun Jeong. Performance of improved probabilistic location update scheme for cellular mobile networks. Vehicular Technology, IEEE Transactions on, vol. 49, no. 6, pages 21642173, 2000. (Cit
en page 12.)
[Joumaa 2007] C. Joumaa, A. Caminada et S. Lamrous. Mask Based Mobility Model
A new mobility model with smooth trajectories. In Modeling and Optimiza-
Bibliographie
183
tion in Mobile, Ad Hoc and Wireless Networks and Workshops, 2007. WiOpt
2007. 5th International Symposium on, pages 16, 2007. (Cit en page 20.)
[Joumaa 2009a] C. Joumaa, L. Moalic, S. Lamrous et A. Caminada. Mobility models
comparative study. In Computers Industrial Engineering, 2009. CIE 2009.
International Conference on, pages 1798 1803, july 2009. (Cit en page 41.)
[Joumaa 2009b] C. Joumaa, L. Moalic, S. Lamrous et A. Caminada. A simulation based mobility models comparative study. In Proceedings of the 2nd
International Conference on Simulation Tools and Techniques, Simutools09,
pages 41:141:2, ICST, Brussels, Belgium, Belgium, 2009. ICST (Institute
for Computer Sciences, Social-Informatics and Telecommunications Engineering). (Cit en page 41.)
[Kammann 2003] J. Kammann, M. Angermann et B. Lami. A new mobility model
based on maps. In Vehicular Technology Conference, 2003. VTC 2003-Fall.
2003 IEEE 58th, volume 5, pages 30453049 Vol.5, 2003. (Cit en pages vii,
19 et 20.)
[Kang 2013] Chaogui Kang, Stanislav Sobolevsky, Yu Liu et Carlo Ratti. Exploring
Human Movements in Singapore: A Comparative Analysis Based on Mobile
Phone and Taxicab Usages. UrbComp13, Chicago, Illinois, USA., August
11-14 2013. (Cit en page 32.)
[Kim 1998] Tai Suk Kim, Min Young Chung, Dan Keun Sung et M. Sengoku. Mobility modeling and traffic analysis in three-dimensional indoor environments.
Vehicular Technology, IEEE Transactions on, vol. 47, no. 2, pages 546557,
1998. (Cit en page 26.)
[Kim 2000] Tai Suk Kim, Jae Kyun Kwon et Dan Keun Sung. Mobility modeling
and traffic analysis in three-dimensional high-rise building environments. Vehicular Technology, IEEE Transactions on, vol. 49, no. 5, pages 16331640,
2000. (Cit en page 26.)
[Knowles 1999] J. Knowles et D. Corne. The Pareto archived evolution strategy:
a new baseline algorithm for Pareto multiobjective optimisation. In Evolutionary Computation, 1999. CEC 99. Proceedings of the 1999 Congress on,
volume 1, pages 3 vol. (xxxvii+2348), 1999. (Cit en page 99.)
[Knowles 2000] J.D. Knowles et D.W. Corne. M-PAES: a memetic algorithm for
multiobjective optimization. In Evolutionary Computation, 2000. Proceedings of the 2000 Congress on, volume 1, pages 325 332 vol.1, 2000. (Cit en
pages 87 et 114.)
[Lam 1997] D. Lam, D.C. Cox et J. Widom. Teletraffic modeling for personal communications services. Communications Magazine, IEEE, vol. 35, no. 2, pages
7987, 1997. (Cit en pages 17 et 18.)
[Lamrous 2008] Sid Lamrous, Alexandre Caminada, Laurent Moalic et Chibli
Joumaa. Cartographie de dplacements De la ralit la modlisation. In
4me Symposium international Images, Multimdia, Applications graphiques
184
Bibliographie
et Environnements (IMAGE), Guelma, Algeria, november 2008. (Cit en
pages 46 et 50.)
[Lee 1961] C. Y. Lee. An Algorithm for Path Connections and Its Applications.
Electronic Computers, IRE Transactions on, vol. EC-10, no. 3, pages 346
365, 1961. (Cit en page 19.)
[Liang 2003] Ben Liang et Zygmunt J. Haas. Predictive distance-based mobility
management for multidimensional PCS networks. IEEE/ACM Trans. Netw.,
vol. 11, no. 5, pages 718732, Octobre 2003. (Cit en page 16.)
[Liefooghe 2010] Arnaud Liefooghe, Laetitia Jourdan et El-Ghazali Talbi. Metaheuristics and cooperative approaches for the Bi-objective Ring Star Problem.
Computers & Operations Research, vol. 37, no. 6, pages 1033 1044, 2010.
(Cit en page 97.)
[Liefooghe 2012] Arnaud Liefooghe, Jrmie Humeau, Salma Mesmoudi, Laetitia
Jourdan et El-Ghazali Talbi. On dominance-based multiobjective local search:
design, implementation and experimental analysis on scheduling and traveling salesman problems. Journal of Heuristics, vol. 18, pages 317352, 2012.
10.1007/s10732-011-9181-3. (Cit en pages 98, 114 et 123.)
[Liu 1998] Tong Liu, P. Bahl et I. Chlamtac. Mobility modeling, location tracking,
and trajectory prediction in wireless ATM networks. Selected Areas in Communications, IEEE Journal on, vol. 16, no. 6, pages 922936, 1998. (Cit en
page 18.)
[Lizee 2001] G. Lizee et A.O. Fapojuwo. Highway traffic models for wireless networks. In Vehicular Technology Conference, 2001. VTC 2001 Spring. IEEE
VTS 53rd, volume 4, pages 27662770 vol.4, 2001. (Cit en page 17.)
[M.-H. 2000] MASSOT M.-H. PRAXITELE : Un concept, un service, une exprimentation, 2000. (Cit en page 128.)
[Markoulidakis 1997] J.G. Markoulidakis, G.L. Lyberopoulos, D.F. Tsirkas et E.D.
Sykas. Mobility modeling in third-generation mobile telecommunications systems. Personal Communications, IEEE, vol. 4, no. 4, pages 4156, 1997.
(Cit en pages 17 et 18.)
[Melab 2013] Nouredine Melab, Th Van Luong, Karima Boufaras et El-Ghazali
Talbi. ParadisEO-MO-GPU: a Framework for Parallel GPU-based Local
Search Metaheuristics. In ACM GECCO2013, Amsterdam, Pays-Bas, Juillet
2013. (Cit en page 103.)
[Meunier 2000] Herv Meunier, El-Ghazali Talbi et Philippe Reininger. A Multiobjective Genetic Algorithm for Radio Network Optimization. In In Proceedings
of the 2000 Congress on Evolutionary Computation, pages 317324. IEEE
Press, 2000. (Cit en pages 104 et 135.)
[Moalic 2012] Laurent Moalic, Sid Lamrous et Alexandre Caminada. Multiobjective
Tabu Algorithm for Optimizing Carsharing Systems. In International Conference on Metaheuristics and Nature Inspired Computing, META12, Sousse,
Tunisia, october 2012. (Cit en page 160.)
Bibliographie
185
[Moalic 2013a] Laurent Moalic, Alexandre Caminada et Sid Lamrous. A Fast Local Search Approach For Multiobjective problems. In LION - Learning and
Intelligent Optimization Conference, Catania, Italy, january 2013. (Cit en
pages 146 et 160.)
[Moalic 2013b] Laurent Moalic, Sid Lamrous et Alexandre Caminada. A memetic
algorithm for multiobjective problems. In GECCO - Genetic and Evolutionary
Computation Conference, pages 9394, Amsterdam, Netherlands, july 2013.
(Cit en page 160.)
[Molina 2009] Julin Molina, Luis V. Santana, Alfredo G. Hernndez-Daz, Carlos
A. Coello Coello et Rafael Caballero. g-dominance: Reference point based
dominance for multiobjective metaheuristics. European Journal of Operational Research, vol. 197, no. 2, pages 685 692, 2009. (Cit en page 94.)
[Moscato 1989] Pablo Moscato. On evolution, search, optimization, genetic algorithms and martial arts: Towards memetic algorithms. Caltech concurrent
computation program, C3P Report, vol. 826, page 1989, 1989. (Cit en
page 112.)
[Nguyen-Luong 2000a] D. Nguyen-Luong. Modeles de prvisions de trafic aux EtatsUnis : Application llaboration des plans de transports rgionaux. Rapport
technique, IAURIF, Janv. 2000. (Cit en pages 22 et 23.)
[Nguyen-Luong 2000b] D. Nguyen-Luong. Recherche sur le choix modal en milieu
urbain. Rapport technique, IAURIF, Juin 2000. (Cit en page 23.)
[Nguyen-Luong 2008] D. Nguyen-Luong. Projet SIMAURIF Perfectionnement et
valorisation - PREDIT Rf : n 06MTE053. Rapport technique, IAURIF,
Juil. 2008. (Cit en page 24.)
[Pan 2006] Changxuan Pan, Jiangang Lu, Shan Di et Bin Ran. Cellular-Based DataExtracting Method for Trip Distribution. Transportation Research Record:
Journal of the Transportation Research Board, vol. 1945, no. -1, pages 3339,
01 2006. (Cit en page 33.)
[Paquete 2003] Luis Paquete et Thomas Sttzle. A Two-Phase Local Search for the
Biobjective Traveling Salesman Problem. In CarlosM. Fonseca, PeterJ. Fleming, Eckart Zitzler, Lothar Thiele et Kalyanmoy Deb, editeurs, Evolutionary
Multi-Criterion Optimization, volume 2632 of Lecture Notes in Computer
Science, pages 479493. Springer Berlin Heidelberg, 2003. (Cit en page 90.)
[Paquete 2004] Luis Paquete, Marco Chiarandini et Thomas Sttzle. Pareto Local
Optimum Sets in the Biobjective Traveling Salesman Problem: An Experimental Study. In Xavier Gandibleux, Marc Sevaux, Kenneth Srensen, Vincent Tkindt, G. Fandel et W. Trockel, editeurs, Metaheuristics for Multiobjective Optimisation, volume 535 of Lecture Notes in Economics and Mathematical Systems, pages 177199. Springer Berlin Heidelberg, 2004. (Cit en
pages 98, 146 et 160.)
[Pareto 1896] Vilfredo Pareto. Cours dEconomie Politique. Droz, Genve, 1896.
(Cit en page 85.)
186
Bibliographie
[Perera 2002] Ranjit Perera, Andreas Eisenbltter, Erik Fledderus, Carmelita Grg,
Michael Scheutzow et Stefan Verwijmeren. Pixel Oriented Mobility Modelling
for UMTS Network Simulations. presented at IST Mobile and Wireless Telecommunications, 2002. (Cit en page 14.)
[Phithakkitnukoon 2012] Santi Phithakkitnukoon, Zbigniew Smoreda et Patrick
Olivier. Socio-Geography of Human Mobility: A Study Using Longitudinal
Mobile Phone Data. PLoS ONE, vol. 7, no. 6, page e39253, 06 2012. (Cit
en page 34.)
[PREDIT 1999] PREDIT. La modlisation dans les transports terrestres, prsid
par Gilles Kahn, directeur scientifique INRIA. Rapport du groupe de travail,
PREDIT, Juin 1999. (Cit en page 10.)
[PREDIT 2007] PREDIT. Miro Rapport Final PREDIT Groupe oprationnel
n 1 Mobilit territoires et dveloppement durable. Rapport technique,
Laboratoire dInformatique de lUniversit de Franche-Comt, Laboratoire
Thoriser et Modliser pour Amnager, Laboratoire PACTE, Laboratoire
Image et Ville, GEODES, Laboratoire CEDETE, Septembre 2007. (Cit en
pages 24 et 25.)
[Pulselli 2006] R M Pulselli, C Ratti et E Tiezzi. City out of Chaos: Social Patterns
and Organization in Urban Systems. International Journal of Ecodynamics,
vol. 1, no. 2, pages 125134, 2006. (Cit en page 30.)
[Pulselli 2008] R M Pulselli, P Romano, S Magaudda et Tiezzi E. Monitoring human
mobility in urban systems: a new technique based on cell-phone activity. In
13th International Conference on Urban Planning in Information and Knowledge Society (REAL CORP), pages 629635. CORP Competence Center
of Urban and Regional Planning, May 2008. (Cit en page 34.)
[RATP 2010] RATP. Mtro Grand Paris tude de prvision de trafic. Rapport
technique, Dpartement du Dveloppement et de lAction Territoriale, Oct.
2010. (Cit en pages 23 et 24.)
[Ratti 2006] C Ratti, R M Pulselli, S Williams et D Frenchman. Mobile Landscapes:
using location data from cell phones for urban analysis. Environment and
Planning B: Planning and Design, vol. 33, no. 5, pages 727748, 2006. (Cit
en page 28.)
[Ratti 2007] Carlo Ratti, Andres Sevtsuk, Sonya Huang et Rudolf Pailer. Mobile
Landscapes: Graz in Real Time. In Georg Gartner, William Cartwright,
Michael P. Peterson, William Cartwright, Georg Gartner, Liqiu Meng et
Michael P. Peterson, editeurs, Location Based Services and TeleCartography,
Lecture Notes in Geoinformation and Cartography, pages 433444. Springer
Berlin Heidelberg, 2007. (Cit en page 31.)
[Reades 2007] J. Reades, F. Calabrese, A. Sevtsuk et C. Ratti. Cellular Census:
Explorations in Urban Data Collection. Pervasive Computing, IEEE, vol. 6,
no. 3, pages 30 38, july-sept. 2007. (Cit en page 33.)
Bibliographie
187
[Rheingold 2002] H. Rheingold. Smart mobs: the next social revolution. Perseus
Pub., 2002. (Cit en page 40.)
[Roy 1985] B. Roy. Mthodologie multicritre daide la dcision. Economica,
Paris, 1985. (Cit en page 158.)
[Schaffer 1985] J. David Schaffer. Multiple Objective Optimization with Vector Evaluated Genetic Algorithms. In Proceedings of the 1st International Conference
on Genetic Algorithms, pages 93100, Hillsdale, NJ, USA, 1985. L. Erlbaum
Associates Inc. (Cit en pages 92 et 109.)
[Scourias 1999] John Scourias et Thomas Kunz. An activity-based mobility model
and location management simulation framework. In Proceedings of the 2nd
ACM international workshop on Modeling, analysis and simulation of wireless and mobile systems, MSWiM 99, pages 6168, New York, NY, USA,
1999. ACM. (Cit en page 16.)
[Sevtsuk 2010] Andres Sevtsuk. Does Urban Mobility Have a Daily Routine? Learning from the Aggregate Data of Mobile Networks. Journal of urban technology,
vol. 17, no. 1, page 41, 2010. (Cit en page 34.)
[Shaheen 2008] Susan A. Shaheen et Adam P Cohen. Worldwide Carsharing
Growth: An International Comparison, 2008. (Cit en page 125.)
[Silverman 1986] B. W. Silverman. Density estimation for statistics and data analysis. Chapman & Hall, London, 1986. (Cit en page 96.)
[Song 2010] Chaoming Song, Zehui Qu, Nicholas Blumm et Albert-Lszl Barabsi.
Limits of Predictability in Human Mobility. Science, vol. 327, no. 5968, pages
10181021, 2010. (Cit en page 34.)
[Srinivas 1994] N. Srinivas et Kalyanmoy Deb. Multiobjective Optimization Using
Nondominated Sorting in Genetic Algorithms. Evolutionary Computation,
vol. 2, pages 221248, 1994. (Cit en pages 93 et 94.)
[Steenbruggen 2011] John Steenbruggen, Maria Borzacchiello, Peter Nijkamp et
Henk Scholten. Mobile phone data from GSM networks for traffic parameter
and urban spatial pattern assessment: a review of applications and opportunities. GeoJournal, pages 121, May 2011. 10.1007/s10708-011-9413-y. (Cit
en pages 28 et 33.)
[Systems 1997] Raytheon Systems et P. B. Farradyne. FINAL EVALUATION REPORT For The CAPITAL-ITS Operational Test and Demonstration Program, May 1997. (Cit en pages i, 9 et 29.)
[Tabbane 2002] S. Tabbane. Ingnierie des rseaux cellulaires. Collection Rseaux
et tlcommunications. Herms science publications, 2002. (Cit en page 45.)
[Talbi 2001] El-Ghazali Talbi, Malek Rahoual, Mohamed Hakim Mabed et Clarisse
Dhaenens. A Hybrid Evolutionary Approach for Multicriteria Optimization
Problems: Application to the Flow Shop. In EMO, pages 416428, 2001.
(Cit en pages 103 et 112.)
188
Bibliographie
[Talbi 2009] El-Ghazali Talbi. Metaheuristics: from design to implementation. Wiley, 2009. (Cit en page 80.)
[Talbi 2013] El-Ghazali Talbi. Hybrid metaheuristics. Springer, 2013. (Cit en
pages 102 et 113.)
[Tian 2002] J. Tian, J. Hhner, C. Becker, I. Stepanov et K. Rothermel. Graphbased mobility model for mobile ad hoc network simulation. In Simulation
Symposium, 2002. Proceedings. 35th Annual, pages 337344, 2002. (Cit en
pages vii, 26 et 27.)
[Tsai 1999] I-Fei Tsai et Rong-Hong Jan. The lookahead strategy for distance-based
location tracking in wireless cellular networks. SIGMOBILE Mob. Comput.
Commun. Rev., vol. 3, no. 4, pages 2738, Octobre 1999. (Cit en page 14.)
[Tuan 2003] Chiu-Ching Tuan et Chen-Chau Yang. A compact normal walk model
for PCS networks. SIGMOBILE Mob. Comput. Commun. Rev., vol. 7, no. 4,
pages 2031, Octobre 2003. (Cit en pages vii, 14 et 15.)
[Ulungu 1999] E.L. Ulungu, J. Teghem, P.H. Fortemps et D. Tuyttens. MOSA
method: a tool for solving multiobjective combinatorial optimization problems. Journal of Multi-Criteria Decision Analysis, vol. 8, no. 4, pages 221
236, 1999. (Cit en page 90.)
[While 2006] L. While, P. Hingston, L. Barone et S. Huband. A faster algorithm
for calculating hypervolume. Evolutionary Computation, IEEE Transactions
on, vol. 10, no. 1, pages 2938, 2006. (Cit en pages ix, 106 et 108.)
[Wu 2002] Chien-Hsing Wu, Huang-Pao Lin et Leu-Shing Lan. A new analytic
framework for dynamic mobility management of PCS networks. Mobile Computing, IEEE Transactions on, vol. 1, no. 3, pages 208220, 2002. (Cit en
page 14.)
[Yang 1994] Xiaofeng Yang et Mitsuo Gen. Evolution program for bicriteria transportation problem. Computers & Industrial Engineering, vol. 27, no. 14,
pages 481 484, 1994. <ce:title>16th Annual Conference on Computers
and Industrial Engineering</ce:title>. (Cit en page 90.)
[Zitzler 1999] E. Zitzler et L. Thiele. Multiobjective evolutionary algorithms: a comparative case study and the strength Pareto approach. Evolutionary Computation, IEEE Transactions on, vol. 3, no. 4, pages 257 271, nov 1999. (Cit
en pages 94, 100, 104, 105, 135 et 136.)
[Zitzler 2001] Eckart Zitzler, Marco Laumanns et Lothar Thiele. SPEA2: Improving
the Strength Pareto Evolutionary Algorithm. TIK-Report 103, 2001. (Cit
en pages 94, 95, 109 et 115.)
[Zitzler 2003] E. Zitzler, L. Thiele, M. Laumanns, C.M. Fonseca et V.G. da Fonseca. Performance assessment of multiobjective optimizers: an analysis and
review. Evolutionary Computation, IEEE Transactions on, vol. 7, no. 2,
pages 117 132, april 2003. (Cit en pages 105 et 135.)
Bibliographie
189
[Zitzler 2004] Eckart Zitzler et Simon Knzli. Indicator-based selection in multiobjective search. In in Proc. 8th International Conference on Parallel Problem
Solving from Nature (PPSN VIII, pages 832842. Springer, 2004. (Cit en
pages 93, 96 et 100.)
[Zitzler 2007] Eckart Zitzler, Dimo Brockhoff et Lothar Thiele. The Hypervolume Indicator Revisited: On the Design of Pareto-compliant Indicators
Via Weighted Integration. In Shigeru Obayashi, Kalyanmoy Deb, Carlo
Poloni, Tomoyuki Hiroyasu et Tadahiko Murata, editeurs, Evolutionary
Multi-Criterion Optimization, volume 4403 of Lecture Notes in Computer
Science, pages 862876. Springer Berlin Heidelberg, 2007. (Cit en page 101.)

These Mo Alic

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

These Mo Alic

Hochgeladen von

Copyright:

Verfügbare Formate

Thse de Doctorat

cole doctorale sciences pour lingnieur et microtechniques

MODLISATION DYNAMIQUE DE LA DENSIT

TALBI El-Ghazali, Professeur, Universit de Lille

Table des matires

I Modlisation dynamique de la densit de population via les

Taxinomie des modles . . . . . . . . . . . . . . . . . . . . . . . . . .

Modles de mobilit alatoires . . . . . . . . . . . . . . . . . .

Modles de mobilit dterministes . . . . . . . . . . . . . . .

Modles de mobilit hybrides . . . . . . . . . . . . . . . . . .

Cas de la tlphonie comme marqueur de mobilit

Le projet CAPITAL [Systems 1997]

Les travaux du MIT : une source de rfrence . . . . . . . . .

Autres travaux utilisant la tlphonie mobile . . . . . . . . .

2 La tlphonie mobile : un marqueur de prsence

La tlphonie mobile : une nouvelle source de donnes . . . . . . . .

Structure et fonctionnement dun rseau cellulaire

Quelles donnes sont disponibles ? . . . . . . . . . . . . . . .

Un nouveau modle de distribution de la population . . . . . . . . .

Mobilit et caractrisation socio-conomique du territoire . .

Table des matires

Modle de distribution spatio-temporelle des mobiles . . . . .

Constitution des donnes de rfrence . . . . . . . . . . . . .

Construction dune Signature Territoriale . . . . . . . . . . .

Gnralisation de la Signature Territoriale . . . . . . . . . . .

Optimisation combinatoire multiobjectif de lauto-partage

3 Optimisation combinatoire multiobjectif : tat de lart

Notions de base et dfinitions . . . . . . . . . . . . . . . . . . . . . .

Formulation dun problme doptimisation multiobjectif . . .

Espace de dcision vs espace objectif . . . . . . . . . . . . . .

Optimisation combinatoire et mtaheuristiques . . . . . . . .

Dominance et Pareto optimalit (le problme de la relation

Mtaheuristiques pour les problmes multiobjectifs . . . . . . . . . .

Classification des principales approches . . . . . . . . . . . . .

Les approches par transformation mono-objectif . . . . . . . .

Les approches non-Pareto . . . . . . . . . . . . . . . . . . . .

Les approches Pareto . . . . . . . . . . . . . . . . . . . . . . .

Les approches hybrides . . . . . . . . . . . . . . . . . . . . . . 101

Table des matires

Evaluation des algorithmes multiobjectifs : une approche base dindicateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

Indicateur de contribution . . . . . . . . . . . . . . . . . . . . 104

Indicateur -additif . . . . . . . . . . . . . . . . . . . . . . . . 105

Indicateur hypervolume . . . . . . . . . . . . . . . . . . . . . 105

Indicateur de distance gnrationnelle . . . . . . . . . . . . . 108

4 Algorithmes mmtiques et optimisation multiobjectif

Schma directeur dun algorithme mmtique . . . . . . . . . . . . . 113

La recherche locale dans un contexte multiobjectif . . . . . . 114

Loprateur gntique dans un contexte multiobjectif . . . . . 115

Lalgorithme mmtique, une recherche locale amliore ? . . 115

MEMO : un algorithme mmtique multiobjectif . . . . . . . . . . . 117

NSGA-II comme oprateur gntique . . . . . . . . . . . . . . 117

Loprateur de recherche locale . . . . . . . . . . . . . . . . . 121

Droulement de lalgorithme mmtique . . . . . . . . . . . . 123

Optimisation applique la planification urbaine : localisation de

Enjeu de la localisation des stations . . . . . . . . . . . . . . 126

Description formelle du problme . . . . . . . . . . . . . . . . 127

Application de lalgorithme mmtique MEMO . . . . . . . . . . . . 134

Introduction des indicateurs de comparaison . . . . . . . . . . 135

Dfinition dun ensemble de rfrence avec NSGA-II, PLS et

Table des matires

Dfinition du paramtrage de MEMO . . . . . . . . . . . . . 148

Analyse des solutions de MEMO . . . . . . . . . . . . . . . . 151

Analyse de la progression de lalgorithme MEMO . . . . . . . 156

De loptimisation laide la dcision multiobjectif . . . . . . . . . . 157