AI Livre-Blanc n01

Intelligence
Artificielle
Les dfis actuels et laction dInria
LIVRE BLANC N01

Les livres blancs dInria examinent les grands dfis actuels
du numrique et prsentent les actions menes par nos
quipes-projets pour rsoudre ces dfis.
Ce document est le premier produit par la cellule veille

et prospective dInria. Cette unit, par lattention quelle
porte aux volutions scientifiques et technologiques,
doit jouer un rle majeur dans la dtermination des
orientations stratgiques et scientifiques dInria. Elle doit
galement permettre lInstitut danticiper limpact des
sciences du numrique dans tous les domaines sociaux et
conomiques.
Ce livre blanc a t coordonn par Bertrand Braunschweig

avec des contributions de 45 chercheurs dInria et de ses
partenaires.
Un grand merci Peter Sturm pour sa relecture prcise et
complte. Merci galement au service STIP du centre de
Saclay le-de-France pour la correction finale de la version
franaise.
Intelligence artificielle :
une thmatique de recherche majeure
pour Inria
1. Samuel et Toi.Net 5
2. 2016, l'anne de l'intelligence artificielle (IA) ? 9
3. Les dbats sur l'IA 14
4. Les dfis de l'IA et les contributions d'Inria 19

4.1 Les dfis gnriques de l'intelligence artificielle 23

4.2 Dans l'apprentissage automatique 26
4.3 Dans lanalyse des signaux : vision, parole 37

4.4 Dans les connaissances et le web smantique 46
4.5 En robotique et vhicules autonomes 53
4.6 En neurosciences et sciences cognitives 59

4.7 Dans le traitement du langage 63

4.8 En programmation par contrainte pour l'aide la dcision 65
4.9 En musique et environnements intelligents 68
5. Rfrences Inria : chiffres 73
6. Rfrences supplmentaires 76
Remerciements 81
3
4
1
Samuel
et Toi.Net1
5
7h15, Sam se rveille et se prpare pour une journe de travail ordi-
naire. Il prend sa douche et s'installe dans la cuisine pour prendre son
petit djeuner. Toi.Net2, sa servante-robot, lui sert un caf chaud et une
assiette de fruits. Toi.Net, passe-moi le sucre s'il te plat , demande Sam.
La servante-robot prend le sucrier qui se trouve l'autre bout de la table
et le lui apporte. Pourtant, il y a une bote de sucre dans le placard de la
cuisine maisToi.Net sait qu'il est beaucoup plus simple d'utiliser le sucrier.
Des nouvelles intressantes ? , demande Sam. La servante-robot com-
prend qu'elle doit trouver l'actualit qui correspond aux centres d'intrt
de Sam. Elle commence par le football.
Toi.Net: Monaco a battu Marseille 3-1 domicile. C'est la premire fois de-
puis douze ans que Monaco marque trois buts contre Marseille. Un coup du
chapeau de Diego Suarez .
Toi.Net : Llection de Miss France s'est droule au Palais des congrs.
Miss Martinique est l'heureuse lue .
Sam : Ne m'embte plus avec ce type d'actualit, les lections de Miss ne
m'intressent pas .
Toi.Net : D'accord, je ne le ferai plus .
Toi.Net : Pour Paris, la mto prvoit du soleil dans la matine et de fortes
pluies partir de 13 heures et toute l'aprs-midi .
1 Le titre de cette section fait rfrence l'crivain britannique du 19e sicle Samuel Butler, auteur
de Erewhon, l'un des premiers livres formuler des hypothses sur la possibilit d'une intelligence
artificielle s'appuyant sur la thorie de la slection naturelle darwinienne et la reproduction entre
machines.
2 Personnage de la servante dans la comdie de Molire "Le Malade imaginaire".
6
1_Samuel et Toi.Net
Toi.Net : M. Lamaison, candidat la prsidence de la rgion sud-ouest, d-

clare que le taux de chmage a atteint les 3,2 millions ; son plus haut niveau
depuis 2004 .
Sam : Peux-tu vrifier cette information ? J'ai l'impression que ce nombre
tait plus lev au milieu des annes 2010 .
Deux secondes aprs, Toi.Net rpond : Vous avez raison, le chmage s'le-
vait 3,4 millions en 2015, selon les statistiques de l'INSEE .
la fin du petit djeuner, Sam ne se sent pas bien. Son bracelet connect
indique une pression artrielle anormale et Toi.Net reoit la notification.
O avez-vous mis vos comprims ? demande-t-elle Sam. Sur la table
de chevet ou peut-tre dans la salle de bain . Toi.Net lui apporte la bote de
mdicaments et Sam reprend des forces.
Toi.Net : C'est l'heure d'aller au travail. Puisqu'il va probablement pleuvoir
lorsque vous irez faire de la marche au parc aprs le djeuner, je vous ai apport
vos bottines .
Une voiture autonome attend devant la maison. Sam entre dans le vhi-
cule qui lui annonce : Ce matin, je ferai un dtour par l'A-4 en raison d'un
accident sur votre trajet habituel et d'un temps d'attente de quarante-cinq
minutes cause d'un embouteillage .
Toi.Net est une servante-robot bien duque. Elle connait beaucoup

de choses sur Sam, comprend ses demandes, se souvient de ses prf-
rences, est capable de trouver des objets et de les utiliser bon escient,
se connecte Internet et extrait des informations pertinentes, apprend
des situations nouvelles, etc. Cela a t rendu possible grce aux im-
menses progrs raliss dans le domaine de l'intelligence artificielle : le
traitement et la comprhension de la parole (comprendre les demandes
de Sam) ; la reconnaissance visuelle et la reconnaissance d'objets (loca-
liser le sucrier sur la table) ; la planification automatise (dfinir la srie
d'actions dbouchant sur une situation donne comme chercher une
bote de comprims dans la salle de bain) ; la reprsentation des connais-
sances (pouvoir identifier un coup du chapeau comme une srie de trois
buts marqus par un mme joueur au cours d'un mme match de foot-
ball) ; le raisonnement (choisir de prendre le sucrier prsent sur la table
plutt que d'aller chercher la bote de sucre dans le placard de la cuisine
ou recourir aux prvisions mtorologiques pour dcider quelle paire
de chaussures Sam devrait mettre) ; la fouille de donnes (extraire les
informations pertinentes partir du web, y compris vrifier les faits dans
le cas de la dclaration politique) ; l'algorithme incrmental dapprentis-
sage automatique (lui permettant de se souvenir de ne plus mentionner
les concours de Miss l'avenir). La servante-robot adapte constamment
7
son interaction avec Sam en dressant le profil de son propritaire et en
dtectant ses motions.
Inria, avec plus de cent-soixante quipes-projets rparties au sein de

huit centres de recherche, est trs actif sur toutes les facettes de lIA. Le
prsent document expose ses points de vue sur les grandes tendances
et les principaux dfis de l'intelligence artificielle et dcrit la manire dont
ses quipes conduisent des recherches scientifiques, dveloppent des
logiciels et uvrent pour le transfert technologique afin de relever ces
dfis.
8
2
2016, l'anne
de l'intelligence
artificielle (IA) ?
9
C'est ce qu'ont dclar rcemment plusieurs minents scientifiques
de Microsoft. L'IA est devenue un sujet en vogue dans les mdias et ma-
gazines scientifiques en raison de nombreuses ralisations, dont beau-
coup sont le fruit des progrs accomplis dans le domaine de l'apprentis-
sage automatique. De grandes entreprises dont Google, Facebook, IBM,
Microsoft mais aussi des constructeurs automobiles l'instar de Toyota,
Volvo et Renault, sont trs actifs dans la recherche en IA et prvoient d'y
investir davantage encore dans le futur. Plusieurs scientifiques spcia-
liss dans l'IA dirigent dsormais les laboratoires de recherche de ces
grandes entreprises et de nombreuses autres.
La recherche en IA a permis de raliser

Les progrs accomplis en d'importants progrs dans la dernire d-
matire de robotique, de cennie, et ce dans diffrents secteurs. Les
avances les plus connues sont celles r-
vhicules autonomes, de alises dans l'apprentissage automatique,
traitement de la parole grce notamment au dveloppement d'ar-
et de comprhension du chitectures d'apprentissage profond, des
langage naturel sont tout rseaux de neurones convolutifs multi-
aussi impressionnants. couche dont l'apprentissage s'opre par-
tir de gros volumes de donnes sur des
architectures de calcul intensif. Parmi les
ralisations de l'apprentissage automatique, il convient de citer la rso-
lution de jeux Atari (Bricks, Space invaders, etc.) par Google DeepMind,
utilisant les pixels images affichs l'cran comme donnes d'entre
afin de dcider quelle action adopter pour atteindre le plus haut score
possible la fin de la partie. Il convient galement de mentionner le der-
nier rsultat obtenu par la mme quipe dans le jeu de Go, l'emportant
sur le meilleur joueur humain en une srie de cinq matchs, en recourant
une combinaison de recherche Monte Carlo arborescente d'apprentis-
sage profond partir de vrais matchs et d'apprentissage par renforce-
ment en jouant contre son propre clone.
Voici d'autres exemples remarquables :
- la description automatique du contenu d'une image ("Une image
est plus parlante qu'un millier de mots"), galement par Google (http://
googleresearch.blogspot.fr/2014/11/a-picture-is-worth-thousand-coherent.
html) ;
- les rsultats du Large Scale Visualisation Challenge 2012 d'Imagenet,
remport par un trs grand rseau neuronal convolutif dvelopp par
l'Universit de Toronto, et entran avec des GPU de Nvidia (http://image-
net.org/challenges/LSVRC/2012/results.html) ;
- la qualit des systmes de reconnaissance faciale tels que ceux de
10
2_2016, l'anne de l'IA ?
Facebook (https://www.newscientist.com/article/dn27761-facebook-can-
recognise-you-in-photos-even-if-youre-not-looking#.VYkVxFzjZ5g) ;
- etc.
Mais il ne s'agit l que dune trs petite partie des rsultats obtenus
grce l'IA. Les progrs accomplis en matire de robotique, de vhicules
autonomes, de traitement de la parole et de comprhension du langage
naturel sont tout aussi impressionnants.
Comme exemples, on peut citer :
- le niveau de comptence atteint par les robots au Robotic Challenge
de Darpa, remport par KAIST en 2015. Dans cette comptition, les ro-
bots doivent conduire un vhicule utilitaire, ouvrir une porte et entrer
dans un btiment, fermer une vanne, utiliser un outil pour percer un
mur, se dplacer travers des dcombres ou retirer les dbris bloquant
une porte d'entre et monter une chelle (https://en.wikipedia.org/wiki/
DARPA_Robotics_Challenge) ;
- la comprhension de la parole. Elle est dsormais considre
comme une fonctionnalit standard des smartphones et tablettes dots
de compagnons artificiels tels que Siri d'Apple, Cortana de Microsoft ou
M de Facebook ;
- la traduction instantane. Microsoft Skype Translator traduit des
conversations dans diffrentes langues en temps rel ;
- les vhicules sans chauffeur. Des voitures autonomes ont parcouru
des milliers de kilomtres sans incidents majeurs.
Figure 2 : Informations smantiques ajoutes aux rsultats du moteur de recherche Google
Tout aussi fondamentaux sont les rsultats obtenus dans des do-
maines tels que la reprsentation des connaissances et le raisonnement,
les ontologies et d'autres technologies pour le web smantique et le web
de donnes :
11
- Google Knowledge Graph amliore les rsultats de recherche en
affichant des donnes structures sur les termes ou expressions de re-
cherche demands ;
- Schema.org contient des millions de triplets RDF dcrivant des faits
connus : les moteurs de recherche peuvent utiliser ces donnes pour
fournir des informations structures sur demande ;
- Facebook utilise le protocole OpenGraph - qui s'appuie sur RDFa -
pour permettre n'importe quelle page web de devenir un objet enrichi
dans un graphe social.
Enfin, une autre tendance importante est la rcente ouverture de

plusieurs technologies auparavant propritaires afin que la commu-
naut des chercheurs en IA puisse non seulement en bnficier, mais
aussi contribuer les enrichir par de nouvelles fonctionnalits. Comme
exemples, on peut citer :
- les services cognitifs d'IBM Watson, disponibles sur des interfaces
programmatiques (API), qui offrent jusqu' vingt technologies diffrentes
telles que les services Speech To Text et Text To Speech, l'identification des
concepts et des liens entre concepts, la reconnaissance visuelle et bien
d'autres : http://www.ibm.com/cloud-computing/bluemix/solutions/watson/ ;
Figure 3 : Ordinateur IBM Watson - Clockready (CC BY-SA 3.0, via Wikimedia Commons)
- la bibliothque logicielle TensorFlow de Google utilise pour l'ap-

prentissage automatique, qui a t mise en open source ; https://www.
tensorflow.org/ ;
12
2_2016, l'anne de l'IA ?
- la mise en open source par Facebook du design de son ser-

veur Big Sur pour excuter de grands rseaux neuronaux d'ap-
prentissage profond sur des GPU : https://code.facebook.com/
posts/1687861518126048?_mref=message_bubble.
Lenthousiasme suscit par toutes ces ralisations positives a t ce-

pendant tempr par les inquitudes exprimes ici et l par des scienti-
fiques de renom. Ce sera le sujet de la section suivante.
13
3
Les dbats
sur l'IA
14
3_Les dbats sur l'IA
Les dbats sur l'IA ont commenc au 20e sicle - cf. les lois de la ro-
botique d'Isaac Asimov - mais sintensifient aujourdhui en raison des
rcentes avances, dcrites prcdemment, dans le domaine.
Selon la thorie de la singularit technologique, une re de domina-
tion des machines sur l'Homme verra le jour lorsque les systmes d'in-
telligence artificielle deviendront super-intelligents :
"La singularit technologique est un vnement hypothtique li l'av-
nement d'une vritable intelligence artificielle. Ainsi un ordinateur, un rseau
informatique ou un robot seraient thoriquement capables dune auto-amlio-
ration rcursive (processus de perfectionnement auto-gnr) ou de concevoir
et fabriquer des ordinateurs ou robots plus intelligents. Des rptitions de ce
cycle pourraient aboutir un effet d'acclration - une explosion de l'intelli-
gence c'est--dire des machines intelligentes capables de concevoir des
gnrations successives de machines de plus en plus puissantes, crant une
intelligence largement suprieure aux capacits intellectuelles humaines, d'o
un risque de perte de contrle. L'Homme ne pouvant apprhender les capa-
cits d'une telle super-intelligence, la singularit technologique est le point
au-del duquel l'intelligence humaine ne pourrait ni prdire ni mme imaginer
les vnements" (traduction de Wikipdia anglais).
Les dfenseurs de la singularit technolo-

gique sont proches du mouvement transhu- Une re de
maniste qui vise amliorer les capacits
domination des
physiques et intellectuelles des humains grce
aux nouvelles technologies. La singularit cor- machines sur
respondrait au moment o la nature des tres l'Homme verra
humains subirait un changement fondamental, le jour lorsque
lequel serait peru soit comme un vnement les systmes d'IA
souhaitable (par les transhumanistes), soit
deviendront super-
comme un danger pour l'humanit (par leurs
opposants). intelligents
Le dbat sur les dangers de l'IA a franchi un

nouveau palier avec la rcente polmique sur les armes autonomes et
les robots tueurs, suscite par une lettre ouverte publie l'ouverture
de la confrence IJCAI en 20153. La lettre, qui demande l'interdiction des
armes capables de fonctionner sans intervention humaine, a t signe
par des milliers de personnes, dont Stephen Hawking, Elon Musk, Steve
Wozniak et nombre de chercheurs de premier plan en IA ; on retrouve
3 Voir http://futureoflife.org/open-letter-autonomous-weapons/
15
dailleurs parmi les signataires certains des chercheurs d'Inria ayant
contribu l'laboration du prsent document.
Parmi les autres dangers et menaces ayant fait l'objet de dbats au

sein de la communaut, on peut citer : les consquences financires sur
les marchs boursiers du trading haute frquence, lequel reprsente d-
sormais la grande majorit des ordres passs - dans le trading haute
frquence, des logiciels soi-disant intelligents excutent grande vi-
tesse des transactions financires, pouvant conduire des crashs bour-
siers comme le Flash Crash de 2010 ; les consquences de la fouille de
donnes massives sur le respect de la vie prive, avec des systmes de
fouille capables de divulguer les caractristiques personnelles des indi-
vidus en tablissant des liens entre leurs oprations en ligne ou leurs en-
registrements dans des bases de donnes ; et bien entendu le chmage
potentiel gnr par le remplacement progressif de la main d'uvre par
des machines.
Figure 4 : Dans le film Her de Spike Jonze (Annapurna Pictures / Warner Bros, 2013),
un homme tombe amoureux de son systme d'exploitation intelligent
Plus nous dveloppons l'intelligence artificielle, plus le risque est

grand dtendre uniquement certaines capacits intelligentes (par
exemple optimisation et fouille par l'apprentissage) au dtriment
d'autres, peu susceptibles de gnrer un retour sur investissement im-
mdiat ou de prsenter un quelconque intrt pour le crateur de l'agent
(par exemple : morale, respect, thique, etc.). Utilise grande chelle,
16
3_Les dbats sur l'IA
l'intelligence artificielle peut comporter de nombreux risques et consti-

tuer quantit de dfis pour les humains, en particulier si les intelligences
artificielles ne sont pas conues et encadres de faon respecter et
protger les humains. Si, par exemple, l'optimisation et les performances
sont le seul objectif de leur intelligence, cela peut conduire des ca-
tastrophes grande chelle o les utilisateurs sont instrumentaliss,
abuss, manipuls, etc. par des agents artificiels inpuisables et sans
vergogne. La recherche en IA doit tre globale et inclure tout ce qui rend
les comportements intelligents, pas uniquement les "aspects les plus
raisonnables".
Dietterich et Horvitz ont publi dernirement une rponse intres-

sante certaines de ces questions4. Dans leur bref article, les auteurs
reconnaissent que la communaut des chercheurs en IA ne devrait pas
se focaliser sur le risque de perte de contrle par les humains car celui-ci
ne prsente pas de caractre critique dans un avenir prvisible, et re-
commandent plutt d'accorder plus d'attention aux cinq risques court
terme auxquels sont exposs les systmes bass sur l'IA, savoir :
- les bugs dans les logiciels ;
- les cyberattaques ;
- la tentation de jouer "l'Apprenti Sorcier", cest dire donner la ca-
pacit aux systmes d'IA de comprendre ce que veulent les utilisateurs
au lieu d'interprter littralement leurs ordres ;
- "l'autonomie partage", savoir la coopration fluide des systmes
d'IA avec les utilisateurs de faon que les utilisateurs puissent toujours
reprendre le contrle en cas de besoin ;
- et les impacts socio-conomiques de l'IA : en d'autres termes l'IA
doit tre bnfique pour l'ensemble de la socit et pas seulement pour
quelques privilgis.
Inria n'ignore rien de ces dbats et, en tant qu'institut de recherche
consacr aux sciences du numrique et au transfert technologique,
uvre pour le bien-tre de tous, pleinement conscient de ses responsabi-
lits envers la socit. Informer la socit et les instances dirigeantes des
potentialits et des risques des sciences et technologies du numrique
fait partie des missions dInria.
Dans cette optique, ces dernires annes, Inria a :

- lanc une rflexion sur l'thique bien avant que les menaces de l'IA
ne suscitent des dbats au sein de la communaut scientifique ;
4 Dietterich, Thomas G. and Horvitz, Eric J., Rise of Concerns about AI: Reflections and Directions,
Communications of the ACM, October 2015 Vol. 58 no. 10, pp. 38-40
17
- contribu la cration de la CERNA5 d'Allistene, une commission
de rflexion qui travaille sur les problmes thiques soulevs par la re-
cherche en sciences et technologies du numrique ; son premier rapport
de recommandations est consacr la recherche en robotique ;
- mis en place un nouvel organe charg dvaluer au cas par cas les
enjeux lgaux ou thiques dune recherche : le Comit Oprationnel
d'Evaluation des Risques Lgaux et Ethiques (COERLE), compos de
scientifiques d'Inria et de contributeurs externes. Le COERLE a pour mis-
sion daider identifier les risques et dterminer si l'encadrement dun
projet de recherche est ncessaire.
En outre, Inria encourage ses chercheurs prendre part aux dbats

socitaux lorsque des mdias les sollicitent pour s'exprimer sur des
questions thiques telles que celles souleves par la robotique, l'appren-
tissage profond, la fouille de donnes et les systmes autonomes.
Les enjeux scientifiques et technologiques mis au jour par la re-

cherche en IA amnent Inria dvelopper des stratgies pour relever
les multiples dfis soulevs. La prochaine section sera consacre son
positionnement et la typologie de ces dfis.
5 Commission de rflexion sur l'Ethique de la Recherche en sciences et technologies du Numrique de

l'Alliance des Sciences et Technologies du Numrique : https://www.allistene.fr/cerna-2/
18
4
Les dfis de l'IA et
les contributions
d'Inria
19
L'IA est un vaste domaine ; toute tentative de le structurer en sous-do-
maines peut donner lieu dbat. Toutes les typologies se valant, il a donc
t dcid dopter pour la hirarchie de mots-cls propose rcemment
par la communaut des responsables d'quipes-projets Inria, afin de
mieux identifier leurs contributions aux sciences du numrique en gn-
ral. Dans cette hirarchie, l'intelligence artificielle est un mot-cl de pre-
mier niveau avec sept sous-domaines, certains spcifiques, dautres ren-
voyant diffrentes sections de la hirarchie (voir le tableau ci-dessous).
n CONNAISSANCES
_Bases de connaissances
_Extraction & nettoyage de connaissances
_Infrence
_Web smantique
_Ontologies
n APPRENTISSAGE AUTOMATIQUE
_Apprentissage supervis
_Apprentissage (partiellement) non-supervis
_Apprentissage squentiel et par renforcement
_Optimisation pour l'apprentissage
_Mthodes baysiennes
_Rseaux de neurones ou neuronaux
_Mthodes noyau
_Apprentissage profond
_Fouille de donnes
_Analyse de donnes massives
n TRAITEMENT DU LANGAGE NATUREL
n TRAITEMENT DES SIGNAUX
_Parole
_Vision
Reconnaissance d'objets
Reconnaissance d'activits
Recherche dans des banques d'images et de vidos
Reconstruction 3D et spatio-temporelle
Suivi d'objets et analyse des mouvements
Localisation d'objets
Asservissement visuel
n ROBOTIQUE (y compris les vhicules autonomes)
_Conception
_Perception
_Dcision
_Action
20
4_Les dfis de l'IA et les contributions d'Inria
_Interactions avec les robots (environnement/humains/robots)

_Flottes de robots
_Apprentissage des robots
_Cognition pour la robotique et les systmes
n NEUROSCIENCES, SCIENCES COGNITIVES
_Comprhension et stimulation du cerveau et du systme
nerveux
_Sciences cognitives
n ALGORITHMIQUE DE L'IA
_Programmation logique et ASP
_Dduction, preuve
_Thories SAT
_Raisonnement causal, temporel, incertain
_Programmation par contraintes
_Recherche heuristique
_Planification et ordonnancement
n AIDE LA DCISION
Tableau 1: Hirarchie de mots-cls pour l'IA tablie par Inria
Les contributions d'Inria sont prsentes ci-aprs par quipe-projet.

Inria sappuie sur un modle de recherche original qui repose sur une
entit de base : lquipe-projet. Les quipes-projets runissent, autour
dune personnalit scientifique, un groupe de chercheurs, denseignants
chercheurs, de doctorants et dingnieurs. Elles ont toutes un objectif
commun : relever un dfi scientifique et technologique dans lun des
domaines de recherche prioritaires de l'institut dfinis dans le plan
stratgique. L'quipe-projet a une dure maximale de vie de douze ans
et une dure moyenne de huit ans. (Les noms des quipes-projets seront
crits en CAPITALES ORANGE afin de les distinguer des autres noms.)
PLAN STRATGIQUE "OBJECTIF INRIA 2020"
La stratgie scientifique dInria est construite autour de deux axes

complmentaires, sur lesquels sarticulera la contribution de linstitut :
Les sciences et technologies du numrique utiles lhumain, la

socit et la connaissance.
Les chantiers majeurs sur lesquels Inria sengage mettent lhumain au
cur des problmatiques du numrique :
- l'humain en tant que tel : sant et bien-tre ;
21
- l'humain et ses environnements : de lindividu la socit, de lhabitat
la plante ;
- lhumain et la connaissance : mergence, mdiation et ducation.
Les dveloppements scientifiques prioritaires au cur de nos

sciences :
- calculer le futur : modles, logiciels et systmes numriques ;
- matriser la complexit : donnes, rseaux et flux ;
- interagir avec les mondes rel et numrique : interactions, usages et
apprentissage.
Nous abordons des questions cls poses par dautres sciences ou par
de grands domaines dapplication, auxquels les sciences informatiques
et mathmatiques devront contribuer :
- la sant et le bien-tre ;
- l'nergie et les ressources naturelles ;
- l'environnement et le dveloppement durable ;
- la socit et l'ducation.
Aprs un premier paragraphe consacr aux dfis gnriques, seront

abords des dfis plus spcifiques par ordre dcroissant des investis-
sements d'Inria : cela signifie que linventaire commencera par les do-
maines dans lesquels Inria compte le plus grand nombre d'quipes et de
chercheurs actifs. Cela ne signifie pas que les quipes contribuant aux
dfis prsents en dernier sont de moindre qualit, seulement qu'elles
sont moins nombreuses.
Les dfinitions de l'IA et des sous-domaines ne seront pas reprises

dans cet expos car elles font l'objet d'une abondante littrature. De
bonnes dfinitions figurent galement sur Wikipdia, par exemple :
https://en.wikipedia.org/wiki/Artificial_intelligence
https://en.wikipedia.org/wiki/Machine_learning
https://en.wikipedia.org/wiki/Robotics
https://en.wikipedia.org/wiki/Natural_langage_processing
https://en.wikipedia.org/wiki/Semantic_Web
https://en.wikipedia.org/wiki/Knowledge_representation_and_reasoning
etc.
22
4.1_Les dfis gnriques de l'intelligence artificielle
4.1
es dfis gnriques de l'intelligence
L
artificielle
Les principaux dfis gnriques identifis par Inria sont les suivants:
(i) IA situe ; (ii) processus d'apprentissage avec intervention humaine;
(iii) ouverture d'autres disciplines ; (iv) multitches ; (v) validation et
certification des systmes d'IA.
IA situe
Les systmes d'IA doivent oprer dans le monde rel et interagir

avec leur environnement : recevoir des donnes de capteurs, dterminer
le contexte dans lequel ils oprent, agir sur le monde rel ; ils doivent
par ailleurs se comporter de faon autonome et conserver leur intgrit
dans diverses conditions. Pour rpondre ces exigences, les systmes
d'IA doivent grer des donnes non structures ainsi que des donnes
smantiques.
Processus d'apprentissage avec intervention humaine
Les systmes d'IA ont vocation interagir avec des utilisateurs hu-
mains : ils doivent donc tre capables d'expliquer leur comportement,
de justifier d'une certaine manire les dcisions qu'ils prennent afin que
les utilisateurs humains puissent comprendre leurs actions et leurs mo-
tivations. Si cette comprhension n'est pas au rendez-vous, les utilisa-
teurs humains n'auront qu'une confiance limite, voire inexistante, dans
les systmes, qui ne seront donc pas accepts. En outre, les systmes
d'IA ont besoin d'une certaine flexibilit et de capacits d'adaptation afin
de pouvoir grer diffrents utilisateurs et diffrentes attentes. Il est im-
portant de dvelopper des mcanismes d'interaction qui favorisent une
bonne communication et interoprabilit entre les humains et les sys-
tmes d'IA. Certaines quipes d'Inria travaillent sur la collaboration entre
l'IA et l'interface Homme-machine car il existe de nombreuses attentes
dans ce domaine.
Ouverture d'autres disciplines
Une IA sera souvent intgre dans un systme largi compos de

nombreux lments. L'ouverture signifie donc que des scientifiques et
dveloppeurs en IA devront collaborer avec des spcialistes d'autres
disciplines des sciences informatiques (par exemple la modlisation,
23
la vrification et la validation, les rseaux, la visualisation, linteraction
Homme-machine, etc.) composant le systme largi, ainsi qu'avec des
scientifiques dautres champs de comptences contribuant l'IA comme
les psychologues, les biologistes (en biomimtique, notamment), les ma-
thmaticiens, etc.
Le deuxime aspect prendre en compte est l'impact des systmes
de l'IA sur plusieurs facettes de notre vie, de notre conomie et de
notre socit et donc la ncessaire collaboration avec des spcialistes
d'autres domaines. Il serait trop long de tous les mentionner mais titre
dexemples on peut citer les conomistes, les environnementalistes, les
juristes.
Multitches
De nombreux systmes d'IA excellent dans un domaine spcifique,

mais se rvlent incomptents en-dehors de celui-ci. Pourtant, les sys-
tmes voluant dans un environnement rel, tels que les robots, doivent
tre capables de raliser plusieurs actions en parallle, comme mmori-
ser des faits, assimiler de nouveaux concepts, agir sur le monde rel et
interagir avec les humains.
Validation et certification
Composantes incontournables des systmes critiques, la certification

des systmes d'IA ou leur validation par des moyens appropris, consti-
tuent de vritables dfis, en particulier si ces systmes rpondent aux
attentes cites ci-dessus (adaptation, multitches, processus d'apprentis-
sage avec intervention humaine). La vrification, la validation et la certifi-
cation des systmes classiques (qui ne relvent donc pas de lIA) consti-
tuent dj des tches difficiles - mme s'il existe dj des technologies
exploitables, dont certaines sont dveloppes par des quipes-projets
d'Inria. L'application de ces outils aux systmes d'IA complexes est une
tche titanesque laquelle il convient de s'attaquer pour tre en capacit
dutiliser ces systmes dans des environnements tels que les avions, les
centrales nuclaires, les hpitaux, etc.
Autres dfis gnriques
Outre les prcdents dfis, les exigences ci-dessous concernant

les systmes d'IA devraient donner lieu de nouvelles activits de re-
cherche: certaines sont extrmement complexes et ne peuvent pas tre
satisfaites court terme, mais mritent qu'on s'y intresse.
24
4.1_Les dfis gnriques de l'intelligence artificielle
Inculquer des normes et des valeurs aux systmes d'IA va bien au-
del des sciences et technologies existantes : par exemple, un robot
qui va acheter du lait pour son propritaire doit-il s'arrter en chemin
pour aider une personne dont la vie est en danger ? Une technologie
d'IA puissante pourrait-elle tre utilise par des terroristes artificiels ?
l'heure actuelle, la recherche en IA est bien loin de pouvoir rpondre
ces exigences.
L'exigence de protection de la vie prive est particulirement impor-

tante pour les systmes d'IA confronts aux donnes personnelles, tels
que les assistants/compagnons intelligents ou les systmes de fouille de
donnes. Cette exigence valait dj pour les systmes classiques, mais
les systmes dIA ont ceci de particulier qu'ils gnreront de nouvelles
connaissances partir des donnes prives et les rendront probable-
ment publiques dfaut de moyens techniques capables d'imposer des
restrictions.
Enfin, un dernier dfi concerne le passage chelle. Les systmes

d'IA doivent tre capables de grer de vastes quantits de donnes et
de situations. On pense aux algorithmes d'apprentissage absorbant des
millions de points de donnes (signaux, images, vidos, etc.) et aux sys-
tmes de raisonnement grande chelle, tels que le systme Watson
d'IBM, utilisant des connaissances encyclopdiques. Cependant, la ques-
tion du passage chelle pour les nombreux V (varit, volume, vitesse,
vocabulaires, etc.) reste entire.
Applications de l'IA
Il ne s'agit pas proprement parler d'un dfi pour l'IA, mais il est im-
portant d'insister sur le fait que les systmes d'IA contribuent rsoudre
des problmes socitaux : les applications d'IA couvrent tout le spectre
des activits humaines, telles que l'environnement et l'nergie, la sant
et l'assistance l'autonomie domicile, le transport et les villes intelli-
gentes, etc. Ils peuvent tre bnfiques pour l'humanit et l'conomie,
mais ils peuvent galement reprsenter des menaces s'ils ne sont pas
contrls (voir la section 3).
25
4.2
es dfis gnriques dans
L
l'apprentissage automatique
Les algorithmes et systmes d'apprentissage automatique ont connu
d'importantes avances ces dernires annes grce la disponibilit de
grands volumes de donnes et du calcul intensif, sans oublier les avan-
ces intressantes en optimisation. Une caractristique majeure de l'ap-
prentissage profond (deep learning) est sa capacit apprendre les des-
cripteurs tout en effectuant le classement (clustering).
Il subsiste toutefois nombre de limites et dfis que nous avons classs
comme suit : i) sources de donnes ; ii) reprsentations symboliques
vs reprsentations continues ; iii) apprentissage continu et sans fin ; iv)
apprentissage sous contraintes ; v) architectures de calcul ; vi) appren-
tissage non-supervis ; vii) processus d'apprentissage avec intervention
humaine, explications.
Sources de donnes
Les dfis dans ce domaine sont nombreux : apprendre partir de

donnes htrognes, disponibles sur une multiplicit de canaux ; grer
des informations incertaines ; identifier et traiter des vnements rares
au-del des approches purement statistiques ; travailler en combinant
des sources de connaissances et des sources de donnes ; intgrer des
modles et des ontologies dans le processus d'apprentissage ; et enfin
obtenir de bonnes performances d'apprentissage avec peu de donnes,
lorsque des sources de donnes massives ne sont pas disponibles.
ORPAILLEUR est une quipe-projet d'Inria et du Loria, cre dbut

2008. Il s'agit d'une quipe pluridisciplinaire qui comprend des scienti-
fiques en informatique, mais galement un biologiste, des chimistes et
un physicien. Les sciences de la vie, la chimie et la mdecine sont des
domaines d'application de premire importance et l'quipe dveloppe
des systmes de travail leur intention.
L'extraction de connaissances partir de bases de donnes (Knowledge

Discovery in Databases - KDD - en anglais), consiste traiter un grand
volume de donnes afin d'extraire des units de connaissance significa-
tives et rutilisables. Si on assimile les units de connaissance des p-
pites dor et les bases de donnes des terres ou des rivires explorer,
le processus KDD peut tre compar lorpaillage1.
26
4.2_Les dfis gnriques dans l'apprentissage automatique
Le processus KDD est itratif, interactif et gnralement contrl par

un expert du domaine de donnes, appel l'analyste. L'analyste slec-
tionne et interprte un sous-ensemble d'units extraites pour obtenir
des units de connaissance prsentant une certaine validit vis--vis des
donnes analyses. l'instar d'une personne cherchant de l'or et dote
dune certaine exprience de la tche et du lieu, l'analyste peut utiliser
ses propres connaissances mais galement les connaissances du do-
maine de donnes pour amliorer le processus KDD.
Le processus KDD exploite les connaissances du domaine notamment

par une mise en rapport avec les ontologies relatives au domaine de
donnes, pour faire un pas en direction de la notion d'extraction de
connaissances guide par les connaissances du domaine ou KDDK (pour
Knowledge Discovery guided by Domain Knowledge). Dans le processus
KDDK, les units de connaissance extraites ont encore "une vie" aprs
la phase dinterprtation : elles sont figures par un formalisme de re-
prsentation des connaissances intgrer dans une ontologie et rutili-
ses pour les besoins de rsolution de problmes. Ainsi, l'extraction des
connaissances sert tendre et actualiser les ontologies existantes, en
montrant que l'extraction des connaissances et leur reprsentation sont
des tches complmentaires permettant de donner corps la notion de
KDDK.
1 Ceci explique le nom de lquipe de recherche puisque le terme "orpailleur" dsigne une personne
qui cherche de lor dans les rivires ou les montagnes.
Reprsentations symboliques vs reprsentations continues
Les reprsentations continues permettent l'algorithme d'apprentis-

sage automatique d'approcher des fonctions complexes, tandis que les
reprsentations symboliques sont utilises pour apprendre des rgles
et des modles symboliques. Les avances rcentes les plus significa-
tives concernent les reprsentations continues. Celles-ci laissent nan-
moins de ct le raisonnement alors quil serait souhaitable de l'intgrer
dans la reprsentation continue pour pouvoir faire des infrences sur les
donnes numriques. Par ailleurs, afin d'exploiter la puissance de l'ap-
prentissage profond, il peut s'avrer utile de dfinir des reprsentations
continues de donnes symboliques, comme cela a t fait par exemple
pour le texte avec word2vec et text2vec.
27
Les travaux de LINKMEDIA portent sur l'interprtation automatique de
contenus multimdia professionnels et sociaux dans toutes leurs moda-
lits. Dans ce contexte, l'intelligence artificielle s'appuie la fois sur la
conception de modles de contenus et sur les algorithmes d'apprentis-
sage associs pour extraire, dcrire et interprter des messages dits
pour les humains. LINKMEDIA dveloppe des algorithmes d'apprentis-
sage automatique principalement bass sur des modles statistiques et
neuronaux pour extraire des structures, des connaissances, des entits
ou des faits partir de documents et collections multimdia.
La multimodalit et la modalit transversale en vue dtablir un lien
entre les reprsentations symboliques (les mots ou des concepts dans
un texte par exemple) et les observations continues (images continues
ou attributs de signaux par exemple) sont les deux principaux dfis de
LINKMEDIA, pour lesquels les rseaux neuronaux sont prometteurs.
La dtection de canulars dans les rseaux sociaux, par une association
du traitement de limage et du traitement naturel du langage, la cration
dhyperliens dans des collections de vidos en exploitant simultanment
le contenu parl et visuel, et les analyses dactualits interactives par
des graphes de proximit sont parmi les principaux sujets sur lesquels
travaille lquipe.
Les analyses de type "processus d'apprentissage avec intervention hu-

maine" pour lesquelles lintelligence artificielle est au service dun uti-
lisateur, sont galement au cur du travail de lquipe et posent des
dfis quant linterprtation du contenu multimdia bas sur des ma-
chines supervises par lHomme : lHomme a besoin de comprendre
les dcisions prises par les machines et dvaluer leur fiabilit, deux pro-
blmatiques dlicates tant donnes les approches actuelles guides
par les donnes. La connaissance et lapprentissage automatique sont
fortement intriqus dans ce scnario, d'o la ncessit de mcanismes
permettant aux experts humains dinjecter des connaissances dans les
algorithmes dinterprtation des donnes. Des utilisateurs malveillants
manipuleront invitablement les donnes pour influencer linterprtation
automatique en leur faveur, situation que lapprentissage automatique
actuel a du mal grer.
Enfin et surtout, plus que les mesures objectives sur les donnes, lva-
luation des algorithmes soriente vers des paradigmes de conception
centre utilisateur pour lesquels il nexiste de pas de fonction objectif
utiliser.
28
Apprentissage continu et sans fin
On attend de certains systmes d'IA qu'ils soient rsilients, c'est--dire

capables de fonctionner 24/7 sans interruption. Des avances intres-
santes ont t ralises dans les systmes d'apprentissage "tout au long
de la vie" qui engrangeront continuellement de nouvelles connaissances.
La difficult rside ici dans la capacit des systmes d'IA oprer en
ligne en temps rel, tout en tant capables de remettre en question des
croyances antrieures, et ce de faon autonome. L'auto-amorage consti-
tue une option pour ces systmes car il permet d'utiliser les connais-
sances lmentaires acquises en dbut d'exploitation pour orienter les
futures tches d'apprentissage, comme dans le systme NELL (Never-
Ending Langage Learning) dvelopp l'Universit Carnegie-Mellon
(http://rtw.ml.cmu.edu/rtw/).
Apprentissage sous contraintes
La protection de la vie prive est sans doute la contrainte la plus im-

portante prendre en compte. Les chercheurs spcialiss dans l'appren-
tissage automatique ont reconnu rcemment la ncessit de protger la
vie prive tout en poursuivant l'apprentissage partir de donnes per-
sonnelles. Une thorie de l'apprentissage automatique respectueux de
la vie prive est actuellement dveloppe par des chercheurs tels que
Michael Jordan (http://arxiv.org/abs/1210.2085). Plusieurs quipes-pro-
jets d'Inria travaillent sur la protection de la vie prive : en particulier
ORPAILLEUR dans le domaine de l'apprentissage automatique, mais ga-
lement des quipes-projets d'autres domaines telles que PRIVATICS (sur
les algorithmes de protection de la vie prive) et SMIS (sur la protection
de la vie prive dans les bases de donnes). De faon plus gnrale, l'ap-
prentissage automatique peut tre amen prendre en compte d'autres
contraintes externes telles que des donnes dcentralises ou des limites
nergtiques. Des recherches sur la problmatique gnrale de l'appren-
tissage automatique sous contraintes externes sont donc ncessaires.
MAGNET
L'apprentissage automatique, dans une de ses dimensions, a pour objet
d'identifier des rgularits, des motifs, dans les donnes et de les re-
prsenter dans un modle. La notion de modle est varie, statistique,
probabiliste ou formelle comme une machine tats finis, etc. L'objectif
de l'apprentissage est de pouvoir utiliser ensuite ce modle pour prdire
des valeurs associes de nouvelles donnes. L'approche se distingue
29
en cela de la tentative de raisonner, de reprsenter et traiter des connais-
sances, autres branches classiques de l'IA. Dans une formalisation ma-
thmatique traditionnelle, toutefois, l'objectif de l'apprentissage automa-
tique est de russir bien approximer une fonction inconnue qui prend
en entre des donnes, reprsentant la description d'un objet, une
entit, et produit un rsultat comme une valeur discrte ou une valeur
relle. C'est par exemple attribuer une valeur positive ngative ou neutre
la reprsentation d'un texte court dans le but d'analyser les sentiments
dans les tweets ou estimer l'intrt que peut porter une personne un
nouveau film de cinma. Retrouver cette fonction, ces motifs, nces-
site de disposer de suffisamment de donnes pour les identifier. Plus le
modle se complexifie, par exemple repose sur des relations de dpen-
dance entre les donnes comme l'influence que peuvent avoir des amis
sur des gots cinphiles, plus la tche devient difficile. C'est aussi le cas
lorsque la fonction apprendre ne calcule plus une valeur scalaire mais
une structure part entire comme un arbre d'analyse d'une phrase
par exemple. L'quipe MAGNET s'intresse particulirement ce dfi
de prendre en compte les relations structurelles dans les donnes, que
ce soit en entre quand l'ensemble des donnes est reprsent sous
forme de graphe, ou lorsqu'il faut prdire une structure complexe.
Ce qui n'tait pas possible il y a vingt ans le devient d'un point de vue
pratique aujourd'hui. L'apprentissage automatique est ancien, mais rede-
venu populaire l're de l'explosion la fois des capacits de calcul et de
la collecte massive de donnes. On observe alors des progrs spectacu-
laires. Toutefois, ce qui est devenu possible du point de vue statistique,
l'abondance de donnes fournissant des statistiques suffisantes pour
estimer des fonctions plus complexes, soulve des questions informa-
tiques de passage l'chelle, d'efficacit des algorithmes. Ces ques-
tions fondamentales sont au cur des problmatiques de MAGNET.
Une reprsentation sous forme de graphe, qu'elle soit donne ou calcu-
le de faon adaptative face une tche donne, permet d'expliciter et
d'exploiter une approximation de ces dpendances. La question de ces
dpendances est galement trs pertinente dans le cas du traitement de
la langue. Par exemple lors de la rsolution du problme de corfrence,
lorsqu'on cherche identifier si deux parties de texte font rfrence
une mme entit, une mme personne.
Les dfis venir semblent poss par les systmes d'information mo-
dernes imposant de nouvelles contraintes : les donnes massives sont
rparties, les systmes sont dcentraliss, en comptition ou coop-
ratifs. Un enjeu majeur rside dans la capacit d'exploiter ces masses
30
de donnes non plus sous l'angle de la centralisation, mais comme un

ensemble de tches d'apprentissage autonomes et personnalises sur
des donnes personnelles. Le caractre personnel et privatif des don-
nes ajoute une contrainte supplmentaire limitant la communication.
Des contraintes nergtiques apparaissent videmment. Apprendre ef-
ficacement sous de telles contraintes au sein d'un rseau de donnes et
de machines d'apprentissage semble un dfi fondamental et alternatif
l'hypercentralisation observe aujourd'hui.
Architectures de calcul
Les systmes d'apprentissage automatique modernes ncessitent du

calcul intensif et un stockage de donnes efficace afin de s'adapter la
taille des donnes et aux dimensions des problmes. Des algorithmes
seront excuts sur des GPU et d'autres architectures puissantes ; don-
nes et processus doivent tre distribus sur plusieurs processeurs. De
nouvelles recherches doivent s'attacher amliorer les algorithmes d'ap-
prentissage automatique et les formulations des problmes afin de tirer
le meilleur parti de ces architectures de calcul.
SIERRA sintresse avant tout aux problmes dapprentissage automa-

tique, le principal objectif tant de faire le lien entre la thorie et les
algorithmes, ainsi quentre les algorithmes et les applications fort im-
pact dans diffrents domaines techniques et scientifiques, en particulier
la vision artificielle, la bio-informatique, le traitement du signal audio, le
traitement de texte et la neuro-imagerie. Les dernires ralisations de
cette quipe de recherche comprennent des travaux thoriques et algo-
rithmiques pour une optimisation convexe grande chelle, dbouchant
sur des algorithmes qui effectuent quelques passages sur les donnes
tout en assurant une performance prdictive optimale dans un grand
nombre de situations dapprentissage supervis.
Les dfis futurs comprennent le dveloppement de nouvelles mthodes
dapprentissage non-supervis et llaboration dalgorithmes dapprentis-
sage pour les architectures informatiques parallles et distribues.
Apprentissage non-supervis
Les rsultats les plus remarquables obtenus dans le domaine de

l'apprentissage automatique sont bass sur l'apprentissage supervis,
31
c'est--dire l'apprentissage partir d'exemples dans lesquels le rsultat
attendu est fourni avec les donnes d'entre. Cela implique d'tiqueter
les donnes avec les rsultats attendus correspondants, un processus qui
ncessite des donnes grande chelle. Le Turc mcanique d'Amazon
(www.mturk.com) est un parfait exemple de la manire dont les grandes
entreprises mobilisent des ressources humaines pour annoter des don-
nes. Mais la vaste majorit des donnes existe sans rsultat attendu,
cest--dire sans annotation dsire ou nom de classe. Il convient donc
de dvelopper des algorithmes d'apprentissage non-supervis afin de
grer cette norme quantit de donnes non tiquetes. Dans certains
cas, un apport minime de supervision humaine peut tre utilis pour gui-
der lalgorithme non-supervis.
SEQUEL
Cette quipe-projet sappelle SEQUEL pour sequential learning (appren-
tissage squentiel). En effet, SEQUEL se concentre sur lapprentissage
dans les systmes artificiels (matriels ou logiciels) qui accumulent
des informations au fil du temps. Ces systmes sont dsigns ci-aprs
comme agents apprenants ou machines apprenantes. Les donnes re-
cueillies peuvent tre utilises pour faire une estimation de certains pa-
ramtres dun modle qui, son tour, peut tre utilis pour slectionner
des actions en vue dexcuter certaines tches doptimisation long
terme.
Ces donnes peuvent tre obtenues par un agent qui observe son envi-
ronnement : elles reprsentent ainsi une perception. Cest notamment
le cas lorsque lagent prend des dcisions - en vue datteindre un certain
objectif - qui affectent lenvironnement, et par consquent, le processus
dobservation lui-mme.
Dans SEQUEL, le terme "squentiel" se rfre deux aspects :
- lacquisition squentielle de donnes, partir de laquelle un modle
est appris (apprentissage supervis et non-supervis) ;
- la tche de prise de dcision squentielle, fonde sur le modle appris
(apprentissage par renforcement).
Les problmes relatifs lapprentissage squentiel incluent notamment

lapprentissage supervis, lapprentissage non-supervis et lappren-
tissage par renforcement. Dans tous ces cas, il est pos comme hy-
pothse que le processus peut tre considr comme stationnaire, au
moins pendant un certain temps, puisquil volue lentement.
Il est souhaitable davoir des algorithmes "anytime", cest--dire qu tout
moment, une prdiction peut tre requise ou une action peut tre s-
32
lectionne en tirant pleinement parti, et si possible le meilleur parti, de

lexprience dj acquise par lagent apprenant.
La perception de lenvironnement par lagent ( laide de ses capteurs)
nest gnralement pas la meilleure perception pour faire une prdiction
ou pour prendre une dcision (processus de dcision markovien partiel-
lement observable - POMDP). Par consquent, la perception doit tre
projete sur un espace dtat (ou entre) plus efficace et pertinent.
Enfin, une problmatique importante relative la prdiction concerne
son valuation : jusqu quel point peut-on se tromper lorsque lon fait
une prdiction ? Pour pouvoir contrler les systmes rels, il est essen-
tiel de rpondre cette question.
En rsum, les principales problmatiques traites par lquipe SEQUEL
concernent :
lapprentissage de modles, et plus spcifiquement de modles qui
projettent un espace dentre RP sur R ;
la projection de lobservation sur lespace dtats ;
le choix de laction excuter (dans le cas du problme de prise de
dcision squentielle) ;
les garanties dexcution ;
la mise en place dalgorithmes utilisables ;
le tout compris dans un cadre squentiel.
Les principales applications concernent les systmes de recomman-

dation, mais galement la prdiction, lapprentissage supervis et la
classification non-supervise de donnes (clustering). De nombreuses
mthodes sont utilises, depuis les mthodes noyaux jusqu lappren-
tissage profond. Les mthodes non-paramtriques sont souvent privil-
gies dans les travaux de SEQUEL.
Processus dapprentissage avec intervention humaine, explications
Les dfis portent sur la mise en place dune collaboration naturelle

entre les algorithmes dapprentissage automatique et les utilisateurs,
afin damliorer le processus dapprentissage. Pour ce faire, les systmes
dapprentissage automatique doivent tre en mesure de montrer leur
tat sous une forme comprhensible pour lHomme. De plus, lutilisa-
teur humain doit pouvoir obtenir des explications de la part du systme
sur nimporte quel rsultat obtenu. Ces explications seraient fournies au
cours de lapprentissage et pourraient tre lies des donnes dentre
ou des reprsentations intermdiaires. Elles pourraient galement in-
diquer des niveaux de confiance, selon le cas.
33
LACODAM
Les techniques relatives la science des donnes ont dj dmontr
leur immense potentiel. Toutefois, elles exigent de possder une solide
expertise non seulement sur les donnes dintrt, mais galement sur
les techniques dextraction de connaissances partir de ces donnes.
Seuls quelques experts hautement qualifis possdent une telle exper-
tise. Une mthode de recherche prometteuse consiste donc automa-
tiser (en partie) le processus li la science des donnes et le rendre
accessible un plus grand nombre dutilisateurs.
Un des travaux novateurs dans ce domaine a t le projet "Data Science
Machine" du MIT1, qui permet dautomatiser le processus dlicat du
feature engineering 2, afin didentifier les caractristiques les plus per-
tinentes parmi des milliers de caractristiques possibles et dexploiter
celles-ci en vue dexcuter des tches dapprentissage automatique. Une
autre approche intressante est celle du projet "Automatic Statistician"
de luniversit de Cambridge3, qui dcouvre des rgressions complexes
par exploration dun espace de recherche de combinaisons de noyaux de
rgression simples et produit des rapports en langage naturel.
Ces deux approches sont conues pour des tches supervises : elles
ont accs des mesures dvaluation leur permettant de mesurer au-
tomatiquement leur performance et de lamliorer. La nouvelle quipe
LACODAM sintresse lautomatisation pour mettre en place une ap-
proche plus exploratoire, dont le but est de dcouvrir des connaissances
"intressantes" partir de donnes, avec des informations pralables d-
finissant ce qui est intressant. Premirement, cela ncessite lutilisation
de mthodes diffrentes de celles mentionnes ci-dessus, comme lex-
traction de motifs ou le regroupement non-supervis de donnes (clus-
tering). Deuximement, cela exige dinteragir avec lutilisateur, car il est
le seul savoir ce qui lintresse. Un problme toujours prsent est de
trouver la meilleure mthode pour permettre au systme et lutilisateur
dexplorer conjointement les donnes. La solution exige une collabora-
tion entre lexploration de donnes et lapprentissage automatique ainsi
que lintelligence artificielle ou encore les interfaces homme-machine et
la visualisation.
1 James Max Kanter, Kalyan Veeramachaneni: Deep feature synthesis: Towards automating data
science endeavors. DSAA 2015: 1-10
2 Feature engineering : construction de nouvelles variables partir de celles dont on dispose dj.
3 David K. Duvenaud, James Robert Lloyd, Roger B. Grosse, Joshua B. Tenenbaum, Zoubin
Ghahramani: Structure Discovery in Nonparametric Regression through Compositional Kernel Search.
ICML (3) 2013: 1166-1174
34
Apprentissage par transfert
Lapprentissage par transfert est utile lorsque peu de donnes sont

disponibles pour lapprentissage dune tche. Il consiste utiliser pour
une nouvelle tche les connaissances ayant t acquises partir dune
autre tche et pour laquelle un plus grand nombre de donnes est dispo-
nible. Il sagit dune ide plutt ancienne (1993), dont les rsultats restent
modestes car elle est difficile mettre en uvre. En effet, elle implique
de pouvoir extraire les connaissances que le systme a acquises en pre-
mier lieu, mais il nexiste aucune solution gnrale ce problme (de
quelle manire, comment les rutiliser ? ...).
Une autre approche de lapprentissage par transfert est le "shaping".
Il sagit dapprendre une tche simple, puis de la complexifier progressi-
vement, jusqu atteindre la tche cible. Il existe quelques exemples de
cette procdure dans la littrature, mais aucune thorie gnrale.
Apprentissage automatique et aide la dcision : retours

dinformations, modles de causalit, reprsentations
Il existe une "exubrance irrationnelle" sur les mgadonnes (ou Big

data). Cette exubrance et le niveau lev des attentes de certains utili-
sateurs (entrepreneurs, journalistes, politiques) pourraient avoir un effet
contre-productif et exposer la communaut scientifique un hiver des
mgadonnes, semblable lhiver de lIA (longue priode despoirs d-
cus partie des annes 1980, dont lIA nest sortie quau dbut de ce
sicle).
TAO
I. P
rogrammes informatiques sous-spcifis : la programmation
par feedback
Les algorithmes comprennent des fonctionnalits de plus en plus com-
plexes, et l'utilisateur est de moins en moins dispos lire le manuel
d'utilisation. Pour raliser des logiciels (adapts un environnement
ouvert et des utilisateurs dont les prfrences voluent), la program-
mation par feedback investigue par TAO s'appuie sur l'interaction avec
l'utilisateur : itrativement, l'algorithme propose un nouveau comporte-
ment et l'utilisateur indique si ce comportement reprsente ou non une
amlioration (par rapport au meilleur comportement antrieur).
Cette approche repose sur deux piliers fondamentaux :
- lapprentissage automatique, pour modliser les prfrences de l'utili-
35
sateur en fonction de ses retours ;
- loptimisation, pour choisir les comportements proposs les plus infor-
matifs et minimiser le temps requis pour atteindre un comportement
satisfaisant.
L'une des questions ouvertes concerne la communication avec l'utili-

sateur, permettant l'humain dans la boucle de donner du sens au pro-
cessus dapprentissage et d'interaction. Les approches envisages se
fondent sur la visualisation d'une part, et sur la dfinition de tches ou
d'environnements graduellement plus complexes d'autre part.
II. Dcision optimale et apprentissage de modles causaux

Parmi les objectifs de lexploitation des mgadonnes figure la dci-
sion optimale. Or, les modles permettant de prendre des dcisions
appropries sont ncessairement des modles causaux (par opposition
aux modles prdictifs, qui peuvent s'appuyer sur des corrlations).
Par exemple, les notes des lves sont corrles la prsence plus
ou moins importante de livres leur domicile. Cependant, envoyer des
livres dans chaque foyer namliorera pas les notes des lves, toutes
choses gales par ailleurs.
La recherche de modles causaux conduit revisiter les critres de l'ap-

prentissage statistique. Une approche prometteuse consiste apprendre
un indice de causalit, en partant de l'ensemble des problmes pour les-
quels la causalit est connue (par exemple, l'altitude d'une ville "cause"
sa temprature moyenne).
III. Changements de reprsentation / apprentissage profond

Les avances significatives apportes par l'apprentissage de rseaux
neuronaux profonds (par exemple dans les domaines de la vision par
ordinateur ou du traitement automatique du langage naturel) sont lies
leur capacit apprendre automatiquement une reprsentation efficace
de domaines complexes partir d'une grande quantit de donnes (ou
d'interactions intensives avec l'environnement dans le contexte de l'ap-
prentissage par renforcement).
Parmi les perspectives de recherche figurent :

la recherche d'approches d'optimisation non convexe efficaces d'un
point de vue mathmatique (e.g. en tenant compte de la gomtrie de
l'espace) et informatique (e.g. du point de vue de la complexit algorith-
mique en temps et en mmoire, tirant parti des architectures spciali-
ses) ;
36
4.3_Les dfis gnriques dans lanalyse des signaux : vision, parole
lextension de ces mthodes au cas de petites donnes, lorsqu'on dis-

pose de connaissances a priori sur le domaine d'application (permettant
par exemple l'augmentation des donnes par application d'oprateurs
d'invariance) ;
lexploitation de sources de donnes complmentaires (par exemple
concernant des donnes relles et des donnes simules) pour
construire des reprsentations la fois prcises et robustes.
4.3
es dfis gnriques dans lanalyse des
L
signaux : vision, parole
Lanalyse des signaux, en particulier la vision et la parole, a bnfici
des rcents progrs de lIA. Les systmes dapprentissage profond ont
gagn de nombreuses comptitions dans le domaine de la reconnais-
sance des formes et de la reconnaissance visuelle. Ainsi, le systme de
vision MobilEye renforce les capacits de conduite autonome des voi-
tures Tesla, tandis que des assistants vocaux tels que Siri, Cortana ou
Amazon Echo, sont utiliss chaque jour par des millions de personnes.
Les diffrents dfis relatifs lanalyse des signaux visuels sont les
suivants : (i) le passage lchelle ; (ii) la transition entre images fixes et
vido ; (iii) la multimodalit ; (iv) lintroduction de connaissances a priori.
THOTH
La quantit dimages et de vidos numriques disponibles en ligne
ne cesse daugmenter de manire exponentielle : les particuliers
publient leurs films sur YouTube et leurs images sur Flickr, les journa-
listes et les scientifiques crent des pages web pour diffuser des infor-
mations et des rsultats de recherche, et les archives audiovisuelles des
missions de tlvision sont accessibles au public. En 2018, il est prvu
que prs de 80 % du trafic sur Internet seront gnrs par les vidos et
quune personne mettrait plus de cinq millions dannes pour visionner la
quantit de vidos qui sera alors publie chaque mois sur les rseaux IP
mondiaux. Par consquent, il est de plus en plus ncessaire, dannoter
et dindexer ce contenu visuel pour les utilisateurs particuliers et profes-
sionnels. Les mtadonnes textuelles et auditives disponibles ne sont
gnralement pas suffisantes pour rpondre la plupart des requtes
et les donnes visuelles doivent alors entrer en jeu. Par ailleurs, il nest
pas concevable de dfinir les modles des contenus visuels ncessaires
37
pour rpondre ces requtes en annotant manuellement et rigoureuse-
ment chaque catgorie de concept, dobjet, de scne ou daction perti-
nente dans un chantillon reprsentatif de situations quotidiennes, ne
serait-ce que parce quil serait difficile, voire impossible, de dterminer
a priori les catgories pertinentes et le niveau de granularit appropri.
Lide principale de la proposition de lquipe-projet THOTH est de

dvelopper un nouveau cadre pour apprendre automatiquement la
structure et les paramtres de modles visuels, en explorant acti-
vement de grandes sources dimages et de vidos numriques (des
archives hors ligne, mais galement la quantit croissante de contenus
disponibles en ligne, avec des centaines de milliers dimages), tout en
exploitant le faible signal de supervision mis par les mtadonnes qui
les accompagnent. Cet norme volume de donnes dapprentissage
visuelles permettra lapprentissage de modles complexes non-li-
naires avec un grand nombre de paramtres, tels que les rseaux
convolutifs profonds et les modles graphiques dordre suprieur.
Lobjectif principal de lquipe THOTH est dexplorer automatiquement

de grandes collections de donnes, de slectionner les informations
pertinentes et dapprendre la structure et les paramtres de modles
visuels. Il existe trois dfis majeurs : (1) la conception et lapprentis-
sage de modles structurs capables de reprsenter des informations
visuelles complexes ; (2) lapprentissage en ligne de modles visuels
partir dannotations textuelles, de sons, dimages et de vidos ; et (3)
lapprentissage et loptimisation grande chelle. Un autre point impor-
tant est (4) la collecte et lvaluation des donnes.
Passage lchelle
Les systmes de vision modernes doivent tre capables de traiter des

donnes volumineuses et haute frquence. Cest par exemple le cas
pour les systmes de surveillance dans les lieux publics, les robots vo-
luant dans des environnements inconnus et les moteurs de recherche
dimages sur le web qui doivent tous traiter dnormes quantits de don-
nes. Les systmes de vision doivent non seulement traiter ces donnes
trs rapidement mais galement le faire en garantissant des niveaux de
prcision levs pour viter toute ncessit de vrification des rsultats
ou tout post-traitement de la part doprateurs humains. Mme les taux
de prcision atteignant 99,9 % pour la classification dimages pour des
systmes critiques ne sont pas suffisants lors du traitement de millions
38
dimages, puisque les 0,1 % restants ncessiteront des heures de traite-

ment par lHomme.
Transition entre images fixes et vido
La reconnaissance dobjets dans des images reste un vritable dfi

au sens gnral du terme, mme si des rsultats trs prometteurs sont
disponibles. La reconnaissance dactions dans des vidos - et plus
gnralement la comprhension de scnes - est un domaine en pleine
expansion qui a dclench de nouvelles recherches, comme celles de
lquipe-projet STARS prsente ci-aprs.
STARS
Au cours de ces dernires annes, de nombreuses tudes avances
ont t ralises dans le domaine de lanalyse des signaux, et en parti-
culier dans celui de la comprhension de scnes. La comprhension de
scnes est un processus, souvent ralis en temps rel, de perception,
danalyse et dlaboration dune interprtation dune scne dynamique
en 3D observe par lintermdiaire dun rseau de capteurs (camras
vido, par exemple). Ce processus consiste essentiellement associer
les informations des signaux issues des capteurs observant la scne
avec les modles dvelopps pour comprendre la scne. Par cons-
quent, la comprhension de scnes ajoute et extrait de la smantique
partir des donnes des capteurs qui caractrisent une scne. Cette
scne peut contenir un certain nombre dobjets physiques diffrents
(personnes, vhicules) qui interagissent entre eux ou avec un environ-
nement (quipements, par exemple) plus ou moins structur. La scne
peut durer quelques instants (chute dune personne) ou quelques mois
(dpression dune personne) et peut tre limite une lame de verre de
laboratoire observe travers un microscope ou dpasser la taille dune
ville. Les capteurs sont gnralement des camras (omnidirectionnelles,
infrarouges, de profondeur), mais il peut galement sagir de micro-
phones ou dautres types de capteurs (tels que les cellules optiques, les
capteurs de contact, les capteurs physiologiques, les acclromtres,
les radars, les dtecteurs de fume, les smartphones, etc.).
La comprhension de scnes sinspire de la vision cognitive et ncessite

lassociation dau moins trois domaines : la vision par ordinateur, les
sciences cognitives et le gnie logiciel.
39
Figure 5 : Reconnaissance d'activit dans un hpital - Inria / Photo H. Raguet
La comprhension de scnes peut atteindre cinq niveaux de fonction-

nalits gnriques de vision par ordinateur : la dtection, la localisation,
le suivi, la reconnaissance et la comprhension. Toutefois, les systmes
de comprhension de scnes vont au-del de la dtection de carac-
tristiques visuelles, telles que les angles, les bords ou les zones en
mouvement, pour extraire les informations lies au monde physique qui
sont importantes pour les oprateurs humains. La comprhension de
scnes exige galement des fonctionnalits de vision par ordinateur plus
robustes, plus solides et plus flexibles, en leur donnant une comptence
cognitive : la capacit dapprendre, de sadapter, dvaluer les solutions
alternatives et de dvelopper de nouvelles stratgies pour lanalyse et
linterprtation.
Concernant la comprhension de scnes, lquipe STARS a dvelopp

des systmes automatiss originaux afin de comprendre les comporte-
ments humains dans un grand nombre denvironnements et pour diff-
rentes applications :
dans les stations de mtro, dans les rues et bord des trains :
violences, bagages abandonns, graffitis, fraudes, comportement de la
foule ;
dans les zones aroportuaires : arrive des avions, ravitaillement des
avions, chargement/dchargement des bagages, guidage au sol des
avions ;
dans les banques : braquages, contrles daccs dans les btiments,
40
utilisation de distributeurs automatiques de billets ;

applications de soins domicile pour le suivi des activits des
personnes ges : cuisine, repos, prparation dun caf, visionnage
de programmes tlviss, prparation de la bote pilules, chute de
personnes ;
maison intelligente, suivi du comportement au bureau pour lintelli-
gence ambiante : lecture, consommation de boissons ;
surveillance dans les supermarchs: arrts devant un produit, files dat-
tente, retraits darticles ;
applications biologiques : tude du comportement des gupes.
Pour laborer ces systmes, lquipe STARS a conu de nouvelles tech-

nologies pour la reconnaissance des activits humaines notamment
laide de camras vido 2D et 3D. Plus prcisment, les chercheurs ont
combin trois catgories dalgorithmes pour reconnatre les activits
humaines :
des moteurs de reconnaissance qui utilisent des ontologies exprimes
par des rgles reprsentant les connaissances de lexpert. Ces moteurs
de reconnaissance dactivits peuvent tre facilement tendus et
permettent dintgrer ultrieurement des informations supplmentaires
issues des capteurs lorsquelles sont disponibles [Knig 2015] ;
des mthodes dapprentissage supervis qui sappuient sur des
chantillons positifs/ngatifs reprsentatifs des activits cibles spci-
fies par les utilisateurs. Ces mthodes sappuient gnralement sur le
modle de "sac de mots" (bag-of-words) qui calcule une grande varit
de descripteurs spatio-temporels [Bilinski 2015].
des mthodes dapprentissage non-supervis (entirement automati-
ses) qui dcouvrent des classes dactivits dans des grandes bases de
donnes [Negin 2015].
Bibliographie :
- A. Knig, C. Crispim, A. Covella, F. Bremond, A. Derreumaux, G. Bensadoum, R. David, F.
Verhey, P. Aalten et P.H. Robert. Ecological Assessment of Autonomy in Instrumental Activities
of Daily Living in Dementia Patients by the means of an Automatic Video Monitoring System,
Frontiers in Aging Neuroscience - publication en libre accs - http://dx.doi.org/10.3389/
fnagi.2015.00098, 02 June 2015.
- P. Bilinski et F. Bremond. Video Covariance Matrix Logarithm for Human Action Recognition in
Videos. The International Joint Conference on Artificial Intelligence, IJCAI 2015, Buenos Aires,
Argentine du 25 au 31 juillet 2015.
- F. Negin, S. Cosar, M. Koperski, et F. Bremond. Generating Unsupervised Models for Online
Long-Term Daily Living Activity Recognition. The 3rd IAPR Asian Conference on Pattern
Recognition, ACPR2015, Kuala Lumpur, Malaisie, 4-6 novembre 2015.
41
Multimodalit
La comprhension des donnes visuelles peut tre amliore de dif-

frentes manires : sur le web, les mtadonnes qui accompagnent les
images et les vidos peuvent tre utilises pour liminer certaines hy-
pothses et guider le systme vers la reconnaissance dobjets, dvne-
ments et de situations spcifiques. Une autre option consiste utiliser
la multimodalit, cest--dire des signaux manant de diffrents canaux
(infrarouges, lasers, signaux magntiques, etc.). Il est galement sou-
haitable dutiliser une combinaison de signaux sonores en complment
de la vision (images ou vidos) le cas chant. Par exemple, un dfi a
t propos par lAgence Nationale de la Recherche et la DGA en 2010
(http://www.defi-repere.fr/) : lidentification multimodale de personnes
dans des missions dinformation, en utilisant limage dans laquelle les
personnes sont visibles, les textes en incrustation dans lesquels le nom
des personnes apparat, la bande-son dans laquelle la voix des locuteurs
est reconnaissable et le contenu du signal de parole dans lequel le nom
des personnes est prononc.
Le programme de recherche de lquipe-projet PERCEPTION repose sur

ltude et la mise en place de modles informatiques, en vue dtablir
un lien entre images et sons dune part et significations et actions
dautre part. Les membres de lquipe-projet PERCEPTION relvent
ce dfi grce une approche interdisciplinaire allant de la vision par
ordinateur au traitement de signaux sonores, en passant par lanalyse de
scnes, lapprentissage automatique et la robotique. Plus prcisment,
PERCEPTION dveloppe des mthodes pour la reprsentation et la
reconnaissance dobjets et dvnements visuels et sonores, la fusion
audiovisuelle, la reconnaissance des actions, des gestes et de la parole de
lHomme, laudition spatiale et linteraction Homme-robot.
Les sujets de recherche de cette quipe-projet sont les suivants :

la vision par ordinateur : reprsentation spatio-temporelle dinforma-
tions visuelles en 2D et 3D, reconnaissance des gestes et des actions,
capteurs 3D, vision binoculaire, systmes avec plusieurs camras ;
lanalyse de scnes sonores : audition binaurale, localisation et spara-
tion de sources sonores, communication verbale, classification dvne-
ments sonores ;
lapprentissage automatique : modles de mlange, rduction de di-
mension linaire et non-linaire, apprentissage de varits, modles gra-
phiques ;
42
la robotique : vision robotique, audition robotique, interaction Homme-

robot, fusion de donnes.
Lquipe-projet WILLOW sintresse des problmes fondamentaux de

la vision par ordinateur, notamment la perception en trois dimensions,
la photographie numrique ou encore la comprhension dimages et de
vidos.
Elle tudie de nouveaux modles de contenus dimages (quels sont les
critres dun vocabulaire visuel adapt ?) et de processus dinterprtation
(quest-ce quune architecture de reconnaissance efficace ?).
Ses dernires ralisations incluent notamment un travail thorique sur
les fondements gomtriques de la vision par ordinateur, de nouvelles
avances en matire de restauration dimages (retrait deffet flou,
rduction du bruit, surchantillonnage), ou encore des mthodes
faiblement supervises pour la localisation temporelle dactions
dans des vidos. Les membres de lquipe WILLOW travaillent en
troite collaboration avec les quipes SIERRA et THOTH dInria,
ainsi quavec des chercheurs de luniversit Carnegie-Mellon, de
luniversit de Californie Berkeley ou encore du laboratoire dIA de
Facebook, collaborations qui mettent en avant la forte synergie qui unit
lapprentissage automatique et la vision par ordinateur, avec de nouvelles
opportunits qui mergent galement dans des domaines comme
larchologie ou la robotique.
Les dfis futurs incluent notamment le dveloppement de modles
trs faiblement superviss de reconnaissance visuelle dans des
ensembles de donnes dimages et de vidos grande chelle, laide
de mtadonnes disponibles sous forme de texte ou de parole, par
exemple.
Introduction de connaissances a priori
Une autre option visant amliorer les applications de vision consiste

introduire des connaissances a priori dans le moteur de reconnais-
sance. Lexemple ci-dessous, issu de lquipe-projet ASCLEPIOS, consiste
ajouter des informations sur lanatomie et la pathologie dun patient
pour garantir de meilleures analyses des images biomdicales. Dans
dautres domaines, il est possible dutiliser des informations contex-
tuelles, des informations sur une situation ou une tche, ou encore
des donnes de localisation, pour lever toute ambigut sur les inter-
43
prtations possibles. Toutefois, la question de savoir comment fournir
ces connaissances a priori nest pas rsolue de manire gnrale : des
mthodes et des reprsentations de connaissances spcifiques doivent
tre tablies pour traiter une application cible en vision artificielle.
Lquipe-projet ASCLEPIOS a trois axes de recherches principaux :

lanalyse dimages biomdicales partir de modles gomtriques,
statistiques, physiques et fonctionnels avancs ;
la simulation de systmes physiologiques partir de modles infor-
matiques sappuyant sur des images biomdicales et dautres signaux ;
lapplication de ces outils la mdecine et la biologie pour assis-
ter la prvention, le diagnostic et la thrapie.
Figure 6 : Modlisation biophysique partir d'analyse d'images mdicales

Inria / Photo H. Raguet
Le point sur lanalyse dimages mdicales : la qualit des images biom-

dicales tend samliorer de faon constante (meilleure rsolution
spatiale et temporelle, meilleur rapport signal/bruit). Non seulement les
images sont multidimensionnelles (trois coordonnes spatiales et ven-
tuellement une dimension temporelle), mais les protocoles mdicaux
ont aussi tendance inclure des images multisquences (ou multipa-
ramtriques) et multimodales pour chaque patient. Malgr les efforts
et les avances considrables raliss au cours de ces vingt dernires
annes, les problmes les plus importants relatifs la segmentation et
44
au recalage dimage nont pas t rsolus de manire gnrale.

Le premier objectif de cette quipe-projet, court terme, est de travailler
sur des versions spcifiques de ces problmes, en prenant en compte
autant dinformations a priori que possible sur lanatomie et la patholo-
gie du patient. Leur second objectif vise inclure un plus grand nombre
de connaissances sur les proprits physiques de lacquisition dimages
et les tissus observs ainsi que sur les processus biologiques mis en
uvre. Les autres thmes de recherche de lquipe-projet ASCLEPIOS
sont lanalyse dimages biologiques, lanatomie algorithmique et la
physiologie algorithmique.
Les dfis de lanalyse des signaux vocaux et sonores partagent beau-

coup de points communs avec la liste prcdente : le passage lchelle,
la multimodalit et lintroduction de connaissances a priori sont gale-
ment pertinents pour les applications audio. Les applications cibles sont
lidentification du locuteur, la comprhension de la parole, le dialogue (y
compris pour les robots), ainsi que la traduction automatique en temps
rel. Dans le cas de signaux audio, il est galement ncessaire de d-
velopper ou davoir accs des donnes volumineuses pour lappren-
tissage automatique. Lapprentissage incrmental en ligne pourrait tre
ncessaire pour le traitement de la parole en temps rel.
MULTISPEECH est une quipe de recherche commune de lUniver-

sit de Lorraine, dInria et du CNRS. Elle fait partie du dpartement D4
"Traitement automatique des langues et des connaissances" du Loria.
Outre la vision, laudition est un sens porteur de prcieuses informations

pour les interactions Homme-machine (comprhension de la parole, re-
connaissance du locuteur et des motions) et la perception de lenviron-
nement (informations sonores sur des activits, un danger, etc.). La tech-
nologie dapprentissage profond fait aujourdhui partie de ltat de lart
et a entran ces cinq dernires annes la diffusion dinterfaces vocales
avec microphone rapproch. Les grands dfis qui subsistent sont notam-
ment lutilisation de microphones distants affects par la rverbration
et le bruit acoustique, lexploitation de grandes quantits de donnes
vocales et audio non tiquetes, lamlioration de la robustesse face
la variabilit des locuteurs et des vnements sonores, lexploitation
dinformations contextuelles et lintgration robuste dautres techniques
de dtection.
45
Lquipe MULTISPEECH semploie actuellement relever ces dfis en
dveloppant des architectures dapprentissage profond adaptes diff-
rents sous-problmes, en les regroupant dans des systmes plus larges
et en essayant dvaluer et de transposer le niveau de confiance dun
systme un autre. Outre les interfaces vocales, les applications de
ces technologies incluent notamment les dispositifs de surveillance pour
lassistance domicile ou les villes intelligentes.
4.4
dfis gnriques dans les
Les
connaissances et le web smantique
Daprs la dfinition initiale de Tim Berners-Lee, "le web smantique
est une extension du web actuel dans laquelle linformation se voit associe
un sens bien dfini, amliorant ainsi la capacit des ordinateurs et des hu-
mains travailler en coopration." La "semantic tower" sappuie sur des
URI et sur le format XML, travers des schmas RDF reprsentant des
triplets de donnes, jusqu des ontologies permettant un raisonnement
et un traitement logique. Les quipes dInria impliques dans la repr-
sentation, le raisonnement et le traitement des connaissances relvent
les dfis du web smantique de diffrentes manires : (i) en traitant de
grands volumes dinformations issues de sources rparties htrognes;
(ii) en tablissant des liens entre les donnes massives stockes dans des
bases de donnes laide de technologies smantiques ; (iii) en dve-
loppant des applications sappuyant sur la smantique et matrisant ces
technologies.
Traitement de grands volumes dinformations issus de sources

distribues htrognes
Avec lomniprsence dInternet, nous sommes dsormais face

lopportunit et au dfi de passer de systmes intelligents artificiels lo-
caux des socits et des intelligences artificielles largement rparties.
Concevoir et maintenir en fonctionnement des systmes fiables et ef-
ficaces regroupant des donnes lies depuis des sources distantes, au
travers de flux de traitement et de services rpartis, est toujours un pro-
blme. Les aspects suivants doivent tre traits grande chelle et de
manire continue : la qualit des donnes et la traabilit des processus
qui les manipulent, le niveau de prcision de leur extraction et de leur
capture, lexactitude de leur alignement et de leur intgration ou encore
la disponibilit et la qualit des modles partags (ontologies, vocabu-
46
4.4_Les dfis gnriques dans les connaissances et le web smantique
laires) ncessaires pour reprsenter, changer ou encore raisonner sur

les donnes.
Le sujet principal de lquipe-projet EXMO est lhtrognit des

connaissances et leur reprsentation.
Lopportunit offerte par le web de partager des connaissances grande
chelle a fait de cette proccupation centrale un point critique. Lquipe-
projet EXMO a effectu des travaux importants sur lalignement donto-
logies dans le contexte du web smantique. Lalignement dontologies
consiste trouver des lments lis dans des ontologies htrognes
et les exprimer comme des alignements.
Lquipe-projet EXMO a conu des langages dalignement avec une

smantique formelle et un support logiciel (the Alignment API). Elle a
dvelopp des aligneurs dontologies par mesures de similarit. Enfin,
lquipe-projet est lorigine des campagnes annuelles Ontology
Alignment Evaluation Initiative, qui valuent les aligneurs dontologies.
Des travaux plus rcents ont port sur linterconnexion des donnes,
cest--dire lalignement de donnes plutt que dontologies, avec la no-
tion de cls de liaison (link keys).
Un autre sujet de lquipe est lvolution des connaissances. EXMO

a contribu la rvision de rseaux dontologies. Toutefois, pour ga-
rantir une volution homogne des connaissances, ses futurs travaux
adapteront les techniques dvolution culturelle la reprsentation des
connaissances.
Un second aspect du web est quil offre non seulement un cadre

dapplication universel pour Internet, mais galement un espace hybride
dans lequel les humains et les agents logiciels peuvent interagir grande
chelle et former des communauts mixtes. Aujourdhui, des millions
dutilisateurs et dagents artificiels interagissent quotidiennement dans
des applications en ligne, entranant ainsi la ncessit dtudier et de
concevoir des systmes trs complexes. Il est ncessaire de disposer de
modles et dalgorithmes qui produisent des justifications et des explica-
tions, et qui acceptent les retours dinformation pour prendre en charge
des interactions avec diffrents utilisateurs. Il faut pour cela prendre en
compte les utilisateurs en tant que composants intelligents des systmes
complexes, qui interagissent avec dautres composants (intelligence arti-
ficielle dans les interfaces, interaction en langage naturel), qui participent
47
au processus (calcul par lhumain, crowdsourcing, machines sociales) et
qui peuvent tre amliors par le systme (amplification de lintelligence,
augmentation cognitive, intelligence augmente et cognition distribue).
WIMMICS
Les applications web (Wikipedia, par exemple) proposent des espaces
virtuels dans lesquels les personnes et les logiciels interagissent dans
des communauts mixtes qui changent et utilisent des connaissances
formelles (ontologies, bases de connaissances) et des contenus infor-
mels (textes, messages, tiquettes).
Lquipe-projet WIMMICS tudie des modles et des mthodes qui
mettent en relation la smantique formelle et la smantique sociale sur
le web. Elle suit une approche multidisciplinaire pour analyser et mo-
dliser ces espaces, leurs communauts dutilisateurs et leurs interac-
tions. Elle fournit galement des algorithmes de calcul pour produire ces
modles partir des traces sur le web, notamment grce lextraction
de connaissances depuis un texte, lanalyse smantique des rseaux
sociaux et grce la thorie de largumentation.
Figure 7 : Sans la smantique, la Russie apparat plus prs du Pakistan que de lUkraine.
Extrait de larticle "Why the Data Train Needs Semantic Rails" par Janowicz et al., AI
Magazine, 2015.
Pour pouvoir formaliser et raisonner sur ces modles, WIMMICS pro-

pose des langages et des algorithmes qui utilisent et tendent les
approches bases sur les graphes de connaissances pour le web s-
mantique et le web de donnes, notamment le Resource Description
Framework (RDF). Ensemble, ces contributions se concrtisent par des
outils danalyse et des indicateurs qui fournissent de nouvelles fonction-
nalits pour les communauts.
48
Les rsultats de ces recherches sont intgrs, valus et transfrs

par lintermdiaire de logiciels gnriques (moteur de recherche pour le
web smantique CORESE) et dapplications spcialises (moteurs de
recherche DiscoveryHub et QAKIS).
tablissement de ponts entre les donnes massives stockes

dans des bases de donnes laide de technologies smantiques
Le web smantique traite lintgration massive de sources de

donnes trs diverses (capteurs des villes intelligentes, connaissances
biologiques extraites darticles scientifiques ou encore descriptions
dvnements sur les rseaux sociaux) qui utilisent des vocabulaires trs
diffrents (schmas relationnels, thsaurus, ontologies formelles), dans
des raisonnements trs varis (prises de dcision par drivation logique,
enrichissements grce linduction, fouilles de donnes, etc.). Sur le web,
le graphe original des hyperliens est accompagn dun nombre croissant
dautres graphes et est combin des sociogrammes qui capturent la
structure des rseaux sociaux, des workflows qui dfinissent les chemins
de dcision suivre, des logs qui capturent les traces de navigation
des utilisateurs, des compositions de services qui spcifient des trai-
tements rpartis, ou encore des ensembles de donnes lies. De plus,
ces graphes ne sont pas disponibles dans un entrept central unique,
mais sont rpartis sur de nombreuses sources diffrentes. Certains sous-
graphes sont publics (dbpedia http://dbpedia.org , par exemple), tandis
que dautres sont privs (donnes dentreprises). Certains sous-graphes
sont petits et stocks localement (le profil dun utilisateur sur un appa-
reil, par exemple), dautres sont plus grands et hbergs sur des clusters
(Wikipedia), certains sont largement stables (thsaurus du latin), dautres
changent plusieurs fois par seconde (statuts sur les rseaux sociaux), etc.
Un type de rseau nest pas isol, il interagit avec dautres rseaux : les
rseaux sociaux influencent les flux de messages, ainsi que leurs sujets
et leur nature, les liens smantiques entre les termes interagissent avec
les liens entre les sites et vice versa, etc. La mise en place de mthodes
permettant de reprsenter et danalyser les types de graphes, de les
regrouper et de regrouper les processus qui sappliquent ces graphes,
reprsente un dfi considrable.
CEDAR
Pour donner un sens aux mgadonnes (Big data), il est ncessaire de
les interprter travers le prisme des connaissances sur le contenu,
49
leur organisation et leur signification. De plus, la connaissance dun
domaine est souvent le langage le plus proche des utilisateurs, quils
soient experts dun domaine ou des utilisateurs novices dune applica-
tion manipulant de grands volumes de donnes. Des outils volutifs et
expressifs de type OBDA (accs aux donnes par des ontologies)
reprsentent par consquent un facteur cl dans la russite des applica-
tions de mgadonnes.
Lquipe-projet CEDAR travaille linterfaage entre des formalismes
de reprsentation des connaissances (notamment logiques de descrip-
tion ou rgles existentielles) et des moteurs de bases de donnes. Elle
conoit des outils de type OBDA trs efficaces, en accordant une at-
tention particulire au passage lchelle vers des bases de donnes
plus grandes, en intgrant par exemple des capacits de raisonnement
aux moteurs des bases de donnes ou en les dployant dans le cloud,
pour passer lchelle. Lquipe-projet CEDAR tudie galement de nou-
velles mthodes dinteraction avec des bases de connaissances et de
donnes plus grandes et plus complexes, comme celles rfrences
dans le Linked Open Data cloud (http://lod-cloud.net). La smantique est
galement envisage comme moyen de donner du sens des contenus
complexes htrognes, et de les intgrer dans des banques de don-
nes web riches et htrognes. Une application particulire concerne
la vrification de faits journalistiques (fact-checking).
GRAPHIK
Exploiter les diffrentes donnes disponibles aujourd'hui passe par une
prise en compte de leur smantique, c'est--dire par la connaissance.
Cette exigence, largement reconnue, a donn naissance un nouveau
paradigme, lOBDA (voir ci-dessus), qui s'appuie sur les ontologies de
domaine pour accder aux donnes. En d'autres termes, les bases de
donnes deviennent des bases de connaissances dans lesquelles on a
ajout une couche ontologique sur les donnes. L'ajout de cette couche
prsente plusieurs intrts : il permet de dduire des informations non
explicitement codes dans les donnes, d'adapter le vocabulaire de re-
qute aux besoins spcifiques et d'accder des sources de donnes
htrognes de faon uniforme.
Au cours des dix dernires annes, un nombre significatif de recherches

a abouti toute une srie de langages dontologies offrant diffrents de-
grs de compromis entre expressivit et complexit. Cependant, il reste
encore beaucoup de progrs accomplir avant d'obtenir des systmes
50
volutifs allant au-del des ontologies de base. De plus, les recherches

sur les systmes OBDA se fondent sur l'hypothse selon laquelle les
donnes suivent des structures relationnelles, alors mme que des
volumes croissants de sources de donnes ne sont pas relationnels,
comme les bases de donnes NOSQL pour le "Big data analytics". La
question de savoir si le paradigme OBDA peut tre adapt aux systmes
de gestion de donnes non relationnels reste ouverte.
L'une des fonctions importantes des techniques base de connais-

sances est leur capacit d'explication, c'est--dire leur capacit poten-
tielle justifier les conclusions obtenues. tre capable d'expliquer, de
justifier ou d'argumenter est une caractristique obligatoire dans de
nombreuses applications de lIA dans lesquelles les utilisateurs ont be-
soin de comprendre les rsultats du systme afin de pouvoir aussi bien
s'y fier que le matriser. En outre, cela devient un problme crucial d'un
point de vue thique ds que des dcisions automatises ont un impact
potentiel sur les tres humains.
Les recherches de GRAPHIK portent principalement sur le domaine

de la reprsentation des connaissances et du raisonnement. L'quipe-
projet est particulirement intresse par les formalismes daccs
aux donnes, comme les logiques de description et les rgles exis-
tentielles / Datalog+. Les contributions de l'quipe-projet portent la
fois sur l'aspect thorique et sur l'aspect appliqu. GRAPHIK s'attaque
actuellement la question de lOBDA, en mettant l'accent sur le dve-
loppement de formalismes appropris avec des algorithmes efficaces
et sur la question du raisonnement avec des informations imparfaites,
en insistant sur l'explication et la justification des conclusions tires de
sources de donnes incohrentes.
LINKS
L'apparition du web de donnes a fait natre le besoin de nouvelles
technologies de gestion de bases de donnes pour les collections
de donnes lies. Les dfis classiques de recherche sur les bases de
donnes sappliquent maintenant aux donnes lies : comment dfinir
des requtes logiques exactes, comment grer des mises jour dyna-
miques et comment automatiser la recherche des requtes appropries.
Contrairement aux donnes ouvertes lies ordinaires, les recherches de
lquipe-projet LINKS sont axes sur les collections de donnes lies
sous diffrents formats, partant de l'hypothse que les donnes sont
51
correctes dans la plupart des dimensions. Les problmes restent diffi-
ciles rsoudre en raison de donnes incompltes, de schmas non-in-
formatifs ou htrognes, ainsi que de donnes errones ou ambigus.
Lquipe-projet dveloppe des algorithmes pour l'valuation et l'optimisa-
tion des requtes logiques sur les collections de donnes lies, des algo-
rithmes incrmentaux pouvant superviser les flux du web de donnes et
grer les mises jour dynamiques des collections de donnes lies, ainsi
que des algorithmes d'apprentissage symbolique qui peuvent dduire,
partir d'exemples, les requtes appropries pour des collections de
donnes lies. LINKS dveloppe aussi des langages de programmation
rpartis pour la gestion dynamique des collections de donnes.
Ses principaux objectifs de recherche se structurent comme suit :

- requtes sur des donnes lies htrognes : dveloppement de
nouveaux types de mises en correspondance de schmas pour les jeux
de donnes semi-structurs en formats hybrides, y compris les collec-
tions RDF et les bases de donnes relationnelles. Ceux-ci impliquent
des requtes rcursives sur les collections de donnes lies avec des
algorithmes d'valuation, une analyse statique et allant vers des applica-
tions concrtes ;
- gestion des donnes lies dynamiques : dveloppement des lan-
gages de programmation distribus, centrs sur les donnes, en utilisant
des flux et le paralllisme, pour grer les collections dynamiques de don-
nes lies et les flux de traitement. En se basant sur de nouveaux algo-
rithmes de requtes incrmentales, lquipe-projet tudie la propagation
des mises jour de donnes dynamiques par mises en correspondance
des schmas, ainsi que les mthodes d'analyse statique pour les work-
flows du web de donnes ;
- graphes de liaison : dveloppement des algorithmes d'apprentissage
symbolique pour gnrer des requtes et des mises en correspondance
(mappings) de donnes lies, en diffrentes reprsentations graphiques,
partir d'exemples annots.
DYLISS
Les sciences exprimentales subissent une rvolution des donnes en
raison de la multiplication des capteurs qui permettent de mesurer l'vo-
lution dans le temps de milliers d'lments interdpendants, physiques
ou biologiques. Lorsque les mesures sont suffisamment prcises et
varies, elles peuvent tre intgres dans un systme d'apprentissage
machine afin de connatre le rle et la fonction des lments dans le
systme exprimental analys.
52
4.5_Les dfis gnriques en robotique et vhicules autonomes
Toutefois, dans de nombreux domaines tels que la biologie molculaire,

la chimie et l'environnement, les mesures ne sont pas suffisantes pour
identifier le rle spcifique de chaque composant.
Dans ce cas, il est essentiel de confronter le rsultat des analyses de
donnes au corpus de savoir qui est actuellement en cours de structu-
ration dans le cadre de l'initiative Linked Open Data (donnes ouvertes
lies) associe aux technologies du web smantique. En effet, il existe
aujourdhui plus de mille cinq-cents entrepts de connaissances sur les
sciences exprimentales, stockes au format RDF. L'un des principaux
dfis poss est donc de permettre l'exploration, le tri et l'extraction de
candidats pour les fonctions de composants. C'est pourquoi l'quipe
DYLISS a pour objectif de dvelopper des techniques de programma-
tion logiques permettant de combiner efficacement classification double
symbolique, base sur l'analyse de concepts formels, avec les technolo-
gies du web smantique.
Autres quipes-projet dans ce domaine : TYREX, Grenoble ; ZENITH,

Montpellier.
4.5
es dfis gnriques en robotique et
L
vhicules autonomes
La robotique associe plusieurs sciences et technologies, allant des
techniques "bas niveau" - comme la mcanique, la mcatronique, l'lec-
tronique, le contrle-commande - jusqu'aux "haut niveau" comme la
perception, les sciences cognitives, la collaboration et le raisonnement.
Dans cette sous-section, mme si l'intelligence artificielle en robo-
tique implique l'utilisation de fonctions de "bas niveau" pour certains
traitements, nous naborderons ici que les aspects directement relis au
champ de l'IA.
Les progrs rcemment accomplis en matire de robotique sont im-
pressionnants. Les robots humanodes peuvent marcher, courir, se dpla-
cer dans des environnements connus ou inconnus, effectuer des tches
simples telles que saisir des objets ou manipuler certains appareils ;
les robots bio-inspirs sont capables de reproduire les comportements
dtres vivants trs diffrents (insectes, oiseaux, reptiles, rongeurs...) et
d'utiliser ces comportements pour rsoudre des problmes complexes
efficacement. Ainsi, le robot bipde Atlas, de Boston Dynamics (http://
www.bostondynamics.com/robot_Atlas.html) peut se dplacer l'ext-
53
rieur, sur terrain difficile et porter des objets lourds, l'instar du robot
quadrupde BigDog de la mme socit.
Sur le plan cognitif, grce aux progrs

Sur le plan cognitif, raliss dans le traitement de la parole, l'in-
les robots peuvent terprtation des images et des scnes grce
linformation produite par des capteurs, et
jouer de la musique, grce aux capacits de raisonnement mises
accueillir les visiteurs en uvre, les robots peuvent jouer de la mu-
dans des centres sique, accueillir les visiteurs dans des centres
commerciaux, parler commerciaux, parler avec des enfants. Avec
avec des enfants. des fonctions de coordination de groupe, les
robots sont capables de jouer au football en-
semble, mais aucune quipe de robots n'est
encore capable de battre une quipe d'hu-
mains mme peu habiles. Des vhicules autonomes peuvent rouler sans
danger sur de longues dures et certains pays ainsi que des tats am-
ricains pourraient les autoriser rouler sur des routes publiques dans
un futur proche, bien que beaucoup de questions, notamment thiques,
restent ouvertes.
Les quipes d'Inria charges de la recherche sur les robots et les vhi-
cules autonomes traitent les problmes suivants : (i) comprhension de
situation par perception multisensorielle ; (ii) raisonnement prenant en
compte l'incertitude, la rsilience ; (iii) association de plusieurs approches
pour la prise de dcision.
Comprhension de situation par perception multisensorielle
Pour qu'un robot puisse se dplacer dans des zones inconnues, par
exemple pour une voiture autonome dans la circulation ou pour un robot
d'assistance personnelle comme Toi.Net (voir section 1), il est essentiel
de percevoir son environnement et d'identifier la situation, ce qui est
rendu possible grce une captation multisensorielle (vision, laser, son,
Internet, dtection de l'environnement routier dans le cas de vhicules).
Les situations peuvent correspondre de simples symboles, des on-
tologies ou des reprsentations plus sophistiques des acteurs et des
objets prsents dans un environnement. Une bonne analyse de la situa-
tion peut permettre au robot de prendre des dcisions complexes - allant
mme dans certains cas jusqu' enfreindre la loi ou les rglementations
pour sauver la vie des passagers dune voiture.
54
RITS est un projet multidisciplinaire portant sur la robotique applique

aux systmes de transport intelligents. Lquipe-projet cherche notam-
ment combiner les outils et les techniques mathmatiques pour conce-
voir des systmes robotiques intelligents permettant une mobilit auto-
nome et durable.
Parmi les thmatiques scientifiques couvertes :

traitement des signaux multicapteurs (traitement de l'image, donnes
tlmtriques laser, donnes GPS, UMI) et fusion des donnes ;
perception volue pour la modlisation et l'interprtation de l'envi-
ronnement ;
contrle-commande de vhicule (acclration, freinage, direction) ;
communications sans fil (vhicule-vhicule, vhicule-infrastructure) ;
modlisation et simulation de trafic grande chelle ;
contrle et optimisation des systmes de transport routier ;
dveloppement et dploiement de vhicules automatiss (cyber-voi-
tures, vhicules particuliers...).
Ces recherches ont pour objectif d'amliorer le transport routier

en termes de scurit, d'efficacit, de confort et dimpact cologique.
L'approche technique est centre sur les aides la conduite, pouvant
aller jusqu' une automatisation totale.
Figure 8 : Voitures autonomes de RITS. - Inria / Photo H. Raguet
Un systme exprimental de dmonstration bas sur des vhicules to-

talement automatiss a t install sur le site Inria de Rocquencourt.
55
L'quipe-projet dispose de moyens importants dont une flotte d'une
douzaine de vhicules autonomes, diffrents capteurs ; elle dispose
galement de moyens informatiques sophistiqus, dont un outil de
simulation.
Raisonnement prenant en compte l'incertitude, la rsilience
Les robots sont actifs dans le monde physique et doivent faire face
des dfaillances de toutes sortes : coupures rseau, capteurs dfectueux,
risques lectroniques, etc. Certains capteurs fournissent des informations
incompltes ou prsentent des marges d'erreur qui induisent une incer-
titude par rapport aux donnes transmises. Cependant, un robot mobile
autonome doit fonctionner continuellement, sans aucune intervention
humaine et sur de longues dures. L'un des principaux problmes pour
les systmes robotiques provient des donnes transmises, qui peuvent
tre incertaines, insuffisantes ou encore disponibles de manire frac-
tionne en raison des diffrents temps d'acquisition. Des algorithmes
anytime, qui fournissent un rsultat la demande, peuvent constituer
une solution dans les cas o il est ncessaire de prendre une dcision
rapidement, mme si cette dcision n'est pas parfaite.
Prise de dcision base sur plusieurs approches
Un robot prend une dcision en se fondant sur un certain nombre

de donnes et d'informations disponibles : les donnes des diffrents
capteurs, des informations sur l'environnement sous forme d'valuation
de la situation, le souvenir des dcisions passes, les rgles et rgle-
ments stocks dans la mmoire du robot. Il est ncessaire de combiner
ces faits avec les donnes et d'obtenir un raisonnement hybride partir
des donnes numriques, continues ou discrtes et des reprsentations
smantiques. De plus, comme nous l'avons vu prcdemment, ce raison-
nement doit aussi prendre en compte le facteur d'incertitude : c'est le
dfi que doit relever la recherche sur la prise de dcision des robots.
L'apprentissage non-supervis et l'apprentissage par renforcement des
situations et de leurs interprtations smantiques peuvent constituer des
approches pertinentes.
L'objectif de l'quipe LARSEN est de faire sortir les robots des labora-
toires de recherche et des usines. En effet, les robots actuels sont loin
d'tre des machines autonomes, fiables et interactives qui pourraient
56
coexister avec nous, dans notre socit, et fonctionner pendant des

jours, des semaines ou des mois. Alors qu'il reste sans aucun doute
des progrs faire au niveau matriel, les plates-formes de robotique
voluent rapidement. Les principaux problmes restant rsoudre pour
atteindre cet objectif se situent, pour cette quipe-projet, du ct logi-
ciel. Ainsi, LARSEN espre que son logiciel puisse fonctionner sur des
robots peu coteux qui ne sont pas quips
de capteurs ou dactionneurs haute perfor-
mance (et cot lev), de sorte que ses Dvelopper de
techniques puissent tre dployes de faon nouvelles formes
raliste et values dans des conditions d'interactions
relles, comme dans des applications robo- physiques entre les
tiques de service et d'assistance. Lquipe-
robots et les humains
projet conoit ces robots comme capables
de cooprer non seulement les uns avec les
autres, mais aussi avec des espaces ou des appartements intelligents,
qui peuvent tre vus comme une extension des robots au cadre de vie
dans son ensemble.
Les membres de l'quipe LARSEN organisent leurs recherches autour

de deux axes principaux, l'autonomie permanente et l'interaction na-
turelle avec les systmes robotiques :
- concernant l'autonomie permanente, les chercheurs ont identifi deux
problmes traiter. Le premier est de parvenir doter les robots d'une
conscience de la situation qui reste stable dans des environnements
ouverts et dynamiques. Le second est de leur permettre de se remettre
de dommages physiques. L'une des approches proposes par l'quipe-
projet est de laisser le robot exprimenter grce de nouveaux algo-
rithmes essais-erreurs qui lui permettront d'apprendre avec un nombre
d'essais rduit (une douzaine en principe). Une autre approche que
l'quipe-projet va tudier consiste dployer plusieurs robots ou un
essaim de robots.
- concernant l'interaction naturelle avec les systmes robotiques,
l'quipe-projet modifie le comportement des robots de faon amliorer
leur degr d'acceptabilit. Elle traite une question plus originale qui
est de dvelopper de nouvelles formes d'interactions physiques entre
les robots et les humains. Pour ce faire, le robot doit pouvoir ragir et
s'adapter en fonction de la raction de l'humain, en exploitant l'ensemble
des signaux verbaux et non-verbaux que l'humain met naturellement
lors des interactions physiques ou sociales. L'un des principaux objectifs
est de faire en sorte que le robot soit capable de dtecter la prsence
d'un tre humain et de comprendre son activit.
57
Assistance personnelle : Inria Project Lab PAL
Au cours des cinquante dernires annes, les progrs de la mdecine
et l'amlioration de la qualit de la vie ont permis d'allonger l'esprance
de vie dans les socits industrielles. L'augmentation du nombre de
personnes ges induit des problmatiques nouvelles en sant publique
car, mme si les seniors vieillissent en bonne sant, leur ge entrane
progressivement et naturellement une fragilisation, notamment sur le
plan physique, qui peut aboutir une perte d'autonomie. Ce constat
oblige la socit repenser le modle actuel de prise en charge des
personnes du troisime ge. En raison d'une capacit d'accueil limite
dans les instituts spcialiss et du souhait de la majorit des personnes
ges de rester chez elles le plus longtemps possible, la demande de
services spcifiques domicile est de plus en plus importante.
Les technologies de l'intelligence ambiante et la robotique ont leur rle

jouer face cet enjeu de socit. Inria a lanc entre 2010 et 2015 un Inria
Project Lab (IPL) nomm PAL, pour Personnally Assisted Living (vie avec
assistance personnelle). En se basant sur les comptences et les objec-
tifs des quipes impliques, l'IPL PAL a dfini et trait quatre thmes
de recherche :
- valuation du degr de fragilit de la personne ge ;
- mobilit des personnes ;
- rducation, transfert et assistance la marche ;
- interaction sociale.
CHROMA
L'objectif global de CHROMA est de traiter des questions fondamen-
tales non rsolues, situes l'intersection des domaines de recherche
mergents que sont la "robotique base sur l'humain" et les "systmes
multirobots".
Il sagit de concevoir des algorithmes et de dvelopper des modles
permettant des robots mobiles de se dplacer et d'agir dans des
environnements dynamiques peupls d'tres humains.
CHROMA sintresse aux dcisions relatives aux tches de navigation

du robot ou multirobots, y compris la perception et la gnration de
mouvement. Lapproche de lquipe-projet, sur ce point, consiste
runir les mthodes probabilistes, les techniques de planification de
mouvement et les modles dcisionnels multiagents. Ceci implique de
58
4.6_Les dfis gnriques en neurosciences et sciences cognitives
collaborer avec des spcialistes de plusieurs disciplines, telles que la

psychosociologie pour la prise en compte des modles humains.
Les recherches de CHROMA portent essentiellement sur deux aspects

de la navigation robotique :
i) perception et conscience de la situation dans un environnement peupl
d'humains, en se concentrant sur la perception Baysienne et la fusion
des donnes des capteurs ;
ii) passage lchelle de la planification de dplacement pour un ou
plusieurs robots, en combinant les modlisations d'incertitude, les mo-
dles dcentraliss (essaim de robots) et la prise de dcision squen-
tielle multiagent.
L'quipe-projet CHROMA vise des applications et le transfert de ses r-

sultats scientifiques. Elle travaille avec des partenaires industriels et des
start-up. Les principaux domaines d'application concernent la conduite
de vhicules autonomes (avec Renault et Toyota), les robots ariens pour
les tches de surveillance et la robotique de service.
Autres quipes-projets dans ce domaine : LAGADIC, Rennes,

HEPHAISTOS, Sophia-Antipolis.
4.6
es dfis gnriques en neurosciences
L
et sciences cognitives
Lobjectif principal de lquipe FLOWERS est la modlisation du dvelop-

pement volutif chez les humains et ses applications dans les domaines
de la robotique, de l'interaction Homme-ordinateur et des technologies
ducatives.
L'un des principaux enjeux des sciences cognitives et de l'intelligence
artificielle est de comprendre comment les organismes peuvent
acqurir un ventail de comptences sur une dure tendue. Le
processus de dveloppement sensorimoteur, cognitif et social chez
l'enfant est organis en tapes ordonnes et rsulte de l'interaction
complexe entre le cerveau, le corps et lenvironnement physique.
Pour faire avancer la comprhension fondamentale des mcanismes de

dveloppement, l'quipe-projet FLOWERS a mis au point des modles
59
informatiques et robotiques, en troite collaboration avec des spcia-
listes de psychologie du dveloppement et de neurosciences. L'quipe-
projet a dvelopp des modles de processus d'exploration guide qui
permettent aux apprenants de collecter des donnes efficacement dans
des espaces de grande dimension multitches. Cela inclut des mca-
nismes d'apprentissage par l'action et par recherche d'information (ga-
lement appel apprentissage motiv par la curiosit, curiosity-driven
learning), d'apprentissage par imitation et la libration maturationnelle
des degrs de libert.
Figure 9 : Le robot humanode Poppy, imprim en 3D et open-source - Inria / Photo H. Raguet
FLOWERS a non seulement abouti laborer de nouvelles thories et

de nouveaux paradigmes exprimentaux qui permettent de comprendre
le dveloppement humain, mais elle a galement explor l'tendue
des possibilits d'application de ces modles la robotique, l'interac-
tion Homme-ordinateur et aux technologies ducatives. En robotique,
l'quipe-projet a dmontr que la curiosit artificielle combine l'ap-
prentissage par imitation peut fournir des blocs fonctionnels essentiels
permettant aux robots d'acqurir plusieurs capacits par interaction
naturelle avec des utilisateurs profanes humains, par exemple dans
le contexte de la robotique d'assistance. L'quipe-projet a galement
montr que les modles d'apprentissage motiv par la curiosit
peuvent tre transposs dans des algorithmes intelligents permet-
tant aux logiciels ducatifs de s'adapter de faon incrmentielle et
dynamique aux particularits de chaque apprenant humain et propo-
sant des squences personnalises d'activits pdagogiques. Dans
60
4.6_Les dfis gnriques en neurosciences et sciences cognitives
le domaine de l'interaction Homme-ordinateur, FLOWERS a montr

comment les algorithmes incrmentaux d'apprentissage peuvent tre
utiliss pour supprimer la phase de calibration dans certaines interfaces
cerveau-ordinateur.
Information Seeking, Curiosity and Attention : Computational and Neural MechanismsGottlieb,

J., Oudeyer, P-Y., Lopes, M., Baranes, A. (2013)Trends in Cognitive Science, 17(11), p. 585-596.
How Evolution may work through Curiosity-driven Developmental ProcessOudeyer, P-Y. et
Smith. L. (sous presse)Topics in Cognitive Science.
Self-Organization in the Evolution of Speech, 2e dition (2016) Oudeyer, P-Y., Oxford University
Press
Multi-Armed Bandits for Intelligent Tutoring Systems, Manuel Lopes, Benjamin Clement, Didier
Roy, Pierre-Yves Oudeyer. Journal of Educational Data Mining (JEDM), Vol 7, No 2, 2015.
Exploiting task constraints for self-calibrated brain-machine interface control using error-related
potentials, I. Iturrate, J. Grizou, J. Omedes, P.-Y. Oudeyer, M. Lopes and L. Montesano. PLOS
One, 2015.
Inverse Reinforcement Learning in Relational Domains, Thibaut Munzer, Bilal Piot, Mathieu
Geist, Olivier Pietquin et Manuel Lopes. International Joint Conference on Artificial Intelligence
(IJCAI'15), Buenos Aires, Argentine, 2015.
ARAMIS
Comprendre les fonctions du cerveau et leurs altrations requiert l'int-
gration de plusieurs niveaux d'organisation, fonctionnant des chelles
spatiales (allant du niveau de la molcule celui de l'ensemble du cer-
veau) et temporelles (de la milliseconde la dure dune vie entire)
diffrentes et reprsentant plusieurs types de processus biologiques
(processus anatomique, fonctionnel, molculaire et cellulaire). Plusieurs
aspects de ces processus peuvent maintenant tre quantifis chez
des sujets humains vivants grce au dveloppement de diverses tech-
nologies dont la neuro-imagerie, l'lectrophysiologie, la gnomique, la
transcriptomique... L'un des principaux objectifs de l quipe est de d-
velopper des approches qui peuvent automatiquement apprendre des
modles adapts partir des donnes multimodales gnres par ces
techniques.
L'objectif de l'quipe-projet ARAMIS est de dvelopper des approches

informatiques et statistiques permettant l'apprentissage partir de
donnes crbrales multimodales (neuro-imagerie, lectrophysiologie,
gnomique...). Une premire mthode de recherche consiste mod-
liser la structure du cerveau et sa variabilit statistique selon les popu-
lations. Cela implique le dveloppement d'une mthode de segmenta-
tion pour extraire les structures crbrales des images et des modles
statistiques de forme (Gori et al., 2013), mise en uvre dans le progiciel
61
gratuit Deformetrica6. Un second axe de recherche a pour objectif de
modliser les interactions fonctionnelles entre des zones distantes
du cerveau qui sont la base des processus cognitifs. Il s'appuie sur
des approches pouvant modliser l'organisation des rseaux crbraux
complexes (De Vico Fallani et al., 2014). Ces modles s'appliquent la
conception de nouveaux dispositifs, aux interfaces cerveau-ordinateur et
au neurofeedback, pour la rducation de patients en neurologie. Enfin,
l'quipe-projet dveloppe des mthodes pour tudier des modles des
maladies neurologiques et de leur progression. Ces derniers permettent
d'tudier les modles topographiques (Cuingnet et al., 2013) et spa-
tio-temporels (Schiratti et al., 2015) caractristiques d'une maladie don-
ne. Ils pourraient dboucher sur la mise au point de nouveaux outils de
personnalisation du diagnostic, pronostic et traitement pour des troubles
comme la maladie d'Alzheimer, la maladie de Parkinson, l'pilepsie et les
troubles crbrovasculaires.
6 http://www.deformetrica.org
Bibliographie :
Cuingnet R, Glauns JA, Chupin M, Benali H, and Colliot O (2013). Spatial and Anatomical
Regularization of SVM: A General Framework for Neuroimaging Data. IEEE Transactions on
Pattern Analysis and Machine Intelligence 35, 682696.
Gori P, Colliot O, Worbe Y, Marrakchi-Kacem L, Lecomte S, Poupon C, et al. (2013). Bayesian Atlas
Estimation for the Variability Analysis of Shape Complexes. In Proc. Medical Image Computing
and Computer Assisted Intervention, Nagoya, Japan, pp. 267274.
Schiratti J-B, Allassonniere S, Colliot O, and Durrleman S (2015). Learning spatiotemporal
trajectories from manifold-valued longitudinal data. In Neural Information Processing Systems,
Montral, Canada,.
De Vico Fallani F, Richiardi J, Chavez M, and Achard S (2014). Graph analysis of functional brain
networks: practical issues in translational neuroscience. Philosophical Transactions of the Royal
Society of London Series B, Biological Sciences 369.
MNEMOSYNE
Aux frontires des neurosciences intgratives et computationnelles,
lquipe-projet MNEMOSYNE propose de modliser le cerveau comme
un systme de mmoires actives en synergie et en interaction avec
les mondes interne et externe et de le simuler comme un tout et en
situation.
Les principales fonctions cognitives et comportementales (ex: attention,

reconnaissance, planification, dcision) mergent de boucles sensori-
motrices impliquant le monde extrieur, le corps et le cerveau. Lquipe
tudie, modlise et implmente ces boucles et leurs interactions dans
la perspective dun comportement compltement autonome. Avec cette
62
4.7_Les dfis gnriques dans le traitement du langage
approche "systmique", les chercheurs indiquent que de tels systmes

complexes ne peuvent tre vraiment apprhends que comme un tout
et dans des situations comportementales naturelles. Pour mettre au
point les caractristiques fonctionnelles et adaptatives de tels modles
au niveau de leur circuiterie neuronale et pour les implmenter dans
des systmes interagissant avec le monde, ils doivent combiner les prin-
cipes, les mthodes et les outils de diffrents domaines scientifiques.
- Lquipe-projet modlise les principales structures crbrales et

les principaux flux dinformation du cerveau (comme en neuros-
ciences intgratives et cognitives) en insistant sur les liens entre le cer-
veau, le corps et lenvironnement (cognition incarne).
- Elle utilise des formalismes de calcul distribu lui permettant dim-
planter des modles diffrentes chelles de description (comme en
neurosciences computationnelles).
- Elle dploie ses modles large chelle (calcul haute performance),
les incarne dans des corps en interaction avec lenvironnement (robo-
tique autonome) et les simule de faon interactive avec les vnements
rencontrs par un robot virtuel/rel.
4.7
es dfis gnriques dans le traitement
L
du langage
Le domaine du traitement automatique de langage naturel (TALN)
est apparu dans les annes 1950. Il est toujours d'une importance ca-
pitale aujourd'hui, dans la socit de l'information. Son objectif est de
traiter des textes en langage naturel, qu'il s'agisse d'analyser des textes
existants ou den gnrer de nouveaux, afin d'atteindre un traitement de
langage semblable celui de lHomme pour toute une srie de tches
ou d'applications. Ces applications, regroupes sous le terme "ingnie-
rie du langage", regroupent la traduction automatique, la rponse aux
questions, la recherche d'informations, l'extraction d'informations, l'ex-
ploration de donnes, la lecture et l'criture assistes, etc. D'un point de
vue recherche, la linguistique empirique et les humanits numriques
peuvent aussi tre considres comme des domaines d'application du
TALN.
Le TALN est un domaine transdisciplinaire qui requiert une expertise

en matire de linguistique formelle et descriptive (afin de dvelopper des
modles linguistiques des langages humains), d'informatique et d'algo-
63
rithmique (pour concevoir et dvelopper des programmes efficaces qui
peuvent prendre en charge ces modles), et de mathmatiques appli-
ques (pour l'acquisition automatique des connaissances linguistiques
ou gnrales). Le traitement des textes en langage naturel reprsente
une tche difficile, notamment en raison de la forte dose d'ambigut
prsente dans le langage naturel et des spcificits des langages indivi-
duels et des dialectes, mais aussi parce que de nombreux utilisateurs ne
respectent pas ncessairement les conventions grammaticales et ortho-
graphiques lorsque celles-ci existent.
Au cours des premires dcennies, le TALN s'est principalement

concentr sur des approches symboliques, en offrant des contributions
importantes l'informatique, notamment dans la thorie de la gram-
maire formelle et des techniques danalyse syntaxique. Le savoir linguis-
tique a essentiellement t cod sous forme de grammaires et de bases
de donnes lexicales dveloppes manuellement. Au cours des deux
dernires dcennies, les approches statistiques, bases sur l'apprentis-
sage automatique, ont nettement renouvel ce domaine, amenant les
corpus annots sur le devant de la scne et amliorant l'tat de l'art de
faon significative. Cependant, les approches symboliques conservent
des avantages spcifiques et les meilleurs rsultats sont souvent obtenus
en exploitant tous les types de ressources, y compris les connaissances
linguistiques dans les systmes hybrides associant les techniques sym-
boliques et statistiques.
L'quipe-projet ALPAGE (Inria Paris & Universit Paris-Diderot) est sp-

cialise dans le TALN et ses applications. Ses recherches s'tendent
tous les niveaux de l'analyse linguistique (morphologie, syntaxe, sman-
tique, discours), rendant ainsi possible une tude globale multichelle
des donnes texte. ALPAGE a dvelopp de nombreuses ressources
linguistiques, surtout pour le franais, utilises au niveau internatio-
nal. Elle a aussi contribu amliorer l'tat de l'art dans des domaines
comme lanalyse syntaxique symbolique, statistique et hybride (pour le
franais, l'anglais et d'autres langues, y compris des variantes non-stan-
dard comme celles trouves sur le web 2.0), l'analyse smantique et
la modlisation du discours. L'quipe a commenc explorer une ap-
proche mergente qui consiste coupler l'analyse smantique des
modles du monde auquel le texte fait rfrence (par exemple, l'asso-
ciation du monde artificiel d'un jeu vido la reprsentation smantique
des conversations en ligne du joueur).
64
4.8_Les dfis gnriques en programmation par contraintes pour l'aide la dcision
ALPAGE est galement fortement implique dans la recherche appli-

que, de deux manires diffrentes. D'une part, lquipe-projet collabore
avec le monde industriel pour dvelopper des outils et des techniques
TALN, pour des tches comme l'exploration de donnes (surtout pour
des textes imparfaits), la recherche d'information, l'extraction d'infor-
mation et la gnration automatique de texte. Dautre part, elle est for-
tement implique dans la recherche en linguistique informatique et
empirique, et des humanits numriques. Cela implique l'tude de
la morphologie computationnelle et de la syntaxe empirique, y compris
l'tude de l'volution historique des langages. Les axes de recherche
futurs ncessitent une collaboration avec des chercheurs des sciences
humaines et sociales (par exemple, des historiens), ainsi que le dvelop-
pement de modles d'volution linguistique riche, couvrant les aspects
lexicaux, morphologiques et/ou syntaxiques.
Autres quipes-projets dans ce domaine : SEMAGRAMME, Nancy.
4.8
es dfis gnriques en programmation
L
par contraintes pour l'aide la dcision
La programmation par contraintes apparat dans les annes 1980 et
se dveloppe l'intersection de l'intelligence artificielle et de la recherche
oprationnelle, de l'informatique et des math-
matiques. De nature multidisciplinaire, cette
technique continue utiliser des connaissances La prise de
de diffrents domaines, tels que les mathma- dcision assiste
tiques discrtes, l'informatique thorique (tho- par ordinateur
rie des graphes, combinatoire, algorithmes, et l'optimisation
complexit), les analyses fonctionnelles et
deviennent
l'optimisation, l'ingnierie informatique et lo-
gicielle. La programmation par contraintes a des lments
t identifie comme lment stratgique de fondamentaux
l'informatique en 1996 par lACM. Au tournant de l'assistance aux
du sicle, la technologie de l'optimisation se activits humaines
dveloppe dans l'industrie (avec notamment
de toutes sortes.
Ilog, IBM, Dash et, plus rcemment, Microsoft,
Google et Dynadec), avec les domaines scien-
tifiques correspondants, au point de convergence de la programmation
par contrainte, de la programmation mathmatique, de la recherche
locale et de l'analyse numrique. La technologie de l'optimisation aide
65
maintenant le secteur public, les entreprises et, dans une certaine me-
sure, les personnes, prendre des dcisions utilisant au mieux les res-
sources et rpondant des exigences spcifiques dans un monde de
plus en plus complexe. En effet, la prise de dcision assiste par ordina-
teur et l'optimisation deviennent des lments fondamentaux de l'assis-
tance aux activits humaines de toutes sortes.
Avec la prminence de la technologie d'optimisation dans la plupart

des secteurs industriels, il apparat vident que les solutions rapides et
sur mesure, souvent utilises aujourd'hui, ne suffisent pas pour le dve-
loppement long terme de la technologie d'optimisation et sa large diffu-
sion. Il est patent qu'il devrait y avoir une connexion plus directe entre
les rsultats mathmatiques et leur rutilisation systmatique dans les
principaux domaines de la technologie d'optimisation.
Problmes gnraux
En dpit de son importance, la dcision assiste par ordinateur et l'op-

timisation prsentent un certain nombre de faiblesses fondamentales qui
les empchent de tirer compltement parti de leur potentiel et entravent
leurs progrs et leur capacit grer des situations de plus en plus com-
plexes. Cela est principalement d la diversit des acteurs en cause, qui
sont dcrits ci-aprs.
Conception de solutions efficaces
- l'informatique pour les langages, les outils de modlisation et les

bibliothques : comment mettre au point, de faon systmatique, des
mthodes efficaces pour rsoudre les problmes d'optimisation et de
dcision ;
- les mathmatiques appliques pour la partie thorique : trouver
des abstractions puissantes qui permettent de traiter une classe de
problmes, les implmenter dans des composants logiciels.
Chaque communaut technologique exploite indpendamment son
paradigme de solution comme la programmation par contraintes, la pro-
grammation linaire et par nombres entiers, l'optimisation continue, la
recherche locale base sur la contrainte. Dans une certaine mesure, la
plupart de ces techniques exploitent de diffrentes manires les mmes
rsultats mathmatiques.
Ainsi, la premire difficult rencontre pour la programmation par

contraintes est la conception de systmes informatiques mettant en
66
4.8_Les dfis gnriques en programmation par contraintes pour l'aide la dcision
uvre de faon transparente des solutions techniques efficaces.

Thoriquement, l'utilisateur doit pouvoir dcrire son problme dans
un langage de modlisation de haut niveau, sans se soucier des m-
canismes de rsolution sous-jacents utiliss, indpendamment de tout
langage de programmation informatique et de tout moteur de rsolution.
Les systmes doivent galement offrir une base de connaissances sur

la rsolution de problmes, qui prsente des modles et des heuristiques
pour un grand ensemble de problmes bien identifis.
Enfin, l'utilisateur doit avoir la possibilit d'interprter les solutions

obtenues, notamment dans le contexte de problmes surcontraints o il
est ncessaire d'attnuer certaines contraintes, et ce de la faon la plus
raliste possible.
Application grande chelle
Le deuxime dfi est daugmenter la performance de rsolution, sur-

tout dans le contexte de donnes grande chelle. Il est indispensable
d'adapter des techniques telles que des algorithmes de consistance, algo-
rithmes de graphes, programmation mathmatique, mta-heuristiques,
et de les intgrer dans l'application de programmation par contraintes.
Cette intgration soulve de nouvelles questions comme la conception
d'algorithmes incrmentaux, la dcomposition automatique ou la refor-
mulation automatique des problmes.
Problmes industriels complexes
Enfin, le troisime problme porte sur l'utilisation de la program-

mation par contraintes dans le contexte de problmes industriels com-
plexes, surtout pour des systmes hybrides mlant discret et continu. Il
existe de nombreux facteurs de complexit, comme :
- la combinaison des aspects temporels et spatiaux ou des aspects
continus et discrets ;
- le caractre dynamique de certains phnomnes induisant une mo-
dification des contraintes et des donnes dans le temps ;
- la difficult exprimer certaines contraintes physiques, par exemple,
l'quilibrage de la charge et la stabilit temporelle ;
- la dcomposition de grands problmes en sous-problmes, ce qui
peut pnaliser lefficacit de rsolution.
67
TASC
La recherche fondamentale de l'quipe TASC est guide par les ques-
tions souleves prcdemment : classer et enrichir les modles, auto-
matiser la reformulation et la rsolution, dissocier les connaissances d-
claratives et les connaissances procdurales, dvelopper des outils de
modlisation et trouver des outils de rsolution qui passent lchelle.
Lquipe dveloppe une base de connaissances sur la rsolution de
problmes combinatoires : le catalogue gnral des contraintes. Les
aspects relatifs la rsolution sont capitaliss dans le systme de rso-
lution de contraintes, CHOCO. Enfin, dans le cadre de ses activits de
valorisation, d'enseignement et de partenariat de recherche, l'quipe-pro-
jet fait appel la programmation par contraintes pour rsoudre diffrents
problmes concrets.
Le dfi est double : augmenter la visibilit des contraintes dans les
autres disciplines informatiques, et contribuer une diffusion plus large
de la programmation par contraintes dans l'industrie.
4.9
es dfis gnriques en musique et
L
environnements intelligents
Cette partie prsente les deux quipes-projets qui dveloppent un tra-
vail original, troitement li l'IA mais qui ne peut tre aisment rattach
aux parties prcdentes.
MUTANT
Musique & intelligence artificielle : des paradigmes pour les enjeux
futurs
Les traitements de signaux traditionnels et les premiers modles proba-
bilistes pour l'apprentissage automatique ont permis d'amliorer consi-
drablement le traitement automatique de la parole et du langage natu-
rel, surtout dans les annes 1990, mais n'ont jamais permis d'atteindre
ce rsultat dans le domaine de la musique, qu'il s'agisse de la recherche
d'informations par le contenu, des systmes de reconnaissance musi-
cale ou des pratiques musicales assistes par ordinateur. Cela s'explique
par les schmas temporels complexes des signaux musicaux qui ne
peuvent pas tre aisment rduits, par la nature htrogne des informa-
tions musicales et par la nature trs adaptative de nombreux concepts
musicaux intressants (que signifie vraiment genre de la musique au-
68
4.9_Les dfis gnriques en musique et environnements intelligents
jourd'hui ?). Depuis le dbut du XXIe sicle, les scientifiques ont trait
les problmes de recherche d'informations musicales en gnral et ont
form des communauts actives, comparables en taille, impact indus-
triel et socital, celles existant dans les domaines de la vision artifi-
cielle. Les dveloppements se sont concentrs sur les algorithmes hors
ligne agissant sur les grandes bases de donnes, alors que la majorit de
l'activit musicale (production, coute, cration) est en ligne par nature
et implique un apprentissage par l'action. Aujourd'hui, il existe des al-
gorithmes de vision artificielle capables d'interprter des donnes
visuelles mesure que le systme les reoit de faon incrmentale.
Mais cette rvolution doit encore se faire dans le domaine de l'audition
artificielle et de la lecture musicale.
Figure 10 : Utilisation d'Antescofo lors d'une reprsentation en temps rel

Inria / Photo H. Raguet
Depuis sa cration en 2013, l'quipe-projet MUTANT se positionne sur

les domaines de la reconnaissance des donnes musicales et audio et
de l'interaction en temps rel. Antescofo, le logiciel d'coute artifi-
cielle en temps rel, dvelopp par MUTANT, est capable de suivre
des musiciens et de dcoder leurs paramtres musicaux pendant qu'ils
jouent. Il est constitu d'un algorithme, extrmement simple, de trai-
tement des signaux audio pour l'observation des donnes. Sa solidit,
dmontre lors de diffrentes reprsentations publiques, rside aussi
bien dans le fait que l'apprentissage des paramtres et l'adaptation
se font en ligne et en temps rel (apprentissage par l'action) que dans
ses capacits inhrentes de fusion des informations, qui permettent
69
d'obtenir de bons rsultats en mixant plusieurs sources d'information
faillibles prsentant une incertitude leve. La qualit du rsultat final
n'est pas due au traitement du signal de meilleure qualit ou de plus
grande clart mais une gestion intelligente des diffrentes sources
d'information mesure qu'elles arrivent. Le traitement en temps rel
de l'incertitude non-filtre est un lment cl de l'intelligence en
ligne pour rendre possibles les applications. Ceci est une analogie avec
l'coute humaine : ltre humain ne dcode aucune information musicale
de manire parfaite au moment o il lcoute, quil interagisse avec la
musique ou quil la cre. Il s'agit de l'approche adopte par l'quipe pour
obtenir des algorithmes d'coute artificielle efficaces et oprationnels.
La question de la gnration de musique

L'intelligence soulve toute une srie de dfis pour l'in-
artificielle, l'coute telligence artificielle. Comment concevoir
des machines capables d'improviser de
artificielle et la
la musique avec ou sans tres humains
reconnaissance des (comme pour l'imitation de styles musicaux)
donnes musicales avec le mme niveau d'excellence ? ce
sont inutiles si elles stade, il convient de prendre explicitement
ne sont pas couples en compte la nature htrogne de la dure
et des informations musicales dans la mod-
des actions.
lisation. La prise de dcision requiert l'appli-
cation de rgles la fois au niveau local (par
exemple, par rapport aux relations smantiques dans la progression de
la musique) et long terme (par exemple, pour les phrases et les formes
musicales). Elle repose aussi sur l'apprentissage concurrentiel et colla-
boratif entre diffrents agents observant des aspects htrognes de la
mme source d'information (hauteur tonale, timbre, rythme, flux d'infor-
mations, etc.). Ce problme lui seul ncessite d'importantes avances
dans le domaine de l'apprentissage automatique et de l'intelligence arti-
ficielle, en ligne et hors ligne.
Lquipe-projet MUTANT a mis au point des agents d'apprentissage

interactifs avec un apprentissage sous multiples perspectives (en
utilisant les paradigmes de l'apprentissage par renforcement) permet-
tant de gnrer de la musique dans diffrents styles, sans connaissance
pralable ni codage manuel, et galement d'improviser avec des musi-
ciens de jazz en live. Toutefois, les rsultats sont loin d'tre satisfaisants
et les futures recherches devront envisager des architectures combi-
nant diffrentes approches de dcouverte d'informations et de prise de
dcision.
70
4.9_Les dfis gnriques en musique et environnements intelligents
L'intelligence artificielle, l'coute artificielle et la reconnaissance des

donnes musicales sont inutiles si elles ne sont pas couples des
actions. L'coute artificielle avec Antescofo permet aux utilisateurs d'ex-
primer des concepts au travers d'ventuelles expriences perceptives
plutt que par les mathmatiques. Cette capacit d'expression avec des
concepts humains associs un langage en temps rel, de haut niveau,
leur permet de fabriquer des machines avec des scnarios tempo-
rels complexes en environnement actif. C'est la conception choisie par
MUTANT pour la ralisation de systmes multimdia cyber-physiques,
afin que les systmes experts base de connaissances soient acces-
sibles aux utilisateurs quotidiens qui peuvent mieux s'exprimer avec des
concepts humains qui, "sous le capot", sont exprims dans des langages
temps rel.
L'objectif du projet PERVASIVE INTERACTION est de dvelopper

les bases scientifiques et technologiques pour des environnements
humains capables de percevoir, agir, communiquer et interagir avec
les humains afin de leur fournir des services. L'laboration de ces envi-
ronnements comporte de nombreux problmes lis l'interprtation
des informations de capteurs, l'apprentissage, la comprhension
machine, la composition dynamique des lments et l'interaction
Homme-machine. Le but du projet est de raliser des progrs sur
les bases thoriques de la perception et de la cognition, ainsi que
de dvelopper de nouvelles formes d'interaction Homme-machine, en
utilisant des environnements interactifs servant d'exemples pour les
problmes possibles.
Un environnement est une rgion (un volume) connecte de lespace

3D. Un environnement est "perceptif" lorsqu'il est capable de reconnatre
et de dcrire les choses, les personnes et les activits l'intrieur de
ce volume. Il est possible de raliser des formes simples de percep-
tion spcifique l'aide d'un seul capteur. Cependant, pour tre efficace
et gnrique, la perception doit intgrer des informations provenant de
plusieurs capteurs et avec plusieurs modalits. Le projet PERVASIVE
INTERACTION a pour objet de crer et dvelopper des techniques de
perception artificielle associant la vision artificielle, la perception acous-
tique, les capteurs de distance et les capteurs mcaniques afin que les
environnements puissent percevoir et comprendre les humains et les
activits humaines.
Un environnement est "actif" lorsqu'il est capable de changer son
tat interne. Parmi les formes courantes de changement d'tat, on
71
trouve le rglage de la temprature ambiante, du niveau acoustique ou
de l'clairage. Des formes plus innovantes comportent la prsentation
contextualise des informations, ainsi que des services de nettoyage,
d'organisation matrielle et de logistique. L'utilisation de surfaces
plusieurs crans associe la localisation offre la possibilit de modi-
fier automatiquement l'affichage des informations pour s'adapter
l'activit en cours des groupes. L'utilisation de la reconnaissance
d'activits et les dispositifs dcoute offrent la possibilit d'enregis-
trer un journal d'interactions humain-humain, ainsi que de fournir des
informations appropries sans interruption. L'utilisation de projecteurs
vido orientables (avec dtection visuelle intgre) permet d'utiliser
n'importe quelle surface pour les prsentations, les interactions et les
communications.
Un environnement peut tre considr comme "interactif" lorsqu'il

est capable d'interagir avec les humains en utilisant la perception
et l'action, de faon troitement lie. Des formes simples d'interac-
tion peuvent tre bases sur l'observation de la manipulation d'objets
physiques ou sur la dtection visuelle de doigts, mains ou bras. Les
formes plus volues impliquent la perception et la comprhension des
activits et du contexte. PERVASIVE INTERACTION a dvelopp une
nouvelle thorie pour la modlisation de situations pour la comprhen-
sion machine de l'activit humaine, base sur les techniques utilises
en psychologie cognitive. Lquipe-projet explore de nombreuses formes
d'interactions, dont les widgets dinteraction, l'observation de manipula-
tion d'objets, la fusion des informations acoustiques et visuelles, et les
systmes qui modlent le contexte d'interaction afin de dterminer les
actions et services appropris de l'environnement.
Pour la conception et l'intgration de systmes de perception des
humains et de leurs actions, PERVASIVE INTERACTION a dvelopp :
- un environnement base de modles de situation pour les services
contextuels ;
- des techniques efficaces de vision artificielle ;
- une architecture logicielle distribue, autonome pour les systmes de
perception multimodale.
Les expriences de PERVASIVE INTERACTION ont pour objectif le
dveloppement de services interactifs pour les environnements
intelligents. Les champs d'application sont, entre autres, les services
de surveillance pour une vie saine, les objets et services intelligents pour
la maison et de nouvelles formes d'interaction Homme-machine bases
sur la perception.
72
5
Rfrences Inria :
chiffres
73
Sur la priode 2005-2015, les chercheurs dInria ont publi plus de 400
articles sur l'IA et plus de 1000 communications des confrences sur le
sujet. Les rfrences quipes-projets, incluant d'autres supports comme
des chapitres d'ouvrages scientifiques et les rapports internes d'Inria sont
accessibles sur https://hal.inria.fr/ et sur la page web prsentant le rapport
annuel : http://raweb.inria.fr/rapportsactivite/RA2015/index.html
Les tableaux ci-dessous indiquent le nombre minimum de publications
et travaux de confrences publis, car certains articles de presse et com-
munications de colloques n'taient pas indexs dans la base de donnes
dInria sur toute la priode dintrt.
PUBLICATIONS DANS DES REVUES

AI Communications 3
Artificial Intelligence 7
Computer Speech and Langage 13
Computer Vision and Image Understanding 28
Constraints 17
Expert Systems with Applications 17
IEEE Robotics and Automation Magazine 8
IEEE Transactions on Evolutionary Computation 4
IEEE Transactions on Image Processing 45
IEEE Transactions on Intelligent Transportation Systems 14
IEEE Transactions on Knowledge and Data Engineering 15
IEEE Transactions on Pattern Analysis and Machine Intelligence 3
IEEE Transactions on Robotics 48
International Journal of computer vision 68
International Journal of Robotics Research 29
Journal of Artificial Intelligence Research 7
Journal of Data Semantics 6
Journal of Intelligent and Robotic Systems 3
Journal of Intelligent Systems 2
Journal of Langage Technology and Computational Linguistics 1
Journal of machine learning Research 33
Journal of Web Semantics 7
Machine Vision and Applications 9
Pattern Recognition Letters 18
Revue d'Intelligence Artificielle 5
TAL - Traitement Automatique des Langues 20
Trends in Cognitive Sciences 1
Total 431
74
5_Rfrences Inria : chiffres
ACTES DE CONFRENCES
Annual Conference of the International Speech Communication Association 43
Annual Conference on Neural Information Processing Systems 76
Confrence Francophone sur l'Apprentissage Automatique 11
Congrs Francophone de Reconnaissance des Formes et Intelligence Artificielle 43
European Conference on Artificial Intelligence 21
European Conference on Machine Learning 5
European Conference on Principles and Practice of Knowledge Discovery in Databases 2
European Semantic Web Conference 5
European Symposium on Artificial Neural Networks 8
Genetic and Evolutionary Computation Conference 71
IEEE Conference on Computer Vision and Pattern Recognition 60
IEEE Conference on Intelligent Transportation Systems 4
IEEE International Conference on Acoustics, Speech and Signal Processing 91
IEEE International Conference on Computer Vision 38
IEEE International Conference on Robotics and Automation 109
IEEE International Conference on Tools with Artificial Intelligence 17
IEEE RSJ International Conference on Intelligent Robots and Systems 110
International Conference on Artificial Evolution 7
International Conference on Autonomous Agents and Multiagent Systems 12
International Conference on Machine Learning 43
International Conference on Practical Applications of Agents and Multi-Agent Systems 5
International Conference on Principles and Practice of Constraint Programming 20
International Conference Parallel Problem Solving from Nature 22
International Joint Conference on Artificial Intelligence 24
International Semantic Web Conference 14
International Workshop on Principles of Diagnosis 5
Journes d'Extraction et Gestion des Connaissances 58
Journes Francophones sur les Systmes Multi-Agents 7
National Conference on Artificial Intelligence 9
Traitement Automatique du Langage Naturel 18
Workshop on machine learning for System Identification 1
Total 959
75
6
Rfrences
supplmentaires
76
6_Rfrences supplmentaires
Cette partie recense d'autres rfrences, identifies comme les plus pertinentes
pour une lecture approfondie, regroupes en thmatiques.
L'IA en gnral
Cap Digital. Intelligence Artificielle : technologies, marchs et dfis.
Document # 15-167, www.capdigital.com/publications, 2015
Ernest Davis and Gary Marcus. Commonsense Reasoning and Commonsense
Knowledge in Artificial Intelligence. Communications Of The ACM Vol. 58 No. 9,
2015
Jonathan Grudin. AI and HCI: Two Fields Divided by a Common Focus.
AI magazine, 30(4), 48-57, 2008
Kevin Kelly. The Three Breakthroughs That Have Finally Unleashed AI On The
World. http://www.wired.com/2014/10/future-of-artificial-intelligence/, 2014
Pierre Marquis, Odile Papini, Henri Prade (eds). Panorama de l'Intelligence
Artificielle. ses bases mthodologiques, ses dveloppements. 3 vols. Cepadus,
2014
Stuart Russell and Peter Norvig. Artificial Intelligence: A Modern Approach.
http://aima.cs.berkeley.edu
Alan Turing. Intelligent Machinery, a Heretical Theory. Philosophia Mathematica
4 (3): 256-260, 1996 - Original article from 1951
Terry Winograd. Shifting viewpoints: Artificial intelligence and human
computer interaction. Artificial Intelligence 170(18):1256-1258, 2006
Les dbats autour de l'IA

Ronald C. Arkin. The Case for Ethical Autonomy in Unmanned Systems.
Journal of Military Ethics, 9(4), 12/2010
Samuel Butler. Erewhon. Free eBooks at Planet eBook.com, 1872
Dominique Cardon. A quoi rvent les algorithmes. Seuil, 2015
Thomas G. Dietterich and Eric J. Horvitz. Rise of Concerns about AI: Reflections
and Directions. Communications of the ACM | Vol. 58 No. 1, October 2015
Moshe Vardi. On Lethal Autonomous Weapons. Communications of the ACM,
vol. 58 no. 12, December 2015
L'apprentissage automatique (machine learning)

Martin Abadi et al. Large-Scale machine learning on Heterogeneous Distributed
Systems. Software available from tensorflow.org, 2015
77
Christopher Bishop. Pattern Recognition and Machine Learning. Springer, 2006
Lon Bottou. From machine learning to machine reasoning: an essay, Machine
Learning, 94:133-149, January 2014
Yann Le Cun. The Unreasonable Effectiveness of Deep Learning. Facebook AI
Research & Center for Data Science, NYU. http://yann.lecun.com, 2015
Sumit Gulwani, William R. Harris, and Rishabh Singh. Spreadsheet Data
Manipulation Using Examples. Communications of the ACM, Vol. 55 no. 8, 2012
Michael I. Jordan and Tom M. Mitchell. Machine learning: trends, perspectives,
and prospects. Science, Vol. 349 Issue 6245, 2015
James Max Kanter and Kalyan Veeramachaneni. Deep Feature Synthesis:
Towards Automating Data Science Endeavors. International IEEE/ACM Data
Science and Advance Analytics Conference, 2015
Tom M. Mitchell. The Discipline of Machine Learning. CMU-ML-06-108
School of Computer Science Carnegie Mellon University, 2006
Volodymyr Mnih et al. Human-level control through deep reinforcement
learning. Nature 518, p. 529-533, 2015
Michle Sebag. A tour of Machine Learning: an AI perspective.
AI Communications, IOS Press, 27 (1), p.11-23, 2014
Vision
Peter Auer et al. A Research Roadmap of Cognitive Vision.
ECVision : the European Research network for Cognitive Computer Vision
Systems. https://www.researchgate.net, 2005
Nicholas Ayache. Des images mdicales au patient numrique, Leons
inaugurales du Collge de France. Collge de France / Fayard, March 2015
Slawomir Bak. Human Reidentification Through a Video Camera Network.
Computer Vision and Pattern Recognition. PhD, Universit Nice Sophia
Antipolis, 2012
Svetlana Lazebnik, Cordelia Schmid, Jean Ponce. Spatial pyramid matching.
Sven J. Dickinson and Als Leonardis and Bernt Schiele and Michael J. Tarr.
Object Categorization: Computer and Human Vision Perspectives, Cambridge
University Press, p. 401-415, 2009
Sancho McCann, David G. Lowe. Efficient Detection for Spatially Local Coding.
Lecture Notes in Computer Science Volume 9008, p. 615-629, 2015
Farhood Negin, Serhan Cosar, Michal Koperski, Franois Bremond. Generating
Unsupervised Models for Online Long-Term Daily Living Activity Recognition.
Asian conference on patternrecognition (ACPR 2015), 2015
78
6_Rfrences supplmentaires
Oriol Vinyals, Alexander Toshev, Samy Bengio & Dumitru Erhan. Show and Tell:
A Neural Image Caption Generator. https://arxiv.org/pdf/1502.03044, 2015
Reprsentation des connaissances, web smantique, donnes

Nathalie Aussenac-Gilles, Fabien Gandon. From the knowledge acquisition
bottleneck to the knowledge acquisition overflow: A brief French history of
knowledge acquisition. International Journal of Human-Computer Studies,
Elsevier, vol. 71 (n 2), p. 157-165, 2013
Tim Berners-Lee, James Hendler and Ora Lassila. The Semantic Web.
Scientific American, May 2001
Meghyn Bienvenu, Balder Ten Cate, Carsten Lutz, Frank Wolter. Ontology-Based
Data Access: A Study through Disjunctive Datalog, CSP, and MMSNP.
ACM Transactions on Database Systems, Vol. 39, No. 4, Article 33, 2014
Fabien Gandon. The three 'W' of the World Wide Web callfor the three 'M'of a
Massively Multidisciplinary Methodology. Valrie Monfort; Karl-Heinz Krempels.
10th International Conference, WEBIST 2014, Barcelona, Spain. Springer
International Publishing, 226, Web Information Systems and Technologies, 2014
Janowicz, K.; Hitzler, P.; Hendler, J.; and van Harmelen, F. Why the Data Train
Needs Semantic Rails. AI Magazine, 36(5-14), 2015
Antonella Poggi et al. Linking Data to Ontologies. Journal on data semantics X
p. 133-173. Springer-Verlag Berlin, Heidelberg, 2008
Jrme Euzenat, Pavel Shvaiko. Ontology matching. Springer, Heildelberg, 2013
Robotique et vhicules autonomes

J. Christian Gerdes, Sarah M. Thornton, Implementable Ethics for Autonomous
Vehicles. Autonomes Fahren: Technische, rechtliche und gesellschaftliche
Aspekte. Springer, Berlin, 2015
Philippe Morignot, Joshue Perez Rastelli and Fawzi Nashashibi.
Arbitration for Balancing Control between the Driver and ADAS Systems in
an Automated Vehicle: Survey and Approach. 2014 IEEE Intelligent Vehicles
Symposium (IV), 2014
Robotique dveloppementale
Antoine Cully, Jeff Clune, Danesh Tarapore & Jean-Baptiste Mouret.
Robots that can adapt like animals. Nature Vol 521 503-507, 2015
Pierre-Yves Oudeyer. Developmental Robotics. Encyclopaedia of the Sciences
of Learning, N.M. Seel ed., Springer References Series, Springer, 2012
79
IA et sciences cognitives
Jacqueline Gottlieb, Pierre-Yves Oudeyer, Manuel Lopes and Adrien Baranes.
Information-seeking, curiosity, and attention: computational and neural
Mechanisms. Trends in Cognitive Science (2013) 1-9, 2013
Douglas Hofstadter & Emmanuel Sander. Lanalogie, cur de la pense.
Ed. Odile Jacob, 2013
Steels, Luc. Self-organisation and selection in cultural langage evolution.
In Luc Steels (Ed.), Experiments in Cultural Langage Evolution, 1 37.
Amsterdam : John Benjamins, 2012
Langage naturel, parole, audio, musique

Kenneth Church. A Pendulum Swung Too Far. Linguistic Issues in Langage
Technology LiLT. Vol. 2, Issue 4, 2007
Arnaud Dessein, Arshia Cont. An information-geometric approach to real-time
audio segmentation. IEEE Signal Processing Letters, Institute of Electrical and
Electronics Engineers, 20 (4), p. 331-334, 2013
G. Hinton, L. Deng, D. Yu, G.E. Dahl, A. Mohamed, N. Jaitly, A. Senior, V.
Vanhoucke, P. Nguyen, T.N. Sainath, B. Kingsbury. Deep neural networks for
acoustic modeling in speech recognition: the shared views of four research
groups. IEEE Signal Processing Magazine, 29(6):82-97, 2012
80
Remerciements
Chercheurs des quipes-projets et des centres Inria qui ont contribu ce document
(qui ont accord des entretiens, fourni des textes ou les deux)
Abiteboul Serge, quipe-projet DAHU, Horaud Radu, responsable de lquipe-

Cachan projet PERCEPTION, Grenoble
Ayache Nicholas, responsable de Manolescu Ioana, responsable de
lquipe-projet ASCLEPIOS, Sophia- lquipe-projet CEDAR, Saclay
Antipolis Moisan Sabine, quipe-projet STARS,
Bach Francis, responsable de lquipe- Sophia-Antipolis
projet SIERRA, Paris Mugnier Marie-Laure, responsable de
Beldiceanu Nicolas, responsable de lquipe-projet GRAPHIK, Montpellier
lquipe-projet TASC, Nantes Nashashibi Fawzi, responsable de
Boujemaa Nozha, conseiller Big data lquipe-projet RITS, Paris
auprs du Prsident dInria Niehren Joachim, responsable de
Braunschweig Bertrand, directeur du lquipe-projet LINKS, Lille
centre de recherche Inria Saclayle-de- Oudeyer Pierre-Yves, responsable de
France lquipe-projet FLOWERS, Bordeaux
Brmond Franois, responsable de Pietquin Olivier, quipe-projet SEQUEL,
lquipe-projet STARS, Sophia-Antipolis Lille
Charpillet Franois, responsable de Ponce Jean, responsable de lquipe-
lquipe-projet LARSEN, Nancy projet WILLOW, Paris
Colliot Olivier, responsable de lquipe- Preux Philippe, responsable de lquipe-
projet ARAMIS, Paris projet SEQUEL, Lille
Cont Arshia, responsable de lquipe- Roussel Nicolas, responsable de lquipe-
projet MUTANT, Paris projet MJOLNIR, Lille
Cordier Marie-Odile, quipe-projet Sagot Benoit, responsable de lquipe-
LACODAM, Rennes projet ALPAGE, Paris
Crowley James, responsable de lquipe- Schmid Cordelia, responsable de
projet PERVASIVE INTERACTION, lquipe-projet THOTH, Grenoble
Grenoble Schoenauer Marc, co-responsable de
De La Clergerie Eric, quipe-projet lquipe-projet TAO, Saclay
ALPAGE, Paris Sebag Michle, co-responsable de
De Vico Fallani Fabrizio, quipe-projet lquipe-projet TAO, Saclay
ARAMIS, Paris Seddah Djam, quipe-projet ALPAGE,
Euzenat Jrme, responsable de Paris
lquipe-projet EXMO, Grenoble Siegel Anne, responsable de lquipe-
Gandon Fabien, responsable de lquipe- projet DYLISS, Rennes
projet WIMMICS, Sophia-Antipolis Sturm Peter, adjoint au directeur
Giavitto Jean-Louis, quipe-projet scientifique
MUTANT, Paris Termier Alexandre, responsable de
Gilleron Rmi, quipe-projet MAGNET, lquipe-projet LACODAM, Rennes
Lille Thonnat Monique, directrice du centre de
Giraudon Grard, directeur du centre de recherche BordeauxSud-Ouest
recherche Sophia-Antipolis Mditerrane Tommasi Marc, responsable de lquipe-
Gravier Guillaume, responsable de projet MAGNET, Lille
lquipe-projet LINKMEDIA, Rennes Toussaint Yannick, quipe-projet
Gros Patrick, directeur du centre de ORPAILLEUR, Nancy
recherche GrenobleRhne Alpes Vincent Emmanuel, quipe-projet
Guitton Pascal, membre de la cellule de MULTISPEECH, Nancy
veille et prospective
81
Domaine de Voluceau, Rocquencourt BP 105
78153 Le Chesnay Cedex, France
Tl. : +33 (0)1 39 63 55 11
www.inria.fr

AI Livre-Blanc n01

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

AI Livre-Blanc n01

Hochgeladen von

Copyright:

Verfügbare Formate

Intelligence

LIVRE BLANC N01

Ce document est le premier produit par la cellule veille

Ce livre blanc a t coordonn par Bertrand Braunschweig

Toi.Net : M. Lamaison, candidat la prsidence de la rgion sud-ouest, d-

Toi.Net est une servante-robot bien duque. Elle connait beaucoup

Inria, avec plus de cent-soixante quipes-projets rparties au sein de

La recherche en IA a permis de raliser

Figure 2 : Informations smantiques ajoutes aux rsultats du moteur de recherche Google

Enfin, une autre tendance importante est la rcente ouverture de

- la bibliothque logicielle TensorFlow de Google utilise pour l'ap-

- la mise en open source par Facebook du design de son ser-

Lenthousiasme suscit par toutes ces ralisations positives a t ce-

Les dfenseurs de la singularit technolo-

Le dbat sur les dangers de l'IA a franchi un

Parmi les autres dangers et menaces ayant fait l'objet de dbats au

Plus nous dveloppons l'intelligence artificielle, plus le risque est

l'intelligence artificielle peut comporter de nombreux risques et consti-

Dietterich et Horvitz ont publi dernirement une rponse intres-

Dans cette optique, ces dernires annes, Inria a :

En outre, Inria encourage ses chercheurs prendre part aux dbats

Les enjeux scientifiques et technologiques mis au jour par la re-

5 Commission de rflexion sur l'Ethique de la Recherche en sciences et technologies du Numrique de

_Interactions avec les robots (environnement/humains/robots)

Tableau 1: Hirarchie de mots-cls pour l'IA tablie par Inria

Les contributions d'Inria sont prsentes ci-aprs par quipe-projet.

PLAN STRATGIQUE "OBJECTIF INRIA 2020"

La stratgie scientifique dInria est construite autour de deux axes

Les sciences et technologies du numrique utiles lhumain, la

Les dveloppements scientifiques prioritaires au cur de nos

Aprs un premier paragraphe consacr aux dfis gnriques, seront

Les dfinitions de l'IA et des sous-domaines ne seront pas reprises

Les systmes d'IA doivent oprer dans le monde rel et interagir

Processus d'apprentissage avec intervention humaine

Ouverture d'autres disciplines

Une IA sera souvent intgre dans un systme largi compos de

De nombreux systmes d'IA excellent dans un domaine spcifique,

Composantes incontournables des systmes critiques, la certification

Autres dfis gnriques

Outre les prcdents dfis, les exigences ci-dessous concernant

L'exigence de protection de la vie prive est particulirement impor-

Enfin, un dernier dfi concerne le passage chelle. Les systmes

Les dfis dans ce domaine sont nombreux : apprendre partir de

ORPAILLEUR est une quipe-projet d'Inria et du Loria, cre dbut

L'extraction de connaissances partir de bases de donnes (Knowledge

Le processus KDD est itratif, interactif et gnralement contrl par

Le processus KDD exploite les connaissances du domaine notamment

Reprsentations symboliques vs reprsentations continues

Les reprsentations continues permettent l'algorithme d'apprentis-

Les analyses de type "processus d'apprentissage avec intervention hu-

Apprentissage continu et sans fin

On attend de certains systmes d'IA qu'ils soient rsilients, c'est--dire

Apprentissage sous contraintes

La protection de la vie prive est sans doute la contrainte la plus im-

de donnes non plus sous l'angle de la centralisation, mais comme un

Les systmes d'apprentissage automatique modernes ncessitent du

SIERRA sintresse avant tout aux problmes dapprentissage automa-

Les rsultats les plus remarquables obtenus dans le domaine de

Les problmes relatifs lapprentissage squentiel incluent notamment

lectionne en tirant pleinement parti, et si possible le meilleur parti, de

Les principales applications concernent les systmes de recomman-

Processus dapprentissage avec intervention humaine, explications

Les dfis portent sur la mise en place dune collaboration naturelle

_Interactions avec les robots (environnement/humains/robots)