Sie sind auf Seite 1von 28

Modles formels du dialogue

Jean Caelen
Laboratoire CLIPS-IMAG
Domaine universitaire, BP 53
38041 Grenoble Cedex 9
Jean.Caelen@imag.fr
Rsum. Cet article prsente un tat de lart, quelques modles
formels du dialogue et dtaille plus particulirement une
approche fonde sur une logique de laction utilisant les
concepts de but et de stratgie. Le dialogue est considre dans
le cadre dune interaction verbale homme-machine propos
dune tche. Les modles prsents tirent parti de diffrentes
thories et sont classs en quatre grandes catgories. Ils sont
discuts et leurs limites sont nonces.

1 INTRODUCTION
Beaucoup douvrages ont paru en franais sur le dialogue hommemachine (DHM) ces dernires annes. Cela note lintrt de ce domaine
auprs des chercheurs. Cest en effet un sujet fascinant dans la mesure o
il tente de rpondre au fameux dfi dA. Turing [1] sur lintelligence des
machines les machines seront intelligentes, le jour o elles pourront
dialoguer. Ce jour nest manifestement pas encore arriv, mais on en
peroit mieux aujourdhui les difficults, les limites et ce quil est
raisonnable desprer en matire de modlisation du dialogue.
Paralllement (et peut-tre consquemment), le besoin en systmes
interactifs ergonomiques ne cesse de samplifier. Aprs la vague des
interfaces graphiques qui ont introduit lcran graphique et la souris ainsi
que la possibilit de manipulation directe, on sinterroge sur les
meilleures formes dinteraction, les plus utilisables, les plus adaptes la
tche et celles qui ncessitent le moins dapprentissage pour lutilisateur.
Ce besoin, dune autre nature que celui de relever le dfi de Turing,

Assises GdR I3 dcembre 2002

appelle des solutions concrtes pour les systmes composante orale :


interagir en dialoguant avec des machines.
Cest de ce besoin dont il est question dans cet article : montrer ltat
de lart et des solutions en modlisation du DHM (dialogue hommemachine). Nous prendrons le point de vue interactionnel dans lequel le
langage prend place comme modalit dexpression et qui emprunte aux
modles de conversation et de dialogues humains ses paradigmes
fondateurs. On ne trouvera donc pas dans cet article de considrations
traitant du langage naturel mais au contraire des modles suffisamment
gnraux sur le dialogue et pouvant tre mis profit au-del du cadre de
lusage de la langue, pas exemple en interaction homme-machine.

2 LES THEORIES FONDATRICES PAR APPROCHES


DISCIPLINAIRES
De nombreuses disciplines se sont intresses au dialogue humain :
(a) lthnomthodologie (branche de lethnoscience) qui pose la
communication dans une perspective sociale : les individus agissent
dans un cadre normalis selon des rgles et des conventions qui sont
socio-culturellement bien dfinies,
(b) la philosophie du langage (notamment la philosophie analytique) qui
sintresse un individu plac en situation de communication, sur un
plan intentionnel et actionnel,
(c) les cognisciences qui retiennent de la communication les aspects lis
la perception, la planification et au raisonnement cognitifs,
(d) la linguistique qui tudie la structure et la fonction du langage dans le
dialogue,
(e) enfin lintelligence artificielle qui utilise prfrentiellement la notion
dagent rationnel et/ou de planification pour rsoudre le problme de la
coordination dactions conjointes faites travers et par le dialogue.

2.1 L'thnomthodologie
Les thnomthodologistes [2], [3] ont dvelopp leur approche autour
de ltude des capacits de raisonnement de sens commun que manifestent
des individus, membres dune mme culture, pour produire et reconnatre
des actions intelligibles. Cette approche est plus descriptive parce que
naturaliste que prdictive : elle met laccent sur une forme de

Modles formels du dialogue

rhtorique de la moralit travers le principe didentit qui proclame que


les mthodes de raisonnement sont partages entre les individus et
apparaissent la surface de la vie sociale parce que les rgles
dinteraction et daction sociales sont profondment inscrites chez chacun.
En dautres termes pour les thnomthodologistes, le raisonnement
humain est de nature normative. En particulier, il est lisible dans une
conversation qui devient pour eux le lieu dune recherche fonctionnaliste
sur les actions humaines. Les pragmalinguistes se trouvent galement dans
la mme ligne de pense : "parler nest pas simplement la mise en
fonctionnement dun systme linguistique, mais une forme essentielle
daction sociale" [4], "un systme de comportements de diffrents
partenaires qui sinfluencent rciproquement dans des actions concrtes"
[5]. Pour eux linteraction fonctionne selon les principes de la rciprocit
des perspectives et de la rciprocit des motivations. Ces principes
sappuient sur la notion dintercomprhension qui dfinit le projet
daction du locuteur A (ou intention) travers la raction quil attend de
son partenaire B, comme moyen de raliser son but. Le principe de
rciprocit des motivations est lanticipation par A que son projet, une
fois compris, sera accept par B comme la raison et la motivation
cause de du projet et de laction de B [6]. Si, pour eux, ce principe suffit
rgler les niveaux locaux de linteraction (tours de parole fonds sur le
concept des paires adjacentes), le deuxime principe, celui de la
rciprocit des perspectives est ncessaire pour rgler les niveaux
suprieurs dorganisation de linteraction. Ces niveaux sont lis une
conception hirarchique de laction dans laquelle ce principe fonde la
complmentarit ou la symtrie des rles des partenaires pour le guidage
des niveaux dexcution. De lui rsultera la stratgie utilise dans
linteraction (ngociation, coopration, etc.) issue dun accord entre les
partenaires.
Goffman [7] va plus loin, il introduit les notions de rituel et de face :
linteraction sociale est guide par le souci de ne pas perdre la face. La
notion de face renvoie celles de rle, de statut, cest--dire de la position
do on parle et que lon doit conserver car en parlant on construit
une image de soi. Au-del des tours de parole et des paires adjacentes, il
y a dautres mcanismes de rgulation comme la mise en scne des places
de laquelle on attend des retours comme lacquiescement (Mmm), la
surprise (ah oui ?), les marques de sympathie, le rire, etc.
Plus rcemment, Suchman [8] a introduit la notion daction situe, qui
donne une grande importance la prise de dcision en situation (en
dautres termes au contexte) et qui montre que du fait de la grande
dynamique du dialogue, les locuteurs restent en tat dadaptation et

Assises GdR I3 dcembre 2002

dajustement permanent. Ds lors, il est difficile pour un observateur de


prdire les actes de parole puisquils rsultent dune double interprtation,
du locuteur et de lallocutaire, et que les effets nen sont pas, de ce fait,
clairement prvisibles. Elle fonde alors sa description de la conversation
sur des stratgies opportunistes, qui ne sont instanciables que localement
et en tous cas non planifiables long terme. Par cela elle remet en cause
un grand nombre de thories fondes de prs ou de loin sur la logique des
intentions. Malheureusement son apport trs riche par ailleurs, reste plus
critique que constructif dans la perspective de poser un modle
formalisable pour le dialogue.

2.2 La philosophie analytique


Jugeant des insuffisances dune smantique gnrale en linguistique,
certains philosophes du langage comme Austin [9] et Searle [10] mettent
laccent sur la pragmatique en partant du principe que tout nonc est un
acte de langage. Austin, s'intressant aux verbes performatifs, remarque
qu'ils contiennent l'action qu'ils dnotent. Ainsi, dire "je te baptise Queen
Elisabeth" c'est faire l'action du baptme pour peu qu'on ait la lgitimit
pour le faire ; de mme "la sance est leve" ne donne pas seulement le
signe de fin mais produit une action dans le monde. Pour Austin tout
nonc devient un acte de parole qui contient trois composantes : le
locutoire (le dire), l'illocutoire (le faire), le perlocutoire (l'effet produit sur
son interlocuteur). Ainsi l'nonc "les canots la mer" est-il charg de
sens pour l'quipage ! "Haut les mains" vise neutraliser autant qu'
effrayer la victime. "je te promets de venir demain" est une forme
engageante mme si elle ne garantit pas totalement que cet vnement va
se produire : il peut y avoir une srie d'empchements imprvisibles, ou il
se peut que l'intention soit plutt de rassurer que de s'engager vraiment.
Ainsi travers un mme nonc, plusieurs buts sont poursuivis, le but
illocutoire (effet espr de laction, par exemple neutraliser la personne)
et le but perlocutoire (effet espr sur lallocutaire, lui faire peur).
Searle [11] replace la langue dans la thorie des actes de langage et
plus gnralement dans une thorie des intentions. Pour A, noncer une
proposition rsulte de lintention de la produire ; pour B, la comprendre
cest interprter lintention qui la sous-tendue, dans le contexte o elle a
t produite. Dans cette thorie, la communication se situe dans la
pragmatique, et la pragmatique des actes de langage sinscrit son tour
dans une thorie du langage et une thorie de laction selon deux
perspectives : la description des actes de langage et leur rgulation selon
le principe dexprimabilit, cest--dire,

Modles formels du dialogue

(a) noncer des mots = effectuer des actes dnonciation,


(b) rfrer et prdiquer = effectuer des actes propositionnels
(locutoires),
(c) affirmer, ordonner, promettre, etc. = effectuer des actes illocutoires,
(d) effectuer des actes perlocutoires = agir sur son interlocuteur.
Jusqu'en (c) on peut reprsenter un acte de langage par Fp, p = contenu
propositionnel et F = force illocutoire, (ex. : "je te promets que je
viendrai", F marque par "je te promets", force promissive, et p marqu
par "je viendrai"). Vanderveken [12] a formalis une logique illocutoire
du discours, essentiellement monologique, poursuivant ainsi les travaux
de Searle.
Jusque l donc, Searle comme Vanderveken, ne prennent pas encore en
compte le rle du locuteur ni celui de lallocutaire quil ne font apparatre
quen (d). Ceci leur a t reproch puisque cela implique jusquen (c),
llimination du locuteur parlant au profit dun locuteur abstrait ce qui les
oblige introduire la notion de sens littral. Cela introduit une difficult
pour linterprtation des actes indirects qui se font par nonciation non
littrale ("le sucre s'il te plat !" ne peut pas tre analys sans l'action qui
la sous-tend qui prend encore un sens diffrent si c'est un diabtique qui la
prononce). Searle propose alors pour linterprtation de ce type dacte
une stratgie infrentielle, qui examine toutes les conditions de ralisation
de lacte (situation, monde, arrire-plan, etc.), le pourquoi, les intentions
du demandeur, le but poursuivi, etc.
La taxonomie des actes de langage est la suivante :
Acte assertif : la composante illocutoire dcrit un tat de fait existant.
Le locuteur dit comment sont les choses. Le but est de rendre le contenu
propositionnel (qui est une proposition) conforme au monde. L'acte
assertif rvle les croyances du locuteur. Nous notons cet acte FS (faire
savoir).
Acte directif : le but illocutoire est de mettre l'interlocuteur (qui est ici
le locuteur lui-mme) dans l'obligation de raliser une action future. Le
locuteur essaie de faire faire les choses. Le but est de rendre le monde
conforme au contenu propositionnel (qui contient l'action future de
l'interlocuteur). L'acte directif exprime les dsirs et la volont du locuteur.
Nous notons cet acte FF (faire faire une action) ou FD (faire devoir)
lorsque lobligation est forte ou FFS (faire faire savoir) pour une demande
dinformation.

Assises GdR I3 dcembre 2002

Acte promissif : il s'agit d'une obligation contracte par le locuteur luimme de raliser une action future. Le locuteur s'engage faire quelque
chose. Le but est de rendre le monde conforme au contenu propositionnel
(qui contient l'action future de l'interlocuteur). L'acte promissif rvle
l'intention du locuteur. Nous notons cet acte FP (faire pouvoir).
Acte expressif : le but illocutoire de l'acte expressif est d'exprimer
l'tat psychologique qui lui est associ. La direction d'ajustement n'est pas
de rendre le monde conforme aux mots ou vice versa. La proposition
exprime est prsuppose : on se rjouit ou on dplore qu'elle soit vraie.
Cet acte est trs peu prsent en DHM, nous le notons FS.
Acte dclaratif : le but illocutoire de l'acte dclaratif est de rendre
effectif son contenu. Le locuteur provoque des changements effectifs dans
le monde par ses dclarations. Cet acte a simultanment deux directions
d'ajustement entre le langage et le monde. Il faut qu'il soit accompli dans
une certaine institution extra linguistique qui confre au locuteur les
pouvoirs de provoquer de nouveaux faits institutionnels par le seul
accomplissement appropri d'actes de langage. Nous notons cet acte FA.
Malgr ses qualits, cette approche est essentiellement monologique,
cest--dire quelle ne prend pas en compte les noncs dans la dynamique
du dialogue. Une extension est donc ncessaire, pour aborder les
problmes du dialogue et de lintersubjectivit.

2.3 La psychologie cognitive


Parmi les thories les plus fcondes pour le dialogue, nous retiendrons
les approches de Grice puis celles de Sperber et Wilson.
(a) Pour Grice [13], un change dialogique suit une certaine logique
fonde sur un principe gnral de cooprativit ; les interlocuteurs
reconnaissent cher leurs partenaires participant un change, un ou
plusieurs buts communs dans une direction accepte par tous, ce que
Grice formule sous forme de maximes lintention des conversants euxmmes ( la manire des classiques franais, La Rochefoucault
notamment) : que votre contribution la conversation soit, au moment o
elle intervient, telle que le requiert lobjectif ou la direction de lchange
verbal dans lequel vous tes engags. Il exprime plus prcisment cette
maxime laide de deux autres et dfinit la notion dimplicature comme
lensemble des consquences de lapplication ou de la non application de
ces maximes par les conversants.

Modles formels du dialogue

maxime de qualit : que votre contribution soit vridique qui se


dcompose en, naffirmez pas ce que vous croyez tre faux et
naffirmez pas ce pour quoi vous manquez de preuves.
maxime de quantit : que votre contribution contienne autant
dinformations quil est requis (pour les vises conjoncturelles de
lchange) et que votre contribution ne contienne pas plus
dinformations quil nest requis
La maxime de qualit semble limitative voire mme quelque peu nave
car elle semble exclure lironie, le mensonge ou la dissimulation. En
ralit il nen est rien parce que prcisment, une rgle viole a autant
dimplications quune rgle respecte par le fait quil y a eu moment
donn un besoin de la transgresser. Ainsi pour Grice, lironie fonctionne
parfaitement sous ce principe car elle est intentionnellement code par
lintonation de la voix ou des gestes significatifs. De mme le mensonge
finit par se dtecter travers lincohrence du menteur qui ne respectant
pas la maxime naffirmez pas ce pour quoi vous manquez de preuves, se
trouvera tt ou tard face ses contradictions.
La maxime de quantit peut se rduire la seule maxime de pertinence
soyez pertinent. Cette maxime cache elle seule toute une thorie de la
pertinence que nous dvelopperons plus loin.
Enfin, Grice complte ses maximes sur le contenu (quoi dire) par des
maximes de modalit, cest--dire sur le comment dire: soyez clair,
soyez bref, soyez mthodique, vitez dtre ambigu, qui visent
une meilleure efficacit du dialogue.
Par le terme implicature, Grice veut distinguer certaines conclusions
que lon peut tirer des noncs, des vritables implications logiques. En
effet les implicatures sont fondes sur lusage du langage dune part et
prennent en compte les non dits, implicites, ellipses, etc., dautre part. Le
calcul des implicatures ne devient donc possible quen appliquant les
maximes, par exemple jai faim suggre que dune part ce fait est vrai et
dautre part que je rclame manger. Cela peut suggrer galement quil
sest droul un certain temps depuis le dernier repas, etc.. Les
implicatures dpendent fortement du contexte et du sujet parlant.
(b) Pour Sperber et Wilson [14] qui critiquent Grice sur la notion
dimplicature , la communication est un "change dindices qui
orientent (ou r-orientent) les processus infrentiels des interlocuteurs en
prsence. Ils rejettent la thorie codique trop simpliste ; les penses ne
sont pas codes par A, transportes puis dcodes par B : les penses de A
orientent seulement celles de B. Sperber et Wilson rfutent ainsi le

Assises GdR I3 dcembre 2002

modle codique qui stipule une phase de codage et de dcodage des


informations linguistiques et extra linguistiques (signes dans un cadre
smiotique plus large) selon un ensemble de conventions, de savoirs
partags par les deux interlocuteurs et de suppositions mutuelles de lun
sur lautre. Cette vision, fonde sur une approche psychologique, se
distingue de celle de Searle pour lequel existent des intentions mais aussi,
implicitement, un code. Sperber et Wilson nient lutilit de la thorie des
actes de parole quils trouvent classificatoire mais non opratoire. Ils
affirment quil faut remonter aux attitudes cognitives travers les
processus infrentiels pour comprendre les mcanismes de la
communication. Ils posent la signification au plan de la pertinence : les
indices changs doivent tre pertinents pour pouvoir servir retrouver
lintention du destinateur ; signifier, cest rendre signifiant quelque chose
quelquun ; signifier cest vouloir dire cest--dire communiquer ses
intentions ou obtenir un succs dans la comprhension de ses intentions
par autrui. Plus formellement, le succs de (A veut dire S B) est obtenu
si :
(a) B produit une rponse R car
(b) B reconnat lintention de A contenue dans S (note
intention(A) S)
(c) et la rponse R rsulte en partie de (b)
Cela permet de distinguer deux sortes dintentions : les intentions
informatives (A informe B de intention(A) S) cest--dire A rend
manifeste au destinataire B un ensemble dindices ou dhypothses) et les
intentions communicatives (A informe B de intention(intention(A) S)
S cest--dire A rend manifeste au destinataire quil a une intention
informative). Cette information se fait au travers dindices pertinents. De
ce fait A et B doivent se montrer cooprants pour que la communication
russisse. La coopration est donc une rsultante cognitive plus quune
rsultante sociale.
Une critique essentielle de cette thorie repose sur la rgression
linfini, engendre par la rcursivit sur lintention que A a de produire un
stimulus qui rende manifeste B que A veut lui rendre manifeste un
ensemble dhypothses, etc. Cela semble un processus cognitif peu
raliste. Le concept de pertinence est quant lui plus fcond.
Pratiquement, la pertinence repose sur deux facteurs : leffet cognitif
produit chez le destinataire et leffort quil a fallu pour le produire. La
pertinence est donc le rapport de ces deux quantits, cest le juste
quilibre du cot de traitement chez les deux interlocuteurs.

Modles formels du dialogue

2.4 La linguistique
Les linguistes de lcole de Genve [15], [16], envisagent le discours
comme cadre de structuration dchanges linguistiques. Ils sefforcent
dutiliser le moins possible les contraintes ou les donnes extrieures au
discours comme les intentions, les prsuppositions, etc., quils jugent trop
subjectives. Ils proposent une thorie de la cohrence et non une thorie
de linterprtation : "le problme principal est de formuler un ensemble
dunits conversationnelles, un ensemble de relations entre ces units, un
ensemble de principes gouvernant la composition des units simples en
units complexes, bref la formulation de rgles de bonne formation" [17].
Cette approche nest pas prdictive ; elle reste essentiellement une
description fonctionnaliste et/ou structurelle des noncs de A et de B
rendue possible une fois le discours achev et laction accomplie.
Les phases du dialogue que retient l'cole de Genve sont les
suivantes : l'ouverture (initiative, valuative, ractive), la continuation
(initiative, valuative, ractive), la clture (initiative, valuative, ractive),
l'incidence (abandon temporaire d'une activit en cours de ralisation pour
la reprendre par la suite) et la rupture (abandon dfinitif d'une activit en
cours de ralisation). Un dialogue commence par une ouverture et
s'achve par une clture. La phase non marque est la continuation
caractre initiatif.
Luzzati [18] dveloppe de son ct un modle de dialogue deux
axes : l'axe rgissant horizontal correspond la recherche d'un accord
(systme questions rponses principales et secondaires) et l'axe incident
vertical rpond aux exigences de clart et d'explication. La mise en uvre
s'appuie ensuite sur des variables d'avancement, de profondeur,
d'incidence et d'cartement.

3 LES MODELES FORMELS


Ces thories ont inspir divers modles computationnels que lon peut
classer en quatre groupes :
(a) les grammaires structurelles,
(b) les plans et intentions,
(c) les logiques mentalistes,
(d) les jeux.

10

Assises GdR I3 dcembre 2002

3.1 Les grammaires structurelles


Le modle genevois est la source de la plupart des modles
structurels. Il est souvent utilis en DHM car il est dune implmentation
claire et commode. Il se prte bien une formalisation de type grammaire
de dialogue. On peut citer par exemple [18], [19], [20], [21], [22] en
France.
Le modle est de nature hirarchique et se dveloppe sur plusieurs axes
(laxe rgissant et laxe incident chez Luzzati [23], directeur et
subordonn chez Bilange [19]). Il se caractrise essentiellement par
lexistence dune structure lintrieur de laquelle le dialogue peut se
tisser. Cette structure se dcrit laide dune grammaire hors-contexte.
Par exemple Bilange [19] propose la grammaire suivante pour un dialogue
finalis (de type application de rservation arienne) :
E I.{I}*
I CD | CS.CD | CD.CS
CD {A | I}D
CS {E | I | A}S
Avec,
Catgories discursives : E = change, I = intervention, A = acte de
langage
Fonctions : S = subordonn, D = directeur
Constituants : CS constituant subordonn, CD constituant directeurs
Une expression telle que CD {A|I}D se lit un constituant directeur
est form dune suite dactes directeurs et/ou dune intervention
directrice .
A ces rgles structurelles qui rgissent lenchanement possible des
constituants du dialogue sajoutent des fonctions que le modle prvoit
(fonctions illocutoires essentiellement). Par exemple les fonctions
dinitiative, de ractive et dvaluative, parfois de conclusive (pour la
clture).
Une initiative ouvre un change (ou rintroduit un change
momentanment mis en attente), ce qui met lallocutaire en position de
raction. La plupart du temps cet effet attendu lamne produire une
ractive, laquelle le locuteur ragit son tour par une valuative ou par
une clture, lorsquil a obtenu ce quil dsirait. Notons que la clture
approbative nest pas toujours marque explicitement. Quant
lintervention valuative, elle peut tre positive (elle marque lavance
vers le but) ou ngative (cartement du but) : il sagit dactes qui

Modles formels du dialogue

11

marquent la position (et parfois les raisons de) du locuteur par rapport
son interlocuteur.
Un change, pris dans sa globalit, peut tre lui-mme initiatif (change
de politesses par ex.) ou ractif ou valuatif ou conclusif. Dans un
change complet il peut y avoir tout ou partie de ces divers types
dchanges.
Exemple (cit de [19]) :
L : Quand voulez-vous partir ? (1) Intervention initiative
A : Le 13 novembre
(2) Intervention ractive
L : Le 13 novembre...
(3) Intervention valuative
quelle heure ?
(4) Intervention initiative
A : Non, le 20 novembre !
(5) Intervention valuative (3)
10 heures
(6) Intervention ractive (4)
Dans cet change complet, (3)+(5) est un change valuatif et (4)+(6)
un change ractif. Ces deux changes sont imbriqus. La clture est ici
implicite, le locuteur ayant obtenu les renseignements quil demandait.
Les limites de ce modle proviennent de la difficult dinterprter les
fonctions des actes : (6) est une raction (4) car (4) est une demande et
(6) une rponse cohrente dans le cadre de la tche sous-tendue par le
dialogue : une demande de renseignement dhoraire de train. On ne peut
donc interprter correctement la squence quau regard de la tche dune
part, mais aussi au regard du but poursuivi par le demandeur (il sagit
pour lui de fournir un billet en consultant une base de donnes et non de
partir lui-mme en train).
Luzzati [23] a tent de dpasser cette rigidit structurelle en proposant
un modle dynamique voluant sur deux axes, laxe rgissant qui est celui
de lavance dans la tche et laxe incident ou axe de clarification, aidant
la comprhension pour une meilleure avance sur laxe rgissant. Il
distingue, pour une application de renseignement, les questions et
rponses principales et secondaires sur laxe rgissant et les questions et
rponses incidentes. Ce modle vise avant tout viter les erreurs
dincomprhension rptition qui risquent de bloquer le dialogue. Il
contrle des variables interactionnelles, qui mesurent les carts laxe
rgissant, et force le retour sur cet axe en cas de trop fort loignement.

3.2 Les plans et intentions


Avec la gestion de dialogue laide de plans, on ne considre plus
seulement la structure et la fonction des actes de dialogue mais galement
les intentions des interlocuteurs. Les locuteurs dialoguent pour raliser un

12

Assises GdR I3 dcembre 2002

but (cest particulirement vrai dans les dialogues finaliss), ils se servent
pour cela de plans et de schmas [24], [25], [26], [27], [28], [29], [30],
[31]. Cette approche se situe donc dans le cadre plus gnral de la thorie
de la planification [32]. Par analogie aux actions dun robot pour atteindre
un but, les actes de langage sont des actions faites pour modifier les
mondes de connaissance des interlocuteurs et le monde de la tche.
Lorsquil sagit dun dialogue homme-machine, le rle de la machine est
donc de comprendre le plan de lutilisateur pour laider dans sa tche.
Avant de comprendre le plan du locuteur il sagit bien sr de le
reconnatre puis didentifier les buts restant atteindre et correspondant
aux intentions de lutilisateur. Lapproche est donc schmatiquement la
suivante :

si lon suppose que le locuteur a des buts, quil planifie sa tche et


le dialogue en produisant des actes de langage,
alors la machine doit reconnatre le plan travers les actes de
langage de manire dduire les buts du locuteur.

Cette approche ncessite une modlisation prcise des plans et des


buts des interlocuteurs. Les buts sont modliss par des oprateurs de
croyance sur les connaissances (par ex. objets de la transaction dans le cas
de la demande de renseignements). Les plans sont modliss comme des
suites dactions mettant en relation un tat initial du monde et un tat but.
Il sagit alors dactiver les plans pour atteindre cet tat but. Les mthodes
mises en uvre relvent de la planification en Intelligence Artificielle
[33], [34], [35], [36]. On utilise souvent des reprsentations dactions et
de plans fondes sur des schmas comme par exemple :
PRENDRE-TRAIN(Passager, Train)
dfinition :
appartient(Voiture, Train)
corps :
embarquer(Passager, Voiture)
pr-conditions :
possde(Passager, Billet)
sur(Passager, Quai)
effets :
dans(Passager, Voiture)
contraintes :
accoster(Train, Quai)
Les limites dune telle reprsentation sont videntes : on ne peut traiter
que des dialogues qui sont diriges par la tche et dont le but est connu.
Les incidences hors tche du dialogue sont quasiment impossibles
traiter (on peut ici rpondre des questions comme que faut-il faire avant
dembarquer ?, rponses : tre en possession dun billet et attendre que

Modles formels du dialogue

13

le train ait accost au quai, mais on ne peut pas rpondre une question
comme combien de temps faut-il attendre avant dembarquer ?).
Pour dpasser ces limites, Cohen, Allen et Perrault dans leurs travaux
pionniers [24], [25], ont appliqu cette technique de planification
lactivit de dialogue elle-mme. Par exemple, lacte dinformer est un
plan tel que :
INFORM (Speaker, Hearer, P)
Preconditions : speaker knows P (P is true & speaker believes P)
Body : hearer believes speaker wants(hearer knows P)
Effect : hearer knows P
La puissance dun tel modle est vidente : il permet de modliser le
dialogue comme une activit en-soi et de la distinguer de lactivit
dploye pour la tche. Mais les difficults demeurent de reconnatre les
intentions et les buts des locuteurs : que se passe-t-il pour les buts
implicites ? Comment traiter les noncs complexes ciblant plusieurs buts
la fois ? Comment rendre robuste un tel systme plus sensible aux
erreurs de reconnaissance des buts ? Comment savoir quun locuteur veut
savoir quelque chose ? Pour rpondre ces problmes Cohen, Perrault et
Allen introduisent finalement des heuristiques et des techniques de
reconnaissance de plans non indpendantes des plans de la tche.
Dans la continuation de ces travaux, Litman [34] a prsent un modle
qui spare mieux le discours et le domaine dit de sens commun. Pour
modliser le discours elle adopte lapproche de Cohen & all. tandis que
pour le second elle adopte des reprsentations structurelles fondes sur la
notion de focus. Cest ce deuxime niveau, dpendant du domaine, qui
contrle le dialogue. Les plans du discours sont organiss en trois classes :
la classe Continue, qui contient les plans de tches nonlinguistiques, et qui sont en relation avec les plans du domaine,
la classe Clarification, qui contient les plans voqus en cas
dincomprhension, dimpasse, etc.
la classe Topic, qui contient des plans dtape du dialogue,
comme Introduce-Plan, pour la phase douverture par exemple.
Son approche est alors deux niveaux : plans et mta-plans.

14

Assises GdR I3 dcembre 2002

3.3 Les approches mentalistes


Les modles mentaux sont une extension des modles prcdents.
Ils font une place prpondrante la logique dialogique plus qu logique
de la tche. Les initiateurs de ce courant sont Cohen, Perrault et Allen
[24], [25] dj cits prcdemment. Cest pourquoi, il ny a pas
rellement de rupture de paradigme entre les modles dits de planification
et les modles mentaux.
Grosz et Sidner [29] ont propos une thorie du discours articule
autour de la reconnaissance des intentions et du focus dattention un peu
la manire de Litman. Un discours est compos de trois lments, (a) sa
structure linguistique, modlise en termes de segments de discours, (b) sa
structure intentionnelle plus prcisment lensemble des buts des
participants et (c) sa structure attentionnelle ou focalisation sur le
discours. Cette dernire structure permet surtout de rsoudre les
problmes de rfrence pragmatique et discursive. Les buts sont de nature
discursive (par exemple informer) ou de nature pragmatique (par exemple
faire une action, identifier un objet, demander didentifier un objet). La
focalisation sur le discours, lapport le plus original du travail, permet de
faire ressortir les lments les plus pertinents du moment. Pour cela
lespace est organis en sous-espaces (nuds) lis entre eux (arcs). On
associe un sous-espace un segment de discours que lon charge dans une
pile, elle-mme gre par le module de reconnaissance des intentions. Il
nest pas clair cependant comment tout cela sarticule en pratique ni
comment les intentions sont reconnues. On ne voit pas non plus comment
sont traites les incidences au discours principal.
Pour Pollack [37] les plans doivent modliser des attitudes mentales
complexes, en particulier ct des plans ncessaires lorganisation de
la tche et du discours, il doit y avoir des plans pour organiser les
intentions. Pollack avance que de tels plans dintentions sont utiles pour
conduire le dialogue un niveau plus profond. Cela permet aussi de
rparer ou de corriger les erreurs ou les engagements dans des mauvais
plans par manque de connaissance des locuteurs. Par exemple le
dialogue :
A : je voudrais parler Kathy, avez-vous son numro de tlphone ?
B : je suis dsol, mais Kathy est sortie de lhpital.
montre que A sengage sur un mauvais plan par manque de connaissance.
Pollack modlise les intentions laide de la notion de connaissance
mutuelle. Cette connaissance mutuelle est une pr-condition pour activer

Modles formels du dialogue

15

un tat mental (ou tat intentionnel), et un tat mental est un plan. Nous
avons donc :
ETAT-MENTAL(Intention)
Pr-conditions : croyances et connaissances mutuelles
Effets : plan daction
Avec ce niveau de reprsentation il est facile pour une intention
donne, de vrifier les pr-conditions pour activer ou non un plan
daction. Cest ce qui permet B de donner le bon niveau de rponse A
dans lexemple ci-dessus plutt que de poursuivre un plan en impasse
(comme tenter de rechercher le numro de tlphone en ayant peut-tre
demand A dpeler le prnom par exemple). Cette modlisation est trs
sophistique mais se heurte la difficult de description de tous les cas
possibles pour des applications pratiques. Il est pratiquement impossible
davoir une bonne couverture et une bonne efficacit pour dvelopper de
nouvelles applications.
Plus rcemment Sadek [38] a mis au point un type de modle pour des
applications pratiques (projet ARTIMIS) en dfinissant les principes dun
agent rationnel dialoguant. Cet agent a des capacits de ngociation
permettant une trs grande flexibilit dans linteraction : il suit le dialogue
en autorisant les incidences, reprises, explications, demandes daide, etc.
tout en ne perdant pas de vue le but final. Il doit donc la fois avoir des
ractions coopratives et prendre des initiatives dans la tche, un systme
de dialogue intelligent doit en fait, tre un systme intelligent qui
dialogue. Sadek rajoute : ce systme doit avoir un comportement
rationnel [39]. Cela lamne dfinir un cadre logique complet apte
rendre compte dtats mentaux. Nous ne dtaillerons pas ce modle ici,
dans la mesure o il a t dj expos aux journes du GdR I3.

3.4 Les jeux de langage


Un autre courant en modlisation du dialogue tend se dvelopper
autour de la thorie des jeux [40]. Wittgenstein le premier a considr
quune conversation est un jeu de langage. Peut-tre un peu abusivement
peut-on aussi ranger dans cette catgorie les modles argumentatifs
comme [41], [42].
En rgle gnrale, on suppose que chacun des interlocuteurs est engag
dans un jeu dont les tours de parole reprsentent des coups. Ces coups
sont plus ou moins pertinents (cest--dire quils atteignent plus ou moins

16

Assises GdR I3 dcembre 2002

leur but). On avance dans le jeu en en suivant les rgles et en tentant de


maximiser ses gains ou de rduire ses pertes (par exemple le gain la
sortie du jeu sera davoir obtenu un renseignement, ou davoir rsist aux
arguments de son interlocuteur, etc.). On distingue plusieurs catgories de
modles : les modles logiques et les modles stratgiques. Dans les
modles logiques laccent est mis sur les gains (convaincre son
interlocuteur par exemple) sans sintresser outre mesure la manire
dont est obtenu le rsultat, tandis que dans les modles stratgiques cest
linverse, il sagit datteindre un rsultat de manire optimale.
Largumentation logique
Les modles logiques utilisent les principes de largumentation. Le
coup est gagn pour le locuteur lorsquil arrive rfuter les arguments de
lallocutaire ou le convaincre des siens. Le principe gnral est illustr
par lexemple suivant : supposons que le locuteur A affirme pq,
lallocutaire B peut rfuter p (en prouvant p) ou rfuter q ou demander
A de prouver p et de prouver q. Supposons que la stratgie de B soit de
demander A la preuve de p et q. A peut alors rpondre : p parce que a
p et q parce que pb q. Ce qui poussera ensuite B demander A de
prouver a et b ou de prouver lui-mme que a ou b. Et ainsi de suite
jusqu larrt du processus du jeu. Comme on le voit le problme se pose
en termes de logique dune part mais aussi en termes de stratgie dautre
part, puisque B peut perdre sil fait le mauvais choix de stratgie en
nattaquant pas le bon argument.
Pour Baker [41] le jeu de langage est une ngociation, dans laquelle les
locuteurs ont des attitudes sur des propositions. Les attitudes de base du
modle sont loffre, lacceptation, la ratification. Le dialogue se droule
partir de squences types :
Squence de base
Squence tendue
OFFER(A, p)
OFFER(A,p)
ACCEPT(B,p)
OFFER(B, q)
RATIFY(A,p)
ACCEPT(A, TF(p))
Etc RATIFY(X, z)
Dans ces squences, par exemple la squence tendue, le locuteur A
prsente un prdicat p et lallocutaire B le sien q. Ils essaient de se mettre
daccord en transformant progressivement et tour de rle, les prdicats p
et/ou q. Les TF (transformations fonctionnelles) dont ils disposent sont de
quatre types : les expansions logiques, les contractions, les neutres et les
fondamentales. Par exemple on aura un dialogue comme :

Modles formels du dialogue

17

A : hier, je suis all Grenoble


B : non ce ntait pas hier, ctait la semaine dernire
A : ah oui, pardon, la semaine dernire.
Qui se traduit par la squence :
OFFER(A, p1p2)
ACCEPT(B, p2) et OFFER(B, p1 = TF(p1))
RATIFY(A, p1)
Pour Dessalles [42] lenchanement du dialogue sopre sur trois
modalits, IMPR = improbable, IND = indsirable et FAUX = paradoxal.
La conversation dbute par lexposition dun fait le plus inhabituel
possible comme tu sais que Jrme a achet une voiture cette
semaine ? qui prsuppose quil est tonnant que Jrme ait fait cet achat
(il est peut-tre cologiste) ou quil a lhabitude de dlguer les achats
sa femme, etc. A cet vnement IMPR la rplique attendue est soit de
marquer son tonnement ( ah bon ), soit de le banaliser ( mais non
cest pour son frre ). De mme pour les vnements IND ou FAUX. Le
droulement peut alors tre dcrit par une grammaire :
Expos-fait Co-tonnement Demande-clarification
Expos-fait Raction-antagoniste Banalisation
Raction-antagoniste Expos-fait(oppos)
Banalisation Expos-fait(modrateur)
Co-tonnement fin-dialogue Expos-fait(nouveau)
La demande de clarification est considre comme une incidence dans
ce modle.
Ces deux modles reposent sur une bonne interprtation des
prdicats par les interlocuteurs. Or ce problme mriterait un long
dveloppement : cest le problme des implicatures conversationnelles sur
lequel dj Grice avait t critiqu. Rappelons que les implicatures
conversationnelles sont lensemble des infrences que lont peut faire
partir des noncs dune conversation. En effet le langage naturel a une
puissance dexpression qui dpasse celle les logiques standards,
notamment par lutilisation de limplicite, de lellipse, de la rfrence
multiple, de la smantique polyvalente, etc.
On distingue les implicatures directes et les implicatures indirectes.
Dans lexemple :
A : As-tu invit Jean et Pierre pour ce soir ?
B : Oui, jai invit Pierre.
on peut dduire directement que invit(Pierre), mais la rponse laisse
penser aussi que invit(Jean) (principe domission) ou que mme

18

Assises GdR I3 dcembre 2002

vouloir(B, inviter(Jean)) ou prfrer(B, inviter(Pierre)), etc. Il est clair


que ces implicatures indirectes ne peuvent pas toujours se faire sans une
connaissance du contexte et des conversants. Dans lexemple :
A : As-tu fait les courses ?
B : Ma voiture est tombe en panne.
les connaissances de sens commun peuvent suffire sans connatre
ncessairement les conversants : il est hautement probable que la rponse
de B signifie non , bien que la voiture ait pu tomber en panne aprs
avoir fait les courses. Pour interprter la rponse de B il faut donc
analyser les attentes de A contenues dans sa question.
Green et Carberry [43] proposent des plans par dfaut pour rsoudre
ces problmes, comme Use-contrast(), Use-obstacle(), Use-otherwise(),
etc. Ces plans sont indpendants des conversants. Hinkleman [44] inclut
un niveau syntaxique et smantique dans linterprtation de tels actes en
affirmant que les plans ne peuvent rsoudre convenablement le problme
sans introduire le rle des conversants. Enfin, Zuckerman [45] propose
dexaminer les effets des implicatures sur les connaissances mutuelles des
conversants. Pour cela il gnre toutes les implicatures possibles au fil du
dialogue. Des heuristiques sont alors ncessaires pour limiter la
combinatoire.
On le voit donc, un jeu logique ne peut se dvelopper que si les
prdicats (ou les modalits) sont bien poss et bien compris tout au long
du jeu. Il peut y avoir rapidement incomprhension ou blocage si les
infrences effectues par les locuteurs ne sont pas les bonnes, dues leur
manque de connaissances mutuelles ou leur apprciation diffrente de la
situation. Cest le point fragile de ces modles qui ont un niveau de
traitement complexe des implicatures.
Les modles stratgiques
Les modles stratgiques [48] restent centrs sur les buts comme dans
les modles de planification, mais le jeu consiste optimiser la stratgie
pour les atteindre. Nous supposons quil y a deux locuteurs qui dialoguent
et quau dpart chacun vise un certain but dans larrire-plan [46]. Nous
noterons A pour locuteur et B pour allocutaire. Leurs buts seront nots, bA
et bB, lun des deux pouvant tre vide.
On dfinit :
But initial : l'tat du monde ou l'tat mental que l'un des deux locuteurs
veut atteindre, soit pour lui-mme (obtenir un renseignement, acqurir un
savoir-faire, etc.), soit pour son partenaire (lui donner une information, lui
faire-faire quelque chose, lui donner un conseil, etc.).

Modles formels du dialogue

19

Echange : une suite de tours de parole pendant laquelle un but est


maintenu. Le dbut dun change est marqu par lapparition dun
nouveau but, ce but se transforme ventuellement au cours de lchange
(il peut saffiner par exemple ou se dcomposer en sous-buts) et devient
un but final irrductible sur lequel l'change se termine par un succs ou
par un chec. Le succs obit la double condition dtre un but atteint et
un but satisfait [47].
But de lchange : celui qui est maintenu en jeu pendant lchange.
But final : l'tat du monde ou de la situation la fin d'un change (cela
se termine toujours, au moins par l'accord des deux interlocuteurs sur le
fait quil y a chec quand il y a chec : les syndicats et le patronat se
sont spars sur un constat dchec ). Le but final nest pas toujours
prvisible au dpart.
Incidence : un acte de parole qui a pour effet de mettre un but en
attente ou en question (par changement de thme, demande de
clarification, demande de prcision, etc.) mais ne remet pas en cause le
but conversationnel de lchange.
Stratgie de dialogue : la manire de grer les tours de parole entre
interlocuteurs pour conduire un change ou une incidence. La stratgie
vise choisir la meilleure direction dajustement des buts moment
donn.
Direction dajustement : il y a 5 directions dajustement possibles des
buts qui conduisent 5 types de stratgies :
B abandonne son but au profit de celui de A (stratgie ractive),
en dautres termes B ajuste son but sur celui de A (en abrg bB
bA)
B impose son but au dtriment de celui de A (stratgie directive),
en dautres termes il force B adopter son but (en abrg bB
bA)
A et B gardent chacun leur but (stratgie de ngociation), en
dautres termes ils nessaient pas dajuster leurs buts a priori (en
abrg bA b bB) mme si lissue de la ngociation un
compromis b est trouv
A et B tiennent compte du but de lautre (stratgie de
coopration), en dautres termes ils essaient de les ajuster lun
lautre (en abrg bA bB)
A et B abandonnent leurs buts au profit dun troisime (stratgie
constructive), en dautres termes ils font un dtour constructif (en
abrg bA b bB)

20

Assises GdR I3 dcembre 2002

On peut alors dfinir les types de stratgies suivants [48] (on se place
dans la suite, du point de vue de lallocutaire B) :
1. Stratgie ractive
Consiste pour B dlguer linitiative A soit en lui faisant endosser
son but (cas de demande daide ou dassistance), soit en adoptant son but
(cas du serviteur). Le droulement du dialogue se fait :
en maintenant le but de lchange, mais sans prendre dinitiative,
en abandonnant son propre but bB ou en le faisant passer sous la
dpendance de bA.
Le sens dajustement est alors bB bA
2. Stratgie directive
Consiste pour B garder linitiative pour conduire le dialogue :
en maintenant le but de lchange et en gardant linitiative,
en imposant son but bB, (donc on cherche ce que bf=bB)
en ignorant ventuellement celui du locuteur bA, qui est donc en
quelque sorte considr comme inexistant
Cela a pour consquence d'imposer une rponse ractive ou ngocie
A, et de limiter ainsi la varit de ses stratgies.
3. Stratgie constructive (ou du dtour)
Consiste dplacer le but courant momentanment afin de provoquer
un dtour (suppos constructif) qui nest pas ncessairement une
incidence, par exemple pour faire remarquer un oubli, une erreur, faire
une citation, rappeler un fait ancien, une exprience, etc. :
le but courant est mis en attente, ainsi que les buts initiaux,
un nouveau but b est pos,
linitiative peut tre partage.
Contrairement une incidence, un dtour ne ramne pas
ncessairement lchange initial, il peut laisser la conversation en
suspens ou conduire un autre dtour1.

Cette forme de dialogue tait trs utilise dans la Chine ancienne.

Modles formels du dialogue

21

4. Stratgie de coopration
Consiste tenir compte du but de son interlocuteur en lui proposant
une (ou des) solution(s) qui les amnent tous deux atteindre leurs buts, si
ces derniers ne sont pas incompatibles :
cela amne drouler un processus complexe valuer la
situation, prsenter une explication, ventuellement des
exemples, des aides ou des arguments pertinents et offrir un
choix ferm (parce que plus facile au plan cognitif pour la prise
de dcision), en maximisant lespace de concession,
en procdant par recherche dun optimum dans un espace de
possibles,
en accompagnant linterlocuteur jusqu la solution,
en largissant le but conversationnel si ncessaire,
5. Stratgie de ngociation
La ngociation peut se produire dans une situation o les buts sont
incompatibles et que les interlocuteurs veulent minimiser les concessions.
La ngociation procde sur un schma assez classique, par des squences
argumentatives (argumentation/rfutation) avec proposition dune solution
sous-optimale jusqu convergence ou constat dchec. La tactique locale
est de :
tenter dimposer son but ou accepter un compromis,
maintenir le but conversationnel,
pousser la ngociation le plus loin possible jusqu un but
acceptable bf,
Efficacit de la stratgie : une stratgie est efficace si la vitesse de
convergence des actes de parole vers le but final est optimale. Le critre
d'efficacit qui s'en dduit, est de rduire au maximum chaque tour de
parole, la distance au but final (il peut cependant y avoir des cartements
locaux pour viter de tomber dans des impasses ou provoquer des checs).
La pertinence dun acte de dialogue nonc linstant t par A (et donc
de la stratgie associe), est relative au but poursuivi par A mais aussi
relative pour B, au but que B poursuit de son ct. On distingue donc
deux cas, (a) partage et (b) concurrence :
dans le cas o le but est partag, la pertinence dun acte A de A
ladresse de B, doit amener A et B dans une situation de convergence (ou
les maintenir dans cette situation sils y taient dj) et contribuer les
rapprocher du but final,

22

Assises GdR I3 dcembre 2002

dans le cas o le but nest pas partag, on doit distinguer une srie de
scnarios possibles :
(a) soit A et B engagent une ngociation qui peut russir ou chouer, du
point de vue de lun ou de lautre (ou des deux),
(b) soit A et B restent sur leurs positions car lun des deux a abandonn
son but au profit de lautre ou a fait un dtour ;
dans les deux cas, la stratgie de A vis--vis de B est alors darriver
bA ou dempcher que B narrive bB. La pertinence des actions de A
peut prendre alors un sens ngatif pour B. Nous appelons cette pertinence
pertinence transactionnelle. Elle prend une valeur comprise entre 0 et 1 et
peut tre dfinie comme suit :
pertinence constructive :
Pc{A} = exp{-d[bA,effet(A)]}
o d est une distance2 qui mesure lcart entre le but recherch par A
et le but atteint par leffet de lacte A ; il suffit de considrer les effets
potentiels de lacte A pour juger de la pertinence et non de son excution
relle, puisquelle est relative au but de lnonciateur seul.
pertinence obstructive :
P~c{A} = 1-exp{-d[bB, effet(A)]}
ici A soppose la ralisation du but bB de B. d est une distance qui
mesure lcart entre le but recherch par B et le but atteint par leffet de
lacte A ; si cette distance est grande, lacte A aura t pertinent
puisquil loigne B de son but.
La conduite du jeu se fait alors chaque instant pour A en maximisant
Pc{A} et en maximisant P~c{A}. Les deux objectifs tant rarement
atteints simultanment il faut chercher un point dquilibre (dit quilibre
de Nash).

4 DISCUSSION GENERALE
Nous avons parcouru un ensemble de modles, des plus rigides aux
plus souples. Les plus rigides sappuient sur la structure du dialogue et
appellent des traitements descendants, les plus souples tentent de
sadapter au plus bas niveau des actes dialogiques, considrant le dialogue
2
La distance peut se mesurer par exemple en nombre de tours de parole pour atteindre le
but.

Modles formels du dialogue

23

comme un jeu ayant ses rgles et ses stratgies. Entre les deux se trouvent
des modles qui empruntent des mta-structures comme les plans et qui
projettent les actes sur dautres reprsentations comme les tats mentaux
ou les intentions, pour trouver un appui fonctionnel.
Les mthodes structurelles sont des mthodes essentiellement
descriptives et fonctionnelles, elles modlisent le comment dialoguer mais
non le pourquoi des intentions. Il nest pas possible de savoir quel but
poursuit le locuteur, ni quelle stratgie mettre en place pour amliorer
linteraction. Il est difficile galement de modliser des dialogues de
ngociation, ncessitant un niveau dargumentation volu. Cependant la
ralisation dapplications de DHM est relativement aise avec ces
mthodes qui peuvent tre implmentes par des automates et utiliser des
outils gnraux existants base de grammaires. De nombreux modles de
DHM ont t implments avec cette technique pour des applications de
renseignement. Mais ils montrent rapidement leurs limites dans des tches
dites innovatives qui ncessitent de nombreuses incidences, reprises,
mises en attente, et ngociations. Le plan daction ne peut pas tre
reprsent en extension dans ce type de tche, il en rsulte de nombreux
inattendus dialogiques et des ruptures qui d-structurent le dialogue.
Avec les modles de planification et les modles mentaux, on suppose
que les interlocuteurs construisent leurs dialogues autour dactions
coordonnes, en respectant des conventions normalises. On suppose en
gnral que le dialogue est la fois constructif (il conduit la
construction dun but partir des objectifs des interlocuteurs et
lenrichissement des connaissances mutuelles) et co-interactif (les acteurs
coordonnent leurs actions pour aboutir un certain but). La logique de
dialogue dveloppe est double, actionnelle et pistmique pour traduire
les hypothses sur les tats mentaux des conversants en terme de
croyances et dengagement. Les tats mentaux rsument ltat de
connaissance (croire), le contexte de laction (faire), les choix (pouvoir,
devoir) et les engagements (vouloir). A chaque instant du droulement du
dialogue, le modle fait lhypothse que le dialogue est dirig par les tats
mentaux qui sous-tendent les actes (intentions, choix, engagements, etc.).
Lapproche gnrale de ces modles est fonde sur la rationalit. On
suppose que les conversants sont conscients des buts quils poursuivent
(leurs dsirs sont rationaliss), matrisent les connaissances dont ils
disposent (ils savent les valuer, les faire partager, les remettre en
question, les rendre mutuelles, etc.) et respectent les conventions sociales
[4], [5] travers les rles quils jouent (et dont ils ont aussi conscience).
Dans le cadre du dialogue humain, on peut trouver une telle modlisation
trs limitative : elle ne fait pas, en effet, la place aux inattendus (la

24

Assises GdR I3 dcembre 2002

planification et lintention prennent une place dominante) et place les


dsirs sous le contrle de la rationalit (ces dsirs sont non seulement
rationaliss mais aussi conscients). Mais en DHM cette rduction peut
tre intressante dans la mesure o, malgr tout, elle assigne une place au
concept dtats mentaux et donc une composante cognitive dans un
dialogue pseudo-naturel. Le contrleur du dialogue a alors pour mission
de grer les actes de linterlocuteur refltant ses tats mentaux supposs.
Cette modlisation ne vise pas donner un comportement de type humain
la machine mais seulement lui fournir des lments logiques de choix
et des raisons dagir. On ne cherche pas donner des tats mentaux la
machine mais modliser les raisons ( cause de) daction de
linterlocuteur.
Avec les modles de jeu, on utilise une mtaphore reprise la fois des
jeux de langage de Wittgenstein [49] mais aussi de la thorie des jeux. Le
problme est de trouver la bonne mtaphore pour un cadre de dialogue
donn. Faut-il considrer linterlocuteur comme un tre logique ou un tre
de dsir ou un tre social ? Nous avons vu trois modles diffrents ce
propos, il en existe videmment dautres [50]. La question se pose aussi
pour la gnricit de ces modles : ne risque-t-il pas dy avoir un trop
grand nombre de jeux diffrents et partant autant de modles ? Au-del de
ces questions, lintrt de tels modles mtaphoriques est quils peuvent
apporter plus de prcision pour la mtaphore ou le domaine cibl - au prix
peut-tre de leur gnricit - que les autres modles.

5 CONCLUSION
Nous avons montr que toutes les thories de dpart empruntes au
monde pluridisciplinaire des sciences du langage et de la communication
ont t galement fcondes pour modliser le dialogue. Les chercheurs en
IA ont tent de combiner ces thories pour obtenir des modles efficaces
en empruntant des techniques et des paradigmes trs divers allant des
automates la logique en passant par la planification.

6 RFRENCES
[1]

A. Turing, Computing Machinery and Intelligence. Mind Vol. LIX, 1950.

[2]

H. Garfinkel. Studies in ethnomethodology. New Jersey, Prentice


Hall, Englendwood Cliffs, 1967.

Modles formels du dialogue

25

H. Garfinkel, H. Sacks, On formal structures of practical actions, in


Mc Kinney, J.C., Tiryakian, E.A. (Ed.) Theoretical Sociology.
Perspectives and Development, New York, Appleton Century Crofts,
337-66, 1970.
[4] H. Sacks, Everybody has to lie, in Sociological dimensions of
langage use, M.Sanchez et B.Blount (Ed.), USA, New York,
Academic Press, 1975.
[5] E.A. Shegloff, G. Jefferson, H. Sacks, The preference for selfcorrection in the organisation of repair in conversation. Language,
53, p. 361-382, 1977.
[6] E.A. Schegloff, Sequencing in conversational openings, American
anthropologist, N70, p.1075-95, 1968.

[3]

[7]
[8]

E. Goffman, Forms of talk. Oxford, Basil Blackwell ed., 1981.


L.S. Suchman, Plans and Situated Actions, Cambridge University Press,
1987.

[9]

J.L. Austin, How to do Things with Words. Oxford University Press,


1962. Version franaise : Quand dire, cest faire. Edition du Seuil, Paris,

1970.
[10] J. Searle, Speech Acts. Cambridge University Press, UK., 1969. traduit de
langlais Actes de langage, Hermann ed., Paris, 1972.
[11] J Searle, Intentionality. Cambridge: Cambridge University Press, 1983.
[12] J. Searle, D. Vanderveken, Foundations in illocutionary logic. Cambridge
University Press, 1985.
[13] H.P. Grice, Logic and Conversation. in P. Cole and J.L. Morgan eds. Syntax
and Semantics, vol. 3, Academic Press, p. 41-58,1975.
[14] D. Sperber, D. Wilson, Relevance : communication and cognition. Basil
Blackwell ed., Oxford, 1986.
[15] E. Roulet, Larticulation du discours en franais contemporain. Peter Lang
d., Berne, 1985.
[16] J. Moeschler, Modlisation du dialogue, reprsentation de l'infrence
argumentative. Herms d., 1989.
[17] J.

Moeschler, A. Reboul, Dictionnaire


pragmatique, ditions du Seuil, Paris, 1994.

encyclopdique

de

[18] D. Luzzati, Recherches sur le dialogue Homme-Machine: modles


linguistiques et traitement automatique. Thse d'Etat, Paris III, 1989.
[19] E. Bilange, Dialogue personne-machine, d. Herms, Paris, 1992.
[20] G. Sabah, lIA et le langage, d. Herms, Paris, 1989.

26

Assises GdR I3 dcembre 2002

[21] A. Vilnat, L. Nicaud, Un systme de dialogue homme-machine :

STANDIA. Actes du sminaire Dialogue


Communication homme-machine, Dourdan, 1992.

du

GdR-PRC

[22] J. Lehuen Un modle de dialogue dynamique et gnrique intgrant


lacquisition de sa comptence linguistique. Thse de doctorat de
luniversit de Caen, 1997.
[23] D. Luzzati, Le dialogue verbal homme-machine. Masson d., Paris, 1995.
[24] J.F. Allen, CR Perrault. Participating in Dialogues Understanding via Plan
Deduction. In: Proceedings of the 2nd National Conference of the Canadian
Society for Computational Studies of Intelligence, Toronto, Canada, 1978.
[25] P.R. Cohen, On knowing what to say : Planning speech acts. Ph.D.

Thesis, Technical Report n118, Department of Computer Science,


University of Toronto, January 1978.
[26] J.F. Allen, C.R. Perrault. Analyzing intentions in utterances.
Artificial Intelligence, 15(3), p. 143-178, 1980.
[27] J. Allen. Recognizing Intentions From Natural Language Utterances. In:
Computational Models of Discourse Chapter 2 (M Brady and R Berwick
eds.), Cambridge, MA: MIT Press, 1982.

[28] M. Bratman, Intentions, plans and practical reason. Cambridge MIT


Press, 1987.
[29] B Grosz, C Sidner. Plans for Discourse. In: Intentions in Communication (J
Morgan, P Cohen, M Pollack eds.), Cambridge, MA: MIT Press, 1989.

[30] M. Guyomard, P. Nerzic, J. Siroux. Plans mtaplans et dialogue.


Actes de la 4me cole dt sur le Traitement des langues naturelles.
Lannion, 1993.
[31] D.R. Traum, JF Allen, PA Heeman, CH Hwang, N Martin, M Poesio, LK
Schubert. Integrating Natural Language Understanding and Plan Reasoning
in the TRAINS-93 Conversation System. Unpublished Manuscript,
Computer Science Department, University of Rochester, 1996.
[32] H.J. Nilsson. Principles of artificial intelligence. Tioga ed., Palo

Alto, CA, USA, 1980.


[33] R. Wilensky. Planning and Understanding. A computational
approach to human reasoning. Reading, Addison-Wesley Publishing
Company, 1983
[34] D.J. Litman, J.F. Allen. Discourse processing and commonsense
plans.in P.R. Cohen, J.L. Morgan, M.E. Pollack (eds.), Intentions in
communication. Cambridge MIT Press, 1990.
[35] S. Carberry, Plan Recognition in Natural Language Dialogue, MIT
Press, Cambridge, 1990.

Modles formels du dialogue

27

[36] P. Nerzic. Erreurs et chec dans le dialogue oral homme-machine:


dtection et rparation. Thse de doctorat de luniverist de Rennes,
1993.
[37] M.E. Pollack, Plans as complex mental attitudes. In Intentions in
Communications. Bradford/MIT Press, Cambridge, Mass. 1990.
[38] D. Sadek, Attitudes mentales et interaction rationnelle : vers une
thorie formelle de la communication. Thse de doctorat de
luniversit de Rennes I (IRISA), 1991.
[39] D. Sadek. Le dialogue homme-machine : de lergonomie des
interfaces lagent intelligent dialoguant. OFTA, ARAGO 18
Nouvelles interfaces homme-Machine, Lavoisier d., Paris, p. 277321, 1996.
[40] J. Levin, J. Moore, Dialogue-games : meta-communication structure
for natural language interaction. Cognitive sciences, 1(4), p. 395420, 1980.
[41] M. Baker. A model for negociation in teaching-learning dialogues.
Journal of Artificial Intelligence in Education, 5(2), p. 199-254,
1994.
[42] J.L. Dessalles. Modle cognitif de la conversation spontane
appliqu lapprentissage. Thse de doctorat de lENST, Paris,
1993.
[43] N. Green, S. Carberry, Conversational implicatures in indirect replies. Proc.
of the Annual Meeting of the ACL, p. 64-71, 1992.
[44] E.A. Hinkleman, J.F. Allen, Two constrainsts of speech act interpretation.
Proc. of the ACL, p. 212-219, 1989.
[45] I. Zuckerman, Content planning based on a model of a users beliefs and
inferences. Proc. of the Third international Workshop on User Modeling, p.
162-173, 1992.
[46] D. Vernant, Modle projectif et structure actionnelle du dialogue informatif.
in Du dialogue, Recherches sur la philosophie du langage, Vrin d., Paris,
n14, p. 295-314, 1992.
[47] D. Vanderveken, La logique illocutoire. Mandarga d. Bruxelles,

1990.
[48] J. Caelen, A.L. Frchet. Attitudes cognitives et actes de langage. in
Du dialogue, Recherches sur la philosophie du langage, Vrin d., Paris,
n14, p. 19-48, 1992.

[49] L. Wittgenstein, Philosophical Investigations. Oxford University


Pres, London, England, 1953.

28

Assises GdR I3 dcembre 2002

[50] N. Maudet, Modliser les conventions des interactions langagires :


la contribution des jeux de dialogue. Thse de doctorat de
luniversit Paul Sabatier, Toulouse, 2001.

Das könnte Ihnen auch gefallen