Sie sind auf Seite 1von 5

266

cahiers de lexicologie no98

SCHRYVER Gilles-Maurice de (dir.), A Way with Words : Recent Advances in Lexical Theory and Analysis. A Festschrift for Patrick Hanks, Kampala, Menha Publisher, 384p. (coll.Menha Linguistics Series, 2010) ISBN 978-99-7010-101-6.
Louvrage est un hommage Patrick Hanks, linguiste et lexicographe. Il rassemble des articles signs de chercheurs reconnus par la communaut internationale dans le domaine du lexique (lexicologues et lexicographes)2. Le volume souvre sur une introduction de G.-M.Schryver, diteur scientifique du volume. En quelques pages, il rappelle les apports majeurs des travaux de Patrick Hanks. la suite de John Sinclair, P.Hanks a opt pour une lexicographie de corpus, affirmant que le sens des mots existe, mais en contexte seulement, quil consiste en un groupe dlments smantique, et que les dictionnaires ne dcrivent que des potentiels smantiques et non pas des sens. Les publications les plus clbres de Hanks sont celles qui tournent autour de lide que des mesures statistiques sur les collocations sont des outils fondamentaux pour dcrire le sens des mots. Larticle se poursuit ensuite par un historique de la carrire de P. Hanks, qui la amen la thorie des normes et exploitations (Theory of Norms and Exploitations). Il tablit ainsi que deux systmes de rgles rgissent les comportements linguistiques: lun gouverne la phrasologie normale et les mots en usage, lautre permet aux locuteurs lutilisation de la phrasologie normale dans des utilisations plus cratives. Pour clore larticle, Shryver revient sur les publications de Hanks. Louvrage se divise en trois grandes parties : il prsente dabord les aspects thoriques de la lexicographie, puis les aspects computationnels de la discipline, et consacre la dernire partie lanalyse lexicale et la rdaction de dictionnaires. Premire partie: Aspects thoriques John Sinclair est gnralement reconnu comme le pre fondateur de la lexicographie moderne qui sappuie sur une thorie de la linguistique de corpus. Larticle Defining the definiendum, qui ouvre le volume, est rest inachev. La version publie est date d peine deux semaines avant sa mort et na pas t modifie. Cet article essaie de montrer ce que lon devrait entendre par dfinir. Pour J. Sinclair, dfinir, cest spcifier les limites, les frontires dune unit lexicale plus que dcrire son sens. Aussi, lauteur, en sappuyant sur la linguistique de corpus, donne toute leur place aux expressions idiomatiques, et considre quun definiendum doit tre un item lexical (et non un mot), cest--dire un segment de texte laquelle on attribue un sens. Les tudes de corpus montrent quil est absurde de considrer que le sens gnralement considr par les dictionnaires comme le sens principal (core sense) dun item lexical est le sens le plus frquent. En effet, les locuteurs (sans doute sous linfluence) des dictionnaires) considrent le sens concrets des items lexicaux comme le sens principal, ce qui nest pas le cas si on observe lusage. Ensuite, Sinclair montre comment on peut dcrire le sens ditems lexicaux en utilisant des grammaires locales numrant les constructions dans lesquelles les mots apparaissent et prennent un sens diffrent du sens habituellement considr comme principal. Yorick Wilks republie une communication des annes 1970 sur la prfrence smantique: Very Large Lexical Entries and the Boundaries Between Linguistic and Knowledge Structure, dans la ligne des travaux de Minsky (1975).
2

La distinction entre lexicologie et lexicographie est rarement observe par les linguistes de langue anglaise, et ces deux versants sont convoqus au mme titre dans ces Mlanges.

comptes rendus

267

Le problme pos est celui de la quantit dinformations que les entres lexicales dun systme de comprhension automatique du langage doivent contenir, et surtout, celui de la gestion des emplois dont le sens va au-del de ce qui est habituellement dcrit dans un lexique. Wilks montre, en utilisant lexemple de la phrase Ma voiture boit beaucoup dessence, comment la violation dune contrainte smantique (ici le fait que le sujet du verbe boire nest pas un anim, comme on lattend en gnral) peut tre gre par un systme automatique en utilisant un pseudo-texte (PT). Larticle de James Pustejovsky et Anna Rumshisky, Mechanisms of Sense Extension in Verbs, tudie les mcanismes qui permettent de relier les diffrents sens dun prdicat. Quel que soit le degr de mtaphorisation des diffrents sens, la manire dont ils sont relis entre eux est un objet dtude pertinent. La coercition de type3, telle quelle est dcrite dans la thorie du lexique gnratif, nest pas le seul moyen de dcrire les extensions de sens des prdicats. Les diffrents sens proviennent de divers processus oprant sur les prdicats, tels que la gnralisation du type des arguments, le changement dans la prominence relative des arguments ou labstraction du sens noyau du prdicat lui mme. Tous ces phnomnes sont dcrits au travers dexemples qui permettent de voir clairement tous les sens intermdiaires entre le plus concret et le plus abstrait. Igor Meluk, dans The Government Patterns in the Explanatory Combinatorial Dictionary, revient sur certains aspects de la thorie Sens-Texte, et sur des notions fondamentales lies aux dictionnaires explicatifs et combinatoires quil a dvelopps dans les dernires dcennies. Il explique plus particulirement les notions de gouvernement et de patron de gouvernement (Government Pattern). Une unit u1 gouverne une unit u2: soit si la forme morphologique de u2 dpend de proprits intrinsques de u1 (et non de sa forme); soit si u1 slectionne un lexme u2 (et non un grammme); soit si u1 slectionne une unit lexicale u2 dun type grammatical particulier. Un patron de gouvernement contient alors quatre lments: la diathse de lunit lexicale; des lments de structure syntaxique de surface correspondant aux actants de structure profonde; des moyens linguistiques dexpression de surface des actants syntaxiques profonds; et enfin des contraintes sur lexpression des actants syntaxiques de surface. David Wiggins, dans son article The Paradox of Analysis and the Paradox of Synonymy, revient sur un problme connu: si on peut remplacer sans consquence un mot (analysandum) par une priphrase (analysant), alors lanalyse est triviale. Sil y a une diffrence, alors lanalyse est fausse. Concernant la synonymie, le problme est proche. Wiggins revient alors sur le problme pos par Frege propos de ltoile du matin qui est aussi ltoile du soir, et conclut aprs avoir expliqu ses relations avec P. Hanks: on napprend pas quel concept correspond un mot, mais on cherche un mot pour exprimer un concept. Le paradoxe de la synonymie montre que chaque mot qui entre dans la langue cre sa propre niche. Deuxime Partie: Calculer les relations lexicales Larticle de Kenneth W. Church, More is More, pose le problme de la qualit des corpus. Doivent-ils tre calibrs? Doit-on les nettoyer? Aujourdhui, malgr les protestations de certains, comme Adam Kilgarriff, le choix a t fait: on privilgie la
3 Opration qui consiste forcer et donc modifier le type smantique de largument dun prdicat dans certains cas de polysmie.

268

cahiers de lexicologie no98

quantit et non la qualit. Les corpus doivent tre volumineux, mais pas forcment chantillonns ou nettoys, et pour Church, ce choix est raisonnable: plus, cest plus, malgr les critiques de la Google-ologie4. Gregory Grefenstette sintresse, dans larticle Estimating the Number of Concepts, aux expressions composes de plusieurs mots. En effet, si les outils de traitement automatique des langues peuvent grer les mots simples, ils ne sont souvent pas au point concernant la phrasologie, les mots composs, les expressions figes. Les concepts exprims par plusieurs mots sont en nombre inconnu. Aprs avoir dcrit la mthode avec laquelle il analyse les pages web, et en montrant les rserves faire la concernant, G.Grefenstette estime le nombre de concepts exprims par des expressions de deux mots environ 233millions. Larticle de David et Louise Guthrie, Identifying Adjectives that Predict Noun Classes, montre lutilit des adjectifs dans une tche de prdiction de la catgorie smantique du nom quils modifient. Les auteurs utilisent un ensemble de 29classes de noms, et augmentent les corpus existants grce une technique non supervise dannotation des syntagmes nominaux. Il est clairement dmontr que lutilisation de trs gros corpus est fondamentale ici, et il apparat que ltude des adjectifs entourant le nom permet de les dsambiguser efficacement. Alexander Geyken tudie, dans Statistical Variation of German Support Verb Construction in Very Large Corpora, des constructions verbe support en allemand, dites constructions verbes-nominalisation (dsormais NVG). Il essaie, en tudiant de trs grands corpus, de savoir si (1) le nombre de NVG augmente avec la taille des corpus tudis (autrement dit, si la classe est potentiellement infinie) et (2) ce que donne la comparaison entre les NVG trouves en corpus et celles quon trouve dans les grands dictionnaires papier. Ltude montre quun corpus doit compter au moins 100millions de mots pour permettre une relle observation et constituer la base dune bonne tude lexicographique: en dessous, on ny trouve pas de faon significative les NVG recenses dans les dictionnaires. Ltude montre aussi quune tude de corpus est indispensable pour complter les entres des dictionnaires imprims. Larticle de Karel Pala et Pavel Rychl, A Case Study in Word Sketches Czech Verb vidt see, tudie le schma (sketch) du verbe tchque voir (vidt) en corpus. Les schmas ont pour but daider les lexicographes relever en corpus les cooccurrences des units lexicales afin de dcider lesquelles inclure dans un dictionnaire. partir dun travail ralis avec le Sketch-Engine de Kilgarriff5 et du rsultat obtenu pour ce verbe, soit un document dune page, contenant le schma du verbe tudi, Pala et Rychly tirent les enseignements des erreurs contenues dans ce schma. Le premier type derreurs provient du mauvais tiquetage du corpus, le second de rgles de grammaires manquantes ou incorrectes (parfois, de la combinaison des deux facteurs). Il semble donc ncessaire damliorer les performances des tiqueteurs en augmentant la taille des donnes dentranement et en combinant des mthodes statistiques et symboliques. Dans leur article The Lexical Population of Semantic Types in Hankss PDEV, Silvie Cinkov, Martin Holub et Lenka Smejkalov rapportent une analyse du Pattern
4 5 google-ology dans le texte. A.Kilgarriff est lun des plus grands noms de la lexicographie internationale. Il est reconnu pour ses travaux lintersection de la linguistique de corpus, la lexicographie et la linguistique informatique.

comptes rendus

269

Dictionary of English Verbs (PDEV), ralis entre autres par Patrick Hanks. Le PDEV a pour but de faire correspondre des sens des schmas dusage des verbes. Lide du travail dcrit ici est dassigner des types smantiques aux noms qui cooccurrent avec les verbes. Le rsultat permet dassocier des verbes au type smantique le plus probable. Il permet aussi de reprer les dsaccords entre annotateurs, et terme, il permettra daugmenter le PDEV. Elisabetta Jezek et Francesca Frontini, dans larticle From Pattern Dictionary to Patternbank, dcrivent le lien entre les types smantiques (TS) associs aux arguments des verbes et leurs dfinitions (LS, pour lexical sets). En analysant les discordances entre les TS et les LS, les auteurs proposent dtendre la mthode labore par P. Hanks, la Corpus Pattern Analysis (CPA), et lappliquent la construction dune patternbank pour litalien, cest--dire une base de donnes dans laquelle on trouve les schmas des diffrents verbes (informations smantiques et syntaxiques sur les arguments des verbes). Troisime partie: Analyse lexicale et rdaction de dictionnaires Dans Words that Spring to Mind: Idiom, Allusion, and Convention, Rosamund Moon prsente une tude en corpus de lexpression anglaise Spring to mind (venir lesprit). Lauteur dcrit le traitement lexicographique de cette expression, en classe les diffrentes utilisations et en commente certains usages. Elle conclut par les gnralits suivantes, en accord avec les thories de P. Hanks: les mots et les expressions nont pas seulement le sens que dcrivent les dictionnaires; mme leurs occurrences a priori dviantes doivent tre prises en compte car elles font partie des utilisations des units lexicales et permettent la description complte de schmas dusage. Sue Atkins, dans larticle The DANTE Database: Its Contribution to English Lexical Research, and in Particular to Complementing the FrameNet Data, dcrit les deux bases lexicales, DANTE (Database of Analysed Texts in English), qui contient environ 42000 entres lexicales, et Framenet, qui en contient environ 10000. Elle note quune partie des informations contenues dans les deux bases se recoupent (unit lexicale, catgorie grammaticale, expressions avec des verbes support), et que les autres informations pourraient se complter (collocations, par exemple, pour DANTE et rles smantiques pour Framenet), et conclut quil semble possible (et utile), de trouver un moyen dunifier automatiquement ces deux bases de donnes afin den crer une seule, plus complte. Larticle dAdam Kilgarriff et Pavel Rychl, Semi-Automatic Dictionary Drafting, revient sur la thorie Norms and Exploitation de P. Hanks et montre quelle peut tre utilise, avec un grand corpus, afin damliorer les techniques automatises de dsambigusation des mots. Les auteurs prsentent un logiciel, SADD, allant dans ce sens. Paul Bogaards pose la question de lexistence dune thorie lexicographique dans larticle Lexicography: Science without Theory?. Il semble en effet communment admis quil nexiste pas rellement de thorie en lexicographie, mme si la cration dun dictionnaire ncessite une thorie linguistique, une thorie psycholinguistique et une thorie de linformation, afin que les donnes lexicales soient dcrites de faon tre comprises par le lecteur. Cela rend la lexicographie dpendante dautres disciplines, ce que Bogaards ne considre par forcment comme souhaitable. Finalement, selon lui, peu importe les thories utilises si le but reste le mme: crire de bons dictionnaires. Mirosaw Bako, dans The Polish COBUILD and its Influence on Polish Lexicography, revient sur les origines du COBUILD polonais (ISJP). Il raconte comment, aprs avoir dcouvert le COBUILD anglais dont P. Hanks est lorigine, il a travaill de faon produire le mme type douvrage pour le polonais. Il revient sur les cueils viter,

270

cahiers de lexicologie no98

et pour finir, expose ce qui diffrencie le COBUILD de P. Hanks et le ISJP, particulirement le fait quil soit destin des locuteurs natifs. Jonathon Green republie un article de Critical Quaterly: ARGOT: The Flesh Made Word. Il considre que cet article est celui quil aurait crit sil avait pu satisfaire la demande de P.Hanks, qui lui avait demand une histoire de largot franais pour son Encylcopdie du langage et de la linguistique (Encyclopedia of language and Linguistics). Il revient sur ltymologie incertaine du mot, sur ses premires attestations, et son histoire du xvesicle aujourdhui, mme si certains affirment quil na pas survcu la seconde guerre mondiale. Larticle de Michael Rundell, Defining Elegance, porte sur la notion dlgance en lexicographie. Il revient sur le sens du mot, plutt positif, son tymologie, et son importance dans tous les domaines, mme dans les sciences dites dures. En lexicographie, un dictionnaire doit tre la fois concis, informatif et comprhensible pour tre qualifi dlgant. Rundell revient alors sur ce que signifie lgance du point de vue de la microstructure et de la macrostructure du dictionnaire, et termine par des lments plus gnraux: le fait, entre autres, que la vision des dictionnaires a chang avec limportance grandissante des dictionnaires lectroniques, et que llgance consiste tenir compte du fait que lutilisateur nest pas linguiste. Dans lensemble, cet impressionnant ouvrage aborde tous les domaines qui touchent au lexique, grce des articles trs thoriques ou au contraire trs pratiques et concrets. Il constitue par consquent un ouvrage de rfrence pour des lecteurs dj aguerris dans le domaine de la lexicologie/lexicographie. Hlne Manulian LDI (UMR 7187) Universit de Cergy-Pontoise et Universit Paris 13 Nord helene.manuelian@u-cergy.fr
Lauteur du compte rendu remercie John Humbley de lui avoir transmis les notes quil avait prises sur cet ouvrage.

Das könnte Ihnen auch gefallen