Sie sind auf Seite 1von 16

Langues et cultures, systmes et traduction

SYLVIANE CARDEY (France), HELENA MORGADINHO (France), ALEKSANDRA DZIADKIEWICZ (Pologne), SOMBAT KHRUATHONG (Thalande), HSIANG-I LIN (Taiwan), KYOKO KURODA (Japon), GINA MELIAN (Roumanie), FAROUK BOUHADIBA (Algrie), DUYGU CAN (Turquie), EUN SOON YU (Core), XIAOHONG WU (Chine), IGOR SKOURATOV (Russie), VALENTINE GROSJEAN (France), GABRIEL SEKUNDA (Pologne), IZABELLA THOMAS (Pologne), YVES GENTILHOMME (France), NAGA ANURADHA CHINTALAPUDI (Inde), ROSITA CHAN (Panama)
Universit de Franche-Comt, Besanon, France sylviane.cardey@univ-fcomte.fr

RESUME Nous essaierons dans cet article de mettre en regard des langues de mme et diverses origines afin de montrer leurs points communs et leurs diffrences (concernant leur fonctionnement dans un but de traduction). Ceci nous amnera revoir la notion de mot , de parties du discours . Nous pourrons montrer aussi combien la perception du monde travers les civilisations joue son rle dans lorganisation des langues (les traces du pass dans la pense en sont des tmoins comme le montrent les proverbes et autres composs). Larabe, le chinois, le coren, lespagnol, le franais, litalien, le japonais, le polonais, le portugais, le roumain, le russe, le sanskrit, le tha et le turc serviront de base nos remarques et tudes. Toutes ces remarques nous conduiront, travers des exemples, la traduction en gnral et la traduction automatique ou aide (dictionnaires) la traduction en particulier. ABSTRACT In this paper we compare languages having the same origin and others with different roots so as to demonstrate what they have in common and how they differ for the purpose of machine translation. In doing so, we will revisit the notions of 'word' and 'part of speech'. These comparisons demonstrate how different are the views of the world through civilisations, and their impact on the structure of languages (compounds, idioms, proverbs will served our demonstration). Arabic, Chinese, French, Italian, Japanese, Korean, Polish, Portuguese, Romanian, Russian, Sanskrit, Spanish, Thai and Turkish will be at the basis of our studies. These comparisons aim at showing through examples how dictionaries should be organised and how to obtain acceptable translations made by machine. MOTS-CLES/KEYWORDS traduction multilingue, dictionnaires, parties du discours, segments, phrasologie 1. Introduction Les recherches sur lorigine et la filiation des langues sont nombreuses et ont provoqu maintes polmiques. Les linguistes, il est vrai travaillent souvent sur trs peu de langues la fois. Des comparaisons ont t faites au niveau du lexique (comparaison des formes et volution phontique), de la syntaxe, de la morphologie en vue dessayer de retrouver la filiation des langues. Les tudes nont pas beaucoup port sur des units de types phrasologismes (proverbes, dictons et autres) que nous verrons galement dans le cadre de cet article. Notre but est de comparer 14 langues. Nous verrons ainsi que le mot, unit de sens, na plus grand sens quand on le met la lumire de diffrentes civilisations avec diverses faons de penser. Les catgories grammaticales, parties du discours, que nous utilisons pour les langues latines voire indo-europennes ont souvent du mal trouver un quivalent dans dautres langues et vice versa. Pour terminer nous proposerons une faon de voir les dictionnaires multilingues et la traduction automatique. Des langues telles que larabe, le chinois, le coren, lespagnol, le franais, litalien, le japonais, le polonais, le portugais, le

roumain, le russe, le sanskrit, le tha et le turc vont tre tudies travers diffrents filtres ou analyses. 2. Langues et familles de langues, que trouve-t-on dans la littrature ? Si nous reprenons rapidement les travaux faits pour classer ces langues, on peut peu prs dire que le turc appartiendrait au groupe altaque qui inclut aussi le coren et le japonais. Litalien, lespagnol, le franais, le roumain, le portugais sont classs parmi les langues romanes drives du latin de la branche italique de la famille indo-europenne laquelle serait aussi rattachs le russe et le polonais par la branche slave elle mme drive du balto-slave. Le chinois, langue de la famille sino-tibtaine est la plus ancienne aprs le sumrien et la plus parle au monde (environ un milliard de personnes parleraient le chinois mandarin). Le tha appartient la famille austro-tha. Larabe est une langue smitique de la famille afro-asiatique. Le sanskrit est la langue connue la plus ancienne de la famille indo-aryenne, branche de la famille indo-europenne. Lorigine et les groupements par familles tant toujours en dbat, les thories diverses, nous ne poursuivrons pas cette description qui nest pas lobjet de ce travail. 3. La notion de mot Selon le niveau de description dans lequel on se place, niveau phontique-phonologique, niveau orthographique-graphmique, niveau morphologique, niveau lexico-smantique ou encore syntaxique, un mot peut prendre des caractristiques varies voire trs souvent contradictoires. Au lieu donc dessayer de trouver la seule et unique bonne dfinition du mot, nous montrerons travers diffrentes langues comment cette notion apparat lcrit. Aussi pourrions-nous peut-tre reprendre les notions de mots et de mots formes (le mot tant une reprsentation canonique de mots-formes ou variations), mais ceci sera-t-il suffisant ? Nous verrons comment les units de sens sont reprsentes travers les langues. Nous nous placerons dans le cadre de la traduction automatique qui va demander des rgles de description prcises pour analyser la langue avec une machine qui elle ne comprend rien. Tout ceci nous amnera parler plutt de segments que de mots . Nous savons que le problme en traduction relve du sens plus que de la notion de mot, cependant en traduction automatique tout part de reprsentations tangibles que la machine va devoir lire et calculer, il en est de mme dailleurs au dpart pour le traducteur humain devant son texte. Quelle que soit la langue tudie dans un but de traduction, nous avons besoin avant tout de reconnatre des formes, des segments partir desquels la traduction va pouvoir commencer et uniquement commencer. travers des exemples, nous allons essayer de voir comment certaines langues sorganisent afin de mettre en vidence les segments sur lesquels travailler lors de la traduction automatique ou assiste. 3.1. Les segments ou mots dune langue lautre 3.1.1. Dans les langues romanes, si lon ny prend pas garde, pomme de terre nest pas reconnu par lordinateur comme un ensemble mais comme trois units indpendantes. A linverse la langue espagnole est dote dunits composes qui ressemblent des units simples : Saltamontes : compos form par la concatnation du verbe salta et du substantif montes On retrouve ces deux types de compositions en roumain : untdelemn : unt (beurre) + de (de) + lemn (bois) qui signifie en franais : huile floarea-soarelui la fleur du soleil, tournesol

Lenclise ou la contraction dans les langues romanes sont autant de phnomnes quil faut pouvoir reconnatre. 3.1.2. Les langues slaves prsentent la particularit de rattacher des morphmes marqueurs de personnes (m, -!, -!my, -!cie) aux diffrentes parties du discours : Ciekawi!my. = Nous sommes curieux Le morphme !my, premire personne du pluriel, se rattache directement ladjectif, en loccurrence, masculin du pluriel ciekawi. Les morphmes marqueurs de personnes peuvent se rattacher de la mme manire dautres parties du discours (pronoms personnels, adverbes, pronoms interrogatifs). 3.1.3. En turc les mots composs forment un seul mot ; lorsquune voyelle se trouve la fin du premier mot et au dbut du second, lune delles disparat pour donner une seule forme Cuma ertesi Cumartesi 3.1.4. En arabe, un mot est constitu la base par une racine compose essentiellement de deux (atypique), trois (trilitre), majoritairement, quatre (quadrilitre) consonnes au sein desquelles sont insres des voyelles appeles voyelles thmatiques. Cette racine avec les voyelles insres vont constituer un schme ou un thme . Pour illustrer cette composition morphologique du mot en arabe, la racine <ktb> qui reprsente le sens global d crire , des voyelles thmatiques vont tre insres pour construire des schmes tels que : kataba : il a crit kitaab : livre Chaque racine nous donne un sens : <ktb> ide dcrire <rnn> ide de sonner Une des particularits de la langue arabe est de faire usage de doublets smantiques qui sont des synonymes utiliss gnralement en fin de phrase et qui se traduisent souvent par un seul mot dans la langue cible. la tu9add wa la tuhSa (pas compte et pas value) traduction : qui ne peut tre value et non pas qui ne peut tre compte ni value . 3.1.5. Dans les langues asiatiques analyses, cerner la notion de mot quivaut sinterroger sur la notion de syllabe. Cette notion de syllabe est difficile dfinir car elle varie selon la langue. En tha une syllabe a besoin de 3 lments pour former une unit smantique : une consonne initiale, une voyelle et un tonme. La consonne finale nest pas obligatoire. En chinois deux termes sont lis la notion de mot : ! (z) et " (c). Un ! (z) est un caractre (donc monosyllabique), tandis quun " (c) peut tre monosyllabique, dissyllabique ou polysyllabique. Autrement dit, un " (c) peut tre compos dun ou de plusieurs ! (z). Un " (c) est une unit smantique indpendante, pouvant tre traduit par mot en franais alors quun ! (z) est parfois un mot, parfois un morphme (dans ce dernier cas il ne peut pas fonctionner seul). De plus, " (c) englobe deux notions : #$" (d"n chn c : mot simple) et %&" (h chng c : mot compos). La plupart des mots simples chinois sont monosyllabiques.

En tha, les mots simples ou mots fondamentaux sont dominante monosyllabique. Chacun deux reprsente un concept simple. Un mot compos se constitue par juxtaposition de concepts simples, sans aucun espace entre eux. /baj-1/ (feuille) + /klua:j-3/ (bananier) = /baj-1+ klua:j-3/ (feuille de bananier) Le vocabulaire du tha se forme principalement par juxtaposition de concepts simples. Deux noms tha peuvent tre juxtaposs pour composer un nouveau nom. En gnral, les composs tha ont le mot tte gauche. Les mots dpendants stendent droite. Cependant, il existe une masse de termes emprunts ultrieurement au Pli et au Sanskrit qui utilisent la procdure inverse. Comme en chinois, en tha, si lordre des mots est invers alors apparaissent de nouvelles significations. /pva:n-3//lu:k-3/ : ami/amie de (ma) fille ou de (mon) fils /lu:k-3//pva:n-3/ : enfant de (mon) ami ou de (mon) amie Les langues asiatiques s'crivent de gauche droite, mais le chinois ( Taiwan), le japonais et le coren peuvent aussi scrire de haut en bas. Il n'y a pas de marques de sparation de mots sauf en coren ; les mots composs ne sont pas spars. Il n'y a pas de majuscules, ce qui reprsente une difficult majeure dans la segmentation automatique, la distinction entre noms propres et noms communs nest pas simple. Finalement nous terminerons simplement en disant quun segment , un mot a une fonction et un sens lorsquil peut tre reconnu, analys et traduit.

4. Les parties du discours Dans la grammaire traditionnelle des langues latines, on cite en gnral les 9 parties du discours suivantes : adjectif, adverbe, article, conjonction, interjection, nom, prposition, pronom, verbe. Cependant il existe des divergences selon les langues : en Sanskrit, il y a 5 parties du discours : nom, verbe, adjectif, adverbe et prposition. Cest une langue prive darticles et de pronoms relatifs comme le chinois, le japonais et le coren ; en turc, il y a deux grandes catgories, le verbe et le nom. Les noms peuvent prendre de multiples fonctions, adverbe, interjection, pronom, conjonction, etc. ; en chinois, en japonais et en coren, il ny a pas dadjectifs possessifs ni de pronoms relatifs ; en tha, le pronom relatif est calqu sur la grammaire anglaise ; en coren pour traduire la neige qui tombait on utilise la racine du verbe laquelle on adjoint une terminaison relative. Le pronom relatif est exprim laide de terminaisons correspondantes qui sajoutent aprs le radical (racine) des verbes daction, de qualit ou dtat (adjectif).

en tha pour exprimer la possession, on peut employer la prposition kh@:ng-1 prcde dun nom et suivie dun nom ou pronom. dans les langues asiatiques, il nexiste pas darticles. Dans certains cas labsence est comble par lemploi de classificateurs pour indiquer la classe smantique laquelle appartient un terme. Cas sans article : /chan-5+mi ;-1+nang-5sv/ moi + avoir+livre(s) Pron+V+N S+V+COD /chan-5+mi ;-1+nang-5sv :-5+lem-3+nvng-2moi+avoir+livre+1+Cl/ Pron+V+N+classificateur pour livre+Nbr S+V+COD+classificateur pour livre+ Nbr

les langues slaves ont majoritairement les mmes parties du discours que le latin. Par rapport aux langues romanes, on note labsence darticles dfinis et indfinis, ce qui pose problme en traduction automatique. Les units qui ne correspondent pas aux catgories grammaticales traditionnelles sont regroups dans la catgorie appele particules : les particules interrogatives (czy en polonais, !" en russe) les particules expressives (no, #e en polonais, $%, &' en russe) qui sont difficiles traduire puisquelles expriment des attitudes, des sentiments ()" &' *+),! Viens donc ici ! No, no ! Dis-donc ! Ca alors !

5. Remarque conclusive Nous voyons clairement que ce qui pose problme dans le cadre de la traduction automatique est le reprage des segments et la grande divergence de catgories de discours dune langue lautre. Les moyens linguistiques utiliss pour remplir certaines fonctions sont trs varis et parfois certains lments qui nexistent pas dans une langue sont indispensables dans une autre. 6. La phrasologie 6.1. Les phrasologismes pragmatiques On peut dire peu prs quun phrasologisme est une formule avec une structure linguistique fixe par lusage et utilise conventionnellement dans des situations pragmatiques dtermines comme par exemple : Auriez-vous lamabilit / la bont de? Y a moyen que tu (me prtes 10 euros)? (registre familier) Merci de (bien vouloir)+infinitif 6.1.1. lacte de requte Lacte de requte est une manifestation verbale du dsir dobtenir de la part du destinataire du message une raction qui soit bnfique pour lmetteur. Chaque langue a un stock de formules indirectes conventionnelles et de termes dadresse qui permettent dattnuer la requte et de raliser

les principes de la politesse. Nous allons voir comment ces formules sont construites dune langue lautre. 6.1.1.1. en franais Peux-tu me passer le sel ? Tu veux pas me passer le sel ? Veuillez me confirmer votre participation ? Auriez-vous la gentillesse + infinitif + ? Je vous serais trs reconnaissant de (bien vouloir) + infinitif. 6.1.1.2. en espagnol/italien/portugais espagnol Puedes pasarme la sal? Quieres pasarme la sal ? Puede / pueden / podis confirmarme su / su / vuestra llegada? Les formes varient en fonction du destinataire : usted / ustedes / vosotros italien Puoi passarmi il sale ? Non vuoi passarmi il sale ? Voglia / vogliano / vogliate confermarmi la sua / la loro / la vostra partecipazione. (opposition : lei / loro / voi) portugais Podes passar-me o sal? No te importas de me passar o sal? : cela ne te drange pas de me passer le sel Faa a favor de confirmar a sua participao : fates moi la faveur de confirmer 6.1.1.3. en roumain Po!i s" mi dai sarea ? Nu vrei s" mi dai sarea ? (ne sera pas employ) Tu ne veux pas me passer le sel? V" rog s" mi confirma!i participarea dumneavoastr". Je vous prie de me confirmer votre participation Le systme des pronoms de politesse est plus complexe : dumneata (tu), dumneavoastr" (tu ou vous), dumnealui (il), dumneaei (elle), dumnealor (ils ou elles) 6.1.1.4. en russe Le vouvoiement fonctionne de la mme faon quen franais. Pour attnuer la requte, on utilise la particule #$ (by) qui complte le verbe au pass : %& '()*+ #$ ,$ -&.&/012 '3& 4(*2? Ne pourriez-vous pas me passer le sel ?

!"#$%&'()$, *"+),-.+/)- 01- ,$2- &3$()/-. S.V.P., confirmez-moi votre participation. 4&+5)e +"6.7 +$)5 01- Soyez bon de me donner 6.1.1.5. en polonais Chcesz poda8 mi s9l ? Veux-tu me passer le sel ? Forme imperfective de vouloir , interprte comme une simple question Zechcesz / zechcia:by; poda8 mi s9l ? Forme perfective de vouloir qui sert formuler une requte Uprzejmie prosz< Pana / Pani= / Pan9w / Panie / Pa>stwa o potwierdzenie uczestnictwa. Je prie gentiment Monsieur / Madame / Messieurs / Mesdames / Mesdames et Messieurs de confirmer sa/leur participation. 6.1.1.6. en turc On utilise surtout le modlisateur pouvoir -ibilmek (infinitif), qui sattache la fin du verbe concern comme un suffixe. Tuzu uzatabilir misin ? Tu peux me passer le sel ? Tuzu uzatamaz misin ? Tu ne peux pas me passer le sel ? la forme ngative est impolie Tuzu uzatrsan ok sevinirim Je serais trs contente si tu me passais le sel 6.1.1.7. en tha Les structures avec pouvoir sont viter pour ne pas mettre en doute la capacit du destinataire. On trouvera plutt : /chua:y-3+song+2+klva:-1+haj:-3+chan-5+n@:j-1/ (n@:j-5 =particule de demande) Aide-moi me procurer du sel /ka-2ru-4 na:-1+?ja:-2+c@:t-2+rot-4+khwa:ng-5+pra-2tu:-1/ Vous auriez piti de ne pas garer la voiture devant la porte 6.1.1.8. en japonais On utilise surtout le modlisateur kudasai. Kudasai : impratif contract de lexpression kudasari + mase (sil vous plait ou faites_moi la faveur de) Shio wo to-tte kudasai. (Sel + particule COD + passer + kudasai) 6.1.1.9. en chinois Plus la phrase est longue, plus le locuteur est poli ou humble par rapport son interlocuteur. Ainsi quelques mots ou units lexicales sajoutent au noyau de la phrase.

!"#$%&'()*+,-prier-tu-dplacer-un peu-ce-zhang/Cls-table-daccord ?-merci Je te prie de dplacer un peu cette table daccord ? Merci ./01213456#$%&'()7-(je)-pouvoir ou pas-dranger-vous-dplacer-un peu-ce-zhang/Cls-table,-merci. Je peux ou pas vous dranger pour dplacer un peu cette table, merci. 6.1.1.10. en tha/japonais Il existe un grand nombre dexpressions honorifiques adaptes aux divers types de rapports sociaux. Ces formes affectent le vocabulaire, la conjugaison des verbes et certaines tournures de phrases. 6.1.2. Conclusion

Lacte de requte est un acte de langage universel. Ses ralisations varient dune langue lautre. Dans la traduction, il faut donc tenir compte de ces variations culturelles pour viter les fautes pragmatiques : les contresens (requte, offre, question) et les impolitesses. Les dictionnaires doivent donc aussi tenir compte de toutes ces particularits. 6.2. Proverbes et expressions figes

La langue est un mode dexpression de la ralit, pour cette raison elle tente de reflter les choses quelle nomme comme la nature, lhomme, sa vie. Lexpression fige et le proverbe jouent entre autres le rle de miroir du peuple . Cependant les peuples ne se voient pas tous travers le mme miroir. 6.2.1. La vie quotidienne a enrichi les locutions. en franais : en russe : avoir un oeil la pole et lautre au chat : surveiller deux choses en mme temps. V tesnote da ne v obide : quand on est serr, on n'est pas ls. Trad. Litt.: Pas de place mais pas de vexation non plus (esprit communautaire russe !). 8$97:;<= Trad.Litt : Ds quon part, le th devient froid Trad. Loin des yeux, loin du coeur

en chinois :

en japonais : Kaze no tayori. Trad. Litt. : les nouvelles du vent Trad. Le petit doigt me la dit 6.2.2. Le corps est source de nombreuses locutions en franais : tirer une pine du pied avec deux sens - ter lpine qui sest plante dans le pied - se dlivrer dune situation embarrassante.

6.2.3. Les animaux apparaissent souvent dans les locutions

les murs ont des oreilles donnera en coren loiseau coute ce qui se dit le jour et la souris coute ce qui se dit la nuit. 6.2.4. Institutions, techniques, coutumes et murs Par exemple : la chasse et la pche en franais : donner le change (tromper)

Vient de la chasse courre o il arrive que le cerf change sa voie en suivant la trace dune autre bte dont lodeur droute les chiens en les entranant sur une autre piste. De mme : en espagnol : Cazar largo : voir loin, avoir du flair Deux exemples de chengyus chinois. (chengyu : construction fige chinoise quadrisyllabique) !"#$ hn shu! m" y : pcher en eau trouble y tirer au flanc trouble-eau-pcher-poisson Trad. Litt. : pcher des poissons dans de leau trouble %&'( d h#i l$o zh%n : chercher une aiguille dans une botte de foin grandmerpcheraiguille Trad. Litt. : pcher une aiguille dans la mer ' : l$o : pcher signifie essayer de rcuprer quelque chose dans leau 6.2.5. La religion avec son droit, sa liturgie et ses coutumes est lorigine de locutions en chinois : ()*+,-.)/*012 (png sh b sh$o xi$ng), lng sh bo f ji#o : se presser au dernier moment Trad. Litt. : (en temps normal ne brler pas dencens) au dernier moment, en cas durgence, serrer les pieds de Bouddha dans les bras avoir voix au chapitre (avoir le droit de donner son avis) ne savoir quel saint se vouer : ne savoir qui recourir Sen laver les mains : dgager sa responsabilit (comme le fit Ponce Pilate aprs la condamnation de Jsus par les juifs)

en franais :

en espagnol : comulgar con ruedas de molina : croire, avaler nimporte quoi en polonais : Jak u Pana Boga za piecem : en scurit, dans de bonnes conditions ; comme un coq en pte Trad. Litt. : Comme chez Seigneur Dieu derrire son fourneau Ba& si' jak diabe( )wi'conej wody : avoir une peur bleue Trad. Litt. avoir peur comme le diable (a peur) de leau bnite. en japonais : Mutsu-go no tamashii hyaku made-mo : Trad. Litt. Lme lage de six ans ne change plus jusqu lge de cent ans : dans sa peau mourra le loup Tamashii : me

6.2.6. Autres comme lquitation, la guerre, les jeux, la mdecine : Lorsque lon tombe de cheval on peut se remettre en selle, si on veut retenir lanimal, on tire sur la bride en espagnol : salirle a uno el tiro por la culata en prendre plein la figure Expression qui voque la msaventure du tireur qui voit son arme lui exploser au visage. brouiller les cartes : semer la confusion se faire de la bile : 1) sinquiter 2) se dsopiler la rate 6.2.7. et pour finir : le folklore en espagnol : ser ms agarrado que un chotis : tre radin Chotis est une danse folklorique. 6.3. Comment faire concider les miroirs de chaque peuple, phrasologie et traduction Les civilisations diffrentes se transmettent des ides et des expressions au cours des changes dans des aspects divers. Lorigine dune expression peut ainsi tre la traduction littrale dune expression trangre. A titre dexemple, jeter lponge est une expression franaise provenant dune traduction littrale de lexpression anglaise throw up the sponge dans le contexte de la boxe (Rey et Chantreau, 1997 : 366) LIN H.-I. (2004) . Lobjectif est de trouver lquivalent de sens exact un proverbe ou une expression fige mme si la forme syntaxique nest pas respecte. Plusieurs cas se prsentent : Equivalence smantique, lexicale et structurelle totale Equivalence smantique mais quivalence lexicale et structurelle partielle Equivalence smantique mais totale diffrence lexicale et structurelle

6.3.1. Equivalence smantique, lexicale et structurelle totale entre proverbes des diverses langues franais : il pour il, dent pour dent espagnol : Ojo por ojo, diente por diente portugais : Olho por olho, dente por dente italien : Occhio per occhio, dente per dente roumain : Ochi pentru ochi, dinte pentru dinte russe : O!o "a o!o, "#$ "a "#$ polonais : Oko za oko, z%b za z%b turc : Gze gz, di&e di& coren : nunenn nunlo ienn ilo chinois : !"#"$!%#%& arabe : al 9aynu bi l 9ayni wa ssinnu bi ssinnu wal baadiu aDlamu Remarques : en arabe wal baadiu aDlamu a t ajout justement pour donner au proverbe le cachet arabe japonais : Me niwa me wo, ha niwa ha (wo : il, niwa : pour, ha : dent)

on obtient une traduction produite par le calque avec la langue franaise 6.3.2. Equivalence smantique mais quivalence lexicale et structurelle partielle franais : loin des yeux, loin du cur espagnol : ojos que no ven, corazn que no siente portugais : longe da vista, longe do corao italien : lontano dagli occhi, lontano dal cuore roumain : Ochii care nu se vd, se uit russe : ! "#$% &'#'( )% *+,&-$ .'/ : S glas doloj - is serdtsa von polonais : Co z oczu to i z serca turc: Gzden 0rak, gnlden 0rak coren : nunes mljimyn maumes mljimda tha : /klaj+1+ta:-1+klaj+1+caj+1/ loin+yeux+loin+cur chinois : !"#$%&'(Trad. Litt. : Ds quon part, le th devient froid arabe : ba9iidun 9ani al 9yuni, ba9iidun 9anil qalbi sanskrit : nethra door satyam, hrudhaya door satyam japonais : Saru mono wa hibi ni utoshi On remarque que le domaine corporel (il et cur) est prsent dans toutes ces expressions lexception du chinois (th) Concernant la syntaxe, la structure syntaxique franaise est identique la structure portugaise et italienne. ADV+ART+SUBST+ADV+ART+SUBST et aussi trs proche du tha. Le coren et le turc ont invers les lments. Lespagnol, le roumain, le polonais ont paraphras le sens en employant une relative (introduites par que, care, Co), ce qui est diffrent du franais, de litalien et du portugais qui ont une quivalence smantique et lexicale totale. En arabe il sagit dune expression trs rcurrente dans le langage courant et qui a la mme charge smantique quen langue franaise. 6.3.3. Equivalence smantique mais totale diffrence lexicale et structurelle franais : Dans sa peau mourra le loup espagnol : Muda el lobo los dientes y no las mientes portugais : O que o bero d a tumba o leva italien : Il lupo perde il pelo ma non il vizio roumain : Lupul 1i schimb2 p2rul dar n2ravul ba Trad. Litt. : le loup change son poil mais son caractre non russe : 3$4'. . 4'#56+#748, 9$4'. ) . :'")#48 : Kakov v kolybelkou, takov i v moguilkou Trad. Litt. : Tel au berceau, tel au tombeau polonais : Natura ci!gnie wilka do lasu Trad. Litt : la nature appelle le loup la fort coren : akinn ynjekajina akinida : Le mauvais ne samende pas Trad. Litt. Le mauvais est toujours le mauvais tha : /cha:t-3+sva:-5+maj-3+thing-4+la:j-1/ espce+tigre+ne pas+abandonner+trait

chinois : !"#$%& g!u g"i b li"o ch# sh$ chien-changer-non-entirement-manger-merde Trad. Litt.(fam) : Un chien ne changera pas (de son habitude) de manger de la merde japonais : Mutsu-go no tamashii hyaku made-mo Trad. Litt. : lme lage de six ans ne change plus jusqu lge de cent ans Dans les langues franaise, espagnole et italienne, les traductions sappuient sur une image animale et corporelle. lobo, lupo, loup ; dientes, pelo En portugais, on a la comparaison de lhomme sa naissance (bero : berceau) et sa mort (tumba : spulture) Pour les langues turque et arabe, cette expression fige nexiste pas. En tha, on attribue une qualit aux tigres, grands chasseurs de nature. Le tha se donne une image des tigres qui meurent avec dignit sans changer de peau . Nous avons donn ici plus particulirement des traductions littrales (Trad. Litt.) en franais afin de mettre en vidence les grandes divergences dans la formulation linguistique dune mme ide. On voit aussi quune formule de dpart en langue soutenue peut donner comme rsultat une traduction plutt familire. Dun point de vue smantique, toutes ces traductions veulent bien dire la mme chose mais ici le lexique est fond sur dautres images et la forme syntaxique est diffrente. 7. 7.1 Quelques propositions pour la traduction automatique et assiste Les dictionnaires

Comme le montre le rapport Pointer POINTER (1996) il existe des outils qui permettent des accs interactifs de manire conviviale aux banques de donnes terminologiques. Mais c'est prcisment l'organisation de telles banques de donnes de collocations au sens large (non seulement les termes simples) qui nous intresse. Des besoins comme la convivialit, l'appartenance des donnes telle ou telle norme, sont, notre avis, bien sr importantes, mais elles ne servent qu' accompagner toute cette organisation qui reprsente le vritable travail de fond du linguiste formaliste. Les dictionnaires spcialiss interactifs de collocations (terminologiques et autres) multilingues devraient mettre en vidence de faon explicite des phnomnes linguistiques qui sont d'une importance primordiale pour le traducteur. MultiCoDiCT GREENFIELD, P et al. (1999) est un prototype du noyau de ce type de dictionnaires sous la forme d'une plate-forme utilise, programme linguistiquement (ex. affichage de parties du discours, entre autres) et perfectionne (pour les besoins de la reprsentation spcialise du lexique) par de nombreux chercheurs. MultiCoDiCT prend en compte les phnomnes linguistiques CARDEY, S., GREENFIELD, P. (2001) et repose sur une spcification formelle GREENFIELD, P. (1998) . Dans MultiCoDiCT, la reprsentation spcialise du lexique permet le codage de collocations dans un contexte dquivalences de significations dans un domaine donn et travers un ensemble de langues. Cette reprsentation prend en compte les exigences d'intgrit de donnes, l'explicitation de contraintes du domaine (telles que l'interdiction de synonymie, de polysmie), et permet aussi, partir des collocations, la gnration automatique d'articles ainsi que celle de l'indexation des entres. Il faut rappeler que MultiCoDiCT n'est pas quun systme de dictionnaires de mots , c'est aussi un systme de dictionnaires (multilingue) de collocations et segments .

Plusieurs dictionnaires prototypes de collocations ont t conus dans des domaines divers avec MultiCoDiCT dans diffrentes langues : anglais-franais(6), franais-espagnol(2), anglaiscoren-franais, arabe-franais, espagnol-franais-portugais, franais-latin-portugais, chinoisfranais, tha-franais. Ces dictionnaires ont t labors comme prototypes de nature archtypal pour aider les recherches portant par exemple sur l'apprentissage, la terminologie, le figement, la traduction assiste et automatique. Nous donnons ci-dessous un extrait du rcapitulatif des dictionnaires crs et renvoyons le lecteur larticle de GREENFIELD, P. (2003) pour une prsentation plus dtaille des particularits non seulement des dictionnaires mais aussi et surtout des langues dcrites.
Domaine Type Particularits Langues anglais-franais Alternatives internes franaisMots espagnol polycatgoriels, Variantes de langue anglais-franais Non rversibilit

T.A.L. Tourisme Recherche clinique Parties du corps

Terminologie Terminologie Terminologie Expressions figes

Auteur et rfrence ACHECHE, S. (1999) CHAN NG, R. (1999) GAVIEIERO, E. (1997) MORGADINHO, H. (1999)

franaisespagnol

Animalier

Expressions images

franais-tha

Multiples entres pour une collocation, Polysmie, Synonymie Type de traductions

WERTHEHENGSANGA, V. (2001)

Le dernier dictionnaire WERTHE-HENGSANGA, V. (2001) de ce tableau prsente des particularits intressantes que lon ne rencontre dans aucun dictionnaire actuel et qui portent sur les types de traductions partir des expressions images dans le domaine animalier. Les types de traductions sont les suivantes : Eq TL SA SF 7.2. quivalent fourni condition que l'on puisse en trouver un traduction littrale mot mot sens analytique traduction littrale reformule en franais correct sens fonctionnel le sens vritable de l'expression traduite La traduction automatique

Nous parlerons brivement ici de 2 systmes de traduction automatique, lun nous servira montrer les manipulations smantiques ncessaires en vue dobtenir des traductions correctes, lautre donnera simplement des rsultats lorsquil est appliqu un domaine particulier. 7.2.1. Le systme TACT coren/franais Afin de traiter le problme dentres de dictionnaire lorsqu un verbe dans une langue correspondent 2 verbes dans une autres tel que : arroser dans arroser le poisson de jus de citron et

saupoudrer dans saupoudrer le poisson de farine qui se traduisent par la mme unit en coren, lopposition [liquide/pulvrulent] va permettre de marquer la diffrence dans les dictionnaires. Les proprits que nous utilisons sont conues de faon relationnelle, nous utilisons la thorie SyGuLAC (Systemic Grammar using a Linguistically Motivated Algebra & Calculus) CARDEY, S., GREENFIELD, P. (2005) qui va permettre dans un premier temps de partitionner le lexique ici en fonction de traits smantiques de la faon suivante : TACT (Traduction Automatique Centre Tesnire) Coren ! Franais Mi-Seon HONG

La proprit [liquide] soppose ainsi la proprit [solide] et cette dernire comprend, par exemple, les sous-proprits [poudreux], [fragmentaire] et [compact]. 7.2.2. Le systme TACT franais-arabe Dans le mme ordre dide nous avons conu un systme de traduction automatique franais-arabe ALSHARAF H. et al. (2004) qui va permettre lorsquil est appliqu par exemple au domaine du droit de gnrer le type de traduction suivante :

l'ordre administratif connat des litiges relatifs l'organisation et au fonctionnement des services publics et aux contrats administratifs

et lorsquil est appliqu au domaine de la mto des traductions telles que ailleurs sur la moiti nord-ouest du pays, la matine sera peu nuageuse et brumeuse sur le sud-ouest

8.

Conclusion

Nous avons t maintes fois surpris de constater que certains systmes pour passer dune langue une autre empruntaient une 3me langue, langlais, ce qui fait que les rsultats ne peuvent en aucun cas tre bons. Par exemple, pour le mot libre en franais nous avons trouv 19 sens, qui peuvent se retrouver dans la langue du droit avec un sens spcifique au droit mais aussi un sens plus commun. Comment faire pour obtenir la bonne traduction ? Pour conclure, nous dirons simplement, que si lon veut de bonnes traductions automatiques, il faut se limiter un domaine prcis, de plus notre exprience nous a montr que les systmes doivent tre conus de faon unidirectionnelle dans un premier temps et seulement ensuite on peut envisager de travailler dans lautre sens, ce qui va demander la cration en fait dun nouveau systme. Si lon cherche des rsultats de qualit, lanalyse de la langue source devrait se faire en fonction de la langue cible, en sachant que ces analyses ne sont pas forcment rversibles. RFRENCES
ALSHARAF, H., C ARDEY, S. and P. GREENFIELD (2004) : French to Arabic Machine Translation: the Specificity of Language Couples , Actes de The European Association for Machine Translation (EAMT) Ninth Workshop, Malta, 26-27 April 2004, Foundation for International Studies, University of Malta, pp.11-17. ACHECHE , S. (1999) : Systme de traduction semi-automatique des termes relatifs au T.A.L. (Traitement Automatique des Langues) , Mmoire de Matrise d'anglais mention Industries de la Langue, Besanon, 1999. CARDEY, S. and P. GREENFIELD (2001) : The Analysis and Design of Computerises Lexicons , in Lexis in Contrast (B. Altenberg & S. Granger eds.), Benjamins, pp. 231-249 CARDEY, S . and P. GREENFIELD (2005) : Systemic Linguistics with Applications , Proceedings of the 9th International Symposium on Social Communication, Santiago de Cuba, January 24-28, 2005, Actas II, pp. 649-653 CHAN N G, R. (1999) : Prototype informatis de dictionnaire du tourisme franais-espagnol-franais , DEA

Sciences du langage, Besanon, 1999. GAVIEIERO, E. (1997) : Elaboration d'un prototype de lexique informatis anglais/franais, application au domaine de la recherche clinique , DEA Sciences du langage, Besanon, 1997. GREENFIELD , P. (1998) : L'espace de l'tat et les invariants de l'tat des dictionnaires terminologiques spcialiss de collocations multilingues . In actes de la 1re Rencontre Linguistique Mditerranenne, Le Figement Lexical, Tunis, les 17-18 et 19 septembre 1998, pages 271-283. GREENFIELD , P., C ARDEY, S., ACHCHE, S., C HAN N G , R., G ALLIOT , J., G AVIEIRO , E., MORGADINHO , H. et E. PETIT (1999) : Conception de systmes de dictionnaires de collocations multilingues, le projet MultiCoDiCT . Actualit Scientifique, AUPELF-UREF, actes du Colloque international AUPELF Rseau Lexicologie, Terminologie, Traduction, Lloge de la diffrence : la voix de lautre, Beyrouth, 11-13 novembre 1999, pages 103-115. GREENFIELD , P. (2003) : Le rle de l'informatique dans le traitement et l'enseignement des langues , Actes du Congrs international : Journes linguistiques franco-asiatiques, Universit Naresuan, Phitsanulok, Thalande, 20-22 aot 2003, pp.69-84. LIN , H.-I. (2004) : Vers une traduction automatique des expressions figes franaises en chinois : la traduction canonique , Thse de doctorat, Besanon, France. MORGADINHO , H. (1999) : Dictionnaire lectronique franais-espagnol. Expressions figes , Mmoire de Matrise d'espagnol mention Industries de la langue, Besanon, 1999. POINTER (1996) : Pointer (Proposal for an Operational Infrastructure for Terminology in Europe) 1996, http://www.mcs.surrey.ac.uk/Research/CS/AI/Pointer/report/contents.html WERTHE-HENGSANGA, V. (2001) : Etude de la traduction automatique en franais des expressions images de la langue tha (domaine animalier) , DEA Sciences du langage, Besanon, 2001.