Sie sind auf Seite 1von 13

Le Coran : quelques donnes lexicolexico-statistiques statistiques1

Djamel Eddine Kouloughli2 0. PRAMBULE


Comme les textes sacrs des autres religions monothistes, le Coran a fait lobjet, trs tt, et en tout cas bien avant linvention de lordinateur, de dcomptes statistiques minutieux portant sur tous les aspects de son organisation textuelle. Cest ce quatteste par exemple un clbre rcit rapport dans Les Mille et une Nuits et qui met en scne la docte Sympathie , belle et savante jeune femme quun aropage de savants interroge, notamment sur le Coran. Voici un extrait de sa rponse :
Elle rpondit : Le Korn est compos de cent quatorze sourates ou chapitres, dont soixante-dix ont t dicts La Mecque et quarante-quatre Mdine. Il est divis en six cent vingt-et-une divisions, appeles aschar, et en six mille deux cent trente-six versets. Il renferme soixante dix-neuf mille quatre cent trente-neuf mots, et trois cent vingt-trois mille six cent soixante-dix lettres 3

Nos propres donnes, et nos moyens actuels de les traiter, ne confirment pas cette description dans ses moindres dtails. Mais il faut bien reconnatre que tous les ordres de grandeur voqus dans ce texte sont corrobors par nos propres rsultats, ce qui, compte tenu du fait que tous les dcomptes taient faits la main, ne peut que susciter ladmiration4. Aujourdhui, des textes lectroniques du Coran sont trs faciles trouver et tlcharger sur le web et, moyennant quelques manipulations, transformer en corpus lectroniques susceptibles dtre analyss de faon exhaustive et systmatique. Ce sont essentiellement des rsultats de telles analyses qui seront prsents et comments dans les pages qui suivent. Le corpus sur lequel nous avons travaill, comme la plupart des versions lectroniques du Coran en circulation, correspond ce que lon dsigne parfois sous le nom de Coran de Fouad . Cette dnomination fait rfrence la pre1. Le prsent texte corrige une version prcdente o des erreurs staient glisses dans les donnes statistiques. Ces erreurs nous ont t signales par M. Tidjani Ngadi, du dpartement de physique de luniversit dOran (Algrie). Quil trouve ici lexpression de nos remerciements. 2. CNRS, HTL (Histoire des thories linguistiques), UMR 7597. 3. Histoire de la docte Sympathie (178e nuit). Les Mille et une Nuits, traduction Joseph Charles Mardrus. 4. Surtout si lon tient compte du fait quune partie des divergences vient peut-tre de la dfinition des observables (par exemple pour ce qui concerne les mots et les lettres ).

61

mire version imprime du Coran, laquelle a t labore sous lautorit des ulam dal-Azhar et sous lgide du roi Fouad Ier dgypte en 1923. Elle correspond la lecture (qira) de af telle que transmise par im, traditionnellement en usage dans le pays du Nil, et devenue, par les vertus dmocratiques de limprimerie, la version crite du Coran la plus largement diffuse dans le monde. Le Coran relve, lorigine, de loralit, comme le suggre la probable tymologie de Qurn, rcitation voire appel, proclamation . De la relativement longue priode o il a t essentiellement confi la transmission orale assure par les porteurs du Coran (amalat al-Qurn), il a gard des variantes textuelles plus ou moins importantes auxquelles la tradition fait rfrence sous le nom de aruf (idiomes), dune part, de qirt (rcitations, lectures), dautre part. Les aruf, dont une tradition nous apprend que le Prophte aurait lui-mme dclar que la rvlation en comportait sept, semblent concerner des diffrences relatives lidentit de certaines units lexicales du texte qui se manifestent dans le ductus consonantique (rasm). Les qirt concernent plutt des diffrences dans les marques diacritiques associes ce ductus (vocalisation et gmination consonantique). La fixation graphique dfinitive du Coran, qui ne se fait que progressivement, avec ladoption gnralise de la rforme de lcriture arabe dcide par le Calife omeyyade Abd al-Malik Ibn Marwn (m. 705), saccompagnera dun net recul de la tolrance, assez grande lorigine, lgard des variantes dans la rcitation du texte sacr. Au Xe sicle, linitiative du thologien Ibn Muhid (m. 936), seules sept qirt canoniques sont codifies et retenues pour tre reproduites. Les autres, mme si elles sont notes, sont dclares rares (a) et pratiquement ostracises5. Des sept qirt reconnues, seules deux ont eu une diffusion assez large dans la communaut musulmane sunnite, celle de af dont nous avons dj parl, et celle de War, encore en usage au Maghreb. Le Coran de Fouad semble avoir fait dfinitivement pencher la balance en faveur de la premire.

1. PRSENTATION G GNRALE
Dans sa version lectronique comme dans sa version imprime, le texte coranique est divis en 114 sourates (sra/suwar6) classes dans un ordre conventionnel (cest--dire non chronologique). Chaque sourate porte un ou plusieurs noms, galement conventionnels7. Concernant le classement des sourates du
5. Sur lhistoire de la fixation du texte coranique on peut lire, dans les rfrences arabes anciennes, louvrage de Ab Amr al-Dn, Al-Muqni f rasmi maifi al-amr, et dans les rfrences modernes, par exemple Blachre (1958) ou Droche (2005). 6. Sur ltymologie du mot sra, il existe, tant en arabe que dans diverses langues europennes, une abondante littrature, abondance qui tmoigne surtout de labsence dexplication vraiment convaincante de la signification originelle du mot. Tout au plus peut-on dire, avec certitude, que la racine <swr> laquelle est associ ce mot porte le contenu smantique gnral de barrire, sparation . 7. Ainsi, la premire sourate du Coran, outre son nom de Ftia ( Introduction ), est connue sous plus dune dizaine dautres dnominations. De mme, la sra 112, laquelle il

62

Coran, on dit souvent qu lexception de la premire, la Ftia, elles seraient classes par ordre de longueur dcroissante. Cela nest que tendanciellement vrai. Dans le dtail, cette description ne tient pas : par exemple, la sourate 7 (al-Arf) compte 204 versets alors que les trois sourates qui la prcdent en comptent moins de 200. Elle est en outre suivie de la sourate 8 (al-Anfl) qui ne compte que 76 versets, alors que les quatre sourates suivantes (9, 10, 11 et 12) comptent toutes plus de 100 versets. On pourrait multiplier les exemples de ce genre, qui montrent que, stricto sensu, il est inexact de dire que les sourates du Coran sont classes par ordre de longueur dcroissante. Cela soulve, soit dit en passant, une question qui sort de lobjet de la prsente communication, mais qui a son importance, celle de savoir quel est le principe qui a prsid au classement des sourates du Coran tel quil nous est parvenu. Deux hypothses au moins se proposent : la premire, assez superficielle, est quil sagit dun classement visant optimiser les stratgies de mmorisation du texte. La seconde, voque notamment par le grand compilateur de la culture arabe traditionnelle que fut al-Suy (m. 1505), dans Asrr tartb al-Qurn ( Les secrets du classement du Coran ), est que lanalyse thmatique interne des sourates rvlerait un fil conducteur (voire plusieurs) conduisant dune sourate lautre dans leur ordre de classement tel quil est attest. Cette dernire hypothse mriterait dtre explore systmatiquement. En en-tte de chaque sourate on trouve, parfois, dans les versions lectroniques, et toujours dans les versions imprimes, une indication relative lorigine, mecquoise ou mdinoise, de la sourate. Rappelons ce propos que le Coran a t rvl au Prophte de lislam sur une dure de quelque 23 ans, et quune partie de cette rvlation a t reue pendant quil rsidait La Mecque, sa ville natale, et lautre Mdine o, partir de 622, il migre avec ses partisans pour jeter les bases du futur tat islamique. Cest sur cette priodisation que se fonde lindication de lorigine, mecquoise ou mdinoise, des sourates. Cette indication, qui donne une premire chronologie globale des sourates composant le texte coranique, soulve bien sr la question du classement chronologique dtaill des sourates, cest--dire celle de lordre de succession exact des unes par rapport aux autres. Certains seront peut-tre surpris dapprendre que sur cette question essentielle8, il ny a pas vraiment de consensus doctorum. Par exemple, lun des textes les plus anciens relatifs la chronologie coranique, le Kitbu tanzli l-Qurn ( Livre de la rvlation du Coran ) dIbn ihb alZuhr (m. 741) indique que la Ftia aurait t rvle Mdine alors que presque tous les auteurs postrieurs affirment quil sagit dune sourate mecquoise. Selon
est gnralement rfr comme srat al-Il, est connue sous une douzaine dautres noms. 8. Cette question est essentielle, notamment dun point de vue juridique, dans la mesure o certaines prescriptions coraniques ont t modifies au cours de la rvlation. Il importe donc de savoir laquelle des deux prescriptions diffrentes relatives au mme domaine (par exemple la consommation de vin) est chronologiquement la dernire et donc celle dont le respect simpose.

63

al-Zuhr, le nombre des sourates rvles La Mecque est de 85 et celui des sourates mdinoises de 29, chiffres comparer avec ceux que donnait la docte Sympathie dans le texte des Mille et une Nuits (supra) et qui reflte une position traditionnelle courante. titre indicatif, voici la classification chronologique des sourates selon al-Zuhr9 (le premier chiffre renvoie la classification conventionnelle, le second (aprs le slash) lordre chronologique selon al-Zuhr) :
Sourate mecquoises :
96/1;68/2;73/3;74/4;111/5;81/6;87/7;92/8;89/9;93/10;94/11;100/12;103/13;108/14; 102/15;107/16;109/17;105/18;113/19;114/20;112/21;53/22;80/23;97/24;91/25;85/26; 95/27;106/28;101/29;75/30;77/31;50/32;104/33;54/34;90/35;86/36;38/37;7/38;72/39; 36/40;25/41;35/42;19/43;20/44;56/45;26/46;27/47;28/48;17/49;10/50;11/51;12/52; 15/53;6/54;37/55;31/56;34/57;39/58;40/59;41/60;42/61;43/62;44/63;45/64;46/65; 51/66;88/67;18/68;16/69;71/70;14/71;21/72;23/73;32/74;52/75;67/76;69/77;70/78; 78/79;79/80;82/81;84/82;30/83;29/84;83/85;

Sourates mdinoises :
1/86;2/87;8/88;3/89;33/90;60/91;4/92;99/93;57/94;47/95;13/96;55/97;76/98;65/99; 98/100;59/101;110/102;24/103;22/104;63/105;58/106;49/107;66/108;62/109;64/110; 61/111;48/112;5/113;9/114.

Signalons quil existe une classification chronologique officielle dal-Azhar, laquelle ne semble diffrer de celle dal-Zuhr que par la position accorde la Ftia, considre comme mecquoise et cinquime sourate rvle. Dans le cadre de cette classification, que nous adopterons dans les dcomptes prsents plus loin, il y a 86 sourates mecquoises et 28 sourates mdinoises. Certains arabisants occidentaux ont galement propos des classements chronologiques des sourates du Coran en se fondant en partie sur les indications fournies par les sources musulmanes traditionnelles et en partie sur la critique textuelle interne du Coran. La tentative la plus marquante reste celle de Nldeke poursuivie par Schwally. Voici, selon les mmes conventions de prsentation que ci-dessus, la classification chronologique propose par Nldeke10 :
Sourate mecquoises :
96/1;74/2;111/3;106/4;108/5;104/6;107/7;102/8;105/9;92/10;90/11;94/12;93/13;97/14;86/15; 91/16;80/17;68/18;87/19;95/20;103/21;85/22;73/23;101/24;99/25;82/26;81/27;53/28;84/29; 100/30;79/31;77/32;78/33;88/34;89/35;75/36;83/37;69/38;51/39;52/40;56/41;70/42;55/43;112/44;10 9/45;113/46;114/47;1/48;54/49;37/50;71/51;76/52;44/53;50/54;20/55;26/56;15/57;19/58;38/59;36/6 0;43/61;72/62;67/63;23/64;21/65;25/66;17/67;27/68;18/69;32/70;41/71;45/72;16/73;30/74; 11/75;14/76;12/77;40/78;28/79;39/80;29/81;31/82;42/84;10/84;34/85;35/86;7/87;46/88;6/89; 13/90;

9. On pourra vrifier que, selon al-Zuhr, la Ftia est la 86e sourate rvle, et la premire rvle Mdine. Signalons que, dans le texte publi dal-Zuhr auquel nous avons eu accs, une erreur rend la classification chronologique inconsistante. Cette erreur rside dans le fait que la sourate 7 (al-Arf) est classe en deux positions chronologiques diffrentes, car rfrence sous deux noms diffrents, alif-lm-mm-d dabord puis al-Arf. Le reclassement systmatique que nous avons effectu montre quau lieu de alArf, dans la deuxime position, il faut lire al-Azb (sourate 33), moyennant quoi tout rentre dans lordre. 10. On notera que pour Nldeke, la Ftia est bien mecquoise (48e sourate mecquoise), et quil ny a que 24 sourates mdinoises.

64

Sourates mdinoises :
2/91;98/92;64/93;62/94;8/95;47/96;3/97;61/98;57/99;4/100;65/101;59/102;33/103;63/104;24/105;58 /106;22/107;48/108;66/109;60/110;110/111;49/112;9/113;5/114;

La distinction entre sourates mecquoises et sourates mdinoises a des manifestations textuelles que les analystes du texte coranique, anciens ou modernes, nont pas manqu de souligner. La prose rime (sa) caractrise lensemble du texte coranique et se manifeste par le fait que les formes pausales des fins de versets dune mme sourate riment gnralement entre eux11. Mais ce phnomne sexprime de faon beaucoup plus discrte dans les sourates mdinoises que dans les sourates mecquoises, notamment en raison du fait que les sourates de la priode mdinoise sont en gnral plus longues que celles de la priode mecquoise, et quen outre les versets y sont sensiblement plus longs. Les deux types de sourates prsentent galement un aspect stylistique et un contenu thmatique sensiblement diffrent : les sourates mecquoises, en particulier les premires, ont souvent un rythme rapide, saccad, et sont riches en performatifs (serments, menaces, interpellations). Avec le temps, le style en devient plus ample, plus imag, plus lyrique, mais les effets de rythme et de rime y restent toujours sensibles. Globalement, le contenu thmatique des sourates mecquoises est nettement orient vers des exhortations ladoption de la nouvelle foi, accompagnes dvocations eschatologiques ou de rfrences des figures bibliques exemplaires ; les sourates mdinoises prsentent des versets beaucoup plus amples, si bien que les effets de la rime, toujours prsente en fin de verset, y sont nettement plus discrets. Le style y devient plus dmonstratif et largumentation plus articule. Cest dans les sourates de cette priode que lon trouve les dveloppements doctrinaux, juridiques et rglementaires qui vont servir de base lorganisation de la socit musulmane. On y trouve aussi, cependant, de longs rcits difiants reprenant et rinterprtant certains grands thmes des traditions monothistes antrieures. Au total, on se trouve, avec la structure gnrale du texte coranique dont on vient desquisser la prsentation, et notamment avec la dichotomie sourates mecquoises/sourates mdinoises, devant une dualit textuelle assez clairement marque, mais dont les effets statistiques sont, dune certaine manire, neutraliss : les sourates mecquoises, gnralement moins longues mais aussi plus nombreuses que les sourates mdinoises, lemportent finalement en couverture textuelle . Les donnes statistiques suivantes illustrent cet tat de choses :

11. Il convient de noter que le type de rime dont fait usage le texte coranique, et que lon appelle fila, se ralise sur les formes pausales des mots et est donc nettement diffrent de la rime de la posie arabe classique, dite qfiya, qui se ralise sur les formes non pausales des mots.

65

Tableau des sourates mecquoises et mdinoises


Sourates Mk Sourates Md TOTAL Nb. sourates % sourates Nb. versets % versets Nb. mots % mots 86 75 % 4 613 74 % 47 692 59 % 28 25 % 1 623 26 % 32 854 41 % 114 100 % 6 236 100 % 80 546 100 %

Dans le tableau ci-dessus comme dans les graphiques qui suivent, on a adopt les abrviations suivantes : Nb = nombre ; Mk = mecquoises ; Md = mdinoises.

66

Pour clore le chapitre des gnralits sur le texte coranique et plus spcifiquement sur la version lectronique que nous avons soumise lanalyse, prcisons que, par rapport certaines versions imprimes, cette version prsente deux diffrences quil convient de souligner : dune part, son orthographe est normalise et modernise , cest-dire quelle ne reproduit pas les variations orthographiques idiosyncrasiques que certaines versions imprimes conservatrices exhibent et qui font que le mme mot, par exemple le nom propre Ibrhm, peut apparatre sous plusieurs orthographes diffrentes ; de mme, lorthographe adopte pour un certain nombre de mots, notamment ceux contenant une voyelle longue , que les graphies coraniques archaques pouvaient ignorer, sont systmatiquement rgularises conformment lorthographe arabe standard ; dautre part, le texte lectronique, quoiquintgralement vocalis, ne comporte pas les signes diacritiques vise spcifiquement orthopique, en particulier ceux qui rglementent les phnomnes dassimilation phontique et de pause dans la lecture coranique traditionnelle12.

2. QUELQUES CARACT CARACTRISTIQUES STATISTIQUES DU TEXTE TEXTE CORANIQUE


Lanalyse13 dun corpus lectronique du texte coranique tel quil vient dtre caractris livre les rsultats statistiques rsums dans le tableau suivant :
Nombre de formes Nombre doccurrences Rapport occurrences/formes Hapax legomena Hapax dislegomena 17 503 77 874 4 449 10 899 2 694

Les occurrences sont les mots graphiques (squence de lettres spares par deux sparateurs ). En arabe, langue agglutinante, il peut sagir de mots sim-

12. Sur ces signes dans le Coran de Fouad , voir Humbert (1980). 13. laide du logiciel danalyse de Corpus TACT, Lancashire et al. (1996).

67

ples ou de mots complexes14 constitus par un mot simple auquel sagglutinent des prpositions ou conjonctions clitiques dune part, des pronoms clitiques dautre part. Il y en a 77 874 dans le Coran analys ( comparer avec les rsultats de la docte Sympathie ). Les formes sont, en quelque sorte, les modles des occurrences, dcompts une seule fois, en sorte qu toutes les occurrences identiques est associe une seule forme. Le nombre des formes, ici 17 503, donne une ide du vocabulaire total mobilis par le texte. Mais cette ide est imprcise et en loccurrence trs survalue compte tenu de ce qui vient dtre dit sur la notion doccurrence. Par exemple, les trois vocalisations syntaxiques dun mme nom seront comptabilises comme trois formes diffrentes. De mme, toutes les formes cliticises dun mme mot. On comprend alors en quoi le nombre des formes est une trs grosse survaluation du lexique rel dun texte, en tout cas en arabe. Cependant, le rapport occurrences/formes donne une certaine ide de la richesse lexicale dun texte, car tendanciellement, plus ce rapport est lev, plus le taux de rptition dune mme forme est grand, et donc moins le texte est vari. En loccurrence, la valeur de ce rapport pour le Coran, proche de 4,5, est relativement leve, suggrant un assez fort taux de rptition. Nous verrons plus loin que dautres indices confortent cette prdiction. Les hapax legomena sont les mots graphiques qui napparaissent quune seule fois dans le texte, ou si lon veut, les cas ou loccurrence est aussi la forme. En principe, plus le taux dhapax legomena est lev, moins il y a de rptitions et plus le texte est riche lexicalement. Le nombre dhapax legomena dans le Coran est loin dtre ngligeable (prs de 11 000 formes sur 17 503). Mais cette valeur, rapproche de celles qui prcdent, suggre paradoxalement que les formes restantes prsentent un taux de rptition dautant plus lev. En somme, le Coran prsente prs de 11 000 formes qui napparaissent quune fois dans le texte, et environ 6 500 formes ayant un taux de rptition gal ou suprieur 2. Les hapax dislegomena sont prcisment les mots graphiques qui napparaissent que deux fois dans le texte. Lexamen du texte laide dun logiciel de traitement de corpus permet galement dtablir la liste des formes classe soit par ordre alphabtique, ce qui est banal, soit par ordre frquentiel, ce qui est beaucoup plus clairant, et peut notamment servir de point de dpart pour une exploration thmatique du texte. Il ne saurait, bien sr, tre question de reproduire ici de telles listes, puisque les 17 503 formes du texte coranique, mme imprimes 100 lignes par page (ce qui ne serait gure lisible), exigeraient 175 pages ! Nous nous contenterons donc, pour en donner une petite ide, de reproduire les 37 premires lignes de la liste frquentielle du texte coranique, et de faire dessus quelques commentaires gnraux.

14. Sur cette notion et la structure des mots complexes, voir Kouloughli, 1994, chapitre 1.

68

Formes Formes (ordre lexicomtrique) min fiy maa ellaahi laa elxa@iyna ellaahu &alaY ilxaa walaa wamaa inxa ellaaha an qaala ilaY man lahum in yaa cumxa lakum bihi kaana bimaa qul aw @aalika lahu elxa@iy huwa hum aamanuwe qaaluwe &an fiyhaa waman

Frquence 2 363 1 207 1056 828 816 810 734 669 662 658 645 607 591 539 416 404 402 373 357 350 337 336 327 323 296 293 280 280 275 268 265 260 253 250 244 240 240

Coran : liste des 37 premires formes les plus frquentes

69

Lexamen de la liste frquentielle15 permet, entre autres, les observations suivantes : les formes les plus frquentes sont, typiquement, des mots grammaticaux (prpositions, conjonctions, relatifs, etc.). Cette proprit se retrouve dans tout texte suffisamment long quel quen soit le sujet ou la langue ; par contre, une caractristique tout fait frappante de la liste de formes les plus frquentes du texte coranique est que le mot Allh (transcrit ici ellaah ) apparat avec une frquence exceptionnellement leve puisque, sous ses trois formes flchies, il totalise 2 153 occurrences16, ce qui lui donne une frquence doccurrence absolument unique pour une unit lexicale pleine ; dautres mots pleins , noms ou verbes, apparaissent avec une frquence significativement leve dans cette liste, comme par exemple les noms ar (terre) ou samwt (cieux) ou les verbes mana (croire) ou kafara (mcroire). On voit certes, daprs leur smantisme, que les mots pleins frquence doccurrence leve sont fortement thmatiques dans le texte coranique, et que ceci peut expliquer cela. Mais nous allons voir, en explorant un autre paramtre statistique du texte, celui des segments rpts , que cette frquence leve peut en partie sexpliquer par une autre proprit du texte coranique : son taux lev de rptitions. On entend par segment rpt (dsormais SR) toute suite de formes (au sens dfini plus haut) dont la frquence est gale ou suprieure 2 dans un texte. Le logiciel Lexico3 est dot dune fonctionnalit permettant de reprer et de comptabiliser tous les segments rpts dun texte. Lexcution de cette fonctionnalit sur le corpus coranique rvle des proprits assez remarquables de ce point de vue. En effet, ct de SR que lon peut considrer comme correspondant simplement des (fragments de) structures syntagmatiques de la langue comme par exemple min badi ( aprs , 80 occurrences) ou al kulli ( sur tout , 55 occurrences), on trouve des SR qui sont incontestablement lis au contenu thmatique du texte comme allana man ( ceux qui ont cru , 184 occurrences) ou walahum abun almun ( et pour eux un chtiment douloureux , 12 occurrences). Ces SR sont de longueur variable, constitus de groupes pouvant aller jusqu 11 mots comme, par exemple, ill allana tb min badi lika waala fainna allha gafrun ramun ( sauf ceux qui se repentiront ensuite et se rformeront car en effet Dieu est Pardonneur et Misricordieux , 2 occurrences). Les SR les plus longs (longueur comprise entre 8 et 11) nont en gnral que des fr15. Cette liste a t produite par le logiciel de traitement de corpus Lexico3 (Andr Salem et al.), partir dune version du texte coranique ayant subi une transcription phonographmatique , cest--dire une transcription qui respecte les conventions orthographiques de larabe. La lecture du texte transcrit ne devrait pas savrer trop difficile mme pour le lecteur qui ne connat pas le dtail du systme. 16. Auxquelles il faudrait ajouter les formes cliticises comme waellaahu ou biellaahi, formes trs frquentes et qui viennent encore grossir le nombre total doccurrences du nom divin dans le Coran.

70

quences doccurrence modestes17 (gnralement comprises entre 2 et 4). Mais partir de la longueur 7 on peut trouver des frquences de 9, et la longueur 6 la frquence peut approcher la vingtaine ! Et surtout, le nombre de ces SR est trs important : souvent plusieurs dizaines pour chaque ordre de longueur ! Ces proprits du texte coranique que constituent le nombre, la longueur et la frquence doccurrence de SR est sans doute rapporter son statut originel de texte oral. En effet, nombre de ces SR sont, mutatis mutandis, les quivalents des formules que les chercheurs ont mises en vidence dans la posie ancienne18. Cette proprit du texte coranique na en tout cas pas chapp aux commentateurs anciens et modernes qui lui ont parfois consacr des tudes spcifiques19.

3. QUELQUES CARACT CARACTRISTIQUES LEXICOGRAPHIQ LEXICOGRAPHIQUES EXICOGRAPHIQUES DU TEXTE CORANIQUE


Nous terminerons cette brve prsentation de donnes lexico-statistiques relatives au texte coranique par un examen plus spcifique de son lexique. On sait que, dans le cas gnral, tout mot arabe sanalyse en une racine de trois radicales consonantiques ou plus et en un schme constitu de voyelles et ventuellement de consonnes se prfixant, sinfixant ou se suffixant sur les radicales constituant la racine. On peut souhaiter, pour les besoins de la procdure de traitement statistique, faire en sorte que toute unit lexicale, mme si elle nest pas stricto sensu analysable en racine et schme (cest le cas des particules de la grammaire arabe traditionnelle), puisse se voir associer une pseudo-racine conventionnelle. Cette pseudo-racine pourrait tre constitue des consonnes qui forment lunit considre : ainsi, la particule f, graphie et transcrite phonographmatiquement fiy, se verrait associer la pseudo-racine conventionnelle <fy>. Si en outre on poussait un peu plus loin ce principe, on conviendrait que les lettres mystrieuses , qui occurrent linitiale de certaines sourates, et qui sont gnralement dcomptes comme constituant en elles-mmes un verset coranique, que ces lettres donc ont le statut de formes du lexique coranique, et doivent ce titre se voir associer une pseudo-racine conventionnelle. Ainsi, la lettre qui occurre comme la premire forme du premier verset de la sourate du mme nom (sourate 50) se verra associer la pseudo-racine <q>. videmment cela conduit admettre lexistence de pseudo-racines biconsonantiques et mme monoconsonantiques. Si lon adopte les conventions ci-dessus et que lon se livre, sur cette base, lanalyse morphologique de lensemble du corpus coranique, on aboutit aux r-

17. Mais un SR de longueur 10 a, dans le Coran, une frquence de 6 ! Il sagit du SR qla y qawm bud llha m lakum min ilhin ayruhu ( mon peuple adorez Dieu, vous navez pas dautre dieu que lui ). 18. Voir par exemple Monroe (1972). 19. Par exemple, Muammad Ibn amza al-Kirmn (m. 1111), Asrr al-takrr f l-Qurn.

71

sultats suivants : le corpus coranique compte 1 767 racines et pseudo-racines ainsi ventiles :
Pseudo-racines monoconsonantiques Pseudo-racines biconsonantiques Racines (ou pseudo-racines20) triconsonantiques Racines (ou pseudo-racines) quadriconsonantiques Racines (ou pseudo-racines) pentaconsonantiques Racines (ou pseudo-racines) hexaconsonantiques Racines (ou pseudo-racines) de 7 consonnes21 Racines (ou pseudo-racines) de longueur suprieure 7

4 33 1 637 65 22 3 3 0

En ce qui concerne le nombre de formes auxquelles ces racines22 donnent naissance, voici quelques valeurs significatives :
503 racines ne sont associes qu une seule forme. 245 racines ne fournissent que 2 formes. 145 racines ne fournissent que 3 formes. 100 racines fournissent 4 formes. 101 racines fournissent 5 formes. 57 racines fournissent 6 formes. 52 racines fournissent 7 formes. 47 racines fournissent 8 formes. 51 racines fournissent 9 formes. 27 racines fournissent 10 formes. 15 racines fournissent plus de 100 formes.

La racine <ty>, la plus productive, fournit 227 formes. En ce qui concerne le nombre doccurrences : 413 racines ne fournissent quune seule occurrence (et bien sr, quune seule forme).
213 racines ne fournissent que 2 occurrences (de 1 ou 2 formes). 125 racines fournissent 3 occurrences (de 1 3 formes). 95 racines fournissent 4 occurrences (de 1 4 formes). 89 racines fournissent 5 occurrences (de 1 5 formes). 55 racines fournissent 6 occurrences (de 1 6 formes). 36 racines fournissent 7 occurrences (de 1 7 formes). 29 racines fournissent 8 occurrences (de 1 8 formes). 39 racines fournissent 9 occurrences (de 1 9 formes). 29 racines fournissent 10 occurrences (de 1 10 formes). 10 racines fournissent plus de 1000 occurrences.

La racine <qwl> fournit 1 722 occurrences pour 120 formes.


20. Il faut prvoir lexistence de pseudo-racines de trois consonnes ou plus car certaines squences de lettres mystrieuses ont des longueurs suprieures 2 : cest le cas par exemple du premier verset de la sourate 2 (longueur 3) ou de celui de la sourate 7 (longueur 4). 21. Il sagit, on laura peut-tre devin, des pseudo-racines associes aux noms propres ibrhm, isrl et isml. 22. Ou pseudo-racines. Cette prcision sera sous-entendue dans la suite.

72

La racine (ou pseudo-racine) la plus riche en occurrences est <n>, associe aux formes nombreuses et diverses des particules inna, anna, an, in et qui fournit 4 037 occurrences. Elle est suivie de la pseudo-racine <mn>, associe aux formes min et man et qui fournit 3 099 occurrences. Vient ensuite la racine <lh>, associe aux diverses formes du nom divin et qui fournit 2 851 occurrences. Signalons en passant que sur les 1 767 racines et assimiles dcomptes dans le Coran, 1 200 fournissent des formes verbales. Sur ces 1 200 racines, 15 sont quadriconsonantiques, et toutes les autres triconsonantiques23.

lments de bibliographie
Sources anciennes
Al-Qurn al-karm, Le Caire, 1923. Ab Amr al-Dn (m. 1052), Al-Muqni f rasmi maifi al-amri, Le Caire, Maktabat alKulliyyt al-azhariyya, 1978. Ibn Muhid (m. 936), Kitb al-saba f l-qirt, Le Caire, Dr al-Marif, 1979. Muammad Ibn amza al-Kirmn (m. 1111), Asrr al-takrr f l-Qurn, Le Caire, Dr alfala, 1977. all al-Dn al-Suy (m. 1505), Asrr tartb al-Qurn, Le Caire, al-Maktaba al-ariyya li-liba wa-l-nar, 2003. Ibn ihb al-Zuhr (m. 741), Kitbu tanzli l-Qurn, Beyrouth, Dr al-kitb al-jadd, 1980.

Sources modernes
BLACHRE R., 1958, Introduction au Coran, Paris, Maisonneuve et Larose. CHOUMI M., 1966, Le verbe dans le Coran, Paris, Klincksieck. DROCHE F., 2005, Le Coran, Paris, PUF (Que sais-je ?). HUMBERT G., 1980, Essai dinterprtation linguistique des conventions orthographiques du Coran (dition gyptienne) , mmoire de matrise (non publi), Universit Paris 8. KOULOUGHLI D. E., 1982, Sur la phonographmatique arabe, Analyses/thorie, n 1, p. 79-151. 1994, Grammaire de larabe daujourdhui, Paris, Presse Pocket. LANCASHIRE I. et al., 1996, Using TACT with electronic texts, New York, The Modern Language Association of America. MARDRUS J.-C. (traducteur), 1899, Les Mille et une Nuits, Paris, Laffont. MONROE J. T., 1972, Oral composition in pre-islamic poetry , Journal of Arabic Literature, vol. III, p. 1-54. NLDEKE T. et Schwally F., 1909/1919/1926, Geschichte des Qorans, Leipzig, Dieterich'sche Verlagsbuchhandlung. Traduction arabe : Tr al-Qurn, 2004, Beyrouth, KonradAdenauer Stiftung. SALEM A. et al., 2005, Lexico3, quipe CLA2T, Universit Paris 3.

23. Pour une tude dtaille des racines verbales du Coran, voir Choumi (1966).

73

Das könnte Ihnen auch gefallen