Sie sind auf Seite 1von 13

Exploration textomtrique dans le paysage plurilingue

de la presse algrienne francophone

Zina Icheboudene 1, Margareta Kastberg Sjblom 2


2LASELDI EA2281, Universit de Franche-Comt, UFR SLHS, 30, rue Mgevand, 25030
Besanon cedex, zina.icheboudene@univ-fcomte.fr
2ATST, Centre Jacques Petit, EA3187, Universit de Franche-Comt, UFR SLHS, 30, rue
Mgevand, 25030 Besanon cedex, margareta.kastberg@univ-fcomte.fr

Abstract
The purpose of this paper is to perform a study with focus on the Algerian Francophone press in a sociolinguistic
perspective.
The sociolinguistic situation in Algeria is characterized by the coexistence and the constant exchange between
several languages: Standard or Literary Arabic, Regional Arabic (Algerian dialects), Berber Languages and
French. The presence of two or more languages within one single communication occasion or in the same article
is a characteristic of todays Francophone Algerian press.
The study is carried out exploring a large contemporary corpus extracted from three Algerian daily newspapers
edited in French during six months. The extraction of loanwords and the identification of all lexical items issued
from the different local languages in the corpus is an important step in this study and are carried out with the new
tool Ictena. The exploration with the Hyperbase tool allows the extraction of lexical forms and tokens, statistically
specific for this corpus, as well as isotopy correlations, networks and constellations, and makes it possible to
observe, at a semantic and at a lexical level, the various associations between the different items of the corpus. This
exploration makes it possible, not only to observe and to distinguish the thematic fields of the different plurilingual
components of the corpus, but, furthermore, to characterize and describe the characteristics of the code-switching
procedure.

Rsum
Cette tude sintresse ltude de la presse francophone en Algrie dans une perspective sociolinguistique.
La situation sociolinguistique en Algrie est marque par la coexistence et le contact sur le terrain de plusieurs
langues: larabe littraire, larabe dialectal (algrien), le berbre avec ces diffrentes varits et le franais. La
prsence de deux ou mme de plusieurs langues lintrieur dun mme discours est une caractristique de la
presse algrienne francophone, o le contact entre les langues est omniprsent.
Lobjectif est lanalyse dun corpus de presse algrienne francophone et ltude de limpact du plurilinguisme. Il
sagit plus prcisment de la constitution dun grand corpus de presse algrienne francophone contemporaine, de
la dtection et du recensement de tous les items lexicaux provenant des idiomes locaux dans le corpus.
Lanalyse textomtrique, lexploration textuelle et lanalyse statistique permettent dtudier la distribution de ces
emprunts, leurs corrlats et leurs contextes. Lextraction automatique des collocations et des univers cooccurrentiels
permet aussi dtudier les constellations thmatiques de ces emprunts dans les diverses situations dinterfrence
linguistique. Les rsultats permettent de caractriser de manire prcise une typologie de discours bien particulier
dans un contexte plurilingue.

Mots-cls: analyse de discours, corpus, presse, distribution lexicale, emprunts, contact des langues.
502 Zina Icheboudene, Margareta Kastberg Sjblom

1. Introduction
La situation sociolinguistique en Algrie est marque par la coexistence et le contact sur le
terrain de plusieurs langues: larabe littraire, larabe dialectal (algrien), le berbre avec ses
diffrentes varits et le franais. En effet, la langue franaise est toujours prsente dans la
socit algrienne, aussi bien loral qu lcrit. Elle est mme perue comme la langue du
savoir et de louverture. Le franais est toujours la langue vhiculaire dans certains secteurs-
clefs de la socit en loccurrence: ladministration, lconomie, lenseignement suprieur et
certains mdias.
Le contact de la langue franaise avec les langues locales en Algrie a donn lieu des situations
dinterfrences linguistiques qui se traduisent par plusieurs phnomnes: les emprunts lexicaux,
lalternance codique, les nouvelles formulations syntaxiques, etc.
La prsence de deux ou mme de plusieurs langues lintrieur dun mme discours est
notamment une caractristique de la presse algrienne francophone, o le contact entre les
langues est omniprsent.
Lvolution de la presse crite en Algrie est lie lvolution du systme politique du pays:
partir de 19621 le pouvoir en place a exclu toute presse indpendante et libre ou dopinion
partisane. Ladoption dune constitution pluraliste en fvrier 1989 (Cheurfi, 2008), et la leve
du monopole gouvernemental sur la presse crite ont provoqu lmergence dune presse prive
et partisane. Cette dernire considre que le nationalisme et le patriotisme ne constituent pas un
frein louverture de lAlgrie sur le monde et une reconnaissance du plurilinguisme.
partir des annes 902, avec le changement du code de linformation, on constate une mutation
profonde de la presse crite, avec la cration de dizaines de quotidiens, dhebdomadaires et de
mensuels de statut priv dits en arabe et en franais. Selon les statistiques officielles de 2008
33 titres sont publis en franais et 32 en arabe.
Lobjectif de notre tude est lanalyse dun corpus de presse algrienne francophone et ltude
de limpact du plurilinguisme. Il sagit plus prcisment de constituer un grand corpus de
presse algrienne francophone contemporaine, de dtecter tous les items lexicaux provenant
des idiomes locaux (larabe et ses varits, ou le berbre et ses varits) dans les discours de
cette presse et de les recenser avec laide de plusieurs logiciels pour pouvoir les analyser dans
leurs contextes.
Le logiciel textomtrique, avec ces fonctions statistiques et hypertextuelles, permet de
situer les apparitions de ces emprunts dans le corpus et de comparer les diffrentes variantes
morphosyntaxiques. Lextraction automatique des univers cooccurrentiels et des collocations
permet aussi dtudier les constellations thmatiques de ces emprunts dans les diverses situations
de leur intgration.

1 La proclamation de lindpendance de lAlgrie a eu lieu le 3 juillet 1962.


2 Le changement du code de linformation et le lancement dune presse prive et indpendante datent du 3
avril 1990.
Exploration textomtrique 503

2. Constitution dun corpus de presse


Le corpus de cette tude est compos de lensemble des articles des trois quotidiens algriens
gnralistes en langue franaise: Libert, El-Watan, et Le Quotidien dOran. Il comprend les
ditions quotidiennes sur une priode de six mois, du 08 septembre 2008 au 08 mars 2009,
reprsentant au total 423 ditions.
Le recueil de ces donnes sest fait travers les sites internet de ces quotidiens qui proposent
ldition du jour en format PDF . Afin de constituer un corpus exploitable, nous avons
procd en diffrentes phases de travail: dcoupage du journal en articles laide du logiciel
Adobe Photoshop, ocrisation avec le logiciel Abbyy FineReader, pour convertir les documents
en deux formats exploitables txt et html.
Nous avons retenu tous les articles de lensemble des rubriques, et avons seulement exclu les
pages intgralement rserves la publicit.
Les textes du corpus sont repartis en trois sous-corpus de tailles relativement homognes. A
lintrieur de chacun de ces trois corpus se dclinent 141 ditions (correspondant au nombre
de parutions sur la priode de six mois choisie) et un grand nombre darticles assez variable
dun journal lautre. Les diffrences dans le nombre darticles et le nombre doccurrences
sexpliquent par la diffrence de nombre de pages des ditions, qui varie dun numro lautre:
entre 18 et 30 pages pour El-Watan, de 30 32 pour le Quotidien dOran, et de 20 26 pour
Libert.
Ce corpus a t trait et explor avec plusieurs logiciels. La segmentation du corpus a t
ralise avec deux logiciels: ASTADIAG (pour Astartex et Diatag) 3 et Ictena4. Une lecture de 423
ditions de ces trois quotidiens laide dIctena et travers la totalit de leurs articles, nous a
permis de recenser 13.130.531 occurrences.

Journal Nombre dditions Nombre darticles Nombre doccurrences


Libert 141 8506 3.569.219
El-Watan 141 12221 4.978.985
Le-Quotidien dOran 141 10398 4.582.327
Total 423 31125 13.130.531
Tableau 1: Le corpus

Lexploration statistique des donnes a t effectue avec le logiciel Hyperbase, dans sa


version rcente 9.0. Ces logiciels de traitement quantitatif des grands corpus textuels autorisent
un ensemble de traitements sur des corpus de textes prdfinis et numris. Lexploration

3 Environnement dvelopp par J.-M. Viprey, laboratoires ATST Archives, Textes, Sciences des Textes
(EA 3183) et LASELDI Laboratoire de Smio-linguistique, Didactique, Informatique (EA 2281), Universit de
Franche-Comt, (http://laseldi.univ-fcomte.fr/document/viprey/page_JMV.htm).
4 Interface de Consultation de Textes numriques en vue de lAnalyse, dvelopp par N. Salzard, et Ph.
Schepens, LASELDI Laboratoire de Smio-linguistique, Didactique, Informatique (EA 2281),Universit de
Franche-Comt, http://laseldi.univ-fcomte.fr/ictena/DOC/documentation.php.
504 Zina Icheboudene, Margareta Kastberg Sjblom

statistique donne la possibilit danalyses statistiques diverses, non seulement traditionnelles,


mais galement plus spcifiques et qui nous semblent convenir notre tude prcise, ce qui
motive lutilisation complmentaire de plusieurs logiciels.
Lanalyse des spcificits lexicales aussi bien dun point de vue endogne quexogne (en
comparaison avec donnes du corpus Frantext), le calcul des cooccurrences et lextraction
des corrlats thmatiques constituent en effet des outils prcieux dans une tude de caractre
sociolinguistique. Etant donn laspect dinterfrence entre items lexicaux franais et dautres
en arabe et en berbre, nous avons choisi de travailler sur les formes graphiques et de ne pas
avoir recours la lemmatisation.

3. Dtection des items lexicaux trangers la langue franaise


Afin de dtecter les items lexicaux trangers la langue franaise dans notre corpus, nous
lavons confront un dictionnaire de rfrence, celui de DiaTag, strictement ddi au franais
moderne et contemporain (Lethier et Viprey, 2008). Diatag sintgre dans lenvironnement
Astartex, ddi lexploration assiste elle-mme, et aux calculs statistiques.
Lapplication et lanalyse de DiaTag nous ont permis lidentification initiale des items inconnus
dans le corpus. En se rfrant au dictionnaire nous avons identifi 133.633 formes et 536.801
occurrences inconnues, cest--dire environ 4.1% du volume total. Ces formes correspondent
des mots que le dictionnaire du logiciel Diatag ne connait pas; il sagit de:
- mots trangers (arabe, berbre, anglais, espagnol,),
- nologismes,
- noms propres.
Naturellement, on trouve aussi des fautes et des coquilles, ce problme provient de larchitecture
mme des articles de presse en colonnes, de tailles et de positions diffrentes, en format PDF,
qui ncessite le dcoupage et locrisation des articles.
Afin dobtenir la liste des items lexicaux en langues locales dAlgrie prsents dans notre
corpus, nous avons procd au nettoyage de la liste et avons slectionn tous les mots issus de
larabe et du berbre: les emprunts, les nologismes et les termes hybrides.
En effet, nous avons relev plusieurs types de mots provenant des langues locales. Principalement,
il sagit de tous les emprunts de larabe ou du berbre, comme chouhada (martyrs) moudjahiddine
(combattants), hogra (injustice, abus) et Kafala5, etc. En outre, nous avons relev des items
hybrides qui portent des marques de drivations morphologiques, syntaxiques ou smantiques,
des mots en langue locale contamins par le franais (prfixation, suffixation, adjonction de
dterminants, de marque de genre et de nombre, etc.), par exemple: taxieur (pour chauffeur de
taxi), ramadhanesques (relatif au ramadhan, exemple: les soires ramadhanesques), ex-wali
(ex-prfet), etc.
Nous avons pu remarquer que ces items dtects dans le corpus font souvent rfrence des
champs smantiques bien caractristiques, renvoyant lidentit algrienne.

5 Loi musulmane qui prcise et rglemente les conditions lgales pour ladoption denfants abandonns.
Exploration textomtrique 505

4. Classification des mots empruntsou drivs


A la suite de la segmentation de Diatag nous avons constitu un inventaire des mots emprunts
qui font rfrence diffrents champs smantiques bien spcifiques ; les termes les plus
reprsentatifs font rfrence :
la religion musulmane: zakate6, fetwas7, tarawih8, kafala, rahma9, zaouas10, iftar, etc.,
sont des emprunts qui dsignent les pratiques religieuses.
les administrations et institutions : dara, wali, wilaya, mouhafadha, mouhafedh,
houkouma echab, etc., se rfrent la division administrative et aux fonctionnements
institutionnels de lAlgrie.
lespace et les lieux: dechra, houma, hay, douar, madina,
lart, la culture et les traditions: chabie, hawzi, assaouia, melhoun, qacidate, nali,
zorna, maqam, qada, seroual, zerda, meda, khema etc., regroupent tous les emprunts
relatifs aux chants traditionnels, aux styles musicaux, aux tenues vestimentaires et aux
diffrentes pratiques culturelles
la gastronomie: zlabia, frik, zitoune, hrira, diouls, baklaoua, bourek
la ralit sociale: harraga, harga, hogra, khouya, zawali, guellil etc., viennent pour la
plupart du langage populaire (dialectes arabe et berbre).
En examinant cet inventaire, nous avons pu constater que les journalistes de la presse algrienne
francophone ont souvent recours aux langues locales pour dsigner ou dnoter une ralit propre
lenvironnement social et culturel qui caractrise la socit algrienne.
La distribution de ces emprunts nest pas rgulire dans le corpus. La distribution des frquences
de ces termes lintrieur de notre corpus constitu des trois quotidiens, calcule par le logiciel
Hyperbase, permet de constater des diffrences notables. Durant le premier mois de notre
corpus (septembre 2008), nous notons en effet une frquence importante des emprunts relatifs
la religion musulmane, la gastronomie, lart et la culture algriens. Il sagit en effet de la
priode de ramadhan11, qui stale sur trente jours.
La frquence de ces termes emprunts est galement noter pendant deux autres mois de la
priode observe, bien quelle reste en de du seuil significatif de 5%. Il sagit premirement
du mois doctobre 2008, le mois o les Musulmans ftent la journe de lAd12 et deuximement
du mois de mars 2009 quand a eu lieu la fte religieuse appele Mawlid an-Nabawi, jour
danniversaire de la naissance du Prophte Mohamed13.

6 Aumne distribue loccasion de la fin du ramadhan aux pauvres.


7 Discours dun spcialiste de loi musulmane portant un avis religieux.
8 Prire facultative excute chaque soir du Ramadan.
9 Charit, piti, clmence.
10 difice religieux musulman.
11 Mois lunaire pendant lequel les musulmans doivent sastreindre labstinence (nourriture, boisson, tabac,
relations sexuelles) entre le lever et le coucher du soleil.
12 Fte religieuse musulmane consacrant la fin du jene du mois de ramadhan.
13 Douzime jours du troisime mois du calendrier musulman.
506 Zina Icheboudene, Margareta Kastberg Sjblom

Ces priodes sont marques par des pratiques religieuses particulires et par un changement dans
les habitudes culinaires, sociales et conomiques des Algriens, do limportance accorde par
les journalistes ce vocabulaire emprunt aux langues locales lintrieur dun discours en
langue franaise.
Une grande partie des items arabes font en effet rfrence la religion musulmane. La
distribution de frquences relatives de lensemble de termes : Tarawih , Zakat 14,
Kafala, fatwa,rahma reflte trs bien laffluence de ces termes dans la partie initiale
de la priode tudie:

Figure 1: Distribution des frquences relatives des termes religieux dans El-Watan

La motivation de lintroduction de ces emprunts dans le discours franais est assez claire: les
journalistes ont besoin dintgrer des mots pour exprimer des notions non rpertories dans la
langue franaise, ou bien pour dsigner des rfrences propres la culture arabo-musulmane.
Toutefois, non seulement lapparition demprunts isols dans le corpus est caractristique de ce
corpus, mais lenvironnement lexical qui les entoure lest galement.

14 Aumne distribue loccasion de la fin du ramadhan aux pauvres.


Exploration textomtrique 507

5. Cooccurrences
Lapparition de lexies empruntes est souvent trs lie des contextes particuliers; prenons
par exemple un emprunt larabe littraire; le mot rahma. Il sagit dune notion religieuse qui
dsigne la charit, la clmence et la compassion. Lanalyse des contextes autour des apparitions
de ce terme nous permet de constater quil est trs frquent pendant la priode du ramadhan.
Dans la socit algrienne rahma est aussi utilis pour qualifier lesprit gnreux des pratiquants
qui sinvestissent dans la cration des restaurants appels matham el rahma, correspondant
aux restaurants du cur en France. Ces restaurants sont considrs comme un refuge pour
les pauvres et les personnes sans familles.
Lanalyse de la cooccurrence des deux items montre une forte corrlation des deux occurrences.
La figure ci-dessous montre des exemples en contextes.

Figure 2: Contextes de la cooccurrence ramha et restaurant dans Libert

Ces exemples illustrent bien la lexicalisation dune constellation fige en deux langues.
Le restaurant en franais et le rahma en arabe littraire prennent dans le franais algrien
aujourdhui un sens particulier.
Ces collocations et lexicalisations des deux items de deux langues diffrentes sont frquentes
et trs caractristiques de la presse algrienne francophone. Le mot rahma ici renvoie une
ralit religieuse et sociale lie, dans la plupart de ses appariations, au mois de ramadhan, que
lexpression resto du cur ne pourrait reflter ou intgrer.
508 Zina Icheboudene, Margareta Kastberg Sjblom

En outre, dans ce contexte, le phnomne demprunt du mot rahma se manifeste comme un


ancrage pour marquer lidentit culturelle et religieuse du pays travers les discours de la
presse. Il est galement intgr dans ces discours pour caractriser le mois de ramadhan comme
priode daide entre la population et le nomm mois de rahma:
Quel que soit le degr de la faute, nous estimons que les sanctions sont trs disproportionnes
et surtout en plein mois de la rahma o doivent se multiplier les gestes de solidarit. (Libert,
le 08/10/2008)

6. Associations thmatiques
Lutilisation demprunts arabes ou berbres, omniprsents dans le discours de la presse
algrienne francophone, a en effet une forte valeur identitaire. Nous avons galement relev
un nombre important demprunts dont lquivalent existe dans la langue franaise; tel est le
cas des mots hogra (injustice ou abus), chahid (martyr), chabab (jeunes), khama (tente ou
guitoune); dechra (village) et bien dautres.
Pour illustrer ce phnomne, nous avons choisi lexemple du mot de larabe dialectal hogra.
Cet item nous semble intressant, non pas par sa frquence relativement limite (88 occurrences),
mais par son emploi bien particulier dans le discours journalistique algrien et des moments
discursifs (Moirand, 2007) bien particulier. En effet, lanalyse de lenvironnement lexical qui
entoure litem et la comparaison de cet univers lexical avec celui dune de ses quivalents dans
la langue franaise injustice permet de constater des diffrences notables.
Au-del de ltude de la simple cooccurrence, le logiciel Hyperbase permet lextraction
dune association thmatique, dun microcosme cooccurrentiel dune autre manire. Grce
lextraction automatique du contexte dun item lexical, ici hogra, le programme cre un sous-
corpus qui est soumis un calcul de spcificit, puisquon ne recherche plus une relation entre
un mot et un texte, mais une relation privilgie entre les mots eux-mmes - ce que mesure aussi
le calcul de corrlation. Cependant la procdure ne se rduit pas ici deux mots confronts,
mais lensemble indfini de tous les mots qui peuvent se trouver dans lentourage dun mot
(ou dun groupe de mots) quon dfinit comme tant le ple, comme ici hogra.
Exploration textomtrique 509

Figure3 Association thmatique partir du ple hogra

Les mots en rouge correspondent ici des nuds de forte frquentation, et ceux en noir
des nuds moins frquents, nayant pas de contact direct avec le mot-ple. Les traits gras
correspondent aux cooccurrences directes avec le ple, et les traits fins aux cooccurrences
indirectes, cest--dire en cooccurrence avec les cooccurrents.
Les liens les plus forts du hogra sont pays, tramway, jeunes, marre, injustice, chmage,
soulvement et revendication. Le graphique permet aussi de recenser les liens quentretiennent
les cooccurrents avec dautres items lexicaux, hogra tant li labus, laide etc.
La mme analyse de lquivalent franais injustice montre des rsultats assez diffrents. Ici
le calcul est effectu de la mme manire que dans le calcul de tout lheure, cest--dire le
paragraphe entourant le ple injustice.
510 Zina Icheboudene, Margareta Kastberg Sjblom

Figure 4: Association thmatique partir du ple injustice

Les cooccurrents les plus forts de injustice sont flagrante, syndicats, Chirac, notaires, commerant
et Liban. Autour du mot Liban gravitent les termes faisant rfrence lactualit politique
internationale: Palestinien, occidental, conflit et attaque. Cest peu prs la mme constellation
cooccurentielle que lon obtient lorsque lon analyse la presse franaise contemporaine.
En revanche la constellation thmatique qui gravite autour de horga est fortement connote.
Le terme est gnralement employ dans les articles traitant les problmes de caractre social
en Algrie.
Il est frquemment employ pour dsigner larbitraire des dcisions officielles et les abus
dautorit. Le terme dnote en effet le mpris des pouvoirs publics envers les jeunes:
Selon certains tmoignages, la gestion douteuse des postes entrant dans le cadre du social,
la marginalisation et la hogra taient lorigine de cette vague de violence. (El Watan, le
05/10/2008)

Elles avaient pour toile de fond le chmage, la hogra, des jeunes revendiquaient leur droit.
(Libert, le 23/02/2009)

Les journalistes ont aussi recours ce terme pour dfinir linjustice envers les femmes:
Le contrat de mariage pour viter la hogra (El Watan, le 28/10/2008)
Exploration textomtrique 511

Les associations fminines schinent dnoncer la hogra, les violences et les exactions
quotidiennes (Le Quotidien dOran, le 08/03/2009)

Lmigration clandestine est un autre problme dactualit en Algrie. Le mot harraga, qui
signifie migr clandestin, est un terme populaire qui fait parti du nouveau lexique merg
dans la socit algrienne ces dernires dcennies.
Il sagit dun nologisme qui vient de larabe, cr partir du verbe brler qui donne le
nom les brleurs . Il est employ pour qualifier ces jeunes algriens qui brlent leurs
papiers, leurs pass, et qui traversent les frontires clandestinement pour rejoindre les
ctes europennes. Cest un terme qui a galement attir notre attention par sa haute frquence
dans le corpus: 594 occurrences. Dans le mme contexte nous avons relev le terme harga,
cest ainsi quon appelle le faitde fuir le pays clandestinement. Il est fort intressant de
constater la cooccurrence des termes hogra et harga qui ensemble acquirent un sens particulier
et une valeur quasi-proverbiale.
Nous avons relev dans le corpus les exemples suivants o les journalistes jouent sur la sonorit
des deux mots hogra et harga:
Immigration Entre hogra et harga (Immigration entre injustice et fuite)
(le Quotidien dOran, le 02/03/2009)

Que diraient nos valeureux chouhada sils pouvaient revenir et voir les nouveaux maquis
de la dsesprance, de la drogue, du suicide, de la hogra et de la harga pour un
quignon de pain, du banditisme en col bien blanc? (Le Quotidien dOran, le 15/10/08)

Les journalistes emploient en effet ces deux termes harga et hogra pour donner une dimension
sociopolitique aux situations complexes auxquelles est confronte la jeunesse algrienne, le
mpris, linjustice et lmigr clandestin. Ces jeunes se retrouvent donc devant un
choix difficile: soit continuer vivre dans le pays, soit aller la recherche dune porte pour fuir.
Le choix des journalistes demployer des termes propres la ralit sociale algrienne peut
tre considr comme une stratgie pour sapprocher du lecteur algrien (ouvrier- chmeur-
retrait- jeunes diplms), proccup par les problmes du quotidien, et touch par la crise
sociale qui traverse le pays.
En ayant recours des mots commehograet harga, les journalistes participent la cration
dun code spcifique que seul un lecteur algrien peut dchiffrer, et qui chappe aux autres
lecteurs francophones.

7. Variations morphosyntaxiques
Une autre caractristique trs particulire de ces items lexicaux est la variabilit de leurs
transcriptions graphiques. En effet, aucune forme nest retenue comme la seule et unique
pour la transcription des mots emprunts ou des nologismes dialectaux. Cela peut se traduire
par labsence dune norme, comme lindique un des journalistes de quotidien El Watan lors
dun entretien nous ne possdons pas une charte orthographique qui nous oriente dans la
transcription de ces mots qui ne sont pas intgrs dans la langue franaise.
512 Zina Icheboudene, Margareta Kastberg Sjblom

Les emprunts larabe sont gnralement transcrits littralement. Certains emprunts prennent
deux ou mme plusieurs formes graphiques, cest le cas de tarawih, tarawihs et taraouih,
fetwa et fatwa, hay et hai, etc. Cette variabilit des transcriptions peut tre explique par les
caractristiques dintgration phonologique qui peuvent varier considrablement en Algrie.
Ces variations constituent une grande difficult dans lanalyse lexicomtrique et mettent parfois
en cause la fiabilit des rsultats, de la mme manire que dans les tudes statistiques des corpus
en ancien franais (Brunet, 2009). Cependant, ltude des variantes graphiques ouvre la voie
des tudes sociolinguistiques et dialectales et permet de constater que ces variations sont
souvent lies des diffrences dialectales entre lOuest et lEst, et des origines arabophones
ou berbrophones des locuteurs du pays ainsi qu la grande disparit sociale.
On constate ce mme manque dhomognit dans lusage du pluriel, qui est indiqu
diffremment en arabe et en franais. Nous trouvons parfois un -s indiquant un pluriel et
parfois un pluriel sans indicateur graphique.
Que la dcision de lEtat de pnaliser lacte dmigrer clandestinement est absurde quand
on sait que des jeunes harraga mettent volontairement leur vie en pril en se jetant leau.
(Le Quotidien dOran, le 16/09/08)

A Montlimar, prcisment - la ville du nougat -, ces harragas du pass, sans logement ni


nourriture, dmunis face au froid, se voient rduits la pire misre. (El Watan, le 9/10/08)

8. Conclusion
Lobjectif de cette tude ntait pas de traiter tous les aspects de la presse francophone algrienne.
Il sagit ici dune exprience qui sintresse un aspect spcifique : relever et tudier les
emprunts des langues locales dans un corpus en langue franaise. Lexploration de plusieurs
logiciels sest ici rvle dune grande utilit. Lexploration dIctena, interface du dictionnaire
du logiciel Diatag, a rendu possible le recensement efficace des termes trangers lintrieur du
corpus. Le logiciel Hyperbase, avec ses fonctions hypertextuelles et statistiques, nous a permis
dtudier linterfrence des langues arabe et berbre ainsi que leurs diffrents dialectes.
Cette tude montre bien que le processus dintgration des mots de langues locales dans les
discours de la presse algrienne francophone est souvent lexpression de lvolution sociale.
Une grande partie de ces mots traduit les diverses mutations connues par les diffrentes
communauts linguistiques algriennes. En outre, le recours aux termes des langues locales
dont les quivalents peuvent exister dans la langue franaise apparat comme un procd
didentification linguistique, un ancrage dans la socit et dans la culture algriennes. En
effet, la plupart de ces termes traduisent les diverses mutations connues par les communauts
linguistiques algriennes. Le recours lemprunt devient ainsi ncessit, car parfois le contenu
smantique de leurs quivalents dans la langue franaise ne couvre pas la mme ralit quen
arabe, ou na pas la mme profondeur. Ces termes tmoignent donc de la prsence importante
dune mmoire collectiveet dune volont dafficher une identit linguistique. Selon Charaudeau
(1997), le discours de la presse est sans doute le lieu de construction dun miroir social.
Ces mots emprunts fonctionnent discursivement en tant que marques lexicales de la situation
socioculturelle algrienne. Les journalistes y ont recours pour vhiculer des reprsentations
propres lespace gographique et socioculturel algrien.
Exploration textomtrique 513

Rfrences
Adam J.-M. (2005). La Linguistique textuelle. Introduction lanalyse textuelle des discours. Paris,
Armand Colin.
Brunet E. (2009). Compte dauteurs, Tome 1, Etudes statistiques de Rabelais Gracq. Paris, Honor
Champion
Charaudeau P. (1997) Le discours dinformation mdiatique: la construction du miroir social. Paris,
Nathan.
Cheurfi A. (2008). La presse algrienne: gense, conflit et dfis. Alger, Casbah ditions.
Dubois J., et al. (1973). Dictionnaire de linguistique. Paris, Larousse.
Kastberg Sjblom M. (2008) Attirance thmatique: frquences ou squences? Extraction des isotopies
smantiques dun corpus textuel, 5mes Journes de Linguistique de Corpus, G. Williams (d.),
Universit de Bretagne Sud, Lorient, web.univ-ubs.fr/corpus/jlc5/ACTES/ACTES_JLC07_kastberg.pdf
Kastberg Sjblom M. (2010). Costellazioni tematiche in un corpus letterario italiano, JADT 2010,
10e Journes internationales dAnalyse statistique des Donnes Textuelles, S. Bolasco (d.), Roma,
Edizioni Universitarie di Lettere Economia Dritto
Lethier V. & Viprey J.-M. (2008). Annotation linguistique de corpus : vers lexhaustivit par la
convivialit. In Heiden S. et Pincemin B. (ds.) JADT09, 9mes Journes internationales dAnalyse
statistique des Donnes Textuelles, Lyon, Presses Universitaires de Lyon.
Moirand S. (2007). Les discours de la presse quotidienne : observer, analyser et comprendre, Paris,
Presse Universitaire de France.
Viprey J.-M. (2005). Philologie numrique et hermneutique intgrative, In Adam J.-M. et Heidmann
U. (ds.) Sciences du texte et analyse de discours: enjeux dune interdisciplinarit, Genve, Slatkine.
Viprey J.-M. (2006) Structure non-squentielle du texte . In Langages n163 - Unit(s) du texte.
Paris, Arman Colin.

Das könnte Ihnen auch gefallen