Beruflich Dokumente
Kultur Dokumente
Abstract
Reinert Max - "Lexical worlds" and their "logic" through the statistical study of a body of nightmare narratives.
The French school of data analysis, strongly influenced during the seventies by the work of J.P. Benzcri, owes much to his
interest in language data. The development of desk-top publishing and the spreading of texts thanks to computers have
revitalized this line of research by what is usually called the "statistical analysis of textual data" (Lebart, Salem, 1988). In this
article, the author presents his work and questions in the field : the Alceste method and the notion of lexical worlds (which are
central to the proposed strategy). The presentation is backed up by a specific application: the analysis of a body of 212 accounts
of nightmares.
Rsum
L'cole franaise d'analyse des donnes, fortement marque dans les annes soixante-dix par les travaux de J.P. Benzcri, doit
beaucoup aux inttts de celui-ci pour le matriel textuel. Le dveloppement de la microinformatique et la diffusion des textes par
ordinateur ractualisent ce courant de recherche travers ce qu'il est convenu d'appeler "l'analyse statistique des donnes
textuelles" (Lebart, Salem, 1988). Dans cet article, l'auteur prsente ses travaux et ses interrogations dans ce domaine : la
mthodologie Alceste et la notion de mondes lexicaux (qui est au centre de la stratgie propose). Cette prsentation est
effectue travers une application particulire : l'analyse d'un corpus de 212 rcits de cauchemars.
Max REINERT
Universit de Toulouse-Le Mirail
MAX REINERT
Cooccurrents dans les Enoncs Simples d'un Texte). Nous dsirons don
ner ici un aperu de nos objectifs et esprons, de cette manire, ou
vrir un dbat sur le statut des "objets" cernables travers ce type
d'approche statistique pour le sociologue ou le linguiste. On pr
sentera
:
1) En introduction, quelques rflexions et interrogations sur le
sens de la dmarche Analyse des Donnes pour l'analyse de corpus
de textes.
2) La mthodologie "Alceste" et la notion de mondes lexicaux
(qui est au centre de la stratgie propose).
3) Les principaux rsultats de l'analyse d'un corpus de rcits de
cauchemars.
4) Un essai d'interprtation : on ne souhaite pas tant mettre en
valeur des rsultats particuliers que de prsenter, travers eux, une
articulation des notions voques en (2).
MAX REINERT
des donnes a un objectif voisin de celui de l'analyse distributionnelle : non pas chercher le sens d'un texte mais dterminer comment sont
organiss les lments qui le constituent, mme si les notions de distr
ibutions
et d'lments utilises par Z.S. Harris sont diffrentes.
On sait que l'objectif initial du distributionnalisme (Bloomheld,
sous l'influence du behaviorisme, objectif repris par Harris ensuite)
tait de runir un corpus constitu par un ensemble d'noncs mis
par les utilisateurs d'une langue donne, ensemble aussi vari et ex
haustif
que possible, puis, d'en relever les rgularits afin d'en d
duire,
sans prsupposition, les lois de la grammaire. Si cet objectif ne
put tre atteint, Harris s'aperut que cette technique pouvait tre ef
ficace
pour dgager des structures textuelles refltant des lois de
production d'un texte particulier (c'est--dire d'un discours) :
L'analyse distributionnelle l'intrieur d'un seul discours, considr indiv
iduellement,
fournit des renseignements sur certaines corrlations entre la
langue et d'autres formes de comportement. et aussi II rsulte de tout ce
qui prcde que notre mthode devra tablir les occurrences d'lments et
en particulier les occurrences relatives de tous les lments d'un discours
dans les limites de ce seul discours. (1952)
10
MAX REINERT
I I
12
MAX REINERT
13
14
MAX REINERT
15
16
dence sur les rsultats obtenus ici, le vocabulaire "plein" utilis par
les adolescents n'ayant pas t modifi dans cette retranscription
(vocabulaire plein sur lequel porte l'analyse "Alceste") 17.
Concrtement, le corpus 18 que nous avons tudi se prsente
sous la forme d'"noncs lmentaires" d'une ligne maximum, ainsi
que l'extrait ci-dessous le montre 19:
*** *0011 *P_Paris_lalque *A_12ans *S_garon *rveil *repet
Je me sens soulev, transport devant un puits sans fond ;
De l, je me sens tomber dans ce puits ;
Je pousse des cris ,** *0021 *P_Paris_laique *A_12ans *S_garcon
Je suis dans une charrette remplie de serpents ;
Je n'ose bouger ;
3.2. La mise en oeuvre opratoire20
L'objectif est d'obtenir un dassetnent des noncs d'un corpus donn en
fonction de la ressemblance ou de la dissemblance statistique des
iexhnes qui les composent afin de mettre en vidence des mondes lex
icaux.
Au niveau technique, ces "ressemblances et dissemblances"
17. Les rsultats obtenus sur le corpus des cauchemars constitu par M. Zlotowicz, tel
qu'il a t retranscrit dans son livre. Leur proximit avec les rsultats prsents
confirmerait plutt la faible incidence de cette retranscription sur nos rsultats.
18. Le corpus tudi regroupe 212 rcits de cauchemars, d'adolescents de 12, 14 ou 16 ans,
garons ou filles, habitants de la rgion parisienne ou du Limousin et frquentant des
coles laques ou judaques, avec une rpartition homogne des rponses dans les dif
frentes
catgories ainsi constitues comme le montre le tableau ci-dessous :
Paris (EL)
Paris (EJ)
Limousin
12
11
12 ans G
12
12 ans F
12
11
12
14 ans G
11
12
12
14 ans F
12
11
12
16 ans G
12
12
12
16 ans F
12
12
12
Cette composition particulire de la population n'a d'ailleurs pas d'importance
pour cette prsentation. En effet l'influence des variables proposes, bien que non
ngligeable, est assez rduite comme suffit d'ailleurs le montrer le lien entre les r
sultats
obtenus ici avec ceux de M. Zlotowicz tablis partir d'un autre corpus (en
fants parisiens de 5 12 ans).
19. Certaines notations particulires ont t adoptes : "I" pour "il" ou "ils" , dans le
cas. o ce pronom remplace un "agresseur" potentiel ; "ne" pour "ne... pas" ; "por
te*"quand il s'agit du nom et non du verbe, etc. . .
20. Les analyses ont t effectues avec la version 2.0 du logiciel "Alceste".
17
18
MAX REINERT
19
Classe 1
(639 uce)
mere*
dire .
seul<
famille*
cour i r .
venir .
passer .
aime+
tour
parents*
chien+
retrouve+
tuer .
faire .
donne+
maisont
ami +
camarade+
gens
train
aller.
mettre .
revenir .
attrape+
sauve+
mourir .
entendre .
i
Classe 2
(263 uce)
blanc+
grand+
chambre
fentre
yeux
rentr+
recouvert+
enfonce+
regarde+
ressembl+
voir .
noir<
gros+
lit
plafond
animal<
lumiere+
main+
f emme+
f erme+
emmene+
devore+
imrnense+
ouvrir .
rouge+
pet it +
ef f ra
porte*
couteau
homme+
f orme+
i
i
Classe 3
(211 uce)
eau
tombe +
vide+
bateau+
falaise
trou<
pousse
marche+
ecrase+
jeter .
respire+
sol
enfonce*
profond+
passag+
coussin+
surg+
sens
sombre
haut +
cousin*
arret+
cherche+
cr i +
20
MAX REINERT
verbes d'action (courir, faire, venir, aller, mettre, attraper, (se) sau
ver). La distribution des segments rpts (tableau 2) suggre de lier
la rfrence la famille avec la peur de la solitude (je suis tout seul)
et la rfrence l'action avec l'impuissance (je ne peux, je n'arrive).
Classe 2 : De nombreux termes, notamment des adjectifs, sont rela
tifs un monde visuel (tableau 1). D'autre part, 5 noms font direct
ementrfrence des lments de la chambre (chambre, fentre, lit,
plafond, porte) et mme, plus spcifiquement, de la chambre du r
veur
(tableau 2).
Classe 3 : Cette classe trs caractristique regroupe un grand
nombre de mots voquant la chute. Notons la prsence de la forme
"eau", dont les 14 occurrences appartiennent des u.c.e. de cette
classe (c'est la forme la plus caractristique de la classe). L'lment
"eau" est associ la prposition "dans" (tableau 2) : l'eau n'est pas
prsente par sa superficialit mais par sa profondeur.
26. Voici, titre indicatif, la distribution des u.c.e. dans les classes en fonction des ca
ractristiques
de la population :
Cl-1
Cl-2
Cl-3
Intitul
Nbred'u.c.e.
639
263
211
A-12ans
548
252
82
69
A-14ans
572
170
91
79
A-l 6ans
557
217
90
63
P-limousir\
528
77
36
244
P-paris-judaique
628
247
69
95
P-paris-laique
521
148
80
HZ
S-fille
947
341
152
109
730
S-garcon
298
111
102
Par exemple, 252 u.c.e. des 639 de la classe 1 proviennent des rcits des enfants de 12
ans. Cette valeur est en gras, ce qui signifie qu'elle est significativement plus forte
qu'attendue (au sens du chi2. i.e. : chi2 > 3.84 un degr de libert)
II y a une certaine discrimination des populations tudies, ainsi que des ges par
l'analyse mais leur rle dans la dfinition mme des classes ne doit pas tre surestim.
Par exemple les noncs provenant de rcits de la population limousine reprsentent
38% de l'ensemble des noncs de la classe 1. Ce pourcentage devient significatif ici du
fait de l'unit choisie qui est l'u.c.e. et non le rcit. Cela dit, cette discrimination peut in
tres er
le psychosociologue mais nous n'insisterons pas dessus ici.
21
TABLEAU 2
Liste des segments rpts par classe
(frquents plus de 3 fois)
Classe 1
Classe 2
Classe 3
4 la porte* de
6 je ne pouvo i r .
6 dans le eau
6 tout le monde
4 dans mon lit
6 je tombe+ dans
5 je ne arriv+
4 je me trouv<
5 tombe+ dans un
4 a la maison+
4 je suis dans
5 je me sens
4 ne arriv+ a
3 de ma chambre
5 je suis dans
4 je ne arriv+ a
3 dans ma chambre
4 je tombe+ dans un
4 je me promen+
3 par la fentre
3 pousse un cri+
4 je suis avec
3 je voir, des
3 a le eau
4 me dire, que
3 je voir, un
3 du haut+ de
3 pere8 et mere*
3 je ne savoir.
3 dans le vide+
3 de mes camarade+
3 ce sont des
3 je me enfonce*
3 je dire, a
3 je vouloir, me
3 je suis tout
3 je suis tout seul<
3 tous les gens
3 suis tout seul<
La liste des u.c.e. de la premire classe (tableau 3) voque deux
thmatiques : le sujet risque de perdre sa famille ou le sujet est seul et me
nac dans un environnement dangereux.
Dans la seconde classe, la menace est associe des formes indis
tinctes qui grossissent devant lui ou font intrusion dans sa chambre.
Le sujet est passif. Le "je" est principalement suivi du verbe "voir".
Il n'est qu'un regard effray devant ce qui l'envahit. Contrairement
ceux de la premire classe, les personnages voqus sont des i
nconnus
peine humains, imprcis dans leur rle, leur identit, mais
identifis l'aide de nombreux dtails visuels.
Quant la troisime classe, elle est parfaitement homogne : chut
e,cris et anantissement. . . L'anantissement du sujet est associ soit
l'crasement soit sa dissolution dans l'eau. Le sujet perd sa pesan
teurqui est aussi la perte d'un soutien, la perte de toute rfrence.
L'eau est bien le symbole de cette dissolution. Dans sa profondeur
maternante, ne porte-t-elle pas une Ophlie noire, qui est, dit Bachel
ard,comme "une invitation mourir" ?
22
MAX REINERT
TABLEAU 3
Liste des u.c.e. par classe
(ordonne en fonction de la spcificit de leur vocabulaire27)
a) premire classe 2S :
Par exemple, parents*, frre*, soeur*, famille*, celui que j'aime pleurent ;
Parents*, moi et soeur* passons devant un chemin de fer ,Mais une nuit l'assassin la poursuit dans la foret ;
Mes amis avec qui je viens restent pres-de l'avion par lequel N venons ;
Je sui (vre) la bete la plus* horrible de la terre ;
Je n'arrive a retrouver ma maison et parents* ;
N voulons nous tuer tous les deux ou aller loin disparatre ;
b) deuxime classe :
Les animaux ont des formes ressemblant aux animaux de la prhistoire;
Derrire eux une tache blanche grandit, grandit, grandit
I emmnent femmes, hommes, enfants ;
Une personn8 immense, blanche, grosse et malsaine ;
Au-fond d'une immense piece sur un banc est assis un homme difforme ,Dans un theatre aux murs recouverts de tissu rouge ;
Le monstre rentre par la fentre ;
Je ne sais si ce sont des hommes ou des femmes ;
Tout-a -coup, N voyons apparatre un homme ;
Je vois le depart des murs de ce plafond ;
Des monstres effrayants que je ne vois ni dans les livres ni au cinema
I essaient d'enfoncer la porte* ;
E ne peut ouvrir la porte* de ma chambre ;
Je vois un grand espace noir ;
c) troisime classe :
Je tombe du haut d'un precipice trs sombre et trs profond ;
Tous les passagers se jettent a l'eau en criant ;
Je m'crase dans la rue sur le sol ;
Je n'arrte de tomber dans l'eau ;
Je marche ainsi que cousin8 sur des coussins en mousse ;
I tombe du haut d'une falaise ,Je pousse des cris
Je m'crase contre le sol ;
Je saute dans 1 'eau ;
Je crie a tante8 arrte arrte ne fais ca ;
Mais il faut ne que je respire puisque c-est de l'eau ;
Je n'arrte de respirer ;
Je tombe dans un trou ;
Je tombe en criant ;
23
Nbre d'occ.
221
745
945
1090
465
356
-18
0
12
12
1
-14
0
0
0
27. On compare, dans un nonc donn relativement l'ensemble des autres noncs, la
distribution des occurrences du vocabulaire spcifique d'une classe avec la distribu
tion
de celui qui ne l'est pas. Le rsultat de cette comparaison est le coefficient mis
entre parenthse (chi2 1 degr de libert).
28. P. Achard a remarqu que les trois classes d'noncs prsentes ici discriminent as
sez bien trois positions de l'nonciateur telles qu'il les avait mises en vidence dans
son analyse des Une enqute par questionnaire pendant la guerre d'Algrie
(1991) concernant le vcu des appels (notamment des rcits de souvenirs) durant la
guerre d'Algrie : "position d'Acteur, de Tmoin ou de Patient". Selon son codage, 5
des 7 noncs de la premire classe impliquent une position d'Acteur ; tous les
noncs de la deuxime classe renvoient la position de Tmoin ; et enfin, au moins
10 des 19 noncs de la troisime classe impliquent une position de Patient. Ce point
de vue est d'ailleurs cohrent avec celui prsent dans nos interprtations. Cet as
pect est d'autant plus intressant que les deux approches sont trs diffrentes : ana
lyse de renonciation pour Achard, analyse de la rfrence ici (rappelons que les
classes sont discrimines uniquement l'aide des "mots pleins" dans un sens res
treint : pronoms, articles, prpositions, conjonctions, certains adverbes et mme cer
tains verbes modaux sont exclus de l'analyse). Cela montre une fois de plus la forte
corrlation existant entre le plan "pragmatique" et le plan "smantique" de renonc
iation. Cela suggre aussi une parent entre les conditions de production des deux
corpus qui renvoient, en dfinitive, aux rcits d'un vcu angoissant (qu'ils soient
imaginaires dans le cas des cauchemars ou rels dans le cas de la guerre d'Algrie).
29. Chi2 "sign" un degr de libert sur les tableaux quatre cases croisant prsen
ce/absence
de l'occurrence d'une forme de telle catgorie dans telle classe. Le signe
affect au coefficient indique le sens de la corrlation ("+" si la diagonale est plus
remplie et "-" sinon). Les valeurs des marges sont des effectifs : le nombre d'occur
rencesdes formes classes. . .
MAX REINERT
24
Cls
Poids
1 .
2.
3.
4.
S.
Verbes modaux
Marqueurs de l'espace
Marqueurs du temps
Marqueurs de la quantit
Modal isat ions assertives
6.
7.
8.
9.
Organisateurs de l'arg.
Pronoms et adjectifs pers.
Pronoms et adjectifs dem .
Auxiliaires tre et avoir.
Classes
Poids
1561
600
486
52
278
96
57
85
5
-16
2
-4
2
0
1
0
3
0
-5
11
0
0
-3
349
1321
213
196
0
0
10
0
0
0
-6
0
0
0
-1
0
25
26
MAX REINERT
4. UN ESSAI D'INTERPRTATION
4.1 Le rcit de cauchemar : approches et objectifs
Nous voquerons rapidement quelques aspects des travaux de
Michel Zlotowicz, notamment, ceux regroups dans son livre Les
cauchemars de l'enfant (1978). Bien qu'il utilise une mthodologie dif
frente
de la ntre, il aboutit des constats qui nous paraissent assez
voisins ( chacun d'en juger). Comme son approche est nettement
oriente vers la mise en vidence d'une logique du rcit, elle va
nous servir mettre en vidence concrtement la complmentarit
dj voque entre approche 'logique" et approche statistique des
"mondes lexicaux". Insistons encore sur le fait que ce sont les as
pects
mthodologiques qui nous intresse ici et nous ne prtendons
pas faire une revue des tudes sur les rcits de cauchemars. . .
Pour Michel Zlotowicz :
une analyse de contenu classique des rves montre les limites de cette tech
nique : le contenu y est morcel en des units telles que lieux, objets, person
nages, qui sont ensuite comptabilises ; mais cette analyse ne prend pas en
considration ce qui nous parat l'essentiel dans les textes de rves : le fait
que ce sont des rcits, c'est--dire une suite ordonne d'vnements. L'analy
se
morphologique inspire de V. Propp (1928) et codifie par A. Rgnier
(1974) retient au contraire, dans un rcit, ses deux proprits essentielles : sa
structure temporelle et sa substance vnementielle. (1976 : 16)
Cet auteur se situe donc dans une perspective qui privilgie
l'ordre temporel et les actions en opposition avec les techniques
d'analyse de contenu alors en vigueur, centres sur l'tude des "obj
ets" du cauchemar :
les textes recueillis ont la forme de rcits, c'est--dire qu'ils se prsentent fonda
mentalement
comme une suite d'vnements ordonns. La technique d'analyse
du contenu qu'on leur appliquera doit tenir compte de ces deux caractres ; en
particulier, les units de l'analyse devront tre les vnements.
Dans l'analyse de Propp, auquel cet auteur se rfre, les units
d'analyse sont organises autour d'une fonction, c'est--dire, l'action
d'un personnage, dfinie du point de vue de sa signification dans le droule
ment
de l'intrigue (Propp : 31). Zlotowicz dcrit son corpus de rcits
l'aide de trois fonctions principales, dj dgages par Propp dans
27
MAX REINERT
28
29
30
MAX REINERT
31
32
MAX REINERT
33
34
MAX REINERT
35
5. CONCLUSION
Dans l'tude prsente, le rcit de cauchemar renvoie un monde
imaginaire qui apparat, par l mme, comme l'expression d'un
"mode d'tre" du sujet. C'est donc naturellement qu'est mise en
vidence une certaine dualit Monde/ Sujet. Cet aspect, vident
dans ce cas, n'est cependant pas spcifique de ce type de monde et
exemplifie, d'une certaine manire, l'aphorisme de Wittgenstein
selon lequel
Le Moi apparat en philosophie du fait que "le monde est mon propre monde".
Le "monde" est considr la fois comme l'expression d'un ima
ginaire
et le reflet d'un "rel". C'est en cela qu'il est la fois "mon
de"
du sujet et "monde objectif". Ce que Bachelard (1949) exprime
dans cette mise en garde :
II suffit que nous parlions d'un objet pour nous croire objectifs. Mais par
notre premier choix, l'objet nous dsigne plus que nous ne le dsignons et ce
que nous croyons nos penses fondamentales sur le monde sont souvent des
confidences sur la jeunesse de notre esprit.
Cette subjectivation des objets fait de tout objet un signe et, du
monde, une image de notre propre activit psychique (Jung 32).
Il n'est pas tonnant que cette dualit du monde se reflte dans
les logiques mises en oeuvre qui apparaissent la fois, logique d'objet
et logique de sujet pour reprendre la terminologie de J.B. Grize.
32. Jung s'interroge sur la part de donnes psychiques qui se trouve projete dans l'i
nconnu
du phnomne extrieur : Cette part est en fait si grande, qu'en fin de
compte nous ne sommes jamais en mesure d'indiquer la manire dont, en dfiniti
ve,
le monde en lui-mme est fait, car nous sommes bel et bien contraints de trans
poser l'lment physique dans un processus psychique. (Les Racines de la
Conscience, p. 67). L'objet devient porteur d'un contenu psychique et le "monde"
devient l'expression mme de l'inconscient .
36
MAX REINERT
37
RFRENCES BIBLIOGRAPHIQUES
ACHARD, P. (1991) - Une approche discursive des questionnaires : l'exemple
d'une enqute pendant la guerre d'Algrie , langage et Socit, 55 : 5-40.
(1993) -La sociologie du langage (Que-sais-je ? 2720). Paris, Presses universitaires
de France
ANZIEU, D. (1985) -Le Moi-peau. Paris, Dunod.
BACHELARD, G. (1949) - La psychanalyse du feu. Paris, Gallimard.
BARIAUD, Fv RODRIGUEZ-TOM, H. (1975) - Peurs et angoisse chez des ado
lescents
de milieu rural et urbain , Bulletin de Psychologie, XXIX, 324 : 813-823
BENZCRI,J.P. (1973) -L'Analyse des Donnes. Paris, Dunod.
BENZCRI, J.P. (1981) -Pratique de l'Analyse des Donnes : linguistique et lexicologie.
Paris, Dunod.
(1982) -Histoire et Prhistoire de l'Analyse des Donnes. Paris, Dunod.
(1991) - Typologie de textes grecs d'aprs les occurrences des formes des mots
outils , Cahiers de l'Analyse des Donnes 1 : 61-86
38
MAX REINERT
39