Sie sind auf Seite 1von 26

P.

Henry Mr Serge Moscovici

Problmes de l'analyse de contenu


In: Langages, 3e anne, n11, 1968. Socio-linguistique. pp. 36-60.

Citer ce document / Cite this document : Henry P., Moscovici Serge. Problmes de l'analyse de contenu. In: Langages, 3e anne, n11, 1968. Socio-linguistique. pp. 3660. doi : 10.3406/lgge.1968.2900 http://www.persee.fr/web/revues/home/prescript/article/lgge_0458-726X_1968_num_3_11_2900

PAUL HENRY et SERGE MOSCOVICI cole Pratique des Hautes tudes

PROBLMES DE L'ANALYSE DE

CONTENU

1. Les conditions de production des textes et leur analyse. 1.0. L'analyse de contenu est un ensemble disparate de techniques utilises pour traiter des matriaux linguistiques. Ces matriaux peuvent avoir t recueillis au moyen d'enqutes ou d'interviews ou bien ce sont des matriaux naturels , regroups en vue d'une recherche, tels que des articles de journaux, des rcits, des tmoignages, des discours poli tiques, des uvres littraires, etc. Tout ce qui est dit ou crit 1 est sus ceptible d'tre soumis une analyse de contenu. Considre globalement, bien qu'elle puisse s'appliquer en principe au traitement de tous les matriaux linguistiques, l'analyse de contenu ne conduit pas une tude du langage (en tant que facult individuelle par exemple) ou de sa manifestation comme telle. Elle ne dbouche pas non plus sur une tude de la langue (en tant qu'institution ou produit socioculturel par exemple). C'est un instrument analytique sans ambit ions, sinon sans fondements, thoriques. 1.1. L'analyse de contenu sert analyser des textes, c'est--dire des crits ou des paroles enregistres et transcrites. Toutefois une analyse de contenu ne s'applique pas au traitement de n'importe quels textes, mais de textes dlibrment choisis. Lorsque les textes sont obtenus au moyen d'enqutes ou d'interviews, ce choix se manifeste dans la formulation des questions et dans l'chantillonnage de la population soumise l'enqute, ou dans le choix des thmes d'interviews et la conduite de ces derniers. Lorsque l'analyse est applique des textes naturels , ceux-ci sont soigneusement choisis (V. un exemple dans Holsti et al., 1963, pp. 39-41). 1. Nous excluons du champ d'application de l'analyse de contenu tout ce qui n'est pas proprement linguistique tel que films, reprsentations picturales, compor tements (considrs comme symboliques ), etc., bien que, certains gards, le tra itement de ces matriaux pose des problmes apparents ceux de l'analyse de contenu. Nous excluons du champ de notre tude des pratiques analytiques, parfois appe! les analyses de contenu , utilises en linguistique ou en recherche documentaire. Enfin, nous nous concentrerons principalement sur les mthodes utilises en psychol ogie sociale.

37 Ce choix est ncessaire car toute analyse de contenu vise, non l'tude de la langue et du langage, mais la dtermination, plus ou moins part ielle, de ce que nous appellerons les conditions de production des textes qui en sont l'objet. Ce qu'on cherche caractriser ce sont ces conditions de production et non les textes eux-mmes. L'ensemble des conditions de production constitue le champ des dterminations des textes. Nous j prfrons l'expression condition de production celles qui sont com-' munment utilises et qui font rfrence soit la situation de commun ication, soit l'environnement socioculturel, soit la psychologie indi viduelle. Ces dernires expressions ont toutes l'inconvnient de restreindre arbitrairement le champ des dterminations possibles des textes en met tant l'accent sur tel ou tel aspect particulier. Les conditions de production sont multiples et dans la pratique on ne s'intresse qu' quelques-unes d'entre elles. Par exemple, la situation d'interview est une condition de production (nous devrions dire un ensemble de conditions de production) lorsque les textes sont obtenus par ce procd. Cette situation influe sur certaines particularits des textes, mais ne les dtermine que partiellement. Ce n'est qu'une condition de production parmi d'autres, on ne s'y intresse qu'indirectement (d'un point de vue mthodologique) et il est toujours possible d'envisager d'autres modes de dtermination. Ainsi, lorsqu'on cherche, par l'analyse des textes, dfinir l'attitude d'une ou plusieurs personnes l'gard d'un objet (marque de savon, coopration technique , ou dmocratie peu importe), il est toujours suppos que cette attitude existe indpendam ment des textes et qu'elle en a dtermin certains aspects (ceux sur lesquels devra s'appuyer l'analyse). On peut donc dire que cette attitude figure parmi les conditions de production des textes. Mme lorsque l'ana lysede contenu se rduit une analyse stylistique, on suppose que le style existe indpendamment du texte, ce qui permettra, par comparaison, de dire s'il est lgitime ou non d'attribuer un texte anonyme un auteur connu (Hart, 1934). Le style, ou tout au moins certains de ses aspects, est considr comme une condition de production des textes en ce sens qu'il affecte tous les textes produits (ou productives) par un auteur des fins prcises (par exemple littraires). 1.2. Ces exemples, proposs titre illustratif, ne suffisent pas donner au concept de condition de production une signification prcise : il n'a pour l'instant qu'une valeur oprationnelle. Il nous permet d'exa miner les procdures d'analyse de contenu en rfrence deux plans fondamentaux. Le premier plan de rfrence est celui de l'analyse des conditions de production. Le psychologue, le psychologue social, le socio logue disposent d'un vocabulaire thorique ou plus exactement d'un modle d'analyse plus ou moins prcis de ces conditions de production qui constituent leurs objets d'tude. Ce modle sert structurer le pre mier plan de rfrence que nous appellerons par commodit de langage, le plan vertical. Le second plan de rfrence est celui de l'analyse des

38 textes dont on ne retient que certains lments ou certains traits; nous l'appellerons le plan horizontal. 1.3. Nous sommes maintenant en mesure d'noncer le problme fon damental de l'analyse de contenu. Il est clair que les deux plans de rfrence que nous venons de dfinir ne sont pas indpendants. C'est ce qui simultanment rend l'analyse possible et fait problme. Selon le plan horizontal, la procdure analytique est dtermine par le plan ver tical; le choix des lments du texte que^l'on retiendra dpend naturell ement des objectifs de l'analyse, c'est--dire de celles parmi les conditions de production que l'on veut tudier ainsi que de la manire de les dfinir. Inversement, le plan vertical est dtermin par le plan horizontal. En effet, les conditions de production sont caractrisgg. partir des lments distingus dans le texte et les possibilits'cie cette caractrisation dpend de leur dfinition. En l'absence de dfinition autonome de la structu rationde ces deux plans et de leurs rapports, on aboutit une impasse mthodologique et thorique. 1.4. Tous les problmes de l'analyse de contenu drivent de celui-ci. Les pratiques analytiques ne sont que des moyens d'chapper la ci rcularit de cette problmatique sans pour autant la rsoudre. L'ensemble de cet article sera consacr l'examen de ce problme sous ses diverses formes. Afin de l'noncer d'une manire moins abstraite et plus prcise, nous commencerons par prsenter succinctement les mthodes existantes. Dans la mme perspective, nous examinerons plus en dtail une tude entreprise par W. Ackermann et R. Zygouris dans le cadre du Centre d'tudes et de Recherches psychotechniques. Puis nous esquisserons des solutions thoriques.

2. Trois types d'analyse de contenu. 2.0. Pour prsenter les mthodes utilises en analyse de contenu, nous allons naturellement faire usage des concepts oprationnels que nous avons introduits. Les procdures analytiques seront classes en fonction de la structuration de leur plan vertical (c'est--dire en fonction de la caractrisation des conditions de production qu'elles servent tudier) et de leur plan horizontal (c'est--dire en fonction de leur analyse des textes) ainsi que des relations qu'elles postulent entre ces deux plans. Nous obtiendrons ainsi trois grandes familles de procdures que nous aborderons dans l'ordre de la complexit croissante (laquelle se trouve concider grossirement avec l'ordre chronologique de leur apparition). 2.1. Les procdures les plus simples ont t minutieusement dcrites par Berelson (1952). Leur caractristique fondamentale est qu'elles privi lgient le plan vertical au dtriment du plan horizontal en n'envisageant que des rapports simples entre ces deux plans. La description des textes est commande par la dfinition des conditions de production consid-

39 res et par la manire de les caractriser. Ces conditions de production, ce sont principalement les attitudes l'gard d'objets dtermins, les opinions et croyances sur un sujet prcis et dlimit et des variables plus contingentes telles que les intentions ou les motivations. Les atti tudes sont caractrises par leurs composantes, leurs directions et leurs intensits. Classiquement on distingue dans les attitudes des composantes affectives (ou valuatives) et cognitives. Les opinions ont un caractre plus exclusivement cognitif et n'ont pas, en principe, de composante affective. Ces composantes globales peuvent tre subdivises en souscomposantes dont la dfinition est plus directement lie aux attitudes particulires considres. Par direction, on entend par exemple favorable oppos dfavorable ou bien, dans un cas particulier, autoritarisme oppos galitarisme. Par intensit, on entend le caractre plus ou moins saillant d'une composante dans une direction donne. L'attitude, comme l'opinion, est toujours une attitude ou une opinion l'gard de quelque chose de prcis mais qui peut tre abstrait comme la dmocratie ou concret comme un produit de consommation. Si l'on cherche dfinir les attitudes l'gard d'un objet par l'analyse de textes, cet objet doit faire partie (explicitement ou implicitement) du rfrent des textes. C'est le critre de choix des textes. L'analyse de contenu est une mthode trs utilise dans l'tude et la catgorisation des attitudes, opinions et croyances. Envisage comme condition de production des textes, l'attitude ou l'opinion n'est qu'une condition relativement peu dterminante. De ce point de vue l'analyse est donc trs partielle pour ne pas dire ponctuelle. En contrepartie seuls certains lments isols des textes sont retenus. On repre des mots ou des fragments de textes qui sont regroups en classes thmatiques ou classs par items. Les mots, les fragments de textes sont retenus dans la mesure o ils dnotent quelque chose de pertinent du point de vue de l'attitude considre, c'est--dire en fonction de la possibilit de les rattacher l'une des composantes ou sous-composantes de cette attitude. Composantes et directions dfinissent les catgories thmatiques. Le dnombrement des lments de chaque catgorie doit en principe carac triser l'intensit de l'attitude selon telle ou telle composante et dans telle ou telle direction. La description empirique des attitudes et des opinions fournit dans ce cas un cadre analytique dans lequel sont classs certains lments des textes. Il n'y a aucune dfinition autonome de la structuration du plan horizontal, mais les problmes poss par ces mthodes intressent aussi bien le plan vertical que le plan horizontal ou les rapports entre ces plans. En ce qui concerne le plan vertical, il est clair que la validit de l'analyse dpend essentiellement de la valeur de la description empi rique des conditions de production considres. Pour le plan horizontal, se pose le problme de la dimension des units de contenu. Les mthodes qui reposent sur le reprage de mots isols ne tiennent pas compte du

40 contexte dans lequel ces mots apparaissent. Or ce contexte peut modifier considrablement leur signification. Les mthodes qui utilisent des units de contenu plus larges ngligent les nuances de l'expression et mme, puisqu'il est difficile de parler de nuances lorsqu'on substitue tout un paragraphe ou plusieurs pages de texte un seul item pour les repr senter, altrent profondment la signification. Le rle de l'interprtation est considrable. Enfin et surtout, il n'est jamais tenu compte des rela tions entre les diffrentes units de contenu, de leurs rapports mutuels. En ce qui concerne les rapports entre les deux plans, la validit de l'analyse dpend entirement de la possibilit de dcider ce que l'emploi de tel ou tel mot ou expression dnote quanct l'attitude considre. A la limite, il faudrait pouvoir faire a priori l'inventaire de tous les mots ou de toutes les expressions qui rvlent les diffrents aspects des att itudes ou opinions. Or, si on s'intresse par exemple l'attitude l'gard de la coopration technique telle qu'on peut la dfinir partir d'articles de presse, on ne peut mme pas dcider de ne retenir que les jugements de valeur par exemple (on y serait enclin du fait que, dans toute attitude, il y a une composante affective ou evaluative). Le fait que certains aspects de la coopration sont ou ne sont pas abords dans le texte est en luimme significatif. On n'est pas en mesure de faire l'inventaire de tout ce qu'on pourrait dire sur un tel sujet, donc de dterminer les manques mme l'intrieur d'un systme de catgories pr-tabli. On a cherch tourner ces obstacles de plusieurs manires. La pre mire consiste avoir recours une sorte de pr-analyse qu'on pourrait qualifier de sauvage ou d'intuitive. Cette analyse aurait pour but d'explorer le contenu global des textes et d'en dterminer empiriquement les dimensions saillantes par rapport aux conditions de production consi dres. On peut galement procder par approximations successives en alternant analyse systmatique et retour aux textes. La seconde manire de contourner les difficults revient considrer que l'analyse a un but principalement comparatif. Il ne s'agit plus de caractriser, ou de mesur er des attitudes ou des opinions mais de comparer/d'un texte l'autre ou d'un ensemble de textes l'autre, ces attitudes et ces opinions. Pour tester des hypothses ou des prdictions thoriques, on s'intresse plus souvent aux changements ou aux diffrences d'attitudes ou d'opinions qu' leurs caractristiques intrinsques. Utiliser l'analyse de contenu des fins comparatives rpond donc un besoin pratique de la recherche. On vite du mme coup la question des manques mais on n'limine pas les autres difficults car les critres de comparaison sont dfinis partir de descriptions psychologiques empiriques et ce choix laisse peu de place la comparaison directe des textes. Il faut mentionner enfin que, pour rsoudre la question de la structuration du plan vertical, on a tent de constituer des systmes de catgories universelles (en particulier Laswell, 1938, et White, 1951). La construction de ces grilles repose entirement sur des considrations empiriques trangres au problme de l'infrence

41 partir de textes; leur utilisation pose avec une acuit accrue le pro blme des rapports entre les deux plans d'analyse comme l'ont fait remarquer divers auteurs (Pool, 1959). Comme nous l'avions annonc en abordant la prsentation de cette premire famille de mthodes, leur caractristique fondamentale est l'i mportance qu'elle accorde la structuration du plan vertical, laquelle ne s'accompagne pas d'un effort parallle d'analyse du texte. Cette structu rationn'a t possible que parce qu'elle concerne un ensemble trs dli mit et particulier de conditions de production en faisant abstraction de toutes les autres. Elles postulent que les conditions de production prises en considration sont indpendantes des autres dterminations des textes. C'est, pour une part, en raction contre ces diffrentes limitations et pour chapper leurs consquences que les mthodes que nous allons maintenant examiner ont t conues. 2.2. Ces mthodes n'ont pas t construites dans le seul but de sur monter des difficults mthodologiques : elles devaient en premier lieu rpondre des exigences nouvelles issues des dveloppements de la psychol ogie et de la psychologie sociale. La validation des hypothses thoriques ne reposait plus sur la mesure de certains carts isols mais ncessitait l'tude des systmes de variables interdpendantes. Ainsi, dans le prolon gement du paragraphe prcdent, la thorie des attitudes s'intressait dsormais aux relations entre attitudes l'gard d'objets diffrents. Cette volution, qui n'intresse pas que la thorie des attitudes, impliquait une nouvelle structuration du plan vertical et surtout du plan horizontal. Les techniques d'analyse devaient prendre en considration les relations entre les lments des textes, c'est--dire tenir compte des contextes. Elles sont donc caractrises par une analyse plus approfondie des textes, analyse qui fait appel parfois simultanment des techniques inspires par la thorie de l'information et par la linguistique structurale et aux possibilits de traitement automatique sur calculateur lectronique. Il est possible de dfinir de trs nombreux types de relations entre lments d'un texte. Les techniques varient selon le type de relation considr et corrlativement selon la manire de dfinir les contextes, c'est--dire les units de contenu. La thorie de l'information et la li nguistique ont fourni des modles oprationnels pour dfinir ces relations. Dans d'autres cas (celui du General Inquirer en particulier), on ne s'in tresse qu'aux relations marques dans le texte entre certains aspects dfinis des conditions de production considres : c'est alors le plan ver tical qui commande la dlimitation des units de contenu. La varit des modles utiliss pour structurer le plan horizontal a pour corollaire une grande diversit dans les mthodes; nous devrons nous limiter l'examen de quelques types reprsentatifs. 2.2. a Un premier type de relation entre mots d'un texte est dfini partir de la frquence des co-occurrences dans un contexte de dimension fixe arbitrairement. Imaginons par exemple qu'on ait recueilli une srie

42 d'interviews non directifs dans le but de dterminer les attitudes l'gard de plusieurs objets et les relations entre ces attitudes. On structure le plan vertical comme prcdemment, c'est--dire qu'on dfinit des cat gories thmatiques correspondant divers aspects des attitudes. On repre non seulement les mots ou les squences de chaque catgorie, mais les co-occurrences de mots ou de squences de catgories diffrentes dans des contextes de dimension fixe arbitrairement (par exemple la phrase : on estime que, si les occurrences de termes sont trop espaces, il ne peut y avoir d'interfrences entre elles). On peut ainsi dresser des matrices de frquence des co-occurrences des lments de chaque catgorie pour chaque texte et la matrice des frquences moyennes des co-occurrences pour l'e nsemble des textes. Cette dernire matrice fournit une sorte de point de rfrence; on considre que les diffrences interindividuelles s'annulent les unes les autres. Il est alors possible de rpartir les co-occurrences dans un texte particulier en deux catgories, d'une part celles dont la frquence est significativement suprieure la moyenne pour l'ensemble des textes et d'autre part celles dont la frquence est significativement infrieure cette moyenne. A partir de l, on peut conclure l'existence d'associations ou d'ex clusions entre catgories. Une telle procdure permet de rpondre des questions telles que : a) Pour une personne dtermine, l'objet A voque-t-il l'objet B ou au contraire le fait de penser ou de mentionner un objet A empche-t-il de penser simultanment un objet B ou de le mentionner? b) Telle direction dans une composante de l'attitude l'gard d'un objet est-elle lie telle direction dans une autre composante de cette attitude, etc.? On ne peut mettre en vidence par cette mthode que des proprits relatives, dfinies par comparaison la moyenne d'un chantillon, d'une population ou d'un groupe de juges . La validit de cette comparai son est base sur des considrations empiriques qui ont t soutenues par le dveloppement de la thorie de l'information. Pour justifier de l'emploi d'une mthode apparente celle que nous venons de dcrire, Osgood (1952) s'appuie sur Shannon et Weaver pour affirmer que les mots n'apparaissent pas au hasard mais par paquets, qu'on peut reconsti tuer les mots manquant dans un texte mutil en se basant, non sur le sens, mais sur un modle de la langue qui fixe la frquence d'association des mots. Tout cart par rapport cette norme gnratrice est consi dr comme porteur d'une signification contingente, c'est--dire qu'il n'est pas dtermin par la langue ou par la culture mais par d'autres conditions de production, propres au producteur particulier du texte. Dans cette direction peut tre envisage une gnralisation de ces mthodes qui liminerait le caractre relatif des rsultats. Des diction nairesde frquence d'apparition des mots ont t constitus pour la plu part des langues usuelles partir de trs vastes corpus. A partir de l,

43 on peut calculer des frquences de co-occurrences statistiquement nor males par rapport cette distribution de frquence pour certains corpus de mots slectionns, puis comparer les frquences de co-occurrences de ces termes dans un texte dtermin cette frquence thorique. La conception d'un tel instrument suscite deux remarques complmentaires : (a) Quelle est la signification des frquences normales de co-occurrence; autrement dit, parvient-on par ce procd reprsenter oprationnellement ce qui, dans le modle hypothtique lgitimant la procdure, int resse les lments retenus? (b) L'instrument est trop grossier car le corpus de rfrence est trop gnral : la structure qu'il dtermine par projection sur l'chantillon est trop lche pour cerner les variables. Tout au plus, selon nous, on peut talonner l'chantillon, la population ou le groupe de juges , dlimiter un thme dans un complexe culturel. Tout en tant instructives car elles posent les questions du corpus et des relations entre les textes rassembls en vue de l'analyse et un ensemble culturel plus vaste (questions sur lesquelles nous reviendrons), ces objections ont peu de poids compares celles qui portent sur la structuration du plan vertical et l'inventaire des catgories thmatiques. Sur ce point, les difficults sont identiques celles que nous avons ren contres propos des mthodes plus simples. Il en est de nouvelles qui tiennent (a) la ncessit d'une prparation du texte ( dition ) par exemple il est ncessaire de mettre sur le mme plan les mots et leurs modalits (pronom, etc.) pour que le dnombrement des co-occurrences ait une quelconque signification (b) au dcoupage arbitraire du point de vue linguistique des units de contenu la dlimitation des contextes soulve de grandes difficults lorsqu'on a affaire des phrases de struc tures complexes. 2.2. b Une mthode propose par Osgood sous le titre Evaluative Association Analysis (EAA, Osgood et al., 1956) se heurte aux mmes difficults linguistiques et leur apporte une solution normative au niveau de l'dition des textes. L encore il s'agit d'une technique d'ana lyse des attitudes, l'accent tant mis sur la composante affective. L'di tion, c'est--dire la prparation des textes, a pour but de donner aux squences retenues dans les textes une structure canonique. Celle-ci peut avoir deux formes : (a) AOi C P (b) AU! C A02 (ces formes sont dites affirmatives ; en anglais assertives ). (AOj) est un objet sur lequel porte une attitude de mme que (A02) ( Attitude Object ), C est un connecteur verbal, P un prdicat d'un type particulier (common meaning term). Les objets d'attitude sont des symboles dont l'valuation (evaluative meaning) varie d'une personne l'autre (par exemple : la dmocratie, le capitalisme, une marque d'essence,

44 le cinma, un film, etc.). Les prdicats considrs (common meaning terms) sont des symboles dont l'valuation est stable (par exemple, bon, tratre, efficace, etc.). Objets d'attitude et prdicats sont plus des cat gories thmatiques que des units linguistiques. Des quivalences entre noms sont poses par le codeur au moment de l'dition en fonction du contexte. De par la dfinition mme des units de contenu, on ne retient des textes que des jugements de valeur. Le choix de ces formes canoniques est troitement li la structuration du plan vertical. Cette structuration est fonde sur une technique multidimensionnelle de mesure des attitudes qu'Osgood a propose. C'est une gnralisation des techniques connues sous le nom d'chelles d'attitudes . Les chelles utilises par Osgood sont des chelles en sept points aux extrmits desquelles figurent deux prdicats antinomiques (exemple bon-mauvais). Lorsqu'on veut dter miner l'attitude d'une personne l'gard d'un objet, il lui est demand d'valuer cet objet sur une srie d'chelles en indiquant le point de chaque chelle, entre les extrmes, qui lui semblent le caractriser. Osgood a tudi la distribution des rponses des sries d'chelles en les soumet tant des analyses factorielles et a dgag trois dimensions indpendantes (valuation : bon-mauvais ou beau-laid; activit : rapide-lent ou tendurelch; puissance : fort-faible ou lourd-lger), ce qui ouvrait la voie une caractrisation multidimensionnelle des attitudes. De plus, il s'est intress aux rapports entre attitudes : schmatiquement le principe de congruit nonce que, lorsqu'une relation est perue entre deux objets, leur valuation dpend de cette relation et de son sens (relation associa tive ou disjunctive). Le rapport entre cette technique de mesure des attitudes et la EAA est dfini par une pondration des connecteurs verbaux (indice du poids et du sens de la liaison entre deux objets ou entre un objet et un prdicat) et des prdicats (valuation des objets) sur des chelles en sept points (pour dterminer ces pondrations on a encore recours des groupes de juges). Connaissant les pondrations, on calcule indirectement l'valua tion dans chaque dimension des objets des attitudes, valuation qui tient compte des relations entre les diffrents objets telles qu'elles sont mesures par la pondration des connecteurs. Les problmes que soulve la mise en uvre de cette technique sont d'une part la dtermination des quivalences entre termes l'intrieur d'une catgorie thmatique et d'autre part la rduction des squences utiles en formes canoniques. Cette rduction normative est plus fonde sur une interprtation que sur une analyse des textes bien que la dfini tion de la forme des units de contenu se rapproche d'une dfinition li nguistique. Les autres objections qu'on pourrait formuler portent sur les rapports entre les deux plans d'analyse. Elles concernent en fait les tech niques de mesure des attitudes au moyen d'chelles et nous nous conten terons ici de les mentionner.

45 Les deux types de mthode que nous venons d'esquisser mesure des frquences des co-occurrences et EAA ont de nombreux points communs. Entre autres, elles ncessitent l'une et l'autre une prparation ou dition des textes qui prcde l'analyse proprement dite. Cette carac tristique, nous la retrouverons dans un troisime type de mthode conue en vue du traitement automatique sur ordinateur. 2.2. c Cette mthode comporte en fait un trs grand nombre de variantes. Toutes ces variantes sont cependant drives d'un systme d'analyse documentaire baptis le General Inquirer , lequel est un sous-systme du langage artificiel COM IT . De trs nombreux ouvrages ont t consacrs aux diffrentes versions du General Inquirer et ses applications (Stone et al., 1966); nous devrons nous contenter ici d'noncer les principes. A bien des gards, les systmes General Inquirer apparaissent comme une synthse et une systmatisation des mthodes examines jusqu'ici. Cette systmatisation est lie l'automatisation, laquelle contraint de rendre explicite des rgles qui restaient jusque-l dans le domaine des proccupations mthodologiques. Les systmes Gener al Inquirer se prsentent comme des outils permettant de traduire les donnes empiriques, extraites des textes, en donnes thoriques. Le cadre thorique, c'est--dire la structuration du plan vertical, dans lequel ces donnes vont tre organises, est l encore dfini d'une manire autonome. Le rapport entre le plan vertical d'analyse des conditions de production considres et le plan horizontal d'analyse du texte est dfini en partie par un dictionnaire qui est enregistr, en mmoire. Ce dictionnaire fixe des correspondances entre le vocabulaire thorique servant dcrire les conditions de production et le vocabulaire des textes par l'intermdiaire d'un systme de mots-clefs (tag concepts). Ces mots-clefs dsignent les catgories de mots qui sont la trace de tel ou tel aspect des conditions de production considres. Si la recherche a pour but de caractriser des attitudes l'gard d'objets dfinis, le mot objet figurera dans le voca bulaire thorique et les mots-clefs correspondants seront des classes d'obj ets. Le dictionnaire est construit partir de l'inventaire des aspects des conditions de production dont on doit tenir compte pour les besoins de la recherche, c'est--dire qu'on commence par faire l'inventaire du voca bulaire thorique lequel traduit la structuration du plan vertical. On tablit ensuite les listes de mots-clefs correspondant chaque terme du vocabulaire thorique. Le degr de gnralit de ces termes qui doit tre homogne fixe la finesse de l'analyse. Enfin, par l'exploration systmatique d'un thsaurus, on fait l'inventaire de tous les mots qui peuvent apparatre dans les textes et qui peuvent tre considrs comme autant d'indices de la prsence des variables reprsentes par les motsclefs. Ces listes d'entre peuvent tre enrichies aprs une premire exploi tation car les programmes prvoient l'tablissement de la liste de tous les mots rejets. Il est donc possible de rajuster le dictionnaire. Ce raju stement reste cependant partiel car il n'affecte ni le vocabulaire thorique

46 ni le systme de mots-clefs qui en dpend. En d'autres termes, on ne peut pas modifier la dfinition du rapport entre les deux plans d'analyse. Ce fait est videmment trs important car il a pour consquence qu'on ne peut pas modifier, partir de l'analyse des textes, la structuration du plan vertical, introduire de nouveaux aspects de conditions de production autrement qu'en reconstruisant un nouveau dictionnaire, c'est--dire en reprenant l'analyse thorique des conditions de production. Le dictionnaire lui seul ne dfinit pas compltement les rapports entre les deux plans d'analyse sauf dans les cas o on ne s'intresse qu' la prsence et l'absence de certaines variables des conditions de produc tion parmi les dterminations des textes (et ventuellement leur inten sit mesure par des frquences d'apparition des mots d'entre pour chaque mot-clef). Les systmes General Inquirer peuvent utiliser des units de contenu plus larges que le mot. Celles-ci sont parfois appeles thmes . Leur dfinition est l encore commande par le plan vertical et non base sur des critres linguistiques (smantiques ou syntaxiques) : la dimension de l'unit de contenu est fixe par le nombre maximum de relations qui peuvent intervenir entre les diffrents aspects des conditions de production apparaissant dans une mme unit de contenu. En pratique, on fixe arbitrairement le nombre d'aspects des conditions de production qui peuvent figurer simultanment dans une unit, ce qui revient au mme. Dans une tude sur les conflits internationaux, R. Holsti (Holsti et al., 1963) a dfini le thme comme tant une squence l'intrieur de laquelle ne figurait pas simultanment plus d'un des quatre lments suivants : (a) celui qui peroit l'action ou l'tat, (b) l'agent ou celui qui est peru, (c) l'action, (d) le but de l'action ou la cible. La dfinition de ces units de contenu de dimension fixe rend ncessaire une prparation des textes dont le but est de sparer l'intrieur des phrases les units de contenu. Par ailleurs, il est possible, connaissant le dictionnaire, de faire un inventaire thorique a priori de tous les thmes possibles. Il ne reste plus alors, l'aide d'une indexation approprie, qu' reprer ces thmes manuellement dans les textes. (Cette procdure d'indexation manuelle permet de faire l'conomie de la construction d'un dictionnaire des thmes analogues au dictionnaire des mots. La liste des mots d'entre sous chaque mot-clef pouvant comporter plusieurs dizaines d'units, la simple combinatoire donnerait un dictionnaire des thmes de dimensions considrables entranant des temps de recherches disproportionns.) Les systmes General Inquirer rsultent d'une tentative dans la construction d'un modle universel d'analyse de contenu. Leur caractris tique fondamentale est encore la prdominance du plan vertical sur le plan horizontal et l'impossibilit de modifier la structuration du plan vertical par inference partir de l'analyse des textes. On exprime parfois ce fait en disant que ce sont des systmes interprtation close. -Par ailleurs, le nombre des relations qui peuvent tre prises en considration entre les lments d'interprtation est fix a priori, ceci tient au fait que

47 ces systmes ne sont pas dots d'une syntaxe autonome permettant de construire, par exemple par imbrication, des units de contenu de dimens ionsvariables. *** Les deux premires familles de procdure que nous avons examines ont un point commun. Pour l'une comme pour l'autre, la structuration du plan vertical commande l'analyse du texte. Dans le cas des procdures du premier type, on ne cherche pas atteindre autre chose qu'une des cription de conditions de production particulires. Le cadre thorique de cette description est fourni par une analyse autonome de certaines caractristiques psychologiques ou d'autres facteurs (description des atti tudes, catgories de Baies, 1950, par exemple) mais ceux-ci ne sont considrs implicitement comme facteurs de production qu' l'occasion de la procdure analytique. On ne repre donc dans les textes que des indices de ces tats. Avec les mthodes de la seconde famille, on quitte le stade pure ment descriptif, leur but est de mettre l'preuve des hypothses concer nant par exemple les changements d'opinion, d'attitudes, les phnomnes d'influence, etc. Cette ambition thorique implique qu'on a dfini prala blement un certain nombre de variables des phnomnes correspondants. La dfinition de ces variables est donne par exemple par la thorie des attitudes (divers principes de consistance ou de congruit qui fixent cer taines liaisons thoriques entre divers aspects des attitudes) ou par cer taines hypothses concernant les processus d'interaction. Ces variables ne sont pas dfinies en tant que facteurs des processus de production, mais en tant que variables des phnomnes qui, mme lorsqu'ils font intervenir le langage, sont supposs avoir leur lois propres. L encore, ce n'est qu' l'occasion de la mise en uvre de la procdure analytique que ces variables et leur relation sont considres en tant que facteur de production. Dans ces conditions, les textes sont utiliss comme four nissant un ensemble d'indices. La signification des lments apparaissant (ou susceptibles d'apparatre) dans les textes dtermine leur qualit d'indices de telle ou telle variable, la frquence de ces lments est l'indice d'autres variables intensit ou degr de liaison. Dans un cas comme dans l'autre, on est prisonnier du mode tho rique de description ou de modle thorique dfinissant les variables prcisment parce qu'il n'y a d'ordre ou de variable que dans le plan vertical. C'est la structuration du plan vertical qui fixe quels sont les lments pertinents des textes, quelles sont les quivalences entre l ments l'intrieur des catgories thmatiques, quelles sont les relations retenir entre catgories d'lments, quelle est la dimension des units de contenu. La mise en uvre des procdures ne permet pas d'aboutir la formulation d'hypothses nouvelles, la dfinition de variables qui

48 sortiraient du cadre thorique fix. Du point de vue de leur rentabilit thorique, ces procdures dbouchent donc sur un systme clos d'inter prtation. D'autre part, et c'est l leur seconde caractristique fondamentale, leur validit sur le plan strictement mthodologique est suspendue la lgitimit de l'utilisation des traits des textes comme indice de telle ou telle variable particulire. Le mode de liaison entre les deux plans d'ana lyse n'est pas systmatique; il est tabli par des interprtations ou doit tre assujetti des preuves empiriques. Ces deux faits suffisent expliquer qu'on ait cherch construire d'autres systmes d'analyse qui, premirement, laissent ouvert le systme d'interprtation et, deuximement et corrlativement, ne dfinissent pas a priori les traits des textes susceptibles d'tre utiliss comme indices. Les mthodes correspondantes, que l'on pourrait qualifier de procdures de dcouvertes, doivent s'appuyer sur un mode d'analyse des texte, offrant, de plus larges possibilits. En effet (du fait que jusqu'ici c'tait la structu ration du plan vertical qui commandait les caractristiques des mthodes), la clture du systme d'interprtation correspondaient certaines parti cularits du mode d'analyse des textes. Ceux-ci consistent en la rpartition des lments retenus en un nombre fixe de catgories pr-tablies, ou bien on utilise un systme de reprsentation driv d'un langage artificiel un nombre fini d'tats, comme le COMIT. Or, la dfinition d'indices dans un systme interprtation ouverte repose essentiellement sur la mise en vidence de proprits des textes, de relations entre leurs l ments dfinissant des units fonctionnelles. C'est une mthode de ce type que nous allons maintenant examiner en dtail. 2.3. Cette procdure a t utilise dans le cadre d'une enqute sur l'assimilation des connaissances scientifiques. Cette enqute elle-mme faisait suite une srie d'tudes traitant de la diffusion des connais sancesscientifiques, des transformations des modes de penser, des mta morphoses des notions scientifiques conscutives la diffusion de ces connaissances (Barbichon et Moscovici, 1965). Le vocabulaire scientifique comporte de nombreux termes qui ont une signification vulgaire , hors du champ de chaque spcialit (lumire, vitesses, poids, etc.). Les objets de la connaissance scientifique font partie de l'environnement naturel. Les techniques sont bouleverses par les progrs de la science. En consquence, le domaine scientifique n'est pas un domaine clos que l'on pourrait apprhender de l'intrieur sans qu'il y ait interfrence avec une connaissance antrieure empirique ou dj thorique. L'assimilation des connaissances doit tre envisage du point de vue de la rorganisation des connaissances antrieures et de l'altration des connaissances nou velles (altration du point de vue de la source) ncessaires leur int gration dans un contexte comportant des dbris du cadre prexistant. Le but de l'enqute tait donc de clarifier, voire de rformer, les concep tions classiques du mcanisme de l'assimilation en l'expliquant. Pourquoi

49 l'accueil est-il slectif? Quels sont les facteurs qui entranent le refus de notions nouvelles? En quoi l'organisation nouvelle des connaissances dpend de l'organisation ancienne? Quel est le processus de la construc tion de cette nouvelle organisation? Enfin quel est le rapport existant entre l'organisation des connaissances la source et chez celui qui a t soumis l'influence de cette source? Autant de questions auxquelles on ne sait donner que des rponses fragmentaires. L'enqute (Ackermann et Zigouris, 1966-1967) a t effectue auprs d'un groupe de stagiaires techniciens d'un centre de formation profes sionnelle de l'AFPA. Une srie de questions relatives des phnomnes qui leur taient familiers et dont l'explication faisait appel leurs connais sancesscientifiques et techniques a t soumise ces stagiaires deux reprises, en dbut de stage et, quatre mois plus tard, en fin de stage. Entre ces deux passations du questionnaire, les stagiaires avaient suivi une formation thorique. L'analyse des rponses obtenues lors de la premire passation devait permettre de dfinir l'organisation initiale des connaissances et l'analyse du second groupe de rponses devait rvler les transformations de cette organisation. Dans une tude de ce genre, on ne dispose pas d'une structuration prcise du plan vertical; les hypothses concernant les mcanismes d'assi milation restent vagues. Tout au plus sait-on dans quelles directions on doit les formuler. La procdure analytique doit donc tre exploratoire. Alors que jusqu'ici c'tait la structuration du plan vertical qui avait domin la dfinition de la procdure, dans le cas prsent, ce sera le choix du systme de reprsentation et d'analyse des textes. 2 .3 . a L'instrument d'analyse des textes est driv d'un systme gn rald'analyse documentaire, le SYNTOL (Cros, Gardin, Lvy, 1964). Ce systme permet de construire l'aide d'un lexique organis et d'un systme de relations syntaxiques des reprsentations condenses, normalises et manipulables d'noncs scientifiques. Ces rgles fixent la forme des reprsentations ainsi que les oprations et les transformations auxquelles elles peuvent tre soumises. Il comporte deux axes de rf rences. L'un, syntagmatique, dans lequel les relations entre les termes sont explicitement marques l'aide des relations syntaxiques. L'autre, paradigmatique, est li l'organisation hirarchique du lexique, laquelle permet d'exprimer certaines relations implicites de voisinage ou d'qui valence smantique. Les relations exprimes selon l'un et l'autre axe sont de mme nature et jouent des rles complmentaires dans l'expres sion de l'information. L'organisation paradigmatique est fixe une fois pour toutes. Il est seulement possible, lors d'une recherche rtrospective, et grce des instructions prcises, d'en tenir ou de ne pas en tenir compte. Elle permet d'exprimer des relations stables, universellement acceptes donc le plus souvent implicites. L'organisation syntagmatique offre au contraire de grandes possibilits combinatoires propres exprimer des rapports contingents, vrifis seulement dans un contexte particulier.

50 Un tel systme a l'avantage de ne pas fixer arbitrairement la dimens ion des units de contenu mais laisse en suspens la question du dcou page de ces units. Par ailleurs, le systme des relations SYNTOL ne permet pas d'exprimer la totalit des rgles rhtoriques du langage naturel, une rduction est ncessaire. Celle-ci a pu au moins partiellement tre rendue automatique par la construction d'algorithmes d'analyse automatique oprant au niveau syntaxique (et applicable au franais). Dans ces condi tions, en thorie sinon en pratique, il n'est pas ncessaire d'avoir recours des interprtations non systmatiques pour oprer ces rductions. Le gros problme reste bien entendu la construction du lexique et le choix de son organisation. Comme pour la dlimitation des units de contenu, la nature et les buts de la recherche sont sur ce point dterminants, et les deux questions ne sont pas indpendantes. En analyse documentaire, cette construction ne soulve pas de problmes majeurs tant que n'est pas pose la question de l'enrichissement du lexique. Les besoins spci fiques de la recherche rtrospective des informations, d'une part, et la connaissance du domaine scientifique sur lequel portent les documents traits, d'autre part, fournissent les principes de slection des termes et de leur organisation. Cette rfrence l'organisation du savoir scienti fique auquel renvoient les textes joue le rle d'une norme qui permet la rduction des noncs et assure l'efficacit de l'exploitation en recherche documentaire. 2.3. b Cet instrument ne peut pas tre utilis en analyse de contenu sans un minimum d'adaptation. Il n'est pas possible d'introduire bruta lement la rfrence au savoir scientifique, la grille culturelle, sans risquer de plaquer sur les textes une organisation des connaissances qui n'existe que chez celui qui les analyse. Comme nous venons de la rappeler, cette grille culturelle constitue en recherche documentaire, le paradigme de la mthode d'analyse et le principe de normalisation. Le problme est donc celui de la dfinition des critres de comparaison permettant de considrer comme quivalentes des expressions distinctes quant leur forme mais non quant ce qu'elles rvlent de l'organisation des connais sancesou des mcanismes de leur assimilation. Or, c'est l prcisment l'inconnue et on ne dispose pas d'un modle thorique de cette orga nisation et de ces mcanismes. Il ne nous est pas possible d'entrer dans les dtails de l'analyse (Ackermann et Zygouris, 1966). Nous devrons nous limiter ce qui en constitue les caractres saillants. Pour contourner la difficult, on a eu recours une procdure d'approximation en se basant simultanment sur la comparaison des rponses de l'ensemble des sujets (reprage des invariants ou des squences recurentes et des commutations) et sur une rfrence au savoir scientifique guide par cette comparaison. C'est par la lecture des noncs qu'on a fix ce qu'on pourrait appeler le niveau d'abstraction auquel il fallait se situer dans la formulation des thories pour obtenir une norme de comparaison ni trop grossire ni trop fine.

51 Cette norme a t traduite par le choix des termes du lexique et par l'organisation en arbre de ce lexique (les termes gnraux dominant les termes plus particuliers selon le modle du SYNTOL) ainsi que par la dtermination des units de contenu (squences constituant des rponses minimales la question pose). L'application de cette technique a permis de construire des repr sentations des textes l'aide d'un ensemble de schmas-types lesquels sont des constellations de concepts unis par des relations SYNTOL. Partant de l, on a pu dfinir une typologie des rponses fonde sur l'inventaire des schmas-types servant chacune les reprsenter. Cette typologie a t exploite lors d'une comparaison systmatique des rponses aux deux passations, comparaison qui a permis de mettre en vidence certains faits intressants. On peut reprsenter la dmarche l'aide d'une \(T) \ \ Ce) y \ \ \ \ \ (S)

y yS y

image graphique (laquelle vaut ce que vaut toute image). (P) et (S) reprsentent respectivement les axes paradigmatiques (lexique hirar chis) et syntagmatique (schma de reprsentation des textes), (C) est l'axe de la comparaison des textes, (T) l'axe de rfrence aux thories ou en d'autres termes le paradigme de l'interprtation par l'analyste de la comparaison brute des textes 2. Le dcalage entre ces deux systmes d'axes traduit la distance entre l'nonc brut et sa reprsentation. Plus la rduction est pousse, plus le dcalage est grand. Une dition ou prparation manuelle des textes est ncessaire pour passer d'un systme l'autre. On construit un tat intermdiaire des textes entre leur tat brut et leur reprsentation. Cet tat intermdiaire est une sorte de rsum qui limine les variations stylistiques, les lments inanalysables et pr pare le dcoupage en unit de contenu. 2 . 3 . c Le passage des rsums aux schmas-types peut tre systmat is mais non le passage des textes bruts leurs rsums. Ce biais rvle ce qui est contestable du point de vue mthodologique dans la procdure d'autant plus qu'un problme important, celui des erreurs, n'a pu tre rsolu de manire satisfaisante. Ce problme ne se pose pas en analyse documentaire ou ce qui n'est pas conforme la norme relve de l'inven2. On doit considrer que ces systmes d'axes sont situs dans le plan horizontal de rfrence puisqu'ils dfinissent le mode d'analyse des textes.

52 tion et implique un enrichissement ou une modification de cette norme. Ce n'est pas le cas ici et les textes noncs chappent la norme et ne sont reprsentables que pour autant qu'ils sont corrigs. On n'a en effet qu'une connaissance empirique des causes d'erreur (trs imparfaite du reste) et non des systmes d'erreurs, ce qui fait que ces donnes ne peuvent tre intgres la procdure analytique. La correction a pour effet de morceler les textes, de briser les relations entre les lments puisque c'est au niveau de ces relations (et non des termes qui sont toujours pris dans leur sens usuel, comme en recherche documentaire) que se manifestent ces erreurs. Les auteurs ont d reprsenter les noncs par les schmas-types correspondant l'nonc corrig (en leur adjoignant un indice pour signaler l'erreur), quitte revenir par la suite une analyse autonome des erreurs. En fin de compte, l'impossibilit de rendre compte des erreurs dans le systme de reprsentation utilis ne remet pas en cause toute la proc dure. La question des erreurs est importante, ce n'est cependant pas la seule question laquelle on peut s'intresser dans une tude sur les mcanismes d'assimilation. Les questions du niveau et du degr d'organisation sont non moins centrales. Ce sont ces problmes principalement qui ont pu tre tudis, ce qui signifie que les consquences de la non-rsolution du problme des erreurs ont pu tre circonscrites. Le vrai problme reste celui de la coupure dans le passage des textes leur reprsentation au niveau du rsum. Dans une dmarche exploratoire, ce fait revt une importance particulire. En effet, on est en droit de s'inquiter de savoir si les proprits des reprsentations rsultent ou non de l'introduction de la norme qui rend ncessaire cette coupure. A fortiori, les inferences, concernant les conditions de production, faites partir de ces proprits risquent de manquer de fondement. On ne peut pas dcider a priori que les oprations effectues sont illgitimes mais la procdure d'approxi mation, bien qu'elle constitue un effort de systmatisation laisse une marge d'incertitude. 2 . 3 . d Les problmes que nous venons d'voquer ne sont cependant pas les plus importants du point de vue de l'analyse de contenu. Le but d'une analyse de contenu n'est pas d'obtenir une reprsen tation systmatique des textes analyss. Tous les problmes de passage des textes leur reprsentation sont mineurs car le vritable problme est de savoir quel type de reprsentation fournira des indications utiles aux progrs de la recherche entreprise (ici, l'tude des processus d'ass imilation des connaissances). Nous avons dit que la procdure avait permis de construire une typologie des rponses. On doit remarquer que, selon le point de vue o l'on se serait plac, on aurait pu en obtenir d'autres sans qu'on puisse dcider que l'une soit meilleure. Bien au contraire, on devrait convenir qu'elles constituent autant de descriptions analytiques complmentaires d'une mme ralit car les units de reprsentation, schmas-types ou

53 autres, ne constituent pas des variables mais tout au plus des indices. Mme dans l'hypothse o l'on serait parvenu dfinir avec prcision des transformations l'intrieur de l'ensemble des schmas-types qui servent reprsenter les textes (en faisant apparatre certains d'entre eux comme des dveloppements ou des synthses logiques de schmas plus simples), rien ne permettrait d'affirmer que ces transformations refltent celles qui permettent effectivement de passer d'un type de rponse un autre. La question de l'adquation entre ces processus thoriques et les processus rels resterait entire. En effet, si dans une telle perspec tive les units de reprsentation apparaissent bien comme des variables des systmes de transformation correspondants, ces transformations comme ces variables ne sont dfinies qu'au niveau du plan horizontal : elles ne concernent que les proprits propres des textes par rapport la langue ou les unes par rapport aux autres. On fixe ainsi un mode d'ap proche pour Yobservateur des textes analyser qui ne tient aucun compte de l'unit phnomnale des processus tudis. Ce type de problme n'est pas circonscrit un domaine de recherche particulier. Il se pose dans les mmes termes, quelques nuances prs, pour toutes les mthodes qui tentent d'atteindre une caractrisation tho rique des conditions de production partir d'une analyse autonome des textes et de cela seulement. C'est en particulier le cas pour la Discourse analysis de Harris (1952) qui, fonde sur la seule analyse linguistique des textes en termes distributionnels et transformationnels, ne peut fournir autre chose que des indices linguistiques devant tre interprts en termes de condition de production, ce que Harris lui-mme a fait remarquer en opposant analyse du discours et analyse de contenu. Dans un autre ordre de faits, puisqu'il ne s'agit que de la gnra tion linguistique des noncs, des remarques analogues peuvent tre faites propos de certaines inferences faites par Chomsky (1967) partir de la construction des modles thoriques de la gnration que constituent les grammaires gnratives. Ces inferences concernent une rationalit intrinsque du sujet parlant qui permettrait de rendre compte de distinc tions telles que celles qui ont t introduites entre modle fort et modle faible. Cette rationalit intrinsque constituerait un ensemble de condi tions de production de tout nonc. Le fait important reste que des variables concernant les rapports entre noncs sont dfinis par les sys tmes de transformations introduits par Chomsky. Toutefois, les tenta tives faites pour tester l'adquation entre les processus thoriques de gnration et les processus rels par Miller (1962), Miller et Me Kean (1964) se sont soldes par des checs (Fodor et Garrett-Sutherland et Cohen, 1966). Ces rsultats ngatifs n'excluent cependant pas, comme nous le verrons, une utilisation rationnelle des systmes de transformat ions dfinis entre noncs.

54 3. Perspectives thoriques : Analyse de contenu taxinomique et analyse de contenu systmatique. 3.0. En examinant les principaux types de mthodes, notre objectif tait de rassembler les lments ncessaires pour formuler avec prcision les problmes de l'analyse de contenu. La critique interne des mthodes peut tre poursuivie dans le sens d'une remise en question des rapports entre l'instrument et les phno mnes observs bien au-del de ce que nous en avons dit. On peut cher cher tenir compte plus encore de la lettre des textes en raffinant les indices- linguistiques ou statistiques et simultanment on peut repenser les conceptions thoriques qui structurent l'analyse des conditions de production. Nous n'avons nullement t exhaustifs car ce n'tait pas notre propos. Par la critique interne, on ne peut poser que des questions mthod ologiques, or les problmes de l'analyse de contenu ne sont pas seul ement des problmes de mthode. Tant qu'on tentera sur deux plans spars d'amliorer l'analyse des conditions de production et l'analyse des textes, on ne pourra juger ni de la valeur oprationnelle ni de la lg itimit des oprations auxquelles conduit la mise en uvre des techniques. Les problmes sont simultanment thoriques et pratiques. Thorique en ce qui concerne la liaison entre les deux plans d'analyse, pratique en ce que les mthodes n'offrent que des possibilits limites (a) dans la mise l'preuve d'hypothses (b) dans la construction d'hypothses nouvelles. Les mthodes correspondent en effet deux types de dmarches analy tiques que nous avons appeles respectivement procdures closes et pro cdures exploratoires. Mettre en uvre une procdure close consiste partir d'un cadre empirique ou thorique d'analyse de certains tats psychologiques, psychosociologiques ou autres, qu'on cherche particul ariser ou bien propos desquels on a formul des hypothses ou des questions. On rassemble des textes produits dans des conditions telles que ces tats fassent partie de leurs conditions de production. Puis, on observe ces textes travers le cadre thorique fix pour aboutir une particularisation des conditions de production considres ou une mise l'preuve des hypothses les concernant. Ces procdures sont dites closes car le cadre pr-tabli ne peut tre modifi. En ce qui concerne les procdures exploratoires, on commence gal ement par rassembler des textes produits dans des situations parti culires correspondant aux tats qu'on veut observer. Le cadre d'analyse de ces dernires n'est pas fix et on part de la mise en vidence de pro prits des textes. On dfinit des diffrences, des similitudes et ventuell ement des transformations faisant se correspondre les textes ou leurs reprsen tations.Les diffrences, les similitudes, les transformations doivent ensuite tre interprtes pour aboutir une caractrisation des tats observs. En rsum, ce qui spare procdure close et procdure d'exploration c'est le fait que le principe d'organisation qui fixe le mode d'observation

55 est dans un cas fourni par ce que nous avons appel le plan vertical et dans l'autre, le plan horizontal. Ces procdures se rejoignent en ce qu'elles constituent les unes et les autres des techniques d'observation d'tats qu'on ne cherche pas apprhender en tant que condition de production des textes (bien qu'implicitement on les considre comme tels), mais en quelque sorte en eux-mmes, indpendamment du fait qu'ils peuvent intervenir dans le processus de production. Bien au contraire, ces tats interviennent dans des phnomnes d'un tout autre ordre et, si on postule l'existence d'une systmatique de ces tats, les procdures sont ncessai rement en marge de cette systmatique. Les techniques oprent en quelque sorte par coups de sonde, la seule unit phnomnale l'chelle des textes tant celle des processus de leur production et non celle des phnomnes tudis. Dans ces conditions, il n'y a rien d'tonnant ce que les textes ne puissent fournir que des indices des tats permettant de les classer en tablissant entre eux des diffrences et des similitudes. La logique des transformations entre tats est tablie ou postule sur un autre plan. Pour cette raison, nous dirons que ces procdures sont des mthodes d'analyse de contenu taxinomiques. Nous entendons ainsi insister sur ce qui constitue la limite de leur rentabilit thorique. 3.1. Ce qui prcde nous permet du mme coup d'noncer quelle condition on peut esprer s'affranchir de ces limitations. Le problme est en fin de compte celui du rapport entre les processus de production des textes et les phnomnes tudis. Nous allons commencer par mont rer que ce n'est l qu'une manire nouvelle d'noncer la problmatique que nous avions pose au dbut de cet article. D'une part, c'est bien la dimension des phnomnes tudis, celle du champ dans lequel ils oprent, qui rend ncessaire la sparation opra tionnelle des deux plans d'analyse. Elle fait que ces phnomnes appar aissent des moments de leur droulement dans le temps comme condi tions de production des textes. Le mode d'action de ces conditions de production particulires sur les caractristiques des textes est fix par les processus de production qui ont leur spcifit propre. Ce sont les lois de ces processus qui dfinissent le rapport entre les deux plans d'analyse. Les mthodes d'analyse de contenu taxinomique considrent les pro cessus de production comme un invariant dans la dmarche analytique. En procdant de la sorte, on fait une double approximation. Premire ment, on postule que, quels que soient les phnomnes tudis, c'est--dire la nature des conditions de production, les lois des processus de production qui interviennent sont les mmes. Deuximement, on pose qu'il y a ind pendance entre les phnomnes tudis et les processus de production que ces derniers n'en modifient pas le cours ou encore que le fait de la verbalisation ne constitue pas un vnement en soi 3. 3. Il n'est pas tonnant que l'on considre alors le langage comme un mode symbolique de comportement, c'est--dire dont l'ordre serait entirement rduct ible celui d'autres phnomnes.

56 Dire que les phnomnes tudis et les processus de production ont leurs lois propres ne revient pas poser ces deux ordres de phnomnes comme indpendants. Simultanment c'est la condition de toute approche scientifique des problmes poss. 3.2. Sur le plan thorique, que signifie le fait de considrer que les processus de production des textes et les phnomnes qu'on tudie par leur analyse ont leurs lois propres? Cela revient dire qu'il y a un ordre des phnomnes tudis et un ordre du langage mme si, dans une pers pective thorique plus large, on doit poser que l'ordre du langage comme tel rsulte de son intervention dans des phnomnes d'un autre ordre; tels que le fonctionnement de la pense, la communication, les changes, la culture, etc., et des conditions biologiques. C'est ce niveau que se situe l'articulation relle entre les deux ordres. Pratiquement, en ce qui concerne la dmarche analytique elle-mme, on doit poser qu'il existe un systme de transformations (dont la logique est celle des processus) qui permet de passer des conditions globales de production aux textes. En fait, on ne s'intresse pas aux conditions glo bales de production parmi lesquelles il faudrait ranger les caractristiques de la langue (institution sociale), mais seulement celles d'entre elles qui sont en rapport avec les phnomnes tudis. Corrlativement, on ne s'intressera pas toutes les particularits des textes mais seulement celles d'entre elles qui sont lies par l'intermdiaire des processus de production ces conditions particulires. En consquence, on ne peut se contenter de raffiner les indices sta tistiques ou linguistiques puisque rien ne permet de savoir a priori si ces indices ont une signification par rapport aux phnomnes tudis. Le problme est bien celui du rapport entre les deux plans d'analyse et renvoie une tude des processus de production. 3.3. L'tude de ces processus peut tre envisage dans deux perspec tives diffrentes. L'une est long terme et thorique. Elle vise la consti tution d'une thorie des processus de production. Cette entreprise dpasse le cadre de chacune des disciplines qui s'intressent au langage ou utilisent l'analyse de contenu, c'est--dire entre autres, la linguistique, la psychol ogie, la sociologie, la psychologie sociale, l'ethnologie, etc., car il faudrait tenir compte des conditions globales de production et de l'ensemble des proprits linguistiques des textes. En fin de compte, la validation d'une telle thorie (qui fournirait du mme coup une thorie de l'instrument d'analyse) repose sur la pratique analytique ce qui nous renvoie la seconde voie possible. Celle-ci est oprationnelle et court terme bien qu'elle puisse fournir des lments de l'approche thorique. Elle consiste isoler exprimentalement les variables des processus de production qui sont lies aux phnomnes tudis. Autrement dit, il s'agit de dgager le systme partiel de transformations permettant de passer des conditions de production particulires lies aux phnomnes tudis aux traits co rrespondants des textes. Dans cette voie, on doit avoir recours des pro-

57 cdures exprimentales qui permettent soit une manipulation des condi tions de production, non plus en tant que variables des phnomnes tudis, mais des processus de production, soit un chantillonnage des situations de production qui par recoupement a le mme effet. Dans le champ des phnomnes tudis, les conditions de production considres sont des variables de ces phnomnes organiss en fonction de la connais sance partielle qu'on en a ou d'hypothses de recherches. Cette organi sation se traduit par exemple par le fait que certaines variables sont considres comme indpendantes et d'autres comme dpendantes. De la mme manire, en ne considrant que les textes dans leurs rapports avec la langue, particulirement dans l'optique de la linguistique transformationnelle, on fait apparatre certains traits des textes comme variables. Le dveloppement de ce qu'on pourrait appeler la linguistique traductive ou transformationnelle et la thorie des grammaires gnratives (Chomsky et Miller, 1963; Quine, 1959) a permis de donner un sens prcis au concept d' vnement linguistique l'intrieur du plan de la langue. Par vnement, il faut entendre la manifestation de liaisons entre noncs en relation d'expansion par exemple. Jusqu' une priode rcente, on ne pouvait concevoir d'vnement linguistique que dans le cadre de la li nguistique diachronique et les phnomnes correspondants ne pouvaient se manifester en synchronie que sous la forme des pressions l'intrieur des structures synchroniques de la langue par le jeu des principes fonc tionnels ou d'conomie. Ces vnements ne pouvaient intresser des pro cdures d'analyse de contenu puisque leur dimension dpassait largement celle des phnomnes tudis. Pour l'analyse de contenu, la linguistique restait descriptive et ne pouvait fournir que des indices (mme l'int rieur du plan linguistique). Il n'en est plus de mme ds qu'on envisage la construction de modles oprationnels du langage dfinissant les trans formations entre formes de sens donn, c'est--dire en relation smantique d'expansion. Les formes deviennent alors des variables l'intrieur d'un systme. Toutefois, de la mme manire que l'organisation des variables dans le plan vertical est celle de l'ordre des phnomnes tudis, le systme des variables du plan horizontal concerne l'ordre des noncs par rapport la langue. Du point de vue de l'tude des processus de production, le statut de ces variables change. Globalement 4, les variables du plan vertical deviennent des variables indpendantes, celles du plan horizontal, dpen dantes. En d'autres termes, on construit le plan horizontal comme plan de variables dpendantes. Il n'en reste pas moins que, du point de vue des phnomnes tudis, les variables du plan vertical gardent leur statut et leur organisation. A cause de la sparation entre variables dpendantes et indpendantes dans ce plan, la mise en uvre de procdures expri4. A quelques nuances prs, puisqu'il faut laisser la possibilit d'un retour ren dant compte de l'autodtermination des processus de production dans leur droule ment squentiel.

58 mentales de ce type peut conduire la construction de vritables mthodes d'analyse de contenu que nous qualifierons de systmatiques. En effet, bien qu'on ne puisse pas dterminer simultanment les conditions de production et les manipuler, le fait qu'en tant que variables des phnomnes tudis elles aient des statuts diffrentiels, qu'elles soient hirarchises, permet de les dterminer dans leur relation avec les ph nomnes par une construction convenable du plan exprimental. Les mthodes d'analyse de contenu systmatiques s'intressent l'tude du langage et son fonctionnement du point de vue des conditions de production exactement de la mme manire que la linguistique par exemple vise l'ordre du discours et son fonctionnement du point de vue de la langue 5. L'avantage de ces mthodes est qu'elles se situent dans le cadre de la liaison fonctionnelle entre les deux plans d'analyse et qu'elles permettent de faire se correspondre des variables sur ces deux plans. Par ailleurs, il est possible de dlimiter avec prcision le champ d'investi gation alors que, dans le cas des mthodes taxinomiques, cette dlimita tion est toujours arbitraire. Le passage des mthodes d'analyse de contenu taxinomiques celles que nous venons de dfinir constitue un renversement. Les techniques taxinomiques sont des mthodes d'observation, leur rentabilit thorique est limite comme celle de toute mthode d'observation. L'introduction de l'exprimentation dans les procdures correspond non seulement un progrs mthodologique mais galement un stade plus avanc de la recherche. Les techniques d'observation ont longtemps suffi au besoin de celle-ci, elles s'avrent maintenant insuffisantes. En particulier l'ana lysede contenu systmatique devrait jouer un rle important dans l'tude des processus cognitifs sur lesquels on sait peu de choses et qui pourtant posent des problmes centraux en psychologie sociale. De ce qui prcde, on peut dgager quatre types de problmes int ressant l'analyse de contenu. En premier lieu, il faut choisir entre mthodes taxinomiques et mthodes systmatiques. Les premires conduisent un classement d'l ments des textes en fonction de critres internes ou externes. Il reste interprter la signification de ce classement du point de vue de la recherche entreprise : l'tude de phnomnes particuliers. C'est choisir la voie de l'induction laquelle ne peut conduire la construction de modles tho riques parce que la liaison fonctionnelle entre les variables des deux plans d'analyse lui chappe. L'analyse de contenu taxinomique est une tech nique d'observation, elle ne peut tre utile qu' ce titre. Les mthodes systmatiques ouvrent la voie une dmarche deductive en distinguant clairement les phnomnes tudis et les processus de production des 5. Il est remarquable de constater que la linguistique s'est tourne vers l'tude du fonctionnement du discours du point de vue de la langue au moment mme o les techniques de traduction automatique et de fabrication de rsums automatiques introduisaient en quelque sorte l'exprimentation en linguistique.

59 textes par l'analyse desquels est mene cette tude et en se pliant aux dterminations des uns et des autres. Elles permettent en cernant les liaisons entre les diffrentes variables de mettre l'preuve des modles dynamiques des phnomnes tudis. Le choix entre mthodes taxinomiques et systmatiques concide donc avec celui qui est pos l'occasion de toute investigation entre observation et exprimentation. Si on opte pour des mthodes systmatiques, c'est donc en fonction des objectifs et de la nature de la recherche entreprise. Il reste qu'il ne saurait y avoir de mthode gnrale d'analyse de contenu systmatique. De par sa dfinition mme, l'instrument doit tre adapt au type de ph nomnes tudis. Ceci nous conduit distinguer deux autres catgories de problmes, lesquels ont prcisment trait la mise en uvre des mthodes systmatiques. Le choix des modles dfinissant les variables sur les deux plans d'analyse est fondamental. Il dpend pour les unes du dveloppement antrieur de la thorie des phnomnes tudis et pour les autres de l'analyse linguistique. Toutefois, ds ce stade, il est ncessaire de faire ces hypothses sur les processus de production de manire pouvoir considrer les variables dans le cadre de ces processus et non plus dans leurs plans respectifs. Ce sont ces hypothses qui, en fin de compte, dter minent le choix des modles particuliers sur l'un et l'autre plan d'analyse. Elles devront tre formules partir de ce que l'on sait de la thorie des processus de production et c'est parce qu'il s'agit d'hypothses drives de cette thorie gnrale qu'on devra avoir recours l'exprimentation. Il est donc clair qu'on ne doit pas confondre les manipulations que l'on pourrait faire sur les variables en tant que variables de phnomnes tu dis et en tant que variables des processus de production. En consquence, la mise en uvre des mthodes systmatiques sup pose qu'on ait clairement dfini les plans exprimentaux et construit des situations exprimentales. En d'autres termes, la mthodologie expri mentale doit ncessairement intervenir et tre adapte. Il reste une dernire catgorie de problmes qui dcoulent du fait que ces mthodes de recherche se situent au carrefour de la linguistique et de la psychologie sociale. Ces deux disciplines se sont en quelque sorte tournes le dos, les linguistes dnonant juste titre le psychologisme et les psychologues assimilant le langage un ensemble quelconque d'in dices de phnomnes non linguistiques. On a donc confondu variables des textes et variables des phnomnes tudis en niant, entre autres, l'existence d'effets idologiques. On admet habituellement sans difficults que la linguistique puisse apporter beaucoup la psychologie sociale, mais inversement l'analyse de contenu systmatique devrait jouer vis-vis de la linguistique un rle analogue celui de la traduction automat ique. Elle conduit une mise l'preuve des concepts et des mthodes et simultanment elle permet d'introduire dans la recherche linguistique elle-mme une dimension nouvelle, celle des phnomnes dans lesquels

60 intervient le langage. Or, la prise en considration des dterminations que ces phnomnes imposent la production du discours doit permettre de rsoudre certains problmes strictement linguistiques qui, autrement, resteraient obscurs. Nous croyons que les mthodes d'analyse systma tique devraient fournir des indications utiles la thorie linguistique de la gnration des noncs" et l'tude de la logique du langage. Bales, R. F. (1950), A set of categories for the analysis of small group research , Amer. Sociol. Rev., 1950, 15, 146-159. Barbichon, G. et Moscovici, S. (1965), Diffusion des connaissances scien tifiques , Inf. Sciences Soc, 1965, 4-1, 7-22. Berelson, B. (1952), Content analysis in communication research, The Free Press, Glencoe. Chomsky, N. et Miller, G. (1963), Introduction to the formal analysis of natural language, in Luce, R. D., Bush, R. R., Galanter, E. (eds), Handbook of mathematical psychology, Wiley, New York, Londres, vol. 2, pp. 269-322. Chomsky, N. (1967), Cartesian linguistics, Harper and Row, New York. Cros, R. C., Gardin, J. C, Levy, F. (1964), V automation des recherches docu mentaires, un modle gnral, le SYNTOL , Gauthier Villars, Paris. Fodor, J. et Garrett, M. (1966), Some reflections on competence and per formance. Comment par Sutherland, N. S. et Cohen, L. J., in Psycholinguistics papers. Proceedings of the 1966 Edinburgh conf. Lyons, J. et "Wales, R. J. (eds), Edinburgh University Press. Harris, Z. S. (1952), Discourse analysis , Language, 28, 1-30. Hart, A. (1934), Shakespeare and the homlies, Melbourne University Press. Holsti, O. R., North, R. C, Zaninovich, H. G., Dinnes, D. A. (1963), Content Analysis, Northwestern University Press. Laswell, H. D. (1938), A provisional classification of symbol data , Psychiatry, 1938, 1, 197-204. Miller, G. A. (1962), Some psychological studies of grammar , Amer. Psychologist, 17, 748-762. Miller, G. A., Me Kean, K. (1964), A chronometric study of some relations between sentences , Quant. Journ. of Exp. Psychology. Moscovici, S., Communication processes and the properties of language, in Berkowitz L. (ed), Advances in Experimental Social Psychology, 1967, 3, Academic Press, New York et Londres. Zygouris, R. et Ackermann, W. (1966), Reprsentation et assimilation des connaissances scientifiques. Doc. n 3, rontyp CERP/AFPA. Osgood, C. E. (1962), Symbols of Democracy, Stanford University Press. Osgood, C. E., Saporta, S., Nunnaly, J. C. (1956), Evaluative asser tion Analysis , Litera, 3, 1956, 47-102. Pool, I. de S. (1959), Trends in Content analysis, The University of Illinois Press, Urbana, 111., 189-233. Quine, N. V. (1959), Meaning and translation, In Brower, R. A. (ed), On Translation, Havard University Press, Cambridge Mass. Stone, P. J., Dunphy, D. C, Smith, M. S., Ogilire, D. M. (1966), The general inquirer a computer approach to content analysis in the behavioral sciences, Mit Press, Cambridge. Mass. White, R. K. (1951), The study of behavior : Q-technique and its methodology, Glen Gardner, New Jersey. The society for the psychological study of social issues. Zygouris, et Ackermann, W. R. (1967), Code d'analyse et domaine de rfrence. Bulletin du CERP.