Sie sind auf Seite 1von 68

tude par questionnaire

Le sondage

Plan
Introduction
Construction du
questionnaire
Administration du
questionnaire
Dpouillement du
questionnaire
2

Paradoxe des enqutes marketing


par questionnaire

Valider des hypothses, des relations


Mesurer des phnomnes
Sur des donnes auto-produites

Le modle de recherche sous-jacent


Descripteurs
sociologiques
Descripteurs
sociodmographiques
Descripteurs
psychologiques

Variables
explicatives
causales

Variable(s)
expliquer

Descripteurs
situationnels

Information recueillir : valeur et


proportion
Faits, croyances,
connaissances, notorit,
image
Attitudes, opinions,
prfrences
Motivations, freins
Intentions
Comportements, non
comportements
5

Construction du
questionnaire

laboration du questionnaire

tapes de llaboration
Principes gnraux de
conception
Types de questions
Forme des questions

tapes de llaboration dun questionnaire

Dfinition des informations


utiles
Passage des informations
utiles aux questions poser
Nombre de questions
Ordre des questions
Rdaction, dition du
formulaire, test, rvision,
test
9

Principes de conception
Rdaction
Attirer lattention et
susciter lintrt
tre compris
immdiatement et de
manire homogne
viter les biais dans les
rponses
Prsentation

10

Principes de conception
Structure
Parties
Arborescence
logique
Filtres (technique
de lentonnoir)

11

Les sources de biais dans les


questions
Le recours la mmoire
Avez-vous achet des haricots
dans les quinze derniers jours ?
Le recours lanticipation dans les
intentions
Avez-vous lintention dacheter
des haricots ?
Limprcision dans la question
Allez-vous souvent au
cinma ?
La mise en cause du prestige social
ou de tabous
quels moyens contraceptifs
utilisez-vous ?
La complexit et la longueur des
questions
Ne pensez-vous pas que les
enfants ne mangent pas

12

Types des questions


Fermes
rponse unique
dichotomique
rponse unique
exclusive (caftria,
chelles)
rponses multiples
(nombre contraint ou
libre)
rponses multiples
ordonnes
Ouvertes
numriques
textuelles

13

Administration du questionnaire
Critres de choix dune
mthode
Faciliter lobtention des
rponses
tre cohrente avec le
budget allou lenqute

14

Mthodes dadministration
Interview par enquteur
domicile ou sur le lieu de travail
Enqute dans la rue ou dans un
lieu public
Enqute par tlphone (CATI)
Questionnaire auto-administr
Enqute par correspondance
Enqute par ordinateur (CAPI) ou
par Internet

15

Interview domicile ou sur le lieu de


travail
Rle de lenquteur
Il doit prendre rendez-vous ou
annoncer sa visite
Il doit crer une atmosphre
favorable lobtention des
rponses
Il doit obtenir des rponses
toutes les questions
Il doit apprcier la validit des
rponses
Avantages
Respect de la taille et de la
structure de lchantillon
Ralisation matrielle commode
Inconvnients
Biais dus la prsence de
lenquteur
Risque de fraude
Cot lev (administration et
dplacements)

16

Enqute dans la rue ou lieu public


Rle de lenquteur
Il doit aborder les interviews
sans quils se mprennent sur ses
intentions
Il doit obtenir leur concours et
obtenir des rponses toutes les
questions
Possibilit de raliser rapidement un
grand nombre dinterviews
Pas deffort de mmoire si
lenqute porte sur des actes qui
viennent dtre accomplis ou sur
un vnement qui vient dtre
vcu
Reprsentativit incertaine
selon les heures et les jours de la
semaine
Ralisation matrielle peu
commode

17

Enqute par tlphone (CATI)


Rle de lenquteur
Il doit joindre son interlocuteur
des heures propices
Il doit obtenir son concours et
obtenir des rponses toutes les
questions
Avantages
Permet de toucher des individus
trs dissmins (cot moindre)
Possibilit de raliser
rapidement un grand nombre
dinterviews
Inconvnients
Reprsentativit incertaine
Cot calculer judicieusement
Immdiatet des rponses (pas
de temps de rflexion)

18

Questionnaire auto-administr ou
par correspondance
Rle des documents de prsentation
Ils doivent attirer lattention et
inciter les interviews rpondre
Ils doivent expliquer comment
rpondre et retourner le
questionnaire
Avantages
Permet de toucher des individus
trs dissmins
Permet une libert de rponse et
garantit lanonymat
Permet dutiliser un
questionnaire long en rduisant
son apparence
Inconvnients
Taille et reprsentativit
impossible apprcier
Redressement dchantillon

19

Enqute par ordinateur ou par


Internet
Mthode de recrutement des
sonds
Par un animateur (stand dans
une foire ou salon, ordinateur
en magasin)
Par mdia interpos (presse,
radio, tlvision, Internet, email)
Concours facile obtenir par la
nouveaut du mdia
Permet de toucher des
individus trs dissmins
Dpouillement instantan,
pas de saisie des
questionnaires
Inconvnients
Reprsentativit incertaine

20

Mthode assistes
dadministration

CAPIComputer Assisted Personal Interview Enqute en face


face assiste par ordinateur. L'enquteur utilise un ordinateur
portable sur l'cran duquel il lit les questions et saisit directement
les rponses (voir galement CATI, CAWI, SATI, WATI).

CATIComputer Assisted Telephone Interview Mthode d'enqute


permettant de recueillir les donnes relatives l'appel
directement sur l'ordinateur du tl-oprateur (voir galement
CAPI, CAWI, SATI, WATI).

CAWIComputer Assisted Web Interview Enqute via Internet


assiste par ordinateur (voir galement CAPI, CATI, SATI, WATI).

WATIWeb Assisted Telephone Interview Mthode de recueil


dinformations par tlphone et assiste par Internet (voir
galement CAPI, CATI, CAWI, SATI).

21

Dpouillement du questionnaire

tapes du dpouillement
Les diffrentes analyses et
traitements statistiques
Le passage la population

22

tapes du dpouillement du
questionnaire
Saisie de la structure de
lenqute
Saisie des questionnaires
Contrle de la
reprsentativit et
redressement
Constitution de souschantillons
dpouillement
23

Analyses

et traitements

Question ouverte
numrique
Question ouverte textuelle
Recodage des questions
numriques, textuelles et
rponses multiples
Questions rponses
ordonnes
Tris plat (questions
fermes et chelles)
Tris croiss
Tris filtrs

24

QUELQUES GENERALITES SUR


SPHINX
QUELQUES RAPPELS SUR LE
QUESTIONNAIRE
25

Quelques Gnralits sur


Sphinx
Logiciel daide
La conception dun questionnaire
Au traitement statistique des donnes

Tris plat, tris croiss, tests du khi-deux (Selon les hypothses


vrifier)

A la reprsentation graphique des rsultats


Tableaux de valeurs, reprsentations graphiques (camemberts,
histogrammes )

Avantages / forces
Assez souple et flexible
Modification, volution des questions (avant la saisie)

(Assez) Facile daccs, dapprentissage et dusage


Dans la ralisation des questionnaires
Leur saisie (directe ou indirecte), les traitements statistiques

Mise en ligne du questionnaire


Mais peu ergonomique (Surveygold : http://surveygold.com/download.htm )

Inconvnients / faiblesses
Fragile (attention aux buggs)

26

Le questionnaire : quelques
rappels

Avant la conception le questionnaire,


sassurer davoir au pralable
formul la problmatique et les
hypothses
dfini son chantillon
men des entretiens exploratoires, voire
semi-directifs

La conception du questionnaire
Aprs la conception du questionnaire
Le pr-tester avant ladministration !!!!
27

Sur sa rdaction. (1/2)

Lorganisation du questionnaire

Un titre gnral : informatif, attractif et neutre


Evitez Questionnaire ; Enqute
Un consigne inaugurale prcise :
Cest quoi ? pourquoi faire (Objectif) ? de qui ? Pourquoi les avoir choisi
? combien de temps dure-t-il ? garantir lanonymat et un contact
Structurer le questionnaire en diffrentes
sous-parties thmatiques logiques et cohrente
Vous (qui tes vous?) profil socio-biographique
Votre Travail (que faites vous ?) Questions sur son activit
professionnelle
Vos impressions sur le travail (Que ressentez vous ?) Questions
relatives aux contraintes et astreintes du travail)
28

Sur
saquestions
rdaction.
(2/2) (items)
La formulation
des
et des rponses
Concision et esprit de synthse : une trentaine de questions qui peut
varier selon les objectifs et les contextes de ltude (recherche,
tlphone)
Simplicit : questionnaire trop complexe, trop long, trop dtaill peut
drouter/dcourager (essayer de toujours faire le plus simple possible)
questionnaire intuitif
Unicit: une question ne mesure quune seule et seule variable
(questions non ambigus, non polysmiques)
La spcificit : la question que lon formule doit mesurer parfaitement la
variable que lon souhaite tudier (Selon problmatisation & Hypothses)
Neutralit : questions Non inductives, impartiales, affirmatives
La varit : varier les modalits de rponses, les questions, le rythme,
quelques questions ouvertes (prendre plaisir rpondre)
Vocabulaire adapt la cible sonde (entretiens exploratoires)
Construire le questionnaire (formulation de questions et modalits de
rponses) daprs ce que voulez dmontrer et par rapport aux traitements
statistiques que vous allez raliser (tris croiss, tests de Khi-deux).
Certaines formulations de questions ne permettront en effet pas de raliser
certains tests statistiques (ou alors avec beaucoup de difficults)

29

Les Diverses modalits de formulation des


questions
Type de
quest.

Df.

Sphinx

Exemples

Quest.
Ouverte

Aucune modalit
de rponse
propose

Texte

Quelles sont les difficults que


vous rencontrez dans votre
travail ?

Questions
fermes
choix
uniques

Plusieurs modalit
de rponse
propose (au
moins deux)
une seule
rponse possible

Ferme
unique

- Prcisez votre sexe : H/F


- Indiquez votre Syst Dexploit
XP / 2000 / Mac / Linux/ Autres
prcisez

Questions
fermes
choix
multiples

Plusieurs modalit
de rponse
propose
Plusieurs
rponses
possibles

Ferme
Multiple

- Quels sont les facteurs


dambiance qui vous gnent le
plus dans votre travail ?
Bruit / Temprature / Lumire /
Autres prciser
30

Type de
quest.
Quest.
ferme
Intervalle

Df.

Sphinx

Modalits de
rponses
prsentes sous un
ordre gradu
pour mesurer une
attitude, une
prfrence:

Ferme
Echelle

Question
ferme
Intervalle
numrique

Echelle tranches
(dage, de
frquence, de
grandeur)

Ferme
Echelle

Question
ouverte
numrique

A utiliser lorsque les Numrique


rponses attendues
sont numriques
(pour faire des
statistiques).

Echelle de
Likert
Echelle
dOsgood

Exemples
--

Vous vous panouissez dans votre


travail .
-* Pas du tt daccord/ plutt pas
daccord/ plutt daccord /Tout fait
daccord
-* 1(pas panoui) / 2 / 3 / 4 / 5 /6 / 7 /
8 (trs panoui)
-- En ce qui concerne vos conditions
de travail, vous tes : trs insatisfait /
insatisfait/ Satisfait / trs satisfait
--

Prcisez votre salaire mensuel net


(Hors prime)
-Inf 1000 / de 1001 1500 / de
15001 2000 / Sup 2001
- Votre dernier congs maladie a dur
: de 1 3 jours, de 4 7 jours, plus
de 7 jours
- Combien de formation avez-vous
demand cette anne ?
--X--- Formation
-- Combien de formation avez-vous
31
suivi cette anne ? --X--- Formation

La conception du questionnaire
sur Sphinx
Les diffrents lments
Lentte du questionnaire
Titre, consigne, organisme, date

Structuration en parties (Sous-thmes)


Menu > Organiser >Insrer un titre de partie

Rdaction des questions)


(Rdiger Nouvelle question ou double clic sur lcran ou clique gauche)
Libell : rdaction du texte de la question
Variable : Titre abrg qui rsume le plus clairement la
question
Type : nature de la variable (Ferm unique, multiple)
Noms des modalits : Saisie des rponses possibles
spares par des points virgules (;)
32

Boite de dialogue pour saisir les questions

33

Questions de vocabulaire.

Vocabulaire

Une observation
= 1 individu ayant rempli un questionnaire

Citation (Effectif)
Nombre totale de personne ayant rpondu une modalit de rponse
Par exemple 55 personnes ont rpondu quelles taient en manque de
reconnaissance dans leur travail

La frquence
Cest le pourcentage des rponses donnes par les individus pour chaque
modalit de rponse.
Ex : 50 % des personnes estiment en tre manque de reconnaissance dans
le travail (sur un total de 110 rpondants)
Cette frquence peut tre calcule par rapport aux citations ou aux
observations

Tableau de Citations (par dfaut)


Le calcul (%) sur fait alors sur le nombre de rponses totales donnes par
les individus (quand plusieurs rponses sont possibles : QCM)
Ex : Le choix de la modalit Manque de reconnaissance reprsente
27,5 % de lensemble des citations donnes (n = 200)

Tableau des observations


34
Nombre total de personnes ayant rpondu la question (Cf ex. plus haut)

Les analyses statistiques


Objectifs
Rsumer de faon claire et structure
linformation qui a t collecte
Vrifier les hypothses qui ont t
formules au dpart

Deux types danalyse complmentaire


Analyse plat
Tris croiss
Analyse Bi & Multivaries
(test dhypothses recherches)
35

Analyse plat : 1 regard sur


les rsultats de lenqute
La prsentation des rsultats se fera laide:
de tableaux de frquence et/ou
de reprsentations graphiques adquates
(camemberts/secteurs, diagramme, histogrammes)
dindicateurs de tendance centrale (moyenne) et de
dispersion (cart-type) pour les variables mtriques
Ces rsultats seront :
ordonns de manire logique selon un plan
(thmatique) et non prsents questions par questions
et brivement comments de manire faire ressortir
les points importants.

36

Exemple de Tableau de frquence : Questions fermes


choix unique
Serives

Dans quel service travaillez


vous ?
Nb. cit.

Frq.

Production

80

26,7%

Administration

77

25,7%

Informatique

50

16,7%

RH

45

15,0%

Mthodes

34

11,3%

Recherche & Dveloppement

14

4,7%

300

100%

TOTAL OBS.

Les modalits de rponse proposes sont reportes avec le nombre


de citations (effectifs en valeur absolue: n) et les frquences
associes (freq : %).
On a demand un classement des rponses par ordre dcroissant
Conseil: dans Sphinx, slectionner Copier en texte. Cela permet de
coller le tableau sous forme de texte, transformable en tableau
(aprs avoir slectionn du dbut la fin du tableau Insrer 37
Tableau) au lieu de le coller en image simple.

Diverses reprsentations graphiques possibles


4,7%

GEA

26,7%

Gnie Civil

11,3%

GEA

26,7%

25,7%

Informatique

Gnie Civil
Informatique
Biologie

16,7%

Biologie
Chimie

Chimie

15,0%

15,0%

Gnie Chimique

11,3%

Gnie Chimique

4,7%

Barres
16,7%

25,7%

Camembert
Secteur

4,7%
GEA

26,7%
25,7%

11,3%

26,7%

Gnie Civil

26,7%

Informatique
Biologie

26,7%

25,7%

Chimie
Gnie Chimique
16,7%
16,7%

15,0%

15,0%

15,0%

Anneaux
Donuts

11,3%

11,3%

4,7%

4,7%

4,7%
GEA

Gnie
Civil

Inform Biolog
atique
ie

Profils

Chimi
e

Gnie
Chimi
que

GEA

16,7%

25,7%

Gnie
Civil

Inform Biolog
atique
ie

Chimi
e

Gnie
Chimi
que

Histogramme
38

Exemple de Tableau de frquence : Question fermes


choix multiple sans classement ? :
Citation ou observation ?
Quelles sont les fonctionnalits que vous utilisez le plus (au moins 3 fois par semaine) ?
Plusieurs rponses sont possibles
Fonctionnalits-internet

Nb. cit.

Frq.
Nb. cit.

Frq.

Messsagerie

19

19,6%

surf-navigation

17

17,5%

chat

5,2%

tlchargement

9,3%

Fonctionnalits-internet

Messsagerie

19

95,0%

surf-navigation

17

85,0%

chat

25,0%

tlchargement

45,0%

rsaux sociaux

10

10,3%

forum

8,2%

10

50,0%

blog

7,2%

achats en ligne

13

13,4%

forum

40,0%

jeux en rseaux

9,3%

blog

35,0%

autre

0,0%

TOTAL CIT.

97

100%

achats en ligne

13

65,0%

jeux en rseaux

45,0%

autre

0,0%

rsaux sociaux

TOTAL OBS.

20

Obs : nombre total dindividus


interrogs (*) ( prfrer dans ce cas)

Citat : nombre de rponses tota


donnes
39

Exemple de Tableau de frquence : Question fermes


choix multiple avec classement
Dans la liste suivante, quels sont pour vous les 5 principaux facteurs
de stress ?

40

Exemple de Tableau de frquence :


Question fermes chelle (1/2)
Daprs vous, la qualit de lcoute du management est-elle ?
Qualit Dcoute

Nb. cit.

Frq.

Non rponse

126

42,0%

Trs satisfaisante (1)

48

16,0%

Assez satisfaisante

99

33,0%

Peu satisfaisante

20

6,7%

2,3%

300

100%

Pas du tout satisfaisante (4)


TOTAL CIT.

Calcul dun score


Moyenne = 1,92 Ecart-type = 0,74
La question est rponse unique sur une chelle.
Les paramtres sont tablis sur une notation de 1 (Trs
satisfaisante) 4 (Pas du tout satisfaisante).
Les calculs sont effectus sans tenir compte des non-rponses.
La moyenne est calcule automatiquement et sinterprte selon
la notation des extrmits de lchelle

41

Exemple de Tableau de frquence :


Question fermes chelle (avec score) (2/2)

Tableau 1 Aperu des scores pour les problmes physiques (en %


et selon la moyenne dcroissante)

Score
moyen

Aucun
Lger
dsagr dsagr
ment (1) ment (2)

Dsagr
ment
modr
(3)

Troub
les
(4)

Trouble
s
srieux
(5)

Troubles
insoutena
bles (6)

Epaules

1.93

24

19

17

24

11

Nuque

1.92

24

29

19

23

Bas du
dos

1.84

30

16

19

20

10

Yeux

1.66

26

23

23

27

Haut du
dos

1.31

41

20

16

14

42

Tableaux de groupes de questions:


Question avec modalits de rponses communes et thmatiquement proches

Quel est lieu dusage


des TIC ?

Quel est le comportement vis-vis des TIC (dpendance)

43

Exemple de Tableau de frquence :


Question ouvertes numrique
Combien d'heures en moyenne passez vous par jour sur internet
(messagerie, surf, chat, jeux en rseau, tlchargement...)
heures Nb. cit.
val = 1
4
val = 2
4
val = 3
4
val = 4
3
val = 5
2
val = 6
3
TOTAL CIT. 20

Frq.
20,0%
20,0%
20,0%
15,0%
10,0%
15,0%
100%

Minimum = 0, Maximum = 15
Moyenne = 3,20 Ecart-type = 1,74
44

Exemple de Tableau de frquence :


Question ouvertes textes
Indiquez par un mot "positif" ce
que signifie internet pour vous ?

Ouverture
Relations
25,0%
connaissance
Interactions
Proximit
libert

25,0%
5

4
3
2
1

20,0%
15,0%
10,0%
5,0%

Nombre de valeurs diffrentes : 6


'Ouverture' est le plus cit : 5
observations.
45

Les analyses bi et multi-varies


: test dhypothse de recherche
Analyses plus pousses
Implique deux ou plus de deux questions dont on croisera les
rponses.
Le choix des analyses mettre en place dpendra de plusieurs
facteurs;
du nombre de variables mises en relation
du statut des variables testes
Nominale : Plutt satisfait ou Plutt insatisfait de ses conditions
de travail
Ordinale : classement des rponses du plus faible au plus fort
Mtrique/ Numrique : Evaluation donne ses conditions de
travail sur une chelle de 1 (trs mauvaises) 8 (trs bonnes) ou
Echelle de salaire

de lobjet de lanalyse.
46

Objectifs
Tester un lien dassociation entre deux variables nominales

(ferme et ferme)
Existe-t-il un lien entre le fait que louvrier se dclare satisfait
ou insatisfait de ses conditions de travail et /
le type de formation quil dclare avoir pralablement suivi ?
Le fait dtre un H/F - selon son ge

Analyse approprie
Test du Chi-deux avec
calcul du
Coefficient de
contingence

Tester un lien de causalit entre une variable cause nominale


(VI) et une variable effet mtrique/numrique (VD)
Le type de formation/lge/le sexe dtermine t-il lindice de
satisfaction perue des conditions de travail?

Analyse de variance
(Anova) Fischer

Tester un lien dassociation entre deux variables ordinales


Existe un lien entre lattractivit de certaines TIC et le type
de loisirs prfrs (dans les deux cas , lindividu devait
classer des propositions).

Coefficient de
corrlation de
Spearman-Kendall

Tester un lien dassociation entre deux variables mtriques


(Numriques
Le score dpanouissement professionnel (de 1 8) est-il
associe lge des salaris ( lanciennet " ? Au salaire)

Coefficient de
corrlation linaire
de Pearson

Tester un lien de causalit entre une variable cause mtrique


(ou binaire) et une (ou plusieurs) variable(s) effet(s)
mtrique(s)
Le salaire a-t-il une influence sur lvaluation de la charge
cognitive perue

Analyse de rgression
linaire

ANalysis Of
Variance

47

Les analyses multi-varies

Au stade des analyses, les rponses aux questions


deviennent des variables explicatives sur lesquelles
on applique des outils statistiques afin dexpliquer le
phnomne, objet sous lequel porte lenqute. Or la
plupart de ces phnomnes sont dtermins par
linteraction de plus de deux variables, se qui nous
amne faire recours une srie de techniques dites
multivaries

I. Mthodes multivaries
1- Les mthodes multivaries pour expliquer
2-Les mthodes multivaries pour synthtiser
3-Les mthodes multivaries pour classifier: Les typologies
II La rgression multiples
Conclusion

I. Mthodes multivaries
Selon les types des questions (variables) et lobjectif de
lanalyse statistique on distingue trois catgories des mthodes
multivaris:

Mthodes multivaries pour expliquer


Mthodes multivaries pour synthtiser
Mthodes multivaries pour classifier

1 Les mthodes multivaries pour expliquer

V4

1-1 La rgression multiple

Cette technique danalyse sapplique exclusivement aux


variables numriques, cest--dire dans les enqutes:
aux questions ouvertes numriques ; aux questions
fermes chelles; aux questions fermes uniques
dichotomiques: oui-non ou 0/1.
Il sagit dune extension de lanalyse de rgression
simple , mais dont lanalyse sappuie sur plus de deux
variables. Autrement dit, on cherche comprendre
comment se comporte une variable expliquer y en
fonction de plusieurs variables explicatives x1, x2 ,x3

1-2 La matrice importance-performance

Il sagit dune application particulire de lanalyse de rgression


multiple utilis souvent dans le cadre dune enqute de
satisfaction qui
sintresse gnralement a mesurer la
satisfaction globale, puis donner une mesure dtaille dun
ensemble des critres identifis a priori comme les composantes
partielles de la perception du client ou du collaborateur.
Souvent les individus sont questionns sur limportance relative
quils accordent chaque item particulier afin de mettre en
perspective la satisfaction sur chaque critre avec son
importance. Cette matrice permet donc de dgager la
satisfaction du rpondant et limportance quil accorde aux
diffrents facteurs valus en conduisant une carte, o chaque
critre est plac sur deux dimensions: horizontalement,
performance mesure par les notes moyennes de critres sur
lensemble des rpondants; verticalement, limportance quon
peut apprcier selon plusieurs mthodes dont les dtails ne font
pas objet de cette expos.

1-3 Les arbres de dcision

Les arbres de dcision savrent plutt utile pour


identifier les caractristiques dune population cible dont
on cherche expliquer en fonction dun ensemble de
variables, afin de dgager celles qui ont les plus
dimpact. A titre dexemple, une enqute de satisfaction
pourrait sintresser identifier ce qui caractrise les
clients non satisfaits. Pour ce faire lalgorithme de
larbre de dcision effectue tous les croisements
possibles afin de mettre en avant les variables les plus
lies celles qui nous intressent, et surtout les
modalits qui correspondent le mieux la cible que lon
cherche a caractriser

2 Les mthodes multivaries pour synthtiser

2-1 Lanalyse factorielle en composantes principales ou ACP

LACP sert observer les questions redondantes est


celles qui mesurent la mme chose car fortement
corrles entre eux . On pourra ainsi synthtiser
linformation puis la restituer sur une carte factorielle,
cest--dire sur un plan deux dimensions plus facile
lire . Cest noter que lACP semploie pour des
variables numriques: Questions ouvertes numrique,
fermes chelles ou fermes uniques binaires.

q1 q2 q3 q4 q5 q6q16

F1 F2

2-2 Lanalyse factorielle des correspondances ou AFC

Ayant les mmes principes de base que lACP, lAFC sapplique


quant elle aux variables nominales-les questions fermes. Dans ce
cas ci on sintresse non pas aux combinaisons des variables mais
aux combinaisons des modalits afin didentifier les grandes
dimensions des rsultats, et les modalits qui sont lies
statistiquement. LAFC est employe surtout pour croiser
simultanment plus de deux variables nominales-les rponses des
questions fermes.

3 Les mthodes multivaries pour classifier: Les typologie

I. II La rgression multiple
Pour dterminer sous forme dquation linaire la relation
explicative amenant des variables explicatives
expliquer ou non un phnomne (variable explique)

V1
V2
V3

V0

Vn
Variables
explicatives

Variable explique

Equation de rgression multiple:


Vo = a1xV1 + a2xV2 + a3xV3 + anxVn

Exemple illustratif

Expliquer la dpense touristique totale V1 en fonction des


dpenses dhbergement V2, dalimentation V3, de restauration
V4 et de loisir V5

On obtient un modle du type:


V1= aV2+bV3+cV4+ rsidu
La qualit de lajustement sapprcie par rapport la valeur
du coefficient de corrlation. Plus la valeur absolue est
leve, plus faible est lcart entre les valeurs calcules par
lquation et les valeurs observes en ralit (cet cart est
appel rsidu)

Equation de la rgression :

Dpense totale = +0.796 * Dpense hbergement +1.638 * Dpense


alimentation +0.734 * Dpense restaurant +1.858 * Dpense loisirs +174.856

Les 4 variables expliquent 80.2% de la variance de Dpense


totale et le
coefficient de rgression multiple = 0,9
Significativit des paramtres :
'Dpense hbergement' : coefficient = 0,80, cart-type = 0,23
'Dpense alimentation' : coefficient = 1,64, cart-type = 0,28
'Dpense restaurant' : coefficient = 0,73, cart-type = 0,45
(Peu influent)
'Dpense loisirs' : coefficient = 1,86, cart-type = 0,29
Leffet de chaque variable explicative dpend du coefficient
de rgression figurant dans lquation. Plus celui-ci est lev,
plus la variable explicative considre influence la variable
explique.

Cependant , il faut galement prendre en compte lcart type de


chacun de ces
coefficients : plus il est lev, moins linfluence de la variable
considre est
marque. Certains termes de l'quation sont peu influents, leur
rapport
coefficient / cart-type est infrieur 2
La matrice des coefficients de corrlation peut se prsenter sous
la forme
dun tableau ou dun diagramme :

Conclusion
Lanalyse multivarie des donnes comme une
procdure statistique se prte pour analyser
simultanment plus de deux variables afin soit de
dcrire, soit de dresser des typologies soit de
synthtiser.

Merci

68

Das könnte Ihnen auch gefallen