Sie sind auf Seite 1von 20

Faculté des sciences juridiques,

économiques et sociales-Tanger

MASTER FFC ; AMO

L’analyse factorielle des


correspondances
Réalisé par:
Encadré par:
DR. EJBARI Ridouan
BELADEL Ouiame
CHEKOUR Mouhcine
EL KHALAMSANI Soufiane
PLAN

I- INTRODUCTION

II- PRINCIPE DE LA METHODE

III- PRÉSENTATION DE LA MÉTHODE :

IV- LE TEST DE KI-DEUX

V- CONCLUSION
Introduction
Les méthodes d'analyse factorielle des correspondances (AFC) tout
comme celles d'analyse en composantes principales (ACP) s'utilisent pour
décrire et hiérarchiser les relations statistiques qui peuvent exister entre des
individus placés en ligne et des variables placées en colonnes dans un tableau
rectangulaire de données.

L’une et l’autre de ces deux méthodes considèrent le tableau de données


comme un nuage de points dans un espace mathématique ayant autant de
dimensions qu’il y a de colonnes dans le tableau de données ; elles cherchent à
le projeter sur des axes ou des plans (appelés factoriels) de façon que l’on
puisse en visualiser et étudier au mieux la forme et donc rechercher
globalement des corrélations. La spécificité de l’AFC est qu’elle considère en
même temps un nuage de point représentant les lignes (individus) et un autre
représentant les colonnes (variables).
PRINCIPE DE LA MÉTHODE
Le principe de ces méthodes est de partir sans a priori sur les données et de les
décrire en analysant la hiérarchisation de l'information présente dans les données.
Pour ce faire, les analyses factorielles étudient l'inertie du nuage de points ayant
pour coordonnées les valeurs présentes sur les lignes du tableau de données.

La « morphologie du nuage » et la répartition des points sur chacun de ces axes


d'inertie permettent alors de rendre lisible et hiérarchisée l'information contenue
dans le tableau. Mathématiquement, après avoir centré et réduit le tableau de
données que l'on a affecté d'un système de masse (par exemple, les sommes
marginales de chaque ligne), on calcule la matrice d'inertie associée et on la
diagonalise (la répartition de l'information selon les différents axes est représentée
par l'histogramme des valeurs propres). On effectue alors un changement de base
selon ses vecteurs propres, c'est-à-dire selon les axes principaux d'inertie du nuage
de points. On projette alors les points figurant chaque ligne sur les nouveaux axes.
L'ensemble de l'information est conservée, mais celle-ci est maintenant
hiérarchisée, axe d'inertie par axe d'inertie. L'histogramme des valeurs propres
permet de voir le type de répartition de l'information entre les différents axes et
l'étendue en dimension de celle-ci.
PRÉSENTATION DE LA
MÉTHODE
Exemple : que deviennent les bacheliers ?

orientation BAC
Destination post bac
Total

Option de Universit classe Ecoles lettre


Total
bac é prépa supp
scientifique

gestion 13 2 5 20
économie
économie 20 2 8 30
gestion
scientifique 10 5 40 55
Option de bac
lettre 22 1 7 30
0 20 40 60 80 100 120 140 160

Total 65 10 60 135 Destination post bac


Comment donner du sens à ces Données ?

Idée : ce qui est intéressant, c’est de mettre en évidence ce qui est inattendu
dans ces répartitions ; Inattendu = en quoi on dévie d’une répartition
uniforme ;

L’AFC permet de :
1- Évaluer ce que serait une situation d’uniformité, d’indépendance
2- Calculer en quoi la situation constatée en diffère
3- Exprimer cette différence graphiquement pour pouvoir l’analyser
4- Interpréter le mapping obtenu …
5- et en optimiser la lisibilité ;
le tableau ci-dessus s’appel un tableau de contingence qui regroupe (i) option de bac
et (j) option post bac:

Ce tableau peut être transformé en tableaux de fréquences :

Un tel tableau est constitué dans la perspective de l'étude de la liaison entre deux
variables catégorielles (qualitatives) : Quels sont les option post bac « préférés » pour
quel option de bac ?
LE TEST DE KI-DEUX :
LE TEST DE KI-DEUX :

Ce test permet de contrôler l’existence d’une dépendance mais en aucun


cas le sens de cette dépendance, Ce test sert à apprécier l’existence ou non
d’une relation entre deux caractères au sein d’une population, lorsque ces
caractères sont qualitatifs où lorsqu’un caractère est quantitatif et l’autre
qualitatif, ou bien encore lorsque les deux caractères sont quantitatifs mais
que les valeurs ont été regroupées.

À noter que ce test permet de contrôler l’existence d’une dépendance mais


en aucun cas le sens de cette dépendance ;
Prenons l’exemple suivant :

Soit le tableau ci-dessous, qui donne les résultats d’une enquête hypothétique effectuée
auprès de 400 étudiants, sur leurs préférences en matière de cours. On leur a demandé :
« Parmi ces 4 matières : HPE, Droit, Micro et Macro, laquelle préférez-vous ? » (Il
était interdit de répondre : « aucune »).
Pour cela on doit calculer l’expression suivante, que nous appellerons, faute
d’une expression plus appropriée, le « khi-carré calculé » :

avec

Pour notre exemple le détails du calcul est le suivant :


Pour trouver cette valeur dans le tableau, nous devons prendre en compte
deux informations supplémentaires :
• Le nombre de « degrés de liberté » qui se calcule ainsi :

Degrés de liberté = {(Nb de catégories [ou modalités ou valeurs] de X) – 1} x


{(Nb de catégories [ou modalités ou valeurs] de Y) – 1} Ici, il y a 4 modalités
pour X (les 4 matières) et 2 modalités pour Y (les deux sexes). Donc, le
nombre de degrés de liberté est égal à : (4 - 1) x (2 – 1) = 3 x 1 = 3.

• Ensuite, nous devons choisir la probabilité de fiabilité du test : 5% de chances


de se tromper, 1% ou 1 pour 1000. Nous allons choisir 5%, soit P = 0,05.

Nous avons donc 3 degrés de liberté et une probabilité de fiabilité du test de


P=0,05. Par conséquent, nous voyons dans la table que le khi-carré théorique
est égal à : ( voir tableaux statistique en annexe)
Il nous reste maintenant à comparer le khi carré théorique issu de la table (7,82)
avec le khi-carré calculé (34,11 environ) :

La règle est la suivante :


• Si le khi-carré calculé est inférieur au khi-carré théorique : indépendance
• Si le khi-carré calculé est supérieur au khi-carré théorique : dépendance

Etant donné que le chi-carré calculé est supérieur au khi carré théorique, nous
pouvons conclure que le sexe a une influence sur le choix de la matière. Notre
observation initiale sur la base de l’échantillon est donc probablement vraie à
l’extérieur de l’échantillon (avec cependant 5% de chances de nous tromper).
Merci de votre attention

Das könnte Ihnen auch gefallen