Beruflich Dokumente
Kultur Dokumente
89
Introduction au chapitre VI
Une autre manière d’analyser la dispersion pourrait être aussi l’analyse de sa
conséquence. En effet, s’il y a dispersion, il y a forcément concentration des modalités. Si
celles-ci se dispersent de part et d’autre de leur valeur centrale, c’est pour se concentrer de
part et d’autre des deux cotés de la série. Dispersion et concentration sont donc deux notions
interdépendantes.
En économie, la notion de concentration est très importante : on parle de concentration
des chiffres d’affaires, des salaire, des populations,….
En Statistique, l’analyse de la concentration met en confrontation, ou la comparaison, les
effectifs (ni) ou les fréquences (fi) des individus de la population statistique étudiée et leurs
« masses » (nixi ou fixi) respectives. Ainsi, par exemple, la répartition des salaires est
analysée par la confrontation des effectifs des employés aux masses salariales dans
l’entreprise.
Ce sont ces deux méthodes que nous développerons dans le présent chapitre. En
premier lieu on développera la méthode algébrique qui consiste à comparer deux paramètres
de position centrale : l’un relatif aux effectifs ou fréquences, ni ou fi, appelé « Médiane »
(déjà développée au chapitre III), l’autre relatif aux « masses », nixi, appelé « Médiale ».
Cette comparaison permettra de donner une première idée sur l’importance de la
concentration des modalités. (Section 1).
En deuxième lieu, on développera la méthode graphique qui consiste à tracer une courbe, dite
« courbe de Gini » ou « courbe de concentration », ou encore, « courbe de Lorenz », à partir
de laquelle on déduit un paramètre ou indicateur appelé « indice de Gini ». Cet indice, qui a
d’abord pour objet de confirmer le constat de la méthode algébrique, nous renseigne
également sur l’intensité de la concentration des modalités. (Section 2).
90
Section 1 : L’analyse algébrique de la concentration
L’analyse algébrique de la concentration revient à calculer et à comparer des
paramètres, en suivant les quatre étapes suivantes :
Les notions de Médiane et d’étendue étant déjà définie dans les chapitres précédents, il
nous faut, cependant, définir la notion de « Médiale ».
Mis à part le fait que l’on se réfère à la colonne des (nixi) cumulés, notée (nixi) , on
calcul la Médiale en suivant les même étapes que la médiane :
Calculer THL = (Ʃnixi)/2, il représente le (nixi) cumulé que l’on déterminera dans la
colonne des (nixi) . En terme relatif THL est toujours égale à 0,5, soit 50%, ce qui
correspond à la fréquence cumulée des (nixi/Ʃnixi) ou Fi’ = 0,5 ou 50%.
ML = X0 + a 0,5 – F’ML-1
f’ML
Avec:
X0 = Borne inférieure de la classe médiale.
a = amplitude de la classe médiale.
91
(nixi)ML = masse de la classe correspondant à la classe médiale.
F’ML-1 = (nixi/Ʃnixi) = fréquence cumulée des masses de la classe avant la classe médiale.
Elle est toujours égale à 0,5, soit 50%.
f’ML = (nixi/Ʃnixi) = Fréquence relative de la masse de la classe correspondant à la classe
médiale.
(ΔM/e) est égale à 1, cela signifie que ΔM = e, dans ce cas la concentration est dite
nulle . C’est une situation de parfaite répartition des modalités ou d’« équi-
répartition ». Il y a une proportionnalité entre les fréquences d’individus et les
fréquences des masses. Autrement dit, à chaque proportion d’individus correspondrait
la même proportion de masse : fi = 10% fi’ = 10% ; fi = 30% fi’ = 30% ;...
En pratique une telle situation se rencontre exceptionnellement, voire jamais.
Remarque
La méthode algébrique nous donne un premier aperçu de la concentration des
modalités. Cet aperçu est confirmé par la suite et mesurée avec plus de précision grâce à la
méthode pratique.
Exemple 1
Le tableau suivant donne la répartition des salaires (en 103DA)dans une entreprise :
Salaire 103DA 0 - 4 4 - 8 8 - 12 12 - 16 16 - 22 22 - 30 30 - 42
Nombre d’employés 6 25 24 17 14 11 3
92
Réponse
Pour faire cette analyse, nous allons suivre les quatre étapes de la méthode
algébrique. Mais, auparavant, il faut d’abord compléter le tableau statistique avec toutes les
colonnes nécessaires dont nous avons besoins en fonction des formules que l’on va utiliser.
Le tableau complet sera comme suit :
xi ni Ni fi Fi nixi fi’= nixi/Ʃnixi Fi’ = (nixi/Ʃnixi)
Classe
1- Calcul de la médiane
2- Calcul de la Médiale
THL = Ʃnixi/2 = 1300/2 650 (nixi) = 650) ; Ou directement THL = 0,5 (F’ = 0,5 ).
ML ∈ [16 - 22[
Remarque
Ce résultat devra être confirmé par la méthode graphique. C’est l’objet de la section
suivante.
93
Section 2 : L’analyse graphique de la concentration
Cette méthode est complémentaire de la précédente. Elle est développée par les
auteurs italiens Gini et Lorenz.
Elle consiste à représenter graphiquement la concentration en traçant une courbe, dite courbe
de Lorenz ou courbe de Gini, ou encore, courbe de concentration. A partir de cette courbe est
déduit, par des opérations géométriques, un paramètre permettant de mesurer l’intensité de la
concentration, appelé « indice de Gini ».
Les fréquences variant de 0 à 1, on obtient un carré, appelé carré de Gini, de coté égale à 1 et
de surface également égale à 1.
En reliant les points de coordonnées (0 ;0) et (1 ;1), on obtient une diagonale qui divise le
carré en deux triangles de même surface, soit ½ ou 0,5 chacun.
Remarque
L’aire de concentration est la surface située entre la diagonale et la courbe de
concentration.
94
F’i
1
0,9
0,8
0,7
0,6 Aire de
0,5 concentration
F’i 0,4…………………………………………………
F’i-1 0,3……………………………………
0,2 A B
0,1 C
S = 1/2 – (la somme des surfaces des trapèzes situés sous la courbe).
En effet, la surface sous la courbe est formée par des trapèzes dont nous illustrons l’un d’eux
qui est formé par les cotés A, B et C (en couleur verte sur la courbe).
95
Illustration :
La surface d’un trapèze étant : Si = (A+B)C
2
A = F’i-1 C
B = F’i
C = Fi – Fi-1 = f’i
Il es résulte que :
Si = (F’i-1+F’i) fi
2
IG = 1 - Ʃ (F’i-1+F’i) fi)
Remarque
IG varie entre 0 et 1 : IG ∈ [0 - 1]
Ainsi ;
- Si IG tend vers 1, (IG > 0,5), la concentration est dite forte.
- Si IG tend vers 0, (IG < 0,5), la concentration est dite faible.
Exemple 2
Reprendre l’exemple précédent et analyser la concentration par la méthode dite
graphique.
96
Réponse
F’i
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Fi
97
2- Calcul de l’Indice de Gini
Pour cela il faut ajouter quelques colonnes au tableau précèdent, des colonnes pour
les besoins de la formule de IG. Autrement dit, il faut ajouter trois autres colonnes, à savoir ;
0 0,0092 0,00052
0,0092 0,1338 0,03345
0,1246 0,4338 0,104112
0,3092 0,8015 0,136255
0,4923 1,1892 0,166488
0,6969 1,6139 0,177529
0,9169 1,9174 0,05752
- - 0,6752
Remarque
La colonne F’i-1 se détermine en remplaçant chaque valeur dans la colonne F’i par sa
valeur précédente (i par i-1).
IG = 0,325
IG < 0,5 il en résulte que la concentration est faible. On confirme le résultat établi
par la courbe de concentration et la méthode algébrique.
98
Conclusion au chapitre VI
Ainsi, en plus de la caractérisation des distributions statistiques par des valeurs centrales
(moyenne, médiane, mode), on peut également caractériser leur dispersion, comme on peut
aussi caractériser leur concentration.
Au delà de ces trois types de paramètres, il serait temps de passer, dans la suite du
présent cours, à d’autres thèmes, plus large, de la statistique descriptive, notamment les
distributions statistiques à deux caractères, …, qui seront donc développés dans les chapitres
suivants.
Cependant, avant d’entamer ces dernières, il serait utile pour l’étudiant, de prendre
connaissance de l’autre usage fait de la notion de coefficient multiplicateur, développée dans
le chapitre III (Cf. Section 4, Chapitre III), à savoir ; les indices ou les nombres indices, c’est
l’objet du chapitre VII suivant.
99