Beruflich Dokumente
Kultur Dokumente
Zoubida CHORFI :
zd.chorfi@gmail.com
zoubidachorfi@research.emi.ac.ma
1ère partie (suite) :
Description des données
La seule classe modale est [165,170[, classe correspondant au plus grand effectif 7.
• On peut avoir deux modes ou plus et on peut ne pas avoir de mode (chaque
valeur se répète une seule fois ou toutes les classes ont le même effectif)
1-4. Médiane
• La médiane est la valeur de la variable qui partage la population, dont les unités
statistiques ont préalablement été classées par ordre croissant des valeurs (de la variable
considérée), en deux sous populations égales.
Méthode de calcul : (série discontinue)
• Toujours se ramener à une série : Si les données se présentent sous forme d'une
distribution, convertir la distribution en série.
• Classer la série : Une fois la série constituée, l'ordonner en classant les chiffres par ordre
croissant. On désignera par k le rang d’une valeur dans la série (voir tableau ci-après).
• Déterminer si la série comprend un nombre pair ou impair d’unités statistiques : Soit n
le nombre d’unités statistiques. Deux cas peuvent alors se présenter : celui ou n est pair et
celui ou n est impair.
𝑛+1
Si n est impair : le rang de la médiane est
2
𝑛 𝑛
Si n est pair: la médiane se situe entre les deux observations de rang et +1.
2 2
On prend généralement la valeur moyenne des deux observations comme valeur médiane.
Exemple:
Cas 1 : n pair
si l'on prend la série S1 = {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4, 5}.
On a donc le tableau suivant (où les valeurs sont classées par ordre croissant):
a(k) +a (k+1)
Me = =3
2
Cas 2: n impair
si l'on prend la série précédente mais que l’on enlève le 20ème élément
On a donc le tableau suivant (où les valeurs sont classées par ordre croissant):
Me = a (k+1)= 3
1-5. Classe médiane et médiane d’une série continue
• On définit la classe médiane comme la première classe dont la fréquence cumulée égale
ou dépasse 0.5 (ou 50%).
Exemple :
fréq. fréq.
(a) (b)
0 1 7 0 1 7
NB: L’étendue est une mesure de la dispersion peu satisfaisante (dépend des valeurs extrêmes, souvent peu
fiables)
2-2. Quantiles :
• Les quantiles sont des caractéristiques de position partageant la série statistique ordonnée en k
parties égales.
Pour k = 4, les quantiles, appelés quartiles, sont trois nombres Q1, Q2, Q3 tels que :
Au moins 25 % des valeurs prises par la série sont inférieures ou égales à Q1,
Au moins 75% des valeurs prises par la série sont inférieurs ou égales à Q3,
Q2 est la médiane Me,
Q3− Q1 est l’intervalle interquartile, il contient 50 % des valeurs de la série.
Pour k = 10, les quantiles sont appelés déciles, il y a neuf déciles D1, D2...10 % des valeurs de la
série sont inférieures à D1...
Pour k = 100, les quantiles sont appelés centiles, il y a 99 centiles, chacun correspondant à 1 % de
la population.
Exemples : soit la série classée par ordre croissant suivante S={1,2,3,7,8,9}
- N=6 et N/4=1,5 donc le 1er quartile est la 2ème valeur (Au moins 25% des valeurs sont inférieurs ou
égales à 2) Q1 =2
- N=6 et 3N/4=4,5 ; les trois premiers groupes réunis doivent contenir 5 valeurs ( au moins 75% des
valeurs sont inférieurs ou égales à 8) Q3 =8
- N=6 (pair), la médiane est la moyenne de la 3ème et la 4ème valeur soit Médiane=5
2-3. La variance et l’écart type:
Soit (x1 , …... xn ) un échantillon, et sa moyenne empirique, On appelle Variance
corrigée ou variance observée de l’échantillon, la quantité notée S2 définie par:
𝑛
1
S2 = (𝑥𝑖 −𝑥 ) 2
𝑛−1
𝑖=1
C’est un estimateur sans biais de la variance. On appelle écart-type de l’échantillon la
racine carrée de la variance. L'avantage de l'écart-type sur la variance est qu'il s'exprime,
comme la moyenne, dans la même unité que les données.
Cas 2 : n données réparties en k classes, la classe i étant d’effectif absolu ni . Dans ces
conditions, on obtient : 𝑘
1
S2 = 𝑛𝑖 (𝑥𝑖 − 𝑥 ) 2
𝑛−1
𝑖=1