Sie sind auf Seite 1von 192

La statistique descriptive

Cours ralis par Laurent DOYEN


DOYEN
1. Introduction et dfinitions
Statistique descriptive:
Analyse et synthse, NUMERIQUE et GRAPHIQUE,
dun ensemble de donnes
DOYEN
1. Introduction et dfinitions
Statistique descriptive:
Analyse et synthse, NUMERIQUE et GRAPHIQUE,
dun ensemble de donnes
But: Synthtiser linformation contenue dans les donnes
Origine: tude dmographique
DOYEN
Individus: latin: ce qui est indivisible
stat: chacune des personnes tudies
DOYEN
Individus: latin: ce qui est indivisible
stat: chacune des personnes tudies
Personne humaine, automobile, entreprise, pays, .
DOYEN
Individus: latin: ce qui est indivisible
stat: chacune des personnes tudies
Personne humaine, automobile, entreprise, pays, .
Population: ensemble des individus observs
DOYEN
Individus: latin: ce qui est indivisible
stat: chacune des personnes tudies
Personne humaine, automobile, entreprise, pays, .
Population: ensemble des individus observs
Les tudiants de 12-25ans, les Renault produites entre 1990 et 1995
DOYEN
Individus: latin: ce qui est indivisible
stat: chacune des personnes tudies
Personne humaine, automobile, entreprise, pays, .
Population: ensemble des individus observs
Les tudiants de 12-25ans, les Renault produites entre 1990 et 1995
Caractre (Variable Statistique): ce quon observe sur
chacun des individus de la population
DOYEN
Individus: latin: ce qui est indivisible
stat: chacune des personnes tudies
Personne humaine, automobile, entreprise, pays, .
Population: ensemble des individus observs
Les tudiants de 12-25ans, les Renault produites entre 1990 et 1995
Sexe, age, taille, nombre enfants,
Caractre (Variable Statistique): ce quon observe sur
chacun des individus de la population
DOYEN
Attention:
La population doit tre dfinie avec prcision,
cest totalement diffrent de considrer:
Les tudiants
Les tudiants de 12-25 ans
Les tudiants de lIUP com. et vente de Grenoble
DOYEN
Attention:
La population doit tre dfinie avec prcision,
cest totalement diffrent de considrer:
Les tudiants
Les tudiants de 12-25 ans
Les tudiants de lIUP com. et vente de Grenoble
La population doit tre homogne au regard des
caractres tudis:
la rpartition des individus selon leur taille doit
distinguer les deux sexes
DOYEN
2 types de caractres:
Qualitatifs: non mesurables
DOYEN
2 types de caractres:
Qualitatifs: non mesurables
Sexe, couleur des
yeux, secteur
dactivit
DOYEN
2 types de caractres:
Qualitatifs: non mesurables
Quantitatifs: mesurables
Sexe, couleur des
yeux, secteur
dactivit
DOYEN
2 types de caractres:
Qualitatifs: non mesurables
Age, taille , PIB, taux
de chmage
Quantitatifs: mesurables
Sexe, couleur des
yeux, secteur
dactivit
DOYEN
Quantitatifs discrets:
peuvent prendre un
nombre fini et faible
de valeurs
2 types de caractres:
Qualitatifs: non mesurables
Age, taille , PIB, taux
de chmage
Quantitatifs: mesurables
Sexe, couleur des
yeux, secteur
dactivit
DOYEN
Quantitatifs discrets:
peuvent prendre un
nombre fini et faible
de valeurs
2 types de caractres:
Qualitatifs: non mesurables
Age, taille , PIB, taux
de chmage
Quantitatifs: mesurables
Sexe, couleur des
yeux, secteur
dactivit
Nb enfants
0 1 2 3 4 5
DOYEN
Quantitatifs discrets:
peuvent prendre un
nombre fini et faible
de valeurs
2 types de caractres:
Qualitatifs: non mesurables
Age, taille , PIB, taux
de chmage
Quantitatifs: mesurables
Sexe, couleur des
yeux, secteur
dactivit
Quantitatifs continues:
Par nature:
Nb enfants
0 1 2 3 4 5
DOYEN
Quantitatifs discrets:
peuvent prendre un
nombre fini et faible
de valeurs
2 types de caractres:
Qualitatifs: non mesurables
Age, taille , PIB, taux
de chmage
Quantitatifs: mesurables
Sexe, couleur des
yeux, secteur
dactivit
Quantitatifs continues:
Par nature:
Nb enfants
0 1 2 3 4 5
Taille:
1m 2m
DOYEN
Quantitatifs discrets:
peuvent prendre un
nombre fini et faible
de valeurs
2 types de caractres:
Qualitatifs: non mesurables
Age, taille , PIB, taux
de chmage
Quantitatifs: mesurables
Sexe, couleur des
yeux, secteur
dactivit
Quantitatifs continues:
Par nature:
Nb enfants
0 1 2 3 4 5
Taille:
1m 2m
Par ncessit:
DOYEN
Quantitatifs discrets:
peuvent prendre un
nombre fini et faible
de valeurs
2 types de caractres:
Qualitatifs: non mesurables
Age, taille , PIB, taux
de chmage
Quantitatifs: mesurables
Sexe, couleur des
yeux, secteur
dactivit
Quantitatifs continues:
Par nature:
Nb enfants
0 1 2 3 4 5
Taille:
1m 2m
Par ncessit:
Nombre de salaris dune PME
0 500
DOYEN
2. tude dun caractre qualitatif
2.1 Modalits dun caractre: les diffrents tats dun
caractre qualitatif.
EXHAUSTIFS et INCOMPATIBLES
DOYEN
2. tude dun caractre qualitatif
2.1 Modalits dun caractre: les diffrents tats dun
caractre qualitatif.
EXHAUSTIFS et INCOMPATIBLES
Cad chaque individu prsente une et une seule modalit du caractre
DOYEN
2. tude dun caractre qualitatif
2.1 Modalits dun caractre: les diffrents tats dun
caractre qualitatif.
EXHAUSTIFS et INCOMPATIBLES
Cad chaque individu prsente une et une seule modalit du caractre
Cadre suprieure, Profession int., Employ, Ouvrier, Ouvrier qualifi
DOYEN
2. tude dun caractre qualitatif
2.1 Modalits dun caractre: les diffrents tats dun
caractre qualitatif.
EXHAUSTIFS et INCOMPATIBLES
Cad chaque individu prsente une et une seule modalit du caractre
Cadre suprieure, Profession int., Employ, Ouvrier, Ouvrier qualifi
Inactifs
DOYEN
2. tude dun caractre qualitatif
2.1 Modalits dun caractre: les diffrents tats dun
caractre qualitatif.
EXHAUSTIFS et INCOMPATIBLES
Cad chaque individu prsente une et une seule modalit du caractre
Cadre suprieure, Profession int., Employ, Ouvrier, Ouvrier qualifi
Inactifs
DOYEN
2.2 Pourcentage et frquence:
p
i
f
i
N= Effectif total de la
population
Effectif de la modalit
considre
=
n
i
100
N
n
p
i
i
=
N
n
f
i
i
=
DOYEN
2.2 Pourcentage et frquence:
p
i
f
i
N= Effectif total de la
population
Effectif de la modalit
considre
=
n
i
100
N
n
p
i
i
=
N
n
f
i
i
=
Proprit:
100 =
!
i
i
p
1 =
!
i
i
f
DOYEN
2.2 Pourcentage et frquence:
p
i
f
i
N= Effectif total de la
population
Effectif de la modalit
considre
=
n
i
100
N
n
p
i
i
=
N
n
f
i
i
=
Proprit:
100 =
!
i
i
p
1 =
!
i
i
f
Exemple: En 1989 parmi les franais de plus de 15 ans
Sur 21033906 hommes il y a 4286858 retraits
des hommes sont retraits
% 20 100
21033906
4286858

DOYEN
2.3 Tableau de distribution:
100 43997993 Ensemble
26.7 11741884 Inactifs divers (autres que
retraits)
19.2 8429509 Retraits
16.2 7121812 Ouvriers
15.4 6771239 Employs
10.4 4593294 Professions intermdiaires
5.3 2314770 Cadres et professions
intellectuelles suprieures
4.0 1757221 Artisans, commerants et
chefs dentreprises
2.9 1268264 Agriculteurs exploitants
Pourcentages Nb de personnes CSP
Franais de plus de 15 ans en 1986
DOYEN
2.4 Reprsentations graphiques:
Rgle: sur les graphiques, les aires des modalits
sont proportionnelles leurs effectifs
DOYEN
2.4 Reprsentations graphiques:
Rgle: sur les graphiques, les aires des modalits
sont proportionnelles leurs effectifs
0
10
20
30
Pourcentages
Agri. Exploi.
Artisans,
Cadres
Prof. Int.
Employs
Ouvriers
Retraits
Inactifs
a. Diagramme en barre:
La hauteur des barres est
proportionnelle leffectif de la
modalit
DOYEN
b. Diagramme en secteurs:
Langle du secteur de disque est
proportionnel leffectif de la
modalit
Agri. Exploi.
Artisans,
Cadres
Prof. Int.
Employs
Ouvriers
Retraits
Inactifs
DOYEN
3. tude dune variable
quantitative discrte
Mnage Franais par rapport leur effectif en 1989
100 22434621 Total
1.8 109189 6 ou plus
5.3 1182235 5 personnes
13.6 3057674 4 personnes
16.1 3619655 3 personnes
31.6 7086664 2 personnes
31.6 7079434 1 personne
Pourcentage Effectif Nbe personnes
DOYEN
3. tude dune variable
quantitative discrte
Mnage Franais par rapport leur effectif en 1989
100 22434621 Total
1.8 109189 6 ou plus
5.3 1182235 5 personnes
13.6 3057674 4 personnes
16.1 3619655 3 personnes
31.6 7086664 2 personnes
31.6 7079434 1 personne
Pourcentage Effectif Nbe personnes
On considre
6 et +
comme valant
6
DOYEN
3.1 Frquence cumule: proportion dindividus dont la
valeur du caractre est infrieure ou gale la valeur
considre
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nbe pers.
32
F. Cumule
en %
DOYEN
3.1 Frquence cumule: proportion dindividus dont la
valeur du caractre est infrieure ou gale la valeur
considre
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nbe pers.
32
F. Cumule
en %
22434621
7086664 7079434 +
63
64 32 32 = +
DOYEN
3.1 Frquence cumule: proportion dindividus dont la
valeur du caractre est infrieure ou gale la valeur
considre
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nbe pers.
32
F. Cumule
en %
22434621
7086664 7079434 +
63
64 32 32 = +
En 1989, 63% des
mnages sont composs
de 2 personnes ou moins
100
98
93
79
DOYEN
3.2 Reprsentations graphiques:
a. Histogramme des frquences:
Diagramme en bton: en abscisse les valeurs du caractre
en ordonne les frquences
0
10
20
30
1 2 3 4 5 6 et +
Nbe de pers.
par mnage
Frquence en %
DOYEN
3.2 Reprsentations graphiques:
a. Histogramme des frquences:
Diagramme en bton: en abscisse les valeurs du caractre
en ordonne les frquences
0
10
20
30
1 2 3 4 5 6 et +
Nbe de pers.
par mnage
Frquence en %
32% des mnages
sont composs de
2 personnes
DOYEN
b. Diagramme cumulatif:
Reprsente les frquences cumules en fonction des valeurs du
caractre
0
25
50
75
100
0 1 2 3 4 5 6 7
Nbe pers.
par mnage
Frquence en %
DOYEN
b. Diagramme cumulatif:
Reprsente les frquences cumules en fonction des valeurs du
caractre
79% des mnages franais
sont constitu de
strictement moins
de 4 personnes
0
25
50
75
100
0 1 2 3 4 5 6 7
Nbe pers.
par mnage
Frquence en %
DOYEN
3.3 Rsum numrique dune distribution:
a. Caractristiques centrales:
La moyenne note
x
Moyenne arithmtique des valeurs du caractre pour les n
individus de la population
! !
= =
i
i
i
i
i i
x
f
x n
n
x
1
DOYEN
3.3 Rsum numrique dune distribution:
a. Caractristiques centrales:
La moyenne note
x
Moyenne arithmtique des valeurs du caractre pour les n
individus de la population
! !
= =
i
i
i
i
i i
x
f
x n
n
x
1
Reprsente le barycentre
des valeurs prises par le
caractre
DOYEN
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nbe pers.
! !
= =
i
i
i
i
i i
x
f
x n
n
x
1
0.32*1
+0.32*2
+0.16*3
+0.14*4
+0.05*5
+0.02*6
) (personnes 4 . 2
= x
DOYEN
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nbe pers.
! !
= =
i
i
i
i
i i
x
f
x n
n
x
1
0.32*1
+0.32*2
+0.16*3
+0.14*4
+0.05*5
+0.02*6
) (personnes 4 . 2
= x
Ne pas oublier
lunit
En 1989 en France, il y a en
moyenne 2.4 personnes par mnage
DOYEN
Le(s) mode(s)
Valeurs du caractre en lesquelles lhistogramme des
frquences possde un maximum relatif
DOYEN
Le(s) mode(s)
Valeurs du caractre en lesquelles lhistogramme des
frquences possde un maximum relatif
0
10
20
30
1 2 3 4 5 6 et +
Nbe de pers.
par mnage
Frquence en %
Le mode vaut: 2 personnes
DOYEN
Valeurs du caractre en lesquels lhistogramme des
frquences possde un maximum RELATIF
Le mode
DOYEN
Valeurs du caractre en lesquels lhistogramme des
frquences possde un maximum RELATIF
Le mode
Cette distribution a
2 modes!
Elle est BIMODALE
Cest souvent caractristique dune population
NON HOMOGENE
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
On la dtermine laide des frquences cumules ou
du diagramme cumulatif
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
On la dtermine laide des frquences cumules ou
du diagramme cumulatif
La mdiane
est entre 1 et 2
personnes par
mnage
0
25
50
75
100
0 1 2 3 4 5 6 7
Nbe pers.
par mnage
Frquence en %
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
On la dtermine laide des frquences cumules ou
du diagramme cumulatif
32% 1 pers. ou moins
62% 2 pers. ou moins
La mdiane
est entre 1 et 2
personnes par
mnage
0
25
50
75
100
0 1 2 3 4 5 6 7
Nbe pers.
par mnage
Frquence en %
DOYEN
Quelle est la diffrence entre moyenne et mdiane?
Note de prparation la maison semaine3:
6
14 16
mdiane
12 = x
DOYEN
Quelle est la diffrence entre moyenne et mdiane?
Note de prparation la maison semaine3:
6
14 16
mdiane
12 = x
3 9 = x
La mdiane est peu sensible aux valeurs
aberrantes contrairement la moyenne
DOYEN
b. Caractristiques de dispersion:
Exemple:
Notes des devoirs la maison en 2001 lIUP com et
vente
Semaine 1: 9, 10, 10, 11
Semaine 2: 0, 10, 10, 20
DOYEN
b. Caractristiques de dispersion:
Exemple:
Notes des devoirs la maison en 2001 lIUP com et
vente
Semaine 1: 9, 10, 10, 11
Semaine 2: 0, 10, 10, 20
Toutes les caractristiques
centrales valent 10!
DOYEN
b. Caractristiques de dispersion:
Exemple:
Notes des devoirs la maison en 2001 lIUP com et
vente
Semaine 1: 9, 10, 10, 11
Semaine 2: 0, 10, 10, 20
Toutes les caractristiques
centrales valent 10!
Trouver des valeurs numriques qui caractrisent la
dispersion de la distribution
Comment les valeurs sont elles loignes de la
moyenne?
DOYEN
Une mauvaise ide:
!

i
i i
x
n
x n
) (
1
Semaine 1: 9, 10, 10, 11
( ) 0 ) 10 11 ( * 1 ) 10 10 ( * 2 ) 10 9 ( * 1
4
1
= + +
DOYEN
Une mauvaise ide:
!

i
i i
x
n
x n
) (
1
Semaine 1: 9, 10, 10, 11
( ) 0 ) 10 11 ( * 1 ) 10 10 ( * 2 ) 10 9 ( * 1
4
1
= + +
+
=
0
Les carts positifs et ngatifs se compensent!
DOYEN
Lcart absolu moyen:
La moyenne des ECARTS ABSOLUS la moyenne
x x
n
x
f
x n
e
i
i
i
i
i
i
x
= =
! !

1
DOYEN
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nb pers.
0.32 * |1-2.4|
+ 0.32 * |2-2.4|
+ 0.16 * |3-2.4|
+ 0.14 * |4-2.4|
+ 0.05 * |5-2.4|
+ 0.02 * |6-2.4|
) (personnes 4 . 1
e
x
Lcart absolu moyen:
) (personnes 4 . 2 = x
DOYEN
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nb pers.
0.32 * |1-2.4|
+ 0.32 * |2-2.4|
+ 0.16 * |3-2.4|
+ 0.14 * |4-2.4|
+ 0.05 * |5-2.4|
+ 0.02 * |6-2.4|
) (personnes 4 . 1
e
x
Lcart absolu moyen:
) (personnes 4 . 2 = x
Attention lunit
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne
( ) ( ) x
x
f
x
x
n
i i
n
i
i
i
i

!

!
= =
2 2
2

1

DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne
( ) ( ) x
x
f
x
x
n
i i
n
i
i
i
i

!

!
= =
2 2
2

1

Si x a pour unit la personne, alors


a pour unit

2
personne
2
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne
( ) ( ) x
x
f
x
x
n
i i
n
i
i
i
i

!

!
= =
2 2
2

1

Si x a pour unit la personne, alors


a pour unit

2
personne
2
Lcart-type est la racine carr de la variance

2
=
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne
( ) ( ) x
x
f
x
x
n
i i
n
i
i
i
i

!

!
= =
2 2
2

1

Si x a pour unit la personne, alors


a pour unit

2
personne
2
Lcart-type est la racine carr de la variance

2
=
Mme unit que le
caractre
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne
( ) ( ) x
x
f
x
x
n
i i
n
i
i
i
i

!

!
= =
2 2
2

1

Si x a pour unit la personne, alors


a pour unit

2
personne
2
Lcart-type est la racine carr de la variance

2
=
Mme unit que le
caractre
Entre et il y a au moins 75% de la population
2 x 2 + x
DOYEN
Pour calculer la variance on peut utiliser la formule:
x
x
f
i
i
i
2
2 2

"
#
$
%
&
'
=
!

) (personnes 4 . 2 = x
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nbe pers.
0.32 * 1
2
+ 0.32 * 2
2
+ 0.16 * 3
2
+ 0.14 * 4
2
+ 0.05 * 5
2
+ 0.02 * 6
2
) ( 1.5 25 . 7
personnes
4 2
2
2 2

.
-

DOYEN
Pour calculer la variance on peut utiliser la formule:
x
x
f
i
i
i
2
2 2

"
#
$
%
&
'
=
!

) (personnes 4 . 2 = x
100 22434621 Total
2 109189 6 ou plus
5 1182235 5 pers.
14 3057674 4 pers.
16 3619655 3 pers.
32 7086664 2 pers.
32 7079434 1 pers.
Pi Effectif Nbe pers.
0.32 * 1
2
+ 0.32 * 2
2
+ 0.16 * 3
2
+ 0.14 * 4
2
+ 0.05 * 5
2
+ 0.02 * 6
2
) ( 1.5 25 . 7
personnes
4 2
2
2 2

.
-

Attention
lunit
DOYEN
En 1999, au moins 75% des mnages franais ont
un effectif entre 0 et 4.8 personnes.
(personne) 2 . 1 5 . 1
DOYEN
4. tude dune variable
quantitative continue
Mme notion que dans le chapitre prcdent.
La seule diffrence est que on ne considre pas les
modalit une par une mais par CLASSES
DOYEN
4. tude dune variable
quantitative continue
Mme notion que dans le chapitre prcdent.
La seule diffrence est que on ne considre pas les
modalit une par une mais par CLASSES
Intervalle de valeurs possibles pour la
variable statistique continue
DOYEN
Population franaise active par ge en 1999
100 100 26542481 Total
100 8.4 2225411 55 et +
91.6 12.5 3305278 50-54
79.2 13.9 3696642 45-49
65.2 14.2 3770300 40-44
51.0 14.6 3865252 35-39
36.5 14.2 3771554 30-34
22.3 13.7 3628502 25-29
8.6 8.6 2279542 15-24
Cumul Pourcentage Effectif Age
DOYEN
Population franaise active par ge en 1999
100 100 26542481 Total
100 8.4 2225411 55 et +
91.6 12.5 3305278 50-54
79.2 13.9 3696642 45-49
65.2 14.2 3770300 40-44
51.0 14.6 3865252 35-39
36.5 14.2 3771554 30-34
22.3 13.7 3628502 25-29
8.6 8.6 2279542 15-24
Cumul Pourcentage Effectif Age
Il y a
3771554
personnes
dans la
classe
dge des
30-34 ans
DOYEN
Comment dterminer les classes?
DOYEN
Comment dterminer les classes?
Nombre de classes relativement faible: 10
DOYEN
Comment dterminer les classes?
Nombre de classes relativement faible: 10
Effectif des classes du mme ordre de grandeur
Classe fine l o le caractre est plus frquent
Classe large l o le caractre est rare
DOYEN
Comment dterminer les classes?
Nombre de classes relativement faible: 10
Effectif des classes du mme ordre de grandeur
Classe fine l o le caractre est plus frquent
Classe large l o le caractre est rare
Essayer dutiliser des classes de mme amplitude
DOYEN
Comment dterminer les classes?
Nombre de classes relativement faible: 10
Effectif des classes du mme ordre de grandeur
Classe fine l o le caractre est plus frquent
Classe large l o le caractre est rare
Essayer dutiliser des classes de mme amplitude
Souvent la premire et la dernire classe nont pas la
mme amplitude
DOYEN
4.1 Frquence relative
Quand les amplitudes des classes sont diffrentes on
ne considre plus les frquences, mais les
FREQUENCES RELATIVES:
a
f
i
i
est lamplitude de la classe
a
i
DOYEN
100 1 26542481 Total
100 0.084 2225411 55 et +
91.6 0.125 3305278 50-54
79.2 0.139 3696642 45-49
65.2 0.142 3770300 40-44
51.0 0.146 3865252 35-39
36.5 0.142 3771554 30-34
22.3 0.137 3628502 25-29
8.6 0.086 2279542 15-24
Cumul .fi Effectif Age
1
1
1
1
1
1
2
.ai
2
0.042
0.125
0.139
0.142
0.146
0.142
0.137
0.043
.f relative 5 ans
DOYEN
100 1 26542481 Total
100 0.084 2225411 55 et +
91.6 0.125 3305278 50-54
79.2 0.139 3696642 45-49
65.2 0.142 3770300 40-44
51.0 0.146 3865252 35-39
36.5 0.142 3771554 30-34
22.3 0.137 3628502 25-29
8.6 0.086 2279542 15-24
Cumul .fi Effectif Age
1
1
1
1
1
1
2
.ai
Pour avoir la largeur de classe il faut
fixer la borne suprieur de la classe.
Il faut prendre une dcision raisonnable.
Ici on parle de population active: 55-64
2
0.042
0.125
0.139
0.142
0.146
0.142
0.137
0.043
.f relative 5 ans
DOYEN
4.2 Reprsentations graphiques:
a. Histogramme des frquences:
Les classes de la distribution forment les bases des batons
Les SURFACES sont proportionnelles aux frquences!
DOYEN
4.2 Reprsentations graphiques:
a. Histogramme des frquences:
Les classes de la distribution forment les bases des batons
Les SURFACES sont proportionnelles aux frquences!
Donc si les classes sont damplitudes diffrentes, les
HAUTEURS des histogrammes sont proportionnelles
aux FREQUENCES RELATIVES.
DOYEN
0
2
4
6
8
10
12
14
16
0 10 20 30 40 50 60
Age en
annes
.f relatives
5 ans
DOYEN
0
2
4
6
8
10
12
14
16
0 10 20 30 40 50 60
Age en
annes
.f relatives
5 ans
Pour la borne suprieure on
conserve toujours la mme
DOYEN
b. Polygone des frquences cumules:
En abscisse les limites de classes
En ordonne les frquence cumules
On rejoint les points
par une ligne brise
0
20
40
60
80
100
0 10 20 30 40 50 60
Age en annes
.f cumules
DOYEN
4.3 Rsum numrique dune distribution:
a. Caractristiques centrales:
La moyenne note
x
Moyenne arithmtique des valeurs du caractre pour les n
individus de la population
! !
= =
i
i
i
i
i i
c
f
c n
n
x
1
DOYEN
4.3 Rsum numrique dune distribution:
a. Caractristiques centrales:
La moyenne note
x
Moyenne arithmtique des valeurs du caractre pour les n
individus de la population
! !
= =
i
i
i
i
i i
c
f
c n
n
x
1
On ne considre plus les valeurs des modalits, mais les
CENTRES DES CLASSES
DOYEN
4.3 Rsum numrique dune distribution:
a. Caractristiques centrales:
La moyenne note
x
Moyenne arithmtique des valeurs du caractre pour les n
individus de la population
! !
= =
i
i
i
i
i i
c
f
c n
n
x
1
Reprsente le barycentre
des valeurs prises par le
caractre
On ne considre plus les valeurs des modalits, mais les
CENTRES DES CLASSES
DOYEN
100 1 26542481 Total
100 0.084 2225411 55 et +
91.6 0.125 3305278 50-54
79.2 0.139 3696642 45-49
65.2 0.142 3770300 40-44
51.0 0.146 3865252 35-39
36.5 0.142 3771554 30-34
22.3 0.137 3628502 25-29
8.6 0.086 2279542 15-24
Cumul .fi Effectif Age
!
=
i
i
i
c
f
x
DOYEN
100 1 26542481 Total
100 0.084 2225411 55 et +
91.6 0.125 3305278 50-54
79.2 0.139 3696642 45-49
65.2 0.142 3770300 40-44
51.0 0.146 3865252 35-39
36.5 0.142 3771554 30-34
22.3 0.137 3628502 25-29
8.6 0.086 2279542 15-24
Cumul .fi Effectif Age
60
53
47
43
37
33
27
20
.ci
!
=
i
i
i
c
f
x
20
2
24 15

+
DOYEN
100 1 26542481 Total
100 0.084 2225411 55 et +
91.6 0.125 3305278 50-54
79.2 0.139 3696642 45-49
65.2 0.142 3770300 40-44
51.0 0.146 3865252 35-39
36.5 0.142 3771554 30-34
22.3 0.137 3628502 25-29
8.6 0.086 2279542 15-24
Cumul .fi Effectif Age
60
53
47
43
37
33
27
20
.ci
0.086*20
+ 0.137*27
+ 0.142*33
+ 0.146*37
+ 0.142*43
+ 0.139*47
+ 0.125*53
+ 0.042*60
!
=
i
i
i
c
f
x
(ans) 40 x
20
2
24 15

+
DOYEN
100 1 26542481 Total
100 0.084 2225411 55 et +
91.6 0.125 3305278 50-54
79.2 0.139 3696642 45-49
65.2 0.142 3770300 40-44
51.0 0.146 3865252 35-39
36.5 0.142 3771554 30-34
22.3 0.137 3628502 25-29
8.6 0.086 2279542 15-24
Cumul .fi Effectif Age
60
53
47
43
37
33
27
20
.ci
0.086*20
+ 0.137*27
+ 0.142*33
+ 0.146*37
+ 0.142*43
+ 0.139*47
+ 0.125*53
+ 0.042*60
!
=
i
i
i
c
f
x
(ans) 40 x
20
2
24 15

+
Ne pas
oublier
lunit
En 1999 en France, les actifs
ont une moyenne dge de 40 ans
DOYEN
Classe(s) modale(s)
CLASSES en lesquelles lhistogramme des
frquences prsente un maximum RELATIF
Classes en laquelle la frquence RELATIVE
prsente un maximum RELATIF
DOYEN
Classe(s) modale(s)
CLASSES en lesquelles lhistogramme des
frquences prsente un maximum RELATIF
Classes en laquelle la frquence RELATIVE
prsente un maximum RELATIF
0
2
4
6
8
10
12
14
16
0 10 20 30 40 50 60
Age en annes
.f relatives 5 ans
La classe modale est
celle des 35-39 ans
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
Cest la valeur correspondant un effectif cumul de
50% sur le polygone des frquences cumules
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
Cest la valeur correspondant un effectif cumul de
50% sur le polygone des frquences cumules
0
20
40
60
80
100
0 10 20 30 40 50 60
Age en annes
.f cumules
Graphiquement, on lit
que la mdiane vaut
un peu moins de 40
ans
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
Cest la valeur correspondant un effectif cumul de
50% sur le polygone des frquences cumules
0
20
40
60
80
100
0 10 20 30 40 50 60
Age en annes
.f cumules
Graphiquement, on lit
que la mdiane vaut
un peu moins de 40
ans
Peut on avoir
une expression
exacte de la
mdiane?
DOYEN
Pour avoir la valeur de la mdiane on ralise une
interpolation linaire .
0
20
40
60
80
100
0 10 20 30 40 50 60
Age en annes
.f cumules
DOYEN
Pour avoir la valeur de la mdiane on ralise une
interpolation linaire .
35
38
41
44
47
50
32 34 36 38 40 42
Age en annes
.f cumules
35
36.5
40
M
50
51
Les accroissements
sur les abscisses et
les ordonnes sont
proportionnels
5 . 36 51
35 40
5 . 36 50
35

M
DOYEN
Pour avoir la valeur de la mdiane on ralise une
interpolation linaire .
35
38
41
44
47
50
32 34 36 38 40 42
Age en annes
.f cumules
35
36.5
40
M
50
51
Les accroissements
sur les abscisses et
les ordonnes sont
proportionnels
5 . 36 51
35 40
5 . 36 50
35

M
(ans) 7 . 39
5 . 36 51
35 40
) 5 . 36 50 ( 35

+ =
DOYEN
Pour avoir la valeur de la mdiane on ralise une
interpolation linaire .
35
38
41
44
47
50
32 34 36 38 40 42
Age en annes
.f cumules
35
36.5
40
M
50
51
Les accroissements
sur les abscisses et
les ordonnes sont
proportionnels
5 . 36 51
35 40
5 . 36 50
35

M
(ans) 7 . 39
5 . 36 51
35 40
) 5 . 36 50 ( 35

+ =
50% des actifs ont plus
de 39.7 ans et 50 %
ont moins
DOYEN
b. Caractristiques de dispersion:
cart absolue, variance, cart-type
Idem caractre discret mais on prend le centre des
classes comme valeur reprsentative
DOYEN
b. Caractristiques de dispersion:
cart absolue, variance, cart-type
Idem caractre discret mais on prend le centre des
classes comme valeur reprsentative
1 26542481 Total
0.084 2225411 55 et +
0.125 3305278 50-54
0.139 3696642 45-49
0.142 3770300 40-44
0.146 3865252 35-39
0.142 3771554 30-34
0.137 3628502 25-29
0.086 2279542 15-24
.fi Effectif Age
(ans) 40 x
60
53
47
43
37
33
27
20
.ci
DOYEN
b. Caractristiques de dispersion:
cart absolue, variance, cart-type
Idem caractre discret mais on prend le centre des
classes comme valeur reprsentative
1 26542481 Total
0.084 2225411 55 et +
0.125 3305278 50-54
0.139 3696642 45-49
0.142 3770300 40-44
0.146 3865252 35-39
0.142 3771554 30-34
0.137 3628502 25-29
0.086 2279542 15-24
.fi Effectif Age
60
53
47
43
37
33
27
20
.ci
(ans) 40 x
0.086 * |20-40|
+0.137 * |27-40|
+0.142 * |33-40|
+0.146 * |37-40|
+0.142 * |43-40|
+0.139 * |47-40|
+0.125 * |53-40|
+0.084 * |60-40|
(ans) 64 . 9 x e
0.086 * 20
2
+0.137 * 27
2
+0.142 * 33
2
+0.146 * 37
2
+0.142 * 43
2
+0.139 * 47
2
+0.125 * 53
2
+0.084 * 60
2
40
2 2
1712 =

) ( 112
ans
2

) (ans 6 . 10 112
DOYEN
Le coefficient de variation
x
V

=
DOYEN
Le coefficient de variation
x
V

=
Cest un nombre SANS UNITE,
donc plus pratique pour
comparer 2 distributions
DOYEN
Le coefficient de variation
x
V

=
Cest un nombre SANS UNITE,
donc plus pratique pour
comparer 2 distributions
DOYEN
Le coefficient de variation
x
V

=
Cest un nombre SANS UNITE,
donc plus pratique pour
comparer 2 distributions
Exemple:
Prix dun poisson rouge en Francs Grenoble
6.5 F 19.5 F 33 F
Prix dun poisson vert en euros Grenoble
1 E 3 E 5 E
(F) 8 . 10 (F); 19.7 1 1 x
(E) 63 . 1 (E); 3 2 1 x
DOYEN
Le coefficient de variation
x
V

=
Cest un nombre SANS UNITE,
donc plus pratique pour
comparer 2 distributions
Exemple:
Prix dun poisson rouge en Francs Grenoble
6.5 F 19.5 F 33 F
Prix dun poisson vert en euros Grenoble
1 E 3 E 5 E
(F) 8 . 10 (F); 19.7 1 1 x
(E) 63 . 1 (E); 3 2 1 x
54 . 0 1 V
54 . 0 2 V
DOYEN
Lintervalle interquartile
Les quartiles sont les 3 valeurs qui
partagent la population en 4 effectifs gaux.
Q Q Q
3 2 1
; ;
Ce sont les 3 valeurs du caractre correspondant
des effectifs cumuls de 25%, 50% et 75%
DOYEN
0
20
40
60
80
100
0 10 20 30 40 50 60
Age en annes
.f cumules
Lintervalle interquartile
Les quartiles sont les 3 valeurs qui
partagent la population en 4 effectifs gaux.
Q Q Q
3 2 1
; ;
Ce sont les 3 valeurs du caractre correspondant
des effectifs cumuls de 25%, 50% et 75%
DOYEN
Lintervalle interquartile
Les quartiles sont les 3 valeurs qui
partagent la population en 4 effectifs gaux.
Q Q Q
3 2 1
; ;
Ce sont les 3 valeurs du caractre correspondant
des effectifs cumuls de 25%, 50% et 75%
0
20
40
60
80
100
0 10 20 30 40 50 60
Age en annes
.f cumules
Q
1
Q
2
Q
3
Graphiquement:
(ans) 30
1

Q
(ans) 40
2

Q
(ans) 50
3

Q
DOYEN
Pour calculer la valeur des quartiles on fait une
interpolation linaire
Pour k=1,2,3:
F F
x x
F P x
Q
i j
i j
i k i
k

+ = ) (
F
j
F
i
P
k
x
i
x
j
Q
k
Effectifs cumuls
% 25
1
=
P
% 50
2
=
P
% 75
3
=
P
DOYEN
100 1 26542481 Total
100 0.084 2225411 55 et +
91.6 0.125 3305278 50-54
79.2 0.139 3696642 45-49
65.2 0.142 3770300 40-44
51.0 0.146 3865252 35-39
36.5 0.142 3771554 30-34
22.3 0.137 3628502 25-29
8.6 0.086 2279542 15-24
Cumul .fi Effectif Age
3 . 22 5 . 36
30 35
) 3 . 22 25 ( 30
1

+ =
Q
(ans) 31
(ans) 5 . 39 Me
2
=
Q
2 . 65 2 . 79
45 50
) 2 . 65 75 ( 45
3

+ =
Q
(ans) 8.5 4
DOYEN
Lintervalle inter-quartile: [ Q
1
, Q
3
] il contient 50 % de
la population et laisse 25% de chaque ct.
Lcart inter-quartile: Q
s
est lamplitude de lintervalle
inter quantile: Q
s
=Q
3
Q
1
il mesure la dispersion de la
population
DOYEN
Lintervalle inter-quartile: [ Q
1
, Q
3
] il contient 50 % de
la population et laisse 25% de chaque ct.
Lcart inter-quartile: Q
s
est lamplitude de lintervalle
inter quantile: Q
s
=Q
3
Q
1
il mesure la dispersion de la
population
Exemple:
En France, en 1999, 50 % de la population active a entre 31
et 48.5 ans
Q
s
=48.5-31=17.5 (ans)
DOYEN
5. tude dun couple de
caractres
Deux caractres (X,Y) pouvant tre de nature diffrente: qualitatif,
quantitatif discret ou continu; on note et
leurs modalits.
n i i x .. 1 ) ( = m j j y .. 1 ) ( =
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
Euros
Salaires Y
Ages X
Salaire net et ge des livreurs de pizza du restaurant PIPIpizza
DOYEN
5. tude dun couple de
caractres
Deux caractres (X,Y) pouvant tre de nature diffrente: qualitatif,
quantitatif discret ou continu; on note et
leurs modalits.
n i i x .. 1 ) ( = m j j y .. 1 ) ( =
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
Euros
Salaires Y
Ages X
Salaire net et ge des livreurs de pizza du restaurant PIPIpizza
3 pers. de 20-22
ans gagnant 170
200 euros
DOYEN
5. tude dun couple de
caractres
Deux caractres (X,Y) pouvant tre de nature diffrente: qualitatif,
quantitatif discret ou continu; on note et
leurs modalits.
n i i x .. 1 ) ( = m j j y .. 1 ) ( =
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
Euros
Salaires Y
Ages X
Salaire net et ge des livreurs de pizza du restaurant PIPIpizza
3 pers. de 20-22
ans gagnant 170
200 euros
9 pers. gagnant
entre 200 et 230
euros
DOYEN
5. tude dun couple de
caractres
Deux caractres (X,Y) pouvant tre de nature diffrente: qualitatif,
quantitatif discret ou continu; on note et
leurs modalits.
n i i x .. 1 ) ( = m j j y .. 1 ) ( =
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
Euros
Salaires Y
Ages X
Salaire net et ge des livreurs de pizza du restaurant PIPIpizza
3 pers. de 20-22
ans gagnant 170
200 euros
9 pers. gagnant
entre 200 et 230
euros
Il y a 16 livreurs dans lentreprise
DOYEN
5.1 Frquence relative
F. relative de , proportion dindividus prsentant
la modalit des caractres par rapport
la population totale.
) , ( j i y x
) , ( j i y x ) , ( Y X
N
n
f
j i
j i
,
, =
j i n ,
Nb individus avec et i x X= i y Y=
N
Nb totale dindividus
DOYEN
5.1 Frquence relative
F. relative de , proportion dindividus prsentant
la modalit des caractres par rapport
la population totale.
) , ( j i y x
) , ( j i y x ) , ( Y X
N
n
f
j i
j i
,
, =
j i n ,
Nb individus avec et i x X= i y Y=
N
Nb totale dindividus
Proprit:
1 , =
!!
i j
j i f
DOYEN
16 1 9 6
7 1
0.06
5
0.31
1
0.06
24-26
5 0
0
3
0.19
2
0.13
22-24
4 0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
19 . 0
16
3

DOYEN
16 1 9 6
7 1
0.06
5
0.31
1
0.06
24-26
5 0
0
3
0.19
2
0.13
22-24
4 0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
19 . 0
16
3

31% des employs ont entre 24 et 26 ans et
gagnent entre 200 et 230 euros
DOYEN
5.2 Frquence marginale
Pour (X,Y) les lois marginales sont:
La loi de X quelque soit la valeur de Y
La loi de Y quelque soit la valeur de X
DOYEN
5.2 Frquence marginale
Pour (X,Y) les lois marginales sont:
La loi de X quelque soit la valeur de Y
La loi de Y quelque soit la valeur de X
Not:
,. i f
j f.,
DOYEN
5.2 Frquence marginale
Pour (X,Y) les lois marginales sont:
La loi de X quelque soit la valeur de Y
La loi de Y quelque soit la valeur de X
Not:
,. i f
j f.,
16 1
0.06
9
0.56
6
0.38
7
0.44
1
0.06
5
0.31
1
0.06
24-26
5
0.31
0
0
3
0.19
2
0.13
22-24
4
0.25
0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
25 . 0
16
4
,. 1 = f
DOYEN
5.2 Frquence marginale
Pour (X,Y) les lois marginales sont:
La loi de X quelque soit la valeur de Y
La loi de Y quelque soit la valeur de X
Not:
,. i f
j f.,
16 1
0.06
9
0.56
6
0.38
7
0.44
1
0.06
5
0.31
1
0.06
24-26
5
0.31
0
0
3
0.19
2
0.13
22-24
4
0.25
0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
25 . 0
16
4
,. 1 = f
31% des
livreur ont
entre 22 et
24 ans
DOYEN
16
1
1
0.06
9
0.56
6
0.38
7
0.44
1
0.06
5
0.31
1
0.06
24-26
5
0.31
0
0
3
0.19
2
0.13
22-24
4
0.25
0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Proprit: 1 ,. =
!
i
i f
1 ., =
!
j
j f
DOYEN
16
1
1
0.06
9
0.56
6
0.38
7
0.44
1
0.06
5
0.31
1
0.06
24-26
5
0.31
0
0
3
0.19
2
0.13
22-24
4
0.25
0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
0.25
+ 0.31
+ 0.44
0.38 + 0.56 + 0.06
Proprit: 1 ,. =
!
i
i f
1 ., =
!
j
j f
DOYEN
16
1
1
0.06
9
0.56
6
0.38
7
0.44
1
0.06
5
0.31
1
0.06
24-26
5
0.31
0
0
3
0.19
2
0.13
22-24
4
0.25
0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Proprit:
+
+
+ +
+ +
=
=
=
i,. , f f
j
j i =
!
DOYEN
16
1
1
0.06
9
0.56
6
0.38
7
0.44
1
0.06
5
0.31
1
0.06
24-26
5
0.31
0
0
3
0.19
2
0.13
22-24
4
0.25
0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Proprit:
i,. , f f
j
j i =
!
+
+
=
+
+
=
+
+
=
j
i
j i f f ., , =
!
DOYEN
Sur les lois marginales, on peut tracer des
graphes: de frquences, frquences cumules,
0
0,2
0,4
0,6
0,8
1
20 22 24 26 28
ges
Frquences cumules des ges
DOYEN
Sur les lois marginales, on peut calculer des
indices centraux et de dispersions.
16
1
1
0.06
9
0.56
6
0.38
7
0.44
1
0.06
5
0.31
1
0.06
24-26
5
0.31
0
0
3
0.19
2
0.13
22-24
4
0.25
0
0
1
0.06
3
0.19
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
185*0.38 +215*0.56+245*0.06 = 205.4 (euros)
Le salaire
moyen des
livreurs de
pizza est de
205.4 euros
DOYEN
5.3 Frquence conditionnelle
Frquence conditionnelle de sachant : proportion
dindividus prsentant la modalit du caractre X par
rapport au totale des individus prsentant la modalit du
caractre Y, note
i x
i y
i x
i y
j i y x f
!
=
i
j i
j i
y x
n
n
f j i
,
,
!
=
j
j i
j i
x y
n
n
f i j
,
,
DOYEN
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Frquence conditionnelle des ges sachant les salaires
5 . 0
6
3
=
3 . 0
6
2
=
17 . 0
6
1

11 . 0
9
1

33 . 0
9
3
=
56 . 0
9
5
= 1
1
1
=
0
1
0
=
0
1
0
=
DOYEN
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Frquence conditionnelle des ges sachant les salaires
5 . 0
6
3
=
3 . 0
6
2
=
17 . 0
6
1

11 . 0
9
1

33 . 0
9
3
=
56 . 0
9
5
= 1
1
1
=
0
1
0
=
0
1
0
=
Parmi les
livreurs gagnant
entre 170 et 200
euros, 50% ont
entre 20 et 22
ans
DOYEN
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Frquence conditionnelle des ges sachant les salaires
5 . 0
6
3
=
3 . 0
6
2
=
17 . 0
6
1

11 . 0
9
1

33 . 0
9
3
=
56 . 0
9
5
= 1
1
1
=
0
1
0
=
0
1
0
=
Parmi les
livreurs gagnant
entre 170 et 200
euros, 50% ont
entre 20 et 22
ans
+
+
+
+
+
+
= = =
1 1 1
DOYEN
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Frquence conditionnelle des salaires sachant les ges
75 . 0
4
3
= 25 . 0
4
1

4 . 0
5
2
=
14 . 0
7
1

6 . 0
5
3
=
71 . 0
7
5
= 14 . 0
7
1
=
0
4
0
=
0
5
0
=
DOYEN
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Frquence conditionnelle des salaires sachant les ges
Parmi les
livreurs gs de
20 22 ans, 75%
gagnent entre
170 et 200 euros
75 . 0
4
3
= 25 . 0
4
1

4 . 0
5
2
=
14 . 0
7
1

6 . 0
5
3
=
71 . 0
7
5
= 14 . 0
7
1
=
0
4
0
=
0
5
0
=
DOYEN
16 1 9 6
7 1 5 1 24-26
5 0 3 2 22-24
4 0 1 3 20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Frquence conditionnelle des salaires sachant les ges
Parmi les
livreurs gs de
20 22 ans, 75%
gagnent entre
170 et 200 euros
+
+
+
+
+ +
=
=
=
1
1
1
75 . 0
4
3
= 25 . 0
4
1

4 . 0
5
2
=
14 . 0
7
1

6 . 0
5
3
=
71 . 0
7
5
= 14 . 0
7
1
=
0
4
0
=
0
5
0
=
DOYEN
Sur les lois conditionnelles, on peut tracer des
graphes: de frquences, frquences cumules
0
0,2
0,4
0,6
0,8
170 200 230 260
Salaires en euros
Frquences pour les 24-26 ans
DOYEN
Sur les lois conditionnelles, on peut calculer des
indices centraux et de dispersions.
16 1 9 6
7 1
0.14
5
0.71
1
0.14
24-26
5 0
0
3
0.6
2
0.4
22-24
4 0
0
1
0.25
3
0.75
20-22
230-260
euros
200-230
euros
170-200
euros
Salaires Y
Ages X
Frquence conditionnelle des salaires sachant les ges
Parmi les livreurs gs
de 22 24 ans, le
salaire moyen chez
PIPIpizza est de 203
euros
245 * 0 215 * 6 . 0 185 * 4 . 0 + +
(euros) 203 =
Pour les 22-24 ans:
DOYEN
5.3 Indpendance
X est dite indpendante de Y si les variations de Y
nentranent pas de variation de X
DOYEN
5.3 Indpendance
X est dite indpendante de Y si les variations de Y
nentranent pas de variation de X
Proprit: Si X est indpendante de Y alors Y est
indpendante de X.
DOYEN
5.3 Indpendance
X est dite indpendante de Y si les variations de Y
nentranent pas de variation de X
Proprit: Si X est indpendante de Y alors Y est
indpendante de X.
On dit X et Y sont indpendants
DOYEN
5.3 Indpendance
X est dite indpendante de Y si les variations de Y
nentranent pas de variation de X
Proprit: Si X est indpendante de Y alors Y est
indpendante de X.
On dit X et Y sont indpendants
Les rsultats de 2 lancs de d non pip sont indpendants!
DOYEN
Proprit:
X et Y sont indpendantes si les frquences conditionnelles
de X sachant Y sont gales aux frquences marginales de X
DOYEN
Proprit:
X et Y sont indpendantes si les frquences conditionnelles
de X sachant Y sont gales aux frquences marginales de X
Ou de faon quivalente,
X et Y sont indpendantes si les frquences conditionnelles
de Y sachant X sont gales aux frquences marginales de Y
DOYEN
Proprit:
X et Y sont indpendantes si les frquences conditionnelles
de X sachant Y sont gales aux frquences marginales de X
Ou de faon quivalente,
X et Y sont indpendantes si les frquences conditionnelles
de Y sachant X sont gales aux frquences marginales de Y
Proprit:
Dans le cas ou il y a indpendance entre X et Y, alors dans
le tableau de contingence les valeurs des lignes sont
proportionnelles et les valeurs des colonnes le sont aussi.
DOYEN
0.44 0.14 0.71 0.14 24-26
0.31 0 0.6 0.4 22-24
0.25 0 0.25 0.75 20-22
.f des classes
dge
230-260
euros
200-230
euros
170-200
euros
.f sachant ge
Les distribution sont toutes diffrentes, donc ges et salaires
ne sont pas indpendants, il existe une dpendance entre
ges et salaires chez PIPIpizza.
DOYEN
5.3 Dpendance totale
X est dit totalement dpendant de Y, si la connaissance de
X entrane la connaissance de Y.
DOYEN
5.3 Dpendance totale
X est dit totalement dpendant de Y, si la connaissance de
X entrane la connaissance de Y.
Dans le tableau de contingence cela ce traduit par le fait
quil ny a quun effectif non nul par colonne.
DOYEN
5.3 Dpendance totale
X est dit totalement dpendant de Y, si la connaissance de
X entrane la connaissance de Y.
Dans le tableau de contingence cela ce traduit par le fait
quil ny a quun effectif non nul par colonne.
Si Y est totalement dpendant de X, alors dans le tableau
de contingence, il ny a quun effectif non nul par ligne.
DOYEN
5.3 Dpendance totale
X est dit totalement dpendant de Y, si la connaissance de
X entrane la connaissance de Y.
Dans le tableau de contingence cela ce traduit par le fait
quil ny a quun effectif non nul par colonne.
Si Y est totalement dpendant de X, alors dans le tableau
de contingence, il ny a quun effectif non nul par ligne.
Ce nest pas une notion rciproque,
contrairement lindpendance
DOYEN
5.3 Dpendance totale
X est dit totalement dpendant de Y, si la connaissance de
X entrane la connaissance de Y.
Dans le tableau de contingence cela ce traduit par le fait
quil ny a quun effectif non nul par colonne.
Si Y est totalement dpendant de X, alors dans le tableau
de contingence, il ny a quun effectif non nul par ligne.
Ce nest pas une notion rciproque,
contrairement lindpendance
Il ny a pas de dpendance totale entre ge et salaire.
DOYEN
Exemple: Y= Valeur du lanc dun d
X= gain
X=
1 si Y est paire
-1 si Y est impaire
X est totalement dpendant de Y
Y nest pas totalement dpendant de X
Y nest pas indpendant de X
DOYEN
Exemple: Y= Valeur du lanc dun d
X= gain
X=
1 si Y est paire
-1 si Y est impaire
X est totalement dpendant de Y
Y nest pas totalement dpendant de X
Y nest pas indpendant de X
Dans le cas gnral il ny a pas indpendance ni
dpendance totale: on est entre les deux.
DOYEN
6. tude dun couple de
caractres sans pondration:
rgression linaire
On tudie un couple de caractre X et Y qui soit:
Quantitatifs
Sans pondration: chaque modalit du couple
apparat une seule fois
) , ( j i y x
DOYEN
Exemple:
Lentreprise CONCONconserve tudie lincidence de la pression
marketing. Elle enregistre dans 5 zones gographiques, les
Ventes (en milliers de boites de conserve) et les Dpenses
Publicitaires (en milliers d euros)
i x
i y
18 65 5
12 40 4
9 31 3
6 32 2
5 27 1
.x
i
.y
i
Rgion i
DOYEN
6.1 Visualisation de la corrlation
? ) (Y f X
On reprsente le nuage de points: X en fonction de Y
On cherche si il existe une droite ou une courbe qui
soit une bonne approximation du nuage de points
DOYEN
6.1 Visualisation de la corrlation
? ) (Y f X
On reprsente le nuage de points: X en fonction de Y
On cherche si il existe une droite ou une courbe qui
soit une bonne approximation du nuage de points
Exemple:
X
Y
DOYEN
6.1 Visualisation de la corrlation
? ) (Y f X
On reprsente le nuage de points: X en fonction de Y
On cherche si il existe une droite ou une courbe qui
soit une bonne approximation du nuage de points
Il ny a pas de
bonne
approximation,
X et Y semblent
indpendants
Exemple:
X
Y
DOYEN
X
Y
DOYEN
X
Y
Une droite est une bonne
approximation du nuage de
points, il existe une relation
linaire entre X et Y.
DOYEN
X
Y
Une droite est une bonne
approximation du nuage de
points, il existe une relation
linaire entre X et Y.
X
Y
DOYEN
X
Y
Une droite est une bonne
approximation du nuage de
points, il existe une relation
linaire entre X et Y.
X
Y
Une courbe est une bonne
approximation du nuage de
points, il existe une relation
curviligne entre X et Y.
DOYEN
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
DOYEN
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
b X a Y * +
DOYEN
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
b X a Y * +
16
40
)
Keuro
Kboite
( .5 2
16
40
= a
DOYEN
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
b X a Y * +
(Kboite) 10 5 . 2 * 4 20 = b
16
40
)
Keuro
Kboite
( .5 2
16
40
= a
DOYEN
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
b X a Y * +
(Kboite) 10 5 . 2 * 4 20 = b
16
40
)
Keuro
Kboite
( .5 2
16
40
= a
Cest trs approximatif!
DOYEN
6.2 Lquation de rgression linaire
Quand lobservation semble tre de type linaire:
Lobjectif est de calculer a et b de telle sorte que lon minimise:
b X a Y + = *
!
i
i e
2
X
Y
1 e
2 e
3 e
: i e
cart entre la droite de
rgression et la i
me
observation
DOYEN
On note:
!
=
i
i x
n
x
1
!
=
i
i y
n
y
1
x
x
x x
i i
i
n
i
n
X V
2
2
2
1 1
) (
) (
= =
! !
y x y x
n
y y x x
n
X Cov
i
i i
i
i i * *
1
) )( (
1
) ( = =
! !
DOYEN
On note:
!
=
i
i x
n
x
1
!
=
i
i y
n
y
1
x
x
x x
i i
i
n
i
n
X V
2
2
2
1 1
) (
) (
= =
! !
y x y x
n
y y x x
n
X Cov
i
i i
i
i i * *
1
) )( (
1
) ( = =
! !
) (
) , (

X V
Y X Cov
a =
On a:
x a y b * =
DOYEN
18 65 5
12 40 4
9 31 3
6 32 2
5 27 1
.x
i
.y
i
Rgion i
324 4225
144 1600
81 961
36 1024
25 729
.x
i
2
.y
i
2
1170
480
279
192
135
.y
i
*
x
i
195 50 8539 610 2256
DOYEN
18 65 5
12 40 4
9 31 3
6 32 2
5 27 1
.x
i
.y
i
Rgion i
324 4225
144 1600
81 961
36 1024
25 729
.x
i
2
.y
i
2
1170
480
279
192
135
.y
i
*
x
i
195 50 8539 610 2256
(Keuro) 10
5
50
= = x
(Kboite) 39
5
195
= = y
(Keuro)
10
2
2
22
5
610
) ( = = X V
Kboite) * (Keuro 2 . 61 39 * 10
5
2256
) , ( = = Y X Cov
DOYEN
18 65 5
12 40 4
9 31 3
6 32 2
5 27 1
.x
i
.y
i
Rgion i
324 4225
144 1600
81 961
36 1024
25 729
.x
i
2
.y
i
2
1170
480
279
192
135
.y
i
*
x
i
195 50 8539 610 2256
(Keuro) 10
5
50
= = x
(Kboite) 39
5
195
= = y
(Keuro)
10
2
2
22
5
610
) ( = = X V
Kboite) * (Keuro 2 . 61 39 * 10
5
2256
) , ( = = Y X Cov
)
Keuro
Kboite
( 78 . 2
22
2 . 61
= a
(Kboite) 2 . 11 10 * 78 . 2 39 = b
DOYEN
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
2 . 11 * 78 . 2 + X Y
DOYEN
6.3 Mesure de la qualit de la rgression
Le coefficient de corrlation:
) ( ) (
) , (
Y V X V
Y X Cov
r=
DOYEN
6.3 Mesure de la qualit de la rgression
Le coefficient de corrlation:
) ( ) (
) , (
Y V X V
Y X Cov
r=
Proprits:

proche de 1: corrlation linaire possible


proche de 0: pas de corrlation linaire
1 1 r
r
r
( ) 86 . 0 > r
DOYEN
18 65 5
12 40 4
9 31 3
6 32 2
5 27 1
.x
i
.y
i
Rgion i
324 4225
144 1600
81 961
36 1024
25 729
.x
i
2
.y
i
2
1170
480
279
192
135
.y
i
*
x
i
195 50 8539 610 2256
DOYEN
18 65 5
12 40 4
9 31 3
6 32 2
5 27 1
.x
i
.y
i
Rgion i
324 4225
144 1600
81 961
36 1024
25 729
.x
i
2
.y
i
2
1170
480
279
192
135
.y
i
*
x
i
195 50 8539 610 2256
(Keuro) 10
5
50
= = x
(Kboite) 39
5
195
= = y
(Keuro)
10
2
2
22
5
610
) ( = = X V
(Kboite)
39
2
2
8 . 186
5
8539
) ( = = Y V
Kboite) * (Keuro 2 . 61 39 * 10
5
2256
) , ( = = Y X Cov
DOYEN
18 65 5
12 40 4
9 31 3
6 32 2
5 27 1
.x
i
.y
i
Rgion i
324 4225
144 1600
81 961
36 1024
25 729
.x
i
2
.y
i
2
1170
480
279
192
135
.y
i
*
x
i
195 50 8539 610 2256
(Keuro) 10
5
50
= = x
(Kboite) 39
5
195
= = y
(Keuro)
10
2
2
22
5
610
) ( = = X V
(Kboite)
39
2
2
8 . 186
5
8539
) ( = = Y V
Kboite) * (Keuro 2 . 61 39 * 10
5
2256
) , ( = = Y X Cov
96 . 0
8 . 186 * 22
2 . 61
r
DOYEN
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
2 . 11 * 78 . 2 + X Y
96 . 0 r
DOYEN
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
2 . 11 * 78 . 2 + X Y
96 . 0 r
La corrlation linaire des donnes est forte
DOYEN
On peut faire de la prvision:
Sur une sixime rgion on veut vendre Y=55 (Kboites),
combien faut il dpenser en publicit?
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
DOYEN
On peut faire de la prvision:
Sur une sixime rgion on veut vendre Y=55 (Kboites),
combien faut il dpenser en publicit?
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
2 . 11 * 78 . 2 55 + = X
(Keuro) 8 . 15
78 . 2
2 . 11 55

= X
DOYEN
On peut faire de la prvision:
Sur une sixime rgion on veut vendre Y=55 (Kboites),
combien faut il dpenser en publicit?
20
30
40
50
60
70
4 8 12 16 20
Kboite
Keuro
2 . 11 * 78 . 2 55 + = X
(Keuro) 8 . 15
78 . 2
2 . 11 55

= X

Das könnte Ihnen auch gefallen