Beruflich Dokumente
Kultur Dokumente
Introduction
Ensemble des mthodes et procds partir desquelles
on recueille, organise, rsume et analyse des donnes, et
qui permettent den tirer des conclusions et de prendre
des dcision judicieuses.
Statistiques descriptives
Statistiques inductives
Dfinitions
Statistique descriptive
Cest la phase analytique qui consiste rduire les donnes un
nombre limit de paramtres caractristiques susceptibles de dcrire
la srie statistique.
Statistique inductive
Cest une phase qui permet de dduire des rsultats obtenus sur un
chantillon afin de prendre des conclusions relatives lensemble de
la population entire.
Population (univers):
Tout ensemble tudi en statistique sappelle population. Les lments sont
appels individus.
chantillon:
Cest un sous- ensemble dune population.
Effectif : ( ni )
Leffectif est associ une variable: cest le nombre de fois que cette
variable se rpte.
Frquence: ( fi )
Le rapport entre leffectif et le nombre deffectif total.
Modalit:
Variable:
Elle est dfinie comme tant une quantit ou caractristique qui peut
varier dun individu un autre.
Ex: taille, poids, nationalit
Variable quantitative:
Variable qualitative:
Exemples:
5
Exemple 1:
Dosage du phosphore par polarographie tension sinusodale surimpos::La mesure
de la hauteur dun pic de rduction dune solution phosphomolybdique talon donne
les rsultats suivants:
60, 59, 58, 58, 56, 57, 60, 59, 59, 59, 58, 59, 61, 60, 61
60, 58, 59, 60, 59, 59, 60, 59, 57, 60, 61, 59, 59, 56, 58.
Exemple 2:
On effectue lanalyse du sang de 20 personnes qui ont manipul un gaz
toxique. La mesure du taux de leucocytes ( globules blanc), par mm3, donne
les rsultats suivants :
3600
5100
6100
4600
5100
4800
3200
4700
5600
6900
5300
6100
3900
4200
3400
6300
5400
6200
3200
3700
6
20
21
22
23
24
31
24
11
Exemple 4:
On veut tudier la longueur des tiges dacier dun certaine production. Pour cela on a extrait
un lot dont les rsultats sont donns dans le tableau ci-dessous.
Faire une tude descriptive.
L(en mm)
Nbre de tiges
115-125
125-135
135-145
145-155
155-165
165-175
175-185
12
2
7
Prsentations graphiques
i = fi*360
8
Cest une phase analytique qui consiste rduire les donnes un nombre
limit de paramtres caractristiques.
Paramtres de position
(moyenne, mdiane)
Paramtres de dispersion
(cart type, variance)
Paramtres de position
Mode:
La valeur de la variable correspondant leffectif le plus grand.
Lorsquil sagit de la classe on dit classe modale.
Mdiane:
la valeur de la variable statistique qui partage la population en deux effectifs
gaux.
Deux mthodes sont considrer selon quil sagit de variable statistiques
discrtes ou continues.
Paramtres de position
Variable discrte
Reprsentation graphique
Me
Variable continue
On cherche la classe mdiane
11
Paramtres de position
Les moyennes:
i)
La moyenne arithmtique:
x 1, x2, xi, xn
La moyenne gomtrique:
xn = xn-1*r
g = x0 r n/2
12
Paramtres de position
iii) Moyenne harmonique:
Soit x
(x1 xn)
H
i 1 x i
( x1, x2xn)
q
1 n
2
xi
n
i 1
13
Paramtres de dispersion
Dev. xi X
Paramtres de dispersion
Ecart |xi - X|
Etendue Xmax xmin
14
Paramtres de dispersion
Etendue :
W = X max X min
E = 1/n ni |xi - X|
Variance V :
Cest la moyenne arithmtique des carres des carts / X (MA)
cart- type :
Lcart type (ou cart quadratique moyen = rms) est la V
= V
15
Paramtres de dispersion
Covariance:
16
y = ax + b ou y = a ebx
17
y= a log x + b
18
Y= a/x+ b
19
yi = f(xi) + i
i = yi- f(xi)
2
i
( y
i
f ( xi ))
x y
i
x
i 1
2
i
nx y
nx
S a, b
i 1
y ax b
soit
x y nx y
x x
i
21
r X ,Y
Cov X , Y
Cas extrmes:
r= -1
r= 1
r0
22
m
dfinit la largeur mi-hauteur de la courbe :
Plus est grand
23
m x0
Changement de variable :
m + x0
0.01 0.02
0.06
0.09
0.0
0.1
t = 1.96
1.9
0.475
3.8
3.9
t
25
Prob (m X m + )
Prob (m 2 X m + 2 )
Prob (m 3 X m + 3 )
26
Quelle est le nombre de pices ayant une taille comprise entre 140 & 160 ?
2.
Quelle est le nombre de pices ayant une taille comprise entre 140 & 170 ?
3.
Quelle est le nombre de pices ayant une taille comprise entre 130 & 170 ?
4.
5.
6.
7.
Loi Binomiale
Dfinition
Soit une srie de n preuves successives et indpendantes ( preuve de
Bernoulli)dont lissue de chaque preuve est soit succs avec une
probabilit p, soit insuccs avec une probabilit q= 1-p, alors la
probabilit davoir x succs en n preuves est donne par lexpression:
Pr ob X x
C p q
x
n x
B (n,p)
Conditions dapplication:
Les rsultats de lexprience ne comporte que 2 rsultats possibles: succs ou insuccs
On rpte lexprience n fois
La probabilit de ralisation de lvnement succs est la mme chaque essai note p.
Les essais sont indpendantes et non exhaustifs ( ou n/N 0.10 ) .
28
Loi Binomiale
Proprits:
Les paramtres de la loi binomiale sont n et p ( n > 0 et 0 < p < 1)
La moyenne et la variance sont:
M=np
&
= n p(1-p)
k
0
1
2
0.10
0.8100
0.1800
0.0100
0
1
2
3
0.7290
0.2430
0.0270
0.0010
0.20
0.6400
0.3200
0.0400
p
0.30
0.4900
0.4200
0.0900
0.40
0.3600
0.4800
0.1600
0.50
0.2500
0.5000
0.2500
29
Loi Binomiale
La loi binomiale permet dvaluer la probabilit de tirer x produits
dfectueux dans un chantillon de n produits provenant dun lot important
contenant p% de dfectueux.
Exemple:
Soit un lot contenant une proportion de 10% de produits dfectueux.
On prlve un chantillon de 8 produits sans remise. Calculer la probabilit de
tirer dans un chantillon:
un ou zro produit non- conforme
au moins deux produits non- conformes
Au plus un produit non- conforme
30
Loi de Poisson
Dfinition:
On dit quune variable alatoire X suit une loi de poisson, si elle est
successible de prendre toutes les valeurs entires 0, 1, 2, 3,..n,
la probabilit que X soit gale k tant:
Pr ob X k
e
k
k
Conditions dapplication:
La loi de poisson sappelle encore la loi des petites probabilits. Elle est
utilise pour prsenter des phnomnes rares:nombres daccidents,
nombre de dfauts, de dchets.
Proprits:
La moyenne et la variance sont:
E(X)=
&
=
31
Loi de Poisson
Les valeurs tabules:
0.1
0.2
0.3
0.4
0.5
0.6
Pr ob X k
0.7
0.8
0.9
1.0
1.7
1.8
1.9
2.0
1.1
1.2
1.3
1.4
1.5
1.6
0
1
32
Loi de Poisson
La loi de poisson est largement utilise pour dcrire les dfauts
compatibles par unit ( exemple, le nombre de ponts de soudure sur un
circuit imprim, pannes de machines, appels tlphoniques sur une ligne,
arrives de clients comptoir)
Exemple 1:
Supposons que les dfauts pont de soudure sur un circuit imprim soit
distribu selon une loi de poisson avec un paramtre = 2.
Calculer la probabilit quun circuit contienne un pont de soudure au moins.
Exemple 2:
Si la probabilit pour quun individu ait une mauvaise raction dun certain
srum est de 0.001, dterminer la probabilit pour que sur 2000 individus :
-3
- plus de 2
aient une raction dangereuse.
33
Echantionnage
&
Estimation
34
Echantillonnage
INTRODUCTION
Lchantillonnage a pour objectif dtudier le lien entre la distribution
statistique dune variable X dans une population P et les distributions de
cette variable dans diffrents chantillons.
Pop :
N, M,
Echantillons i : n, mi, i
Exhaustif
Non-exhaustif
35
Echantillonnage
Distribution des moyennes dchantillons
Soit une Population P
( n, m1, 1)
( n, m2, 2)
( n, mi, i)
( n, mk, k)
N, M, : E(X) = M
& = (X)
( k chantillons )
Lensemble :
m (m1,m2,,mi,..mk) constitue une
srie statistique deffectif k appele
Distribution des Moyennes.
36
Echantillonnage
Distribution des moyennes dchantillons
Pop :
Echantillons i : n, mi, i
N, M,
Non-Exhaustif
E(X) = M
Exhaustif
E(X) = M
N n
N 1
37
Echantillonnage
Distribution des frquences dchantillons
1
Soit une Population P
0
p = proportions dlments ayant X = 1
On dsigne par
q = proportions dlments ayant X = 0
tq :
p+q=1 ,
0<p<1
&
0<q<1
E(X) = p
= p*q
38
Echantillonnage
Distribution des frquences dchantillons
X
N, F, F : E(F) = p
( k chantillons )
( n, f1, 1)
( n, f2, 2)
( n, fi, i)
( n, fk, k)
& F = p*q
Lensemble :
m (f1,f2,,fi,..fk) constitue une srie
statistique deffectif k appele
Distribution des Frquences.
39
Echantillonnage
Distribution des frquences dchantillons
Pop :
Echantillons i : n, fi, i
N, F, F
Non-Exhaustif
E(f) = p
m( f )
Exhaustif
E(f) = p
p*q
n
m( f )
p*q
n
N n
N 1
40
Echantillonnage
Autres distributions dchantillonnage
On peut dfinir dautres distributions pour toutes variables susceptibles
dtre variable dun chantillon lautre ( , Me, V,..).
Distributions
N, M,
t
n < 30
Echantillonnage
Distribution t:
Distribution
N, M,
soit un chantillon de taille n
mi M
ti
(n, m i, i)
Ecart Rduit
42
Echantillonnage
Distribution
Pop :
N, M,
Echantillons i : n, mi, i
( xij mi ) 2
2 j 1
i
2
La srie
43
Estimation
Introduction
Si lchantillonnage tudi les relations existants entre une population et tous les
chantillons de mme taille n, lestimation vise tudier la reprsentativit de la
population par un chantillon.
Estimation
Estimation Ponctuelle
Echantillons i : n, mi, i
Pop : N, M,
( M, sont inconnus )
1.
2.
'
n
n 1
'
X n 1
3.
Estimation
Estimation par Intervalle de confiance ( IC )
Lestimation par IC dun paramtre consiste calculer, partir dun estimateur
choisi , un intervalle dans lequel il est vraisemblable que la valeur correspondante
du paramtre sy trouve.
LIC est dfini par deux limites auxquelles est associe une certaine probabilit, fixe
lavance et aussi leve quon dsire, de contenir la valeur vraie du paramtre
inconnu :
Prob ( LI LS ) = 1 -
Avec (1-) = Probabilit associe
lintervalle dencadrer la vraie valeur
/2
1-
/2
46
Estimation
Estimation par Intervalle de confiance ( IC )
On peut crire aussi :
Prob ( - k + k ) = 1 -
La quantit k dpend de la distribution dchantillonnage spcifie de lestimateur
et de la probabilit associe ( = risque derreur ) ( voir schma )
Applications :
Estimation
Estimation par IC dune moyenne
Il y a 3 cas possibles :
1.
Si est connu :
Prob ( m - t m M m + t m ) = 1 -
2.
Si est inconnu et n 30 :
Prob ( m - t m M m + t m ) = 1 -
3.
48
Estimation
Estimation par IC dune proportion
Dans le cas de lestimation dune proportion on a seul cas car est
connu et donn par :
2 = p*( 1- p )
Alors IC est donn par :
Prob ( m - t m M m + t m ) = 1 -
49
Estimation
Remarques
1. Echantillonnage exhaustif :
N n
N 1
0.9
0.5
0.4
0.01
0.001
2
3
1-
/2
-t
/2
t
50
TESTS STATISTIQUES
Objectifs
chantillonnage
Estimation
Tests statistiques
- Homognit, Reprsentativit
- Conformit, Validit, Comparaison
51
Dfinitions
Df 1: Hypothse statistiques
Une Hypothse Statistique est un nonc ( une affirmation )
concernant les caractristiques ( valeurs des paramtres,
forme de la distribution des observations ) dune population.
Df 2: Test statistique
Un test statistique ( ou test dhypothse ) est une dmarche
qui a pour but de fournir une rgle de dcision
permettant, sur la base de rsultats dchantillon, de faire
un choix entre deux hypothses statistiques.
52
Hypothse Nulle H0
Hypothse Alternative H1
N.B.
Cest lhypothse H0 qui est soumise au test et toute la dmarche
du test seffectue en considrant cette hypothse comme vraie.
53
?
Hypothse Nulle H0
Accepter
Rejeter
Hypothse Alternative H1
Risque du 1 espce ( ) :
er
H1
/2
H0
1-
H1
/2
M0
Lorsquon prend une dcision sur un problme donn,
on aimerait bien minimiser les risques et .
55
H0 : M = M0
H0 : M = M0
H0 : M = M0
H1: M M0
H1: M M0
H1: M M0
Rej Ho
Acc Ho
Xc1
M0
Rej Ho
Xc2
Acc Ho
M0
Rej Ho
Xc
Rej Ho
Xc
Acc Ho
M0
Tests Unilatral
Tests Bilatral
M0 = valeur Hypothtique
56
Enoncer H0 et H1
2.
3.
4.
5.
6.
Rsultats exprimentaux
7.
Consquences et Conclusions
57
-Applications : ( TD n4 )
Exemple 1:
Une entreprise achte dun fournisseur des cbles dacier dont la rsistance moyenne la rupture
doit tre suprieure ou gale 250 kg/cm. Entant que cette norme est respecte, l'entreprise est
satisfaite du produit. Toutefois une rsistance moyenne la rupture infrieure 250 kg/cm est
inadquate pour lentreprise. Lors de la rception dun lot, on veut sassurer de la qualit des
cbles sur la base dun chantillon. Formuler les hypothses statistiques pertinentes.
Exemple 2 :
Dans un atelier mcanique, on vrifi le diamtre de tiges tournes sur un tour
automatique. Le diamtre des tiges peut fluctuer selon le rglage du tour. 20 tiges prleves au
hasard, ont t mesures avec un micromtre de prcision. Les rsultats sont prsents dans le
tableau suivant ( en mm ) :
m = 39.96
s = 1.22
Si le diamtre moyen des tiges doit tre de 40 mm, doit-on envisager, selon les rsultats de cet
chantillon, de modifier le rglage du tour ?
58
n(1-p) 5
- Critre de test :
t 0
p p0
p0(1 p0)
n
59
Objectif
Quand et Comment
Tout comme dans le cas de la moyenne, il est frquent de faire un test sur une
variance ( ) et de dterminer son IC avec un certain niveau de confiance.
Toutefois, peut tre en mesure deffectuer un test sur une variance, il faut
introduire une nouvelle loi de probabilit, soit la loi de 2 ( Khi-deux ).
La loi de 2
?
61
62
Prob( ) =
f(
)
0.9
0.5
0.4
0.01
0.001
(1
2
3
63
: 0
(n1)s
La loi 2
Valeur Hypothtique
(n1)s
/2
(n 1)s
/2
( voir dmonstration )
65
Exemple 2 :
Une ville veut acheter une certaine quantit de lampes fluorescentes pour lclairage
de son mtro. La ville est seulement intress une longue dure de vie des lampes
mais aussi une dispersion relativement faible. On dcida que lcart type de cette
caractristique ne devrait pas excder 100 heures. Le laboratoire de la ville a vrifi
20 lampes dun fournisseur local et a obtenu une variance s2 = 12500 h2. Est-ce que les
lampes du fournisseur semblent excder la variation permise ? ( utiliser = 5% )
66
m1
Pop 2 : M2
m2
67
- La forme de distribution.
- La moyenne.
- Lcart type.
3 cas peuvent se prsenter :
- Populations Normales de variances connues.
- Grands chantillons ( n1 30 , n2 30 ) et variances inconnues.
- Populations Normales de variances inconnues ( mais supposes gales
12 = 22 = 2 ) et lun des chantillons ou les deux ayant une taille
petite. .
68
Pop 1 :
M1, 1
Pop 2 :
M2 , 2
m1
m2
Pop 1 :
M1, 1
Pop 2 :
M2 , 2
m1
m2
M2 , 2
m1
m2
n1 = 40
n2 = 40
X1 = 1025 h
X2 = 1070 h
s1 = 120 h
s2 = 140 h
La publicit affirme que ces ampoules ont une dure de vie moyenne de 1000h.
Est-ce que la revue peut affirmer, quen moyenne, les ampoules de F1 ont une
dure de vie infrieure celles du F2 ?
72
p1
P1 et P2 sont inconnues
Pop 2 : P2
p2
73
74
75
76
Prob( F F ) =
f(F)
Pour un donn
1
3
(1-
2
3
79
Prob( F F ) = 1-
f(F)
f(F)
0
F=
(1-
(1-
0
ou
F=
F
80
s
s
2
2
Pop 2 : M2 , 2
m1,s1
m2,s2
Pop 1 : M1, 1
2
1
s
s
2
2
2
1
2
Loi Fischer
s
s
1
2
2
Loi Fischer
81
U1 :
U2 :
n1 = 25
n2 = 25
m1 = 90.6
m2 = 94.4
s1 = 65.42
s2 = 58.24