Beruflich Dokumente
Kultur Dokumente
1. Dfinitions de la probabilit Afin d'viter des dmonstrations trs thoriques, nous donnons les dfinitions tires de la norme NF X06-002. a) Dfinition dterministe de la probabilit (ou priori) Lors de la ralisation dun vnement dont le nombre dissues favorables peut tre calcul au moyen de lanalyse combinatoire (compte tenu de lhypothse dquiprobabilit des issues), on dfinit la probabilit de cet vnement par le rapport du nombre d'issues favorables (h) au nombre d'issues possibles (n) :
P=
h n
Cest la dfinition classique que lon utilise pour valuer les issues dun jeu de hasard. Exemple : La probabilit pour obtenir "pile" aprs un lanc dune pice parfaitement symtrique est de 0,5. b) Dfinition empirique de la probabilit Si aprs un grand nombre de ralisations dune exprience (n ralisations) on observe h fois lissue souhaite, la probabilit de cet vnement est la limite de la frquence des observations de l'issue souhaite :
h P = n lim n
En ralit, la frquence observe en fonction de n oscille autour de sa valeur thorique et s'en rapproche indfiniment lorsque n conformment la "loi des grands nombres".
Pierre Jost
2 2. Variables alatoires a) Dfinition Considrons un vnement comportant un certain nombre dissues. Si on associe un nombre chaque issue, ou chaque ensemble dissues, ce nombre est appel variable alatoire ou ala numrique. On la note par une lettre majuscule X, par contre les valeurs particulires de la variable alatoire sont notes x ou xi. Exemple : jeu de pile ou face : Les issues du jeu sont "pile" ou "face". On peut associer "pile" X = 1 et "face" X = -1 ou encore 0 et 1 ou tout autre nombre. X est alors une variable alatoire. b) Continuit et discontinuit dune variable alatoire, notion de densit de probabilit Variable discontinue ou discrte Cest une variable qui ne peut prendre que des valeurs isoles spares par un intervalle fini, cest--dire non infinitsimal. Elle est gnralement reprsente par un entier. On peut associer une probabilit une variable alatoire discrte. Variable continue Cest une variable qui peut prendre toutes les valeurs dun intervalle fini ou infini. Cela signifie que la diffrence entre deux valeurs voisines peut tre aussi petite que lon peut limaginer. Cest un nombre rel. On ne peut pas associer une probabilit une variable alatoire continue. La probabilit pour que X prenne une valeur particulire x dans R (l'ensemble des nombres rels) est toujours nulle. Par contre on peut associer x une densit de probabilit f(x) et on peut associer un intervalle [x, x+x] une probabilit non nulle. La densit de probabilit est dfinie de la mme manire que la densit dun milieu continu.
Fig.1
Pierre Jost
3 P(x X x + x) x
f(x) = lim x0
Si lintervalle est assez petit pour quon puisse considrer f(x) comme constant :
P(x X x + x) = f(x) x
On constate bien que cette probabilit tend vers 0 lorsque x tend vers 0. Exemple : On sintresse la taille des personnes dun certain ge. Si la taille est considre comme une variable alatoire continue, donc un nombre rel (un nombre rel est un nombre infiniment prcis), rien nempche dexaminer la probabilit pour rencontrer un individu de taille 1,7500 m ou mme 1,7543 m. La probabilit de rencontrer dans la population une valeur numrique aussi prcise est nulle. Il est dailleurs impossible de mesurer la taille dune personne avec une telle prcision. Par contre il existe un certain nombre dindividus ayant une taille comprise entre 1,75 et 1,76 m si lchantillon est suffisamment grand. Il faut donc "discrtiser" une variable alatoire continue pour pouvoir en dfinir une probabilit non nulle. 3. Gnralits sur les lois de probabilits a) Dfinition Une loi de probabilit est une relation permettant dassocier une probabilit ou une densit de probabilit chaque valeur dune variable alatoire. b) Reprsentation dune loi de probabilit Si la variable est discrte : reprsentation comme un diagramme en btons. p(x)
X
Fig. 2 Diagramme en btons
Pierre Jost
- Pour une variable continue on reprsente la fonction densit de probabilit (voir figure 1) c) Fonction de rpartition dune loi de probabilit La fonction cumulative de distribution, ou plus simplement fonction de distribution F ou fonction de rpartition F est dfinie par :
d) Reprsentation graphique de la fonction de rpartition La courbe est encore appele "courbe des probabilits cumules". Dans le cas dune loi continue F(x) reprsente la surface dlimite par la courbe reprsentation de la loi entre - et labscisse x.
Fig. 3 Lois de probabilit et fonctions de rpartition (variables discrtes et continues) e) Fractile d'ordre : t() Dans le cas dune loi continue le fractile t() est labscisse x telle que la surface dlimite par la loi de probabilit entre - et t() soit gale . Les fonctions F(t) et t() sont des fonctions rciproques lune de lautre.
Pierre Jost
P( X t ) =
P( X t ) = 1 - ou F(t ) =
Fig. 5 Fractile t(1-) dune loi statistique encore appel fractile suprieur
On sintresse galement au fractile t(1-) qui joue le mme rle que t sur la partie des x levs (Fig5). On dmontre que :
P( X t 1-) =
Si la loi statistique est symtrique et centre on a la relation t = -t(1-) Les fractiles symtriques dlimitent chacun une surface extrieure de /2. La surface totale intrieure lintervalle interfractile est 1-.
Fig. 6 Fractiles symtriques Remarques : les fractiles des lois de probabilits ont une importance considrable dans les
Pierre Jost
6 4. Paramtres statistiques des variables alatoires a) Esprance mathmatique Dfinition L'esprance mathmatique est un paramtre de position (ou paramtre de tendance centrale) dfini par les relations Variable discrte E(X) =
Xi .P(Xi )
i =1
Les indices 1 N doivent englober tout le domaine de variation de X. Variable continue Variable continue
+
E(X) =
X f(X)
dX
Physiquement, l'esprance mathmatique est le centre de gravit de la loi de probabilit. Fig. 7 Signification physique de lesprance mathmatique
E (X + Y) = E(X) + E(Y)
Par contre E(XY) = E(X) . E(Y) uniquement si les variables x et y sont indpendantes. La variable Z = X - E(X) est appele variable alatoire centre. Son esprance mathmatique est nulle.
Pierre Jost
V(X) =
(x E(x)) 2 f(x)dx
= V(X)
La variance et lcart-type sont des paramtres de dispersion. Physiquement, la variance est assimilable un moment d'inertie (les masses tant gales aux probabilits) et lcart-type est assimilable un rayon de giration. Quelques proprits de lesprance mathmatique V(X) = 2 V(X) Pour deux variables alatoires indpendantes V(X + Y) = V(X) + V(Y) V(X - Y) = V(X) + V(Y) Les proprits dadditivit ne sappliquent quaux variances ; Elles ne sappliquent pas aux carttypes. (une somme (X) + (Y) na aucun sens statistique)
La variable alatoire Z =
Pierre Jost
c) Moments dordre suprieur, dissymtrie et aplatissement Dfinitions On appelle moment dordre n la grandeur :
Mn = E (Xn)
Le moment centr dordre n est le moment dordre n de la variable centre :
n = E[(X - E(X))n]
On a donc
M1 = E(X) , 1 = 0 et 2 = V(X)
Tous les moments centrs dordre impair (>1) donnent une indication sur la dissymtrie de la loi de probabilit. On nutilise que le moment dordre 3 et on appelle coefficient dasymtrie le coefficient :
3 2
3 = 3 2 3
Le coefficient dasymtrie est une grandeur sans dimension, sa valeur donne une ide de limportance de la dissymtrie et son signe montre si la dissymtrie provient de valeurs leves de X (dissymtrie droite ) ou des valeurs petites de X (dissymtrie gauche). Tous les moments centrs dordre pair sont des variables de dispersion. On nutilise que le moment
= 4 3= 4 3 2 4 2
Ce facteur permet donc de montrer quune distribution est plus aplatie ou moins aplatie quune distribution gaussienne, toutes choses gales par ailleurs (mme esprance et mme variance).
Pierre Jost
9 d) Autres paramtres de position Mode Le mode est la valeur de X dont la probabilit est maximale. Cette valeur peut ne pas tre unique. Une distribution unimodale est une distribution nayant quun seul mode, sinon elle est bimodale, trimodale ou multimodale. Mdiane La mdiane Med est la valeur de x pour laquelle P (X x) = P (X x) =
1 2
Pour une distribution continue cest la valeur qui spare la courbe de densit de probabilit en deux portions de surface gale. La mdiane est le fractile d'ordre
1 2
5. Etude de quelques lois de probabilits discrtes a) Loi de Binomiale Ralisation On considre un jeu comportant 2 issues : - une issue favorable S avec la probabilit p - une issue dfavorable S avec la probabilit q = 1 - p On fait n ralisations du jeu de faon que les preuves soient indpendantes. On veut calculer la probabilit pour avoir k issues favorables appeles S, sans tenir compte de lordre de leur ralisation. Probabilit pour la ralisation de S : pk Probabilit pour n - k ralisations de S : (1 - p)n-k Probabilit pour que S se ralise k fois et S n - k fois : pk (1 - p) n-k
(Si on nassocie pas n-k ralisations de S k ralisations de S, le nombre total de ralisations est variable et ne dpend pas de n, parce que lordre des ralisations est indiffrent)
k Nombre de combinaisons de k objets parmi n : C n
Pierre Jost
10
Paramtres statistiques
= 3+
Reprsentation graphique
On reprsente la loi binomiale laide dun diagramme en btons. Le diagramme est symtrique lorsque p = q = 0,5 . Dans ce cas, la mdiane et le mode sont gaux E(X). Lorsque p et la mdiane et le mode deviennent < E(X) Nous verrons ultrieurement limportance de cette proprit. La figure ci-dessous reprsente le diagramme en btons de la loi binomiale pour n = 40 et p = 0,1 (m = 4, = 1,9) Enfin, lorsque n est grand et p petit, les valeurs de P(X=k) diminuent trs vite partir dune certaine valeur de k, ce qui signifie que le diagramme en btons ne dpasse jamais une vingtaine de valeurs . et q la dissymtrie augmente
Pierre Jost
11
b) Loi de Poisson Expression de la loi de probabilit On obtient la loi de Poisson partir de la loi binomiale lorsque n est trs grand et p trs petit, le produit np ntant pas trs grand, (1 < np < 20) Exemple : p = 0,05 et n = 100 fournit une trs bonne approximation dune loi de Poisson. Moyennant quelques approximations, on meut dmontrer :
P(k) =
Paramtres statistiques
mk m e k!
On tire ces valeurs de la loi binomiale dont la loi de Poisson est une approximation. En posant np = m dans les quations correspondantes de la loi binomiale on obtient :
E(X) V(X)
= m = m m 1 m 1 m
= 3 +
Reprsentation graphique
Le diagramme est toujours dissymtrique vers les valeurs leves de X, la mdiane et le mode sont infrieurs la moyenne. Pour les grandes valeurs de n, 0 et 3, la loi se rapproche dune loi de Gauss. La figure ci-dessous reprsente la loi de Poisson pour m = 3 ( = 1,73).
Pierre Jost
12
Intrt de la loi de Poisson la loi de Poisson est la loi suivie par les dsintgrations radioactives ainsi que par dautres vnements rares comme les pannes sur les chanes de fabrication ou les objets dfectueux dans une production. Les files dattente suivent galement une loi de Poisson.
6. Etude de quelques lois de probabilits continues utiles pour linterprtation de donnes exprimentales a) Loi de Gauss (Loi Normale et Loi Normale Rduite) Expression de la densit de probabilit La loi Normale est une fonction continue dpendant des deux paramtres m et
(x m)2 2 2
g(x) =
xm la fonction g devient :
x2 2
g(x) =
1 2
Cest lquation de la loi Normale Rduite. On a videmment E(x) = 0, V(x) = 1, = 0 et = 3 Paramtres statistiques
La loi est donc symtrique et le mode et la mdiane sont gaux la moyenne. Laplatissement prend une valeur caractristique, = 3 qui est prise comme rfrence lorsquon veut comparer les autres lois statistiques la loi Normale.
Pierre Jost
13
Fig.10 Reprsentation graphique de la loi Normale rduite et valeur des surfaces S(u) Valeurs remarquables de g(x) et de la surface comprises entre u et u
+u
S(u) =
-u
F est la fonction de rpartition de g(x). Ces valeurs ont une importance majeure pour la comprhension des tests statistiques. u 0 0.6740 1 g(u) 0.40 0.318 0.242 0.20 0.054 0.014 4.4 10
-3
Remarque Maximum de la courbe Erreur quiprobable Point d'inflexion Largeur mi-hauteur Intervalle de confiance 95 % Intervalle de confiance 99 % Intervalle de confiance 99.5 %
2 ln 2
2 2.6 3
Intrt de la Loi Normale Beaucoup de mesures physiques se distribuent suivant une loi Normale. Il existe des tests statistiques permettant de prouver le caractre normal dun ensemble de mesures et la normalit d'une distribution exprimentale est souvent une condition ncessaire pour l'application des tests statistiques sur les moyennes ou sur les variances.
Pierre Jost
14
b) Loi de Student Sa densit de probabilit dpend dun paramtre , appel "nombre de degrs de libert". Elle est symtrique et a pour reprsentation graphique la famille de courbes dont quelques unes sont reprsentes ci-dessous :
Fig. 11 reprsentation graphique de la loi de Student Les courbes prsentent la mme allure quune courbe de Gauss mais elles sont plus aplaties. Lorsque (en pratique lorsque > 40) la loi de Student est quasiment quivalente la loi de Gauss. Fractiles de la loi de Student Les valeurs des fractiles t(,) et t(,1-) de la loi de Student sont donnes dans les tables de Student-Fisher. Puisque la loi est symtrique t(,) = -t(,1-). Comme pour toute loi statistique, la valeur t(,1-) constant augmente lorsque diminue, mais constant les valeurs de t(,1-) augmentent sensiblement lorsque diminue (voir fig 11 et 12). Ceci sexplique facilement par l augmentation de laplatissement de la courbe. En effet, plus une courbe est aplatie, plus il faut prendre une abscisse t(1-) leve pour que lintgrale :
t(1 )
f(x)dx
ait une valeur donne. Lorsque = 0, la valeur de t est infinie pour toutes les valeurs de , sauf pour = 100 %.
Pierre Jost
15
Fig. 12 Fractiles de la loi de Student (dispersion bilatrale) en fonction de pour = 10%, 5% et 1% et 0,5% Remarque : Les tables de Student-Fisher sont prsentes de diffrentes manires : les tables de fractiles appeles encore "tables unilatrales" donnent t(1-, ) en fonction de 1- et de pour des valeurs < 0,5. Gnralement on pose P = 1 - (P > 0,5) et on donne la table en fonction de P. On trouve galement des tables donnant la valeur de t(P) de faon que :
t(P)
t(P)
f(x)dx = P = 1
Ces tables sont appeles "tables bilatrales de Student-Fisher" Intrt de la loi de Student On peut montrer que pour un chantillon de n observations indpendantes dune grandeur X distribue alatoirement suivant une loi Normale N(m,)
la grandeur
xm o s = s n
( xi m )
i
n1
Cette loi prsente donc un intrt considrable dans tous les tests statistiques relatifs aux moyennes de petits chantillons.
Pierre Jost
16 c) Loi de Fisher-Sndecor Expression de la densit de probabilit Cest la loi dune variable alatoire continue appele F dont la densit de probabilit dpend de deux paramtres 1 et 2 (nombre de degrs de libert) : Les reprsentations graphiques sont donnes la figure 13 en fonction de ses deux paramtres 1 et 2. La loi est dissymtrique et dautant plus aplatie que 1 et 2 sont petits.
Fig.13 Reprsentation graphique de la loi de Fisher-Snedecor Fractiles de la loi de Fisher Les tables donnent les valeurs des fractiles suprieurs F(1, 2, 1-) pour une valeur donne de , cest dire que les deux entres de la table sont 1 et 2. On prend gnralement = 0,05 ou = 0,01 et on a toujours P = 1 - Les fractiles infrieurs peuvent tre calculs sachant que F ( 2 , 1 , ) = lchange des degrs de libert 1, et 2) Comme pour toutes les lois statistiques, les fractiles deviennent infinis lorsque 1 et 2 sont nuls. Numriquement, les valeurs sont trs leves lorsque 2 < 3. Intrt de la loi de Fisher-Snedecor Par consquent, la loi de Fisher-Snedecor intervient dans tous les problmes qui font intervenir des comparaisons de variances, cest dire les problmes de prcision et de qualit des mesures physico-chimiques.
1 (attention F ( 1, 2 ,1 )
Pierre Jost
17 d) Loi du Khi-deux Densit de probabilit La densit de probabilit dpend dun paramtre appel "nombre de degrs de libert". La loi de Khi-deux, appele aussi loi de Pearson, a pour reprsentation graphique en fonction de , une famille de courbes reprsentes la figure 14 :
E(2) =
rapport aux autres lois.) Fractiles de la loi du 2
V(2) = 2
Elle est dissymtrique et dautant plus aplatie que est plus lev (volution contraire par
Comme pour la loi de Fisher, reprsente la surface de la courbe entre 2 et linfini. On reprsente les fractiles soit en fonction de P, soit en fonction de = 1 - P Intrt de la loi de Khi-deux Dans le cas dun chantillon de observations indpendantes dune grandeur X qui suit une loi Normale N(m, ), la somme : ( < 0,5 et P > 0,5).
La somme ci-dessus est dautant plus petite que les valeurs de xi sont proches de la moyenne. La loi du 2 est donc utilise dans les problmes dadquation, cest dire lorsquil faut prouver que des valeurs exprimentales xi sont proches de valeurs modles (xi (thoriques).
Pierre Jost
18 7. Calcul des lois de probabilits, Fonctions de rpartition et fractiles laide du logiciel EXCEL. Le logiciel EXCEL permet de calculer toutes les lois de probabilits classiques, leurs fonctions de rpartition et leurs fractiles. Toutefois les explications concernant ces lois sont souvent incompltes ou errones. On accde ces fonctions par : Insertion dune fonction/fonctions statistiques Fonctions Loi.Binomiale Paramtres k, n, p VRAI/FAUX Significations n : nombre de tirages, p : probabilit dun tirage Si VRAI on renvoie la probabilit cumule de 0 k, valeur P(X=k) comprise. Si FAUX, on renvoie la probabilit, P(X=k) Si VRAI on renvoie la probabilit cumule de 0 X (entier) , valeur P(X) comprise. Si FAUX, on renvoie la probabilit, P(X) Si VRAI on renvoie la fonction de rpartition pour labscisse X. Si FAUX, on renvoie lordonne de la loi Normale pour labscisse x Renvoie la fonction de rpartition de la loi Normale rduite pour labscisse z. Loi.Normale.Inverse Loi.Normale Standard.Inverse Loi.Student P, E(x), P X, , 1 ou 2 Fractile de la loi Normale desprance E et dcarttype pour la probabilit P Fractile de la loi Normale rduite pour la probabilit P Renvoie la probabilit cumule de X linfini pour une loi de Student degrs de libert. Si 1 : distribution unilatrale, si 2 : distribution bilatrale, la fonction renvoie la probabilit totale extrieure ATTENTION, cette fonction renvoie le fractile bilatral dune loi de Student degrs de libert, P tant la probabilit extrieure lintervalle X, +X . Pour le fractile unilatral introduire 2P Renvoie la probabilit cumule de X linfini pour une loi de Fisher 1, et 2 degrs de libert. Renvoie le fractile unilatral dune loi de Fisher 1, et 2 degrs de libert pour la probabilit 1-P. Renvoie la probabilit cumule de X linfini pour une loi de Pearson degrs de libert. Renvoie le fractile unilatral dune loi de Pearson degrs de libert pour la probabilit 1-P
Loi.Poisson
X, E(X), VRAI/FAUX
Loi.Normale
X, E(X), , VRAI/FAUX
Loi.Normale Standard
Loi.Student.Inverse
P,
X, 1, 2 P, 1, 2
, X
P,
Pierre Jost
19
Fractiles unilatraux,
Fractiles bilatraux
Allure gnrale des lois Binomiale, Poisson, Normale, Student, Fisher-Snedecor, Khi-deux Signification de: u(), u(1-), u(/2), u(1-/2) t(), t(1-), t(/2), t(1-/2) F(), F(1-), 2 (), 2(1-), 2 (/2), 2(1-/2) Savoir lire les tables statistiques
Pierre Jost