Beruflich Dokumente
Kultur Dokumente
d e
p o a ilit s r bb
e t P r ie1 at
aa ss n ly e
s a is iq e t t t us
Masse horaire
30 heures dont 20 heures de cours magistraux et 10 heures de travaux dirigs K. Florentin MONKOTAN Finances et Contrle de Gestion 3me anne de Licence Franais HECM site dAkpakpa L'objectif gnral du cours est de familiariser lapprenant avec loutil daide la prise de dcisions que sont la probabilit et la statistique. l'issue de cet enseignement, les tudiants devront tre en mesure d'utiliser les notions de base de la modlisation probabiliste et de travailler avec des variables alatoires; d'appliquer les techniques les plus frquemment utilises de la thorie des probabilits (probabilit et esprance conditionnelles, loi normale, de Poisson et exponentielle) dans des domaines divers, en particulier celui qui est le leur propre. Ltudiant devra aussi tre capable dexplorer des ensembles de donnes riches en structure par les mthodes de l'infrence statistique; d'appliquer les techniques de calcul d'intervalles de confiance et de tests d'hypothses. Premire partie: Probabilits - Notions de base: probabilit, probabilit conditionnelle, probabilit compose et probabilit totale, thorme de Bayes, indpendance. Variables alatoires, ingalits de Markov et chebyschev, fonctions dune variable alatoire, indpendance. Deuxime partie: Statistique infrentielle Notions de bases : chantillonnage, type dchantillon, estimation de paramtres, tests
d'hypothses proportions. relatifs aux moyennes, variance et
Enseignant Cycle et anne dtude Langue denseignement Lieu du cours Comptences acqurir
Thmes abords
La statistique est un ensemble de mthodes scientifiques bases sur le recueil, lorganisation, la prsentation de donnes, ainsi que sur la modlisation et la construction de rsums numriques destines faciliter la prise de dcision. On retiendra deux formes principales de statistiques : la statistique descriptive et la statistique infrentielle. La statistique descriptive permet de dcrire les donnes observes et de tirer des conclusions valables uniquement pour cet ensemble tudi. Ainsi, les prises de dcisions sont uniquement relatives aux donnes interprtes ( la description que lon a pu en faire !). A contrario, la statistique infrentielle synthtise les informations sur un petit nombre de donnes et par des mthodes appropries permet de tirer des conclusions, donc danalyser et de prendre des dcisions applicables sur un plus grand effectif, en gnral la population.
Activit 0 : BelBille Sarl est une entreprise spcialise dans la production de billes de bois. Cette entreprise emploie 10 bucherons qui travaillent 3 jours par semaine et produisent 125 billes en moyenne par jour. Suite des ngociations, BelBille a sign un contrat pour la fourniture de 2.350 billes par mois. Peut-elle dans ses conditions actuelles honorer ses engagements ? Quelles stratgies peut-elle adopter, sinon ? Solution 0 :
Peut-on appliquer ces dernires dcisions toutes les entreprises du secteur du bois ? toutes les entreprises, quelle que soit leur secteur dactivit ? Lactivit 0 porte uniquement sur des donnes relatives une entreprise. Les dcisions prendre alors dans un tel contexte seront prcisment relatives uniquement cette entreprise au cours de cette priode ! Il serait hasardeux en effet de vouloir rendre ces dcisions universelles cest--dire applicables toutes les entreprises du secteur du bois, encore plus toutes les entreprises. Une telle analyse dont les rsultats sont uniquement spcifiques aux individus tudis relve du domaine de la statistique descriptive. On entrerait dans le domaine de la statistique infrentielle lorsque les rsultats des analyses et/ou les dcisions issues de ces analyses impliqueront dautres entreprises du mme secteur, voire toutes les entreprises de ce secteur dactivits. Aprs avoir tudi la statistique descriptive au cours des deux
prcdentes annes, il importe prsent de pouvoir faire des infrences. En effet, il nest pas toujours ais, ni commode faire une tude sur toute une population ; bien souvent cela se rvle mme trs onreux. De nos jours, la statistique est utile toutes les disciplines. Cest pourquoi il est important que nous ltudions et en comprenions quelques notions fondamentales. Le prsent cours aura deux parties essentielles : la probabilit et la statistique infrentielle. Ces deux parties seront subdivises en deux chapitres chacun donnant en dfinitive quatre (04) chapitres : Thories de probabilit, variables alatoires relles, introduction lchantillonnage et estimations de paramtres. Compte tenu de la masse horaire alloue et du contenu du programme, lapprenant est invit se maintenir dans un esprit dalerte, dveil et de
travail constants et rguliers. Il devra en particulier sassurer de parcourir le cours avant son excution, ce qui lui facilitera la comprhension. Divers documents ont t utiles pour composer ce cours. Cest le lieu de remercier tous ses merveilleux enseignants qui ont par gnrosit, permis de consulter et/ou dutiliser leurs documents sans obligation dachat. Malgr toutes ces contributions, lon ne saurait qualifier ce document de parfait ; non, loin de l. Aussi, toutes remarques ou suggestions visant son amlioration sont bienvenues car tous ses dfauts ne sont imputables qu lauteur.
Chapit re 1
Thories de probabilit
cet individu est bon jusqu une limite donne (on parle de seuil en statistique) dans cette matire ; nest-ce pas ? Il existe plusieurs on parle manires de de dfinir une probabilit. ou Principalement, probabilits inductives
exprimentales et de probabilits dductives ou thoriques. On peut les dfinir comme suit : Probabilit exprimentale ou inductive : la probabilit est dduite de toute la population concerne. Par exemple, si sur une population dun million de naissances, on constate 530000 garons et 470000 filles, on dit que P[garon] = 0.53 Probabilit thorique ou dductive : cette probabilit est connue grce `a letude du phnomne sous-jacent sans exprimentation. Il sagit donc dune connaissance a priori par opposition `a la dfinition prcdente qui faisait plutt rfrence `a une notion de probabilit a posteriori. Par exemple, dans le cas classique du de parfait, on peut dire, sans avoir a jeter un de, que P [obtenir un 4] = 1/6. Comme il nest pas toujours possible de dterminer des probabilits a priori, on est souvent amen raliser des expriences. Il faut donc pouvoir passer de la premire la deuxime solution. Ce passage est suppose possible en terme de limite (i.e. avec une population dont la taille tend vers la taille de la population relle). L'analyse combinatoire est le dnombrement des dispositions que l'on peut former l'aide des lments d'un ensemble fini.
1.1. L'ensemble
tudi
lments
discernables
et
lments indiscernables
Reprsentons les lments d'un ensemble par e1; e2; ; en. L'ensemble comporte n lments, i.e. card() = n. Si ei et ej sont quivalents, on dit qu'ils sont indiscernables. Si ei et ej sont diffrents, on dit qu'ils sont discernables. L'ensemble de n lments peut tre constitu d'lments discernables 2 2. Ex. {a; b; c; d ; e}. Tous les lments de peuvent aussi tre tous indiscernables. Ex. {a; a; a; a; a}.
Les lments d'un ensemble peuvent tre discernables ou indiscernables. Ex. = {a; b; a; a; c; d; d; c; a}, card() = 9.
Exemple 1. Soit un ensemble de 4 cartes {9p; 9t; 7ca; 7co}. La hauteur 9 se rpte 2 fois, le 9p se trouve en premire position. on retiendra les dfinitions suivantes : Disposition sans rptition. C'est une disposition o un lment peut apparatre 0 ou 1 fois. Disposition avec rptition. Un lment peut figurer plus d'une fois. Disposition ordonne. L'ordre d'obtention d'un lment est important. Ex. les lments constituant la plaque minralogique d'un vhicule. Disposition non-ordonne. L'ordre d'obtention d'un lment n'est pas important, on n'en tient pas compte dans la caractrisation de la disposition. Ex. Les numros issus d'un tirage du loto. Exemple 2. Prenons un jeu de d 6 faces (lments discernables) = {1; 2; 3; 4; 5; 6}. Aprs 3 jets, nous obtenons A = (2; 5; 1) ; nous ritrons les jets et nous obtenons B = (5; 1; 2). A et B sont quivalents si nous considrons que les dispositions sont non-ordonnes. En revanche, ils ne sont pas quivalents si nous sommes dans le cadre d'une disposition ordonne.
I. Formules (rappels)
classiques
d'analyse
combinatoire
On appelle une paire une disposition de 2 lments dont le 1er appartient A, et le 2nd B. La paire est une disposition ordonne, mais les 2 lments sont de natures diffrentes. Pour dcrire l'ensemble des paires possibles, il suffit de composer chaque lment de A avec chaque lment de B. Il y a donc M = * paires possibles.
Activit 1 :
a) Combien peut-on former de mots de 2 lettres en franais (quils aient un sens ou non) ? b) Combien y a-t-il de mots de 2 lettres forms d'une consonne et d'une voyelle (sans tenir compte de l'ordre) ?
Solution 1 :
ensembles
A = {a1; a2; ; a} B = {b1; b2; ; b} C = {c1; c2; ; b} S = {s1; s2; ; s} On appelle multiplets une disposition ordonne de lments dont le 1er est un lment de A, le second un lment de B,..., et le me un lment de S. Les multiplets sont de la forme (ai1 ; bi2 ; ci3 ; ; si).
Un multiplet de lments peut tre considr comme une paire o : le 1er lment est constitu des (-1) lments, et le second lment, un lment de S. (a, b, c, , s) = [(a; b; c; ); s] Pour obtenir le nombre de multiplets, nous pouvons raisonner par rcurrence.
M = M-1 * = M-2 * * = = * * * *
Activit 2 :
Combien de codes composs de 4 signes peut-on former en sachant que les 2 premiers sont des lettres et les deux derniers des chiffres ? Solution 2 :
Pour mieux apprhender les diffrentes possibilits qui conduisent un tel rsultat, on utilise souvent le diagramme arborescent. Supposons, pour matrialiser que les chemises sont identifies par c1, c2, c3 et c4 alors que
les pantalons sont p1, p2 et p3. Les combinaisons possibles sont les suivantes : Diagramme arborescent
Lorsque r=n, i.e. que ce sont les n objets qui sont arrangs ou permuts par groupes de n. les groupes seront donc tous identiques au niveau des objets qui les composent mais lordre de ces objets sera diffrent dun groupe lautre. On ralise alors des permutations de ces n objets. Cette permutation est appele factorielle n et lon note n!
n! =i=1ni Pnn=n!=nn-1n-2n-r+132(1)
Cest--dire
Ainsi : 6 ! = 6*5*4*3*2*1 soit 6 !=720 La formule de Stirling permet de construire une estimation de la factorielle trs valable pour n 10 : n !nne-n*2n Ainsi utilisant cette notion de factorielle, lon peut rcrire la permutation de n objets pris r r comme il suit :
Pnr=n!n-r!
Si lensemble est constitu de n objets parmi lesquels n1 objets sont identiques (donc non distinguables entre eux), n2 objets sont identiques (donc non distinguables entre eux mais distinguables des autres objets), ainsi de suite jusqu nk objets identiques entre eux, alors le nombre de permutations qui nous apparaitront diffrentes sera :
Pnn1,n2,,nk=n!n1! n2! nk!
Ainsi par exemple, si nous avions dterminer le nombre de mots (qui ait un sens ou nom) possibles que lon peut crire avec les lettres du mot MISSISSIPPI, on aurait :
P111,4,4,2=11!1!4!4!2! =34 650
3.3. Combinaisons
Pour les permutations et les arrangements, nous sommes intresss par lordre. Ainsi, abcd est absolument diffrent de cbad qui est lui-mme diffrent de cadbetc. Mais dans bien des cas, lordre nous importe peu. Par exemple, lorsque lon joue aux cartes et que lon reoit une main, lordre darrive des cartes qui composent cette main nest pas du tout important. Ce qui importe en ce moment, cest plutt la main elle-mme, i.e. les cartes qui nous ont t distribues ! Pour de telles situations, abcd est absolument gal cbad ou cadb ou encore toute autre assemblage de ces quatre lettres. On parle alors de combinaisons de n objets r r et on note :
Cnr=n!r!n-r!
Cnr=Pnrr!
Activit 3 :
On prend un jeu de 52 cartes et on tire au hasard 5 cartes. 1) Combien de mains diffrentes peut-on obtenir ? 2) Combien de mains diffrentes contenant 1 As peut-on obtenir ? 3) Combien de mains diffrentes contenant 3 Rois peut-on obtenir ? 4) Combien de mains composes de cartes de couleurs diffrentes peut-
on obtenir ? 5) Combien de mains composes des valeurs Roi, Valet, 5, As et 9 peuton obtenir ? Solution 3 :
Activit 4 : Dans sa boutique de prt--porter, Flicit a reu une livraison de 5 corsages denfants identiques, 3 chaussures denfants identiques et 11 jupes identiques et 4 pantalons identiques pour enfants. 1) De combien de manires diffrentes peut-elle habiller ses mannequins avec : a. Un pantalon, un corsage et une chaussure ? b. Une jupe, un corsage et une chaussure ? 2) Reprenez les questions prcdentes en sachant que les jupes sont de couleurs bleue (3), rose (5) et brune (3) ; tandis que les pantalons sont de couleurs noire (1) et grise (3). 3) Flicit peut-elle changer de modles tous les jours pour attirer les clients ? Justifier votre rponse !
Solution 4 :
I. Calcul de probabilits
4.1. Le concept de probabilit
Chaque fois que le hasard intervient dans une exprience, il y a toujours une incertitude en ce qui concerne la ralisation dun vnement particulier. Il est alors commode daffecter un chiffre compris entre 0 et 1 la chance ou la probabilit qua cet vnement de se raliser. Ainsi, si nous sommes absolument srs que cet vnement va se raliser, nous disons que sa probabilit est de 100% ou 1. Au contraire, si lvnement en question na aucune chance de se raliser on dit que sa probabilit est 0. Une probabilit peut sestimer de 2 manires diffrentes : 4.1.1.
Si un vnement se produit de h manires diffrentes sur un nombre total n de manires possibles, toutes quiprobables, alors la probabilit de cet vnement est h/n.
Par exemple, si nous prenons une pice non truque, parfaite et que nous la jetons en lair, la probabilit dobtenir Pile ou face est la mme : 1/2. De mme, si nous 4.1.2.
Une exprience est rpte n fois (n est suffisamment grand) et lon constate quun vnement se ralise h fois. Alors, on en dduit que la probabilit de ralisation de cet vnement est h/n. cette probabilit est dite probabilit empirique. Par exemple, si dans une brasserie lon constate que sur 200.000 bouteilles de boisson, il y a 5 bouteilles mal remplies, la probabilit de dfaut de remplissage est 5/200.000.
On note lunivers des possibles not lensemble des rsultats possibles de lexprience. dpend de lexploitation que lon souhaite faire des rsultats.
Par exemples, = {(1, 1), (1, 2), (1, 3), . . .}, si lon note simplement le chiffre apparu sur les ds lun aprs lautre ; = {2, 3, . . . 12}, si lon note le total des chiffres apparus sur les 2 ds.
On note vnement A une proposition relative au rsultat de lexprience ; i.e. une caractristique ou un aspect du rsultat sur lequel lon souhaite se pencher.
Par exemples, la somme des points est suprieur 10, tirer une paire de chiffres identiques, etc. sont des vnements de lexprience du lancer de 2 ds.
si
est
compos
de
vnements
cest
lensemble
sur
lequel
lon
mne
I. Probabilits indpendants
5.1. Probabilits composes
conditionnelles
conditionnelles
et
et
vnements
probabilits
La probabilit conditionnelle dun vnement A sachant un vnement B, not PAB est la probabilit que A se ralise, sous la condition que B est dj ralis. En dautres termes, la probabilit conditionnelle dun vnement A sachant un
vnement B est dnote la probabilit de A dans le cas o B est ralis. On lobtient par : PAB=PABPB De mme on aura PBA=PABPA composes suivantes : PAB=PAB*PB=PBA*P(A) Remarque : PAB=PBA mais PABPBA. et par consquent, partant des deux formules on obtient la formule de probabilits
vnements
et
soient
conditionnellement indpendants sachant un troisime (C). Cest--dire que A et B ne sont indpendants que dans la mesure o C se ralise. Si A et B sont donc conditionnellement indpendants, sachant C alors :
PABC= PAC* PBC P(A|BC) = P(A|C)
Activit 5 :
On considre le jeu de 52 cartes de lactivit 3. On tire une carte au hasard. 1) Quelle est la probabilit que la carte tire soit Roi sachant quelle est un cur ? 2) Quelle est la probabilit que la carte tire porte une valeur infrieure ou gale 10 sachant que cest un pique ? 3) Quelle est la probabilit que la carte tire soit un J sachant quelle
a une valeur suprieure 10 ? 4) Amusez-vous calculer P(B|A) pour chacune des probabilits ciavant demandes. Note : on supposera que les valeurs J, K et Q sont suprieures 10. Solution 5 :
I. Thorme de Bayes
Soit un vnement A qui peut dpendre de N causes Ci diffrentes et incompatibles deux deux (on ne peut avoir deux causes ralises simultanment). Etant donn la ralisation de lvnement A, quelle est la probabilit que ce soit Ci qui en soit la cause ? On peut crire que A = i=1NACi car {C1, C2, , Cn} constitue un systme fini dvnements incompatibles 2 2 : on dit que cest un systme complet. Daprs le thorme des probabilits totales, on a :
PA=iP(ACi)
Bayes :
PCiA=PCi*PACik=1NPCk*PACk
Ce thorme permet dvaluer les probabilits des diffrents vnements C1, C2, , Ck qui peuvent causer la ralisation de lvnement A. Cest pourquoi le thorme de Bayes est aussi appel thorme sur la probabilit des causes. Remarque : 2 vnements A et B sont dits incompatibles sils ne peuvent se raliser simultanment. Par exemple, les vnements prendre une douche et shabiller sont incompatibles dans la mesure o ils ne peuvent (a priori !) se raliser simultanment.
Activit 6 :
Dans son entreprise, Christelle a 2 employs Alain et Pierre qui font par semaine 100 et 200 ventes en moyenne. Elle a constat que dans 5% des cas, Alain perd de largent tandis que Pierre en perd dans 6% des cas. 1) Quelle est la probabilit quune perte soit le fait dAlain ? 2) Quelle est la probabilit que 2 pertes successives soient le fait de Pierre ?
Solution 6 :
Chapit re 2
I.
Supposons que nous affections une valeur chaque point de lespace dchantillonnage. Nous aurons, alors, dfini une fonction sur cet espace. Cette fonction est appele variable alatoire (note v.a.) ou variable stochastique ou encore fonction alatoire ou fonction stochastique. Elle est gnralement dsigne par une lettre majuscule X ou Y. une variable alatoire possde en gnral, une signification donne : physique, gomtrique ou autre. Considrons lexprience suivante : On lance 3 fois une pice de monnaie (qui prend deux valeurs possibles "pile" ou "face", comme on le sait, videmment !). L'ensemble fondamental est = (P; F); (P; F); (P; F) Notons X le nombre de "face" apparue au bout des trois jets. Les valeurs possibles de X sont DX=0;1;2;3. X est une application de 0;1;2;3 vers lintervalle [0, 1] qui est celui des valeurs possibles que peut prendre la probabilit doccurrence de chaque lment de DX. X est donc une application de dans DX. De manire gnrale, X est une application dfinie :
X : R
X s'appelle une variable alatoire, on s'intressera aux valeurs prises par X (X = x), et plus particulirement la probabilit d'obtenir ces valeurs P(X = x). Soit donc une preuve ei et l'ensemble fondamental des ventualits. L'application : R fait correspondre tout lment de un nombre rel ei,
eiX(ei)R
X dsigne la variable alatoire ; x dsigne la valeur possible de la variable alatoire ; le domaine de dfinition de X est Dx= x1, x2 ,, xn
II.
On distingue les variables alatoires discrtes et les variables alatoires continues. Une variable alatoire est dite discrte lorsque les valeurs xi qu'elle est susceptible de prendre sont en nombre fini, ou encore forms exclusivement de nombres entiers. Par exemples, le nombre de "face" apparaissant aprs 10 jets d'une pice ; le nombre de vhicules passant un carrefour dans une journe ; le nombre de clients entrant dans un magasin le samedi. Une variable alatoire est dite continue si elle peut prendre toutes les valeurs d'un intervalle. Par exemples, lintervalle de temps entre 2 passages de train ; la longueur de cheveux ; la dure de vie en secondes d'une pice mcanique. Cest dire donc quune v.a. continue peut prendre un nombre infini, non dnombrable de valeurs. Remarque (Distinction variable discrte et continue) : Parfois, la
distinction entre une v.a. discrte et une v.a. continue est purement formelle. Le type de la variable alatoire dpend du degr de prcision que l'on dsire apprhender. Par exemple, on s'intresse l'esprance de vie d'un chat, si on travaille sur le nombre d'annes, le nombre de valeurs possible est fini ; si on travaille en secondes, ce sera diffrent. La situation sera un peu plus claire lorsque l'on abordera la question de la probabilit ponctuelle. En effet, dans le cas d'une variable continue, la probabilit ponctuelle est par dfinition, nulle.
III.
Probabilit probabilit
dune
variable
alatoire,
loi
de
Une variable alatoire est totalement dfinie par sa loi de probabilit. Cette dernire est caractrise par :
L'ensemble des valeurs qu'elle peut prendre (son domaine de
dfinition DX) ;
Soit X une variable alatoire dfinie par une application de dans , pouvant prendre des valeurs dans Dx= x1, x2 ,, xn. Par dfinition, la probabilit pour que la variable X soit gale x est la probabilit des lments de ayant pour image la valeur x dans l'application. Cette probabilit mesure le degr de crdibilit de ralisation de l'vnement.
P(X = xi) est rgie par les 3 axiomes de Kolmogorov :
1. P(X = xi) 0 2. P(X = Dx) = 1 3. Si les xi sont incompatibles alors, P[(X = xi)(X = xj )]=P(X = xi)+P(X = xj).
Pour les valeurs de x=xk, f(x)=0 Exemple 1 : On lance une pice de monnaie une fois, l'ensemble fondamental est = P,F. Soit X le nombre d'apparition de "pile", DX = 0,1 et on peut calculer facilement P(X = x), PX = 0=12 et graphe des probabilits. Graphe de probabilits
PX = 1=12
premire par rapport x de la fonction de rpartition. Cette drive prend le nom de fonction de densit, note fx=dFxdx . Elle est donc quivalente P(X = x) dans le cas des variables discrtes.
Fonction densit de probabilit dune v.a. continue
Cette fonction est dfinie telle que : fx0 les champs/intervalles possibles de la variables-+fxdx=1 lesprobabilits de chacun des champs/intervalles possibles Ainsi, la probabilit pour que X soit comprise entre les valeurs a et b est donne par :
Pa<X<b=abfxdx or Pa<X<b=PX<b-P(X<a)
surface
comprise entre a et b.
Cette fonction satisfait aussi aux 3 axiomes de Kolmogorov ci-avant mentionns. Une telle fonction est appele la fonction densit de probabilit ou plus simplement fonction densit dune v.a. continue et nest rien dautre que la fonction de probabilit ou la distribution de probabilit de la v.a. continue. Et, comme soulign ci-avant, il nest pas possible, dans le cas dune v.a. continue de dterminer la probabilit que X soit gale une valeur donne avec prcision. Cest pourquoi, on retiendra :
Pa<X<b=PaX<b=PaXb=P(a<Xb)
I.
La fonction de rpartition (ou de distribution) n'est autre que le cumul des probabilits individuelles. La probabilit pour que la variable alatoire X prenne une valeur infrieure x est une fonction F(x) que l'on
appelle fonction de rpartition. Cest pourquoi on lappelle fonction cumulative de distribution, gnralement identifie par Fx=P(X<x).
probabilits) ou simplement la fonction de distribution ( des probabilits). On graphiquement fonction l'aide de d'une reprsente cette courbe rpartition
cumulative en escalier (voir graphique ci-contre). Courbe cumulative en escalier reprsentative de la fonction de distribution dune v.a. discrte
La fonction de rpartition F(x) est une fonction continue, monotone et croissante dans le domaine [0; 1]. On note deux cas extrmes :
F-=limx-Fx=0 F+=limx+Fx=1
Ces deux cas rappellent bien entendu les axiomes de positivit et de certitude. La fonction de rpartition Fonction de rpartition dune v.a.
est reprsente
continue
graphiquement courbe
cumulative
graphique ci-contre).
Remarque : Souvenons-nous que la fonction de rpartition est une intgrale de la fonction de densit. Il est galement possible d'utiliser cette dernire pour reprsenter graphiquement la fonction de rpartition, il s'agit d'une surface dans ce cas.
I.
On appelle quantile ou fractile d'ordre (01) d'une variable alatoire X dont la fonction de rpartition est F (x), la valeur x telle que F (x) = . x s'appelle quantile d'ordre . Remarque : Lorsque X est une variable alatoire discrte, F (x) = veut dire P (X < x) = . Il existe diffrentes sortes de fractiles. Nous prsenterons ici la mdiane, les quartiles et les dciles. La mdiane
La mdiane, note Me est le quantile d'ordre =12 . Me est dfinie parMefxdx=0,5. En d'autres termes la mdiane partage en deux parties gales la population, c'est une caractristique de tendance centrale. Les quartiles (respectivement i = 1; 2; 3) correspondent aux
quantiles d'ordre ( = 0,25; 0,5; 0,75). Chacun des Qi est donc obtenu par : Q1: -Q1fxdx=0,25. Q2:-Q2fxdx=0,5. Q3:-Q3fxdx=0,75. On aura bien videmment remarqu que Q2 = Me.
Les dciles
Le k-me dcile (k=1;;9) est le quantile d'ordre k10 . En particulier, le 5me dcile correspond la mdiane. Ainsi, pour obtenir chacun des dciles, il sagira de calculer : Dk:-Dkfxdx=k10. 5.1.1. probable) d'une Le mode variable alatoire, la valeur Mo pour laquelle
On appelle mode (cest--dire la valeur dominante ou la valeur la plus l'histogramme de frquence prsente son maximum. Lorsque la v.a. X est continue, avec une fonction de densit au moins deux fois drivable, le mode Mo satisfait simultanment aux deux conditions suivantes : f(Mo) = 0 et f(Mo)<0) La seconde condition signifie en fait que la concavit est tourne vers le bas. Pour les v.a. discrtes, Mo est la valeur de X associe la plus grande probabilit, d'o l'appellation valeur la plus probable. 5.1.2. Esprance mathmatique
Soit (X) une fonction dfinie pour tout X appartenant au domaine de dfinition DX. On appelle esprance mathmatique de (X), que l'on note E[(X)] l'expression :
EX=xfxdx=xdFx Et puisque nous notons X, notre v.a., ((x) est alors gale X et par consquent,) on a E(X) qui est lesprance mathmatique de la v.a. X. E(X) est alors donne par : EX=xfxdx Ces sommes sont calcules sur lensemble de dfinition. L'esprance mathmatique existe si l'intgrale est convergente. Elle est indpendante de x. Il faut prciser que cette formule est celle caractristique dune v.a. continue. Pour les v.a. discrtes, on aura plutt : EX=DXxPX=x Caractristiques dune esprance mathmatique : a constante, Ea=a. Cela signifie que lesprance mathmatique dune constante est gale la constante elle-mme. De cette axiome on dduit : EE[X]=E[X] EiaiXi+b=iaiEXi+bi de cela on tire : EaX+bY=aEX+bE[Y] X,Y 2 v.a., on a EXY=EX*EY+cov(X,Y), cov(X,Y) est la covariance des v.a. X et Y. Si X et Y sont indpendantes, alors covX,Y=0 et donc EXY=EX*EY
5.1.2.
Un moment centr dordre r se dfinit comme suit : rX=EE-EXr Pour une v.a. discrte on aura rX=x=0+x-EXrpx avec px=PX=x Pour une v.a. continue : rX=(x-EX)rfxdx, sur lensemble de dfinition Dx. Remarques : (i) En statistique descriptive, ce moment centr est obtenu avec la formule : rX=i=0nfi(xi-x)r o x est la moyenne calcule et fi est la frquence observe pour xi {xi reprsente la modalit (pour les variables quantitatives discrtes) ou le centre de classe (pour les variables quantitatives continues}. (ii) pour r=0, on a 0X=EX-EX0=E1=1 Pour r=1, 1X=E(X-EX)1=EX-EEX=EX-EX=0 Pour r=2, 2X=E(X-EX)2=V(X), la variance de X, discute ci-aprs. 5.1.3.
V(X)=E(X-EX)2
La variance et lcart-type
On appelle variance de X note V(X) le moment centr dordre 2 de X. La variance mesure la dispersion autour de la moyenne. Elle est utile pour calculer lcart-type qui est donn par : X=V(X) Remarque : il est ais de dmontr que VX=EX2-EX2; ceci est la Formule de Koenig. Caractristiques de la variance :
(i) (ii) V(a)=0 V(aX)=a2*V(X)
sont indpendantes
(iv) VXY=VX*VY+EX2*VY+EY2*V(X). On note en particulier que si les v.a.
Pour une v.a. discrte : covX,Y=xyx-EXy-EY.pxy avec pxy=P(X=x;Y=y), la probabilit jointe de x et y. Pour une v.a. continue, f(x,y) tant la fonction de densit jointe, on a :
On retiendra que lorsque 2 v.a. X et Y sont indpendantes, covX,Y=0. 5.1.2. Le coefficient de corrlation
Le coefficient de corrlation est utilis pour apprcier lexistence dune relation (le plus souvent, linaire) entre les variables. Cette relation, si elle existe, nest pas synonyme de causalit entre les 2 variables tudies. Il ne faut donc pas confondre corrlation et causalit ! Le coefficient de corrlation est obtenu suivant la formule :
XY=covX,YX*(Y).
Les
figures
ci-aprs
permettent
5.2.2.
Le coefficient daplatissement
Le coefficient daplatissement vise situer la hauteur de la courbe de densit dune loi par rapport la rfrence que constitue la loi normale ou loi de Laplacegauss. Cest aussi un indicateur sans unit et qui ne varie pas avec les changements dchelle ou de dimension. Il est donn par : 2=44-3 Les graphes ci-aprs permettent de linterprter : Formes dune v.a. selon les diffrentes valeurs du coefficient daplatissement