Sie sind auf Seite 1von 30

C lc l a u

d e

p o a ilit s r bb

e t P r ie1 at

aa ss n ly e

s a is iq e t t t us

Masse horaire

30 heures dont 20 heures de cours magistraux et 10 heures de travaux dirigs K. Florentin MONKOTAN Finances et Contrle de Gestion 3me anne de Licence Franais HECM site dAkpakpa L'objectif gnral du cours est de familiariser lapprenant avec loutil daide la prise de dcisions que sont la probabilit et la statistique. l'issue de cet enseignement, les tudiants devront tre en mesure d'utiliser les notions de base de la modlisation probabiliste et de travailler avec des variables alatoires; d'appliquer les techniques les plus frquemment utilises de la thorie des probabilits (probabilit et esprance conditionnelles, loi normale, de Poisson et exponentielle) dans des domaines divers, en particulier celui qui est le leur propre. Ltudiant devra aussi tre capable dexplorer des ensembles de donnes riches en structure par les mthodes de l'infrence statistique; d'appliquer les techniques de calcul d'intervalles de confiance et de tests d'hypothses. Premire partie: Probabilits - Notions de base: probabilit, probabilit conditionnelle, probabilit compose et probabilit totale, thorme de Bayes, indpendance. Variables alatoires, ingalits de Markov et chebyschev, fonctions dune variable alatoire, indpendance. Deuxime partie: Statistique infrentielle Notions de bases : chantillonnage, type dchantillon, estimation de paramtres, tests
d'hypothses proportions. relatifs aux moyennes, variance et

Enseignant Cycle et anne dtude Langue denseignement Lieu du cours Comptences acqurir

Thmes abords

La statistique est un ensemble de mthodes scientifiques bases sur le recueil, lorganisation, la prsentation de donnes, ainsi que sur la modlisation et la construction de rsums numriques destines faciliter la prise de dcision. On retiendra deux formes principales de statistiques : la statistique descriptive et la statistique infrentielle. La statistique descriptive permet de dcrire les donnes observes et de tirer des conclusions valables uniquement pour cet ensemble tudi. Ainsi, les prises de dcisions sont uniquement relatives aux donnes interprtes ( la description que lon a pu en faire !). A contrario, la statistique infrentielle synthtise les informations sur un petit nombre de donnes et par des mthodes appropries permet de tirer des conclusions, donc danalyser et de prendre des dcisions applicables sur un plus grand effectif, en gnral la population.
Activit 0 : BelBille Sarl est une entreprise spcialise dans la production de billes de bois. Cette entreprise emploie 10 bucherons qui travaillent 3 jours par semaine et produisent 125 billes en moyenne par jour. Suite des ngociations, BelBille a sign un contrat pour la fourniture de 2.350 billes par mois. Peut-elle dans ses conditions actuelles honorer ses engagements ? Quelles stratgies peut-elle adopter, sinon ? Solution 0 :

Peut-on appliquer ces dernires dcisions toutes les entreprises du secteur du bois ? toutes les entreprises, quelle que soit leur secteur dactivit ? Lactivit 0 porte uniquement sur des donnes relatives une entreprise. Les dcisions prendre alors dans un tel contexte seront prcisment relatives uniquement cette entreprise au cours de cette priode ! Il serait hasardeux en effet de vouloir rendre ces dcisions universelles cest--dire applicables toutes les entreprises du secteur du bois, encore plus toutes les entreprises. Une telle analyse dont les rsultats sont uniquement spcifiques aux individus tudis relve du domaine de la statistique descriptive. On entrerait dans le domaine de la statistique infrentielle lorsque les rsultats des analyses et/ou les dcisions issues de ces analyses impliqueront dautres entreprises du mme secteur, voire toutes les entreprises de ce secteur dactivits. Aprs avoir tudi la statistique descriptive au cours des deux

prcdentes annes, il importe prsent de pouvoir faire des infrences. En effet, il nest pas toujours ais, ni commode faire une tude sur toute une population ; bien souvent cela se rvle mme trs onreux. De nos jours, la statistique est utile toutes les disciplines. Cest pourquoi il est important que nous ltudions et en comprenions quelques notions fondamentales. Le prsent cours aura deux parties essentielles : la probabilit et la statistique infrentielle. Ces deux parties seront subdivises en deux chapitres chacun donnant en dfinitive quatre (04) chapitres : Thories de probabilit, variables alatoires relles, introduction lchantillonnage et estimations de paramtres. Compte tenu de la masse horaire alloue et du contenu du programme, lapprenant est invit se maintenir dans un esprit dalerte, dveil et de

travail constants et rguliers. Il devra en particulier sassurer de parcourir le cours avant son excution, ce qui lui facilitera la comprhension. Divers documents ont t utiles pour composer ce cours. Cest le lieu de remercier tous ses merveilleux enseignants qui ont par gnrosit, permis de consulter et/ou dutiliser leurs documents sans obligation dachat. Malgr toutes ces contributions, lon ne saurait qualifier ce document de parfait ; non, loin de l. Aussi, toutes remarques ou suggestions visant son amlioration sont bienvenues car tous ses dfauts ne sont imputables qu lauteur.

Chapit re 1

Thories de probabilit

I. Dfinitions et rappels : le basique


La thorie des probabilits fournit des modles mathmatiques permettant letude dexpriences dont le rsultat ne peut tre prvu avec une totale certitude. Ainsi, si lon jette 600 fois un d parfait, non pip, on peut sattendre ce que le chiffre 2 apparaisse environ 100 fois, tout comme le chiffre 5 ou un autre des 6 chiffres marqus sur chaque face du d. De mme, si lon installe dans un htel un nombre plus ou moins important de climatiseurs de mme marque et modle, lon peut constater que leur dure de vie restera dans un intervalle que lon peut dterminer par avance, en ayant les informations adquates. La thorie des probabilits permet de donner un sens prcis ces considrations un peu vagues. La statistique permet de confronter les modles probabilistes avec la ralit observe afin de les valider ou de les invalider. Par exemple si quelquun a 90 bonnes rponses sur 100 au questionnaire, a-t-on vraiment raison de le qualifier de bon dans cette matire ? En dautres termes, peut-on valablement dire que la chance ou le hasard nont rien y voir ? Seule la rptition, un grand nombre de fois de ce rsultat pour cette matire peut permettre de dduire de ce que

cet individu est bon jusqu une limite donne (on parle de seuil en statistique) dans cette matire ; nest-ce pas ? Il existe plusieurs on parle manires de de dfinir une probabilit. ou Principalement, probabilits inductives

exprimentales et de probabilits dductives ou thoriques. On peut les dfinir comme suit : Probabilit exprimentale ou inductive : la probabilit est dduite de toute la population concerne. Par exemple, si sur une population dun million de naissances, on constate 530000 garons et 470000 filles, on dit que P[garon] = 0.53 Probabilit thorique ou dductive : cette probabilit est connue grce `a letude du phnomne sous-jacent sans exprimentation. Il sagit donc dune connaissance a priori par opposition `a la dfinition prcdente qui faisait plutt rfrence `a une notion de probabilit a posteriori. Par exemple, dans le cas classique du de parfait, on peut dire, sans avoir a jeter un de, que P [obtenir un 4] = 1/6. Comme il nest pas toujours possible de dterminer des probabilits a priori, on est souvent amen raliser des expriences. Il faut donc pouvoir passer de la premire la deuxime solution. Ce passage est suppose possible en terme de limite (i.e. avec une population dont la taille tend vers la taille de la population relle). L'analyse combinatoire est le dnombrement des dispositions que l'on peut former l'aide des lments d'un ensemble fini.

1.1. L'ensemble

tudi

lments

discernables

et

lments indiscernables
Reprsentons les lments d'un ensemble par e1; e2; ; en. L'ensemble comporte n lments, i.e. card() = n. Si ei et ej sont quivalents, on dit qu'ils sont indiscernables. Si ei et ej sont diffrents, on dit qu'ils sont discernables. L'ensemble de n lments peut tre constitu d'lments discernables 2 2. Ex. {a; b; c; d ; e}. Tous les lments de peuvent aussi tre tous indiscernables. Ex. {a; a; a; a; a}.

Les lments d'un ensemble peuvent tre discernables ou indiscernables. Ex. = {a; b; a; a; c; d; d; c; a}, card() = 9.

1.2. Les diffrentes dispositions


Une disposition est l'ensemble form d'lments choisis parmi les n lments de l'ensemble tudi. Un lment figurant dans une disposition est caractris par : le nombre de fois o il figure dans l'ensemble ; sa place dans la disposition.

Exemple 1. Soit un ensemble de 4 cartes {9p; 9t; 7ca; 7co}. La hauteur 9 se rpte 2 fois, le 9p se trouve en premire position. on retiendra les dfinitions suivantes : Disposition sans rptition. C'est une disposition o un lment peut apparatre 0 ou 1 fois. Disposition avec rptition. Un lment peut figurer plus d'une fois. Disposition ordonne. L'ordre d'obtention d'un lment est important. Ex. les lments constituant la plaque minralogique d'un vhicule. Disposition non-ordonne. L'ordre d'obtention d'un lment n'est pas important, on n'en tient pas compte dans la caractrisation de la disposition. Ex. Les numros issus d'un tirage du loto. Exemple 2. Prenons un jeu de d 6 faces (lments discernables) = {1; 2; 3; 4; 5; 6}. Aprs 3 jets, nous obtenons A = (2; 5; 1) ; nous ritrons les jets et nous obtenons B = (5; 1; 2). A et B sont quivalents si nous considrons que les dispositions sont non-ordonnes. En revanche, ils ne sont pas quivalents si nous sommes dans le cadre d'une disposition ordonne.

I. Formules (rappels)

classiques

d'analyse

combinatoire

2.1. Les paires


Soient 2 ensembles constitus respectivement de lments discernables et lments discernables : A = {a1; a2; a3; ; a} et B = {b1; b2; b3; : : : ; b}.

On appelle une paire une disposition de 2 lments dont le 1er appartient A, et le 2nd B. La paire est une disposition ordonne, mais les 2 lments sont de natures diffrentes. Pour dcrire l'ensemble des paires possibles, il suffit de composer chaque lment de A avec chaque lment de B. Il y a donc M = * paires possibles.
Activit 1 :

a) Combien peut-on former de mots de 2 lettres en franais (quils aient un sens ou non) ? b) Combien y a-t-il de mots de 2 lettres forms d'une consonne et d'une voyelle (sans tenir compte de l'ordre) ?
Solution 1 :

4.1.1. Soient discernables.

Les multiplets distincts forms d'lments compltement

ensembles

A = {a1; a2; ; a} B = {b1; b2; ; b} C = {c1; c2; ; b} S = {s1; s2; ; s} On appelle multiplets une disposition ordonne de lments dont le 1er est un lment de A, le second un lment de B,..., et le me un lment de S. Les multiplets sont de la forme (ai1 ; bi2 ; ci3 ; ; si).

Un multiplet de lments peut tre considr comme une paire o : le 1er lment est constitu des (-1) lments, et le second lment, un lment de S. (a, b, c, , s) = [(a; b; c; ); s] Pour obtenir le nombre de multiplets, nous pouvons raisonner par rcurrence.
M = M-1 * = M-2 * * = = * * * *

Activit 2 :

Combien de codes composs de 4 signes peut-on former en sachant que les 2 premiers sont des lettres et les deux derniers des chiffres ? Solution 2 :

I. Principes fondamentaux de comptage


3.1. Le diagramme arborescent
Si sur un ensemble donn une opration quelconque peut tre effectue de n1 faons diffrentes puis quune seconde opration peut tre effectue de n2 faons diffrentes, une troisime de n3 faons diffrentes, ainsi de suite et quenfin une k-ime opration peut tre effectue de nk faons diffrentes, alors les k oprations peuvent tre effectues dans lordre indiqu de n1, n2, n3, nk faons diffrentes. Par exemple, si un homme possde 3 pantalons et 4 chemises, il a alors
3*4=12 manires diffrentes de shabiller.

Pour mieux apprhender les diffrentes possibilits qui conduisent un tel rsultat, on utilise souvent le diagramme arborescent. Supposons, pour matrialiser que les chemises sont identifies par c1, c2, c3 et c4 alors que

les pantalons sont p1, p2 et p3. Les combinaisons possibles sont les suivantes : Diagramme arborescent

3.2. Arrangements, permutations et factorielle


Comme lindique son nom, il sagit darranger, i.e. de mettre dans un ordre (comme sur une ligne) r objets distincts pris dan un ensemble de n objets. Pour ce faire, le premier objet peut tre choisi de n manires ; on aura ensuite n-1 manires de choisir le 2me objet (une fois le choix du premier fait), puis n-2 manires de choisir le 3me objet et ainsi de suite. Finalement, on aura n-r+1 manires de choisir le r-ime objet. On dit alors que lon a fait un arrangement de n objets pris r r. On parle aussi de permutations de r objets dans un ensemble de n objets. On le note :
Pnr=nn-1n-2n-r+1

Lorsque r=n, i.e. que ce sont les n objets qui sont arrangs ou permuts par groupes de n. les groupes seront donc tous identiques au niveau des objets qui les composent mais lordre de ces objets sera diffrent dun groupe lautre. On ralise alors des permutations de ces n objets. Cette permutation est appele factorielle n et lon note n!
n! =i=1ni Pnn=n!=nn-1n-2n-r+132(1)

Cest--dire

Ainsi : 6 ! = 6*5*4*3*2*1 soit 6 !=720 La formule de Stirling permet de construire une estimation de la factorielle trs valable pour n 10 : n !nne-n*2n Ainsi utilisant cette notion de factorielle, lon peut rcrire la permutation de n objets pris r r comme il suit :
Pnr=n!n-r!

Remarque importante noter :

Si lensemble est constitu de n objets parmi lesquels n1 objets sont identiques (donc non distinguables entre eux), n2 objets sont identiques (donc non distinguables entre eux mais distinguables des autres objets), ainsi de suite jusqu nk objets identiques entre eux, alors le nombre de permutations qui nous apparaitront diffrentes sera :
Pnn1,n2,,nk=n!n1! n2! nk!

Ainsi par exemple, si nous avions dterminer le nombre de mots (qui ait un sens ou nom) possibles que lon peut crire avec les lettres du mot MISSISSIPPI, on aurait :
P111,4,4,2=11!1!4!4!2! =34 650

3.3. Combinaisons
Pour les permutations et les arrangements, nous sommes intresss par lordre. Ainsi, abcd est absolument diffrent de cbad qui est lui-mme diffrent de cadbetc. Mais dans bien des cas, lordre nous importe peu. Par exemple, lorsque lon joue aux cartes et que lon reoit une main, lordre darrive des cartes qui composent cette main nest pas du tout important. Ce qui importe en ce moment, cest plutt la main elle-mme, i.e. les cartes qui nous ont t distribues ! Pour de telles situations, abcd est absolument gal cbad ou cadb ou encore toute autre assemblage de ces quatre lettres. On parle alors de combinaisons de n objets r r et on note :
Cnr=n!r!n-r!

On peut aisment montrer que

Cnr=Pnrr!

Notons les proprits suivantes : 0!=1 Cn0=Cnn=1 Cnr=Cnn-r Cnr=Cn-1r-1+Cn-1r r=1nCnr=2n

Activit 3 :

On prend un jeu de 52 cartes et on tire au hasard 5 cartes. 1) Combien de mains diffrentes peut-on obtenir ? 2) Combien de mains diffrentes contenant 1 As peut-on obtenir ? 3) Combien de mains diffrentes contenant 3 Rois peut-on obtenir ? 4) Combien de mains composes de cartes de couleurs diffrentes peut-

on obtenir ? 5) Combien de mains composes des valeurs Roi, Valet, 5, As et 9 peuton obtenir ? Solution 3 :

Activit 4 : Dans sa boutique de prt--porter, Flicit a reu une livraison de 5 corsages denfants identiques, 3 chaussures denfants identiques et 11 jupes identiques et 4 pantalons identiques pour enfants. 1) De combien de manires diffrentes peut-elle habiller ses mannequins avec : a. Un pantalon, un corsage et une chaussure ? b. Une jupe, un corsage et une chaussure ? 2) Reprenez les questions prcdentes en sachant que les jupes sont de couleurs bleue (3), rose (5) et brune (3) ; tandis que les pantalons sont de couleurs noire (1) et grise (3). 3) Flicit peut-elle changer de modles tous les jours pour attirer les clients ? Justifier votre rponse !

Solution 4 :

I. Calcul de probabilits
4.1. Le concept de probabilit
Chaque fois que le hasard intervient dans une exprience, il y a toujours une incertitude en ce qui concerne la ralisation dun vnement particulier. Il est alors commode daffecter un chiffre compris entre 0 et 1 la chance ou la probabilit qua cet vnement de se raliser. Ainsi, si nous sommes absolument srs que cet vnement va se raliser, nous disons que sa probabilit est de 100% ou 1. Au contraire, si lvnement en question na aucune chance de se raliser on dit que sa probabilit est 0. Une probabilit peut sestimer de 2 manires diffrentes : 4.1.1.

Approche a priori ou mthode classique

Si un vnement se produit de h manires diffrentes sur un nombre total n de manires possibles, toutes quiprobables, alors la probabilit de cet vnement est h/n.

Par exemple, si nous prenons une pice non truque, parfaite et que nous la jetons en lair, la probabilit dobtenir Pile ou face est la mme : 1/2. De mme, si nous 4.1.2.

Approche a posteriori ou mthode des frquences

Une exprience est rpte n fois (n est suffisamment grand) et lon constate quun vnement se ralise h fois. Alors, on en dduit que la probabilit de ralisation de cet vnement est h/n. cette probabilit est dite probabilit empirique. Par exemple, si dans une brasserie lon constate que sur 200.000 bouteilles de boisson, il y a 5 bouteilles mal remplies, la probabilit de dfaut de remplissage est 5/200.000.

4.2. Vocabulaire et axiomes de probabilit


Soit le lancer de deux ds, non pips et identiques. On note les deux chiffres obtenus.

On note lunivers des possibles not lensemble des rsultats possibles de lexprience. dpend de lexploitation que lon souhaite faire des rsultats.

Par exemples, = {(1, 1), (1, 2), (1, 3), . . .}, si lon note simplement le chiffre apparu sur les ds lun aprs lautre ; = {2, 3, . . . 12}, si lon note le total des chiffres apparus sur les 2 ds.

On note vnement A une proposition relative au rsultat de lexprience ; i.e. une caractristique ou un aspect du rsultat sur lequel lon souhaite se pencher.

Par exemples, la somme des points est suprieur 10, tirer une paire de chiffres identiques, etc. sont des vnements de lexprience du lancer de 2 ds.

On note une tribu lensemble de tous les vnements ( ; ). ) lapplication P, qui a un

On appelle loi de probabilit sur ( , que :


P =1 P( ) = 0 0P(A)1

vnement de associe une valeur comprise dans lintervalle [0, 1] telle

P()=1-P(A), est lvnement contraire de A, i.e. tout autre

vnement qui se ralise si A ne se ralise pas.


P(A)P(B), si A inclus dans B PAB=PA+PB-P(AB) PA=PA1+PA2++P(Ak),

si

est

compos

de

vnements

lmentaires (mutuellement exclusifs).


PA1+PA2++PAn=1, si lespace dchantillonnage est compos de n

vnements lmentaires (donc mutuellement exclusifs). Lespace dchantillonnage lexprience.


P(Ai)Ai

cest

lensemble

sur

lequel

lon

mne

4.1. Evnements joints


Si deux vnements A et B peuvent advenir, on peut sintresser de savoir si les 2 vnements peuvent se produire simultanment ; on examine donc la probabilit de ralisation de leur intersection. On note cela P(AB) ou P(A,B). Diagramme dintersection

I. Probabilits indpendants
5.1. Probabilits composes

conditionnelles
conditionnelles

et
et

vnements
probabilits

La probabilit conditionnelle dun vnement A sachant un vnement B, not PAB est la probabilit que A se ralise, sous la condition que B est dj ralis. En dautres termes, la probabilit conditionnelle dun vnement A sachant un

vnement B est dnote la probabilit de A dans le cas o B est ralis. On lobtient par : PAB=PABPB De mme on aura PBA=PABPA composes suivantes : PAB=PAB*PB=PBA*P(A) Remarque : PAB=PBA mais PABPBA. et par consquent, partant des deux formules on obtient la formule de probabilits

5.2. Evnements indpendants


Deux vnements A et B sont dits indpendant si la connaissance de B ne change pas les chances de ralisation de A (en dautres termes si la ralisation de A naffecte pas la ralisation de B) et vice-versa ; i.e.
P(A|B) = P(A) Ou P(B|A) = P(B)

Si A and B sont indpendants, alors : Remarque : Il peut arriver que 2

PAB = PA* PB=PBA

vnements

et

soient

conditionnellement indpendants sachant un troisime (C). Cest--dire que A et B ne sont indpendants que dans la mesure o C se ralise. Si A et B sont donc conditionnellement indpendants, sachant C alors :
PABC= PAC* PBC P(A|BC) = P(A|C)

Activit 5 :

On considre le jeu de 52 cartes de lactivit 3. On tire une carte au hasard. 1) Quelle est la probabilit que la carte tire soit Roi sachant quelle est un cur ? 2) Quelle est la probabilit que la carte tire porte une valeur infrieure ou gale 10 sachant que cest un pique ? 3) Quelle est la probabilit que la carte tire soit un J sachant quelle

a une valeur suprieure 10 ? 4) Amusez-vous calculer P(B|A) pour chacune des probabilits ciavant demandes. Note : on supposera que les valeurs J, K et Q sont suprieures 10. Solution 5 :

I. Thorme de Bayes
Soit un vnement A qui peut dpendre de N causes Ci diffrentes et incompatibles deux deux (on ne peut avoir deux causes ralises simultanment). Etant donn la ralisation de lvnement A, quelle est la probabilit que ce soit Ci qui en soit la cause ? On peut crire que A = i=1NACi car {C1, C2, , Cn} constitue un systme fini dvnements incompatibles 2 2 : on dit que cest un systme complet. Daprs le thorme des probabilits totales, on a :
PA=iP(ACi)

En appliquant le thorme des probabilits conditionnelles chaque cause Ci, on obtient :


P(A C1) = P(A).P C1A = P(Ci).PAC1 P(A C2) = P(A).P C2A = P(Ci).PAC2 P(A Ci) = P(A).P CiA = P(Ci).PACi

De l nous obtenons le thorme de

Bayes :
PCiA=PCi*PACik=1NPCk*PACk

Ce thorme permet dvaluer les probabilits des diffrents vnements C1, C2, , Ck qui peuvent causer la ralisation de lvnement A. Cest pourquoi le thorme de Bayes est aussi appel thorme sur la probabilit des causes. Remarque : 2 vnements A et B sont dits incompatibles sils ne peuvent se raliser simultanment. Par exemple, les vnements prendre une douche et shabiller sont incompatibles dans la mesure o ils ne peuvent (a priori !) se raliser simultanment.

Activit 6 :

Dans son entreprise, Christelle a 2 employs Alain et Pierre qui font par semaine 100 et 200 ventes en moyenne. Elle a constat que dans 5% des cas, Alain perd de largent tandis que Pierre en perd dans 6% des cas. 1) Quelle est la probabilit quune perte soit le fait dAlain ? 2) Quelle est la probabilit que 2 pertes successives soient le fait de Pierre ?

Solution 6 :

Chapit re 2
I.

Variables alatoires relles

Dfinition d'une variable alatoire

Supposons que nous affections une valeur chaque point de lespace dchantillonnage. Nous aurons, alors, dfini une fonction sur cet espace. Cette fonction est appele variable alatoire (note v.a.) ou variable stochastique ou encore fonction alatoire ou fonction stochastique. Elle est gnralement dsigne par une lettre majuscule X ou Y. une variable alatoire possde en gnral, une signification donne : physique, gomtrique ou autre. Considrons lexprience suivante : On lance 3 fois une pice de monnaie (qui prend deux valeurs possibles "pile" ou "face", comme on le sait, videmment !). L'ensemble fondamental est = (P; F); (P; F); (P; F) Notons X le nombre de "face" apparue au bout des trois jets. Les valeurs possibles de X sont DX=0;1;2;3. X est une application de 0;1;2;3 vers lintervalle [0, 1] qui est celui des valeurs possibles que peut prendre la probabilit doccurrence de chaque lment de DX. X est donc une application de dans DX. De manire gnrale, X est une application dfinie :
X : R

X s'appelle une variable alatoire, on s'intressera aux valeurs prises par X (X = x), et plus particulirement la probabilit d'obtenir ces valeurs P(X = x). Soit donc une preuve ei et l'ensemble fondamental des ventualits. L'application : R fait correspondre tout lment de un nombre rel ei,
eiX(ei)R

X dsigne la variable alatoire ; x dsigne la valeur possible de la variable alatoire ; le domaine de dfinition de X est Dx= x1, x2 ,, xn

II.

Les diffrents types de variables alatoire

On distingue les variables alatoires discrtes et les variables alatoires continues. Une variable alatoire est dite discrte lorsque les valeurs xi qu'elle est susceptible de prendre sont en nombre fini, ou encore forms exclusivement de nombres entiers. Par exemples, le nombre de "face" apparaissant aprs 10 jets d'une pice ; le nombre de vhicules passant un carrefour dans une journe ; le nombre de clients entrant dans un magasin le samedi. Une variable alatoire est dite continue si elle peut prendre toutes les valeurs d'un intervalle. Par exemples, lintervalle de temps entre 2 passages de train ; la longueur de cheveux ; la dure de vie en secondes d'une pice mcanique. Cest dire donc quune v.a. continue peut prendre un nombre infini, non dnombrable de valeurs. Remarque (Distinction variable discrte et continue) : Parfois, la

distinction entre une v.a. discrte et une v.a. continue est purement formelle. Le type de la variable alatoire dpend du degr de prcision que l'on dsire apprhender. Par exemple, on s'intresse l'esprance de vie d'un chat, si on travaille sur le nombre d'annes, le nombre de valeurs possible est fini ; si on travaille en secondes, ce sera diffrent. La situation sera un peu plus claire lorsque l'on abordera la question de la probabilit ponctuelle. En effet, dans le cas d'une variable continue, la probabilit ponctuelle est par dfinition, nulle.

III.

Probabilit probabilit

dune

variable

alatoire,

loi

de

Une variable alatoire est totalement dfinie par sa loi de probabilit. Cette dernire est caractrise par :
L'ensemble des valeurs qu'elle peut prendre (son domaine de

dfinition DX) ;

Les probabilits attribues chacune de ses valeurs P(X = x).

Soit X une variable alatoire dfinie par une application de dans , pouvant prendre des valeurs dans Dx= x1, x2 ,, xn. Par dfinition, la probabilit pour que la variable X soit gale x est la probabilit des lments de ayant pour image la valeur x dans l'application. Cette probabilit mesure le degr de crdibilit de ralisation de l'vnement.
P(X = xi) est rgie par les 3 axiomes de Kolmogorov :

1. P(X = xi) 0 2. P(X = Dx) = 1 3. Si les xi sont incompatibles alors, P[(X = xi)(X = xj )]=P(X = xi)+P(X = xj).

3.1. Probabilit dune variable alatoire discrte


La loi de probabilit est la suivante :
x1, x2, x3, ,xk les valeurs possibles de la variablesp1, p2, p3,, pk lesprobabilits de chacune des valeurs possibles pi=PX = xk=f(xk) est la probabilit individuelle de xk

Pour les valeurs de x=xk, f(x)=0 Exemple 1 : On lance une pice de monnaie une fois, l'ensemble fondamental est = P,F. Soit X le nombre d'apparition de "pile", DX = 0,1 et on peut calculer facilement P(X = x), PX = 0=12 et graphe des probabilits. Graphe de probabilits
PX = 1=12

Le graphe obtenu par reprsentation de f(x) dans un repre est appel

Remarque : La hauteur de chaque barre est proportionnelle la valeur de la probabilit pi.

3.2. Probabilit dune variable alatoire continue


Si X est une v.a. continue, la probabilit que X prenne une valeur particulire quelconque est gnralement nulle. En Effet, considrons lexemple de lesprance de vie dun chat. Supposons que nous nous intressions de savoir, prcisment, en secondes, la dure de vie dun chat ! Peut-on dterminer la dure de vie dun chat la seconde prs ? La rponse assurment est Non !. Ainsi, lon ne saurait non plus dterminer la probabilit de survie dun chat un moment prcis de lespace temps. Il ny a donc pas de possibilit de dterminer la probabilit individuelle de survie un temps t prcis. Dans ces conditions, il nest pas possible de dfinir une fonction de probabilit comme pour une v.a. discrte. Pour pouvoir dfinir une distribution de probabilit dans le cas dune v.a. continue, on remarque que la probabilit pour que la valeur de X soit comprise entre deux valeurs diffrentes est une notion qui a un sens. Dans ce cas, la plupart du temps,
DxR. La probabilit ponctuelle P(X = x) = f(x) est appele la fonction de

densit (de probabilit).

La densit de probabilit d'une variable est la alatoire drive continue

premire par rapport x de la fonction de rpartition. Cette drive prend le nom de fonction de densit, note fx=dFxdx . Elle est donc quivalente P(X = x) dans le cas des variables discrtes.
Fonction densit de probabilit dune v.a. continue

Cette fonction est dfinie telle que : fx0 les champs/intervalles possibles de la variables-+fxdx=1 lesprobabilits de chacun des champs/intervalles possibles Ainsi, la probabilit pour que X soit comprise entre les valeurs a et b est donne par :
Pa<X<b=abfxdx or Pa<X<b=PX<b-P(X<a)

Donc Pa<X<b=-bfxdx--afxdx do : Pa<X<b=Fb-F(a) Graphiquement, traduit par la cela se

surface

comprise entre a et b.

Cette fonction satisfait aussi aux 3 axiomes de Kolmogorov ci-avant mentionns. Une telle fonction est appele la fonction densit de probabilit ou plus simplement fonction densit dune v.a. continue et nest rien dautre que la fonction de probabilit ou la distribution de probabilit de la v.a. continue. Et, comme soulign ci-avant, il nest pas possible, dans le cas dune v.a. continue de dterminer la probabilit que X soit gale une valeur donne avec prcision. Cest pourquoi, on retiendra :
Pa<X<b=PaX<b=PaXb=P(a<Xb)

I.

Fonction de distribution ou de rpartition

La fonction de rpartition (ou de distribution) n'est autre que le cumul des probabilits individuelles. La probabilit pour que la variable alatoire X prenne une valeur infrieure x est une fonction F(x) que l'on

appelle fonction de rpartition. Cest pourquoi on lappelle fonction cumulative de distribution, gnralement identifie par Fx=P(X<x).

4.1. Variable alatoire discrte


En gnral, f(x) est une fonction de rpartition si :
f(x)0 xfx=1 x possible Fx=PX<xk=k=0x-1P(X=k) est appele la fonction de rpartition ( des

probabilits) ou simplement la fonction de distribution ( des probabilits). On graphiquement fonction l'aide de d'une reprsente cette courbe rpartition

cumulative en escalier (voir graphique ci-contre). Courbe cumulative en escalier reprsentative de la fonction de distribution dune v.a. discrte

4.2. Variable alatoire continue


La fonction de rpartition F(x)=P(X<x) est dfinie par :
F(x)=-xftdt

La fonction de rpartition F(x) est une fonction continue, monotone et croissante dans le domaine [0; 1]. On note deux cas extrmes :
F-=limx-Fx=0 F+=limx+Fx=1

Ces deux cas rappellent bien entendu les axiomes de positivit et de certitude. La fonction de rpartition Fonction de rpartition dune v.a.

est reprsente

gnralement par une (voir

continue

graphiquement courbe

cumulative

graphique ci-contre).

Remarque : Souvenons-nous que la fonction de rpartition est une intgrale de la fonction de densit. Il est galement possible d'utiliser cette dernire pour reprsenter graphiquement la fonction de rpartition, il s'agit d'une surface dans ce cas.

I.

Caractristiques dune variable alatoire


5.1. Les caractristiques de tendance centrale
5.1.1. Les quantiles

On appelle quantile ou fractile d'ordre (01) d'une variable alatoire X dont la fonction de rpartition est F (x), la valeur x telle que F (x) = . x s'appelle quantile d'ordre . Remarque : Lorsque X est une variable alatoire discrte, F (x) = veut dire P (X < x) = . Il existe diffrentes sortes de fractiles. Nous prsenterons ici la mdiane, les quartiles et les dciles. La mdiane

La mdiane, note Me est le quantile d'ordre =12 . Me est dfinie parMefxdx=0,5. En d'autres termes la mdiane partage en deux parties gales la population, c'est une caractristique de tendance centrale. Les quartiles (respectivement i = 1; 2; 3) correspondent aux

Les quartiles, nots Qi

quantiles d'ordre ( = 0,25; 0,5; 0,75). Chacun des Qi est donc obtenu par : Q1: -Q1fxdx=0,25. Q2:-Q2fxdx=0,5. Q3:-Q3fxdx=0,75. On aura bien videmment remarqu que Q2 = Me.

Les dciles

Le k-me dcile (k=1;;9) est le quantile d'ordre k10 . En particulier, le 5me dcile correspond la mdiane. Ainsi, pour obtenir chacun des dciles, il sagira de calculer : Dk:-Dkfxdx=k10. 5.1.1. probable) d'une Le mode variable alatoire, la valeur Mo pour laquelle

On appelle mode (cest--dire la valeur dominante ou la valeur la plus l'histogramme de frquence prsente son maximum. Lorsque la v.a. X est continue, avec une fonction de densit au moins deux fois drivable, le mode Mo satisfait simultanment aux deux conditions suivantes : f(Mo) = 0 et f(Mo)<0) La seconde condition signifie en fait que la concavit est tourne vers le bas. Pour les v.a. discrtes, Mo est la valeur de X associe la plus grande probabilit, d'o l'appellation valeur la plus probable. 5.1.2. Esprance mathmatique

Soit (X) une fonction dfinie pour tout X appartenant au domaine de dfinition DX. On appelle esprance mathmatique de (X), que l'on note E[(X)] l'expression :

EX=xfxdx=xdFx Et puisque nous notons X, notre v.a., ((x) est alors gale X et par consquent,) on a E(X) qui est lesprance mathmatique de la v.a. X. E(X) est alors donne par : EX=xfxdx Ces sommes sont calcules sur lensemble de dfinition. L'esprance mathmatique existe si l'intgrale est convergente. Elle est indpendante de x. Il faut prciser que cette formule est celle caractristique dune v.a. continue. Pour les v.a. discrtes, on aura plutt : EX=DXxPX=x Caractristiques dune esprance mathmatique : a constante, Ea=a. Cela signifie que lesprance mathmatique dune constante est gale la constante elle-mme. De cette axiome on dduit : EE[X]=E[X] EiaiXi+b=iaiEXi+bi de cela on tire : EaX+bY=aEX+bE[Y] X,Y 2 v.a., on a EXY=EX*EY+cov(X,Y), cov(X,Y) est la covariance des v.a. X et Y. Si X et Y sont indpendantes, alors covX,Y=0 et donc EXY=EX*EY

5.1. Les caractristiques de dispersion


5.1.1. Les moments non-centrs dordre r Un moment non-centr dordre r se dfinit comme suit : mrX=E[Xr]. Pour une v.a. discrte on aura mrX=x=0+xrpx avec px=PX=x Pour une v.a. continue : mrX=xrfxdx, sur lensemble de dfinition Dx. Remarques : (i) En statistique descriptive, ce moment non-centr est obtenu avec la formule : mrX=i=0nfixir o fi est la frquence observe pour xi {xi reprsente la modalit (pour les variables quantitatives discrtes) ou le centre de classe (pour les variables quantitatives continues}. (ii) pour r=0, on a m0X=1 Pour r=1, m1X=EX, qui est bien entendu, lesprance mathmatique Pour r=2, m2X=EX2 Et ainsi de suite

5.1.2.

Les moments centrs dordre r

Un moment centr dordre r se dfinit comme suit : rX=EE-EXr Pour une v.a. discrte on aura rX=x=0+x-EXrpx avec px=PX=x Pour une v.a. continue : rX=(x-EX)rfxdx, sur lensemble de dfinition Dx. Remarques : (i) En statistique descriptive, ce moment centr est obtenu avec la formule : rX=i=0nfi(xi-x)r o x est la moyenne calcule et fi est la frquence observe pour xi {xi reprsente la modalit (pour les variables quantitatives discrtes) ou le centre de classe (pour les variables quantitatives continues}. (ii) pour r=0, on a 0X=EX-EX0=E1=1 Pour r=1, 1X=E(X-EX)1=EX-EEX=EX-EX=0 Pour r=2, 2X=E(X-EX)2=V(X), la variance de X, discute ci-aprs. 5.1.3.
V(X)=E(X-EX)2

La variance et lcart-type

On appelle variance de X note V(X) le moment centr dordre 2 de X. La variance mesure la dispersion autour de la moyenne. Elle est utile pour calculer lcart-type qui est donn par : X=V(X) Remarque : il est ais de dmontr que VX=EX2-EX2; ceci est la Formule de Koenig. Caractristiques de la variance :
(i) (ii) V(a)=0 V(aX)=a2*V(X)

(iii) VaX+bY=a2VX+b2VY+2ab*cov(X,Y). On notera que covX,Y=0 si X et Y

sont indpendantes
(iv) VXY=VX*VY+EX2*VY+EY2*V(X). On note en particulier que si les v.a.

sont centres, i.e. E[X]=E[Y]=0 alors V(XY)=V(X)*V(Y). 5.1.1. La covariance

Soient 2 v.a. X et Y, la covariance de X et Y est donne par :


covX,Y=EX-EXY-EY=EXY-EX*EY

Pour une v.a. discrte : covX,Y=xyx-EXy-EY.pxy avec pxy=P(X=x;Y=y), la probabilit jointe de x et y. Pour une v.a. continue, f(x,y) tant la fonction de densit jointe, on a :

On retiendra que lorsque 2 v.a. X et Y sont indpendantes, covX,Y=0. 5.1.2. Le coefficient de corrlation

Le coefficient de corrlation est utilis pour apprcier lexistence dune relation (le plus souvent, linaire) entre les variables. Cette relation, si elle existe, nest pas synonyme de causalit entre les 2 variables tudies. Il ne faut donc pas confondre corrlation et causalit ! Le coefficient de corrlation est obtenu suivant la formule :

XY=covX,YX*(Y).

5.2. Les caractristiques de formes ou coefficients de Fisher


5.2.1. Le coefficient dasymtrie Le coefficient dasymtrie est une valeur sans dimension ; il nest affect ni par un changement dorigine, ni par un changement dchelle. Il permet dapprcier la symtrie ou ltalement entre la partie gauche et la partie droite de la reprsentation (fonction densit pour les v.a. continue et diagramme en btons pour les v.a. discrtes) dune v.a. Sa formule est la suivante :
1=33=E[X-E[X)3]3.

Les

figures

ci-aprs

permettent

dinterprter les valeurs obtenues de cet indicateur.


Formes de distributions selon le coefficient dasymtrie

5.2.2.

Le coefficient daplatissement

Le coefficient daplatissement vise situer la hauteur de la courbe de densit dune loi par rapport la rfrence que constitue la loi normale ou loi de Laplacegauss. Cest aussi un indicateur sans unit et qui ne varie pas avec les changements dchelle ou de dimension. Il est donn par : 2=44-3 Les graphes ci-aprs permettent de linterprter : Formes dune v.a. selon les diffrentes valeurs du coefficient daplatissement

5.3. Ingalit de Bienaym-Chebychev


Soit X une v.a. d'esprance mathmatique et de variance 2. L'ingalit de Bienaym-Chebychev indique que pour tout nombre rel positif t, la probabilit que X s'carte de son esprance mathmatique d'une grandeur infrieure t, a pour limite suprieure 2t2. On a alors : PX-t2t2.

Das könnte Ihnen auch gefallen