Sie sind auf Seite 1von 9

EAM

CTA1 / L3 AES
STATISTIQUES
24/11/2010


Page 1
Population : taille N - Loi de la population : X.
Echantillon : sous ensemble de la population de taille n, obtenu par tirage alatoire.
( )
1 2
, , ,
n
X X X , iid : indpendants et identiquement distribus ( i ,
i
X suit la mme loi que X).

Echantillon
Notation Population
Estimateur
(variable alatoire)
Observation
Proportion p 1
1
n
i
i
F X
n
=
=


avec 0 ou 1
i
X =
f
Moyenne
1
1
n
i
i
X X
n
=
=

x
Centre :
( )
( )
2
2
1
1
1
n
i
i
S X X
n
=
=



2
s
Variance
2

Non centre :
( )
2
2
1
1
n
i
i
V X X
n
=
=


2
v
PROPRIETES :
MOYENNE (encore appele esprance): ( ) ( ) . . a X b a X b + = + E E .
( ) ( ) ( )
1 1 n n
X X X X + + = + + E E E
VARIANCE: ( ) ( ) ( ) ( ) ( ) ( )
2
2 2
. . V X X X V a X b a V X = + = E E
Si ( (( ( ) )) ) , . .
i
X i i d : ( ) ( )
1 1
.
n
X X n X + + = E E , ( ) ( ) ( )
1 1
1
.
n
n i
i
V X X V X nV X
=
+ + = =


( ) ( ) ( )
( )
1
1
1
1
n
i
i
V X
X X X V X
n n
=
| |
= = =
|
\

E E E
signifie suit une loi
25 n> >> >
signifie pour 25 n > >> > , suit approximativement une loi de .
LOI USUELLES DISCRETES :
Loi de BERNOULLI : ( (( ( ) )) ) ( (( ( ) )) ) 1 X p er p , = , = , = , = B B . On ralise une seule fois une exprience
deux issues possibles {Succs, Echec}, avec ( ) Succs p = P . Soit X = "Nombre de succs obtenus".
[ ] ( ) { } ( ) ( ) ( )
1
0 ou 1, . 1 0,1 , 1
k
k
X X k p p k X p V X p p

= = = = , = P E .
Loi Binomiale : ( (( ( ) )) ) B X n p , ,, , . On ralise n fois, de faons indpendantes, une
mme exprience deux issues possibles {Succs, Echec}, avec ( ) Succs p = P . Soit X = "Nombre de
succs obtenus".
Page 2
( )
[ ] ( ) ( ) ( ) ( )
1 2
, 1,
0,1, ou , 1 , 1
n i
n k
k k
n
X X X X X p iid
X n X k C p p X np V X np p

= + + +
= = = = , =

B
P E

Loi de POISSON : ( (( ( ) )) ) P X .
[ ] ( ) ( ) 0,1, 2, , . ,
!
k
X X k e X V X
k

= = = = , = P E
LOI USUELLES CONTINUES :
Loi exponentielle : ( (( ( ) )) ) X xp a E .
( ) ( ) ( )
1
.
2
1
. si 0
,
0 si 0
t
a
X
e t
X a V X a f t
a
t


= , = =

<

E
Loi normale : ( (( ( ) )) ) N X , , , , . ( ) ( ) ( )
( )
2
2
2
2
1
,
2
t
X
X V X f t e

= , = =

E
( ) 0;1
X
U

=

N loi normale centre ( ) ( ) 0 U = E rduite ( ) ( ) 1 V U = .


Valeurs particulires :
[ ]
[ ]
[ ]
[ ] [ ]
1, 96 1, 96 0, 95
1, 645 0, 95
1, 645 1, 645 0, 90
2. 1
U
U
U
U U
< < =

< =

< < =

< < = <

P
P
P
P P

Si ( )
, 1;
i i i
X i n N , indpendantes, alors :

( )
( )
2 2 2 2
1 1 2 2 1 2 2 1 1 2 2
2
2 2 2 2
1 1 1
1 1 2 2 1 2 2 1 1 2 2
. . . , . .
,
. . . , . .
n n n
i i i
i i i
a X a X a a a a
X
a X a X a a a a
1
= = =
1
+ + +
| |
|
|
\ +

N
N
N

Si ( )
, 1;
i
X i n N , indpendantes, alors :
( )
1
,
n
i
i
X n n
=

N .
Loi du Chi 2
( (( ( ) )) )
2
:
o Si ( )
0;1 1;
i
U i n N indpendantes, alors : ( )
2 2
1
n
i
i
U n
=

(n degrs de libert).
o Si ( )
, 1;
i
X i n N , indpendantes, alors : ( )
2
2
1
n
i
i
X
n
=
| |

|

.
o Si ( )
, 1;
i
X i n N , indpendantes, alors : ( )
2
2
1
1
n
i
i
X X
n
=
| |

|

.
Loi de STUDENT ( (( ( ) )) ) ( (( ( ) )) )
St n dite loi de la variance :
o Si ( ) ( )
2
0;1 et Z U n N , alors ( )
U
T St n
Z
n
=
Page 3
Loi de FICHER ( (( ( ) )) ) ( (( ( ) )) )
1 2
, F n n dite loi du rapport de deux variances :
o Si ( ) ( )
2 2
1 1 2 2
Z et Z n n , alors ( )
1
1
1 2
2
2
,
Z
n
F n n
Z
n

APPROXIMATION :
o Si 25 n , 0,10 p et ( ) , X n p B , alors ( )
25
.
n
X n p
>
P .
o Thorme central limite (T.C.L.) : Si
1 2
, , , ,
n
X X X iid ( ) ( ) et
i i
X X = = E ,
alors : ( )
1
25
0,1
n
i
i
n
X n
n
=
>

N ou encore
( )
25
1
,
n
i
n
i
X n n
>
=

N ;
o Corollaire [1] (T.C.L.) : Si ( ) , X n p B , alors: ( )
( )
25
, 1
n
X np np p
>
N ;
o Corollaire [2] (T.C.L.) : Si ( ) X n P , alors:
( )
25
,
n
X n n
>
N ;
DISTRIBUTIONS DECHANTILLONNAGE : lois de probabilit des variables dchantillonnage
2
, , F X S .
Lorsque lchantillon est prlev avec remise (tirage non exhaustif ) :
proportion
dchantillonnage
F
( )
( )
25
0;1
1
n
F p
p p
n
>

N ou encore
( )
25
1
;
n
p p
F p
n
>
| |

|
|
\
N
25 n < << <
Sous lhypothse :
( ) , X N
Variance de la
population
2

connue
25 n > >> >
Sans hypothse supplmentaire
( ) 0;1
X
n

N
Ou encore :
; X
n
| |

|
\
N
25 n < << <
Sous lhypothse :
( ) , X N
( ) 1
X
St n
S
n


moyenne
dchantillonnage
X
Variance de la
population
2

inconnue
25 n > >> >
Sans hypothse supplmentaire
( ) 0;1
X
S
n

N
variance
dchantillonnage
2
S
( )
( )
2
2
2
1
1
n S
n



Page 4
Lorsque lchantillon est prlev sans remise (tirage exhaustif ) :
proportion
dchantillonnage
F
( )
( )
25
0;1
1
1
n
F p
p p
N n
n N
>

N ou encore
( )
25
1
;
n
p p
F p
n
>
| |

|
|
\
N
25 n < << <
Sous lhypothse :
( ) , X N
moyenne
dchantillonnage
X
Variance de la
population
2

connue
25 n > >> >
Sans hypothse supplmentaire
( ) 0;1
1
X
N n
N
n

N
QUALITES DUN ESTIMATEUR :

estimateur (variable alatoire) du paramtre estimer.



( )

= E Biais de lestimateur
( )
( )
2

= E Ecart quadratique moyen.


est un estimateur centr (ou encore sans biais) de ssi


( )

= E ;

est un estimateur convergent de ssi


( )
( )
2

lim 0
n+
= E ;

estimateur centr est convergent de ssi


( )

lim 0
n
V
+
= ;
VRAISSEMBLANCE de la ralisation d'un n chantillon ( )
1 2
, , ,
n
x x x :
( )
( ) ( ) [ ]
( ) ( )
1 1
1
1 2
1 2
1
, , , ,
, , ,
n
n n i i
i
n
n
n i
i
X x X x X x
L x x x
f x x x f x

=

=

( = = = =

P P

Exemples dEstimateur du Maximum de Vraissemblance (EMV) :
( ) X er p B :
1
1
n
i
i
F X
n
=
=

EMV de p ;
( ) X P :
1
1
n
i
i
X X
n
=
=

EMV de ;
Page 5
REGION CRITIQUE dun TEST DHYPOTHESES au niveau :
Erreur de 1
re
espce : [ ]
1 0
/ D H = P : probabilit de mauvaise dcision alors que
0
H est vraie.
Erreur de 2
nde
espce : [ ]
0 1
/ D H = P : probabilit de mauvaise dcision alors que
1
H est vraie.
En pratique fix de manire arbitraire : 0, 01 ou 0, 05 ou 0,1 = ;
Rgion critique (RC) = zone de rejet de
0
H .
Hypothse simple contre hypothse simple
0 0
1 1
:
:
H
H
=


Si
1 0
< , alors RC :
{ }

< Si
1 0
> , alors RC :
{ }

>
Hypothse simple contre hypothse composite
0 0
1 0
:
:
H
H
=

<


0 0
1 0
:
:
H
H
=

>


0 0
1 0
:
:
H
H
=


RC :
{ }

< RC :
{ }

>
RC :
{ } { } ,inf ,sup

c c

< >
VARIABLE DE DECISION du TEST LE PLUS PUISSANT au niveau :
Puissance du test
0 0
1 1
:
:
H
H
=

: [ ]
1 1
1 / D H = P : probabilit de bonne dcision alors que
1
H est vraie.
Test unilatral plus puissant que le test bilatral !
Fonction puissance : ( )
1
1 .
Lemme de NEYMAN-PEARSON : Pour tester
0 0
1 1
:
:
H
H
=

ce lemme permet de dterminer


lestimateur le plus appropri. Il apparait en calculant
( )
( )
1 2 1
1 2 0
, , , ,
, , , ,
n
n
L x x x
k
L x x x

>

.
VARIABLE DE DECISION dun TEST PARAMETRIQUE DE NIVEAU :
Hypothse sur :
0 0
1 1
:
:
H
H
=

la variable de dcision est


1
1
n
i
i
X X
n
=
=

;
Hypothse sur p :
0 0
1 1
:
:
H p p
H p p
=

la variable de dcision est


1
1
n
i
i
F X
n
=
=

;
Hypothse sur
2
:
2 2
0 0
2 2
1 1
:
:
H
H
=

la variable de dcision est


( )
( )
2
2
1
1
1
n
i
i
S X X
n
=
=


;
Page 6
Etapes dun test :
Dfinition des Hypothses
0
1
:
:
H
H


Identification de la variable de dcision et sa loi ;
Forme de la rgion critique ;
Dtermination de la rgion critique :

( )
1 0
, , , D H u F
2

( =

P ;
Valeur observe de la variable de dcision
( )
, , ,
obs obs obs
u F
2
;
Conclusion du test.
TESTS DE COMPARAISON : Population A ( (( ( ) )) ) , , , , ,
A A A A A
p n f x et population B ( (( ( ) )) ) , , , , ,
B B B B B
p n f x .
Comparaison de deux proportions : Si > 30 et > 30
A B
n n
Hypothses :
0
1
: 0
: 0
A B
A B
H p p
H p p
=

test bilatral !
Variable de dcision :
A B
F - F . Sous
0
H : ( )
1 1
0 ; 1
A B
A B
F F p p
n n
| |
| |
| +
|
|
\
\
N ,
o p inconnue est estime par
.
A A B B
A B
n f n f
f
n n
+ +
=
+
.
Comparaison de deux variances : Si et normales
A B
X X !
Hypothses :
2
0
2
2
1
2
: 1
1
A
B
A
B
H
H

=

>

si >
2 2
A B
s s test unilatral droite !
Variable de dcision :
2
A
2
B
S
S
. Sous
0
H : ( )
2
2
1; 1
A
A B
B
S
F n n
S

Comparaison de deux moyennes : Hypothses :
0
1
:
;
A B
A B A B
H
H
=

>


Variable de dcision :
A B
X X .
et
A B
connus avec ( (( ( ) )) ) ( (( ( ) )) ) et normales ou 30 et 30
A B A B
X X n n > > > > > > > > :
Sous
0
H :
2 2
; 0
A B
A B
A B
X X
n n
| |

| +
|
\
N
et
A B
inconnus avec ( (( ( ) )) ) et normales
A B
X X petits chantillons :
Sous
0
H et galit des variances : ( ) 2
1 1
A B
A B
A B
X X
St n n
S
n n

+
| |
+
|
\
, o
( ) ( )
2 2
2
1 1
2
A A B B
A B
n S n S
S
n n
+
=
+
;
et
A B
inconnus avec ( (( ( ) )) ) 30 et 30
A B
n n > > > > > > > > :
Sous
0
H et galit des variances : ( )
2 2
0 ; 1
A B
A B
A B
X X
S S
n n

+
N
Page 7
TESTS DE COMPARAISON DE PLUSIEURS MOYENNES (ANOVA = ANalysis Of VAriance) :
Population 1
( (( ( ) )) )
1
11 1,2 1 1 1
, , , , ,
n
x x x n x , , Population k
( (( ( ) )) )
1 ,2
, , , , ,
k
k k kn k k
x x x n x .
ANOVA 1 facteur :
1 1 1 1
1 1
. moyenne gnrale, tous groupes confondus.
i
n k k k
ij i i i
i j n i
x x n x n n
n n
= = = = = = = = = = = = = = = =
= = = = = = = = = = = = = = = =


Hypothses :
0 1 2
1 0
:
:
k
H
H H
= = =


, variance gales
2 2 2
1 k
= = = et ( ) ,
i i
X N .

( (( ( ) )) )
2
1 1
Somme des carrs explique ou inter-classe
i
n k
i
i j
SCE x x
= = = = = = = =
= = = = = = = =


Sous
0
H et galit des variances : ( )
2
2
1
SCE
k



( (( ( ) )) )
2
1 1
Somme des carrs rsiduelle ou intra-classe
i
n k
ij i
i j
SCR x x
= = = = = = = =
= = = = = = = =


Sous
0
H et galit des variances : ( )
2
2
SCR
n k



( (( ( ) )) )
2
1 1
Somme des carrs totale
i
n k
ij
i j
SCT x x
= = = = = = = =
= = = = = = = =


Sous
0
H et galit des variances : ( )
2
2
1
SCT
n


Variable de dcision du test :
Sous
0
H et galit des variances :
( )
( )
( )
1
1;
SCE
k
F k n k
SCR
n k


Rgion critique : { } W F F

= >
Tableau ANOVA 1 facteur :

SC
Somme des
carrs
ddl
Degrs de
libert
Variance
SC
ddl
= == =
obs
F F


Explique
ou inter-classe
SCE 1 k
1
SCE
VE
k
=


Rsiduelle
ou intra-classe
SCR n k
SCR
VR
n k
=


VE
VR
( ) 1; F k n k


Totale SCT 1 n

Page 8
ANOVA 2 facteurs explicatifs :
1 2
nombre de lignes nombre de colonnes
k
n n n l c = = = = = =

me me
1 1
moyenne sur la ligne, moyenne sur la colonne
1 1
.
c l
i ij j lj
j i
i j x x x x
c l
= = = = = = = =
= = = = = = = = = = = = = = = =



( (( ( ) )) )
2
1 1
Somme des carrs rsiduelle
l c
ij i j
i j
SCR x x x x
= = = = = = = =
= + = = + = = + = = + =



( (( ( ) )) )
2
1
Somme des carrs explique par les lignes
l
i
i
SCEL c x x
= == =
= = = = = = = =



( (( ( ) )) )
2
1
Somme des carrs explique par les colonnes
c
j
j
SCEC l x x
= == =
= = = = = = = =


Somme des carrs totale SCT SCEL SCEC SCR = + + = = + + = = + + = = + + =
Tableau ANOVA 2 facteurs :
SC ddl Variance
SC
ddl
= == =
obs
F
Lignes SCEL 1 l
1
SCEL
VEL
l
=


Lobs
VEL
F
VR
=
Colonnes SCEC 1 c
1
SCEC
VEC
c
=


Cobs
VEC
F
VR
=
Rsiduelle SCR ( )( ) 1 1 l c
( ) ( ) 1 1
SCR
VR
l c
=



Totale SCT 1 1 l c n =

Test sur les lignes
Hypothses :
( )
0 1 2
1 0
les moyennes sont gales pour le facteur :
:
l
A H
H H
= = =

i i i

,
Variable de dcision du test :
Sous
0
H et galit des variances : ( )( ) ( )
1; 1 1
VEL
F l l c
VR

Test sur les colonnes
Hypothses :
( )
0 1 2
1 0
les moyennes sont gales pour le facteur :
:
c
B H
H H
= = =

i i i

,
Variable de dcision du test :
Sous
0
H et galit des variances : ( ) ( ) ( )
1; 1 1
VEC
F c l c
VR

Page 9
TESTS DU
2
(TEST NON PARAMETRIQUE) :
H
0
ne concerne pas un paramtre mais les caractristiques de la population.
1 1 1 1
l c c l
ij i ij j ij
i j j i
n n n n n n
= = = = = = = = = = = = = = = =
= = = = = = = = = = = =
i i i i i i i i

Test dindpendance :
Hypothses :
0
1 0
: indpendance des variables
:
H
H H

,
thoriques Effectifs que l'on doit observer en cas d'indpendance :
i j
ij ij
n n
E e
n

= = = = = = = =
i i i i i i i i

observs Effectifs :
ij ij
O o = == =
Pour 5, ,
ij
e i j > > > > : Sous
0
H :
( (( ( ) )) )
( (( ( ) )) ) ( (( ( ) )) ) ( (( ( ) )) )
2
2
1 1
1 1
l c
ij ij
i j
ij
o e
l c
e
= = = = = = = =

Das könnte Ihnen auch gefallen