Beruflich Dokumente
Kultur Dokumente
A- Gnralits
B- Tests optimaux
A-1 Introduction
Faire un test de la valeur du paramtre consiste prendre une dcision concernant la valeur de
ce paramtre partir dun sondage de la population.
Ex :
X,
=E(X)?
( x1 ,..., xn )
" = 3"?
Au vu de lchantillon, peut-on confirmer cette hypothse?
A-1 Introduction
Principe
Dans la plupart des situations relles, il arrive que lon ait une ide de la
valeur de . On peut ds lors faire lhypothse de cette valeur. On cherchera
valider une hypothse de type :
H 0 : = 0
3.
( X 1000 )
Lorsque n>30, T =
X 1000
/ n
N (0,1)
P(T>-t)
P(T>t)
t =
x 1000
/ n
16%
16%
16%
Supposons lhypothse du
ministre soit vraie et que la
moyenne dchantillonnage soit
de x = 980 La probabilit
dobtenir une diffrence dau
moins 20 correspond un cartrduit de |z|=2.
P ( T 2) 4%
2%
2%
Wbar
W
-t0
W
t0
R p
H 0 : 0
H1 : 1
avec 0 ,1 ,0 1 =
H 0 : 0
Dans l'exemple prcdent, l'hypothse nulle est
H 0 : m = 1000
H1 : 1
Exemples dhypothses
Cas pratique :
H 0 : E ( X ) = 1000
H1 : E ( X ) 1000
H 0 : E ( X ) = m0
H1 : E ( X ) m0
H 0 : E ( X ) = m0
H1 : E ( X ) m0
H 0 : V ( X ) = 02
2
H1 : V ( X ) > 0
H 0 : X N (m, )
H1 : X E ( )
La dcision conduit choisir entre H0 et H1, toute dcision comportant une part de risque de
se tromper. Il y a 4 cas possibles :
Vrit
Dcision
H0 est vrai
On choisit H0
1- (OK)
On choisit H1
1- (OK)
P (choisir H 0 / H 0 vraie)=P ( 0 ) = 1
0
P (choisir H 0 / H1 vraie)=P ( 0 ) =
1
H1 est vrai
P (choisir H1 / H1 vraie)=P ( 1 ) = 1
1
P (choisir H1 / H 0 vraie)=P ( 1 ) =
0
est le risque de premire espce ou niveau de signification : cest le risque que lon prend
en rejetant tort H0 : le risque de penser que le ministre nest pas honnte.
est le risque de deuxime espce : cest le risque que lon prend en acceptant tort H0 : le
risque de ne pas avoir vu que le ministre est un menteur
Dans la pratique des tests statistiques, il est de rgle de fixer (ex : 5%, 1%,10%) car
cest le risque que lon veut contrler, que lon est prt prendre en rejetant tort H0.
Ce choix est bas sur la perception que l'on a de la gravit des consquences d'un rejet
injustifi de H0.
tant fix, sera dtermin comme le rsultat dun calcul . varie en sens contraire
de : si lon veut diminuer on est conduit ne rejeter H0 que dans des cas rares
donc conserver H0 bien souvent tort, donc on augmente (proba sous H1
daccepter H0)
Remarques :
Concevoir une statistique de test n'est pas une question simple. La plupart des tests
classiques reposent sur des statistiques dont l'identification a demand leurs
auteurs beaucoup d'efforts et d'imagination.
Une statistique de test n'a aucune raison d'tre unique, et le choix entre plusieurs
statistiques candidates est une question difficile., qui dterminera entre autre la
puissance du test.
T=
X m0
N(0,1) sous H0
Sn
Cas pratique :
connu :
inconnu :
Si X gaussienne ou n>30
T=
T=
X m0
T=
. T N(0,1) sous H0
X m0
. T N(0,1) sous H0
Sn
si X est gaussienne
T=
(n 1) Sn2
02
. T (n-1) sous H0
T N (0,1) sous H0
W = {( x1 ,...xn ) R n / on choisit H1 }
Lorsquon dispose dun statistique de test T et de sa loi sous H0, les ralisations de Wsont
celles pour lesquelles la valeur correspondante t de la statistique de test conduit rejeter
H0.
W = {t R / on choisit H }
1
W = {z R / on choisit H1 }
PH 0 ( z R / on choisit H1 ) = = ], q1 / 2 [ ]q1 / 2 , [
P(W / H 0 ) =
H 0 : = 0
On suppose que lon dispose dune statistique de test T et de sa loi sous H0.
Une rgion critique se dtermine en cherchant t0 tel que :
W =(t 0, +) ou W=(, t 0)
W = (, t 0) (t 0, +)
et nous favorisons la seconde explication parce que nous ne croyons pas dans les
vnements rares .
A contrario, "Ne pas rejeter l'hypothse nulle" ne veut pas dire "l'accepter comme vraie".
Cela veut seulement dire que les donnes ne sont pas en contradiction flagrante avec
Cette hypothse.
X m0
. T N(0,1) sous H0
Sn
1. Choix de H0 et H1
2. Choix de
3. Dtermination de la variable de dcision (statistique de
test) et de sa loi sous H0 (en fonction de H0 et H1, des
hypothses sur la distribution de X et de la taille de
lchantillon prlev)
4. Dtermination dune rgion critique en fonction de
5. Dcision (voir si les observations sont ou pas dans la
rgion critique)
6. Calcul ventuel de la puissance du test
B- Test optimal
R p
Soit 0 ,1 ,0 1 =
Au vu des rsultats dun sondage, on veut raliser un test de niveau de
Rappels :
H 0 : 0
contre
H :
1
1
La puissance
Croit avec niveau de signification
Croit avec la taille n de lchantillon
Dpend de la rgion critique
H0 : E( X ) = 0
H1 : E ( X ) 0
Statistique de test :
T = n X n / Sn Sous H 0 , T T (n 1)
P (W * / H 0 ) P (W / H 0 ),
P (W * / H1 ) P (W / H1 )
Test UPP : On dira quun test W* est uniformment le plus puissant
(UPP) dans la classe des tests de niveau si et seulement si il est meilleur
que tous les autres tests de niveau .
W ,W * R n / sup 0 P (W * ) = sup 0 P (W ) = ,
P(W * / H1 ) P(W / H1 )
Meilleure Rgion Critique (MRC) : Cest la rgion critique du test UPP,
si celui-ci existe.
< 1 ( )
1
Test convergent : Un test est dit convergent ssi 1 ( )
n
H 0 : = 0
(0)
H1 : = 1
W R n satisfaisant P (W / H 0 ) = et qui
1 = P(W / H1 )
Fonction maximiser
1 = P (W / H1 ) =
W
Contrainte :
L( x1 ,..., xn ,1 )
L( x1 ,..., xn , 0 )dx1...dxn .
L( x1 ,..., xn , 0 )
L( x1 ,..., xn ,1 )
W = ( x1 ,..., xn ) R n /
> k
L( x1 ,..., xn , 0 )
o
Interprtation : Lorsque H0 est vraie, lchantillon dont on dispose est plus probable
(plus vraisemblable) lorsque il est tir dune loi de paramtre 0 que de paramtre
1 : le rapport des vraisemblances est plus petit que sous H1.
g (t ,1 )
W = ( x1 ,..., xn ) R n /
> k
g (t , 0 )
H 0 : m = m0
H1 : m = m1
avec m1 > m0
Sol 1 :
donc
De la forme :
L( x1 ,..., xn , m) =
1
2
( xi m )
i =1
(2 ) n / 2
1
2 2
( n x 2 mnx + nm )
(2 ) n / 2
1
2 2
n
W = ( x1 ,..., xn ) R / x > (m1 + m0 ) +
ln k
2
n(m1 m0 )
W = {( x1 ,..., xn ) R n / x > k }
Sous H0,
X N (m0 ,
k m0
P (W / H 0 ) = = P0 ( X > k ) = 1
.
/ n
k=
Sol2 :
N (m0 ,
g (t ,1 )
W = ( x1 ,..., xn ) R n /
> k
g (t , 0 )
X N (m1 ,
k m1
1 = P1 ( X > k ) = 1
/ n
est la valeur de la fdr d'une N(0,1) au point
Application numrique :
=5%, m0=0, m1=1, s=1, n=100.
Rgion critique :
Puissance :
k =k =
k m1
/ n
q1 + m0 =
n
W = {x > 0.164}
1
*1.64
10
H 0 : = 0
(1)
H1 : > 0
ou
H 0 : = 0
(1')
H1 : < 0
W = x >
q1 + m0 ne
n
H1 : m > m0
H 0 : 0
contre
H :
1
1
Au risque , au vu dun chantillon de donnes de taille n.
NB : Lorsque (resp. 1 ) nest pas rduit un point , (resp. ) est une fonction de
0
la valeur du paramtre inconnu.
Problme : Quelle variable de dcision et quelles valeurs de cette variable fournit la
rgion critique optimale (en terme de puissance)?
Solution : En dehors des cas particuliers (0), (1), (1) et de quelques autres, il nexiste
pas en gnral , de test optimal pour (3)
sup 1 L( x1 ,..., xn , )
n
W = ( x1 ,..., xn ) R / =
> k
sup 0 L( x1 ,..., xn , )
P (W / H 0 )
'=
sup 0 1 L( x1 ,..., xn , )
sup 0 L( x1 ,..., xn , )
Cas du test de
H 0 : = 0
(2)
H1 : 0
H 0 : m = m0
H1 : m m0
Au vu dun chantillon iid de la population. Le test du rapport de vraisemblance
donne la rgion critique:
W = ( x1 ,..., xn ) R n / x m0 >
q1 / 2
n