Cours 6 : TESTS
Embed Size (px)
Transcript of Cours 6 : TESTS
-
Cours 6 : TESTS
A- Gnralits
B- Tests optimaux
-
A-1 Introduction
Soit X une caractristique dont la distribution dpend de inconnu.
Faire un test de la valeur du paramtre consiste prendre une dcision concernant la valeur de ce paramtre partir dun sondage de la population.
Ex : P
X, 1( ,..., )nx x
Au vu de lchantillon, peut-on confirmer cette hypothse?
X, =E(X)?
" 3"? =
-
A-1 Introduction
Principe
Soit X une caractristique de la population dont la loi dpend dun paramtre inconnu .
Dans la plupart des situations relles, il arrive que lon ait une ide de la Dans la plupart des situations relles, il arrive que lon ait une ide de la valeur de . On peut ds lors faire lhypothse de cette valeur. On cherchera
valider une hypothse de type :
Les techniques de test vont permettre de confirmer ou dinfirmer cette hypothse.
0 0:H =
-
A-2 Principe dun test
Exemple : Lors du recensement de lINSEE , Le ministre du travail a affirm aprs calcul :
H0 : le salaire moyen m des franais est de 1000 euros par mois .
Un statisticien est charg de vrifier ces dires au vu dun chantillon de lapopulation . On note le salaire X. Des relevs des salaires depuis depopulation . On note le salaire X. Des relevs des salaires depuis denombreuses annes ont permis dtablir que la dispersion des salaires franaisvaut . Il prlve un chantillon alatoire de taille 100 et calcule la valeur de lamoyenne dchantillonnage
1. rejet de lhypothse du ministre que la vritable moyenne m=E(X) est de 1000, tant donn lcart important existant entre et la valeur hypothtique de m.
2. il semble raisonnable daccepter lhypothse du ministre.
x
100x = x
1001x =
-
A-2 Principe dun test
3. la moyenne dchantillonnage nest ni trs grande ni trs petite par rapport la valeur hypothtique , de telle sorte que la dcision ne simpose pas delle-mme.
980 ou 1010x =
Il arrive frquemment que la valeur ne permette pas de trancher la dcision comme dans 3.
De plus, mme lorsquelle parait simposer (1. et 2.) on nest jamais sr de ne pas tre tomb sur un chantillon ayant trs peu de chances de se raliser.
Comment tre sur de prendre la bonne dcision ? jamais. Tout au plus, on peut prendre la dcision la plus probable.
x
-
A-2 Principe dun test
Base de dcision: combien grande ou significative doit tre la diffrence entre et laffirmation du ministre pour rejeter lgitimement cette affirmation?
Rponse : on dispose de la loi de lcart
sous H0 ou de faon quivalente de celle
( )1000X
x
sous H0 ou de faon quivalente de celle de lcart rduit :
On peut alors dterminer la probabilit dobserver un cart absolu >= |t| (valeur de lcart observ) lorsquon est effectivement sous H0 (si cet cart des frquent ou non).
1000Lorsque n>30, T (0,1)
/
XN
n=
P(T>t)P(T>-t)
-
A-2 Principe dun test
Applications : Supposons que laffirmation du ministre
soit vraie (=1000) et que la valeur obtenue soit de . Avec un cart-type de 100, les chances dobtenir une moyenne qui diffre dau moins 10 de 1000 , i.e. dobtenir un cart suprieur ou gal 10 en valeur absolue, c'est--dire un cart rduit de
1010x =
est de lorsquelhypothse du ministre est vraie..
Cette probabilit est relativement forteet la diffrence de 10 nest pas suffisammentsignificative pour rfuter laffirmation duministre.
10001
/
x
nt
=
( 1) 32%P T
16%16% 16%16%
-
A-2 Principe dun test
Supposons lhypothse du ministre soit vraie et que la moyenne dchantillonnage soit de La probabilit dobtenir une diffrence dau moins 20 correspond un cart-rduit de |z|=2.
980x =
Les chances de ralisation dune telle diffrence sont faibles ; on peut lgitiment rfuter lhypothse du ministre. Il existe une vidence statistique suffisante pour le faire.
( 2) 4%P T
2%2%
-
A-2 Principe dun test
Conclusion : il peut arriver quune moyenne dchantillonnage soit possible mais quen mme temps, son occurrence soit si faible que lon soit justifi de ne pas accepter lhypothse. La diffrence entre la moyenne dchantillonnage obtenue et la valeur prsume est considre comme suffisamment grande pour justifier le rejet lorsque la probabilit dobserver une telle diffrence est suffisamment faible. suffisamment faible.
Que veut dire suffisamment faible ? Ce critre est subjectif. Il dpend des normes fixes par le dcideur lui-mme. Le seuil de probabilit tolr dpend du risque quil accepte de prendre en rejetant lhypothse alors quelle est vraie (il est en effet susceptible de se trompe r dans 100 % des cas sil fait un grand nombre de tests).
Comme ce seuil est subjectif, il est fix avant dentreprendre le test par le dcideur lui-mme. Cette probabilit sappelle seuil de signification du test ou risque de premire espce.
-
A-2 Principe dun test
Rgle de Dcision : Supposons que lon sefixe un seuil de =5%. Cela veut dire quelon considrera comme rare touteoccurrence dont la probabilitdapparition est infrieure ou gale 5%.
Soit z0, la valeur telle que P(|T|>t0)=5% Ontablira la rgle de dcision suivante : tablira la rgle de dcision suivante :
on rejettera lhypothse du ministre dslors que lcart rduit observ |t| estsuprieur t0, c'est--dire si z se situedans .W est la zone de rejet du test ou rgioncritique.
on lacceptera si |t| est infrieur z0 envaleur absolue, c'est--dire z se situeendehors de la rgion critique : dans lazone dacceptation
( , 0) ( 0, )W t t= +
[ ]0, 0W t t=
-t0 t0
Wbar
WW
-
A-3 Notions gnrales
Soit X une v.a. dont la loi dpend dun paramtre
Dfinition dun test: Un test est un mcanisme permettant de trancher entre deux hypothses sur ce paramtre, au vu des rsultats dun sondage :
pR
0 0
1 1
:
:
H
H
0 1 0 1avec , , =
-
A-3 Notions gnrales
Hypothse nulle, hypothse alternative
Lhypothse que lon cherche vrifier sappelle hypothse nulle (note H0) . Elle porte sur la loi de probabilit (ou de facon quivalente le paramtre de cette loi) ayant donn naissance l'chantillon disponible.
Dans l'exemple prcdent, l'hypothse nulle est
0 0:H
0 : 1000H m =
Si le rsultat dchantillonnage conduit au rejet de lhypothse nulle, nous devrons alors en arriver une autre conclusion. La conclusion accepte dans ce cas sappelle hypothse alternative (note H1) .
RQ : Il peut y en avoir plusieurs pour la mme hypothse nulle suivant le choix de
Dans l'exemple prcdent,
La dcision aboutira choisir entre ces deux hypothses.
RQ : il se peut cependant que les hypothses, nulle et alternative, soient fausses toutes les deux , ex: H0 : m = m0 contre H1: m> m0 alors qu'en ralit m< m0 ).
1 1: H
11 : 1000H m
-
A-3 Notions gnrales
Les hypothses H0 et H1 ne sont pas symtriques :
o de mme que dans un procs dassises il y a prsomption dinnocence, en thorie des tests il y a prsomption de Ho: il faut montrer que Ho est peu probable pour dcider H1.
o Par contre accepter Ho peut venir du fait que soit effectivement Ho est vraie, soit on na pas les moyens ncessaires de prouver H1. (ex: pas assez dobservations). on na pas les moyens ncessaires de prouver H1. (ex: pas assez dobservations).
o H0 est gnralement une hypothse laquelle on tient particulirement, pour des raisons qui peuvent tre subjectives, ou que lon aimerait avoir des raisons de rfuter.
- H0 est une hypothse solidement tablie et qui na pas t contredite par lexprience jusqualors.
- H0 correspond une hypothse de prudence. Ex: test dinnocuit dun vaccin : il est prudent de partir dune hypothse dfavorable au nouveau produit.
- H0 est la seule hypothse facile formuler.
-
A-3 Notions gnrales
o H1 slabore en fonction de ce que lon espre dcouvrir du phnomne.
Ex : si les rsultats exprimentaux d'un nouveau traitement de l'hypertension artrielle sont soumis un test, l'hypothse nulle est :
H0 : le nouveau traitement n'a aucun effet.
On espre que les donnes ne vont pas seulement dmentir l'hypothse nulle, mais vont aussi suggrer une rduction de la tension artrielle des patients. On formulera alors l'hypothse alternative :
H1 : le nouveau traitement rduit la tension artrielle.
plutt que l'hypothse plus gnrale mais moins utile :
H1 : le nouveau traitement a un effet sur la tension artrielle.
-
A-3 Notions gnrales
Vocabulaire sur les hypothses:
o Hypothse simple, hypothse composite : H0 (resp. H1) est appele hypothse simple si lensemble (resp. ) est rduit un seul point.
Ex : . Elle est dite composite dans le cas contraire.0 1
0 0:H =
o Test unilatral, bilatral : lorsque H0 est une hypothse simple le test est dit unilatral si H1 est de type
et bilatral si
0 0:H =1 0 1 0: ou :H H >
0
1
: ( , )
: ( )
H X N m
H X E
1 0
0 0
1 0
: ( )
: ( )
H E X m
H E X m
=
-
A-3 Notions gnrales
Risques et probabilits derreurs
La dcision conduit choisir entre H0 et H1, toute dcision comportant une part de risque dese tromper. Il y a 4 cas possibles :
VritDcision
H0 est vrai H1 est vrai
0 0
est le risque de premire espce ou niveau de signification : cest le risque que lon prend en rejetant tort H0 : le risque de penser que le ministre nest pas honnte.
est le risque de deuxime espce : cest le risque que lon prend en acceptant tort H0 : le risque de ne pas avoir vu que le ministre est un menteur
On choisit H0 1- (OK)
On choisit H1 1- (OK)
(choisir H / H vraie)= ( )1 0 10P P =
(choisir H / H vraie)= ( ) 10 0 00P P =
(choisir H / H vraie)= ( )0 1 01P P =
(choisir H / H vraie)= ( ) 11 1 11P P =
-
A-3 Notions gnrales Dans la pratique des tests statistiques, il est de rgle de fixer (ex : 5%, 1%,10%) car
cest le risque que lon veut contrler, que lon est prt prendre en rejetant tort H0. Ce choix est bas sur la perception que l'on a de la gravit des consquences d'un rejet injustifi de H0.
tant fix, sera dtermin comme le rsultat dun calcul . varie en sens contraire de : si lon veut diminuer on est conduit ne rejeter H0 que dans des cas rares donc conserver H0 bien souvent tort, donc on augmente (proba sous H1
daccepter H0)daccepter H0)
1- est la probabilit dopter pour H1 en ayant raison et sappelle la puissance du test.
-
A-3 Notions gnrales
La statistique du test : variable de dcision
La conception d'un test passe par l'identification d'une statistique T =h(X1,..Xn) de lchantillon, appele statistique de test, jouant le rle de variable de dcision :
elle doit apporter le maximum dinformation sur le problme pos.
RQ : Pour des tests portant sur un paramtre , la statistique de test est souvent base sur une fonction dune statistique exhaustive du paramtre (souvent un cart entre un estimateur exhaustif du paramtre et la valeur de ce paramtre sous H0.)
Sa loi doit tre diffrente sous H0 et sous H1.
Il faut que sa loi soit entirement connue au moins sous H0.
-
A-3 Notions gnrales
Remarques :
Concevoir une statistique de test n'est pas une question simple. La plupart des tests classiques reposent sur des statistiques dont l'identification a demand leurs auteurs beaucoup d'efforts et d'imagination.
Une statistique de test n'a aucune raison d'tre unique, et le choix entre plusieurs Une statistique de test n'a aucune raison d'tre unique, et le choix entre plusieurs statistiques candidates est une question difficile., qui dterminera entre autre la puissance du test.
La statistique de test choisie et sa distribution sous H0 dpendent gnralement de la distribution de la population et/ou de la taille de lchantillon. Il sagit de prciser ces hypothses et de les vrifier ultrieurement.
Ex : lorsque X est gaussienne de variance inconnue et n>30, le test de H0 : E(X)=m0 utilise la statistique
0 N(0,1) sous H0n
nX m
TS
=
-
A-3 Notions gnrales
Exemples de statistiques de test :
Cas pratique : Si X gaussienne ou n>30
Test simple dune moyenne : si X gaussienne et n>30
1000 T (0,1) sous H0
10X
T N=
Test simple dune moyenne : si X gaussienne et n>30
connu :
inconnu :
Test dune variance : si X est gaussienne
0 . T N(0,1) sous H0X
nX m
T=
0 . T N(0,1) sous H0n
nX m
TS
=
2
20
( 1). T (n-1) sous H0n
n ST
=
-
A-3 Notions gnrales
Rgion critique, zone dacceptation
On appelle rgion critique W du test toute rgion de Rn contenant lensemble des ralisations de lchantillon alatoire conduisant au rejet de l'hypothse nulle.
Lorsquon dispose dun statistique de test T et de sa loi sous H0, les ralisations de Wsont
1 1{( ,... ) / on choisit H }n
nW x x R=
Lorsquon dispose dun statistique de test T et de sa loi sous H0, les ralisations de Wsontcelles pour lesquelles la valeur correspondante t de la statistique de test conduit rejeterH0.
La dtermination dune rgion critique W dpend de et se fait en crivant :
Ex : cas pratique :
0( / )P W H =
A contrario, la zone dacceptation est le complmentaire dans Rn de la
zone de rejet
1{ / on choisit H }W t R=
1{ / on choisit H }W z R=
] [ ] [0 1 1 / 2 1 / 2( / on choisit H ) , ,HP z R q q = =
-
A-3 Notions gnrales
Pour une statistique de test donne, cest un intervalle rel (cg, cd) . Cg et cd s'appellent les valeurs critiques
Pour le niveau de signification choisi, les valeurs critiques sont telles que la somme des aires sous la courbe que la somme des aires sous la courbe de la densit de la statistique gauche de cg et droite de cd est gale .
Pour une statistique de test, un seuil
Et une taille dchantillon donns, la
Rgion Critique n'est pas unique . Ex: La
Figure montre que cg = - cd , mais
Toute paire de valeurs (cg , cd ) dfinissant
Une aire sous la courbe gale dfinit
Une rgion critique.
-
A-3 Notions gnrales
Exemple: On considre un test simple de lhypothse
On suppose que lon dispose dune statistique de test T et de sa loi sous H0.
Une rgion critique se dtermine en cherchant t0 tel que :
0 0:H =
Une rgion critique se dtermine en cherchant t0 tel que :
Dans le cas dun test unilatral (H1 de type > ou t0)= (ou P(Tt0)= On a alors :
( 0, ) ou W=( , 0)W t t= +
( , 0) ( 0, )W t t= +
-
A-3 Notions gnrales
p-value
Dans un test unilatral (disons,
droite), Cest la probabilit sous H0 pour
que la statistique prenne une valeur au
moins aussi grande que sa valeur calcule T
Sur lchantillon (cest aire sous la courbe de
La densit de la statistique la droite de T).
H0 est rejete si la p-value est plus
petite que le niveau de signification
Dans le cas dun test bilatral cest laire
sous la courbe de La densit de la
statistique la droite de T et la gauche de -T,si
T>0.
-
A-3 Notions gnrales
Rgle de dcision :
Une fois choisie une rgion critique, l'hypothse nulle est rejete comme trop peuVraisemblable si la valeur de lchantillon (ou de la statistique de test ) est l'intrieur decette rgion critique. Sinon, l'hypothse nulle n'est pas rejete. (si elle est dans la zonedacceptation)
La dcision de rejet est donc base sur le fait que, devant une valeur improbable delchantillon nous avons le choix entre deux interprtations :
H0 est vraie, et la valeur observe de la statistique est trs improbable, H0 est fausse,
et nous favorisons la seconde explication parce que nous ne croyons pas dans les vnements rares .
A contrario, "Ne pas rejeter l'hypothse nulle" ne veut pas dire "l'accepter comme vraie".Cela veut seulement dire que les donnes ne sont pas en contradiction flagrante avecCette hypothse.
-
A-3 Notions gnrales
Exemple : Test bilatral dune hypothse simple sur la moyenne :
H0 : E(X)=m0 contre H1 : E(X)m0
On suppose X gaussien. On utilise la stat de test
X m=
On accepte H0 si la valeur t observe de T se situe lextrieur de W. ie, si | t| t0
0 . T N(0,1) sous H0n
nX m
TS
=
-
A-3 Notions gnrales
Rsum : Dmarche dun test
1. Choix de H0 et H12. Choix de 3. Dtermination de la variable de dcision (statistique de
test) et de sa loi sous H0 (en fonction de H0 et H1, des 3. Dtermination de la variable de dcision (statistique de
test) et de sa loi sous H0 (en fonction de H0 et H1, des hypothses sur la distribution de X et de la taille de lchantillon prlev)
4. Dtermination dune rgion critique en fonction de 5. Dcision (voir si les observations sont ou pas dans la
rgion critique)6. Calcul ventuel de la puissance du test
-
B- Test optimal
-
B-1 Puissance et rgion critique
Soit X une v.a. dont la loi dpend dun paramtre
Au vu des rsultats dun sondage, on veut raliser un test de niveau de
pR
0 0:
contre
H
0 1 0 1Soit , , =
Rappels :
Lorsque H0 est une hypothse composite dpend de la vrai valeur inconnue du paramtre tudie. Le niveau du test est alors dfini par :
A moins que H1 soit une hypothse simple, dpend de . Normalement, la puissance augmente lorsquon sloigne de lhypothse nulle.
1 1: H
0 1 1
1 1
0 0
1
Niveau : ( ) (choisir H / H vraie)= ( )= ( ) ( /1
(choisir H / H vraie)= ( ) ( ) ( /1 1 1
)
Puissance : 1 ( ) )
P P P W P W H
P P P W P W H
= =
= = =
0( )sup P W =
-
B-1 Puissance et rgion critique
Un test de niveau et taille dchantillon donns est dautant meilleur que sa puissance est grande, i.e. que lon ne se trompe pas en rejetant H0.
Pour et n fixs, la qualit dun test est caractrise par sa puissance.
La puissance
Croit avec niveau de signification
Croit avec la taille n de lchantillon
Dpend de la rgion critique
Pour une taille d'chantillon et un niveau de signification donns,
la puissance du test ne dpend plus que du choix de la rgion critique choisie
toutes les rgions critiques (i.e. tous les tests) ne fournissent pas la mme puissance.
-
B-1 Puissance et rgion critique
Exemple : Soit X gaussienne de variance inconnue, de moyenne inconnue. On teste au seuil 5%:
0
1
: ( ) 0
: ( ) 0
H E X
H E X
=
Statistique de test :
0/ Sous H , ( 1)n nT nX S T T n=
-
B-1 Puissance et rgion critique
1 rgion critique (i.e. premier test): la prsence de la valeur de la statistique de test dans la rgion critique ne suggre pas que H1 soit vraie : le test a une puissance trs faible.
2 rgion critique l(i.e. deuxime test) a prsence de la valeur de la statistique dans la rgion critique suggre que la moyenne de X est plus petite (resp. plus grande) que 0, un argument en faveur de H1 : La
puissance du test est importante.
-
B-1 Puissance et rgion critique
Objectif : Etant donns n et fixs, on aimerait identifier la rgion critique qui maximise la puissance du test., cest--dire un domaine de Rn
parmi lensemble de toutes les ralisations possibles de lchantillon (X1,Xn) de probabilit infrieurs ou gale et de puissance maximale.
NB Dfinir un test revient dfinir sa rgion critique.
-
B-2 Qualit dun test
Dfinitions:
Un test de rgion critique W* est meilleur quun test de rgion critique W si et seulement si :
*0 0
*1 1
( / ) ( / ),
( / ) ( / )
P W H P W H
P W H P W H
Test UPP : On dira quun test W* est uniformment le plus puissant (UPP) dans la classe des tests de niveau si et seulement si il est meilleur que tous les autres tests de niveau .
Meilleure Rgion Critique (MRC) : Cest la rgion critique du test UPP, si celui-ci existe.
0 0
* *
*1 1
, / sup ( ) sup ( ) ,
( / ) ( / )
nW W R P W P W
P W H P W H
= =
-
B-2 Qualit dun test
Test sans biais : Un test est dit sans biais ssi
Test convergent : Un test est dit convergent ssi
1 ( ) <
1 ( ) 1n
-
B-2 Qualit dun test
Existence dun test UPP:
Le problme du choix de la rgion critique optimale (ou de faconquivalente du test optimal) a t rsolu thoriquement par Neyman et Pearson pour le test entre deux hypothses simples.Pearson pour le test entre deux hypothses simples.
Dans le cas gnral dune hypothse H1 composite, H1 regroupe plusieurs valeurs du paramtre inconnu . La puissance dun test dpend de la vrai valeur de , que lon ne connait pas et que lon tudie. Cest donc une fonction (1-()) de . Il est alors gnralement impossible de trouver un test ayant une puissance optimale pour tous les possibles . En gnral, une rgion critique fournit une puissance suprieure une autre pour certaines valeurs de et infrieure pour dautres valeurs de .
-
B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson
Soit X une variable alatoire de densit f(x,) o est un paramtre inconnu. On cherche tester :
Au niveau , au vu dun chantillon de donnes de taille n.
0 0
1 1
:(0)
:
H
H
= =
R
NB : Ici, et sont des valeurs et non des fonctions, car la valeur du paramtre est
Connue sous chaque hypothses.
Problme : Existe-t-il une variable de dcision et des valeurs de cette variable qui fournissent la rgion critique optimale ? Quelles sont-elles?
Formalisation : on cherche satisfaisant et qui
maximise
nW R 0( / )P W H =
11 ( / )P W H =
-
B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson
Soit L la vraisemblance de lchantillon.
Fonction maximiser
1 1 1( / ) (( ,.., ) ) ( ,..., , ) ... , {0,1}.ii n n i nW
P W H P X X W L x x dx dx i = =
1 1( ,..., , )1 ( / ) ( ,..., , ) ... .nL x x
P W H L x x dx dx = =
Contrainte :
1 11 1 0 1
1 0
( ,..., , )1 ( / ) ( ,..., , ) ... .
( ,..., , )n
n nnW
L x xP W H L x x dx dx
L x x
= =
0 0 1 0 1( / ) ( / ) ( ,..., , ) ... .n nW
P W H P W H L x x dx dx = = =
-
B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson
Solution : Thorme de Neyman-Pearson (admis) : Pour n et fixs, il existe un test de niveau UPP (optimal) pour (0) dans la classe des tests de niveau , dfini par la rgion critique :
1 11
1 0
( ,..., , )( ,..., ) /
( ,..., , )n n
nn
L x xW x x R k
L x x
= >
o est dtermine de telle sorte que :
W sappelle la rgion critique de Neyman-Pearson
Le test de (0) ayant cette rgion critique sappelle test de Neyman-Pearson ou test du rapport de vraisemblance.
Interprtation : Lorsque H0 est vraie, lchantillon dont on dispose est plus probable (plus vraisemblable) lorsque il est tir dune loi de paramtre que de paramtre : le rapport des vraisemblances est plus petit que sous H1.
k 0( / )P W H =
01
-
B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson
Proprits du test de Neyman-Pearson (admises)
P0 : Le test ainsi constitu est lunique test UPP
P1 : Le test ainsi constitu est sans biais
P2 : Le test ainsi constitu est convergent, i.e.
P3 : Sil existe une statistique exhaustive T pour de densit g(t,) 1
10
( , )( ,..., ) /
( , )n
n
g tW x x R k
g t
= >
-
B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson
Exemple Soit X de loi N(m,) o connu et m inconnu. On veut tester :
Calcul de la Rgion critique de Neyman-Pearson (de niveau ):
0 0
1 1
:
:
H m m
H m m
= = 1 0
avec m m>
1 1( ) ( 2 )
n
x m n x mnx nm +
Sol 1 :
donc
De la forme :
2 21
1 1( ) ( 2 )2 2
1 / 2 / 2( ,..., , )
(2 ) (2 )
ii
x m n x mnx nm
n n n
e eL x x m
=
+
= =
2
1 1 01 0
1 2( ,..., ) / ( ) ln
2 ( )n
nW x x R x m m kn m m = > + +
{ }1( ,..., ) /nnW x x R x k= >
-
B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson
La variable de dcision (statistique de test) est . Sous H0,
k se dtermine alors en considrant que (avec fdr de la loi N(0,1))
0( , )X N mn
0
00( / ) ( ) 1 .
/
k mP W H P X k
n
= = > =
X
Sol2 : est une statistique exhaustive pour m, de loi .
Daprs P3, la rgion critique est de la forme
On retrouve la mme que prcdemment.
1 0 1 o est le quantile d'ordre 1 d'une N(0,1)k q m qn
= +
11
0
( , )( ,..., ) /
( , )n
n
g tW x x R k
g t
= >
X 0( , )N mn
-
B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson
Calcul de la puissance :
Sous H1,
On calcule la puissance par :
1
11 ( ) 1/
k mP X k
n
= > =
1( , )X N mn
Application numrique :
=5%, m0=0, m1=1, s=1, n=100.
Rgion critique :
Puissance :
1
/
est la valeur de la fdr d'une N(0,1) au point /
n
k m
n
1 0
1*1.64
10
{ 0.164}
k k q mn
W x
= = + =
= >
( ) ( )1
1 ( ) 1 8.35 8.35 1P X k = > = = =
-
B4- Test dune hypothse simple contre une alternative composite unilatrale
Soit X une variable alatoire de densit f(x,) o est un paramtre inconnu. On cherche tester :
ou
Au risque , au vu dun chantillon de donnes de taille n.
NB : Ici, est une valeur et est une fonction de la valeur du paramtre inconnu.
0 0
1 0
:(1')
:
H
H
=
Problme : Quelle variable de dcision et quelles valeurs de cette variable fournit la rgion critique optimale (en terme de puissance)?
Solution (Proprit ): Si la rgion critique du test de Neyman-Pearson pour(0) ne dpends pas de 1 , alors ce test est UPP pour (1) (si 1 > 0) ou (1 )(si 0 > 1)parmi tous les tests de niveau .
Exemple : Dans lexemple prcdent, on a vu que ne
dpend pas de m1. Donc le test de rgion critique W est UPP pour
1 0W x q mn
= > +
0 0
1 0
:
:
H m m
H m m
= >
-
B5- Cas gnral
On considre le cas gnral du test dhypothses
Au risque , au vu dun chantillon de donnes de taille n.
0 0
1 1
:
contre
:
H
H
Au risque , au vu dun chantillon de donnes de taille n.
NB : Lorsque (resp. ) nest pas rduit un point , (resp. ) est une fonction dela valeur du paramtre inconnu.
Problme : Quelle variable de dcision et quelles valeurs de cette variable fournit la rgion critique optimale (en terme de puissance)?
Solution : En dehors des cas particuliers (0), (1), (1) et de quelques autres, il nexistepas en gnral , de test optimal pour (3)
0 1
-
B5- Cas gnral
Test du rapport des vraisemblances : on appelle test du rapport de vraisemblance, le test dfini par la rgion critique :
o est dtermine de telle sorte que :
1
0
11
1
sup ( ,..., , )( ,..., ) /
sup ( ,..., , )nn
nn
L x xW x x R k
L x x
= = >
k ( / )P W H o est dtermine de telle sorte que :
NB : On obtient le mme test en remplaant par
ds lors que le sup dans la dfinition de est atteint.
Proprits
La loi asymptotique de 2ln est une loi du chi2 p degrs de libert (p=dimde )
Le test du rapport de vraisemblances est convergent
k 0( / )P W H
0 1
0
1
1
sup ( ,..., , )'
sup ( ,..., , )n
n
L x x
L x x
=
-
B5- Cas gnral
Cas particuliers du test du rapport des vraisemblances :
Cas (0) = Le test du rapport des vraisemblances est le test de Neyman-Pearson, optimal.
Cas (1), (1): Le test du rapport des vraisemblances est le test de Neyman-Pearson, optimal.
Cas du test de Cas du test de
O est lestimateur du maximum de vraisemblance de .
0 0
1 0
:(2)
:
H
H
=
1 11
1 0 1 0
sup ( ,..., , ) ( ,..., , )( ,..., ) /
( ,..., , ) ( ,..., , )n n n n
nn n
L x x L x xW x x R k
L x x L x x
= = = >
n
-
Exemple : Soit X une population de loi N(m,), connu. On veut tester
Au vu dun chantillon iid de la population. Le test du rapport de vraisemblance
0 0
1 0
:
:
H m m
H m m
=
Au vu dun chantillon iid de la population. Le test du rapport de vraisemblance donne la rgion critique:
1 0 1 / 2( ,..., ) /n
nW x x R x m qn
= >