Cours 6 : TESTS

of 49 /49
Cours 6 : TESTS A- Généralités B- Tests optimaux

Embed Size (px)

Transcript of Cours 6 : TESTS

  • Cours 6 : TESTS

    A- Gnralits

    B- Tests optimaux

  • A-1 Introduction

    Soit X une caractristique dont la distribution dpend de inconnu.

    Faire un test de la valeur du paramtre consiste prendre une dcision concernant la valeur de ce paramtre partir dun sondage de la population.

    Ex : P

    X, 1( ,..., )nx x

    Au vu de lchantillon, peut-on confirmer cette hypothse?

    X, =E(X)?

    " 3"? =

  • A-1 Introduction

    Principe

    Soit X une caractristique de la population dont la loi dpend dun paramtre inconnu .

    Dans la plupart des situations relles, il arrive que lon ait une ide de la Dans la plupart des situations relles, il arrive que lon ait une ide de la valeur de . On peut ds lors faire lhypothse de cette valeur. On cherchera

    valider une hypothse de type :

    Les techniques de test vont permettre de confirmer ou dinfirmer cette hypothse.

    0 0:H =

  • A-2 Principe dun test

    Exemple : Lors du recensement de lINSEE , Le ministre du travail a affirm aprs calcul :

    H0 : le salaire moyen m des franais est de 1000 euros par mois .

    Un statisticien est charg de vrifier ces dires au vu dun chantillon de lapopulation . On note le salaire X. Des relevs des salaires depuis depopulation . On note le salaire X. Des relevs des salaires depuis denombreuses annes ont permis dtablir que la dispersion des salaires franaisvaut . Il prlve un chantillon alatoire de taille 100 et calcule la valeur de lamoyenne dchantillonnage

    1. rejet de lhypothse du ministre que la vritable moyenne m=E(X) est de 1000, tant donn lcart important existant entre et la valeur hypothtique de m.

    2. il semble raisonnable daccepter lhypothse du ministre.

    x

    100x = x

    1001x =

  • A-2 Principe dun test

    3. la moyenne dchantillonnage nest ni trs grande ni trs petite par rapport la valeur hypothtique , de telle sorte que la dcision ne simpose pas delle-mme.

    980 ou 1010x =

    Il arrive frquemment que la valeur ne permette pas de trancher la dcision comme dans 3.

    De plus, mme lorsquelle parait simposer (1. et 2.) on nest jamais sr de ne pas tre tomb sur un chantillon ayant trs peu de chances de se raliser.

    Comment tre sur de prendre la bonne dcision ? jamais. Tout au plus, on peut prendre la dcision la plus probable.

    x

  • A-2 Principe dun test

    Base de dcision: combien grande ou significative doit tre la diffrence entre et laffirmation du ministre pour rejeter lgitimement cette affirmation?

    Rponse : on dispose de la loi de lcart

    sous H0 ou de faon quivalente de celle

    ( )1000X

    x

    sous H0 ou de faon quivalente de celle de lcart rduit :

    On peut alors dterminer la probabilit dobserver un cart absolu >= |t| (valeur de lcart observ) lorsquon est effectivement sous H0 (si cet cart des frquent ou non).

    1000Lorsque n>30, T (0,1)

    /

    XN

    n=

    P(T>t)P(T>-t)

  • A-2 Principe dun test

    Applications : Supposons que laffirmation du ministre

    soit vraie (=1000) et que la valeur obtenue soit de . Avec un cart-type de 100, les chances dobtenir une moyenne qui diffre dau moins 10 de 1000 , i.e. dobtenir un cart suprieur ou gal 10 en valeur absolue, c'est--dire un cart rduit de

    1010x =

    est de lorsquelhypothse du ministre est vraie..

    Cette probabilit est relativement forteet la diffrence de 10 nest pas suffisammentsignificative pour rfuter laffirmation duministre.

    10001

    /

    x

    nt

    =

    ( 1) 32%P T

    16%16% 16%16%

  • A-2 Principe dun test

    Supposons lhypothse du ministre soit vraie et que la moyenne dchantillonnage soit de La probabilit dobtenir une diffrence dau moins 20 correspond un cart-rduit de |z|=2.

    980x =

    Les chances de ralisation dune telle diffrence sont faibles ; on peut lgitiment rfuter lhypothse du ministre. Il existe une vidence statistique suffisante pour le faire.

    ( 2) 4%P T

    2%2%

  • A-2 Principe dun test

    Conclusion : il peut arriver quune moyenne dchantillonnage soit possible mais quen mme temps, son occurrence soit si faible que lon soit justifi de ne pas accepter lhypothse. La diffrence entre la moyenne dchantillonnage obtenue et la valeur prsume est considre comme suffisamment grande pour justifier le rejet lorsque la probabilit dobserver une telle diffrence est suffisamment faible. suffisamment faible.

    Que veut dire suffisamment faible ? Ce critre est subjectif. Il dpend des normes fixes par le dcideur lui-mme. Le seuil de probabilit tolr dpend du risque quil accepte de prendre en rejetant lhypothse alors quelle est vraie (il est en effet susceptible de se trompe r dans 100 % des cas sil fait un grand nombre de tests).

    Comme ce seuil est subjectif, il est fix avant dentreprendre le test par le dcideur lui-mme. Cette probabilit sappelle seuil de signification du test ou risque de premire espce.

  • A-2 Principe dun test

    Rgle de Dcision : Supposons que lon sefixe un seuil de =5%. Cela veut dire quelon considrera comme rare touteoccurrence dont la probabilitdapparition est infrieure ou gale 5%.

    Soit z0, la valeur telle que P(|T|>t0)=5% Ontablira la rgle de dcision suivante : tablira la rgle de dcision suivante :

    on rejettera lhypothse du ministre dslors que lcart rduit observ |t| estsuprieur t0, c'est--dire si z se situedans .W est la zone de rejet du test ou rgioncritique.

    on lacceptera si |t| est infrieur z0 envaleur absolue, c'est--dire z se situeendehors de la rgion critique : dans lazone dacceptation

    ( , 0) ( 0, )W t t= +

    [ ]0, 0W t t=

    -t0 t0

    Wbar

    WW

  • A-3 Notions gnrales

    Soit X une v.a. dont la loi dpend dun paramtre

    Dfinition dun test: Un test est un mcanisme permettant de trancher entre deux hypothses sur ce paramtre, au vu des rsultats dun sondage :

    pR

    0 0

    1 1

    :

    :

    H

    H

    0 1 0 1avec , , =

  • A-3 Notions gnrales

    Hypothse nulle, hypothse alternative

    Lhypothse que lon cherche vrifier sappelle hypothse nulle (note H0) . Elle porte sur la loi de probabilit (ou de facon quivalente le paramtre de cette loi) ayant donn naissance l'chantillon disponible.

    Dans l'exemple prcdent, l'hypothse nulle est

    0 0:H

    0 : 1000H m =

    Si le rsultat dchantillonnage conduit au rejet de lhypothse nulle, nous devrons alors en arriver une autre conclusion. La conclusion accepte dans ce cas sappelle hypothse alternative (note H1) .

    RQ : Il peut y en avoir plusieurs pour la mme hypothse nulle suivant le choix de

    Dans l'exemple prcdent,

    La dcision aboutira choisir entre ces deux hypothses.

    RQ : il se peut cependant que les hypothses, nulle et alternative, soient fausses toutes les deux , ex: H0 : m = m0 contre H1: m> m0 alors qu'en ralit m< m0 ).

    1 1: H

    11 : 1000H m

  • A-3 Notions gnrales

    Les hypothses H0 et H1 ne sont pas symtriques :

    o de mme que dans un procs dassises il y a prsomption dinnocence, en thorie des tests il y a prsomption de Ho: il faut montrer que Ho est peu probable pour dcider H1.

    o Par contre accepter Ho peut venir du fait que soit effectivement Ho est vraie, soit on na pas les moyens ncessaires de prouver H1. (ex: pas assez dobservations). on na pas les moyens ncessaires de prouver H1. (ex: pas assez dobservations).

    o H0 est gnralement une hypothse laquelle on tient particulirement, pour des raisons qui peuvent tre subjectives, ou que lon aimerait avoir des raisons de rfuter.

    - H0 est une hypothse solidement tablie et qui na pas t contredite par lexprience jusqualors.

    - H0 correspond une hypothse de prudence. Ex: test dinnocuit dun vaccin : il est prudent de partir dune hypothse dfavorable au nouveau produit.

    - H0 est la seule hypothse facile formuler.

  • A-3 Notions gnrales

    o H1 slabore en fonction de ce que lon espre dcouvrir du phnomne.

    Ex : si les rsultats exprimentaux d'un nouveau traitement de l'hypertension artrielle sont soumis un test, l'hypothse nulle est :

    H0 : le nouveau traitement n'a aucun effet.

    On espre que les donnes ne vont pas seulement dmentir l'hypothse nulle, mais vont aussi suggrer une rduction de la tension artrielle des patients. On formulera alors l'hypothse alternative :

    H1 : le nouveau traitement rduit la tension artrielle.

    plutt que l'hypothse plus gnrale mais moins utile :

    H1 : le nouveau traitement a un effet sur la tension artrielle.

  • A-3 Notions gnrales

    Vocabulaire sur les hypothses:

    o Hypothse simple, hypothse composite : H0 (resp. H1) est appele hypothse simple si lensemble (resp. ) est rduit un seul point.

    Ex : . Elle est dite composite dans le cas contraire.0 1

    0 0:H =

    o Test unilatral, bilatral : lorsque H0 est une hypothse simple le test est dit unilatral si H1 est de type

    et bilatral si

    0 0:H =1 0 1 0: ou :H H >

    0

    1

    : ( , )

    : ( )

    H X N m

    H X E

    1 0

    0 0

    1 0

    : ( )

    : ( )

    H E X m

    H E X m

    =

  • A-3 Notions gnrales

    Risques et probabilits derreurs

    La dcision conduit choisir entre H0 et H1, toute dcision comportant une part de risque dese tromper. Il y a 4 cas possibles :

    VritDcision

    H0 est vrai H1 est vrai

    0 0

    est le risque de premire espce ou niveau de signification : cest le risque que lon prend en rejetant tort H0 : le risque de penser que le ministre nest pas honnte.

    est le risque de deuxime espce : cest le risque que lon prend en acceptant tort H0 : le risque de ne pas avoir vu que le ministre est un menteur

    On choisit H0 1- (OK)

    On choisit H1 1- (OK)

    (choisir H / H vraie)= ( )1 0 10P P =

    (choisir H / H vraie)= ( ) 10 0 00P P =

    (choisir H / H vraie)= ( )0 1 01P P =

    (choisir H / H vraie)= ( ) 11 1 11P P =

  • A-3 Notions gnrales Dans la pratique des tests statistiques, il est de rgle de fixer (ex : 5%, 1%,10%) car

    cest le risque que lon veut contrler, que lon est prt prendre en rejetant tort H0. Ce choix est bas sur la perception que l'on a de la gravit des consquences d'un rejet injustifi de H0.

    tant fix, sera dtermin comme le rsultat dun calcul . varie en sens contraire de : si lon veut diminuer on est conduit ne rejeter H0 que dans des cas rares donc conserver H0 bien souvent tort, donc on augmente (proba sous H1

    daccepter H0)daccepter H0)

    1- est la probabilit dopter pour H1 en ayant raison et sappelle la puissance du test.

  • A-3 Notions gnrales

    La statistique du test : variable de dcision

    La conception d'un test passe par l'identification d'une statistique T =h(X1,..Xn) de lchantillon, appele statistique de test, jouant le rle de variable de dcision :

    elle doit apporter le maximum dinformation sur le problme pos.

    RQ : Pour des tests portant sur un paramtre , la statistique de test est souvent base sur une fonction dune statistique exhaustive du paramtre (souvent un cart entre un estimateur exhaustif du paramtre et la valeur de ce paramtre sous H0.)

    Sa loi doit tre diffrente sous H0 et sous H1.

    Il faut que sa loi soit entirement connue au moins sous H0.

  • A-3 Notions gnrales

    Remarques :

    Concevoir une statistique de test n'est pas une question simple. La plupart des tests classiques reposent sur des statistiques dont l'identification a demand leurs auteurs beaucoup d'efforts et d'imagination.

    Une statistique de test n'a aucune raison d'tre unique, et le choix entre plusieurs Une statistique de test n'a aucune raison d'tre unique, et le choix entre plusieurs statistiques candidates est une question difficile., qui dterminera entre autre la puissance du test.

    La statistique de test choisie et sa distribution sous H0 dpendent gnralement de la distribution de la population et/ou de la taille de lchantillon. Il sagit de prciser ces hypothses et de les vrifier ultrieurement.

    Ex : lorsque X est gaussienne de variance inconnue et n>30, le test de H0 : E(X)=m0 utilise la statistique

    0 N(0,1) sous H0n

    nX m

    TS

    =

  • A-3 Notions gnrales

    Exemples de statistiques de test :

    Cas pratique : Si X gaussienne ou n>30

    Test simple dune moyenne : si X gaussienne et n>30

    1000 T (0,1) sous H0

    10X

    T N=

    Test simple dune moyenne : si X gaussienne et n>30

    connu :

    inconnu :

    Test dune variance : si X est gaussienne

    0 . T N(0,1) sous H0X

    nX m

    T=

    0 . T N(0,1) sous H0n

    nX m

    TS

    =

    2

    20

    ( 1). T (n-1) sous H0n

    n ST

    =

  • A-3 Notions gnrales

    Rgion critique, zone dacceptation

    On appelle rgion critique W du test toute rgion de Rn contenant lensemble des ralisations de lchantillon alatoire conduisant au rejet de l'hypothse nulle.

    Lorsquon dispose dun statistique de test T et de sa loi sous H0, les ralisations de Wsont

    1 1{( ,... ) / on choisit H }n

    nW x x R=

    Lorsquon dispose dun statistique de test T et de sa loi sous H0, les ralisations de Wsontcelles pour lesquelles la valeur correspondante t de la statistique de test conduit rejeterH0.

    La dtermination dune rgion critique W dpend de et se fait en crivant :

    Ex : cas pratique :

    0( / )P W H =

    A contrario, la zone dacceptation est le complmentaire dans Rn de la

    zone de rejet

    1{ / on choisit H }W t R=

    1{ / on choisit H }W z R=

    ] [ ] [0 1 1 / 2 1 / 2( / on choisit H ) , ,HP z R q q = =

  • A-3 Notions gnrales

    Pour une statistique de test donne, cest un intervalle rel (cg, cd) . Cg et cd s'appellent les valeurs critiques

    Pour le niveau de signification choisi, les valeurs critiques sont telles que la somme des aires sous la courbe que la somme des aires sous la courbe de la densit de la statistique gauche de cg et droite de cd est gale .

    Pour une statistique de test, un seuil

    Et une taille dchantillon donns, la

    Rgion Critique n'est pas unique . Ex: La

    Figure montre que cg = - cd , mais

    Toute paire de valeurs (cg , cd ) dfinissant

    Une aire sous la courbe gale dfinit

    Une rgion critique.

  • A-3 Notions gnrales

    Exemple: On considre un test simple de lhypothse

    On suppose que lon dispose dune statistique de test T et de sa loi sous H0.

    Une rgion critique se dtermine en cherchant t0 tel que :

    0 0:H =

    Une rgion critique se dtermine en cherchant t0 tel que :

    Dans le cas dun test unilatral (H1 de type > ou t0)= (ou P(Tt0)= On a alors :

    ( 0, ) ou W=( , 0)W t t= +

    ( , 0) ( 0, )W t t= +

  • A-3 Notions gnrales

    p-value

    Dans un test unilatral (disons,

    droite), Cest la probabilit sous H0 pour

    que la statistique prenne une valeur au

    moins aussi grande que sa valeur calcule T

    Sur lchantillon (cest aire sous la courbe de

    La densit de la statistique la droite de T).

    H0 est rejete si la p-value est plus

    petite que le niveau de signification

    Dans le cas dun test bilatral cest laire

    sous la courbe de La densit de la

    statistique la droite de T et la gauche de -T,si

    T>0.

  • A-3 Notions gnrales

    Rgle de dcision :

    Une fois choisie une rgion critique, l'hypothse nulle est rejete comme trop peuVraisemblable si la valeur de lchantillon (ou de la statistique de test ) est l'intrieur decette rgion critique. Sinon, l'hypothse nulle n'est pas rejete. (si elle est dans la zonedacceptation)

    La dcision de rejet est donc base sur le fait que, devant une valeur improbable delchantillon nous avons le choix entre deux interprtations :

    H0 est vraie, et la valeur observe de la statistique est trs improbable, H0 est fausse,

    et nous favorisons la seconde explication parce que nous ne croyons pas dans les vnements rares .

    A contrario, "Ne pas rejeter l'hypothse nulle" ne veut pas dire "l'accepter comme vraie".Cela veut seulement dire que les donnes ne sont pas en contradiction flagrante avecCette hypothse.

  • A-3 Notions gnrales

    Exemple : Test bilatral dune hypothse simple sur la moyenne :

    H0 : E(X)=m0 contre H1 : E(X)m0

    On suppose X gaussien. On utilise la stat de test

    X m=

    On accepte H0 si la valeur t observe de T se situe lextrieur de W. ie, si | t| t0

    0 . T N(0,1) sous H0n

    nX m

    TS

    =

  • A-3 Notions gnrales

    Rsum : Dmarche dun test

    1. Choix de H0 et H12. Choix de 3. Dtermination de la variable de dcision (statistique de

    test) et de sa loi sous H0 (en fonction de H0 et H1, des 3. Dtermination de la variable de dcision (statistique de

    test) et de sa loi sous H0 (en fonction de H0 et H1, des hypothses sur la distribution de X et de la taille de lchantillon prlev)

    4. Dtermination dune rgion critique en fonction de 5. Dcision (voir si les observations sont ou pas dans la

    rgion critique)6. Calcul ventuel de la puissance du test

  • B- Test optimal

  • B-1 Puissance et rgion critique

    Soit X une v.a. dont la loi dpend dun paramtre

    Au vu des rsultats dun sondage, on veut raliser un test de niveau de

    pR

    0 0:

    contre

    H

    0 1 0 1Soit , , =

    Rappels :

    Lorsque H0 est une hypothse composite dpend de la vrai valeur inconnue du paramtre tudie. Le niveau du test est alors dfini par :

    A moins que H1 soit une hypothse simple, dpend de . Normalement, la puissance augmente lorsquon sloigne de lhypothse nulle.

    1 1: H

    0 1 1

    1 1

    0 0

    1

    Niveau : ( ) (choisir H / H vraie)= ( )= ( ) ( /1

    (choisir H / H vraie)= ( ) ( ) ( /1 1 1

    )

    Puissance : 1 ( ) )

    P P P W P W H

    P P P W P W H

    = =

    = = =

    0( )sup P W =

  • B-1 Puissance et rgion critique

    Un test de niveau et taille dchantillon donns est dautant meilleur que sa puissance est grande, i.e. que lon ne se trompe pas en rejetant H0.

    Pour et n fixs, la qualit dun test est caractrise par sa puissance.

    La puissance

    Croit avec niveau de signification

    Croit avec la taille n de lchantillon

    Dpend de la rgion critique

    Pour une taille d'chantillon et un niveau de signification donns,

    la puissance du test ne dpend plus que du choix de la rgion critique choisie

    toutes les rgions critiques (i.e. tous les tests) ne fournissent pas la mme puissance.

  • B-1 Puissance et rgion critique

    Exemple : Soit X gaussienne de variance inconnue, de moyenne inconnue. On teste au seuil 5%:

    0

    1

    : ( ) 0

    : ( ) 0

    H E X

    H E X

    =

    Statistique de test :

    0/ Sous H , ( 1)n nT nX S T T n=

  • B-1 Puissance et rgion critique

    1 rgion critique (i.e. premier test): la prsence de la valeur de la statistique de test dans la rgion critique ne suggre pas que H1 soit vraie : le test a une puissance trs faible.

    2 rgion critique l(i.e. deuxime test) a prsence de la valeur de la statistique dans la rgion critique suggre que la moyenne de X est plus petite (resp. plus grande) que 0, un argument en faveur de H1 : La

    puissance du test est importante.

  • B-1 Puissance et rgion critique

    Objectif : Etant donns n et fixs, on aimerait identifier la rgion critique qui maximise la puissance du test., cest--dire un domaine de Rn

    parmi lensemble de toutes les ralisations possibles de lchantillon (X1,Xn) de probabilit infrieurs ou gale et de puissance maximale.

    NB Dfinir un test revient dfinir sa rgion critique.

  • B-2 Qualit dun test

    Dfinitions:

    Un test de rgion critique W* est meilleur quun test de rgion critique W si et seulement si :

    *0 0

    *1 1

    ( / ) ( / ),

    ( / ) ( / )

    P W H P W H

    P W H P W H

    Test UPP : On dira quun test W* est uniformment le plus puissant (UPP) dans la classe des tests de niveau si et seulement si il est meilleur que tous les autres tests de niveau .

    Meilleure Rgion Critique (MRC) : Cest la rgion critique du test UPP, si celui-ci existe.

    0 0

    * *

    *1 1

    , / sup ( ) sup ( ) ,

    ( / ) ( / )

    nW W R P W P W

    P W H P W H

    = =

  • B-2 Qualit dun test

    Test sans biais : Un test est dit sans biais ssi

    Test convergent : Un test est dit convergent ssi

    1 ( ) <

    1 ( ) 1n

  • B-2 Qualit dun test

    Existence dun test UPP:

    Le problme du choix de la rgion critique optimale (ou de faconquivalente du test optimal) a t rsolu thoriquement par Neyman et Pearson pour le test entre deux hypothses simples.Pearson pour le test entre deux hypothses simples.

    Dans le cas gnral dune hypothse H1 composite, H1 regroupe plusieurs valeurs du paramtre inconnu . La puissance dun test dpend de la vrai valeur de , que lon ne connait pas et que lon tudie. Cest donc une fonction (1-()) de . Il est alors gnralement impossible de trouver un test ayant une puissance optimale pour tous les possibles . En gnral, une rgion critique fournit une puissance suprieure une autre pour certaines valeurs de et infrieure pour dautres valeurs de .

  • B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson

    Soit X une variable alatoire de densit f(x,) o est un paramtre inconnu. On cherche tester :

    Au niveau , au vu dun chantillon de donnes de taille n.

    0 0

    1 1

    :(0)

    :

    H

    H

    = =

    R

    NB : Ici, et sont des valeurs et non des fonctions, car la valeur du paramtre est

    Connue sous chaque hypothses.

    Problme : Existe-t-il une variable de dcision et des valeurs de cette variable qui fournissent la rgion critique optimale ? Quelles sont-elles?

    Formalisation : on cherche satisfaisant et qui

    maximise

    nW R 0( / )P W H =

    11 ( / )P W H =

  • B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson

    Soit L la vraisemblance de lchantillon.

    Fonction maximiser

    1 1 1( / ) (( ,.., ) ) ( ,..., , ) ... , {0,1}.ii n n i nW

    P W H P X X W L x x dx dx i = =

    1 1( ,..., , )1 ( / ) ( ,..., , ) ... .nL x x

    P W H L x x dx dx = =

    Contrainte :

    1 11 1 0 1

    1 0

    ( ,..., , )1 ( / ) ( ,..., , ) ... .

    ( ,..., , )n

    n nnW

    L x xP W H L x x dx dx

    L x x

    = =

    0 0 1 0 1( / ) ( / ) ( ,..., , ) ... .n nW

    P W H P W H L x x dx dx = = =

  • B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson

    Solution : Thorme de Neyman-Pearson (admis) : Pour n et fixs, il existe un test de niveau UPP (optimal) pour (0) dans la classe des tests de niveau , dfini par la rgion critique :

    1 11

    1 0

    ( ,..., , )( ,..., ) /

    ( ,..., , )n n

    nn

    L x xW x x R k

    L x x

    = >

    o est dtermine de telle sorte que :

    W sappelle la rgion critique de Neyman-Pearson

    Le test de (0) ayant cette rgion critique sappelle test de Neyman-Pearson ou test du rapport de vraisemblance.

    Interprtation : Lorsque H0 est vraie, lchantillon dont on dispose est plus probable (plus vraisemblable) lorsque il est tir dune loi de paramtre que de paramtre : le rapport des vraisemblances est plus petit que sous H1.

    k 0( / )P W H =

    01

  • B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson

    Proprits du test de Neyman-Pearson (admises)

    P0 : Le test ainsi constitu est lunique test UPP

    P1 : Le test ainsi constitu est sans biais

    P2 : Le test ainsi constitu est convergent, i.e.

    P3 : Sil existe une statistique exhaustive T pour de densit g(t,) 1

    10

    ( , )( ,..., ) /

    ( , )n

    n

    g tW x x R k

    g t

    = >

  • B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson

    Exemple Soit X de loi N(m,) o connu et m inconnu. On veut tester :

    Calcul de la Rgion critique de Neyman-Pearson (de niveau ):

    0 0

    1 1

    :

    :

    H m m

    H m m

    = = 1 0

    avec m m>

    1 1( ) ( 2 )

    n

    x m n x mnx nm +

    Sol 1 :

    donc

    De la forme :

    2 21

    1 1( ) ( 2 )2 2

    1 / 2 / 2( ,..., , )

    (2 ) (2 )

    ii

    x m n x mnx nm

    n n n

    e eL x x m

    =

    +

    = =

    2

    1 1 01 0

    1 2( ,..., ) / ( ) ln

    2 ( )n

    nW x x R x m m kn m m = > + +

    { }1( ,..., ) /nnW x x R x k= >

  • B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson

    La variable de dcision (statistique de test) est . Sous H0,

    k se dtermine alors en considrant que (avec fdr de la loi N(0,1))

    0( , )X N mn

    0

    00( / ) ( ) 1 .

    /

    k mP W H P X k

    n

    = = > =

    X

    Sol2 : est une statistique exhaustive pour m, de loi .

    Daprs P3, la rgion critique est de la forme

    On retrouve la mme que prcdemment.

    1 0 1 o est le quantile d'ordre 1 d'une N(0,1)k q m qn

    = +

    11

    0

    ( , )( ,..., ) /

    ( , )n

    n

    g tW x x R k

    g t

    = >

    X 0( , )N mn

  • B3- Test entre deux hypothses simples: La mthode de Neyman-Pearson

    Calcul de la puissance :

    Sous H1,

    On calcule la puissance par :

    1

    11 ( ) 1/

    k mP X k

    n

    = > =

    1( , )X N mn

    Application numrique :

    =5%, m0=0, m1=1, s=1, n=100.

    Rgion critique :

    Puissance :

    1

    /

    est la valeur de la fdr d'une N(0,1) au point /

    n

    k m

    n

    1 0

    1*1.64

    10

    { 0.164}

    k k q mn

    W x

    = = + =

    = >

    ( ) ( )1

    1 ( ) 1 8.35 8.35 1P X k = > = = =

  • B4- Test dune hypothse simple contre une alternative composite unilatrale

    Soit X une variable alatoire de densit f(x,) o est un paramtre inconnu. On cherche tester :

    ou

    Au risque , au vu dun chantillon de donnes de taille n.

    NB : Ici, est une valeur et est une fonction de la valeur du paramtre inconnu.

    0 0

    1 0

    :(1')

    :

    H

    H

    =

    Problme : Quelle variable de dcision et quelles valeurs de cette variable fournit la rgion critique optimale (en terme de puissance)?

    Solution (Proprit ): Si la rgion critique du test de Neyman-Pearson pour(0) ne dpends pas de 1 , alors ce test est UPP pour (1) (si 1 > 0) ou (1 )(si 0 > 1)parmi tous les tests de niveau .

    Exemple : Dans lexemple prcdent, on a vu que ne

    dpend pas de m1. Donc le test de rgion critique W est UPP pour

    1 0W x q mn

    = > +

    0 0

    1 0

    :

    :

    H m m

    H m m

    = >

  • B5- Cas gnral

    On considre le cas gnral du test dhypothses

    Au risque , au vu dun chantillon de donnes de taille n.

    0 0

    1 1

    :

    contre

    :

    H

    H

    Au risque , au vu dun chantillon de donnes de taille n.

    NB : Lorsque (resp. ) nest pas rduit un point , (resp. ) est une fonction dela valeur du paramtre inconnu.

    Problme : Quelle variable de dcision et quelles valeurs de cette variable fournit la rgion critique optimale (en terme de puissance)?

    Solution : En dehors des cas particuliers (0), (1), (1) et de quelques autres, il nexistepas en gnral , de test optimal pour (3)

    0 1

  • B5- Cas gnral

    Test du rapport des vraisemblances : on appelle test du rapport de vraisemblance, le test dfini par la rgion critique :

    o est dtermine de telle sorte que :

    1

    0

    11

    1

    sup ( ,..., , )( ,..., ) /

    sup ( ,..., , )nn

    nn

    L x xW x x R k

    L x x

    = = >

    k ( / )P W H o est dtermine de telle sorte que :

    NB : On obtient le mme test en remplaant par

    ds lors que le sup dans la dfinition de est atteint.

    Proprits

    La loi asymptotique de 2ln est une loi du chi2 p degrs de libert (p=dimde )

    Le test du rapport de vraisemblances est convergent

    k 0( / )P W H

    0 1

    0

    1

    1

    sup ( ,..., , )'

    sup ( ,..., , )n

    n

    L x x

    L x x

    =

  • B5- Cas gnral

    Cas particuliers du test du rapport des vraisemblances :

    Cas (0) = Le test du rapport des vraisemblances est le test de Neyman-Pearson, optimal.

    Cas (1), (1): Le test du rapport des vraisemblances est le test de Neyman-Pearson, optimal.

    Cas du test de Cas du test de

    O est lestimateur du maximum de vraisemblance de .

    0 0

    1 0

    :(2)

    :

    H

    H

    =

    1 11

    1 0 1 0

    sup ( ,..., , ) ( ,..., , )( ,..., ) /

    ( ,..., , ) ( ,..., , )n n n n

    nn n

    L x x L x xW x x R k

    L x x L x x

    = = = >

    n

  • Exemple : Soit X une population de loi N(m,), connu. On veut tester

    Au vu dun chantillon iid de la population. Le test du rapport de vraisemblance

    0 0

    1 0

    :

    :

    H m m

    H m m

    =

    Au vu dun chantillon iid de la population. Le test du rapport de vraisemblance donne la rgion critique:

    1 0 1 / 2( ,..., ) /n

    nW x x R x m qn

    = >