Tests de comparaison de...
Transcript of Tests de comparaison de...
Tests de comparaison de pourcentages
Docteur Alexandrine Lambert
>
Faculté
de Pharmacie
Comparer deux pourcentages
•
Pourcentage
–
Variable qualitative dichotomique(Présence/Absence, Malades/Non malades, Décès/Survie, …)
–
π
est
le
pourcentage
(inconnu)
d’individus
présentant
la caractéristique dans la population
–
π
est estimé
par le pourcentage p
observé
sur un échantillon de taille n dont k individus présentent la caractéristique
nk
p =
Comparer deux pourcentages
Comparaison
de
deux
pourcentages
dans
le
cas
des
grands échantillons.
•
Comparaison
d’un
pourcentage
observé
à
un
pourcentage théorique
• Comparaison de deux pourcentages observés
–
Échantillons indépendants
–
Échantillons appariés
Comparer deux pourcentages
Comparaison
de
deux
pourcentages
dans
le
cas
des
grands échantillons.
•
Comparaison
d’un
pourcentage
observé
à
un
pourcentage théorique
• Comparaison de deux pourcentages observés
–
Échantillons indépendants
–
Échantillons appariés
Comparer un pourcentage à une valeur théorique
•
Problème
:
déterminer
si
un
pourcentage
observé
p
sur
un échantillon de taille n est différent d’une valeur théorique πth
Comparer π à πth
Populationπ
(inconnu)
Populationde référenceπth (connu)
Échantillonp
Comparer un pourcentage à une valeur théorique
•
Formuler une hypothèse
–
Hypothèse nulle H0
•
π
=
πth
où
π
est
le
pourcentage
de
la
population
dont
est
issu l’échantillon
–
Hypothèses alternatives H1
•
Test bilatéral : π
≠
π
th
•
Test unilatéral à gauche ou à droite : π
< π
th
ou π
> π
th
Comparer un pourcentage à une valeur théorique
•
Fixer le risque α
•
Choisir la statistique
–
Test du χ2
de conformité
(loi du X2)
–
Test z (loi normale)
•
Conditions d’application :
–
n. πth
≥
5 et
n.(1‐
πth
) ≥
5 (cas des grands échantillons)
Comparer un pourcentage à une valeur théorique
Test du χ2 de conformité
•
Calculer la valeur χ2
prise par la statistique du test
–
Tableau
–
Conditions d’application : C1
≥
5 et C2
≥
5
–
–
Sous H0
la statistique suit une loi du X2
à 1 ddl2
222
1
2112
C)C(O
C)C(O
χ−
+−
=
Effectifs observés O1
= n.p O2
= n.(1‐p) n
Effectifs calculés C1
= n.πth C2
= n.(1‐πth
) n
Comparer un pourcentage à une valeur théorique
Test du χ2 de conformité
•
Confronter à la valeur seuil
–
Lecture de la valeur seuil dans la table de la loi du χ2
–
Test bilatéral : on rejette H0
au risque α
si •
En pratique, si α
= 5%,
–
Si : rejet de H0
–
Si : non rejet de H0
2χ 21,αχ
21,α
2 χ χ ≥
3,84 χ2 <
3,84χ21,α =
3,84 χ2 ≥
Comparer un pourcentage à une valeur théorique
•
Exemple 1
–
En
France,
7%
des
personnes
hospitalisées
contractent
une infection
nosocomiale
dans
l'établissement
où
elles
sont
soignées.
–
Sur
un
échantillon
de
250
personnes
soignées
à
l’hôpital
H, 28 ont contracté
une infection nosocomiale.
–
Le
pourcentage
observé
sur
l’échantillon
diffère‐t‐il
de
la référence nationale au risque α
= 5% ?
Comparer un pourcentage à une valeur théorique
6,77232,5232,5)(222
17,517,5)(28
χ22
2 =−
+−
=
0,07π ; 0,11225028
p ; 250n th ====
Infection nosocomiale OUI NON Total
Effectifs observés O1 = 28 O2 = 222 250 Effectifs calculés C1 = 250x0,07 = 17,5 C2 = 250x0,93 = 232,5 250
Comparer un pourcentage à une valeur théorique
Test du χ2 : exemple 1
•
Lecture
•
3,84
: rejet de H0
On montre, au risque 5%, une différence significative entre le
pourcentage de
personnes
hospitalisées
contractant
une
infection
nosocomiale
à
l’hôpital H et dans l’ensemble du pays (p < 0,01).
=≥= 25% 1,
2 χ 6,77χ
Comparer un pourcentage à une valeur théorique
Test z
•
Calculer la valeur z prise par la statistique Z
n)π.(1π
πpz
thth
th
−−
= Équivalence entre χ2
et test z : χ2
= z2
χ2
à 1 ddl
est le carré
d’une loi normale centrée réduite
Équivalent à C1 et C2 ≥
5
–
–
Sous
H0
,
Z suit
une
loi normale centrée réduite
–
Conditions
d’application
: n.πth
≥
5 et n.(1‐
πth
) ≥
5
Comparer un pourcentage à une valeur théorique
Test z
•
Confronter z à la valeur critique zα–
Test bilatéral : on rejette H0
si |z|≥
zα–
Test unilatéral :•
si H1
s’écrit π
> πth
, on rejette H0
si z
≥
z2α•
si H1
s’écrit π
< πth
, on rejette H0
si z
≤ ‐z2α
Pour un même risque d’erreur, les valeurs seuil du χ2
sont donc
les carrés des valeurs seuil de z : χ21,α
=(zα
)2
(3,84 =1,962)
Comparer un pourcentage à une valeur théorique
Test z : exemple 1•
Données :
•
Hypothèses : H0
: π
= 0,07 ; H1
: π
≠
0,07
•
Calcul
–
–
Conditions d’application vérifiées : 250 x 0,07 ≥
5 et 250 x 0,93 ≥
5
2,60
2500,93)0,07.(1
0,070,112z =
−−
=
0,07π ; 0,11225028
p ; 250n th ====
Comparer un pourcentage à une valeur théorique
Test z : exemple 1
•
Lecture
•
z = 2,60 ≥
z0,05
=1,96
: rejet de H0
Degré
de signification lu dans la table : p < 0,01
(même conclusion que test précédent)
Comparer deux pourcentages
Comparaison
de
deux
pourcentages
dans
le
cas
des
grands échantillons.
•
Comparaison
d’un
pourcentage
observé
à
un
pourcentage théorique
• Comparaison de deux pourcentages observés
–
Échantillons indépendants
–
Échantillons appariés
Comparer 2 pourcentages observés - Échantillons indépendants -
•
Problème
: comparer 2 proportions (p1
et p2
) dans 2 groupes indépendants de tailles n1
et n2Comparer π1 à π2
Populationπ1
Échantillonp1
Populationπ2
Échantillonp2
Comparer 2 pourcentages observés - Échantillons indépendants -
•
Formuler une hypothèse
–
Hypothèse nulle H0
•
Les
2
échantillons
sont
issus
de
la
même
population
ayant
comme pourcentage π0
π1
=
π2
(=
π0
)
où
π1
et
π2
pourcentages
de
la
population
dont
sont
issus
les
échantillons 1 et 2
–
Hypothèses alternatives H1
•
Test bilatéral : π1
≠
π2
•
Test unilatéral : π1
< π2
ou π1
> π2
Comparer 2 pourcentages observés - Échantillons indépendants -
•
Fixer le risque α
•
Choisir la statistique :
–
Test du χ2
(loi du χ2)
–
Test z (loi normale)
•
Conditions d’application :
–
n1
. π0
≥
5 et n1
.(1‐
π0
) ≥
5
–
n2
. π0
≥
5 et n1
.(1‐
π0
) ≥
5
Comparer 2 pourcentages observés - Échantillons indépendants -
Test du χ2
•
Calculer la valeur χ2
prise par la statistique–
Tableau de contingence (tableau à 4 cases)
–
Conditions d’application : Cij
≥
5
–
–
Sous HO
la statistique suit une loi du X2
à 1 ddl
∑−
=ji, ij
2ijij2
C
)C(Oχ
Effectifs calculés
sous H0
:
N
nn'C ji
ij =
Succès Échec Total Groupe 1 O11 (C11) O12 (C12) n1 Groupe 2 O21 (C21) O22 (C22) n2
Total n’1 n’2 N
Comparer 2 pourcentages observés - Échantillons indépendants -
Test du χ2 : Remarques
•
Dans
le
cas
des
tableaux
de
contingence
à 4
cases,
il
est possible
d’utiliser
la
correction
de
continuité,
surtout
lorsque
les valeurs attendues sont faibles (en pratique Cij
< 5)
•
Petits échantillons : test exact de Fisher (hors programme)
( )∑
−=
ji, ij
ijij2
C
0,5‐COχ
2
Comparer 2 pourcentages observés - Échantillons indépendants -
Test du χ2
•
Confronter à la valeur critique
–
Lecture de la valeur seuil dans la table
–
Test bilatéral :•
Si : rejet de H0
•
Si : non rejet de H0
2χ 21,αχ
21,α
2 χχ ≥21,α
2 χχ <
Comparer 2 pourcentages observés - Échantillons indépendants -
•
Exemple 2
–
On désire comparer l’efficacité
de deux traitements T1 et T2 sur 100 patients atteints d’une maladie M.
–
On tire au sort 2 deux groupes de 50 patients, un groupe est soumis à T1, le second à T2.
–
Le pourcentage de guérison chez les patients soumis à T1 est de 30%, chez ceux soumis à T2 de 40%.
–
Le taux de guérison est‐il différent entre les 2 traitements ?
Comparer 2 pourcentages observés - Échantillons indépendants -
Test du χ2 : exemple 2•
Données :
•
Hypothèses : H0
: π1
= π2
; H1
: π1
≠
π2
•
Calcul
–
Conditions d’application vérifiées : Cij
≥
5
– 1,1032,532,5)(30
32,532,5)(35
17,517,5)‐(20
17,517,5)‐(15
χ2222
2 =−
+−
++=
0,4p ; 50n et 0,3p ;50n 2211 ====
Guéris Non guéris Total Groupe T1 15 (17,5) 35 (32,5) 50
Groupe T2 20 (17,5) 30 (32,5) 50 Total 35 65 100
Comparer 2 pourcentages observés - Échantillons indépendants -
Test du χ2 : exemple 2
•
Lecture
•
3,84
: H0
acceptable.On
ne
met
pas
en
évidence,
au
risque
5%,
de
différence
significative
entre
les taux de guérison avec les 2 traitements
=<= 25% 1,
2 χ 1,10χ
Comparer 2 pourcentages observés - Échantillons indépendants -
Test z
•
Calculer la valeur z prise par la statistique Z
–
–
p0
est l'estimation de la proportion commune π0
–
Z suit une loi normale centrée réduite
–
Conditions d’application :•
n1
.
π0
≥
5 et n1
.(1‐ π0
) ≥
5 •
n2
.
π0
≥
5 et n2
.(1‐ π0
) ≥
5
2
00
1
00
21
n)p.(1p
n)p.(1p
ppz
−+
−−
= χ2
= (z)2
Cij
≥
5
Х2
à 1 ddl
est le carré d’une loi normale
centrée réduite
21
22110 nn
.pn.pnp
++
=avec
Comparer 2 pourcentages observés - Échantillons indépendants -
Test z
•
Confronter z à la valeur critique zα–
Test bilatéral : on rejette H0
si |z|≥
zα–
Test unilatéral :•
si H1
s’écrit π1
> π
2
, on rejette H0
si z
≥
z2α•
si H1
s’écrit π
1
< π
2
, on rejette H0
si z
≤ ‐z2α
Comparer 2 pourcentages observés - Échantillons indépendants -
Test z : exemple 2•
Données :
•
Hypothèses : H0
: π1
= π2
; H1
: π1
≠
π2
•
Calcul
–
Conditions d’application vérifiées : 50 x 0,35 ≥
5 et 50 x 0,65 ≥
5
1,05
500,35x0,65
500,35x0,65
0,40,3z =
+
−=
0,4p ; 50n et 0,3p ;50n 2211 ====
0,35505050x0,450x0,3
p0 =++
=
Comparer 2 pourcentages observés - Échantillons indépendants -
Test z : exemple 2
•
Lecture
•
z = 1,05 < z0,05
= 1,96
: H0
acceptable(Même conclusion que le test précédent)
Comparer deux pourcentages
Comparaison
de
deux
pourcentages
dans
le
cas
des
grands échantillons.
•
Comparaison
d’un
pourcentage
observé
à
un
pourcentage théorique
• Comparaison de deux pourcentages observés
–
Échantillons indépendants
–
Échantillons appariés
Comparer 2 pourcentages observés - Séries appariées -
•
Variable aléatoire qualitative dichotomique
•
Cas des grands échantillons
•
Individus de 2 échantillons liés–
Présence d’une caractéristique sur les mêmes sujets
–
Présence d’une caractéristique chez des sujets appariés
•
Problème
: on s’intéresse aux taux de guérison chez des sujets ayant reçus un traitement T1 et des sujets appariés
ayant reçus
un
traitement
T2
:
on
cherche
à comparer
p1
et
p2
les
taux
de guérison avec T1 et T2.
Comparer 2 pourcentages observés - Séries appariées -
•
Formuler une hypothèse
–
Hypothèse nulle H0
•
π1
= π
2
où
π1
et π2
pourcentages inconnus des 2 populations d’où
sont issus les échantillons
–
Hypothèses alternatives H1
•
Test bilatéral : π1
≠ π2
•
Test unilatéral : π1
< π2
ou π1
> π2
Comparer 2 pourcentages observés - Séries appariées -
•
Tableau des valeurs–
Pour
tenir
compte
de
l’appariement,
il
faut
faire apparaître
quels
sont
les
sujets
qui
appartiennent
aux
mêmes paires.
–
Pour
chaque
paire
d’individus, on
peut
observer,
selon
s’il
y
a
présence
(+)
ou
absence
(‐)
du caractère
étudié,
l’une
des
4
configurations possibles.
Échantillon 1 Échantillon 2Nombre
de paires
+ + a
+ ‐ b
‐ + c
‐ ‐ d
Comparer 2 pourcentages observés - Séries appariées -
–
Les
paires
concordantes
n’apportent
pas
d’information
sur
la
liaison entre
le
traitement
et
la
guérison.
On
doit
donc
se
fonder
sur
la
répartition des paires discordantes.
–
Si l’hypothèse H0
est vraie, il doit y avoir autant de paires discordantes du type +‐
que de type ‐+
–
Tester H0
revient donc à tester si le pourcentage observé
de paires ‐+ est significativement différent de la valeur théorique 0,5.
Éch. 2
+ ‐ Total
Éch. 1+ a b a+b
‐ c d c+d
Total a+c b+d n
Comparer 2 pourcentages observés - Séries appariées -
•
Fixer le risque α
•
Choisir la statistique
–
Test du χ2
de McNemar
(loi du X2)
–
Test z (loi normale)
–
Conditions d’application
Comparer 2 pourcentages observés - Séries appariées -
cbc)(b
2cb2cb
‐c
2cb2cb
‐bχ
2
22
2
+−
=+
⎟⎠⎞
⎜⎝⎛ +
++
⎟⎠⎞
⎜⎝⎛ +
=
+‐ ‐+Effectifs observés b c b+c
Effectifs calculés b c2
b c2 b+c
52cb
≥+
Comparer 2 pourcentages observés - Séries appariées -
Test de McNemar (χ2) : remarques
•
Il
est
possible
d’utiliser
la
correction
de
continuité,
surtout lorsque les valeurs attendues sont faibles
( )cb
1cb
2cb
0,5‐2cb
‐c
2cb
0,5‐2cb
‐bχ
2
22
20 +
−−=+
⎟⎠⎞
⎜⎝⎛ +
++
⎟⎠⎞
⎜⎝⎛ +
=
Comparer 2 pourcentages observés - Séries appariées -
Test de McNemar (χ2)
•
Confronter à la valeur critique –
Lecture de la valeur seuil dans la table
–
Test bilatéral : on rejette H0
si •
Si : rejet de H0
•
Si : non rejet de H0
2χ 21,αχ
2α 1,
2 χχ ≥21,α
2 χχ <
Comparer 2 pourcentages observés - Séries appariées -
Test z
•
Calculer la valeur z prise par la statistique Z
–
–
Z suit une loi normale centrée réduite
–
Conditions d’application : b+c ≥
10
cb
cb
c).0,5.0,5(b2cb
bz
+−
=+
+−
= χ2
= (z)2
Х2
à 1 ddl
est le carré d’une loi normale
centrée réduite
Comparer 2 pourcentages observés - Séries appariées -
Test z
•
Confronter z à la valeur critique zα–
Test bilatéral : on rejette H0
si |z|≥
zα–
Test unilatéral :•
si H1
s’écrit π1
> π2
, on rejette H0
si z
≥
z2α•
si H1
s’écrit π1
< π2
, on rejette H0
si z
≤ ‐z2α
Comparer 2 pourcentages observés - Séries appariées -
•
Exemple 3–
On
désire
comparer
l’efficacité
de
deux
traitements
T1
et
T2
chez
100 patients atteint d’une maladie M.
–
Les
deux
traitements
sont
administrés
aux
patients.
L’ordre d’administration
des
2
traitements
est
tiré
au
sort
en
ménageant
une
période dite de wash‐out
entre les 2 administrations.
–
Les résultats sont les suivants :
–
Le taux de guérison est‐il différent entre les deux traitements ?
T1 Succès Échec
T2Succès 24 16 Échec 6 54
Comparer 2 pourcentages observés - Séries appariées -
Test de McNemar : exemple 3
•
On cherche à comparer les pourcentages observés :
•
Hypothèses : H0
: π1
= π2
; H1
: π1
≠ π2
•
Conditions
d’application
vérifiées
:
nombre
de
paires discordantes = 16 + 6 = 22 ≥
10
• 4,556)(166)‐(16
χ2
2 =+
=
30100
624,=
+=1p 40
1001624
,=+
=2p
Comparer 2 pourcentages observés - Séries appariées -
Test de McNemar : exemple 3
•
Lecture
•
3,84
: H0
rejetéeOn
montre,
au
risque
5%,
une
différence
significative
entre
les
taux
de
guérison avec les 2 traitements (p<0,05).
=≥= 25% 1,
2 χ 4,55χ