Test du 2 : test d'indépendance et test d'homogénéité...

87
Principe Ad´ equation Ind´ ependance Cas part. Test du χ 2 : test d’ind´ ependance et test d’homog´ en´ eit´ e PCEM2 — Biostatistique Pr. Nicolas MEYER ——————— Laboratoire de Biostatistique et Informatique M´ edicale Fac. de M´ edecine de Strasbourg ——————— evrier 2011

Transcript of Test du 2 : test d'indépendance et test d'homogénéité...

Page 1: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Test du χ2 :test d’independance et test d’homogeneite

PCEM2 — Biostatistique

Pr. Nicolas MEYER

———————Laboratoire de Biostatistique et Informatique Medicale

Fac. de Medecine de Strasbourg———————

Fevrier 2011

Page 2: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Site internet du LBIM

http ://udsmed.u-strasbg.fr/labiostat/spip.php ?article2

Page 3: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 χ2 d’adequationComparaison d’une proportion a une referenceComparaison d’une repartition a une repartition theorique

3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales

4 Cas particuliersCas des series apparieesCas des petits effectifs

Page 4: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 χ2 d’adequation

3 χ2 d’independance

4 Cas particuliers

Page 5: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Contexte

Cours precedent : comparaison de deux proportions

peut se formaliser differement

comme la comparaison de la repartition de deux distributionsbinomiales

peut s’etendre a plus de deux proportions : comparaisons detrois proportions de succes

peut s’etendre a la comparaisons de distributionsmultinomiales : au moins deux groupes ayant au moins deuxmodalites pour chaque variable : comparaison de la repartitionde l’intensite d’un symptome en 3 classes selon l’exposition atrois toxiques differents

Page 6: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Notion de tableau de contingence

Exemple : Comparaison de deux proportions

• dans les cours precedents : pA = 110/200 et pB = 80/190 etcomparaison (( directe )) par le test z

• Une autre presentation est possible :

TMT A TMT B Total

Succes 110 80 190Echecs 90 110 200

Total 200 190 390

Soit un tableau a 4 cases.

Page 7: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Notion de tableau de contingence

Exemple : Comparaison de deux proportions

• dans les cours precedents : pA = 110/200 et pB = 80/190 etcomparaison (( directe )) par le test z

• Une autre presentation est possible :

TMT A TMT B Total

Succes 110 80 190Echecs 90 110 200

Total 200 190 390

Soit un tableau a 4 cases.

Page 8: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Notion de loi multinomiale

Rappel :

• la loi binomiale : B(n; p) : nombre de succes parmi n sujetsayant chacun une probabilite p d’avoir un succes.

• si resultat de l’experience aleatoire a plus que deux issues (doncautre que succes-echec) → loi multinomiale

• Ex. : groupes sanguins : un sujet appartient a l’un des 4 groupespossibles.

• modelise par la loi multinomiale

• distribution multinomiale : quand les sujets peuvent etre classesdans une parmi plus de deux modalites.

Page 9: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Notion de table de contingence

• Forme generale : un tableau donnant le croisement de deuxvariables multinomiales

F1 F2 F3 F4 F5

Gr .1 . . . . . . . . . . . . . . . n1.

Gr .2 . . . . . . . . . . . . . . . n2.

Gr .3 . . . . . . . . . . . . . . . n3.

Gr .4 . . . . . . . . . . . . . . . n4.

Total n.1 n.2 n.3 n.4 n.5 n..

Page 10: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Notion de table de contingence

Forme generale du tableau de contingence (TC)

I lignes et J colonnes soit I · J cases ou cellules

deux marges : effectifs marginaux / distributions marginales

cellules indexees par ligne i et colonne j : cijun effectif par case : nijun effectif marginal en ligne : ni .un effectif marginal en colonne : n.jun effectif total n..

Dans la case i ,j , il y a nij sujets ayant la caracteristique i de lavariable de ligne et la caracteristique j de la variable en colonne.

Page 11: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Exemple 1 : cas general

Soit un tableau de I lignes et de J colonnes.On note nij l’effectif de la cellule i ,j , avec i ∈ (1, . . . ,I ) etj ∈ (1, . . . ,J )

1 . . . j . . . J

1 . . . . . . . . . . . . . . . n1.

. . . . . . . . . . . . . . . . . .i . . . . . . nij . . . . . . ni .

. . . . . . . . . . . . . . . . . .I . . . . . . . . . . . . . . . nI .

Total n.1 n.j n.J

Page 12: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Exemple 2 : cas le plus courant

Pour un tableau de deux lignes et deux colonnes :

col. 1 col. 2 total

ligne 1 n11 n12 n1.

ligne 2 n21 n22 n2.

total n.1 n.2 n..

Page 13: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Taille du tableau et degres de liberte

Notion de degres de liberte (ddl)

soit une table 2× 2 : une fois les marges et une case connues,on peut completer le tableau → un ddl, pour la case a fixer

pour une table 3× 3 : une fois les marges connues, il faut fixer4 cases pour pouvoir determiner les 5 cases restantes : 4 ddl

loi du χ2 : caracterisee par des ddl

calcul du nombre de ddl pour un tableau de taille I · J :nddl = (I − 1) · (J − 1)

Page 14: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Contexte et commentaires

Utilisation du TC :

le tableau contient generalement des effectifs et pas desproportions

comparer deux proportions ⇔ comparer deux series d’effectifs

dans le test du χ2, on compare des repartitions d’effectifs(entre 0 et ∞) et pas directement des proportions (entre 0 et1)

une proportion = rapport de deux nombres : succes / echec

mais la question est la meme : les proportions different-elles ?

Page 15: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

On souhaite comparer deux proportions observees

• les effectifs observes subissent des fluctuations d’echantillonnage

• sous H0 la repartition des effectifs en lignes est identique d’unecolonne a l’autre et vice-versa.

• Par exemple, sous egalite parfaite (H0) on observe :

col. 1 col. 2 total

ligne 1 10 10 20ligne 2 84 84 168

total 94 94 188

dans cet exemple :

la repartition en colonne est lameme d’une ligne a l’autre

la repartition en ligne est lameme d’une colonne a l’autre

Page 16: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

On souhaite comparer deux proportions observees

• les effectifs observes subissent des fluctuations d’echantillonnage

• sous H0 la repartition des effectifs en lignes est identique d’unecolonne a l’autre et vice-versa.

• Par exemple, sous egalite parfaite (H0) on observe :

col. 1 col. 2 total

ligne 1 10 10 20ligne 2 84 84 168

total 94 94 188

dans cet exemple :

la repartition en colonne est lameme d’une ligne a l’autre

la repartition en ligne est lameme d’une colonne a l’autre

Page 17: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

On souhaite comparer deux proportions observees

• les effectifs observes subissent des fluctuations d’echantillonnage

• sous H0 la repartition des effectifs en lignes est identique d’unecolonne a l’autre et vice-versa.

• Par exemple, sous egalite parfaite (H0) on observe :

col. 1 col. 2 total

ligne 1 10 10 20ligne 2 84 84 168

total 94 94 188

dans cet exemple :

la repartition en colonne est lameme d’une ligne a l’autre

la repartition en ligne est lameme d’une colonne a l’autre

Page 18: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Attention !

L’egalite des repartitions en ligne et en colonnes est une egalite enproportion et pas en effectifs ! Par exemple :

col. 1 col. 2 total

ligne 1 10 5 15ligne 2 84 42 126

total 94 47 141

col. 1 col. 2 total

0,106 0,106 0,1060,894 0,894 0,894

1 1 1

col. 1 col. 2 total

0,667 0,333 10,667 0,333 1

0,667 0,333 1

Page 19: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Attention !

L’egalite des repartitions en ligne et en colonnes est une egalite enproportion et pas en effectifs ! Par exemple :

col. 1 col. 2 total

ligne 1 10 5 15ligne 2 84 42 126

total 94 47 141

col. 1 col. 2 total

0,106 0,106 0,1060,894 0,894 0,894

1 1 1

col. 1 col. 2 total

0,667 0,333 10,667 0,333 1

0,667 0,333 1

Page 20: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Attention !

L’egalite des repartitions en ligne et en colonnes est une egalite enproportion et pas en effectifs ! Par exemple :

col. 1 col. 2 total

ligne 1 10 5 15ligne 2 84 42 126

total 94 47 141

col. 1 col. 2 total

0,106 0,106 0,1060,894 0,894 0,894

1 1 1

col. 1 col. 2 total

0,667 0,333 10,667 0,333 1

0,667 0,333 1

Page 21: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Attention !

L’egalite des repartitions en ligne et en colonnes est une egalite enproportion et pas en effectifs ! Par exemple :

col. 1 col. 2 total

ligne 1 10 5 15ligne 2 84 42 126

total 94 47 141

col. 1 col. 2 total

0,106 0,106 0,1060,894 0,894 0,894

1 1 1

col. 1 col. 2 total

0,667 0,333 10,667 0,333 1

0,667 0,333 1

Page 22: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Sous H0 : egalite des repartitions en lignes / colonnes

• Les effectifs observes sont tels que les proportions differentnumeriquement

• le test suppose la comparaison des effectifs observes et deseffectifs sous H0

• comment obtenir les effectifs sous H0, i.e. effectifs theoriques(attendus) sous H0 ?

Page 23: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Comment obtenir les effectifs theoriques ?

• en l’absence de difference entre les repartitions entre lignes /entre colonnes, les meilleures estimations des proportions de succes/ echec sont obtenues a partir des effectifs marginaux.

• s’il n’y a pas de difference entre les groupes, les repartitions enlignes / colonnes sont en moyenne identiques entre elles etidentiques a la distribution marginale ligne/colonne

col. 1 col. 2 total

ligne 1 10 5 15ligne 2 84 42 126

total 94 47 141

Page 24: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Comment obtenir les effectifs theoriques ?

• en l’absence de difference entre les repartitions entre lignes /entre colonnes, les meilleures estimations des proportions de succes/ echec sont obtenues a partir des effectifs marginaux.

• s’il n’y a pas de difference entre les groupes, les repartitions enlignes / colonnes sont en moyenne identiques entre elles etidentiques a la distribution marginale ligne/colonne

col. 1 col. 2 total

ligne 1 10 5 15ligne 2 84 42 126

total 94 47 141

Page 25: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

(.../... Comment obtenir les effectifs theoriques ?)

• sous H0, les repartitions marginales doivent etre identiques pourchaque ligne/colonne

• donc l’effectif theorique d’une cellule sous H0 est la valeurattendue sous H0

• les valeurs attendues obtenues sous H0 sont estimees a partir duproduit des marges

• soit une repartition de chaque ligne/colonne au prorata dechaque colonne/ligne

Page 26: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Soit sur un tableau :

col. 1 col. 2 total

ligne 1 e11 o1.

ligne 2 o2.

total o.1 o.2 o..

sous H0 : e11 = o1. · o.1/o..de facon generale :

eij = oi . · o.j/o..

Page 27: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Soit sur un tableau :

col. 1 col. 2 total

ligne 1 e11 o1.

ligne 2 o2.

total o.1 o.2 o..

sous H0 : e11 = o1. · o.1/o..de facon generale :

eij = oi . · o.j/o..

Page 28: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Soit sur un tableau :

col. 1 col. 2 total

ligne 1 e11 o1.

ligne 2 o2.

total o.1 o.2 o..

sous H0 : e11 = o1. · o.1/o..de facon generale :

eij = oi . · o.j/o..

Page 29: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Soit pour un tableau a 4 cases :

col. 1 col. 2 total

ligne 1 e11 = o1.·o.1o..

e12 = o1.·o.2o..

o1.

ligne 2 e21 = o2.·o.1o..

e22 = o2.·o.2o..

o2.

total o.1 o.2 o..

Page 30: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

On se retrouve avec deux tableaux !

valeurs observees

col. 1 col. 2 total

ligne 1 o11 o12 o1.

ligne 2 o21 o22 o2.

total o.1 o.2 o..

valeurs theoriques

col. 1 col. 2 total

ligne 1 e11 e12 o1.

ligne 2 e21 e22 o2.

total o.1 o.2 o..

Un tableau de valeurs observees et un tableau de valeurs theoriquesou attendues sous H0

Page 31: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

On se retrouve avec deux tableaux !

valeurs observees

col. 1 col. 2 total

ligne 1 o11 o12 o1.

ligne 2 o21 o22 o2.

total o.1 o.2 o..

valeurs theoriques

col. 1 col. 2 total

ligne 1 e11 e12 o1.

ligne 2 e21 e22 o2.

total o.1 o.2 o..

Un tableau de valeurs observees et un tableau de valeurs theoriquesou attendues sous H0

Page 32: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

On se retrouve avec deux tableaux !

valeurs observees

col. 1 col. 2 total

ligne 1 o11 o12 o1.

ligne 2 o21 o22 o2.

total o.1 o.2 o..

valeurs theoriques

col. 1 col. 2 total

ligne 1 e11 e12 o1.

ligne 2 e21 e22 o2.

total o.1 o.2 o..

Un tableau de valeurs observees et un tableau de valeurs theoriquesou attendues sous H0

Page 33: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

• Le probleme de la comparaison de deux proportions devient leprobleme de la comparaison de deux repartitions

• qui se ramene a la comparaison de deux tableaux : l’un observeet l’autre theorique

• Comment calculer l’ecart entre ces deux tableaux ?

• dans une cellule ij , ecart entre obs et theo :

(oij − eij )2

eij

Page 34: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

• cet ecart par cellule est somme sur l’ensemble des cellules :∑ij

(oij − eij )2

eij

• on montre que(oij−eij )2

eij→ N (0 ; 1)

• or une somme de N (µ;σ)→ χ2

test du χ2

la comparaison de la repartition des lignes et des colonnes d’untableau se fait par un test du χ2 a k ddl.

Page 35: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Synthese : la logique du test :

en l’absence de difference de repartition (i.e. absence dedifference de proportions), les valeurs observees sont egalesaux valeurs theoriques sur l’ensemble des cellules

Donc, sous H0 : oij = eij , ∀i ,j et∑

ij(oij−eij )2

eij= 0

• Si H0 est fausse :

les ecarts sont d’autant plus importants que les distributionsdifferent et donc :

plus les proportions / repartitions different

plus les ecarts oij − eij augmentent

plus la valeur de χ2 augmente

Page 36: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

La valeur du χ2obs sera comparee a une valeur seuil χ2

α

Page 37: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Construction du test

Les hypotheses du test :

H0 : les repartitions en lignes / en colonnes ne different pas

H1 : les repartitions en lignes / en colonnes different

→ formulation generale, a adapter a chaque cas

La procedure :

remplir le tableau de contingence

calculer le nombre de degres de liberte

calculer les effectifs theoriques

calculer la valeur du χ2obs

si χ2obs > χ2

ddl ;seuil : on rejette H0

sinon, on ne rejette pas H0

Page 38: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Remarques

(1) Conditions d’application du test du χ2 : tous les eij > 5

(2) dans le cas d’une table 2× 2, i.e. cas de la comparaison dedeux proportions : les deux tests sont strictements equivalents etχ2

obs = (zobs)2

Page 39: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 χ2 d’adequationComparaison d’une proportion a une referenceComparaison d’une repartition a une repartition theorique

3 χ2 d’independance

4 Cas particuliers

Page 40: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Notion d’adequation

• comparaison d’une proportion observee et d’une proportiontheorique

• comparaison d’une distribution multinomiale observee et d’unemultinomiale theorique

• notion d’adequation entre observation et theorie pre-existante

• test d’une loi de probabilite : une serie de valeur suit-elle une loimultinomiale, une loi de Poisson, une loi de Gauss, etc ?

Dans le cas d’un χ2 d’adequation :

les effectifs theoriques sont connus par ailleurs (donnes par latheorie) et il n’est pas necessaire de les definir a partir des donneesobservees

Page 41: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Notion d’adequation

• comparaison d’une proportion observee et d’une proportiontheorique

• comparaison d’une distribution multinomiale observee et d’unemultinomiale theorique

• notion d’adequation entre observation et theorie pre-existante

• test d’une loi de probabilite : une serie de valeur suit-elle une loimultinomiale, une loi de Poisson, une loi de Gauss, etc ?

Dans le cas d’un χ2 d’adequation :

les effectifs theoriques sont connus par ailleurs (donnes par latheorie) et il n’est pas necessaire de les definir a partir des donneesobservees

Page 42: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 prop/ref

Plan

1 Principe du test

2 χ2 d’adequationComparaison d’une proportion a une referenceComparaison d’une repartition a une repartition theorique

3 χ2 d’independance

4 Cas particuliers

Page 43: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 prop/ref

Comparaison proportion observee / proportion theorique

On souhaite comparer une proportion observee et une proportiontheorique (exemple de la loi de Mendel)

• Les effectifs theoriques du tableau et du test sont deja connuspar construction : la loi de Mendel fournit les valeurs attendues

• il est inutile de calculer les valeurs theoriques a partir des valeursobservees

Page 44: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 prop/ref

Comparaison d’une proportion a une reference

On obtient donc le tableau suivant :

Effectifs observes Effectifs Theoriques

ligne 1 130 0,75 · 200 = 150ligne 2 70 0,25 · 200 = 50

total 200 200

Page 45: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 prop/ref

Realisation du test

Les hypotheses du test :

H0 : la repartition observee des phenotypes ne differe pas de larepartition theorique

H1 : la repartition observee des phenotypes differe de larepartition theorique

La procedure :

remplir le tableau de contingence X

calculer le nombre de degre de liberte = 1 (I-1)

calculer les effectifs theoriques X

calculer la valeur du χ2obs :

(130− 150)2

150+

(70− 50)2

50= 10,67

Page 46: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 prop/ref

χ2obs > χ2

seuil au risque α = 5% puisque 10,67 > 3,84 :

donc on rejette H0

• Donc on rejette l’hypothese d’adequation des donnees a larepartition theorique et on peut considerer que le gene etudie n’apas une transmission mendelienne.

Remarque : 10,67 = (3,27)2, χ2obs = z 2 (voir cours prop.)

Page 47: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 rep/theorique

Plan

1 Principe du test

2 χ2 d’adequationComparaison d’une proportion a une referenceComparaison d’une repartition a une repartition theorique

3 χ2 d’independance

4 Cas particuliers

Page 48: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 rep/theorique

Comparaison multinomiale observee / theorique

• Repartition des groupes sanguins (Beuscart et al. ) dans lapopulation francaise : connue tres fiablement par les dons du sang.

• La repartition des groupes sanguins au pays basque sur unechantillon de 150 sujets• Frequences theoriques :

0 A B AB total

Pop. francaise 0,42 0,45 0,09 0,04

• Effectifs theoriques et observes :

0 A B AB total

Eff. observes 81 64 4 0 150Eff. attendus 63,0 67,5 13,5 6,0 150

Page 49: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 rep/theorique

Comparaison multinomiale observee / theorique

• H0 : la frequence des groupes sanguins ne different pas entre lapopulation basque et la population francaise

• H1 : la frequence des groupes sanguins different entre lapopulation basque et la population francaise

• Les effectifs theoriques > 5, ddl=3 (I-1).

• le χ2obs vaut :

(81− 63)2

63+

(64− 67,5)2

67,5+

(4− 13,5)2

13,5+

(0− 6)2

6= 17,92

• pour un α = 0,05 et avec 3 ddl, le χ2seuil = 7,815

• Donc χ2obs > χ2

3;α donc rejet de H0 et on conclut que larepartition des groupes sanguins dans la population basque differede celle dans la population francaise.

Page 50: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

1 rep/theorique

Retour sur le contexte d’utilisation

• exemple precedent : comparaison d’une distribution multinomialeobservee et d’une multinomiale theorique

• illustre la notion d’adequation entre observation et theoriepre-existante

• applicable pour tester une loi de probabilite : une serie de valeursuit-elle une loi multinomiale specifiee, une loi de Poisson, une loide Gauss, etc ?

• Exemple sur une loi de Gauss : soit une concentration serique surn patient.

definir des intervalles d’interets, par ex. 10, 20, 30, 40, 50UI/mLdeterminer la proportion de sujets attendus ayant uneconcentration entre deux valeurs, a partir d’une moyenne etd’une variance theoriquescomparer les proportions theoriques et observees par un χ2

Page 51: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 χ2 d’adequation

3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales

4 Cas particuliers

Page 52: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

2 prop obs.

Plan

1 Principe du test

2 χ2 d’adequation

3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales

4 Cas particuliers

Page 53: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

2 prop obs.

Comparaison de deux proportions observees

• Peut se faire par un test z (voir cours precedent)

• plus frequemment realise par un test du χ2

X Procedure du test :

poser les hypotheses comme avec le test zcalculer les effectifs theoriques

calculer la valeur du χ2obs

comparer a la valeur seuil du χ2α

rejet ou non de H0 selon la comparaison

Page 54: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

2 prop obs.

Exemple

(A partir de l’exemple donne avec le test z , soit 52 et 38% de tauxde succes)

TMT A TMT B Total

Succes 26 19 45Echecs 24 31 55

Total 50 50 100

.../...

Page 55: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

2 prop obs.

Exemple

.../...

• effectifs attendus sous H0 :

TMT A TMT B Total

Succes 22,50 22,50 45Echecs 27,50 27,50 55

Total 50 50 100

Valeur de la statistique de test :

χ2obs =

(26− 22,50)2

22,50+

(19− 22,50)2

22,50+

(24− 27,50)2

27,50+

(31− 27,50)2

27,50

χ2obs = 0,544 + 0,544 + 0,445 + 0,445 = 1,980

Page 56: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

2 prop obs.

Exemple

• donc : χ2obs < χ2

seuil puisque χ2seuil = 3,84 pour 1 ddl

• on ne rejette pas H0 et on ne met pas en evidence de differenceentre les deux traitements

Page 57: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

> 2 proportions

Plan

1 Principe du test

2 χ2 d’adequation

3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales

4 Cas particuliers

Page 58: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

> 2 proportions

Comparaison de plus de deux proportions

• On souhaite comparer les taux de succes de trois traitementssimultanement :

• On observe les donnees suivantes :

TMT A TMT B TMT C Total

Succes 26 19 32 77Echecs 24 31 18 73

Total 50 50 50 150

• Les hypotheses sont : H0 les taux de succes sont identiques dansles trois populations et H1 au moins une des populations a un tauxde succes different des autres

Page 59: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

> 2 proportions

Comparaison de plus de deux proportions

Les effectifs theoriques sont les suivants :

TMT A TMT B TMT C Total

Succes 25,67 25,67 25,67 77Echecs 24,33 24,33 24,33 73

Total 50 50 50 150

La valeur du χobs :χobs = 0,004 + 1,732 + 1,563 + 0,005 + 1,826 + 1,648 = 6,778pour un seuil a 5% = 5,99 → on rejette H0 et on conclut quel’un au moins des traitements differe des autres.

Page 60: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

multinom.

Plan

1 Principe du test

2 χ2 d’adequation

3 χ2 d’independanceComparaison de deux proportions observeesComparaison de plus de deux proportionsComparaison de plusieurs multinomiales

4 Cas particuliers

Page 61: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

multinom.

Comparaison de plusieurs multinomiales

• Le test du χ2 peut se generaliser a la comparaison de plus dedeux multinomiales (distribution a plus de deux modalites).

• comparaison de l’evolution d’une pathologie articulaire(aggravation, amelioration, stabilite) en fonction de trois types detraitements A, B et C.

• a noter : les echantillons doivent etre independants ! On ne peuta priori pas comparer la frequence de plusieurs effets secondairesentre deux ou trois medicaments car un sujet peut avoir plusieurseffets secondaires avec le meme medicament. Le cas desechantillons non-independants sera vu plus loin dans le cas de deuxseries appariees.

Page 62: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

multinom.

Comparaison de plusieurs multinomiales

Soit le tableau suivant :

Evolution TMT A TMT B TMT C Total

Amelioration 16 20 32 68Stabilisation 24 31 18 73Aggravation 20 10 19 49

Total 60 61 69 190

• Les hypotheses sont : H0 : l’evolution est identique pour les troistraitements et H1 : au moins un des traitements se caracterise parune evolution differente

• On souhaite faire un test au risque α = 0,02

Page 63: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

multinom.

Comparaison de plusieurs multinomiales

Les valeurs theoriques sont les suivantes :

Evolutions TMT A TMT B TMT C Total

Amelioration 21,47 21,83 24,69 68Stabilisation 23,05 23,44 26,51 73Aggravation 15,47 15,73 17,79 49

Total 60 61 69 190

Avec par exemple : e32 = 61×49190 = 15,73

Page 64: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

multinom.

Comparaison de plusieurs multinomiales

• χ2obs = 1,395 + 0,154 + 2,161 + 0,039 + 2,441 + 2,732 + 1,324 +

2,088 + 0,082 = 12,416

• le nombre de ddl = (3− 1)× (3− 1) = 4

• la valeur seuil du χ24;α=2% = 11,67

• Rem : la valeur seuil du χ24;α=1% = 13,28

• donc on rejette l’H0 au seuil choisi

Page 65: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

multinom.

Remarques diverses

Comparaisons de plusieurs multinomiales

probleme des comparaisons multiples et de localisation de laou des differences apres un test significatif

probleme egalement pour les comparaisons des taux de succesde plusieurs populations

pas de solutions simples

Page 66: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 χ2 d’adequation

3 χ2 d’independance

4 Cas particuliersCas des series apparieesCas des petits effectifs

Page 67: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Plan

1 Principe du test

2 χ2 d’adequation

3 χ2 d’independance

4 Cas particuliersCas des series apparieesCas des petits effectifs

Page 68: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

• series appariees : repetition d’une mesure sur un meme sujet

• mesure qualitative : presence/absence d’une caracteristique

a deux temps differents : avant-apres application d’untraitement

sur deux organes (paires : poumons),

sur deux prelevements sur un meme organe : deux biopsieshepatiques

en epidemiologie : sujets apparies → etude cas-temoins

Page 69: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Exemple d’un traitement applique sur les deux mains (pommadecorticoıde pour un eczema)

Gauche Droite

Amelioration O1 O3

Pas d’amelioration O2 O4

Total n n 2n

Les hypotheses testees sont :

πD = πG

πD 6= πG

Page 70: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

• La comparaison de ces deux proportions (πD et πG) ne peut passe faire avec le test du χ2 indique precedemment en raison de lanon-independance des donnees

• dans une serie appariee, les resultats sur l’une des seriesdependent des resultats sur l’autre serie

• les conditions d’applications (independance des mesures) ne sontdonc pas presentes

• changer la presentation des donnees et tenir compte de ladependance des donnees

Page 71: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Cote Gauche

Cote Droit Amelioration Pas d’amelioration

Amelioration a c a + cPas d’amelioration b d

Total a + b n

Avec :

amelioration a droite : pD = (a + c)/namelioration a gauche : pG = (a + b)/n

Page 72: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

D’ou la comparaison :

πD = πG

πD 6= πG

mais avec les valeurs observees suivantes :

pD = (a + c)/npG = (a + b)/n

La comparaison doit tenir compte des paires concordantes et despaires discordantes

.../...

Page 73: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

.../...

paires concordantes : les deux cotes donnent le meme resultat(succes-succes ou echec-echec)

paires discordantes : les deux cotes donnent un resultatdifferent (succes-echec ou vice-versa)

Les paires concordantes n’apportent pas d’information sur la liaisonentre la maladie et le traitement : pour ces paires, le taux desucces ne differe pas.

Page 74: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Cote Droit Cote gauche nombre de paires

S S aE S bS E cE E d

Total = n

Principe si H0 vraie : nb. paires (S,E) = nb paires (E,S)

⇒ tester si proportion de paires (S,E) (equiv. (E,S)) 6= 1/2

• soit comparaison proportion observee et proportion theorique

Page 75: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Realisation du test :

(E,S) (S,E)

Effectifs observes b cEffectifs theoriques b+c

2b+c2

Total = n

D’ou la valeur du χ2 :

χ2obs;s.a. =

(b − b+c

2

)2b+c2

+

(c − b+c

2

)2b+c2

=

(b−c2

)2+(

c−b2

)2b+c2

.../...

Page 76: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

.../... et in fine :

χ2obs;s.a. =

(b − c)2

b + c

• le nombre de ddl d’un test χ2 pour series appariees = 1

• conditions d’application : b+c2 > 5

Page 77: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Exemple : etude epidemiologique, comparaison a l’exposition a untoxique entre cas (cancer) et temoin (meme service, pathologienon cancereuse). On observe :

TemoinsCas Exposes Non Exposes Total

Exposes 31 8 39Non Exposes 10 42 52

Total 41 50 91

Page 78: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Procedure du test :

on pose H0 et H1 la frequence d’exposition au toxique nediffere pas / differe entre les cas et les temoins X

on fixe le risque α (par exemple 10%) X

verification des conditions d’application : (8 + 10)/2 > 5 X

calcul de χ2obs;s.a. = (8− 10)2/(8 + 10) = 0,22 X

comparaison au χ2seuil pour le risque choisi : χ2

seuil = 2,706 X

comparaison : χ2obs;s.a. < χ2

seuil : on ne rejette pas H0

conclusion : on ne met pas en evidence une difference defrequence d’exposition au toxique entre les cas et les temoins

Page 79: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Plan

1 Principe du test

2 χ2 d’adequation

3 χ2 d’independance

4 Cas particuliersCas des series apparieesCas des petits effectifs

Page 80: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

Dans certaines situations, effectifs tres petits :

dosage tres couteux

animaux (( particuliers ))

maladie rare

protocole complexe et long

etc

Conditions de validite du test du χ2 pas toujours respectees

Page 81: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

Utilisation directe des probabilites par le test exact de Fisher

A B

Succes a b m1

Echec c d m2

Total n1 n2 n

• une fois les marges fixees et une case fixee, on connait toutes lesautres valeurs du tableau

• loi hypergeometrique : constitution d’un echantillon sans remisedans l’urne.

Page 82: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

• on peut calculer la probabilite d’avoir n11 = a sachant les marges

• Soit la V.A. A associee a l’effectif a : Pr(A = a) = n1!n2!m1!m2!a!b!c!d !n!

→ Principe et procedure du test :

• on test un ecart a l’equirepartition des lignes/colonnes (ecart aH0)

• l’ecart a l’H0 est quantifie directement par la probabilite d’avoirun ecart plus important que celui observe

• calcul de la probabilite de Pr(A = a),∀a• addition de toutes les probabilites telles que

Pr(A = a∗) 6 Pr(A = aobs)

.../...

Page 83: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

Soit la table :

A B Total

Succes 5 0 5Echec 2 5 7

Total 7 5 12

Sachant les marges, la case c11 peut prendre les valeurs suivantes :{0, 1, 2, 3, 4, 5}.

Page 84: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

d’ou les probabilites de chaque table :

Pr(A = 5) = 7!5!5!7!/5!0!2!5!12! = 0,0265∗ X

Pr(A = 4) = 7!5!5!7!/4!1!3!4!12! = 0,2210Pr(A = 3) = 7!5!5!7!/3!2!4!3!12! = 0,4420Pr(A = 2) = 7!5!5!7!/2!3!5!2!12! = 0,2651Pr(A = 1) = 7!5!5!7!/1!4!6!1!12! = 0,0442Pr(A = 0) = 7!5!5!7!/0!5!7!0!12! = 0,0013∗

soit valeur de test : p = 0,0265 + 0,0013 = 0,0278.On rejette donc l’H0.

Page 85: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

Remarques :

• peu commode

• toujours valide, meme si effectifs grands

• mais seul a etre valide si effectifs petits

Page 86: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Remarques diverses

Choix de la valeur de α

depend du contexte et du cout du risque

risque α : risque de declarer a tort comme present un effetinexistant

si le medicament a peu d’effets secondaires : α (( grand ))

acceptable

si le medicament a bcp d’effets secondaires : etre sur de sonefficacite avant commercialisation : prendre α (( petit ))

a moduler selon la gravite de la maladie et la disponibilited’autres medicaments

Page 87: Test du 2 : test d'indépendance et test d'homogénéité ...udsmed.u-strasbg.fr/labiostat/IMG/pdf/chideux.pdf · Principe Ad equation Ind ependance Cas part. Plan 1 Principe du test

Principe Adequation Independance Cas part.

Petits effectifs

Synthese finale

Au final, nous avons vu :

dans le cas de deux proportions, le test du χ2 est equivalentau test zle test du χ2 s’etend a differents cas

comparaison de trois proportions ou pluscomparaison de deux ou plus de deux multinomiales

cas particulier des series appariees

cas particulier des petits effectifs