Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le...

54
1 Chapitre 1 LE TEST DU KHI-DEUX I. Présentation de la statistique khi - carré ( χ²) Une somme de ν carré de variables indépendantes normalement distribuées de moyenne 0 et de variance 1 suit une loi normale dite du khi-deux ou du khi-carré notée χ². 2 2 1 2 0 Χ Χ = e Y Y ν avec Y 0 constante telle que l’aire sous la courbe soit égale à 1 ν nombre de degrés de liberté Figure 1 : distributions χ² pour ν = 1, 2, 4 et 8 II. Les tables du khi-deux Ces lois ont été tabulées pour ν variant de 1 à 100. La table correspondant au nombre de degrés de liberté ν fournit le fractile d’ordre p noté χ² p III. Le test du khi – deux III. 1. Mode de calcul ( ) ( ) ( ) ( ) = + + + i i i p p p e e o e e o e e o e e o 2 2 2 2 2 2 1 2 1 1 ..... avec o i = effectifs observés et e i = effectifs théoriques

Transcript of Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le...

Page 1: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

1

Chapitre 1 LE TEST DU KHI-DEUX

I. Présentation de la statistique khi - carré ( χ²)

Une somme de ν carré de variables indépendantes normalement distribuées de moyenne 0 et de variance 1 suit une loi normale dite du khi-deux ou du khi-carré notée χ².

2

21

20

Χ−−Χ= eYY ν avec Y0 constante telle que l’aire sous la courbe soit égale à 1 ν nombre de degrés de liberté Figure 1 : distributions χ² pour ν = 1, 2, 4 et 8

II. Les tables du khi-deux Ces lois ont été tabulées pour ν variant de 1 à 100. La table correspondant au nombre de degrés de liberté ν fournit le fractile d’ordre p noté χ² p

III. Le test du khi – deux III. 1. Mode de calcul ( ) ( ) ( ) ( )∑ −

=−

++−

+−

i

ii

p

pp

eeo

eeo

eeo

eeo 22

2

222

1

211 .....

avec oi = effectifs observés et ei = effectifs théoriques

Page 2: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

2

Neo ii ==∑∑ effectif total

On montre que ( ) ( ) ( ) ( ) Neo

eeo

eeo

eeo

eeo

i

i

i

ii

p

pp −=−

=−

++−

+− ∑∑

222

2

222

1

211 .....

III. 2. Exemple de calcul de khi – deux d’ajustement Pour tester si un dé n’est pas truqué, on le jette 150 fois et on note les résultats obtenus : 1 2 3 4 5 6 17 26 38 22 25 22 En posant comme hypothèse nulle « le dé n’est pas truqué », on s’attend à ce que les effectifs observés ne diffèrent pas des effectifs théoriques, qui sont 25, 25, 25, …, 25 (150 divisé par 6)

( ) ( ) ( ) ( ) ( ) ( ) 08.1025

252225

252525

252225

253825

252625

2517 2222222 =

−+

−+

−+

−+

−+

−=observéχ

ou 08.1015025

²2225

²2525

²2225

²3825

²2625

²172 =−+++++=observéχ

On fixe le seuil de significativité à 10% par exemple Le nombre de degrés de liberté est égal à 6-1=5 On lit dans la table : Χ20.90 à ν = 5 : 9.24 Si le Χ2 observé > 9.24, on rejette Si le Χ2 observé < 9.24, on ne peut pas rejeter H0 (et on ne conclut pas) ; Dans notre cas, 10.08 > 9.24, on rejette H0 (et on conclut que le dé est truqué) avec 10 chances sur 100 de se tromper. Si on travaille à 5%, on lit Χ20.95 à ν = 5 : 11.1 et dans ce cas 10.08 < 9.24, on ne peut rejeter H0 (et on ne conclut pas). III. 3. Exemple de calcul de khi – deux de croisement On travaille à partir du tableau de contingence qui sert à calculer les effectifs théoriques : A B totaux marginaux

totaux de ligne X e11 e12 L1 Y e21 e22 L2 totaux marginaux totaux de colonne

C1 C2 N

e11 = (L1 × C1)/N e21 = (L2 × C1)/N

Page 3: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

3

Exemple avec nombreuses modalités de variables Soit la répartition de 200 familles selon le nombre d’enfants (X) et le nombre de pièces du lieu d’habitation (Y). Testez à 5% l’indépendance de ces deux variables nominales.

X Y

0

1

2

3

4 et +

n.j

2

5

4.2

7

6.6

8

10.4

9 10

11 8.8

40

3

8

4.2

7

6.6

9

10.4

8 10

8

8.8

40

4

2

4.2

9

6.6

13

10.4

10 10

6

8.8

40

5

3

4.2

6

6.6

12

10.4

12 10

7

8.8

40

6 et +

3

4.2

4

6.6

10

10.4

11 10

12 8.8

40

ni.

21

33

52

50

44

n.. 200

On inscrit en rouge les effectifs théoriques dans chacune des cases du tableau. Ho : il y a indépendance entre ces deux variables (= il n’y a pas de lien entre le nombre d’enfants et le nombre de pièces de l’habitation) α = 5% ν = (5-1)(5-1) = 16 χ²0.95 = 26.3 Si χ² observé > 26.3 on rejette Ho Si χ² observé < 26.3 on ne peut pas rejeter Ho

13.132008.8

14449366412110

12114410064814.10

10014416981646.6

16368149492.4

99464252

=−++++

+

+++++

+++++

+++++

++++=observéχ

13.13 < 26.3 donc on ne peut pas conclure à l’indépendance entre les variables

Page 4: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

4

Mode de calcul pour le cas particulier de 2 variables à 2 modalités Dans ce cas particulier, on n’a pas besoin de calculer les effectifs théoriques. X1 X2 totaux marginaux

totaux de ligne Y1 a b n.1 Y2 c d n.2 totaux marginaux totaux de colonne

n1. n2. n..

( )....

......

..²

2121

2

2121

2

nnnncbadn

nnnncdab

n

×××−×

=×××

×=χ

IV. Conditions d’application du khi-deux

Les fréquences théoriques

L’indépendance des observations

L’inclusion des non-occurrences

Khi-deux : test unilatéral ou bilatéral ?

V. Les mesures d’association Exemples sur lesquels on va travailler (issus de Howell)

1) relation entre tabagisme et sexe non-fumeurs

fumeurs

hommes 350 150 500 femmes 400 100 500 750 250 1000

( ) 33.13250750500500

1504001003501000 22 =

××××−××

Page 5: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

5

2) relation entre responsabilité des courses alimentaires et sexe oui non

hommes 4 15 19 femmes 15 4 19 19 19 38

( ) 74.121919191915154438 2

2 =××××−××

Le coefficient de contingence

NC

+= 2

2

χχ

exemples : 11.100033.13

33.131 =

+=C 50.0

3874.1274.12

2 =+

=C

Le coefficient Phi (Ø) Dans le cas des tables 2×2, le coefficient phi est une bonne mesure de corrélation entre deux variables dichotomiques.

N

2χ=Φ

exemples : 12.1000

33.131 ==Φ 58.

3874.12

2 ==Φ

Le coefficient Phi (ou V) de Cramèr (Øc)

( )1

2

−=Φ

kNcχ avec N taille de l’échantillon et k plus petite valeur entre L (nbre de

lignes) et C (nbre de colonnes)

La mesure d’accord : le kappa de Cohen (K) Cette statistique ne se base pas sur le khi-deux mais sur le tableau de contingence et sur le calcul des effectifs attendus.

Page 6: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

6

Exemple (Howell) :

JUGE 1 JUGE 2 Pas de problèmes Intériorisation Extériorisation

Pas de problèmes 15 2 3 20 Intériorisation 1 3 2 6 Extériorisation 0 1 3 4

16 6 8 30 On voit les accords : les entrées en diagonales (15, 3 et 3) Les désaccords se sont toutes les autres cases.

JUGE 1 JUGE 2 Pas de problèmes Intériorisation Extériorisation

Pas de problèmes 15 (10.67) 2 3 20 Intériorisation 1 3 (1.2) 2 6 Extériorisation 0 1 3 (1.07) 4

16 6 8 30 La formule du kappa est :

∑∑∑

−=

i

ii

eNeo

κ avec oi les effectifs observés en diagonale

et ei les effectifs théoriques (attendus) en diagonale

( ) ( )( ) 25.47

07.12.167.103007.12.167.103315

=++−

++−++=κ

Page 7: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

7

Page 8: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

8

Chapitre 2 COEFFICIENTS DE CORRELATION POUR VARIABLES ORDINALES

I. Le coefficient rho de Spearman (ρ) Exemple : 15 copies d’examen classées selon 2 critères (X : cohérence argumentative et Y : nombre de connecteurs logiques utilisés) rX 6 8 9 7 1 13 14 15 2 3 4 5 10 11 12 rY 8 9 7 6 2 15 14 12 1 4 3 5 11 10 13

Formule de rho : ( ))16

1 2

21

−−= ∑

NNd

ρ

Exemple : Calcul de rho :

rX 6 8 9 7 1 13 14 15 2 3 4 5 10 11 12 rY 8 9 7 6 2 15 14 12 1 4 3 5 11 10 13 rX-rY -2 -1 2 1 -1 -2 0 3 1 -1 1 0 -1 1 1 di² 4 1 4 1 1 4 0 9 1 1 1 0 1 1 -1

Σ di² = 30

( ) 95.01²1515

3061 =−

×−=ρ

Remarques :

Si les classements sont identiques : ρ = 1 Exemple de classements identiques :

rX 3 5 2 6 1 4 rY 3 5 2 6 1 4 rX-rY 0 0 0 0 0 0 di² 0 0 0 0 0 0

( ) 11²66

061 =−×

−=ρ

Page 9: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

9

Si les classements sont inversés : ρ = -1

rX 3 5 2 6 1 4 rY 4 2 5 1 6 3 rX-rY -1 3 -3 5 -5 1 di² 1 9 9 25 25 1

( ) 1211²66

7061 −=−=−

×−=ρ

cas des ex-aequo

Exemple : données brutes sur 7 individus selon deux critères X et Y

1) on range X, on garde les couples 2) on attribue des rangs aux données de X 3) on attribue des rangs aux données de Y 4) on calcule d 5) on calcule d²

Xi 2.1 3.5 1 2.1 5 3.5 2.1 Yi 97 105 99 105 155 95 92 Xi rangés 1 2.1 2.1 2.1 3.5 3.5 5 Yi 99 97 105 92 105 95 155 rX 1 3 3 3 5.5 5.5 7 rY 4 3 5.5 1 5.5 2 7 rX-rY -3 0 -2.5 2 0 3.5 0 di² 9 0 6.25 4 0 12.25 0

Σ di² = 31.5

( ) 44.1²775.3161 =

−×

−=ρ

II. Le coefficient tau de Kendall (τ) Exemple : 5 individus statistiques classés selon 2 critères X et Y

rX 3 5 1 2 4 rY 2 3 4 1 5

1ère méthode

1) on range par ordre croissant selon le premier critère 2) on conserve les couples de données 3) on détermine les zij

Page 10: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

10

zij = 1 si ryj > ryi

zij = -1 si ryj ≤ ryi exemple :

rX 3 5 1 2 4 rY 3 4 2 1 5 rX rangés 1 2 3 4 5 rY rangés 2 1 3 5 4 z2. -1 1 1 1 2 z1. 1 1 1 3 z3. 1 1 2 z5. -1 -1 Σzij 6

)1(2

−= ∑

nnzijτ avec n nombre de sujets

6.0)15(5

62=

−×

2ème méthode

1) on range par ordre croissant selon le premier critère 2) on conserve les couples de données 3) on calcule pour chaque donnée rangée combien on a de données strictement

supérieures à cette donnée (on compte 1 point pour chaque donnée de rang supérieur) et combien on a de données de rang égal ou inférieur (on compte -1 à chaque fois) ; on fait la différence entre ces deux nombres et on l’inscrit en dessous de la donnée.

4) On fait la somme de ces différences : S Exemple :

rX 3 5 1 2 4 rY 3 4 2 1 5 rX rangés 1 2 3 4 5 rY rangés 2 1 3 5 4 2 3 2 -1 / S 6

)1(2−

=nnSτ 6.0

)15(562

=−×

Page 11: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

11

Le cas des ex æquo

YX TnnTnnS

−−×−−=

)1()1(2τ

avec ∑ −= )1(21 ttTX et ∑ −= )1(

21 ttTY

t = nombre d’ex æquo dans chaque groupe Exemple :

Xi 2.1 3.5 1 2.1 5 3.5 2.1 Yi 97 105 99 105 155 95 92 Xi rangés 1 2.1 2.1 2.1 3.5 3.5 5 Yi 99 97 105 92 105 95 155 rX 1 3 3 3 5.5 5.5 7 rY 4 3 5.5 1 5.5 2 7 0 1 -2 3 0 1 / 3

Tx = ½ [ 3 (3-1) + 2 (2-1) ] = 4 TY = ½ [ (2 (2-1) ] = 1

YX TnnTnnS

−−×−−=

)1()1(2τ

15.01)17(74)17(7

32=

−−×−−×

Remarque : il y a plusieurs calculs de τ possibles, selon la position des rX ex aequo et les rY correspondant.

III. Le coefficient de concordance de Kendall (W) Exemple : 6 examinateurs classent 5 candidats

E1 E2 E3 E4 E5 E6 ri

C1 1 2 2 1 3 2 11 C2 4 1 3 3 2 5 18 C3 5 5 4 5 5 4 28 C4 3 4 5 2 4 3 21 C5 2 3 1 4 1 1 12 90

Page 12: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

12

)1(12

22 −=

nnkVarRn

W avec k nombre de juges et n nombre d’individus

Exemple :

E1 E2 E3 E4 E5 E6 ri ri² C1 1 2 2 1 3 2 11 121 C2 4 1 3 3 2 5 18 324 C3 5 5 4 5 5 4 28 784 C4 3 4 5 2 4 3 21 441 C5 2 3 1 4 1 1 12 144 90 1814

Moy R = 90/5 varR = 1814/5 – (90/5)²

54.0)15(56

590

51814512

22

2

=−××

−××

=W

Remarque

11

−−

=kkWρ

Le cas des ex æquo

∑−−

=Tknnk

nVarRW

12)1²(² (rappel :

)1(12

22 −=

nnkVarRn

W )

avec ∑ −= )(121 3 ttT t nombre d’ex æquo dans chaque groupe d’ex aequo

Exemple : Soit 10 individus classés selon 3 critères. Les rangs sont les suivants :

rX 1 4.5 2 4.5 3 7.5 6 9 7.5 10 rY 2.5 1 2.5 4.5 4.5 8 9 6.5 10 6.5 rZ 2 1 4.5 4.5 4.5 4.5 8 8 8 10 Σ ri 5.5 6.5 9 13.5 12 20 23 23.5 25.5 26.5 165 ri² 30.25 42.25 81 182.25 144 400 529 552.25 650.25 702.15 3313.5

Page 13: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

13

Tx = 1/12 [ (23-2) + (23-2) ] = 1 TY = 1/12 [ (23-2) + (23-2) + (23-2) ] = 1.5 TZ = 1/12 [ (43 – 4) + (33 – 3) ] = 7

∑−−

=Tknnk

nVarRW

12)1²(²

83.0)75.11(3

12)1²10(103

10165

105.331310

2

2

=++−

−××

−×

=W

IV. Significativité des coefficients

1. Coefficient rho de Spearman

Si 4 ≤ N ≤ 30 Table des valeurs critiques du ρ de Spearman

Page 14: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

14

Si N ≥ 10

La valeur 212

ρρ

−−

=Nt est distribuée selon la loi de Student à ν = N-2 degrés de liberté

Table de la loi de Student

Page 15: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

15

2. Coefficient de corrélation par rang de Kendall (tau, τ)

L (τ) = N (0, )1(9)52(2

−+NNN )

Table de la loi normale

z 0 1 2 3 4 5 6 7 8 9

0,0 ,0000 ,0040 ,0080 ,0120 ,0160 ,0199 ,0239 ,0279 ,0319 ,0359 0,1 ,0398 ,0438 ,0478 ,0517 ,0557 ,0596 ,0636 ,0675 ,0714 ,0754 0,2 ,0793 ,0832 ,0871 ,0910 ,0948 ,0987 ,1026 ,1064 ,1103 ,1141 0,3 ,1179 ,1217 ,1255 ,1293 ,1331 ,1368 ,1406 ,1443 ,1480 ,1517 0,4 ,1554 ,1591 ,1628 ,1664 ,1700 ,1736 ,1772 ,1808 ,1844 ,1879

0,5 ,1915 ,1950 ,1985 ,2019 ,2054 ,2088 ,2123 ,2157 ,2190 ,2224 0,6 ,2258 ,2291 ,2324 ,2357 ,2389 ,2422 ,2454 ,2486 ,2518 ,2549 0,7 ,2580 ,2612 ,2642 ,2673 ,2704 ,2734 ,2764 ,2794 ,2823 ,2852 0,8 ,2881 ,2910 ,2939 ,2967 ,2996 ,3023 ,3051 ,3078 ,3106 ,3133 0,9 ,3159 ,3186 ,3212 ,3238 ,3264 ,3289 ,3315 ,3340 ,3365 ,3389

1,0 ,3413 ,3438 ,3461 ,3485 ,3508 ,3531 ,3554 ,3577 ,3599 ,3621 1,1 ,3643 ,3665 ,3686 ,3708 ,3729 ,3749 ,3770 ,3790 ,3810 ,3830 1,2 ,3849 ,3869 ,3888 ,3907 ,3925 ,3944 ,3962 ,3980 ,3997 ,4015 1,3 ,4032 ,4049 ,4066 ,4082 ,4099 ,4115 ,4131 ,4147 ,4162 ,4177 1,4 ,4192 ,4207 ,4222 ,4236 ,4251 ,4265 ,4279 ,4292 ,4306 ,4319

1,5 ,4332 ,4345 ,4357 .4370 ,4382 ,4394 ,4406 ,4418 ,4429 ,4441 1,6 ,4452 ,4463 ,4474 ,4484 ,4495 ,4505 ,4515 ,4525 ,4535 ,4545 1,7 ,4554 ,4564 ,4573 ,4582 ,4591 ,4599 ,4608 ,4616 ,4625 ,4633 1,8 ,4641 ,4649 ,4656 ,4664 ,4671 ,4678 ,4686 ,4693 ,4699 ,4706 1,9 ,4713 ,4719 ,4726 ,4732 ,4738 ,4744 ,4750 ,4756 ,4761 ,4767

2,0 ,4772 ,4778 ,4783 .4788 ,4793 ,4798 ,4803 ,4808 ,4812 ,4817 2,1 ,4821 ,4826 ,4830 ,4834 ,4838 ,4842 ,4846 ,4850 ,4854 ,4857 2,2 ,4861 ,4864 ,4868 ,4871 ,4875 ,4878 ,4881 ,4884 ,4887 ,4890 2,3 ,4893 ,4896 ,4898 ,4901 ,4904 ,4906 ,4909 ,4911 ,4913 ,4916 2,4 ,4918 ,4920 ,4922 ,4925 ,4927 ,4929 ,4931 ,4932 ,4934 ,4936

2,5 ,4938 ,4940 ,4941 ,4943 ,4945 ,4946 ,4948 ,4949 ,4951 ,4952 2,6 ,4953 ,4955 ,4956 ,4957 ,4959 ,4960 ,4961 ,4962 ,4963 ,4964 2,7 ,4965 ,4966 ,4967 ,4968 ,4969 ,4970 ,4971 ,4972 ,4973 ,4974 2,8 ,4974 ,4975 ,4976 ,4977 ,4977 ,4978 ,4979 ,4979 ,4980 ,4981 2,9 ,4981 ,4982 ,4982 ,4983 ,4984 ,4984 ,4985 ,4985 ,4986 ,4986

3,0 ,4987 ,4987 ,4987 ,4988 ,4988 ,4989 ,4989 ,4989 ,4990 ,4990 3,1 ,4990 ,4991 ,4991 ,4991 ,4992 ,4992 ,4992 ,4992 ,4993 ,4993 3,2 ,4993 ,4993 ,4994 ,4994 ,4994 ,4994 ,4994 ,4995 ,4995 ,4995 3,3 ,4995 ,4995 ,4995 ,4996 ,4996 ,4996 ,4996 ,4996 ,4996 ,4997 3,4 ,4997 ,4997 ,4997 ,4997 ,4997 ,4997 ,4997 ,4997 ,4997 ,4998

3,5 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 ,4998 3,6 ,4998 ,4998 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 3,7 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 3,8 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 ,4999 3,9 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000 ,5000

Page 16: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

16

3. Coefficient de concordance de Kendall (W)

N ≤ 7 On confronte nVar avec la valeur donnée dans une table pour k (nombre de juges) et n (nombre de sujets). Si la valeur calculée > valeur lue on rejette Ho

N Valeurs supplémentaires pour N=3

k 3 4 5 6 7 k s

Valeurs à .05 3 64.4 103.9 157.3 9 54.0 4 49.5 88.4 143.3 217.0 12 71.9 5 62.6 112.3 182.4 276.2 14 83.8 6 75.7 136.1 221.4 335.2 16 95.8 8 48.1 101.7 183.7 299.0 453.1 18 107.7 10 60.0 127.8 231.2 376.7 571.0 15 89.8 192.9 349.8 570.5 864.9 20 119.7 258.0 468.5 764.4 1158.7

Valeurs à .01 3 75.6 122.8 185.6 9 75.9 4 61.4 109.3 176.2 265.0 12 103.5 5 80.5 142.8 229.4 343.8 14 121.9 6 99.5 176.1 282.4 422.6 16 140.2 8 66.8 137.4 242.7 388.3 579.9 18 158.6 10 85.1 175.3 309.1 494.0 737.0 15 131.0 269.8 475.2 758.2 1129.5 20 177.0 364.2 641.2 1022.2 1521.9

Table des valeurs critiques de s (nVar) dans le coefficient de concordance de Kendall

N > 7 L (k (n – 1) W) = χ²ν = n-1

Page 17: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

17

Chapitre 3 TESTS NON PARAMETRIQUES

CAS D’UN ECHANTILLON

I. Le test binomial On utilise le test binomial lorsque la variable nominale présente 2 modalités et que l’effectif de l’échantillon est petit. Exemple : La consigne d’un expérimentateur propose au sujet de choisir entre deux options A et B (question fermée) ; 16 sujets répondent A : 12 B : 4 Il pose donc comme hypothèse nulle qu’il n’y a pas de différence entre le nombre de réponses A et B (comme si on avait obtenu 8 et 8). Une table a été établie pour rejeter ou ne pas rejeter cette hypothèse nulle en fonction des résultats observés si N < 25 Voici la procédure : N = nombre total de cas observés 16 x = plus petit effectif (des deux) observés 4 on fixe le seuil : 0.05 On regarde dans la table la probabilité d’apparition de cette valeur 4 ; elle est de .038 .038 < .05 donc on rejette l’hypothèse nulle au risque de 5% Si on n’avait que 10 sujets : N = 10 A = 8 B = 2 x = 2 proba lue = .055 > .05 donc non significatif à 5%

Page 18: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

18

x N

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

5 .031 .188 .500 .812 .969 6 .016 .109 .344 .656 .891 .984 7 .008 .062 .227 .500 .773 .938 .992 8 .004 .035 .145 .363 .637 .855 .965 .996 9 .002 .020 .090 .254 .500 .746 .910 .980 .998

10 .001 .011 .055 .172 .377 .623 .828 .945 .989 .999 11 .006 .033 .113 .274 .500 .726 .887 .967 .994 12 .003 .019 .073 .194 .387 .613 .806 .927 .981 .997 13 .002 .011 .046 .133 .291 .500 .709 .867 .954 .989 .998 14 .001 .006 .029 .090 .212 .395 .605 .788 .910 .971 .994 .999 15 .004 .018 .059 .151 .304 .500 .696 .849 .941 .982 .996 16 .002 .011 .038 .105 .227 .402 .598 .773 .895 .962 .989 .998 17 .001 .006 .025 .072 .166 .315 .500 .685 .834 .928 .975 .994 .999 18 .001 .004 .015 .048 .119 .240 .407 .593 .760 .881 .952 .985 .996 .999 19 .002 .010 .032 .084 .180 .324 .500 .676 .820 .916 .968 .990 .998 20 .001 .006 .021 .058 .132 .252 .412 .588 .748 .868 .942 .979 .994 21 .001 .004 .013 .039 .095 .192 .332 .500 .668 .808 .905 .961 .987 22 .002 .008 .026 .067 .143 .262 .416 .584 .738 .857 .933 .974 23 .001 .005 .017 .047 .105 .202 .339 .500 .661 .798 .895 .953 24 .001 .003 .011 .032 .076 .154 .271 .419 .581 .729 .846 .924 25 .002 .007 .022 .054 .115 .212 .345 .500 .655 .788 .885

Table of probabilities associated with values as small as observed values of x in the BINOMIAL TEST

Given in the body of this table are one-tailed probabilities under Ho for the binomial test when P = Q = ½

II. Le test de Kolmogorov-Smirnov Ce test est un test d’ajustement entre la distribution d’une variable observée sur un échantillon et une distribution théorique. Il permet de dire si un échantillon peut raisonnablement être constitué comme provenant d’une population présentant la distribution théorique. Il concerne les variables ordinales. Il porte sur la distribution cumulée des effectifs et permet de déterminer la probabilité de l’écart entre l’observé et le théorique. Exemple : observation d’origine sociologique ; les noirs américains semblent préférer un teint clair (une couleur de peau) 10 personnes de couleur sont photographiées et chaque photo est tirée en 5 versions différentes en intensité de noir ; ces versions peuvent être rangées de 1 à 5 (de la plus noire à la moins noire). Chaque sujet choisit sa propre photo parmi les 5 versions Si l’hypothèse (les personnes de couleurs américaines préfèrent une couleur de peau plus claire) est fausse alors on ne devrait pas observer de différence entre les choix. Ces choix devraient se distribuer de façon égale avec la même probabilité d’apparition. Ho : les effectifs des modalités des photos choisies sont égaux Seuil = 5% N = 10

Page 19: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

19

rang de la modalité choisie 1 2 3 4 5

oi 0 1 0 5 4 oi↑ 0 1 1 6 10

SN(x) 0 1/10 1/10 6/10 10/10 ei 2 2 2 2 2

ei↑ 2 4 6 8 10 FO(x) 2/10 4/10 6/10 8/10 10/10

|FO(x) - SN(x)| 2/10 3/10 5/10 2/10 0 SN(x) = fréquences observées cumulées croissantes FO(x) = fréquences théoriques cumulées croissantes On calcule D = sup |FO(x) - SN(x)| D = 5/10 = 0.5 La table donne les valeurs de ce D en fonction du nombre de sujets et du seuil de significativité ; les valeurs lues peuvent être considérées comme des valeurs à ne pas dépasser si l’on veut Ho ; si la valeur calculée est supérieure à la valeur lue, on rejette Ho. Dans notre exemple, on lit une valeur dans la table de 0.410 0.5 > 0.410 donc on rejette Ho à 5% (et d’ailleurs aussi à 1%)

Page 20: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

20

Au-delà de 35

N22.1

N36.1

N63.1

Table pour le test de Kolmogorov-Smirnov

N .10 .05 .01

1 .950 .975 .995 2 .776 .842 .929 3 .642 .708 .828 4 .564 .624 .733 5 .510 .565 .669 6 .470 .521 .618 7 .438 .486 .577 8 .411 .457 .543 9 .388 .432 .514 10 .368 .410 .490 11 .352 .391 .468 12 .338 .375 .450 13 .325 .361 .433 14 .314 .349 .418 15 .304 .338 .404 16 .295 .328 .392 17 .286 .318 .381 18 .278 .309 .371 19 .272 .301 .363 20 .264 .294 .356 25 .24 .27 .32 30 .22 .24 .29 35 .21 .23 .27

Page 21: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

21

III. Le test des séquences Exemple : Soient les séquences suivantes de ‘pile’ ou ‘face’ lors de 20 lancers successifs d’une même pièce de monnaie par un même joueur : P F P P P F F P P F F F P F F P P F F P 10 P 10 F P P P P P P P P P P F F F F F F F F F F 10 P 10 F P F P F P F P F P F P F P F P F P F P F 10 P 10 F Un test permet de savoir si l’ordre d’apparition des piles et les faces est aléatoire ou non. Il repose sur le calcul du nombre de séquence (r) de symboles identiques. Exemple : 1) r = 11 2) r = 2 3) r = 20 Exemple : un financier s’intéresse à la variation du CAC 40 ; il note les résultats suivants +0.12 ; -0.43 ; -0.52 ; +1.21 ; +1.32 ; -0.02 ; -0.03 ; +0.83 ; +0.54 ; +1.25 ; -0.23 ; -1.28 ; -1.49 ; -2.32 ; -3.31 ; -1.01 ; +0.05 ; +0.95 ; +0.87 ; -0.01 Il s’intéresse à une éventuelle structure de l’ensemble de ces variations opposée à une variation aléatoire. + - - + + - - + + + - - - - - - + + + - 1 2 3 4 5 6 7 8 On notera n1 le nombre de + et n2 le nombre de – . On relève r = 8

Page 22: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

22

Toute valeur r inférieure ou égale à celle trouvée dans la table (a) ou supérieure à celle trouvée dans la table (b) cause le rejet de Ho au seuil de 0.05

VALEURS CRITIQUES DE r DANS UN TEST DE SEQUENCES

(a) n2 n1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 202 2 2 2 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 4 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 5 2 2 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 6 2 2 3 3 3 3 4 4 4 4 5 5 5 5 5 5 6 6 7 2 2 3 3 3 4 4 5 5 5 5 5 6 6 6 6 6 6 8 2 3 3 3 4 4 5 5 5 6 6 6 6 6 7 7 7 7 9 2 3 3 4 4 5 5 5 6 6 6 7 7 7 7 8 8 8 10 2 3 3 4 5 5 5 6 6 7 7 7 7 8 8 8 8 9 11 2 3 4 4 5 5 6 6 7 7 7 8 8 8 9 9 9 9 12 2 2 3 4 4 5 6 6 7 7 7 8 8 8 9 9 9 10 1013 2 2 3 4 5 5 6 6 7 7 8 8 9 9 9 10 10 10 1014 2 2 3 4 5 5 6 7 7 8 8 9 9 9 10 10 10 11 1115 2 3 3 4 5 6 6 7 7 8 8 9 9 10 10 11 11 11 1216 2 3 4 4 5 6 6 7 8 8 9 9 10 10 11 11 11 12 1217 2 3 4 4 5 6 7 7 8 9 9 10 10 11 11 11 12 12 1318 2 3 4 5 5 6 7 8 8 9 9 10 10 11 11 12 12 13 1319 2 3 4 5 6 6 7 8 8 9 10 10 11 11 12 12 13 13 1320 2 3 4 5 6 6 7 8 9 9 10 10 11 12 12 13 13 13 14

(b) n2 n1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 202 6 6 6 6 6 6 6 6 6 3 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 4 9 9 10 10 10 10 10 10 10 10 10 10 10 10 10 105 9 10 10 11 11 12 12 12 12 12 12 12 12 12 12 12 126 8 9 10 11 12 12 13 13 13 13 14 14 14 14 14 14 14 147 8 10 11 12 13 13 14 14 14 14 15 15 15 16 16 16 16 168 8 10 11 12 13 14 14 15 15 16 16 16 16 17 17 17 17 179 8 10 12 13 14 14 15 16 16 16 17 17 18 18 18 18 18 1810 8 10 12 13 14 15 16 16 17 17 18 18 18 19 19 19 20 2011 8 10 12 13 14 15 16 17 17 18 19 19 19 20 20 20 21 2112 6 8 10 12 13 14 16 16 17 18 19 19 20 20 21 21 21 22 2213 6 8 10 12 14 15 16 17 18 19 19 20 20 21 21 22 22 23 2314 6 8 10 12 14 15 16 17 18 19 20 20 21 22 22 23 23 23 2415 6 8 10 12 14 15 16 18 18 19 20 21 22 22 23 23 24 24 2516 6 8 10 12 14 16 17 18 19 20 21 21 22 23 23 24 25 25 2517 6 8 10 12 14 16 17 18 19 20 21 22 23 23 24 25 25 26 2618 6 8 10 12 14 16 17 18 19 20 21 22 23 24 25 25 26 26 2719 6 8 10 12 14 16 17 18 20 21 22 23 23 24 25 26 26 27 2720 6 8 10 12 14 16 17 18 20 21 22 23 24 25 25 26 27 27 28

Page 23: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

23

Cas des petits échantillons : n1 et n2 ≤ 20 Pour ces échantillons, une table donne les valeurs permettant de rejeter Ho à 5% Si r ≤ ra (valeur de r donnée dans la table a) ou Si r ≥ rb (valeur de r donnée dans la table b) alors on rejette Ho à 5% Exemples : 1) la pièce de monnaie : n1 et n2 = 10 cas 1 : r = 11 Ho à 5% cas 2 : r = 2 rejet de Ho cas 3 : r = 20 rejet de Ho 2) le CAC 40 : n1 = 9 n1 et n2 = 11 r = 8 table a : 8 > 6 et 8 < 16 donc pas de rejet de Ho à 5%

Cas des grands échantillons Si n1 ou n2 > 20 , on ne peut plus utiliser la table. On sait qu’une bonne approximation de la distribution de r est une loi normale :

( )

−++−−

++

=)1()()2(2

;12

212

21

212121

21

21

nnnnnnnnnn

nnnn

NrL

Exemple : 50 personnes, 30 hommes et 20 femmes forment une file d’attente Ho : il n’y a pas de structure, l’ordre MF est aléatoire dans cette file H1 : l’ordre n’est pas aléatoire dans cette file M F M F M M M F F M F M F M F M M M M F M F M F M M F F F M F M F M F M M F M M F M M M M F M F M M n1 = 30 et n2 = 20 r = 35 Le centrage réduction de r donne : Ecart type = 3.36 Moyenne = 25

98.236.3

2535=

−=z

seuil = 5% 2.98 > 1.96 donc rejet de Ho (l’ordre n’est pas aléatoire)

Page 24: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

24

Chapitre 4 TESTS NON PARAMETRIQUES

CAS DE DEUX ECHANTILLONS APPARIES

I. Test de Mac Némar On utilise ce test lorsqu’un ensemble de sujets est mesuré de façon ordinale ou nominale à deux moments séparés par un certain traitement (au sens large) : une formation, un lecture de texte, une visite d’un établissement, une vision d’un document, un apprentissage, etc. Ce test analyse le changement du sujet sur un certain point entre l’avant et l’après.

Après t1

t0 0 1

1 A B avant

0 C D

Le nombre d’individus qui changent est A+D Sous l’hypothèse nulle, l’effectif théorique est (A+D)/2 dans les deux cases qui nous intéressent.

)(

22

222 DA

DAD

DAA

+−

+

+

+

DADA

DADADA

+−

=+

+−+=Χ

22222 )()(22

En fait, on applique une correction (par continuité) qui consiste à calculer :

DADA+

−−=Χ

22 )1(

et on le confronte à la table du khi deux

Attention : si 52

<+ DA on utilise préférentiellement le test binomial

avec N = A+D x la plus petite valeur entre A et D

Page 25: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

25

Exemples : 1er cas : 30 sujets 3 sujets ont donné la bonne réponse au pré test et au post test 21 sujets se sont trompés lors du pré test 12 sujets ont donné la bonne réponse au post test

Après t1

t0 0 1

1 3 avant 0 21

12

Après t1

t0 0 1

1 6 3 9 avant 0 12 9 21

18 12 30 A = 6 D = 9 A+D = 15 (15/2 > 5 donc on utilise le test de Mac Némar) Ho : la probabilité de passer de 0 à 1 est égale à celle de passer de 1 à 0 (autrement dit 6 pas différent de 9 ; ou encore pas d’effet d’apprentissage) H1 : probabilité de passer d’échec à réussite (de 0 à 1) est supérieure à celle de passer de réussite à échec (autrement dit, 9 > 6, effet de l’apprentissage) ν = 1 seuil = 5%

( )26.0

96196 2

2 =+

−−=Χ

0.26 < 3.84, on ne peut pas rejeter Ho 2ème cas : 15 sujets

Après t1

t0 0 1

1 2 2 avant 0 4 7

15 A = 2 D = 7

Page 26: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

26

A + D = 9 9/2 < 5 test binomial N = 9 x = 2 probabilité lue dans la table: .09 > .05 donc on ne peut pas rejeter Ho (pas d’effet de l’apprentissage)

II. Test de signe On utilise le test de signe lorsque l’on veut comparer des valeurs ordinales pour un couple de données. Il est utile lorsqu’il n’y a pas de quantification possible mais il faut évidemment pouvoir ordonner les valeurs. C’est le cas lorsque l’on veut savoir si un groupe préfère tel ou tel objet (sur une échelle ordinale), événement, traitement ou autre.

Petit échantillon : N ≤ 25 Exemple : On demande à 15 enfants d’une classe de ‘juger’ les deux enseignants qui enseignent à mi-temps. Ils utilisent une échelle graduée de 1 à 10 pour chacun des deux enseignants. On attribue le signe + lorsque la valeur de la 1ère colonne est supérieure à celle de la seconde ; 0 ou = lorsque les deux valeurs sont équivalentes. Melle X Melle Y

9 7 + 8 5 + 5 7 - 2 6 - 9 3 + 7 6 + 5 5 = 9 9 = 2 8 - 7 6 + 8 4 + 9 7 + 3 6 - 4 4 = 5 3 +

Ho La fréquence d’apparition de « + » est égale à la fréquence d’apparition de « -» = 1/2

Page 27: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

27

Remarque : les couples où il n’y a pas de différence entre les deux valeurs comparées ne sont pas décomptés (on ne les prend pas en compte) car leur jugement ne sont ni à l’avantage de l’une, ni de l’autre. Remarque : si on prédit une évaluation meilleure pour l’une ou l’autre, on effectuera un test unilatéral ; si on prédit une différence entre les deux, ce sera un test bilatéral. Dans cet exemple, on prédit une évaluation meilleure en faveur de Melle X ; donc test unilatéral. H1 La fréquence d’apparition de « + » est supérieure à celle de « - » (= Melle X est plus appréciée par les élèves que Melle Y) On est dans les conditions d’application du test binomial (nombre de modalités = 2 ; p = q = 1/2 ; N ≤ 25) :

o Attention, on utilise pour N, le nombre total de couples moins le nombre de couples n’ayant pas produit de différence ; cela signifie qu’il faut avoir évaluer les écarts (en +, = ou -) avant de savoir si on peut utiliser le test binomial ou non)

N = 15 – 3 = 12

o x est le plus petit des 2 effectifs (ici c’est le nombre de « - ») x = 4 o lecture : p = .194 donc on ne peut pas conclure (on ne peut pas rejeter Ho) car

.194 > .05

Grand échantillon : N > 25 On procède dans un 1er temps de la même manière, c’est-à-dire on attribue les signes +, = ou -. Puis on comptabilise le nombre de « + » que l’on appelle R. On sait que L (Z) = N (0, 1) avec

N

NRZ

21

2)5.0( −±

= avec R + 0.5 si R ≤ N/2

R – 0.5 si R > N/2 Exemple : La classe compte 35 élèves et que l’on a obtenu les résultats suivants : 21+ 7= 7- N = 35 – 7 = 28 R = 21 R > N/2 (14) donc on utilise la formule avec R – 0.5

Page 28: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

28

46.228

21

228)5.021(

=−−

=Z

Le test est unilatéral droit ; dans la table de la loi normale, z = 2.46 correspond à .4931 donc à un α de 0.007. On rejette donc Ho au profit de l’hypothèse alternative au seuil de .007, Melle X est plus appréciée par ses élèves que Melle Y.

III. Test de Wilcoxon Dans l’exemple précédent, on s’est intéressé à la seule différence de jugement des deux enseignants pour chaque élève. On pourrait, de plus, vouloir connaître l’importance de l’écart entre les couples d’évaluation. Pour ce faire, on utilise le test de Wilcoxon : on aura alors accès à la significativité de la différence éventuelle autant au niveau des signes que de la grandeur de l’écart. Le test de Wilcoxon est plus puissant que le test de signe, car par exemple il donnera plus d’importance à l’avis de l’élève qui a attribué 9 et 3, qu’à l’avis de celui qui a attribué 7 et 6.

Petit échantillon N ≤ 25 Même exemple : Ho les deux enseignantes sont également appréciées H1 Melle X est plus appréciée que Melle Y Melle X Melle Y Rang en

valeur absolue

Rang positif

Rang négatif

9 7 +2 4.5 +4.5 8 5 +3 7.5 +7.5 5 7 -2 4.5 -4.5 2 6 -4 9.5 -9.5 9 3 +6 11.5 +11.5 7 6 +1 1.5 +1.5 5 5 0 / 9 9 0 / 2 8 -6 11.5 -11.5 7 6 +1 1.5 +1.5 8 4 +4 9.5 +9.5 9 7 +2 4.5 +4.5 3 6 -3 7.5 -7.5 4 4 0 / 5 3 +2 4.5 +4.5 Σ = + 45 Σ = - 33

Page 29: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

29

1) on calcule la différence entre les deux valeurs pour chaque couple (en considérant toujours la 1ère colonne 9 – 7 ; 8 – 5 ; etc)

2) on range ces différences en valeur absolue : on a deux fois 1 ; on attribue donc deux fois le rang 1.5 on a ensuite +2, -2, +2, +2 : on attribue à chacune de ces valeurs le rang 4.5 on a +3, -3 : rang 7.5 on a -4, +4 : rang 9.5 on a +6, -6 : rang 11.5 3) dans les deux colonnes suivantes, on redistribue les rangs en leur attribuant leur signe

4) On somme les rangs positifs et les rangs négatifs Ho se traduit par Σ rangs positifs = Σ rangs négatifs T = plus petite des deux valeurs en valeur absolue T = 33 N = nombre de rangs pris en compte (nombre total de paires moins nombre de paires n’ayant pas produit de différence) N = 12

Page 30: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

30

α unil. α bil.

N

.025 .05

.01

.02 .005 .01

6 0 7 2 0 8 4 2 0 9 6 3 2 10 8 5 3

11 11 7 5 12 14 10 7 13 17 13 10 14 21 16 13 15 25 20 16

16 30 24 20 17 35 28 23 18 40 33 28 19 46 38 32 20 52 43 38

21 59 49 43 22 66 56 49 23 73 62 55 24 81 69 61 25 89 77 68

Table de Wilcoxon pour séries appariées Si T calculé est inférieur ou égal au T lu, on rejette Ho Si T calculé supérieur au T lu, on ne peut pas conclure Dans notre exemple, pour N = 12, on a T calculé (33) > à tout T lu ; donc on ne peut pas conclure (on garde Ho)

Grand échantillon N > 25 On procède avec le même calcul mais on ne peut pas utiliser la table ; on sait que T suit une loi normale :

)24

)12)(1(;4

)1(()( +++

=NNNNN

NTL

Exemple : N = 27 Σ rangs positifs = 276 Σ rangs négatifs = -102

Page 31: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

31

T = inf (276 ; |-102|) = 102

1894

)127(27=

+×=Tµ

62.4124

1272()127(27=

+××+×=Tσ

donc T suit la loi normale L (T) = (189 ; 41.62) On calcule le rapport critique :

09.262.41189102

−=−

=RC

-2.09 < -1.645 donc rejet de Ho à 5% -2.09 < -1.96 donc rejet de Ho à 1%

Page 32: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

32

Chapitre 5 TESTS NON PARAMETRIQUES

CAS DE DEUX ECHANTILLONS INDEPENDANTS

I. Test de Fischer On utilise le test de Fischer lorsque deux échantillons indépendants diffèrent quant à une variable discrète (nominale ou ordinale) qui ne prend que deux valeurs lorsque la somme des tailles des deux échantillons est inférieure ou égale à 30. Le test de Fischer apparaît comme se substituant au test du khi-deux dans le cas d’une hypothèse d’indépendance d’une table 2 × 2 avec (2-1)(2-1)=1 degré de liberté. Mais dans ce test (contrairement au binomial) on prend en compte les 4 cases du tableau et les effectifs peuvent être très petits. Exemple : Dans une enquête, on veut savoir si les femmes et les hommes sont d’accord sur certains items ; chaque item est présenté sous la forme d’une question fermée de type « d’accord ou pas d’accord ». Item : « les femmes au foyer doivent être rémunérées pour leur travail ménager » 14 femmes entre 20 et 30 ans 10 d’accord 4 pas d’accord 12 hommes entre 20 et 30 ans 4 d’accord 8 pas d’accord

X1 X2 Y1 (fem) 10 4 Y2 (hom) 4 8

Ho il n’y a pas de différence de proportion de sujets d’accord ou pas d’accord dans l’un ou l’autre groupe H1 Il y a une différence Une table donne les significations des différences

Utilisation de la table Notation :

X1 X2 Y1 (fem) A (10) B (4) A+B (14) Y2 (hom) C (4) D (8) C+D (12)

A+C (14) B+D (12) A+B+C+D (26) 1) calculer A+B et C+D 2) repérer la valeur de A+B dans la table, puis repérer la valeur C+D

Page 33: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

33

3) parmi les valeurs données de B, repérer celle du tableau. Sur la même ligne, on lit les valeurs de D à dépasser si on ne veut pas rejeter Ho

C’est-à-dire, si la valeur de D est plus petite ou égale à la valeur lue dans le tableau, à un seuil donné, on peut rejeter Ho au seuil donné. 4) Si on ne trouve pas la valeur de B, on prend celle de A ; dans ce cas, le tableau donne

la valeur de C qu’il faut comparer à celle des nos résultats. Le niveau de significativité est donné pour un test unilatéral ; s’il s’agit d’un test bilatéral, il faut doubler les seuils. Si on peut lire B, on aura les valeurs limites pour D Si on peut lire A, on aura les valeurs limites pour C

Dans notre exemple : A+B = 14 C+D = 12 B = 4 on ne le trouve pas dans la table A = 10 C devrait être (pour pouvoir rejeter Ho) inférieur ou égal à 3 (pour unilatéral à 5% ou bilatéral à 10%) Or, C = 4, donc on ne peut pas rejeter Ho ; pas de conclusion Contrainte : Il faut que A+B ≤ 15 et C+D ≤ 15, sinon on ne peut pas lire la table. Si ce n’est pas le cas, on inverse le tableau de contingence. Exemple :

X1 X2 Y1 9 7 16 Y2 3 4 7

12 11 23 A+B = 16 donc on ne pourra pas lire la table On inverse le tableau

Y1 Y2 X1 9 3 12 X2 7 4 11

16 7 A+B = 12 C+D = 11 On ne trouve pas B ; on lit A = 9 ; on compare 9 à C (=7) ; C devrait être ≤ 3 pour rejeter Ho, donc pas de conclusion

Page 34: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

34

II. Le test de Mann Whitney Lorsque deux échantillons indépendants sont mesurés de façon ordinale, on utilise un test de Mann Whitney (le test U) pour tester le fait qu’ils proviennent ou non d’une même population. L’hypothèse nulle est qu’il n’y a pas de différence entre les deux populations dont sont issus ces deux échantillons quant à la variable ordinale observée. La mise en œuvre du test diffère selon que : n1 et n2 ≤ 8 (cas A) 9 ≤ n1 et n2 ≤ 20 (cas B) n2 > 20 (cas C) avec n1 et n2 taille des deux échantillons, n1 < n2

n1 et n2 ≤ 8 Un psycholinguiste, travaillant sur la compréhension des consignes lors d’exercices de mathématiques en classe de seconde, manipule la forme syntaxique de ces textes. Après il note la compréhension de l’élève avec un score entre 0 et 50 Texte classique A 45 28 32 25 44 24 30

Texte travaillé selon hypothèse linguistique

B 38 43 46 41 39 48

Ho : il n’y a pas de différence de compréhension selon le texte H1 : il y a une meilleure compréhension dans le groupe B On applique un test unilatéral ; si bilatéral, on aurait posé comme H1 « il y a une différence de compréhension selon le type de texte. » α = 5%

o On range les deux échantillons confondus par ordre croissant en identifiant chacune des données (échantillons A ou B)

24 25 28 30 32 38 39 41 43 44 45 46 48 A A A A A B B B B A A B B

o Pour chaque note de A, on compte le nombre de notes de B inférieures ou égales à elle. On fait le total. C’est U

24 25 28 30 32 38 39 41 43 44 45 46 48 A A A A A B B B B A A B B 0 0 0 0 0 / / / / 4 4 / / 8

Page 35: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

35

o On lit une des tables appropriées

Ici n1 = 6 et n2 = 7 (n1 toujours inférieur à n2) U = 8 Dans les tables, on lit directement la probabilité de U calculé quand n2 ≤ 8 ; si la probabilité lue est inférieure au seuil décidé, on rejette Ho. Dans la table, on lit une probabilité de .037 .037 < .05, donc on rejette Ho au seuil de 5% Si test bilatéral, on double la probabilité lue ( = .074), si α = .1, rejet. Remarque : Si on avait compté pour chaque note de B le nombre de notes de A inférieures ou égales, on aurait obtenu : 24 25 28 30 32 38 39 41 43 44 45 46 48 A A A A A B B B B A A B B / / / / / 5 5 5 5 / / 7 7 34

Cette valeur est notée U’ ; elle n’apparaît pas dans la table Si vous avez commencé par calculer la valeur qui n’apparaît pas dans la table, il est inutile de recommencer en comptant le nombre de l’autre groupe. On sait que : U + U’ = n1 × n2 8 + 34 = 6 × 7 Donc si dans les tables, la valeur calculée est supérieure à la plus grande valeur de U donnée dans la table, c’est que vous avez calculé U’ et il faut prendre pour U : U = n1×n2 – U’

9 ≤ n1, n2 ≤ 20 Même exemple mais plus de sujets Texte classique A 45 28 32 25 44 24 30 15 16 22 49 Texte travaillé B 38 43 46 41 39 48 47 19 21 n1 = 9 n2 = 11

o On attribue un rang à chacune des valeurs, les deux échantillons étant confondus ; on fait la somme des rangs (R) des valeurs de l’échantillon A ainsi que celle des valeurs de l’échantillon B

Pour des raisons pratiques, on calcule ainsi :

Page 36: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

36

A B valeur rang valeur rang

45 16 38 11 28 8 43 14 32 10 46 17 25 7 41 13 44 15 39 12 24 6 48 19 30 9 47 18 15 1 19 3 16 2 21 4 22 5 49 20

n2=11 R2=99 n1=9 R1=111

o On calcule U1 et U2 :

111

211 2)1(R

nnnnU −

++=

222

212 2)1( RnnnnU −

++=

3311121091191 =−

×+×=U 6699

212111191 =−

×+×=U

U = inf (U1 ; U2) U = 33

o On lit les tables Les tables donnent les valeurs maximales que doit prendre U pour pouvoir rejeter Ho. Dans notre exemple, on utilise un test unilatéral : 1ère table α = .05 U lu = 27 33 > 27 pas de rejet 2ème table α = .025 U lu = 23 3ème table α = .01 U lu = 18

n2 > 20 Les tables sont inutilisables.

)12

)1(;2

()( 212121 ++=

nnnnnnNUL

U sera calculé avec R1 et on calcule le rapport critique.

Page 37: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

37

Ex æquo L’écart type de la distribution est :

+−+×

−++ ∑Tnnnnnnnn

nn12

)()()1)((

213

21

2121

21

avec 12

3 ttT −= et t nombre d’ex æquo pour une valeur

Exemple

valeur rang valeur rang 45 29.5 38 19 28 12 43 27 32 14.5 46 31 25 9.5 41 23.5 44 28 39 20.5 24 8 48 33.5 30 13 47 32 15 1 19 5 16 2 21 6 22 7 18 4 49 35 17 3 25 9.5 35 17.5 26 11 42 25.5 39 20.5 48 33.5 40 22 42 25.5 32 14.5 35 17.5 41 23.5 33 16 45 29.5

n2 = 21 349 n1=14 281 9.5 : 2 fois 14.5 17 20.5 23.5 25.5 29.5 33.5 Remarque : inutile de calculer la somme de n2

1182812

151421142

)1(1

1121 =−

×+×=−

++= RnnnnU

Page 38: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

38

1472

2114=

×=m =

−×=∑ 12

2283

T

68.29412

)2114()2114()12114)(2114(

2114 3

=

+−+×

−++×

98.068.29147118

−=−

=RC

-1.96 < -0.98 < 1.96 donc compris dans la zone où on ne rejette pas Ho ; donc pas de conclusion

III. Le test médiane On utilise le test de la médiane lorsqu’on veut tester la différence entre deux groupes indépendants quant à une variable ordinale ou par intervalle. Plus précisément, il s’agit de tester l’hypothèse selon laquelle les deux groupes proviennent de deux populations présentant la même médiane ou non. La procédure est la suivante :

On détermine la médiane de l’ensemble des valeurs prises par la variable

On dichotomise l’ensemble des valeurs prises par la variable dans chaque groupe en : o Valeur inférieure strictement à la médiane o Valeur supérieure strictement à la médiane

On rassemble dans un tableau de la forme G1 G2

< méd A B A+B >méd C D C+D

A+C B+D A+B+C+D =

n1+n2=N

Selon les effectifs, on applique le test du khi-deux d’indépendance de deux variables nominales ou le test de Fischer Remarque : Si le nombre d’individus présentant exactement la valeur médiane est petit par rapport à n1+n2, on les élimine (de l’ordre de 10%). Si le nombre d’individus présentant exactement la valeur médiane est plus important, on dichotomise de la sorte : ≤ médiane et > médiane

Page 39: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

39

Exemples

1) variable ordinale G1 : 1 10 9 8 5 2 1 3 2 G2 : 2 5 8 8 9 10 7 6 1 3 4 7 7 n1=9 n2 = 13 On cherche la médiane de l’ensemble ; on classe donc toutes les valeurs : 1 1 1 2 2 2 3 3 4 5 5 6 7 7 7 8 8 8 9 9 10 10 L’intervalle médian est (5 ; 6) ; la médiane est de 5.5 On fait le tableau suivant : on dénombre combien de valeurs < 5.5 et > dans le G1, ainsi que dans le G2.

G1 G2 < 5.5 6 5 11 > 5.5 3 8 11

9 13 22 On applique le test de Fischer : A+B = 11 C+D = 11 B = 5 donc D doit être <0 si on veut rejeter Ho D = 8 donc pas de conclusion

2) variable par intervalle Soient deux distributions X et Y

xi ni ni ↑ [0 ; 5[ 3 3 [5 ; 10[ 8 11 [10 ; 15[ 10 21 [15 ; 20[ 7 28 [20 ; 25[ 4 32

32

Page 40: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

40

yi ni ni ↑ [0 ; 5[ 1 1 [5 ; 10[ 3 4 [10 ; 15[ 9 13 [15 ; 20[ 12 25 [20 ; 25[ 10 35

35 Il faut d’abord calculer la médiane de l’ensemble ; on refait donc un tableau en additionnant pour chaque intervalle les effectifs correspondant de X et de Y

zi ni ni ↑ [0 ; 5[ 4 4 [5 ; 10[ 11 15 [10 ; 15[ 19 34 [15 ; 20[ 19 53 [20 ; 25[ 14 67

67 La médiane se situe dans la classe [10 ; 15[ car 67/2=33.5 On fait une interpolation linéaire ; on associe 15 d’effectif cumulé à 10, 34 à 15 et on cherche la valeur de la variable entre 10 et 15 correspondant à 33.5 :

87.141534155.33

101510

=→−−

=−− mémé

Donc la médiane de l’ensemble est de 14.87 Il s’agit maintenant de connaître exactement le nombre de sujets de chacun des groupes qui présentent une valeur < et > à 14.87 Pour cela, il faudra refaire des interpolations linéaires, avec un raisonnement inverse de celui que l’on vient de faire : on connaît les valeurs de la variable, on cherche les effectifs cumulés correspondants. 1er groupe :

xi ni ni ↑ [0 ; 5[ 3 3 [5 ; 10[ 8 11 [10 ; 15[ 10 21 [15 ; 20[ 7 28 [20 ; 25[ 4 32

32 La mé de l’ensemble est situé dans la classe [10 ; 15[ ; à la valeur 10 correspond 11 sujets ( = 11 sujets ont un score strictement inférieur à 10) ; à la valeur 15 correspond 21 sujets ; à combien de sujets correspond la valeur 14.87. On va appeler A ce nombre de sujets :

Page 41: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

41

74.201015

1087.14112111

=→−−

=−− AA

Comme n1 = 32, C = 32-20.74 = 11.26 2ème groupe :

yi ni ni ↑ [0 ; 5[ 1 1 [5 ; 10[ 3 4 [10 ; 15[ 9 13 [15 ; 20[ 12 25 [20 ; 25[ 10 35

35 La médiane de l’ensemble est toujours dans la classe [10 ; 15[ ; on associe 10 à 4 , 15 à 13 et on cherche 14.87 à combien ?

77.121015

1087.144134

=→−−

=−− BB

Comme n2 = 35, D = 35-12.77=22.23 On peut maintenant faire le tableau :

G1 G2 < 14.87 20.74 12.77 33.51 > 14.87 11.26 22.23 33.49

32 35 67

( ) 36.549.3351.333532

6726.1177.1223.2274.20

6749.3351.333532

23.2226.1177.1274.20

2

2

2 =×××

××−×=

×××=Χ

ν = 1 Khi-deux lu à .05 = 3.84 5.36 > 3.84 donc on rejette Ho au profit de H1 à 5% (S, p<.05)

Page 42: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

42

Chapitre 6 ANALYSE DE LA VARIANCE

I. Introduction

Exemple :

Soit l’hypothèse selon laquelle le temps de réaction à un stimulus peut être affecté par la teneur de la consigne. C1 groupe contrôle : « Appuyez sur la touche le plus rapidement possible après l’allumage de la lampe rouge. » C2 groupe expérimental « Appuyez sur la touche le plus rapidement possible après l’allumage de la lampe rouge ; attention la lampe peut s’allumer dans une autre couleur, n’appuyez que si elle est rouge. » Σ m Gpe contrôle 32 24 28 29 25 20 22 19 24 27 250 25 Gpe expé 20 15 18 25 17 32 18 17 19 19 200 20 Temps en ms

Variances intra et inter L’idée générale est la suivante : on travaille non seulement sur l’écart entre les deux moyennes, mais aussi sur la variabilité générale. La variabilité intra est mesurée par la variance intra qui donne une mesure de l’erreur expérimentale (cf. cours 1ère année, variations aléatoires des mesures) ; elle explique les variations, pour une même situation expérimentale, du temps de réaction au sein d’un même groupe de sujets (ou de plusieurs mesures pour un même sujet). Elle n’atteint pas du tout la différence entre les deux situations. La variabilité inter est mesurée par la variance inter qui exprime l’action éventuelle de la VI (variable indépendante) et celles de facteurs aléatoires (erreur expérimentale et fluctuation d’échantillonnage) ; elle prend en compte les variations entre les deux situations (les deux groupes). On s’intéresse au rapport :

raVarerVarFcal int

int= c’est l’indice d’effet de la VI

Si il n’y a pas d’effet de la VI : la var inter se réduit à l’erreur expérimentale la var intra est, par définition, l’erreur expérimentale et donc Fcal ≅ 1

Page 43: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

43

S’il y a un effet de la VI : la var inter contient l’erreur expérimentale mais quelque chose de chose en plus qui est bien plus important (en termes de quantité) que seule cette erreur la var intra est, par définition, l’erreur expérimentale et donc Fcal > 1 Evidemment, c’est la valeur de l’écart entre Fcal et 1 qui sera ou non significatif.

II. Notation Pour le moment, nous travaillons avec des groupes de même effectif. Un plan expérimental simple est noté S (A) S ensemble des individus statistiques pour un groupe cardinal de S = S A ensemble des modalités prises par la VI cardinal de A = A Dans notre exemple, on noterait S10 (A2) On note : a une modalité de la VI (dans notre exemple, a=1 ou 2, on attribue une modalité arbitraire car variable nominale) Ya s valeur de la variable (VD) pour un individu précis qui appartient à un groupe précis (donc pour une valeur précise de la VI)

∑=

=

=Ss

sasa YY

1. somme des valeurs de la variable (VD) pour les individus

qui ont ‘a’ pour modalité de la VI

∑∑=

=

=

=

=Ss

sas

Aa

aYY

11.. somme de toutes les valeurs de la variable (VD)

pour toutes les modalités de la VI

SYM a

a.

. = moyenne des valeurs de la variable VD pour une

modalité précise de la variable VI

SAYM ..

.. = moyenne de toutes les valeurs de la variable VD

pour toutes les modalités de la VI Dans notre exemple : a = 1 groupe contrôle a = 2 groupe expérimental Y12 24 Y27 18 Y1.= 32+24+38+…+27 = 250 Y2.= 20+15+…+19 = 200

Page 44: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

44

Y..= Y1.+ Y2. = 450 M1. = 250/10 = 25 M2. = 200/10 = 20

5.22102

450.. =

×=M

Les sommes des carrés Dans l’anova, les variances inter (entre) et intra (dans) se ramènent à des sommes de carrés rapportées à des degrés de liberté. On travaille sur des écarts entre les valeurs de la variable et les moyennes. Ya s – M.. = (Ya s – Ma. ) + (Ma. - M..) (Ya s – M..)² = (Ya s – Ma.)² + (Ma. - M..)² + 2(Ya s – Ma. ) (Ma. - M..) On veut la somme des carrés des écarts à la moyenne (cf. formule variance)

∑∑=

=

=

=

Ss

s

Aa

a 11(Ya s – M..)² = ∑∑

=

=

=

=

Ss

s

Aa

a 11 (Ya s – Ma.)² + ∑∑

=

=

=

=

Ss

s

Aa

a 11 (Ma. - M..)² +

∑∑=

=

=

=

Ss

s

Aa

a 112(Ya s – Ma. ) (Ma. - M..)

or, on montre (cf Abdi Introduction au traitement statistique des données expérimentales), que la somme du dernier terme est nulle (car somme des Ya s = somme des Ma. ) on a donc

∑∑=

=

=

=

Ss

s

Aa

a 11(Ya s – M..)² = ∑∑

=

=

=

=

Ss

s

Aa

a 11 (Ya s – Ma.)² + ∑∑

=

=

=

=

Ss

s

Aa

a 11 (Ma. - M..)²

(Ya s – Ma.) = l’écart entre un sujet et la moyenne dans son groupe ; donc la somme de tous ces écarts (donc pour tous les sujets) élevée au carré « représente ce qui se rapproche de la variance intra groupe » ; on l’appelle SCdans

(Ma. - M..) = écart entre la moyenne d’un groupe et la moyenne générale ; la somme élevée au carré « représente ce qui se rapproche de la variance inter » ; on l’appelle SCentre. (Ya s – M..) = écart entre le score d’un individu et la moyenne générale ; la somme élevée au carré est SCtot donc on voit que SCtot = SCdans + SCentre

Page 45: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

45

somme des carrés totale = somme des carrés dans les groupes + somme des carrés entre les groupes.

Les degrés de liberté En regardant les formules précédentes, on s’aperçoit qu’elles dépendent du nombre de sujets (plus le nombre de sujets augmente, plus la somme des carré dans les groupes augmente). Si on veut comparer ces sommes, il faut les exprimer sur une même échelle ; il faut donc les normer selon le nombre de sujets, donc selon le degré de liberté. SCentre est calculé à partir des écarts des moyennes de groupes à la moyenne générale ; si nous avons A groupes, nous avons A moyennes donc : ddlentre = A-1 SCdans est calculé à partir des écarts des scores de chaque groupe à la moyenne du groupe. Nous avons S observations par groupe (donc ddl = S-1) et nous avons une moyenne par groupe, donc A moyennes. ddldans = A (S-1) = AS – A = N –A avec N nombre total de sujets SCtot se calcule à partir des écarts de chacun des scores à la moyenne générale ; nous avons N scores (ou S × A) : ddltot = N – 1 Remarque : SCtot = SCdans + SCentre

ddltot = ddldans + ddlentre N – 1 = N –A + A-1 Ces deux relations sont fondamentales dans l’analyse de variance.

Les carrés moyens On définit donc les carrés moyens comme le rapport des sommes des carrés sur le nombre de degrés de liberté correspondant :

dans

dansdans ddl

SCCM = entre

entreentre ddl

SCCM =

Attention CMtot ≠ CMdans + CMentre

Page 46: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

46

Exemple : Σ m Gpe contrôle 32 24 28 29 25 20 22 19 24 27 Y1.=

250 M1. = 25

Gpe expé 20 15 18 25 17 32 18 17 19 19 Y2.= 200

M2. = 20

SCdans est la somme des écarts au carré entre les sujets et la moyenne de son groupe : SCdans = (32-25)² + (24-25)² + ….. + (27-25)² + (20-20)² + (15-20)² +…… + (19-20)² = 372 SCentre est la somme des écarts entre la moyenne d’un groupe et la moyenne générale (attention, pondérée par le nombre d’individus dans chaque groupe)

5.22102

450.. =

×=M

SCentre = 10 × (25-22.5)² + 10 × (20-22.5)² = 125 SCtot est la somme des écarts au carré entre le score d’un individu et la moyenne générale : SCtot = (32-22.5)² + ….. + (27-22.5)² + (20-22.5)² + …. + (19-22.5)² = SCdans + SCentre = 372 + 125 = 497 ddldans = A (S-1) = AS – A = N –A avec N nombre total de sujets = 20 – 2 = 18 ddlentre = A-1 = 2-1 = 1 ddltot = N – 1 = 19

1251

125===

entre

entreentre ddl

SCCM 67.2018372

===dans

dansdans ddl

SCCM

III. L’indice d’effet

expexp

erreurerreurVIeffet

CMCMF

dans

entreczl

+==

dans notre exemple : 05.667.20

125==calF

Cet indice d’effet suit une loi de Fisher-Snédécor à double degré de liberté : ν1 = A – 1 c’est le ddl du numérateur (ddlentre) ν2 = A (S-1) = N –A c’est le ddl du dénominateur (ddldans) Il y a donc autant de tables possibles que de couples de degré de liberté ; on se contente de travailler avec deux tables, celle du seuil de 5% et celle du seuil de 1%.

Page 47: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

47

Si Fcal ≥ Ftable rejet de Ho Si Fcal < Ftable pas de conclusion L’hypothèse nulle consiste à affirmer que, dans l’ensemble de la population (rappel que les hypothèses ne concernent pas l’échantillon considéré, mais la population dont provient l’échantillon), la VI n’a pas d’effet sur la VD. La valeur observée du critère s’attribue au hasard (erreur expérimentale). L’hypothèse alternative considère que dans l’ensemble de la population, la VI a un effet sur la VD. La valeur observée du critère s’attribue à l’effet de la VI sur la VD. Dans notre exemple : On regarde dans la table la valeur de Ftable à 5% pour ν1 = 1 et ν2 = 18 ; on lit 4.41 6.05 > 4.41 on rejette Ho Au seuil de 1%, on lit 8.28 6.05 < 8.28 pas de conclusion

IV. Présentation des résultats Les résultats sont classiquement représentés dans un tableau

Source SC ddl CM Fcal

entre 125 1 125 6.05 dans 372 18 20.67 total 497 19 (S, p<.05)

* (S, p<.01) ** ns On trouve aussi une notation plus générale pour la première colonne qui rappelle le plan expérimental : A (ou encore « consigne ») pour « entre » Renvoie à l’ensemble des modalités prises par les groupes, donc au nombre de groupes ; c’est donc bien la variabilité due aux groupes ; traduit l’effet de la VI S (A) (ou encore « erreur ») pour « dans » C’est la variabilité dans les groupes ; c’est le facteur sujet, l’erreur expérimentale. Autre exemple : Hypothèse sur l’utilisation d’images mentales favorise la mémorisation. Apprentissage de paires de mots ; ensuite on donne le premier mot, le sujet doit donner le second. Deux groupes de 15 sujets : Groupe expérimental : consigne pour imager (lier les deux mots de la paire avec une même image : chat + cigare : imaginer un chat fumant un cigare) Groupe contrôle : mémoriser les couples de mots.

Page 48: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

48

On relève le nombre de mots rappelés par sujet. GE 13-9-10-8-9-12-8-12-10-9-10-12-11-8-9 GC 5-3-4-4-6-1-3-4-6-4-6-2-5-3-4 Ho la VI n’a pas d’effet sur la VD La manipulation expérimentale n’affecte pas le comportement des sujets L’imagerie n’influence pas la mémorisation Le GC et le GE ne diffèrent pas pour le nombre de mots rappelés ; seul le hasard est responsable des différences observées Dans l’ensemble de la population, la moyenne GC est égale à la moyenne GE H1 La VI a un effet sur la VD Etc.. S = 15 A=2 SCentre ou SCA = 270 SCdans ou SCS(A) = 68 SCtot = 338 ddlentre = ddlA = 2-1 = 1 ddldans = ddlS(A) = 30-2 = 28 ddltot = 29

2701

270====

entre

entreAentre ddl

SCCMCM 43.22868

)( ====dans

dansASdans ddl

SCCMCM

18.11143.2

270==calF

ν1 = 1 ν2 = 28 à 5% on lit 4.20 à 1% on lit 7.64

source SC ddl CM Fcal A 270 1 270 111.18

S (A) 68 28 2.43 total 338 29 **

Avec SPSS : Analyse – comparer les moyennes – moyennes – définir VD et VI – choisir option tableau anova et êta

Page 49: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

49

Tableau de bord

VAR00001

10,0000 15 1,64754,0000 15 1,46397,0000 30 3,4140

VAR000021,002,00Total

Moyenne N Ecart-type

Tableau ANOVA

270,000 1 270,000 111,176 ,00068,000 28 2,429

338,000 29

CombinéInter-groupesIntra-classeTotal

VAR00001 * VAR00002

Sommedes carrés df

Moyennedes carrés F Signification

V. Autres modes de calcul

Mode 1

Il est fondé sur le tableau suivant avec les « nombres dans le carré ».

source SC ddl CM Fcal A

(entre) A - 1 A-1 A – 1

A-1

S (A) (dans)

AS - A AS - A AS – A AS-A

total AS - 1 AS - 1

On calcule 7 quantités : Q1 = « Grand total » = Y.. = somme de toutes les valeurs Q2 = AS = Σ Y..² = somme du carré de toutes les valeurs Q3 = A = Σ Ya.² /S = on calcule la somme des valeurs des individus pour le 1er groupe ; on l’élève au carré et on la divise par le nombre d’individus dans le groupe ; on fait de même pour tous les groupes et on somme le tout. Q4 = 1 = Y..²/AS = Q1²/AS Q5 = SCtot = AS – 1 = Q2 - Q4 Q6 = SCentre = SCA = A – 1 = Q3 – Q4 Q7 = SCdans = SCS(A) = AS – A = Q2 – Q3

Page 50: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

50

Exemple : Deux méthodes pédagogiques I et II ; 5 étudiants dans chaque groupe ; même épreuve I 75 62 71 58 73 II 81 85 68 92 90 Q1 = Y.. = 75 + 62 + ….. + 73 + 81 + 85 + ….. + 90 = 755 Q2 = AS = Σ Y..² = 75² + 62² + …. + 73² + 81² + …. + 90² = 58177 Q3 = A = Σ Ya.² /S = (75 + … + 73)² /5 + (81 + … + 90)² / 5 = 339²/5 + 416²/5=57595.4 Q4 = 1 = Y..²/AS = Q1²/AS = 755² / 2×5 = 57002.5 Q5 = SCtot = AS – 1 = Q2 - Q4 = 58177 – 57002.5 = 1174.5 Q6 = SCentre = SCA = A – 1 = Q3 – Q4 = 57595.4 – 57002.5 = 592.9 Q7 = SCdans = SCS(A) = AS – A = Q2 – Q3 = 58177 – 57595.4 = 581.6 On vérifie que 592.9 + 581.6 = 1174.5 On calcule (ddlentre = 1 ; ddldans = 10-2 = 8) CMentre = 592.9 / 1 = 592.9 CMdans = 581.6 / 8 = 72.7 Fcal = 592.9/72.7 = 8.16

source SC ddl CM Fcal A

(entre) 592.9 1 592.9 8.16

S (A) (dans)

581.6 8 72.7

total 1174.5 9 *

Mode 2 On peut également simplifier les calculs en faisant une translation à la variable. Dans notre exemple, on pose Y’ = Y – 70 I 5 -8 1 -12 3 II 11 15 -2 22 20 Y’.. = 5 – 8 + 1 – 12 + 3 + 11 + 15 – 2 + 22 + 20 =55 AS = Σ Y’..² = 5² + 8² + 1² + …. + 22² + 20² =1477 A = Σ Ya.² /S = (5 - 8 + 1 - 12 + 3)² / 5 + (11 + 15 - 2 + 22 + 20)² / 5 = -11² + 66² / 5 = 895.4

Page 51: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

51

1 = Y..²/AS = Q1²/AS = 55² / 2×5 = 302.5

source SC ddl CM Fcal A

(entre) A – 1

895.4-302.5

=592.9

A-1 1

A – 1 A-1

592.9

8.16

S (A) (dans)

AS – A

1477-895.4 =581.6

AS – A 8

AS – A AS-A

581.6/8 =72.7

total AS – 1

1477.302.5 = 1174.5

AS – 1 9

*

Autre exemple : 3 groupes de 5 étudiants ; 3 méthodes de mémorisation selon consigne. Peut-on conclure à un effet de la consigne ? image construite (définition du mot à mémoriser + dessin du mot à faire soi-même) image donnée (définition + dessin donné à recopier) contrôle (définition) On relève le nombre de mots mémorisés I 23 19 25 24 25 Σ = 116 II 14 10 14 19 21 Σ = 78 III 6 9 12 14 15 Σ = 56 Le plan expérimental est de la forme S (A) avec S = 5 et A = 3 Nous n’avons qu’un facteur de variation. Y’.. = 116 + 78 + 56 = 250 AS = Σ Y’..² = 23² + 19² + …..+ 19² + 21² + …. + 14² + 15² = 4692 A = Σ Ya.² /S = (116² + 78² + 56²) / 5 = 4535.2 1 = Y..²/AS = 250² / 3×5 = 4166.67

source SC ddl CM Fcal

Page 52: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

52

A (entre)

A – 1

4535.2-4166.67 =368.53

A-1 2

A – 1 A-1

184.27

184.27/13.07 =

14.1

S (A) (dans)

AS – A

4692-4535.2 =156.8

AS – A

12

AS – A AS-A

13.07

total AS – 1

4692-4166.67 = 525.33

AS – 1

14

**

VI. Lien entre l’ANOVA et le test de Student

Nous venons de comparer grâce à l’ANOVA les moyennes de deux ou plusieurs groupes expérimentaux. L’année dernière, nous avons vu que le T-test permet aussi de comparer deux groupes expérimentaux. Ce ne sont pas deux tests différents car le tcal est lié au Fcal. Exemple : Deux groupes de 8 souris ; G1 produit supposé inhibiteur, G2 groupe contrôle ; on mesure le temps de passation dans une épreuve de labyrinthe. G1 14 15.5 15 16 14.5 15 15.5 16 G2 16 18 15.5 17 17 16.5 18 17.5

1) T-test Rappel:

);()(212121 XXXXStXXL

−−=− σµν

avec 2121

222

211 11

221 nnnnsnsn

XX +−+

+=

−σ et ν = n1 + n2 -2

19.158

5.1211 ==x 43.

85.121

8²16...²5.15²14 2

21 =

+++=σ

94.168

5.1352 ==x 71.

85.135

8²5.17...²18²16 2

22 =

+++=σ

403.81

81

28871.843.8

21=+

−+×+×

=−XXσ

Page 53: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

53

34.4403.

94.1619.15−=

−=RC

à ν = n1 + n2 -2 = 14 t.995=-2.98 rejet de Ho

2) ANOVA G1 14 15.5 15 16 14.5 15 15.5 16 Σ=121.5 G2 16 18 15.5 17 17 16.5 18 17.5 Σ=135.5 Y’.. = 121.5 + 135.5 = 257 AS = Σ Y’..² = 14² + 15.5² + … + 18² + 17.5² = 4149.5 A = Σ Ya.² /S = (121.5² + 135.5²) / 8 = 4140.31 1 = Y..²/AS = 257² / 2×8 = 4128.06

source SC ddl CM Fcal A

(entre) 4140.31-4128.06

=12.25 1

12.25

18.56

S (A) (dans)

4149.5-4140.31 =9.19

14

.66

total 4149.5-4128.06 =21.44

15 **

tcal2 ≅ Fcal 4.342 = 18.83 ≅ 18.56 Avec SPSS : Exemple précédent (deux groupes de 15 sujets avec utilisation ou non d’images mentales)

Tableau ANOVA

270,000 1 270,000 111,176 ,00068,000 28 2,429

338,000 29

CombinéInter-groupesIntra-classeTotal

VAR00001 * VAR00002

Sommedes carrés df

Moyennedes carrés F Signification

T-test

Test d'échantillons indépendants

,615 ,439 10,544 28 ,000 6,0000 ,5690 4,8344 7,1656

10,544 27,618 ,000 6,0000 ,5690 4,8336 7,1664

Hypothèse devariances égalesHypothèse devariances inégales

VAR00001F Sig.

Test de Levene surl'égalité des variances

t ddlSig.

(bilatérale)Différencemoyenne

Différenceécart-type Inférieure Supérieure

Intervalle de confiance95% de la différence

Test-t pour égalité des moyennes

On lit le t = 10.544 F = 111.167 = t²

Page 54: Chapitre 1 LE TEST DU KHI-DEUX - Le Microcosmelemicrocosme.free.fr/pdf/licence.pdf · Le coefficient Phi (ou V) de Cramèr (Øc) ()1 2 − Φ = c N k χ avec N taille de l’échantillon

54

VII. Estimation de l’intensité de l’effet de la VI Quand on rejette Ho, on sait que la VI affecte la VD mais on ne mesure pas l’intensité de cet effet. Cette intensité n’a rien à voir avec le seuil de rejet, ni avec le nombre de sujets de l’expérience. Pour compléter et affiner l’analyse de variance, on estime l’intensité de l’effet de la VI. L’idée est d’exprimer la part de variance de la VD attribuable à la VI par rapport à toutes les sources de variance. Le coefficient le plus utilisé est éta carré : η² On l’a déjà vu l’an passé : c’est le rapport de corrélation non linéaire. Il avait été défini par

globale

erouliquéevar

)intvar(expvar² =η

Dans l’ANOVA, éta carré exprime l’effet de la VI comme le rapport de la Somme des Carrés de A à la Somme des Carrés totale

tot

entre

tot

A

SCSC

SCSC

==2η

Il varie de 0 à 1 ; multiplié par 100, il donne le pourcentage de variance de la VD expliqué par la VI. Exemples :

Les 2 groupes de souris : 57.44.2125.122 ===

tot

A

SCSCη

Les 15 sujets (mémorisation avec utilisation ou non d’images mentales) :

79.3382702 ===

tot

A

SCSCη

Mesures des associations

,894 ,799VAR00001 * VAR00002Eta Eta carré