Download - Économétrie COURS 3-4 Les tests dhypothèses (II).

Transcript
Page 1: Économétrie COURS 3-4 Les tests dhypothèses (II).

Économétrie

COURS 3-4Les tests d’hypothèses (II)

Page 2: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de petite taille

La forme de la distribution d’échantillonnage de la moyenne dépend de la forme de la population générale à partir de laquelle l’échantillon a été extrait.

La distribution d’échantillonnage de sera normale (ou approximatif normale) dans le cas d’échantillons de petite taille seulement si la collectivité générale est normalement distribue.

La variance de l’échantillon ( ) est susceptible de ne pas fournir une bonne approximation de (dans le cas d’échantillons de petite taille).

Au lieu de la statistique z, qui exige la connaissance (ou une bonne approximation) de , nous utilisons la statistique:

ou:

2

xs2x

x

x

x

ns

x

s

xt

x

0

x

0

1n

xxs

2

i2

x

Page 3: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de petite taille Les hypothèses sont:

pour le test bilatéral:H0: μ = μ0,

H1: μ ≠ μ0 (μ < μ0 ou μ > μ0). pour le test unilatéral à droite

H0: μ = μ0,

H1: μ > μ0. pour le test unilatéral à gauche

H0: μ = μ0,

H1: μ < μ0. Le test statistique utilisé est:

ns

x

s

xt

x

0

x

0

Page 4: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de petite taille

L’hypothèse particulière qui doit d'être faite est que la population générale est normalement ou approximatif normalement distribué.

La region critique est donnée par: t > t α/2,n-1 ou t < - t α/2,n-1;

t > t α,n-1;

t < - t α,n-1.

Page 5: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la moyenne de la population générale (μ) pour échantillons de petite taille

Exemple:La direction d’une société a appelé au 5 experts pour prévoir le profit de la société pour l’année curent. Les valeurs estimées sont: 2,60; 3,32; 1,80; 3,43; 2,00 (milliards lei, prix de l’année dernière).En sachant que le profit de la société pendant l’année dernière a été 2,01 mld. lei, est-ce qu’il y a des preuves suffisants pour conclure que la moyenne des prévisions des experts est significatif plus grande que la chiffre de l’année dernière (pour α = 0,05)?La moyenne des prévisions des experts est mld. lei, la variance:

et l’écart-type: mld. lei.

Les éléments du processus de test d'hypothèse statistique sont les suivantes H0: μ = 2,01,H1: μ > 2,01 (test unilatéral à droite).

Parce que tα,n-1 = t0,05;4 = 2,132, la région critique est donnée par t>tα,n-1. Comme t=1,874< t0,05;4=2,132, nous ne pouvons pas conclure que la moyenne de profit estimée par les 5 experts pour l’année curent est significatif plus grande que le profit de l’année dernière, qui a été égale à 2,01 mld. lei.

63,2x

5507,0

4

203,2

1n

xxs

2

i2

x

74,0ss 2

xx

874,15/74,0

01,263,200

ns

x

s

xt

xx

Page 6: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la proportion de la population pour échantillons de grande taille

Pour les variables alternatives, la moyenne de l’échantillon est notée à f (la proportion des réussites), la variance a été calcule comme f (1-f) et l’écart-type comme

La proportion de l’échantillon (f) est approximatif normal distribuée, ayant la moyenne p et l’écart-type, pour un n grand ( et ):

et

Pour vérifier les hypothèses statistiques concernant la proportion il est nécessaire de travailler avec des grands échantillons (n>100).

Comme la proportion f est approximatif normalement distribue, il résulte que la variable standardisée est approximatif normalement standard distribue.

.)1( ff

npp /)1( 5np 5)1( pn

pf n

ff

n

pps f

)1()1(

nff

pfz

/)1(

Page 7: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la proportion de la population pour échantillons de grande taille

L’hypothèse nulle indique le fait que la proportion p est égale à une valeur spécifie:

Alors que l’hypothèse alternative réponds à une de ces trois questions:

si la proportion est différente de la valeur spécifiée (test bilatéral):

; si la proportion est plus grande (supérieure) que la valeur

spécifiée (test unilatéral à droite): ; si la proportion est plus petite (inferieure) que la valeur

spécifiée (test unilatéral à gauche):

.: 00 ppH

01 : ppH

01 : ppH

.: 01 ppH

Page 8: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la proportion de la population pour échantillons de grande taille Le test statistique pour la proportion p est:

La région critique (Rc) est donnée par:

ou pour le test bilatéral; pour le test unilatéral à droite; pour le test unilatéral à gauche.

nff

pf

npp

pfz

/)1(/100

2/zz 2/zz

zz

zz

Page 9: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la proportion de la population pour échantillons de grande taille

Example:Le manager d’une chaine de magasins considère que, après une analyse financière réalisée pour un nouveau produit, la commercialisation est profitable, et que le pourcentage des acheteurs qui désirent acheter le produit est plus grand que 12%. Il sélectionne 400 acheteurs potentiels et constate que 48 d’entre eux achèteront le produit. Pour une probabilité de 99%, est-ce qu’il y a de preuves suffisantes pour convaincre le manager de commercialiser le produit?Les hypothèses sont:

test unilatéral à droite. Le test statistique est:

Comme et , il résulte que nous ne sommes pas dans la région critique (Rc) et que nous n’avons pas de preuves suffisantes pour rejeter l’hypothèse nulle, donc le pourcentage n’est pas plus grande que 12%.

12,0p:H 0 12,0p:H1

15,1017,0

02,0

400/86,014,0

12,014,0

/)1(

12,0

/)1(0

nff

f

nff

pfz

33,2zz 01.0 zz

14,0400

48

n

mf

Page 10: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille

On fait les hypothèses: les deux collectivités générales d’où ont été extraites les

échantillons sont normalement ou approximatif normalement distribues;

les échantillons aléatoires sont sélectionnés indépendant un d’autre.

Dans les conditions dans lesquelles on suppose que les deux collectivités générales ont des variances égales ( = = ), un estimateur de la variance (variabilité) totale à partir de deux populations combinées est:

ou

2

1x 2

2x 2

x

221

1

2

2

1

2

1

2

21

nn

xxxxs

n

ii

n

ii

c

2nn

s1ns1n

1n1n

s1ns1ns

21

2

2x2

2

1x1

21

2

2x2

2

1x12

c

Page 11: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille

Si les variances ne sont pas égales (σ2x1 ≠ σ2

x2), puis le test statistique a la forme:

avec les degrés de liberté:

2

22

1

21

21

n

s

n

s

D)xx(t

1n

)/n(s

1n

)/n(s

/ns/ns

2

2

2

2

2

1

2

1

2

1

2

2

2

21

2

1

Page 12: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille

Les hypothèses statistiques seront, dans ces conditions:

pour le test bilatéralH0: μ1 = μ2 (μ1- μ2 = D);

H1: μ1 ≠ μ2 (μ1- μ2 ≠ D). pour le test unilatéral à droite

H0: μ1 = μ2 (μ1- μ2 = D);

H1: μ1 > μ2 (μ1- μ2 > D). pour le test unilatéral à gauche

H0: μ1 = μ2 (μ1- μ2 = D);

H1: μ1 < μ2 (μ1- μ2 < D).

Page 13: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille

Le test statistique t aura la forme:

La région critique est donnée par:

pour le test bilatéral: ou ;

pour le test unilatéral à droite: ;

pour le test unilatéral à gauche: .

21

2121

2

2

2x1

2

1x

2

21

2

c

2

nn

2nnnn

1ns1ns

Dxx

n

1

n

1s

Dxxt 11

2,2/ 21 nntt 2,2/ 21 nntt

2, 21 nntt

2, 21 nntt

Page 14: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille

ExempleSupposons que nous voulons tester l'hypothèse selon laquelle entre deux marques de voitures il n’y a pas de différences significatives concernant les coûts d'exploitation. Pour cette raison, 20 propriétaires de voiture (8 propriétaires de la première marque et 12 propriétaires de la seconde marque) sont priés de garder avec précision l’évidence des coûts d'exploitation pendant une période d'un année. Pour α=0,1 (la probabilité qui garanti les résultats (1-α)100 = 90%) testez cette hypothèse, si les résultats du traitement des échantillons sont les suivants: Marque 1 Marque 2

n1=8 n2=12 mil. lei mil. lei sx1=0,485 mil. lei sx2=0,635 mil. Lei

Les hypothèses statistiques sont:H0: μ1 = μ2 (μ1- μ2 = 0),

H1: μ1 ≠ μ2 (μ1- μ2 ≠ 0) [μ1> μ2 ou μ1< μ2].

696,51 x 273,52 x

3379,0

2128

635,0112485,018s

222c

Page 15: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la différence entre deux moyennes pour échantillons de petite taille

Le test statistique est:

Comme tα/2,n1+n2-2 = t0,05;18 = 1,734, on observe que t <

tα/2,n1+n2-2, donc nous ne sommes pas dans la région critique.

Il résulte, donc, qu’il n’y a pas des preuves suffisantes pour conclure qu'ils existent des différences significatives entre les coûts d’exploitation de ces deux marques de voitures.

5943,1

2653,0

423,0

12

1

8

13379,0

0273,5696,5t

Page 16: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la variance d’une population

La somme des carrés des différences (qui est, en fait, égale à ou pour échantillons de petite taille), divisée à la variance de la collectivité générale, suit une distribution chi deux ( ) (si la population échantillonnée est normalement distribuée).

Donc, les test statistique utilisé pour vérifier l’hypothèse concernant la variance est:

qui suit une distribution avec (n-1) degrés de liberté, quand population échantillonnée est normalement distribuée, avec la variance .

2)( xxi2sn 2)1( sn

2

2

22 )1(

sn

2

2

2

Page 17: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la variance d’une population

La valeur de pour laquelle l’aire située sous la courbe (située à sa droite) este égale à α, est notée avec . Nous ne pouvons pas utiliser la notation pour représenter le point pour lequel l’aire située dans la part gauche est α, parce que la statistique est toujours supérieure à zéro. Mais représente le point pour lequel l’aire sous la courbe situe à son gauche est α.

Par exemple:

22

2

2

2

.3,33χ

et16,92χ2

2

0,95;9

0,05;9

Page 18: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la variance d’une population

L’hypothèse nulle est:

avec les hypotheses alternatives: pour le test bilatéral ; pour le test unilatéral à droite ; pour le test unilatéral à gauche .La région critique est donnée par:

ou pour le test bilatéral; pour le test unilatéral à droite; pour le test unilatéral à gauche.

2

0

2

0 : H

2

0

2

0 : H2

0

2

0 : H2

0

2

0 : H

2

1,2/1

2

n 2

1,2/

2

n2

1,

2

n2

1,1

2

n

Page 19: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur la variance d’une population

Exemple: Pour les données suivantes concernant la demande d’un produit (choisies parmi une collectivité normalement distribuée), testez (pour une probabilité de 95%), les hypothèses:

Les données sont: 85, 59, 66, 81, 35, 57, 55, 63, 63, 66.Dans l’échantillon: , .

Le test statistique est:

Comme

et nous rejetons l'hypothèse nulle et nous acceptons l'hypothèse alternative

100: 2

0 H

100: 2

1 H

85,13s 8,1912 s

8,1919

1726

1

)( 2

2

n

xxs i

26,17100

1726)1(2

22

sn

92,162

9,05.0

2

1, n

2

1,

2

n

.1002

Page 20: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur le rapport des deux variances

Le paramètre qui nous intéresse est Si la variance de l’échantillon est (comme nous avons

vu) un estimateur non biaisé et consistent de la variance de la collectivité générale, à noter que le rapport est un estimateur ponctuel du rapport des variances .

La distribution d’échantillonnage du rapport est une distribution F, si les échantillons ont étaient extraites indépendant parmi des populations normalement distribuées.

La valeur de la statistique F pour la quelle l’aire située sous la courbe (située à sa droite) est α, est notée avec Fα (avec les degrés de liberté dl1 et dl2).

./ 22

21

2

2

2

1 s/s2

2

2

1 /2

2

2

1 s/s

Page 21: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur le rapport des deux variances

Les rapport entre deux variables Chi-deux indépendantes, divisées aux ses degrés de liberté suit une distribution F. Les degrés de liberté de la distribution F sont identiques aux degrés de liberté de ceux deux distributions Chi-deux.

Puis:

à et degrés de liberté. Dans ce qui suit, l'hypothèse nulle est toujours

désigné comme l'égalité entre les deux variances, c’est-à-dire sous la forme de l’égalité du rapport des variances à l'unité:

2

2

2

2

2

1

2

1

2

2

2

2

22

1

2

1

2

11

/

/

)1(

/)1(:

)1(

/)1(

s

s

n

sn

n

snF

)1( 1n )1( 2 n

.1/: 22

210 H

Page 22: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur le rapport des deux variances

Le test statistique est ,mais, dans les conditions de l’hypothèse nulle, c’est à dire , le test statistique devienne: ,qui suit une distribution F à et degrés de liberté.

La région critique est donnée par: ou pour le test bilatéral, pour le test unilatéral à droite,

pour le test unilatéral à gauche .

En général – si au numérateur on utilise la plus grande variance- le test F est un test unilatéral à droite.

2

2

2

2

2

1

2

1

/

/

s

sF

1/ 2

2

2

1

2

2

2

1

s

sF )1( 1n )1( 2 n

1,1,2/ 21 nnFF 1,1,2/1 21

nnFF

1,1, 21 nnFF

1,1,1 21

nnFF

Page 23: Économétrie COURS 3-4 Les tests dhypothèses (II).

Test d’hypothèse sur le rapport des deux variances

Example:Un analyste veut comparer la dispersion des revenus par famille pour la collectivité des voyageurs qui préfèrent le tourisme littoral avec la dispersion des revenus pour les voyageurs qui préfèrent le tourisme balnéaire. En supposant que les distributions des revenus (millions lei) dans les deux collectivités sont approximatif normales, deux échantillons ont été sélectionnés, ayant le volume égale à 60 et, respectivement à 50 personnes, et les écarts-type (millions lei) sont: s1 = 2,84 et s2 = 1,86. On utilise une probabilité qui garanti les résultats égale à 95%.Les hypothèses statistiques sont:

Le test statistique a la valeur:

La région critique (pour ) est donnée par: Comme , l’hypothèse nulle est rejetée (c’est à dire le rapport entre les variances est nul) et l’hypothèse alternative est acceptée. Ça signifie que on accepte ’hypothèse en conformité avec laquelle la dispersion des revenus pour les voyageurs de la région littorale est significative plus grande que celle des voyageurs de la région balnéaire.

1/: 2

2

2

10 H

1/: 2

2

2

11 H

3314,24596,3

0686,8

86,1

84,22

2

2

2

2

1 s

sF

05,0 64,149;59;05.0 FF49;59;05.0FF