exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions...

22
1 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 500 1 2 3 SP t t t t r r D α β β ε =+ + + pour 1,..., t T = sur des données annuelles avec les variables suivantes : t r : Le rendement du titre de Abble au temps t & 500 SP t r : Le rendement de l’indice Standard&Poor500 au temps t Et la variable dichotomique 1 si l'économie esten expansion au temps : 0 si l'économie est en récession au temps t t D t = Nous avons les matrices de données suivantes basées sur n = 4 observations: 1 6 0 1 4 1 1 2 0 1 6 1 X = 2 1 3 3 2 6 β β β α = = 0 1 0 1 ε = La matrice X a comme vecteurs dans l’ordre: un vecteur de constante (de 1), le rendement du marché & 500 SP t r et une variable dichotomique t D pour tenir compte du statut de l’économie (1 pour une expansion et 0 pour une récession). a) Calculez les valeurs des paramètres estimés ( 1 ˆ α , 2 ˆ β et 3 ˆ β ) à partir de l’estimateur OLS pour le modèle ci-haut. b) Donnez en détails la matrice de variance-covariance estimée de l’estimateur ˆ β et donnez sa version numérique. c) Calculez ˆ y et représentez le graphiquement, et puis comparez-le au vecteur y de données. d) Calculez les USS (la somme des carrés des résidus), les XSS (la somme des carrés expliqués), les TSS (la somme des carrés totaux), le 2 R et le 2 R ajusté associées à la régression du modèle. Interprétez les deux 2 R . Qu’en pensez-vous? Expliquez bien la différence entre les deux 2 R . e) À partir de votre estimateur OLS, testez les hypothèses suivantes et concluez sur les résultats des tests adéquats effectués à un niveau de signification de 5% (ici on ne sait pas si des aléas sont normaux a priori): e0) 0 : 0 k H β = contre l’alternative 1 : 0 k H β Effectuez ces tests pour toutes les variables du modèle et interprétez bien les résultats. Quelles sont les problèmes associés à ces divers tests statistiques dans les divers cas? e1) 1 0 : 0 H α contre l’alternative 1 1 : 0 H α < Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas? e2) 0 2 : 1 H β = contre l’alternative 2 1 : 1 H β Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas? e3) Effectuez le test joint ANOVA de signification de la régression effectué à un niveau de signification de 5%. Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas? f) Calculez 1 ˆ ' x ε , 2 ˆ ' x ε et 3 ˆ ' x ε , et interprétez les résultats. Estimez aussi les ˆ k β en deux blocs avec ˆ α et 2 3 ˆ ˆ ' β β en utilisant les formules de FWL.

Transcript of exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions...

Page 1: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

1

Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0

Q2- Nous avons le modèle suivant : & 5001 2 3

S Pt tt tr r Dα β β ε= + + + pour 1,...,t T= sur des données annuelles

avec les variables suivantes :

tr : Le rendement du titre de Abble au temps t

& 500S Ptr : Le rendement de l’indice Standard&Poor500 au temps t

Et la variable dichotomique

1 si l'économie est en expansion au temps:

0 si l'économie est en récession au tempst

tD

t

=

Nous avons les matrices de données suivantes basées sur n = 4 observations:

1 6 0

1 4 1

1 2 0

1 6 1

X

=

2

1

3

3

2

β β

α

= =

0

1

0

1

ε

=

La matrice X a comme vecteurs dans l’ordre: un vecteur de constante (de 1), le rendement du marché & 500S Ptr

et une

variable dichotomique tD pour tenir compte du statut de l’économie (1 pour une expansion et 0 pour une récession).

a) Calculez les valeurs des paramètres estimés ( 1α , 2β et 3β ) à partir de l’estimateur OLS pour le modèle ci-haut.

b) Donnez en détails la matrice de variance-covariance estimée de l’estimateur β et donnez sa version numérique.

c) Calculez y et représentez le graphiquement, et puis comparez-le au vecteur y de données.

d) Calculez les USS (la somme des carrés des résidus), les XSS (la somme des carrés expliqués), les TSS (la somme des

carrés totaux), le 2R et le 2R ajusté associées à la régression du modèle. Interprétez les deux 2R . Qu’en pensez-vous?

Expliquez bien la différence entre les deux 2R . e) À partir de votre estimateur OLS, testez les hypothèses suivantes et concluez sur les résultats des tests adéquats effectués à un niveau de signification de 5% (ici on ne sait pas si des aléas sont normaux a priori):

e0) 0 : 0kH β = contre l’alternative 1 : 0kH β ≠

Effectuez ces tests pour toutes les variables du modèle et interprétez bien les résultats. Quelles sont les problèmes associés à ces divers tests statistiques dans les divers cas?

e1) 10 : 0H α ≥ contre l’alternative 1 1: 0H α <

Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas?

e2) 0 2: 1H β = contre l’alternative 21 : 1H β ≠

Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas? e3) Effectuez le test joint ANOVA de signification de la régression effectué à un niveau de signification de 5%. Interprétez bien les résultats. Quelles sont les problèmes associés à ce test statistique dans ce cas?

f) Calculez 1 ˆ'x ε , 2 ˆ'x ε et 3 ˆ'x ε , et interprétez les résultats. Estimez aussi les ˆkβ en deux blocs avec α et 2 3ˆ ˆ 'β β en

utilisant les formules de FWL.

Page 2: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

2

g) Estimez le modèle SIM (Single Index Model) suivant : & 5001 2

S Pt ttr rα β ε= + + par OLS et comparez les résultats et

l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients.

(Régression avec une variable omise : tD )

h) Estimez le modèle suivant : & 500 & 5001 2 3 4( )S P S P

t t t t t tr r D D rα β β β ε= + + + ⋅ + par OLS et comparez les

résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients.

(Régression avec variable superflue d’effet croisé : & 500S Pt tD r⋅ reflétant un changement structurel au niveau de l’effet

du rendement du marché sur le rendement du titre.)

i) Estimez le modèle suivant (où on a enlevé la constante): & 5002 3

S Pt t t tr r Dβ β ε= + + par OLS et comparez les

résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients. Expliquez ce qui se produit pour le vecteur de résidus et pour les paramètres.

j) Illustration de l’effet de la multicolinéarité. Estimez le modèle suivant : & 5031

02 3

S Pt t ttr r xβ εα β= + ++

où 2

3 2t t txx x υγ γ υ= + avec un choc tel que . . . (0,1)tv i i d N∼ en faisant varier υγ de 0,10 à 100. On comprend que la

variable que l’on construit pour chaque régression, 3tx , est très fortement corrélée avec 2tx lorsque υγ est faible, et

lorsque υγ augmente le bruit ajouté à 2tx pour construire 3tx augmente, ce qui fait que la corrélation entre les deux

variables diminue. Par ailleurs, ici on fixe 2

1xγ = .

Comparez les résultats des paramètres et des variances des paramètres. Illustrez le tout graphiquement et interprétez le

tout. Expliquez bien ce qui se produit. Donnez les valeurs pour les premiers paramètres estimés et la somme 2 3ˆ ˆβ β+ ,

notez ce qui se produit.

k) Estimez le modèle CAPM empirique suivant : & 5001 2( ) ( )F S F

t t t tP

tr r r rα β ε− = + − + par OLS et comparez les

résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients. Le vecteur de taux sans

risque est donné par:

2

2

0

2

Fr

=

L) Estimez le modèle SIM suivant : & 5001 2

S Pt ttr rα β ε= + + en prenant les variables en déviations par rapport à la

moyenne par OLS pour obtenir les estimés et comparer les résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients.

m) Estimez le modèle original suivant : & 5001 2 3

S Pt tt tr r Dα β β ε= + + + par l’estimateur GLS suivant :

1 1 1 1ˆ ( ' ) ' ( ' ) 'GLS X X X y X X X yβ − − − −= Σ Σ = Ω Ω avec l’aide de la matrice 2

4 0 0 0

0 9 0 0

0 0 4 0

0 0 0 9

σ

Σ = Ω =

. Comparez

les résultats et l’ajustement avec le modèle précédent. Interprétez les résultats et les coefficients.

Page 3: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

3

n) Expérience de Monte Carlo sur les rejets d’un test de signification d’un régresseur. Ajoutez une variable aléatoire comme régresseur et compter le nombre de fois sur 1000 simulations de cette variable où

l’on ne rejette pas la nulle : 0 : 0randomH β = dans la régression suivante :

& 5001 2

S P randomt t t ran tdomr r xα β β ε= + + + avec (5,1)random

tx N∼ .

o) Estimez le modèle SIM suivant : 1 2M

t t tr rα β ε= + + avec une nouvelle variable comme proxy du rendement du

marché donnée par 2

& 500 & 500 & 500( )M S P S P S Pt t t txr r r rθ= − + , ainsi on estime le même modèle mais avec une variable

telle que 2

& 500var( ) var( )M S Pt txr rθ= . Ainsi en augmentant la variance (écart-type) de la variable avec un

paramètre2xθ on obtient des estimateurs différents.

Utilisez les paramètres 2xθ égaux à 0.5, 0.5 , 2 , 2 et 4 pour calculer les estimés.

Interprétez les résultats et les coefficients.

p) Estimez le modèle original suivant : & 5001 2 3

S Pt tt tr r Dα β β ε= + + + en ajoutant une observation telle que :

(5) ' 1 4 1x = et montrez la différence des estimés. Calculez aussi le tout avec la formule de mise-à-jour des

paramètres.

1 1( 1) 1 ( 1)

1( 1) ( 1)

1ˆ ˆ ˆ( ' ) ( ' )1 '( ' )

n n n n n

n n nn n

n n

X X x y xx X X x

β β β + −

+ + + − + +

= + − +

q) Premièrement générez un nouveau régresseur & 02

50Sendot

Pt trx εγ ε= + avec εγ qui est égal à diverses valeurs

de 0.5, 1, 2εγ = . Ainsi le régresseur stochastique est corrélé avec le choc, ce qui fait que l’assomption d’exogénéité

stricte1 ne tient plus.

Générez aussi un autre régressant qtr

avec ce régresseur qui est corrélé avec le terme d’aléa tel que :

1 2 3q endo

t tt tr x Dα β β ε= + + +

Estimez ce nouveau modèle par OLS et expliquez ce qui se produit comme problématique. Montrez la différence entre les estimés.

r) Générez un nouveau régresseur & 02

50S Perrort t error tx r γ η= + avec errorγ qui est égal à diverses valeurs

de 0.5, 1, 2εγ = et (0,1)t Nη ∼ . Ainsi le régresseur contient une erreur de mesure ajoutée via le tη .

Estimez le modèle 1 2 3errort tt tr x Dα β β ε= + + + par OLS et expliquez ce qui se produit comme problématique.

Montrez la différence entre les estimés. zzz) Posez-vous d’autres questions et tentez d’y répondre en prenant des extensions de cette question pour vous donner de l’intuition sur les problématiques de régression en validant le tout sur papier avec des matrices de tailles raisonnables et/ou sur Matlab. C’est la meilleure manière de comprendre comment se comporte l’estimateur OLS et ses particularités…

1 Exogénéité stricte: ( ) 0E Xε =∣

Page 4: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

4

Pistes de solutions numériques (attention aux coquilles) a) Créons le vecteur y des données du régressand.

1 6 0 0 15 0 153

1 4 1 1 17 1 162

1 2 0 0 7 0 76

1 6 1 1 21 1 22

y Xβ ε

− − + = + =

=

= +

Ici on a utilisé ε pour générer y , mais on va travailler pas la suite comme si on ne connaissait pas β et ε , en ayant

seulement accès aux données comme on le fait dans la pratique.

1 6 01 1 1 1 4 18 2

1 4 16 4 2 6 18 92 10

1 2 00 1 0 1 2 10 2

1 6

'

1

X X

=

=

151 1 1 1 60

16' 6 4 2 6 300

70 1 0 1 38

22

X y

= =

( ) 1

21 2 1

10 5 102 1 1

5 10 101 1 11

10 10 1

'

0

X X−

− − − − =

− −

1

3 2 13 2

10 5 10 51 1 1 1

5 10 5 107 3 3 2

10 5 1

( ' )

0 5

'X X X−

− − − − − −

=

L’estimateur OLS est donné par:

1

1

1 6 0 151 1 1 1 1 1 1 1

1 4 1 166 4 2 6 6 4 2 6

1 2 0 70 1 0 1 0 1 0 1

1 6 1 22

4 18 2

18 92 10

2 10 2

ˆ ( ' ) 'X X X yβ

= =

=

121 2 1 11

10 5 10 560 60 2,22 1 1 11

300 300 25 10 10 5

38 381 1 11 29

10 10 10 5

− − − = − − = = − −

,2

5, 8

Page 5: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

5

Voici les détails de l’inversion de 'X X et du calcul du déterminant det( ' )X X

Rappel: La formule du déterminant par l’expansion de Laplace pour une ligne i ou une colonne j quelconque :

( )

1

det( ) ( 1)n

i jn n ij ij

j

A a m+

×=

= −∑

ijm est le Mineur d’ordre i et j qui correspond au déterminant du bloc restant (que l’on nommera ijM ) de la matrice

A si on enlève la ligne i et la colonne j .

( ) ( )cof(A) ( 1) ( 1) det( )i j i jij ij ijm M

+ += − = − correspond au cofacteur d’ordre i et j .

( ) ( )adj(A) ( 1) ( 1) det( )ji

i jij i j

ij m M+ += − = − correspond à l’élément d’ordre i et j de la matrice adjointe adj(A) ,

notez l’ordre ji du mineur qui est inversé en rouge.

Ex. avec une 2x2

det( ) | |a b

cA A ad bc

d= = = −

Ex. avec une 3x3

det( ) | |

a b c

A A d e f a e f b d f c d e

g h i h i g i g h

e f d f d ea b c aei bfg cdh ceg bdi afhh i g i g h

= = − +

= − + = + + − −

=

Par la règle de Sarrus pour une 3x3 (ne s’applique pas pour les matrices plus grandes)

11 12 13

21 22 23 11 22 33 12 23 31 13 21 32 31 22 13 32 23 11 33 21 12

31 32 33

det( ) .

a a a

A a a a a a a a a a a a a a a a a a a a a a

a a a

= = + + − − −

Page 6: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

6

Pour la question 2a) 3 3

( ) ( )

1 13

(1 ) (1 1) (1 2) (1 3)1 1 11 11 12 12 13 13

13

(1 ) (1 1) (1 2)1 1 11 11 1

1

det( ' ) det( ) ( 1) det( ) ( 1)

( 1) det( ) ( 1) det( ) ( 1) det( ) ( 1) det( )

( 1) ( 1) ( 1)

i j i jij ij ij ij

j j

jj j

j

jj j

j

X X A a M a m

a M a M a M a M

a m a m a

+ +

= =

+ + + +

=

+ + +

=

= = − = −

= − = − + − + −

= − = − + −

∑ ∑

∑ (1 3)2 12 13 13

(1 1) (1 2) (1 3)11 12 13

(1 1) (1 2) (1 3)

( 1)

92 10 18 10 18 92( 1) det ( 1) det ( 1) det

10 2 2 2 2 10

( 1) 4(92 2 10 10) ( 1) 18(18 2 10 2) ( 1) 2(18 10 92 2)

4 8

m a m

a a a

+

+ + +

+ + +

+ −

= − + − + − = − ⋅ − ⋅ + − ⋅ − ⋅ + − ⋅ − ⋅

= ⋅ 4 ( 1)18 16 2( 6)

336 288 2( 4) 40

+ − ⋅ + −

= − + − =

det( ' ) 40X X =

Rappel de la formule de l’inverse par la méthode de l’adjointe : ( ) ( )

1 1 1adj( ) (cof( ))'

det detA A A

A A

− = =

Pour la question 2a)

( ) ( ) ( )1 1 1

' adj( ' ) (cof( ' )) 'det ' det '

92 10 18 10 18 92

10 2 2 2 2 1084 16 4

18 2 4 2 4 181 116 4 4

10 2 2 2 2 1040 404 4 44

18 2 4 2 4 18

92 10 18 10 1

21 2

10

'

8 92

X X X X X XX X X X

− =

= =

− − − = − − − − = − −

1

5 102 1 1

5 10 101 1 11

10 10 10

− − − − −

Rappel de la règle de Cramer Solution d’un système d’équation 2x2

1 1 1 2

2 1 2 2

1 1 1

2 2 2

1 1

2 22 1

1

2

1

2

1 1

1 21

1 1 1 2 1 2 1 1 1 2 1 2

2 2 2

2 2 2

2

1 12

2 ,

c

c

c

c

a x b x

a x b x

a b x

a b x

b a

b ab b a ax

a b a b b a a b a b b

c c

c cc

a

a b a b

cx

c c

+ = + = =

− −= = = =

− −

Page 7: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

7

Solution d’un système d’équation 3x3

1 1 1 2 1 3

2 1 2 2 2 3

3 1 3 2 3 3

11 1 1

2 2 2 2

3 3 3 3

1 1 1 1

2 2 2 2

3 3 3 3

1 2

1 1 1

1

2

3

1

1 1

2 2

2

3

1 1

2 2

3 3

2

3 3 3

,

a x b x c x

a x b x c x

a x b x c x

xa b c

a b c x

a b c x

b c a c

b c a c

b c a cx x

a b c a b

a b c

d

d

d

d

d

d

d d

d d

d d

a b c

+ + = + + = + + = =

= =

1 1

2 2

3 3

3

1 1 1 1

2 2 2 2 2 2

3 3 3

2

3

3

3 3

1

, .

a b

a b

a bx

c a b c

a b c a b c

a b c a

d

b

d

c

d

=

77

51 6 0 15,4842,2

1 4 1 16,852,2

1 2 0 335,8

51 6 1 21,2106

5

ˆˆ6,6

y Xβ

= =

= =

2

515 15.4 0.44

16 16.8 0.85ˆ

7 2 0.4

522 21.2 0.84

ˆ6.6

5

y yε

− − − − = − − = =

=

( )

0.4

0.8ˆ ˆ' 0.4 0.8 0.4 0.8 1.6

0.4

0.8

USS ε ε

− − = = − − =

2 1

84 16 4

25 25 2516 4 4

var25 25 254 4 44

25 25 25

3.36 0.64 0.16ˆ ˆ( ) ( ' ) 0.64 0.16 0.16

0.16 0.16 1.76

X Xβ σ −

− − − − − = − − − − −

= = avec 2 ˆ ˆ' 1.6ˆ 1.6

4 3n K

ε εσ = = =

− −

Page 8: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

8

2

1

( ) 114n

ii

TSS y y=

= − =∑

2[2] [2] [2] [2]

1

ˆ ˆ( ) ' '

114 1.6 112.4

ˆn

iiXSS X M X

TSS

y

USS

y ιβ β=

= =

= − = − =

−∑

2 ˆ ˆ' 112.41 1 0.98596

114'

USS XSSR

TSS TSSy M yι

ε ε= − = − = = =

2 ˆ ˆ' / ( ) 1.6 / (4 3)1 1 0.95789

114 / (4 1)' / ( 1)

n KR

y M y nι

ε ε − −= − = − =

−−

Tests Si on veut effectuez des tests il faut déterminer la distribution que l’on va utiliser sous la nulle. Si l’on a pas la normalité des chocs, alors on aura 3 alternatives: 1- Dériver la distribution exacte des tests à échantillon fini (si on connait la vraie distribution des chocs ex. si la distribution des chocs est une distribution de Pareto exponentielle); c’est souvent possible de dériver la distribution exacte, mais relativement complexe. 2- Reconstruire une distribution empirique à partir des données via une simulation de Monte Carlo effectuée avec le modèle sous la nulle en estimant le modèle sous l’alternative et en reconstruisant la distribution empirique EDF (empirical distribution function) de la statistique de test (pour faire cela la statistique de test doit être pivotale). C’est l’approche Bootstrap qui requiert de faire des simulations numériques. 3- Utiliser les distributions asymptotiques des statistiques de test comme approximation de la bonne distribution, ici il faut noter que si l’on a peu de données l’approximation asymptotique risque d’être moins applicable et plus loin de la vraie distribution d’échantillon fini dans le cas particulier en question. Dans la pratique avec des données on a généralement pas de certitude concernant la normalité, alors on effectuera des tests de ‘’normalité’’ afin d’inférer quant à savoir si les aléas sont issus d’une distribution normale ou s’ils sont issus d’une distribution non-normale. Malheureusement nous n’avons pas les vrais chocs en général, alors nous utiliserons les résidus pour construire les tests de ‘’normalité’’. Le test de ‘’normalité’’ Jarque-Bera Le test de Jarque-Bera est en fait un test de l’asymétrie et de l’aplatissement d’une distribution en comparaison avec la nulle des valeurs (du skewness et du kurtosis) qui correspondent aux valeurs espérées d’une variable aléatoire tirée d’une loi normale. J’utilise l’expression ‘’normalité’’ entre guillemets car le test de Jarque-Bera n’est pas un test de normalité proprement dit, mais plutôt un test des moments 3 (skewness) et 4 (kurtosis) qui sont comme ceux de la loi normale sous la

nulle. C’est un test qui suit une distribution 2(2)χ asymptotiquement.

0 22 2 2

2 2 23 4 3 4

3 4 2 3 2 2

ˆ ˆ ˆ ˆ1 1 1ˆ ˆ = 3 = 3 (2)6 4 6 4 6 4ˆ ˆ ˆ ˆ( ) ( )

H

an n n

JB S Kµ µ µ µ

χσ σ σ σ

= + + − + − ∼

Comme dans notre exercice on a pas de certitude concernant la normalité ou non, puisque nous disposons que des données sans connaître la distribution exacte des chocs (qui fait partie du DGP), on va tenter d’inférer avec les résidus sur la nulle de normalité, le tout afin de nous enligner sur les distributions des statistiques de test à utiliser pour les tests sur les paramètres que l’on veut conduire subséquemment. Bref les tests de normalité vont nous éclairer sur les distributions des autres tests statistiques à utiliser.

Page 9: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

9

Règle de décision du test de Jarque-Bera

-Si la statistique calculée JB est plus petite que la valeur critique 2( 2) 0.05 5.99J αχ = = = ou égale, telle

que 2(2) 0.05 5.99JB αχ =≤ = alors on ne rejette pas la nulle 0H de ‘’normalité’’ .

-Si la statistique calculé JB est plus grande que la valeur critique 2( 2) 0.05 5.99J αχ = = = , telle

que 2(2) 0.05 5.99JB αχ => = alors on rejette la nulle 0H de ‘’normalité’’ en faveur de l’alternative 1H d’une

distribution autre que normale. Décision

Pour ce test unilatéral à droite, comme la statistique calculée 2(2) 0.050.4482667 5.99JB αχ == ≤ = , alors on ne rejette

pas la nulle 0H à un niveau nominal de signification de 0.05α = . Utilisant la P-value on trouve une valeur de

0.7992 0.05Pvalue = > , ce qui mène évidemment à la même décision de non-rejet de la nulle. Ainsi le test JB de ‘’normalité’’ de Jarque-Bera donne une statistique de test JB qui indique un non-rejet de la ‘’normalité’’ des chocs, par contre on a très peu de données pour conclure sur les résultats du test, ce qui ajoute un doute face à la représentativité des résultats. Si on avait plus de données on aurait théoriquement sous la nulle plus de ‘’chance’’ d’être près d’une distribution

asymptotique 2( 2)Jχ = .

Ici comme on a pas rejeté la nulle, nous travaillerons comme si la normalité est présente, même si on a aucune certitude à cet effet; la seule information dont on dispose est que l’on a pas rejeté la nulle du test de Jacque-Bera sur une base d’une

distribution asymptotique 2( 2)Jχ = .

Par ailleurs, on sait que si l’on a la normalité des chocs et que l’on doit utiliser l’estimateur 2σ puisque l’on ne connait pas

le vrai 2σ , alors les statistiques de tests de Student à utiliser

0ˆˆ( ) ( )

ˆvar( )

H

k kk

k

t t n Kβ β

β

β

−= −∼ suiveront une loi de

Student...

Prenons ici le résultat du test de Jarque-Bera avec un grain de sel, car le manque de données avec 4n = risque de donner des résultats peu fiables selon la représentativité de notre échantillon de 4 observations. Par ailleurs, le test de Jarque-Bera

est en lui-même un test qui suit une distribution 2(2)χ seulement de manière asymptotique (en échantillon fini on utilise la

loi asymptotique comme approximation, dans la pratique on pourrait utiliser l’approche bootstrap pour effectuer le test JB si on a accès à un ordinateur afin de simuler la distribution empirique EDF sous la nulle) et le seul résultat que l’on a obtenu ici en effectuant le test est un non-rejet de ‘’normalité’’. Ce non-rejet de la nulle de ‘’normalité’’ n’est pas une confirmation de la normalité, ce n’est pas non plus une évidence en faveur de la normalité, un non-rejet est un manque d’évidences qui seraient défavorables à la nulle de ‘’normalité’’. Dans les faits, le vecteur ε que j’ai créé pour cet exercice vient de mon réseaux neuronal personnel qui est plus complexe qu’une distribution normale, ainsi dans les fait on a pas la normalité, mais l’analyste de données n’a pas cette information à sa disposition a priori.

En somme, comme on doit estimer 2σ par 2 ˆ ˆ' 1.6ˆ 1.6

4 3n K

ε εσ = = =

− −, si on a vraiment la normalité des chocs on aura

des tests de Student avec une distribution de Student exacte en échantillon fini.

Page 10: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

10

Rappel sur la p-value:

La p-value (probabilité critique, valeur p, valeur de probabilité ou la signification asymptotique) est la probabilité, sous 0H ,

qu'une statistique de test soit au moins aussi éloignée de son espérance que la valeur observée. En d'autres termes, c'est la probabilité sous la nulle d'observer quelque chose d'au moins aussi surprenant que ce que l'on observe. Pour un test unilatéral à droite, la p-value correspond à la probabilité, pour un modèle statistique donné sous la nulle, que la statistique de test soit supérieur ou égale au résultat de la statistique de test calculée (observée).

Ainsi si une statistique de test X suit une fonction de distribution cumulée (fonction de répartition) ()F ⋅ telle que

()X F ⋅∼ , alors la pvalue pour un test à droite peut être définie comme ( ) ( )test à droitepvalue t P X t= ≥

Si on a la fonction de répartition (fonction de distribution cumulée) ( )XF t évaluée à t pour une variable aléatoire X

(statistique de test) suivante : ( ) ( )

t

X XF t f t dt

−∞

= ∫

Alors on peut définir les pvalues selon 3 cas :

-Test à droite : ( ) ( )ˆ( )

ˆ ˆ ˆ( ) ( ( )) ( ) 1 ( )

k

test à droite k k X X k

t

pvalue t P X t f t dt F t

β

β β β

+∞

= ≥ = ≈ −∫

-Test à gauche : ( ) ( )ˆ( )

ˆ ˆ ˆ( ) ( ( )) ( ) ( )kt

test à gauche k k X X kpvalue t P X t f t dt F t

β

β β β

−∞

= ≤ = =∫

-Test bilatéral avec une distribution symétrique :

( )ˆ ˆ( ) ( )

ˆ ˆ( ) ( )

ˆ ˆ ˆ( ) ( ( ) ) ( ( ) )

( ) ( ) 1 ( )

k k

k k

test àbilatéral symétrique k k k

t t

X X X

t t

pvalue t P X t P X t

f t dt f t dt f t dt

β β

β β

β β β

− +∞

−∞ −

= ≤ − + ≥

= + ≈ −∫ ∫ ∫

Comme règle de décision pour le test à droite : Si la pvalue (l’intégrale) donne une valeur plus grande que le niveau nominal de signification α (c’est que la statistique calculée est plus petite que la valeur critique pour un test à droite) et on ne rejette pas. Si la pvalue (l’intégrale) donne exactement le niveau nominal de signification α (c’est que la statistique calculée est exactement sur la valeur critique) et on ne rejette pas car on est conservateur. Si la pvalue (l’intégrale) donne une valeur plus petite que le niveau nominal de signification α , c’est que la statistique calculée est dans la zone de rejet et on rejette au niveau nominal de signification α . Ainsi on peut voir la p-value comme le niveau de signification maximal possible qui ferait que l’on ne rejette pas la nulle, et au delà de cette valeur on rejetterait. Ou alternativement on peut voir la p-value comme la valeur du niveau de signification maximal qu’il ne faut pas dépasser pour ne pas rejeter la nulle. Intuitivement pour un test unilatéral c'est l'intégrale de la fonction de distribution sous la nulle à partir de la valeur de la statistique calculée avec l’intégration faite dans le sens de la zone de rejet. Si la pvalue est plus petite que le niveau nominal de signification α , alors le résultat du test est déclaré « statistiquement significatif ». Dans le cas contraire, si la pvalue est supérieure ou égale au niveau nominal de signification α , on ne rejette pas l’hypothèse nulle et on ne peut rien conclure quant aux hypothèses formulées.

Page 11: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

11

e0)

i) Pour le test de signification de la constante avec le premier paramètre 1( )α β≡ , on teste la nulle 0 1: 0H β = vs

l’alternative 1 1: 0H β ≠

Ici on utilise une statistique de test de Student car on a dû estimer 2σ

1

1

1

ˆ 0 2.2 2.2ˆ( ) 1.20019841.833030ˆ 3.36var( )

β

β

−= = = = Pvalue = 0.442232364770613 0.05>

Règle de décisions Pour ce test bilatéral, la valeur critique dans la table de Student est

0.05 /2 0.025 /2 0.025 /2 0.025( ) ( ) (4 3) (1) 12.706t n K t n K t tα α α α= = = =− ≡ − = − = = (notation modifiée)

-Si la statistique calculée 1ˆ( )t β est à dans l’intervalle (incluant les bornes) suivant :

/2 0.025 1 /2 0.025ˆ(1) 12.706 ( ) (1) 12.706t t tα αβ= =− = − ≤ ≤ = , alors on ne rejette pas la nulle 0H ce qui donne le

modèle sans la constante & 5002 3

S Pt t t tr r Dβ β ε= + + .

-Si la statistique calculée 1ˆ( )t β est à l’extérieur de l’intervalle ci-haut (incluant les bornes), telle que

1 /2 0.025ˆ( ) (1) 12.706t tαβ =< − = − ou 1 /2 0.025

ˆ( ) (1) 12.706t tαβ => = , on rejette la nulle 0H en faveur de

l’alternative 1H ce qui donne le modèle & 5001 2 3

S Pt tt tr r Dα β β ε= + + + .

Décision

Pour ce test bilatéral 1ˆ12.706 ( ) 1.2001984 12.706t β− ≤ = ≤ , donc on ne rejette pas la nulle 0H à un niveau

nominal de signification de 0.05α = (inférant dans le sens où la variable 1tx , soit la constante, n’est pas significative).

Ainsi on ne rejette pas la nullité de ce paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de données, le test serait fort probablement plus

précis car la variance estimée de 1β aura normalement tendance à diminuer.

Ici le manque d’information nous a conduit à faire une erreur de type 2 (non-rejet de la nulle lorsque la nulle est fausse car

on sait que le vrai 1 3β = , car c’est à partir de ce paramètre que l’on a construit les ty ).

Par ailleurs, on garde généralement la constante dans un tel modèle afin de maintenir la moyenne empirique des résidus à zéro et pour laisser plus de flexibilité au modèle afin que les autres coefficients puissent mieux évaluer les pentes (les relations entre les autres variables explicatives et la variable dépendante). La question i) étudie le scénario d’estimation de la régression sans constante.

N.B. : Notez que si on utilisait la distribution limite asymptotique normale 1ˆ( ) (0,1)

a

t Nβ ∼ , avec les valeurs critiques

1.96− et 1.96 alors on aurait aussi pas rejeté la nulle car 1ˆ1.96 ( ) 1.2001984 1.96t β− ≤ = ≤ .

Par ailleurs, on sais qu’utiliser un résultat asymptotique avec seulement n =4 données a sa part d’incertitude quand à son applicabilité. Ici on avait pas rejeté la normalité des chocs et l’on a décidé de travailler comme si on avait la normalité ou comme si on ne s’éloigne pas trop de la normalité en approximant la loi d’échantillon fini des tests par la loi de Student.

Page 12: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

12

e0) ii) Pour le test de signification de la variable & 02

50St

Ptx r≡ dans la régression via le paramètre 2β , on teste la

nulle 0 2: 0H β = vs l’alternative 1 2: 0H β ≠ .

Encore une fois on utilise une statistique de test de Student car on a dû estimer 2σ

2

2

2

ˆ 0 2.2 2.2ˆ( ) 5.50.4ˆ 0.16var( )

β

β

−= = = = Pvalue = 0.1144982940974 0.05>

Règle de décisions Pour ce test bilatéral, la valeur critique dans la table de Student est

/2 0.025 /2 0.025 /2 0.025( ) (4 3) (1) 12.706t n K t tα α α= = =− = − = =

-Si la statistique calculée 2ˆ( )t β est à dans l’intervalle (incluant les bornes) suivant :

/2 0.025 2 /2 0.025ˆ(1) 12.706 ( ) (1) 12.706t t tα αβ= =− = − ≤ ≤ = , alors on ne rejette pas la nulle 0H ce qui donne

1 3t t tr Dα β ε= + + .

-Si la statistique calculée 2ˆ( )t β est à l’extérieur de l’intervalle ci-haut (incluant les bornes), telle que

2 /2 0.025ˆ( ) (1) 12.706t tαβ =< − = − ou 2 /2 0.025

ˆ( ) (1) 12.706t tαβ => = , on rejette la nulle 0H en faveur de

l’alternative 1H ce qui donne & 5001 2 3

S Pt tt tr r Dα β β ε= + + + .

Décision

Pour ce test bilatéral 2ˆ12.706 ( ) 5.5 12.706t β− ≤ = ≤ , donc on ne rejette pas la nulle 0H à un niveau nominal de

signification de 0.05α = (inférant dans le sens où la variable & 02

50St

Ptx r≡ n’est pas significative). Ainsi on ne rejette

pas la nullité de ce paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de données, le test serait fort probablement plus précis car

la variance estimée de 2β aura normalement tendance à diminuer. Ici le manque d’information nous a conduit à faire une

erreur de type 2 (non-rejet de la nulle lorsque la nulle est fausse car on sait que le vrai 2 2β = , car c’est à partir de ce

paramètre que l’on a construit les ty ).

Si on considère que l’on a pas de variables & 02

50St

Ptx r≡ dans le modèle, la seule chose qui est modélisée est l’intercepte

qui peut varié selon la phase du cycle économique. L’intercepte serait donc 1α en temps de récession et 1 3α β+ en

temps d’expansion.

Par ailleurs, on sait que le paramètre 2β correspond à la pente 2& 500

t

S Pt

Er

∂=

∂, soit l’effet d’une hausse de 1 en point de

% du rendement du marché de & 500S Ptr sur le rendement du titre en espérance tEr . C’est la ‘’vraie’’ pente de la ligne PFR

(population regression function) de tEr par rapport au rendement du marché de & 500S Ptr .

Par ailleurs, on sait que le paramètre estimé 2β correspond à la pente 2& 500

ˆ ˆt

S Pt

r

∂=

∂, soit l’effet d’une hausse de 1 en

point de % du rendement du marché de & 500S Ptr sur le rendement du titre tr prévu par le fit (de manière conditionnelle

aux divers ( )ix ) . C’est la pente estimée de la ligne de relation SRF (sample regression function) de tr par rapport au

rendement du marché de & 500S Ptr .

Page 13: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

13

N.B. : Notez que si on utilisait la distribution limite asymptotique normale 1ˆ( ) (0,1)

a

t Nβ ∼ , avec les valeurs critiques

1.96− et 1.96 alors on aurait rejeté la nulle, mais utiliser un résultat asymptotique avec seulement n =4 données a sa part d’incertitude quand à son applicabilité. Ici on avait pas rejeté la normalité des chocs et l’on a décidé de travailler comme si on avait la normalité ou comme si on ne s’éloigne pas trop de la normalité en approximant la loi d’échantillon fini des tests par la loi de Student.

e0) iii) Pour le test de signification de la variable dichotomique 3 ttx D≡ dans la régression via le paramètre 3β , on

teste la nulle 0 3: 0H β = vs l’alternative 1 3: 0H β ≠ . Ce test correspond à un test de changement structurel au

niveau de l’intercepte, c’est-à-dire que l’on a sous l’alternative la possibilité d’avoir un effet alpha financier qui diffère selon que l’on soit en expansion économique ou en récession. Afin de tester cette hypothèse on tente de ‘’récolter’’ de l’information (via le test) qui pourrait aller à l’encontre de la nulle qui dit que alpha financier est constant dans le temps.

Encore une fois on utilise une statistique de test de Student car on a dû estimer 2σ .

3

3

2

ˆ 0 5.8 5.8ˆ( ) 4.37191451.3266499ˆ 1.76var( )

β

β

−= = = = Pvalue = 0.143153167176287 0.05>

Règle de décisions Pour ce test bilatéral, la valeur critique dans la table de Student est

/2 0.025 /2 0.025 /2 0.025( ) (4 3) (1) 12.706t n K t tα α α= = =− = − = =

-Si la statistique calculée 3ˆ( )t β est à dans l’intervalle (incluant les bornes) suivant :

/2 0.025 3 /2 0.025ˆ(1) 12.706 ( ) (1) 12.706t t tα αβ= =− = − ≤ ≤ = , alors on ne rejette pas la nulle 0H ce qui donne le

modèle SIM classique & 5001 2

S Pt ttr rα β ε= + + où l’on a pas de changement structurel au niveau du alpha financier.

-Si la statistique calculée 3ˆ( )t β est à l’extérieur de l’intervalle ci-haut (incluant les bornes), telle que

3 /2 0.025ˆ( ) (1) 12.706t tαβ =< − = − ou 3 /2 0.025

ˆ( ) (1) 12.706t tαβ => = , on rejette la nulle 0H en faveur de

l’alternative 1H ce qui donne & 5001 2 3

S Pt tt tr r Dα β β ε= + + + où l’on a un changement structurel au niveau du

alpha financier. Dans ce cas, l’intercepte (le alpha financier) change selon la phase du cycle économique. En récession

l’intercepte (le alpha financier) est 1α et en expansion l’intercepte (le alpha financier) est 1 3α β+ .

Décision

Pour ce test bilatéral 3ˆ12.706 ( ) 4.3719145 12.706t β− ≤ = ≤ , donc on ne rejette pas la nulle 0H à un niveau

nominal de signification de 0.05α = . Ainsi on ne rejette pas la nullité de ce paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de

données, le test serait fort probablement plus précis car la variance estimée de 3β aura normalement tendance à

diminuer. Ici le manque d’information nous a conduit à faire une erreur de type 2 (non-rejet de la nulle lorsque la nulle est

fausse car on sait que le vrai 3 6β = , car c’est à partir de ce paramètre que l’on a construit les ty ). Si on prend les

résultats du test statistique pour la vérité, on considère que le alpha financier est stable dans le temps, qu’il ne change pas selon les dates correspondantes aux phases du cycle économique. Il est à noter que ce qui est testé est la possibilité qu’aux

dates 1,3t = versus les dates 2,4t = on ait un intercepte différent, on pourrait rejeter la nulle pour une autre raison

que celle implicite dans la causalité du cycle économique ou même ‘’par hasard’’ en fonction des données observées.

N.B. : Notez que si on utilisait la distribution limite asymptotique normale ˆ( ) (0,1)a

kt Nβ ∼ , avec les valeurs critiques

1.96− et 1.96 alors on aurait rejeté la nulle, mais utiliser un résultat asymptotique avec seulement n =4 données a sa part d’incertitude quand à son applicabilité. Ici on avait pas rejeté la normalité des chocs et l’on a décidé de travailler comme si on avait la normalité ou comme si on ne s’éloigne pas trop de la normalité en approximant la loi d’échantillon fini des tests par la loi de Student.

Page 14: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

14

e1) 10 : 0H α ≥ contre l’alternative 1 1: 0H α < (test unilatéral à gauche)

Encore une fois on utilise une statistique de test de Student car on a dû estimer 2σ

1

1

1

ˆ 0 2.2 2.2ˆ( ) 1.20019841.833030ˆ 3.36var( )

β

β

−= = = = Pvalue = 0.778883817614694 0.05>

Règle de décisions pour ce test à gauche

-Si la statistique calculée 1ˆ( )t β est à plus grande ou égale à la valeur critique : 0.05 1

ˆ(1) 6.314 ( )t tα β=− = − ≤ , alors on

ne rejette pas la nulle 0H ce qui donne & 5001 2 3

S Pt tt tr r Dα β β ε= + + + avec un 1 0α ≥ sous la nulle.

-Si la statistique calculée 2ˆ( )t β est à plus petite que la valeur critique , telle que 1 0.05

ˆ( ) (1) 6.314t tαβ =< − = − , alors on

rejette la nulle 0H en faveur de l’alternative 1H ce qui donne & 5001 2 3

S Pt tt tr r Dα β β ε= + + + avec un 1 0α <

sous la nulle. Décision

Pour ce test unilatéral 0.05 1ˆ(1) 6.314 ( ) 1.2001984t tα β=− = − ≤ = , donc on ne rejette pas la nulle à un niveau

nominal de 0.05α = . En termes financiers, la nulle implique que le ‘’alpha financier’’ est positif ou nul, alors que l’alternative impliquerait qu’il soit négatif. Ainsi on ne rejette pas la positivité (ou nullité) de ce paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de données, le test serait fort

probablement plus précis car la variance estimée de 1β aura normalement tendance à diminuer. Ici on ne fait pas d’erreur

car on sait que le vrai 1 3β = , car c’est à partir de ce paramètre que l’on a construit les ty ).

N.B. : Ici comme la valeur de la statistique de test est positive et que l’on teste à gauche, on a même pas besoin de regarder

dans une table de distribution pour pouvoir conclure, car avec 1ˆ( ) 0t β > on est certain de ne pas rejeter ce test à gauche

même si on avait un niveau de signification de 0,5 (50%).

Notez par ailleurs, que si on utilisait la distribution limite asymptotique normale ˆ( ) (0,1)a

kt Nβ ∼ , avec la valeur critique

1.645− cela n’aurait pas changé notre décision.

Page 15: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

15

e2) 0 2: 1H β = correspondant au modèle suivant & 5001 31S P

t t ttr r Dα β ε= + + + contre l’alternative

21 : 1H β ≠ correspondant au modèle originel & 5001 2 3

S Pt tt tr r Dα β β ε= + + +

Encore une fois on utilise une statistique de test de Student car on a dû estimer 2σ

2

2

2

ˆ 1 1.2 1.2ˆ( ) 30.4ˆ 0.16var( )

β

β

−= = = = Pvalue = 0.204832764699134 0.05>

Règle de décisions

-Si la statistique calculée 2ˆ( )t β est à dans l’intervalle (incluant les bornes) suivant :

/2 0.025 2 /2 0.025ˆ(1) 12.706 ( ) (1) 12.706t t tα αβ= =− = − ≤ ≤ = , alors on ne rejette pas la nulle 0H ce qui donne

& 5001 31S P

t t ttr r Dα β ε= + + + avec 2 1β = .

-Si la statistique calculée 2ˆ( )t β est à l’extérieur de l’intervalle ci-haut (incluant les bornes), telle que

2 /2 0.025ˆ( ) (1) 12.706t tαβ =< − = − ou 2 /2 0.025

ˆ( ) (1) 12.706t tαβ => = , on rejette la nulle 0H en faveur de

l’alternative 1H ce qui donne & 5001 2 3

S Pt tt tr r Dα β β ε= + + + avec 2 1β ≠ .

Décision

Pour ce test bilatéral 2ˆ12.706 ( ) 3 12.706t β− ≤ = ≤ , donc on ne rejette pas la nulle 0H à un niveau nominal de

signification de 0.05α = (inférant dans le sens où 2 1β = ). Ainsi on ne rejette pas la nulle de l’unité ( 2 1β = ) de ce

paramètre. Par contre, on sait que l’on a pas beaucoup d’information (d’observations) et que les résultats risquent de ne pas être représentatifs. Si on avait plus de données, le test serait fort probablement plus précis car la variance estimée de

2β aura normalement tendance à diminuer. Ici le manque d’information nous a conduit à faire une erreur de type 2 (non-

rejet de la nulle lorsque la nulle est fausse car on sait que le vrai 2 2β = , car c’est à partir de ce paramètre que l’on a

construit les ty ).

Par ailleurs, on sait que le vrai paramètre 2β correspond à la pente 2& 5002t

S Pt

Er

∂= =

∂, soit l’effet d’une hausse de 1

en point de % du rendement du marché de & 500S Ptr sur le rendement du titre en espérance tEr . C’est la ‘’vraie’’ pente de

la ligne PFR (population regression function) de tEr par rapport au rendement du marché de & 500S Ptr .

Par ailleurs, on sait que le paramètre estimé 2β correspond à la pente estimée 2& 500

ˆ ˆ 2.2t

S Pt

r

∂= =

∂, soit l’effet d’une

hausse de 1 en point de % du rendement du marché de & 500S Ptr sur le rendement du titre tr prévu par le fit (de manière

conditionnelle aux divers ( )ix ) . C’est la pente estimée de la ligne de relation SRF (sample regression function) de tr par

rapport au rendement du marché de & 500S Ptr .

Ici comme la variance de 2β est relativement forte, le test ne démontre pas beaucoup de puissance et dans la pratique on

arrive pas à rejeter la nulle (et on fait une erreur de type 2). Avec plus de données, cela tendrait à augmenter la puissance du test et à conduire plus fréquemment au rejet de la nulle.

Si on a pas rejeté la nulle ici, c’est que le test ne nous a pas donné d’évidences assez fortes allant à l’encontre d’un 2 1β = ,

en ce sens on a pas rejeté l’hypothèse d’avoir un effet 2& 5001t

S Pt

Er

∂= =

∂, soit qu’une hausse de 1 en point de % du

Page 16: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

16

rendement du marché de & 500S Ptr aurait en moyenne un effet de 1 en point de pourcentage sur le rendement du titre en

espérance tEr . Bref, ici on aurait un effet un pour un sur tEr pour une hausse de & 500S Ptr si la nulle était vraie.

N.B. : Notez que si on utilisait la distribution limite asymptotique normale 2ˆ( ) (0,1)

a

t Nβ ∼ , avec les valeurs critiques

1.96− et 1.96 alors on aurait rejeté la nulle car 2 /2 0.025ˆ( ) 3 1.96t Zαβ == > = , mais utiliser un résultat

asymptotique avec seulement n =4 données a sa part d’incertitude quand à son applicabilité. Ici on avait pas rejeté la normalité des chocs et l’on a décidé de travailler comme si on avait la normalité ou comme si on ne s’éloigne pas trop de la normalité en approximant la loi d’échantillon fini des tests par la loi de Student. Cette différence de conclusion potentielle, met bien en lumière le problème du choix de la loi de la statistique de test appropriée à utiliser, bref il faut bien comprendre les enjeux.

e3) Test ANOVA : 0 2: 0H β = et 3 0β = contre l’alternative 21 : 0H β ≠ et/ou 3 0β ≠

C’est le test de signification de la régréssion, où l’on teste de manière jointe la nullité de tous les paramètres sauf la constante.

( / ( 1))

( / ( )35.125

)

XSS KF

USS n K

−= =

Pvalue = 0.118469775551819 0.05>

De manière alternative on aurait la même statistique de test la formule générale qui utilise 0 : 0H Rβ = vs

1 : 0H Rβ ≠ avec 0 1 0

0 0 1R

=

qui donne

12

23

3

0 1 0 0

0 0 1 0R r

ββ

β ββ

β

= = =

=

( ) ( )( ) ( )( )

( )

11

2

11 1

10 105.8 / 21 11 5.8

10 101.6

11 15.8 / 2

1 1 5.835.125

1.6

2.22.2

ˆ ˆ' ' ' /=

ˆ

2.22.2

56.2

1.6

R r R X X R R r J

F

β β

σ

−−

− − −

=

= =

− −=

Règle de décisions

-Si la statistique calculée F est plus petite que la valeur critique 0.05(2, 4 3)Fα= − ou égale, telle

que

21

0.05 0.05( , ) (2,4 3) 199.50vv

F F J n K Fα α= =≤ − = − = alors on ne rejette pas la nulle 0H .

-Si la statistique calculé F est plus grande que la valeur critique 0.05(2, 4 3)Fα= − , telle

que

21

0.05 0.05( , ) (2,4 3) 199.50vv

F F J n K Fα α= => − = − = alors on rejette la nulle 0H en faveur de l’alternative 1H .

Décision Pour ce test unilatéral, comme la statistique

calculée

21

0.05 0.0535.125 199.50 ( , ) (2, 4 3)vv

F F J n K Fα α= == ≤ = − = − , alors on ne rejette pas la nulle 0H à un

niveau nominal de signification de 0.05α =

Car on a peu de données la variance des β est importante, ce qui explique probablement une statistique de test

Page 17: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

17

21

( , )vv

F F J n Kα< − et le non-rejet de la nulle à 10% de signification, mais à 12% on rejetterait la nulle.

Ici comme les variances des 2β et 3β sont relativement forte, ainsi le test ne démontre pas beaucoup de puissance et dans

la pratique on arrive pas à rejeter la nulle (et on fait une erreur de type 2). Avec plus de données, cela tendrait à augmenter la puissance du test et à conduire plus fréquemment au rejet de la nulle.

f) on a 1

ˆ ˆ' 1 0n

ii

ι ε ε=

= =∑ , 2 21

ˆ ˆ' 0n

i ii

x xε ε=

= =∑ et 3 31

ˆ ˆ' 0n

i ii

x xε ε=

= =∑ car 3 1ˆ' 0X ε ×=

Estimez la constante séparément 1β et 2

3

ˆ

ˆ

β

β

en bloc via les équations de FWL.

Avec [2] 2 3X x x = on a :

( ) ( )1 12[2] [2] [2] [2] [2] [2] 1 1

3

1 1

2 2 2 22 3 2 3 1 1

3 3 3 3

ˆˆ' ' ' '

ˆ

' ' ' 'ˆ

' ' ' '

6

6 4 2 6

0 1 0 1

X X X y X X X x

x x x xx x y x x x

x x x x

ββ

β

β

− −

− −

= −

= −

=

1 10 6 0

4 1 6 4 2 6 6 4 2 6 4 1 6 4 2 6

2 0 0 1 0 1 0 1 0 1 2 0 0 1 0 1

6 1

15

6

1

7

1

6

22

− −

1

1 2.22.2

1 5.8

1

2.61904761904762 0.190476190476191 2.61904761904762 0.419047619047622.2

5.90476190476191 0.0476190476190478 5.90476190476191 0.104

=

= − = − 761904761905

ou

( ) 12[2] [2] [2]

3

151 1 1 1

165 10 5 107 3 3

ˆ 2.2' '

ˆ 5.82 7

10 5 10 5 22

X M X X M yι ι

β

β

− −

− −

= = =

Pour la constante avec l’équation des projections on a:

( ) ( ) ( ) ( )1 1 1 1 21 [2] [2] [2]

3

22 3

3

ˆˆ ˆ' ' ' ' ' ' ' '

ˆ

ˆ 2.215 4.5 0.5 2.2

ˆ 5.8

y X y X

y x x

ββ ι ι ι ι ι ι β ι ι ι ι ι ι

β

β

β

− − − − = − = −

= − = − =

Pour la constante avec l’équation de FWL on a:

[2 ] [2]

1

1

15

163 2 13 22.2

710 5 10

22

' '5

ˆX X

M M yβ ι ι ι−

− − =

= =

Page 18: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

18

On peut aussi regarder le paramètre 3β associé à la variable dichotomique :

( ) ( )1

3 3 3 3 3

1 13 3 2

2

1

ˆˆ ' ' ' '

ˆ

0 0

1 10 1 0 1 0 1 0 1 0 1 0 1

0 0

1

15

6

2 1

1

7

2

x x x x xy xxβ

β ιβ

− −

= −

= −

11 6

1 4 2.20 1 0 1

1 2 2.2

1 6

2.21 116 22 2 10 5.8

2.22 2

= + − =

On peut aussi trouvé l’estimateur OLS 1

2

ˆ

ˆ

β

β

estimé en un bloc avec 2xι

2

1 1

12 3 3

2 22

22

' ' ' 'ˆ

' ' ' '

ˆ

ˆ

1 6

6

1 1 1 1

6 4

4

2 6

1

1 2

1

y xx

xx x

xx

ι ι ι ιβι ι β

β

− −

=

=

1 115

1 1 1 1 16 1 1 1 1 1

62 6 2

4 1 1 1

6 4 7 6

1 6 0

1 1 2.25.8

1 2 0 2.

1

6 2

2

2

6

6

1

4 4

2

− − =

Errata corrigé en rouge

Évidemment on obtient toujours les mêmes valeurs numériques, c’est le premier résultat du théorème de FWL.

Page 19: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

19

g) Modèle SIM avec 2 variables (variable dichotomique 3x omise)

1

2

1 6ˆ1 4

ˆˆ1

15

1

2

1 6

6

7

22

βε

β

= +

( ' 4e 4d t )X X =

1

1 1

2

1 6ˆ 1 4

ˆ 1

154 5 14 4

1 1 1 1 1 1 1 1 1611 11 11 1

6 4 6 4 7 3 1 5 3

22 22 22 2

( ' ) 'ˆ

2

1 2

1 6

2 6 2

22

6X X X y

ββ

β

− − =

− −

= = =

1( ' ) '

1

1

15

16

7

22

23 9 304 18 60 60

11 22 1118 92 300 9 1 300 30

2

'

2 11 1

'

1

( )

X X X

X X X y

=

− = = = −

=

1

2

3

2.7273

2.7273

ˆ2.2ˆ ˆ2.2 de l'estimation du bon modèle avec les 3 variables

ˆ5,8

vs

β

β β

β

≈ = =

2

19.0909

13.6364ˆˆ

8.1818

19.0909

-4.0909

2.3636ˆ

-1.1818

2.9091

ˆ ˆ' 32.1818 Le fit est moins bon

ˆ 16.0909

33.6446 -6.5826ˆ( )

-6.5826 1.4628var

y Xβ

ε

ε ε

σ

β

= =

= =

= =

2

2

0.7177

0.5766

R

R

=

=

Page 20: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

20

h) Avec une variable superflue & 5004

S Pt t tx D r= ⋅

11

22

33

4

1 6 0 0

1 4 1 4

1 2 0 0

1 6 1 6

ˆ 3 ˆ2.2ˆ 2ˆ ˆ2.2

ˆ 1ˆ5, 8

ˆ 1

X

vs

ββ

ββ β

ββ

β

= = = =

2

2

2

15

16

7

22

0

0

ˆ de l'estimation du bon modèle

ˆ

1 fit parfait par construction car 4 4

non-calcul

ˆ0

0

ˆ ˆ' 0

?

ˆ ˆvar( ) ? (

able car 4 4

ML

y

X

y

R n K

R n K

ε

ε ε

β σ

β

= =

=

=

= =

= = = =

=

=

= = =

1 10' ) ( ' )

4X X X− −=

Ici le fit est parfait, il n’y a pas de variance estimée car ˆ ˆ' 0ε ε = .

Page 21: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

21

i) Modèle Sans constante avec seulement 2 3x x

1

1

2 2 22 3

3 3 3

6 0ˆ ' ' 6 4 2 6 4 1 6 4 2 6

ˆ 0 1 0 1 2 0 0 1 0 1' '

15

16

7

226 1

x xx x y

x x

β

β

− = =

2.61904761904762

5.90476190476191

=

1

2 2tan

3 3

ˆ2.2ˆ ˆ ˆ 2.6190 2.2 de l'estimation du bon modèleˆˆ ˆ 5.9048 5,8

-0.7143

-0.3810ˆ

1.7619

0.3810

sanscons te

vs

β

β β ββ

β β

ε

= = = =

=

ˆ' 0.2619

4

ι ε=

2 1.2414 1R = > Les deux 2R sont incohérents car il n’y a plus de constante dans le modèle. 2 0.9486R =

j) Multicolinéarité - les 7 premiers vecteurs β avec 0.1, 0.2, ..., 0.7vγ =

1

2

3

0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7

ˆ -5.2277 -5.2277 -5.2277 -5.2277 -5.2277 -5.2277 -5.2277ˆ .......... 74.3134 39.4176 27.7857 21.9698 18.4802 16.1538 14.4921

ˆ -

β

β

β

=

69.7915 -34.8958 -23.2638 -17.4479 -13.9583 -11.6319 -9.9702

Le dernier estimé avec 100vγ =

1005.2277

ˆ 4.5917

0.0698

vγβ =

− = −

N.B. : Ici on va aussi rappeler que la variable dichotomique a été enlevée, ce qui implique un biais de l’estimateur OLS. k) Modèle CAPM

1

2

ˆ 4.5000ˆ

ˆ 3.5000

ββ

β

= =

1 2.5000 -0.7500

( ' ) -0.7500 0.2500

X X − =

81.2500 -24.3750ˆvar( )

-24.3750 8.1250β

=

Page 22: exo8600 exo2Bq2 sol v161 Exo 2B Q2 2020-02-10 Attention aux coquilles… Pistes de solutions brouillon v8.0 Q2- Nous avons le modèle suivant : & 5001 2 3 S P r r D t t= + + +α β

22

L) Estimation du modèle SIM à deux variables en déviations à la moyenne

12 2 2 2

1 2 2

ˆ ( ' ) ' 2.7273

ˆ ˆ =2.7273

x x x y

y x

β

β β

−= =

= −

m) GLS avec la matrice 2

4 0 0 0

0 9 0 0

0 0 4 0

0 0 0 9

σ

Σ = Ω =

.

1

1 1

1

2

3

4 0 0 0 4 0 0 0 ˆ2.6 2.20 9 0 0 0 9 0 0

ˆ ˆ ˆ' ' 2.1 2.2 de l'e0 0 4 0 0 0 4 0

ˆ5.9 5,80 0 0 9 0 0 0 9

GLS X X X y vs

β

β β β

β

−− − = = = =

stimation OLS

Etc… Les autres résultats numériques sont ici: http://www.solo.uqam.ca/eco8600/notes/AAAexo/exo8600_exo2Bq2_solPrintout.pdf La fonction matlab olsmat.m : http://www.solo.uqam.ca/eco8600/notes/AAAexo/olsmat.m Le script matlab est ici : Script *.m http://www.solo.uqam.ca/eco8600/notes/AAAexo/exo8600_exo2Bq2_solCode.m Script Live *.mlx http://www.solo.uqam.ca/eco8600/notes/AAAexo/exo8600_exo2Bq2_solCode.mlx