Chapitre 3 Mesures stationnaires et théorèmes de...

85
Chapitre 3 Mesures stationnaires et théorèmes de convergence Christiane Cocozza-Thivent, Universit ´ e de Marne-la-Vall ´ ee – p.1

Transcript of Chapitre 3 Mesures stationnaires et théorèmes de...

Page 1: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Chapitre 3

Mesures stationnaires

et théorèmes de convergence

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.1

Page 2: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

I. Mesures stationnaires

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.2

Page 3: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

I. Mesures stationnaires

Définition : Une probabilité π sur E est invariante ou stationnaire pourla chaine de Markov (Xn)n≥0 si, pour tout n ≥ 0 :

(∀x ∈ E, P(Xn = x) = π(x)) =⇒ (∀x ∈ E, P(Xn+1 = x) = π(x)).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.2

Page 4: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

I. Mesures stationnaires

Définition : Une probabilité π sur E est invariante ou stationnaire pourla chaine de Markov (Xn)n≥0 si, pour tout n ≥ 0 :

(∀x ∈ E, P(Xn = x) = π(x)) =⇒ (∀x ∈ E, P(Xn+1 = x) = π(x)).

Proposition 1 : La probabilité π est stationnaire si et seulement si :

∀ y ∈ E,∑

x∈E

π(x)p(x, y) = π(y).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.2

Page 5: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

I. Mesures stationnaires

Définition : Une probabilité π sur E est invariante ou stationnaire pourla chaine de Markov (Xn)n≥0 si, pour tout n ≥ 0 :

(∀x ∈ E, P(Xn = x) = π(x)) =⇒ (∀x ∈ E, P(Xn+1 = x) = π(x)).

Proposition 1 : La probabilité π est stationnaire si et seulement si :

∀ y ∈ E,∑

x∈E

π(x)p(x, y) = π(y).

En fait π est stationnaire si et seulement si, lorsque la loi initiale de lachaine est π (c’est-à-dire si P(X0 = x) = π(x) pour tout x) alors, pourtout instant n, la loi de Xn est également π (c’est-à-direP(Xn = x) = π(x) pour tout x).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.2

Page 6: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple : Dans le cas d’une chaine pour laquelle E = {0, 1} et

p =

1 − a a

b 1 − b

,

nous avons montré que

P(Xn = 0) =b

a + b+ (1 − a − b)n(µ(0) −

b

a + b)

etP(Xn = 1) =

a

a + b+ (1 − a − b)n(µ(1) −

a

a + b)

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.3

Page 7: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple : Dans le cas d’une chaine pour laquelle E = {0, 1} et

p =

1 − a a

b 1 − b

,

nous avons montré que

P(Xn = 0) =b

a + b+ (1 − a − b)n(µ(0) −

b

a + b)

etP(Xn = 1) =

a

a + b+ (1 − a − b)n(µ(1) −

a

a + b)

Par conséquent la probabilité π définie par π(0) = b

a+b, π(1) = a

a+best

stationnaire et c’est la seule.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.3

Page 8: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple : Dans le cas d’une chaine pour laquelle E = {0, 1} et

p =

1 − a a

b 1 − b

,

nous avons montré que

P(Xn = 0) =b

a + b+ (1 − a − b)n(µ(0) −

b

a + b)

etP(Xn = 1) =

a

a + b+ (1 − a − b)n(µ(1) −

a

a + b)

Par conséquent la probabilité π définie par π(0) = b

a+b, π(1) = a

a+best

stationnaire et c’est la seule.

On retrouve ce résultat en appliquant la proposition 1.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.3

Page 9: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple : Dans le cas d’une chaine pour laquelle E = {0, 1} et

p =

1 − a a

b 1 − b

,

nous avons montré que

P(Xn = 0) =b

a + b+ (1 − a − b)n(µ(0) −

b

a + b)

etP(Xn = 1) =

a

a + b+ (1 − a − b)n(µ(1) −

a

a + b)

Par conséquent la probabilité π définie par π(0) = b

a+b, π(1) = a

a+best

stationnaire et c’est la seule.

On retrouve ce résultat en appliquant la proposition 1.

En outrelim

n→+∞

P(Xn = 0) =b

a + b= π(0), lim

n→+∞

P(Xn = 1) =a

a + b= π(1).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.3

Page 10: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En fait, si π est stationnaire et si la loi de X0 est π, alors pour tout n,(Xk+n)k≥0 a même loi que (Xp)p≥0 au sens où : pour tout m ≥ 0, levecteur (Xn, Xn+1, . . . , Xn+m) a même loi que le vecteur(X0, X1, . . . , Xm).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.4

Page 11: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En fait, si π est stationnaire et si la loi de X0 est π, alors pour tout n,(Xk+n)k≥0 a même loi que (Xp)p≥0 au sens où : pour tout m ≥ 0, levecteur (Xn, Xn+1, . . . , Xn+m) a même loi que le vecteur(X0, X1, . . . , Xm).Cela signifie que la chaine de Markov regardée depuis l’instant initial amême loi que la chaine de Markov regardée à partir de tout instant n.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.4

Page 12: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En fait, si π est stationnaire et si la loi de X0 est π, alors pour tout n,(Xk+n)k≥0 a même loi que (Xp)p≥0 au sens où : pour tout m ≥ 0, levecteur (Xn, Xn+1, . . . , Xn+m) a même loi que le vecteur(X0, X1, . . . , Xm).Cela signifie que la chaine de Markov regardée depuis l’instant initial amême loi que la chaine de Markov regardée à partir de tout instant n.

Il est commode d’étendre la notion d’invariance aux mesures sur E etde ne pas la réserver aux probabilités sur E.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.4

Page 13: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En fait, si π est stationnaire et si la loi de X0 est π, alors pour tout n,(Xk+n)k≥0 a même loi que (Xp)p≥0 au sens où : pour tout m ≥ 0, levecteur (Xn, Xn+1, . . . , Xn+m) a même loi que le vecteur(X0, X1, . . . , Xm).Cela signifie que la chaine de Markov regardée depuis l’instant initial amême loi que la chaine de Markov regardée à partir de tout instant n.

Il est commode d’étendre la notion d’invariance aux mesures sur E etde ne pas la réserver aux probabilités sur E.

Définition : Une mesure m sur E (c’est à dire une famille (m(x))x∈E deréels positifs ou nuls) est dite invariante (ou stationnaire) si la mesurem n’est pas la mesure identiquement nulle et si :

∀ y ∈ E∑

x∈E

m(x) p(x, y) = m(y).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.4

Page 14: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Une probabilité invariante est évidemment une mesure invariante.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.5

Page 15: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Une probabilité invariante est évidemment une mesure invariante.

Si m est une mesure invariante et si λ > 0, alors λm est unemesure invariante.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.5

Page 16: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Une probabilité invariante est évidemment une mesure invariante.

Si m est une mesure invariante et si λ > 0, alors λm est unemesure invariante.

Si m est une mesure invariante et si m(E) < +∞, alors m/m(E) estune probabilité invariante.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.5

Page 17: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Une probabilité invariante est évidemment une mesure invariante.

Si m est une mesure invariante et si λ > 0, alors λm est unemesure invariante.

Si m est une mesure invariante et si m(E) < +∞, alors m/m(E) estune probabilité invariante.

En pratique, on cherche des mesures stationnaires et on lesrenormalise éventuellement pour avoir des probabilités stationnaires.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.5

Page 18: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Une probabilité invariante est évidemment une mesure invariante.

Si m est une mesure invariante et si λ > 0, alors λm est unemesure invariante.

Si m est une mesure invariante et si m(E) < +∞, alors m/m(E) estune probabilité invariante.

En pratique, on cherche des mesures stationnaires et on lesrenormalise éventuellement pour avoir des probabilités stationnaires.

Si E est fini et comprend d éléments, m peut être représentée par unvecteur colonne de d composantes et les équations de stationnarités’écrivent :

mtp = mt.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.5

Page 19: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Une probabilité invariante est évidemment une mesure invariante.

Si m est une mesure invariante et si λ > 0, alors λm est unemesure invariante.

Si m est une mesure invariante et si m(E) < +∞, alors m/m(E) estune probabilité invariante.

En pratique, on cherche des mesures stationnaires et on lesrenormalise éventuellement pour avoir des probabilités stationnaires.

Si E est fini et comprend d éléments, m peut être représentée par unvecteur colonne de d composantes et les équations de stationnarités’écrivent :

mtp = mt.

Cela revient à chercher les vecteurs propres à gauche de p (c’est-à-direles vecteurs propres de pt associés à la valeur propre 1). On voit que 1est valeur propre de p donc de pt, mais il n’est pas évident qu’il existe unvecteur propre dont toutes les composantes soient positives ou nulles.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.5

Page 20: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple : Prenons le modèle d’Ehrenfest avec d = 3. La matrice detransition p est :

0 1 0 0

1/3 0 2/3 0

0 2/3 0 1/3

0 0 1 0

.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.6

Page 21: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple : Prenons le modèle d’Ehrenfest avec d = 3. La matrice detransition p est :

0 1 0 0

1/3 0 2/3 0

0 2/3 0 1/3

0 0 1 0

.

On trouve :

π(0) =1

8, π(1) =

3

8, π(2) =

3

8, π(3) =

1

8.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.6

Page 22: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple : Prenons le modèle d’Ehrenfest avec d = 3. La matrice detransition p est :

0 1 0 0

1/3 0 2/3 0

0 2/3 0 1/3

0 0 1 0

.

On trouve :

π(0) =1

8, π(1) =

3

8, π(2) =

3

8, π(3) =

1

8.

Pour cette chaine, nous n’avons pas limn→+∞ P(Xn = i) = π(i) car si nest impair Px(Xn = x) = 0.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.6

Page 23: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple : Prenons le modèle d’Ehrenfest avec d = 3. La matrice detransition p est :

0 1 0 0

1/3 0 2/3 0

0 2/3 0 1/3

0 0 1 0

.

On trouve :

π(0) =1

8, π(1) =

3

8, π(2) =

3

8, π(3) =

1

8.

Pour cette chaine, nous n’avons pas limn→+∞ P(Xn = i) = π(i) car si nest impair Px(Xn = x) = 0.Cette chaine a un comportement “périodique", nous y reviendrons à lafin du chapitre.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.6

Page 24: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Il peut être lourd de chercher les mesures stationnaires à l’aide de ladéfinition, la notion de réversibilité est plus restrictive mais plus facile àmanipuler.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.7

Page 25: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Il peut être lourd de chercher les mesures stationnaires à l’aide de ladéfinition, la notion de réversibilité est plus restrictive mais plus facile àmanipuler.

Définition : La mesure m sur E est réversible pour la chaine deMarkov de fonction de transition p si :

m(x) p(x, y) = m(y) p(y, x),∀x; y ∈ E.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.7

Page 26: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Il peut être lourd de chercher les mesures stationnaires à l’aide de ladéfinition, la notion de réversibilité est plus restrictive mais plus facile àmanipuler.

Définition : La mesure m sur E est réversible pour la chaine deMarkov de fonction de transition p si :

m(x) p(x, y) = m(y) p(y, x),∀x; y ∈ E.

Proposition 2 : Toute mesure réversible est stationnaire.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.7

Page 27: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple d’une chaine de naissance et mort :

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.8

Page 28: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple d’une chaine de naissance et mort :On suppose que qx > 0 pour tout x ≥ 1.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.8

Page 29: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple d’une chaine de naissance et mort :On suppose que qx > 0 pour tout x ≥ 1.On vérifie que la mesure m est réversible si et seulement si elle s’écrit pourx ≥ 1, x ∈ E :

m(x) =p0....px−1

q1......qx

m(0).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.8

Page 30: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple d’une chaine de naissance et mort :On suppose que qx > 0 pour tout x ≥ 1.On vérifie que la mesure m est réversible si et seulement si elle s’écrit pourx ≥ 1, x ∈ E :

m(x) =p0....px−1

q1......qx

m(0).

Si E = {0, 1, ...d}, la probabilité π donnée par :

π(x) =m(x)

∑d

y=0m(y)

=

p0....px−1

q1......qx

∑d

y=0

p0....py−1

q1......qy

pour 0 ≤ x ≤ d,

est réversible donc stationnaire.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.8

Page 31: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple d’une chaine de naissance et mort :On suppose que qx > 0 pour tout x ≥ 1.On vérifie que la mesure m est réversible si et seulement si elle s’écrit pourx ≥ 1, x ∈ E :

m(x) =p0....px−1

q1......qx

m(0).

Si E = {0, 1, ...d}, la probabilité π donnée par :

π(x) =m(x)

∑d

y=0m(y)

=

p0....px−1

q1......qx

∑d

y=0

p0....py−1

q1......qy

pour 0 ≤ x ≤ d,

est réversible donc stationnaire.Si E = N, et si

y≥0m(y) =< +∞, c’est-à-dire si

y≥0

p0....py−1

q1......qy

< +∞, il existe une etune seule probabilité réversible π donnée par :

π(x) =m(x)

y≥0m(y)

=

p0....px−1

q1......qx∑

y≥0

p0....py−1

q1......qy

pour x ∈ N.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.8

Page 32: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Exemple d’une chaine de naissance et mort :On suppose que qx > 0 pour tout x ≥ 1.On vérifie que la mesure m est réversible si et seulement si elle s’écrit pourx ≥ 1, x ∈ E :

m(x) =p0....px−1

q1......qx

m(0).

Si E = {0, 1, ...d}, la probabilité π donnée par :

π(x) =m(x)

∑d

y=0m(y)

=

p0....px−1

q1......qx

∑d

y=0

p0....py−1

q1......qy

pour 0 ≤ x ≤ d,

est réversible donc stationnaire.Si E = N, et si

y≥0m(y) =< +∞, c’est-à-dire si

y≥0

p0....py−1

q1......qy

< +∞, il existe une etune seule probabilité réversible π donnée par :

π(x) =m(x)

y≥0m(y)

=

p0....px−1

q1......qx∑

y≥0

p0....py−1

q1......qy

pour x ∈ N.

Si E = N, et si∑

y≥0

p0....py−1

q1......qy

= +∞, il n’existe pas de probabilité réversible.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.8

Page 33: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Proposition 3 : Soit π une probabilité stationnaire. Si y est un étattransient ou récurrent nul, alors π(y) = 0.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.9

Page 34: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Proposition 3 : Soit π une probabilité stationnaire. Si y est un étattransient ou récurrent nul, alors π(y) = 0.

car si y est transient ou récurrent nul, alors pour tout x

1

nEx

(

n∑

k=1

1{Xk=y}

)

−−−−−→n→+∞

0.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.9

Page 35: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

II. Cas d’une chaine r ecurrente irr eductible

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.10

Page 36: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

II. Cas d’une chaine r ecurrente irr eductible

Lemme 5 : Soit m une mesure invariante (donc non identiquementnulle) d’une chaine de Markov irréductible. Alors, pour tout y ∈ E, on am(y) > 0.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.10

Page 37: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

II. Cas d’une chaine r ecurrente irr eductible

Lemme 5 : Soit m une mesure invariante (donc non identiquementnulle) d’une chaine de Markov irréductible. Alors, pour tout y ∈ E, on am(y) > 0.

Théorème 5 : Une chaine de Markov récurrente irréductible possèdeune mesure invariante m. Cette mesure stationnaire est strictementpositive en tout point et unique à une constante multiplicative près. Enoutre pour tout x0 ∈ E on a :

∀ y ∈ E, m(y) = c(x0) Ex0

Tx0∑

k=1

1{Xk=y}

(c(x0) > 0).

Par suite la chaine est récurrente positive si et seulement si sesmesures stationaires sont de masse totale finie.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.10

Page 38: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 39: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 40: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 41: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 42: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

- pour tout z ∈ E,∑

y∈E λx0(y) p(y, z) = λx0

(z),

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 43: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

- pour tout z ∈ E,∑

y∈E λx0(y) p(y, z) = λx0

(z),

- pour tout y0 ∈ E, λx0(y0) < +∞.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 44: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

- pour tout z ∈ E,∑

y∈E λx0(y) p(y, z) = λx0

(z),

- pour tout y0 ∈ E, λx0(y0) < +∞.

Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 45: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

- pour tout z ∈ E,∑

y∈E λx0(y) p(y, z) = λx0

(z),

- pour tout y0 ∈ E, λx0(y0) < +∞.

Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0.

Soit m une mesure invariante

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 46: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

- pour tout z ∈ E,∑

y∈E λx0(y) p(y, z) = λx0

(z),

- pour tout y0 ∈ E, λx0(y0) < +∞.

Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0.

Soit m une mesure invariante- pour tout z ∈ E, m(z) ≥ m(x0)

∑nk=1 Px0

(Tx0≥ k,Xk = z),

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 47: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

- pour tout z ∈ E,∑

y∈E λx0(y) p(y, z) = λx0

(z),

- pour tout y0 ∈ E, λx0(y0) < +∞.

Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0.

Soit m une mesure invariante- pour tout z ∈ E, m(z) ≥ m(x0)

∑nk=1 Px0

(Tx0≥ k,Xk = z),

- pour tout z ∈ E, m(z) ≥ m(x0) λx0(z),

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 48: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

- pour tout z ∈ E,∑

y∈E λx0(y) p(y, z) = λx0

(z),

- pour tout y0 ∈ E, λx0(y0) < +∞.

Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0.

Soit m une mesure invariante- pour tout z ∈ E, m(z) ≥ m(x0)

∑nk=1 Px0

(Tx0≥ k,Xk = z),

- pour tout z ∈ E, m(z) ≥ m(x0) λx0(z),

- m1 = m − m(x0) λx0est une mesure (positive) qui vérifie, pour tout

y ∈ E, m1(y) =∑

x∈E m1(x) p(x, y).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 49: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On fixe x0 ∈ E et on pose

λx0(y) = Ex0

Tx0∑

k=1

1{Xk=y}

=∑

k≥1

Px0(Tx0

≥ k,Xk = y) ∈ R+.

Etape 1 : λx0est une mesure invariante strictement positive

- λx0(x0) = 1,

- pour tout z ∈ E,∑

y∈E λx0(y) p(y, z) = λx0

(z),

- pour tout y0 ∈ E, λx0(y0) < +∞.

Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0.

Soit m une mesure invariante- pour tout z ∈ E, m(z) ≥ m(x0)

∑nk=1 Px0

(Tx0≥ k,Xk = z),

- pour tout z ∈ E, m(z) ≥ m(x0) λx0(z),

- m1 = m − m(x0) λx0est une mesure (positive) qui vérifie, pour tout

y ∈ E, m1(y) =∑

x∈E m1(x) p(x, y).

- m1(x0) = 0, donc m1 = 0 (lemme 4).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.11

Page 50: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Théorème 6 : Une chaine de Markov irréductible et récurrentepositive possède une et une seule probabilité stationnaire π. Cetteprobabilité stationnaire π vérifie :

∀x0 ∈ E,∀ y ∈ E, π(y) =Ex0

(∑Tx0

k=1 1{Xk=y})

Ex0(Tx0

)=

1

Ey(Ty).

En outre, pour tout y ∈ E :

1

n

n∑

k=1

1{Xk=y}p.s.

−−−→n→+∞

π(y).

Plus généralement, pour toute fonction f positive ou π-intégrable :

1

n

n∑

k=1

f(Xk)p.s.

−−−→n→+∞

y∈E

f(y) π(y) =

fdπ.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.12

Page 51: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Remarque : :

limn→+∞

1

n

n∑

k=1

1{Xk=y} = limn→+∞

1

n

n∑

k=0

1{Xk=y} = limn→+∞

1

n

n−1∑

k=0

1{Xk=y},

et de meme :

limn→+∞

1

n

n∑

k=1

f(Xk) = limn→+∞

1

n

n∑

k=0

f(Xk) = limn→+∞

1

n

n−1∑

k=0

f(Xk).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.13

Page 52: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Remarque : :

limn→+∞

1

n

n∑

k=1

1{Xk=y} = limn→+∞

1

n

n∑

k=0

1{Xk=y} = limn→+∞

1

n

n−1∑

k=0

1{Xk=y},

et de meme :

limn→+∞

1

n

n∑

k=1

f(Xk) = limn→+∞

1

n

n∑

k=0

f(Xk) = limn→+∞

1

n

n−1∑

k=0

f(Xk).

Corollaire 8 : Une chaine irréductible est récurrente positive si etseulement si elle possède une probabilité stationnaire (et celle-ci estalors unique).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.13

Page 53: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Remarque : :

limn→+∞

1

n

n∑

k=1

1{Xk=y} = limn→+∞

1

n

n∑

k=0

1{Xk=y} = limn→+∞

1

n

n−1∑

k=0

1{Xk=y},

et de meme :

limn→+∞

1

n

n∑

k=1

f(Xk) = limn→+∞

1

n

n∑

k=0

f(Xk) = limn→+∞

1

n

n−1∑

k=0

f(Xk).

Corollaire 8 : Une chaine irréductible est récurrente positive si etseulement si elle possède une probabilité stationnaire (et celle-ci estalors unique).

Corollaire 8 : Une chaine irréductible sur un espace d’états finipossède une et une seule probabilité stationnaire π et tous ses étatssont récurrents positifs.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.13

Page 54: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En pratique, pour trouver la probabilité invariante éventuelle d’unechaine irréductible, on peut

commencer par chercher des mesures réversibles γ,

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.14

Page 55: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En pratique, pour trouver la probabilité invariante éventuelle d’unechaine irréductible, on peut

commencer par chercher des mesures réversibles γ,

si on en trouve une, alors la mesure m = γ est invariante,

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.14

Page 56: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En pratique, pour trouver la probabilité invariante éventuelle d’unechaine irréductible, on peut

commencer par chercher des mesures réversibles γ,

si on en trouve une, alors la mesure m = γ est invariante,

si on n’en trouve pas, on ne peut conclure et il faut revenir à larecherche directe de mesures invariantes,

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.14

Page 57: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En pratique, pour trouver la probabilité invariante éventuelle d’unechaine irréductible, on peut

commencer par chercher des mesures réversibles γ,

si on en trouve une, alors la mesure m = γ est invariante,

si on n’en trouve pas, on ne peut conclure et il faut revenir à larecherche directe de mesures invariantes,

si on ne trouve pas de mesure invariante non identiquement nulle,alors la chaine est transiente.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.14

Page 58: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En pratique, pour trouver la probabilité invariante éventuelle d’unechaine irréductible, on peut

commencer par chercher des mesures réversibles γ,

si on en trouve une, alors la mesure m = γ est invariante,

si on n’en trouve pas, on ne peut conclure et il faut revenir à larecherche directe de mesures invariantes,

si on ne trouve pas de mesure invariante non identiquement nulle,alors la chaine est transiente.

si on a trouvé une mesure invariante m non identiquement nulle :

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.14

Page 59: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En pratique, pour trouver la probabilité invariante éventuelle d’unechaine irréductible, on peut

commencer par chercher des mesures réversibles γ,

si on en trouve une, alors la mesure m = γ est invariante,

si on n’en trouve pas, on ne peut conclure et il faut revenir à larecherche directe de mesures invariantes,

si on ne trouve pas de mesure invariante non identiquement nulle,alors la chaine est transiente.

si on a trouvé une mesure invariante m non identiquement nulle :

- ou bien∑

x m(x) < +∞, la chaine est alors récurrente positiveet la probabilité invariante est π(x) = m(x)/

y m(y),

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.14

Page 60: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

En pratique, pour trouver la probabilité invariante éventuelle d’unechaine irréductible, on peut

commencer par chercher des mesures réversibles γ,

si on en trouve une, alors la mesure m = γ est invariante,

si on n’en trouve pas, on ne peut conclure et il faut revenir à larecherche directe de mesures invariantes,

si on ne trouve pas de mesure invariante non identiquement nulle,alors la chaine est transiente.

si on a trouvé une mesure invariante m non identiquement nulle :

- ou bien∑

x m(x) < +∞, la chaine est alors récurrente positiveet la probabilité invariante est π(x) = m(x)/

y m(y),- ou bien

x m(x) = +∞, la chaine est alors récurrente nulle outransiente.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.14

Page 61: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

III. Cas d’une chaine non irr eductible

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.15

Page 62: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

III. Cas d’une chaine non irr eductible

Lemme 10 : Soit C une classe fermée et m une mesure portée par C(c’est-à-dire telle que m(Cc) = 0). Alors m est invariante pour la chainede Markov initiale si et seulement si elle est invariante pour la chainede Markov restreinte à C.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.15

Page 63: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

III. Cas d’une chaine non irr eductible

Lemme 10 : Soit C une classe fermée et m une mesure portée par C(c’est-à-dire telle que m(Cc) = 0). Alors m est invariante pour la chainede Markov initiale si et seulement si elle est invariante pour la chainede Markov restreinte à C.

Théorème 10 : Soit C une classe fermée irréductible formée d’étatsrécurrents positifs, alors la chaine possède une et une seule probabilitéstationnaire π concentrée sur C. Elle est donnée par :

π(x) =

{

1Ex(Tx) si x ∈ C,

0 sinon.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.15

Page 64: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Théorème 11 : Soit (Ck)k∈K (K fini ou dénombrable) l’ensemble desclasses récurrentes irréductibles qui sont récurrentes positives(c’est-à-dire formées d’états récurrents positifs). Notons πk (k ∈ K)l’unique probabilité stationnaire concentrée sur Ck. Alors lesprobabilités stationnaires de la chaine sont les mesures de la forme :

π =∑

k∈K

ck πk, avec ck ≥ 0,∑

k∈K

ck = 1.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.16

Page 65: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

IV. Convergence en loi vers la loi stationnaire

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.17

Page 66: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

IV. Convergence en loi vers la loi stationnaire

Tous les résultats suivants sont admis.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.17

Page 67: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

IV. Convergence en loi vers la loi stationnaire

Tous les résultats suivants sont admis.

Définition : Etant donné x ∈ E pour lequel Px(Tx < +∞) > 0(c’est-à-dire il existe n ≥ 1 tel que pn(x, x) > 0), sa période dx est lep.g.c.d. de {n : n ≥ 1, pn(x, x) > 0}.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.17

Page 68: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

IV. Convergence en loi vers la loi stationnaire

Tous les résultats suivants sont admis.

Définition : Etant donné x ∈ E pour lequel Px(Tx < +∞) > 0(c’est-à-dire il existe n ≥ 1 tel que pn(x, x) > 0), sa période dx est lep.g.c.d. de {n : n ≥ 1, pn(x, x) > 0}.

Remarque :1 ≤ dx ≤ min{n ≥ 1 : pn(x, x) > 0},

en particulier s’il existe x tel que p(x, x) > 0, alors dx = 1.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.17

Page 69: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

IV. Convergence en loi vers la loi stationnaire

Tous les résultats suivants sont admis.

Définition : Etant donné x ∈ E pour lequel Px(Tx < +∞) > 0(c’est-à-dire il existe n ≥ 1 tel que pn(x, x) > 0), sa période dx est lep.g.c.d. de {n : n ≥ 1, pn(x, x) > 0}.

Remarque :1 ≤ dx ≤ min{n ≥ 1 : pn(x, x) > 0},

en particulier s’il existe x tel que p(x, x) > 0, alors dx = 1.

Proposition 12 : Si x conduit à y alors dx = dy Par conséquent, tous leséléments d’une chaine de Markov irréductible ont même période.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.17

Page 70: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

IV. Convergence en loi vers la loi stationnaire

Tous les résultats suivants sont admis.

Définition : Etant donné x ∈ E pour lequel Px(Tx < +∞) > 0(c’est-à-dire il existe n ≥ 1 tel que pn(x, x) > 0), sa période dx est lep.g.c.d. de {n : n ≥ 1, pn(x, x) > 0}.

Remarque :1 ≤ dx ≤ min{n ≥ 1 : pn(x, x) > 0},

en particulier s’il existe x tel que p(x, x) > 0, alors dx = 1.

Proposition 12 : Si x conduit à y alors dx = dy Par conséquent, tous leséléments d’une chaine de Markov irréductible ont même période.

On dit que la chaine est périodique de période d si d > 1 et apériodiquesi d = 1.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.17

Page 71: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Théorème 13 :Soit (Xn)n∈N une chaine de Markov récurrente irréductible.

Si elle est récurrente nulle, alors :

limn→+∞

pn(x, y) = limn→+∞

Px(Xn = y) = 0.

Si elle est récurrente positive de loi stationnaire π :soit elle est apériodique, et alors :

limn→+∞

pn(x, y) = limn→+∞

Px(Xn = y) = π(y).

soit elle est périodique de période d, et alors pour tout couplex, y d’états de E, il existe un entier r (0 ≤ r < d) dépendant de xet y, tel que :

Px(Xn = y) = 0 si n n′est pas de la forme md + r avec m ∈ N

limm→+∞

Px(Xmd+r = y) = d π(y).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.18

Page 72: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : algorithme de M etropolis

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.19

Page 73: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : algorithme de M etropolis

But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peutcalculer car E est trop grand.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.19

Page 74: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : algorithme de M etropolis

But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peutcalculer car E est trop grand.

En fait on simule une chaine de Markov récurrente, irréductible etapériodique (Xn)n≥0 de loi stationnaire π.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.19

Page 75: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : algorithme de M etropolis

But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peutcalculer car E est trop grand.

En fait on simule une chaine de Markov récurrente, irréductible etapériodique (Xn)n≥0 de loi stationnaire π.

On se donne une fonction de transition q symétrique(q(x, y) ≥ 0,

y q(x, y) = 1, q(x, y) = q(y, x)) et irréductible.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.19

Page 76: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : algorithme de M etropolis

But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peutcalculer car E est trop grand.

En fait on simule une chaine de Markov récurrente, irréductible etapériodique (Xn)n≥0 de loi stationnaire π.

On se donne une fonction de transition q symétrique(q(x, y) ≥ 0,

y q(x, y) = 1, q(x, y) = q(y, x)) et irréductible.

On suppose que Xk = x,- on tire y avec la probabilité q(x, ·)

- on prend Xk+1 = y avec probabilité min(π(y)π(x) , 1) et Xn+1 = x avec

probabilité 1 − min(π(y)π(x) , 1).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.19

Page 77: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : algorithme de M etropolis

But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peutcalculer car E est trop grand.

En fait on simule une chaine de Markov récurrente, irréductible etapériodique (Xn)n≥0 de loi stationnaire π.

On se donne une fonction de transition q symétrique(q(x, y) ≥ 0,

y q(x, y) = 1, q(x, y) = q(y, x)) et irréductible.

On suppose que Xk = x,- on tire y avec la probabilité q(x, ·)

- on prend Xk+1 = y avec probabilité min(π(y)π(x) , 1) et Xn+1 = x avec

probabilité 1 − min(π(y)π(x) , 1).

Alors la probabilité π est réversible pour la chaine de Markov (Xn)n≥0.La chaine est irréductible, récurrente positive et apériodique. On prendZ = Xn pour n "grand".

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.19

Page 78: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : recuit simul e

But : minimiser une fonction U définie sur un espace fini mais trèsgrand.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.20

Page 79: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : recuit simul e

But : minimiser une fonction U définie sur un espace fini mais trèsgrand.

Soit T > 0 (la température). On pose

πT (x) =e−

1

TU(x)

ZT

,

ZT constante de normalisation (inconnue).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.20

Page 80: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : recuit simul e

But : minimiser une fonction U définie sur un espace fini mais trèsgrand.

Soit T > 0 (la température). On pose

πT (x) =e−

1

TU(x)

ZT

,

ZT constante de normalisation (inconnue).

Lorsque T tend vers 0, πT converge vers la loi uniforme sur l’ensembledes points où U est minimum (minimum global).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.20

Page 81: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : recuit simul e

But : minimiser une fonction U définie sur un espace fini mais trèsgrand.

Soit T > 0 (la température). On pose

πT (x) =e−

1

TU(x)

ZT

,

ZT constante de normalisation (inconnue).

Lorsque T tend vers 0, πT converge vers la loi uniforme sur l’ensembledes points où U est minimum (minimum global).

On simule πT tout en faisant tendre la température vers 0 :

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.20

Page 82: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

Application : recuit simul e

But : minimiser une fonction U définie sur un espace fini mais trèsgrand.

Soit T > 0 (la température). On pose

πT (x) =e−

1

TU(x)

ZT

,

ZT constante de normalisation (inconnue).

Lorsque T tend vers 0, πT converge vers la loi uniforme sur l’ensembledes points où U est minimum (minimum global).

On simule πT tout en faisant tendre la température vers 0 :

on construit une chaine de Markov inhomogène en temps, telle que laloi de Xn tende vers la loi uniforme sur l’ensemble des points où U estminimum (minimum global).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.20

Page 83: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On utilise l’algorithme de Métropolis mais en faisant varier latempérature.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.21

Page 84: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On utilise l’algorithme de Métropolis mais en faisant varier latempérature.

On suppose que Xk = x,pour construire Xk+1 :- on tire y avec la probabilité q(x, ·),- si U(y) ≤ U(x) on prend Xk+1 = y,

- si U(y) > U(x) on prend Xk+1 = y avec probabilité e− 1

Tk(U(y)−U(x)) et

Xk+1 = x avec probabilité 1 − e− 1

Tk(U(y)−U(x)).

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.21

Page 85: Chapitre 3 Mesures stationnaires et théorèmes de …perso-math.univ-mlv.fr/users/cocozza.christiane/doc-pedago-page... · Cela signifie que la chaine de Markov regardée depuis

On utilise l’algorithme de Métropolis mais en faisant varier latempérature.

On suppose que Xk = x,pour construire Xk+1 :- on tire y avec la probabilité q(x, ·),- si U(y) ≤ U(x) on prend Xk+1 = y,

- si U(y) > U(x) on prend Xk+1 = y avec probabilité e− 1

Tk(U(y)−U(x)) et

Xk+1 = x avec probabilité 1 − e− 1

Tk(U(y)−U(x)).

Le fait de se laisser la possibilité de prendre Xk+1 = y même siU(y) > U(x) évite de rester piégé dans des points correspondant à desminima locaux . . . mais il faut que la température Tk ne décroisse pastrop vite vers 0.

Christiane Cocozza-Thivent, Universite de Marne-la-Vallee – p.21