Condition nécessaire et suffisante de convergence en loi...

25
Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins Rémi Servien Laboratoire Jean Kuntzmann INP Grenoble Neuvième Colloque Jeunes Probabilistes et Statisticiens Mai 2010 Le Mont Dore 1 / 19 Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Transcript of Condition nécessaire et suffisante de convergence en loi...

Page 1: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Condition nécessaire et suffisante de convergence en loide l’estimateur des plus proches voisins

Rémi Servien

Laboratoire Jean KuntzmannINP Grenoble

Neuvième Colloque Jeunes Probabilistes et StatisticiensMai 2010

Le Mont Dore

1 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 2: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Plan de la présentation

1 Estimateur classique des kn plus proches voisins

2 Point de Lebesgue et ρ-régularité

3 Indice de régularité

4 Simulations

5 Conclusion

2 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 3: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Estimateur classique des kn plus prochesvoisins

Sn = {X1, ...,Xn} de v.a. iid sur Rd tiré à partir d’une mesure deprobabilité µ

Estimateur de la densité des kn-plus proches voisins :

fkn(x) =kn

nλ(Bkn(x))

où Bkn(x) est la plus petite boule de centre x contenant kn pointsde l’échantillon.

Estimateur convergent

3 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 4: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Théorème (Moore et Yackel, 1977)Si f est continue et à dérivées bornées dans un voisinage de xavec f (x) > 0 et sous les conditions de convergence de fkn

limn→∞

kn =∞ et limn→∞

kn

n= 0

et sous la condition supplémentaire

limn→∞

kn

n2/3 = 0

alors la variable aléatoire

Tn(x) =√

knfkn(x)− f (x)

f (x)

converge vers une loi N (0,1).

4 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 5: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Définitions

x est un point de Lebesgue de la mesure µ si

limδ→0+

µ(Bδ(x))

λ(Bδ(x))= f (x) existe.

x est un point ρ-régulier de la mesure µ si∣∣∣∣µ(Bδ(x))

λ(Bδ(x))− f (x)

∣∣∣∣ ≤ ρ(δ), (1)

où ρ est une fonction mesurable telle que limδ→0+ ρ(δ) = 0(Berlinet et Levallois, 2000).

5 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 6: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

ExempleOn définit, pour x ∈ [−1,1] et x 6= 0, la densité

f1(x) =

√|x |+ 2− cos(1/x) + 2x sin(1/x)

c

−1.0 −0.5 0.0 0.5 1.0

0.2

0.3

0.4

0.5

0.6

x

f 1((x

))

6 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 7: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Exemple

Discontinuité du 2nd ordre en 0.

Maisµ1(Bh(0))

2h=

2c

+23c

h1/2 + o(h1/2)

0 est un point de Lebesgue de la mesure µ1 de densité f1

7 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 8: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Théorème (Berlinet et Levallois, 2000)Sous les conditions de convergence de fkn , si x est un pointρ-régulier de la mesure µ avec f (x) > 0, alors la condition√

knρ(Rn(x))P→ 0

lorsque n tend vers l’infini implique la convergence endistribution de la variable aléatoire

Tn(x) =√

knfkn(x)− f (x)

f (x)

vers une loi N (0,1).

8 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 9: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Indice de régularité

Si en x , point de Lebesgue de la mesure µ, nous avons

µ(Bδ(x))

λ(Bδ(x))= f (x) + Cxδ

αx + o(δαx ) quand δ → 0+, (2)

où Cx 6= 0 et αx > 0.

L’indice αx est appelé indice de régularité de la mesure µ aupoint x .

9 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 10: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Exemple 1

f1(x) =

√|x |+ 2− cos(1/x) + 2x sin(1/x)

c

µ1(Bh(0))

2h=

2c

+23c

h1/2 + o(h1/2)

0 est un point de Lebesgue de la mesure µ1 de densité f1 avecun indice de régularité α0 = 1/2.

10 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 11: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Exemple 2

f2(x) = 1−√

2/3 +√|x | si x ∈ [−0.5,0.5]

−0.4 −0.2 0.0 0.2 0.4

0.6

0.7

0.8

0.9

1.0

1.1

1.2

x

f 2((x

))

Pour µ2(x) on a :

αx = 1 si x 6= 0

αx = 0.5 si x = 0

Caractère très fortement local de l’indice de régularité

11 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 12: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Exemple 3

f3(x) =1

log |x |+ 1− a si x ∈ [−0.5,0.5]\0

= 1− a si x = 0

−0.4 −0.2 0.0 0.2 0.4

0.4

0.6

0.8

1.0

1.2

1.4

1.6

x

f 3((x

))

0 est un point de Lebesguede la mesure µ3

On a ρ-régularité avecρ(δ) = −1/ log δ

Il n’y a pas d’indice derégularité en 0.

12 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 13: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Théorème

Si x est un point de Lebesgue où (2) est vérifié avec f (x) > 0,et sous les conditions de convergence de fkn , la variablealéatoire

Tn(x) =√

knfkn(x)− f (x)

f (x)

converge en loi si et seulement si la suite(k1+1/2αx

n

n

)

a une limite finie κ. Lorsque cette condition est vérifiée, la loiasymptotique de Tn(x) est

N

(Cxκ

αx

2αx

(1

f (x)

)αx+1

,1

).

13 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 14: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Exemple

f2(x) = 1−√

2/3 +√|x | si x ∈ [−0.5,0.5]

Pour µ2(x) on a :

αx = 1 si x 6= 0

αx = 0.5 si x = 0

Sans prendre en compte la spécificité de f2 en 0, on choisitkn =

√n pour n = 10000.

14 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 15: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Exemple

−2 0 2 4 6

0.0

0.1

0.2

0.3

0.4

x=−0.25x=−0.125x=0x=0.125x=0.25

15 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 16: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Simulationsf2(x) = 1−

√2

3 +√|x |, x ∈ [−0.5,0.5]

Hypothèses du théorème : en 0 : kn << n0.5 et kn << n2/3

sinon.

x = −0.25 −0.125 0 0.125kn = n1/3 [0.74 ;1.25] [0.72 ;1.22] [0.34 ;0.55] [0.63,1.06]kn = n2/5 [0.90 ;1.32] [0.66 ;0.96] [0.37 ;0.53] [0.65,0.94]kn = n0.6 [1.02 ;1.05] [0.85 ;0.87] [0.55 ;0.56] [0.85 ;0.88]

f2(x) 1.03 0.88 0.53 0.88

TABLEAU: Estimations de f2 en différents points x pour n = 500000points

16 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 17: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Autre utilisation de l’indice de régularité

Estimateur de la densité des kn-plus proches voisins :

fkn(x) =kn

nλ(Bkn(x)).

Estimateur récursif (Beirlant, Berlinet et Biau (2008)) :

f (r)kn

(x) = fkn(x)− a(d , kn, αx).

17 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 18: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Estimation de f4(x) = 0.5 exp(|x |) en x = 0

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

kn

● ● ●

●● ● ●

●● ● ●

●●

● ●● ●

● ● ●● ●

● ● ● ●●

● ● ●● ●

● ● ● ●● ●

● ●● ● ●

● ● ●● ●

●●

● ● ● ● ●● ●

● ●● ● ●

●●

●●

●● ●

●●

●●

●● ●

●●

●●

●●

●●

●●

●●

●●

18 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 19: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Estimateur classique Point de Lebesgue et ρ-régularité Indice de régularité Simulations Conclusion

Conclusion

Condition nécessaire et suffisante pour la convergence en loi defkn

Problèmes :

Pas d’indice de régularité exact pour certaines fonctionsρ-régulières

Indice de régularité difficile à calculer

Définition inutilisable pour un rapport de mesures d’ensemblesnon centrés au point d’estimation x et n’étant pas forcément desboules

→ Nouvelle définition de l’indice de régularité

19 / 19Condition nécessaire et suffisante de convergence en loi de l’estimateur des plus proches voisins

Page 20: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Nouvelle définition

On définit l’ensemble Ex par

Ex ={α ≥ 0 tel que ∃C > 0,∃λ0 > 0, tels que ∀I ∈ Ix vérifiant λ(I) < λ0

on ait∣∣∣µ(I)λ(I) − f (x)

∣∣∣ ≤ Cλ(I)α}

où Ix est l’ensemble des intervalles contenant x .S’il existe un réel αx vérifiant

αx = sup Ex (1)

alors αx sera l’indice de régularité de la mesure µ au point x .Si sup Ex = +∞ alors nous aurons αx = +∞.

1 / 6Estimation de régularité locale

Page 21: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Exemplef4(x) = 2−cos(1/x)+2x sin(1/x)

c définie sur R pour x ∈ [−1,1]\0avec c = 4 + 2 sin 1 et µ1 sa mesure de probabilité associée.

−1.0 −0.5 0.0 0.5 1.0

0.2

0.3

0.4

0.5

0.6

x

f 4((x

))

2 / 6Estimation de régularité locale

Page 22: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

En 0 :

Point de Lebesgue

ρ-régularité avec ρ(δ) = δ/c

Pas d’indice de régularité exact car

µ4([−h,h])

2h− f4(0) =

1c

h sin(

1h

)

→ Utilisation de la nouvelle définition : α0 = 1

3 / 6Estimation de régularité locale

Page 23: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Théorème

Si x est un point de Lebesgue où (1) est vérifié avec f (x) > 0 etαx ∈ Ex , et sous les conditions de convergence de fkn , lacondition supplémentaire

limn→∞

k1+1/2αxn

n= 0

implique la convergence asymptotique de la variable aléatoire

Tn(x) =√

knfkn (x)− f (x)

f (x)

vers une loi N (0,1).

4 / 6Estimation de régularité locale

Page 24: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Application à l’histogramme

L’histogramme s’écritfh(x) =

νnq

nhn

avec x ∈ Πnq, νnq étant le nombre de points dans la qèmecellule, q ∈ Z et hn un nombre réel positif dépendant de n.Si

limn→∞

hn = 0 et limn→∞

nhn = +∞. (2)

alorsfh(x)

L2→ f (x).

5 / 6Estimation de régularité locale

Page 25: Condition nécessaire et suffisante de convergence en loi ...math.univ-bpclermont.fr/~bahadora/JPS/WEB/EXPOSES/Servien.pdf · Estimateur classique des k n plus proches voisins S n

Théorème

Si x est un point de Lebesgue où (1) est vérifié avec f (x) > 0 etαx ∈ Ex , et sous les conditions (2), la condition supplémentaire

limn→∞

nh2αx+1n = 0

implique la convergence asymptotique de la variable aléatoire

Hn(x) =√

nhnfh(x)− f (x)√

f (x)

vers une loi N (0,1).

6 / 6Estimation de régularité locale