Lecture 04 florent perronnin - large-scale visual recognition with ecplicit embedding

Post on 22-Aug-2015

36 views 2 download

Transcript of Lecture 04 florent perronnin - large-scale visual recognition with ecplicit embedding

𝐹 π‘₯ 𝑦

π‘¦βˆ— = argmax𝑦 𝐹(π‘₯, 𝑦;π‘Š)

𝐹(π‘₯, 𝑦;π‘Š)

𝐹 π‘₯ 𝑦

π‘¦βˆ— = argmax𝑦 𝐹(π‘₯, 𝑦;π‘Š)

β†’

𝐹(π‘₯, 𝑦;π‘Š)

Ξ¦( )Ξ¦( )

Θ( )

Θ( )

π‘Ž 𝑏 Ξ¦ π‘Ž Ξ¦ 𝑏 :

Ξ¦(π‘₯)π‘₯ =

π‘Ž

𝑏

𝑐

Ξ¦(π‘Ž)

Ξ¦(𝑏)

Ξ¦(𝑐)

𝑅𝑑

𝑒 𝑣 Θ 𝑒 Θ 𝑣 :

Θ(𝑦)

𝑒

𝑣

𝑧

Θ(𝑒)

Θ(𝑣)

Θ(𝑧)

𝑦 =

𝑅𝑒

β€’

β€’

β€’

β†’

β€’

β€’

β€’

β†’

β€’

β€’

β†’

β†’

β†’

𝑂(# π‘π‘™π‘Žπ‘ π‘ π‘’π‘ )

β€’

β†’

β€’

β€’

β†’

β€’

β€’

β€’

β€’

β€’

β€’

Ξ¦

β†’

β€’

X = π‘₯1, … , π‘₯𝑇

β€’

π‘₯𝑑 πœ‘ π‘₯𝑑

β€’

1

𝑇 πœ‘ π‘₯𝑑𝑇𝑑=1

β€’ β†’

β€’ πœ‘π‘π‘œπ‘£ π‘₯𝑑 = [0, … , 0, 1, 0, … , 0]

β€’

β†’

𝝋

𝝋

𝝋

𝝋

β€’

𝝋

β€’

β€’

{πœ‡1, … , πœ‡π‘}

X = π‘₯1, … , π‘₯𝑇

β€’ 𝑁𝑁 π‘₯𝑑 = argminπœ‡π‘–π‘₯𝑑 βˆ’ πœ‡π‘–

β€’ 𝑣𝑖 = (π‘₯𝑑 βˆ’ πœ‡π‘–)π‘₯𝑑:𝑁𝑁 π‘₯𝑑 =πœ‡π‘–

β€’ 𝑣𝑖 β„“2

3

x

v1 v2 v3 v4

v5

1

4

2

5

β‘ 

β‘‘

β‘’

𝑣𝑖 = (π‘₯𝑑 βˆ’ πœ‡π‘–)π‘₯𝑑:𝑁𝑁 π‘₯𝑑 =πœ‡π‘–

πœ‘π‘£π‘™π‘Žπ‘‘ π‘₯𝑑 = 0,… , 0, (π‘₯π‘‘βˆ’πœ‡π‘–), 0, … , 0

β€’

β€’

β†’

𝐷

𝑫𝑡

π‘’πœ† π‘₯𝑑

π‘”πœ† (π‘₯𝑑) = π›»πœ† log π‘’πœ†(π‘₯𝑑)

πΉπœ† = 𝐸π‘₯~π‘’πœ† π‘”πœ†(π‘₯)π‘”πœ†(π‘₯)𝑇

𝐾 π‘₯, 𝑧 = π‘”πœ†(π‘₯)π‘‡πΉπœ†βˆ’1π‘”πœ†(𝑧)

πΉπœ† = 𝐸π‘₯~π‘’πœ† π‘”πœ†(π‘₯)π‘”πœ†(π‘₯)𝑇

𝐾 π‘₯, 𝑧 = π‘”πœ†(π‘₯)π‘‡πΉπœ†βˆ’1π‘”πœ†(𝑧)

πΉπœ†βˆ’1 = πΏπœ†

π‘‡πΏπœ†

πœ‘πœ†π‘“π‘£(π‘₯𝑑) = πΏπœ† 𝑔(π‘₯𝑑)

π‘’πœ†

π‘’πœ†(π‘₯) = 𝑀𝑖𝑒𝑖(π‘₯)𝑁

𝑖=1

𝑒𝑖 π‘₯ =1

(2πœ‹)𝐷/2 Σ𝑖1/2 exp βˆ’

1

2(π‘₯ βˆ’ πœ‡π‘–)′Σ𝑖

βˆ’1(π‘₯ βˆ’ πœ‡π‘–) β†’

πœ† = 𝑀𝑖 , πœ‡π‘– , Σ𝑖 , 𝑖 = 1…𝑁

Σ𝑖 = π‘‘π‘–π‘Žπ‘”(πœŽπ‘–2)

β†’ 𝑀𝑖 , πœ‡π‘– πœŽπ‘–

𝛾𝑑(𝑖) π‘₯𝑑 𝑖

πœ‘π‘€ π‘₯𝑑 =𝛾𝑑(1)

𝑀1, … ,𝛾𝑑(𝑁)

π‘€π‘πœ‘π‘π‘œπ‘£ π‘₯𝑑 = [0,… , 0, 1, 0, … , 0]

β†’

πœ‘πœ‡ π‘₯𝑑 = 𝛾𝑑 1

𝜎1 𝑀1π‘₯𝑑 βˆ’ πœ‡1 , … ,

𝛾𝑑 1

𝜎1 𝑀𝑁π‘₯𝑑 βˆ’ πœ‡π‘ πœ‘π‘£π‘™π‘Žπ‘‘ π‘₯𝑑 = 0,… , (π‘₯π‘‘βˆ’πœ‡π‘–), … , 0

β†’

πœ‘πœŽ π‘₯𝑑 = 𝛾𝑑 1

2𝑀1

π‘₯π‘‘βˆ’πœ‡12

𝜎12βˆ’ 1 ,… ,

𝛾𝑑 𝑁

2𝑀𝑁

π‘₯π‘‘βˆ’πœ‡π‘2

πœŽπ‘2βˆ’ 1

β†’

β†’ πœ‘πœ‡ πœ‘πœŽ β†’ πŸπ‘«π‘΅

πœ‘π‘π‘œπ‘£ π‘₯ = [0,… , 0, 1, 0,… , 0]

π‘€π‘‡πœ‘π‘π‘œπ‘£(π‘₯)

πœ‘π‘π‘œπ‘£ π‘₯ = [0,… , 0, 1, 0,… , 0]

π‘€π‘‡πœ‘π‘π‘œπ‘£(π‘₯)

β†’

πœ‘π‘£π‘™π‘Žπ‘‘ π‘₯ = 0,… , (π‘₯ βˆ’ πœ‡π‘–), … , 0

π‘€π‘‡πœ‘π‘£π‘™π‘Žπ‘‘(π‘₯)

πœ‘π‘£π‘™π‘Žπ‘‘ π‘₯ = 0,… , (π‘₯ βˆ’ πœ‡π‘–), … , 0

π‘€π‘‡πœ‘π‘£π‘™π‘Žπ‘‘(π‘₯)

β†’

πœ‘π‘“π‘£ π‘₯𝑑 = … ,𝛾𝑑 𝑖

πœŽπ‘– 𝑀𝑖π‘₯𝑑 βˆ’ πœ‡π‘– ,

𝛾𝑑 𝑖

2𝑀𝑖

π‘₯𝑑 βˆ’ πœ‡π‘–2

πœŽπ‘–2βˆ’ 1 ,…

π‘€π‘‡πœ‘π‘“π‘£(π‘₯)

πœ‘π‘“π‘£ π‘₯𝑑 = … ,𝛾𝑑 𝑖

πœŽπ‘– 𝑀𝑖π‘₯𝑑 βˆ’ πœ‡π‘– ,

𝛾𝑑 𝑖

2𝑀𝑖

π‘₯𝑑 βˆ’ πœ‡π‘–2

πœŽπ‘–2βˆ’ 1 ,…

π‘€π‘‡πœ‘π‘“π‘£(π‘₯)

β†’

β†’

β€’

β„“2β€’

𝑧 𝑠𝑖𝑔𝑛 𝑧 𝑧 𝛼 0 ≀ 𝛼 ≀‒

β†’ 𝛼 = 1/2

πœ† = 𝑀𝑖 , πœ‡π‘– , Σ𝑖 , 𝑖 = 1…𝑁

X = π‘₯1, … , π‘₯𝑇‒ π‘₯𝑑:

β€’ 𝛾𝑑 𝑖 =𝑀𝑖𝑒𝑖 π‘₯𝑑

π‘€π‘˜π‘’π‘˜ π‘₯π‘‘π‘π‘˜=1

β€’ πœ‘πœ‡ += … ,𝛾𝑑 𝑖

πœŽπ‘– 𝑀𝑖π‘₯𝑑 βˆ’ πœ‡π‘– , …

πœ‘πœŽ += … ,𝛾𝑑 𝑖

2𝑀𝑖

π‘₯π‘‘βˆ’πœ‡π‘–2

πœŽπ‘–2 βˆ’ 1 ,…

β€’ β„“2

β€’

β€’

β€’

β€’

β€’

β€’

β†’

β€’

β€’

β€’

β†’

β€’

β†’

β€’

β€’

β†’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

𝑒

𝑣

𝑧

Θ(𝑒)

Θ(𝑏)

Θ(𝑐)

𝑅𝑒

𝒴 = 1,… , π‘˜

Θ 𝑦 = [0,… , 0, 1, 0, … , 0]

β€’ {βˆ’1,+1} 𝐡(1/2)

β€’

β€’

β†’

β€’ {βˆ’1,+1} 𝐡(1/2)

β€’

β€’

β€’

β€’

βˆ’1…+1

+1…+1

+1β€¦βˆ’1

β€’ {βˆ’1,+1} 𝐡(1/2)

β€’

β€’

β€’

β€’

β€’

β€’

β†’

Θ 6 =

β†’

7 Γ— 5

1 = 2 = 3 = 𝐴 = 𝐡 =

7 Γ— 5

β€’ β†’

β€’

1 = 2 = 3 = 𝐡 =

Θ 𝑦 = Ξ¦(π‘ π‘¦π‘›π‘‘β„Žπ‘’π‘ π‘–π‘  𝑦 )

𝐴 =

𝑛 Γ— π‘˜ π‘Œ

β†’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

𝐹

π‘¦βˆ— = argmax𝑦 𝐹(π‘₯, 𝑦;π‘Š)

Ξ¦(π‘₯) ∈ 𝑅𝑑 Θ(𝑦) ∈ 𝑅𝑒

𝒅 β‰  𝒆

𝐹(π‘₯, 𝑦;π‘Š)

Ξ¦( )Ξ¦( )

Θ( )

Θ( )

𝑀𝑦 𝑑 = 𝑒

𝐹 π‘₯, 𝑦 = 𝑀𝑦𝑇Φ π‘₯

β€’ π‘Š = 𝑀1 , … , π‘€π‘˜ 𝑑 Γ— π‘˜ π‘˜

β€’ Θ(𝑦) Θ 𝑦 = [0, … , 0, 1, 0, … , 0]𝑇

𝐹 π‘₯, 𝑦;π‘Š = [ Ξ¦ π‘₯ 𝑇 ] π‘Š Θ(𝑦)

𝑑 β‰  𝑒:

𝐹 π‘₯, 𝑦;π‘Š = [ Ξ¦ π‘₯ 𝑇 ] π‘Š Θ(𝑦)

π‘Š 𝑑 Γ— 𝑒

β†’

β†’ π‘Š

𝑑 β‰  𝑒:

𝐹 π‘₯, 𝑦;π‘Š = [ Ξ¦ π‘₯ 𝑇 ] π‘Š Θ(𝑦)

π‘Š 𝑑 Γ— 𝑒

β€’ 𝐹 π‘₯, 𝑦;π‘Š = βˆ’| π‘Šπ‘‡Ξ¦ π‘₯ βˆ’ Θ 𝑦 |2

β€’ 𝐹 π‘₯, 𝑦;π‘Š = βˆ’| Ξ¦ π‘₯ βˆ’π‘ŠΞ˜ 𝑦 |2

β†’

U π‘Š π‘Š = π‘ˆπ‘‡π‘‰

β€’ π‘ˆ π‘Ÿ Γ— 𝑑

β€’ 𝑉 π‘Ÿ Γ— 𝑒

𝐹 π‘₯, 𝑦;π‘Š = Ξ¦ π‘₯ π‘‡π‘ŠΞ˜(𝑦)

𝐹 π‘₯, 𝑦; π‘ˆ, 𝑉 = π‘ˆΞ¦ π‘₯π‘‡π‘‰Ξ˜ 𝑦 = Ξ¦β€² π‘₯ π‘‡Ξ˜β€² 𝑦

Ξ¦β€² π‘₯ = π‘ˆΞ¦ π‘₯ Ξ˜β€² 𝑦 = π‘‰Ξ˜ 𝑦

β†’ π‘Ÿ

β†’

π‘Ÿ β‰ͺ 𝑑, 𝑒

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β†’

β€’

β€’

β€’ Ξ¨ π‘₯, 𝑦 = Ξ¦ π‘₯ βŠ— Θ 𝑦 𝑑𝑒

β€’ 𝑀 𝑑𝑒 π‘Š

𝐹 π‘₯, 𝑦;π‘Š = Ξ¦ π‘₯ π‘‡π‘ŠΞ˜ 𝑦 = 𝑀𝑇Ψ π‘₯, 𝑦

β†’

β†’

Θ = [Θ 1 ,… , Θ π‘˜ 𝑒 Γ— π‘˜

𝐹 π‘₯, . ;π‘Š = Ξ˜π‘‡(Ξ¦ π‘₯ π‘‡π‘Š)

β†’

Ξ¦(π‘₯) 𝑧 = π‘Šπ‘‡Ξ¦ π‘₯ Ξ˜π‘‡π‘§

π‘Š Θ

Θ = [Θ 1 ,… , Θ π‘˜ 𝑒 Γ— π‘˜

𝐹 π‘₯, . ;π‘Š = Ξ˜π‘‡(Ξ¦ π‘₯ π‘‡π‘Š)

β†’

β€’

Ξ¦(π‘₯) 𝑧 = 𝝈(π‘Šπ‘‡Ξ¦ π‘₯ ) Ξ˜π‘‡π‘§

π‘Š Θ

Θ = [Θ 1 ,… , Θ π‘˜ 𝑒 Γ— π‘˜

𝐹 π‘₯, . ;π‘Š = Ξ˜π‘‡(Ξ¦ π‘₯ π‘‡π‘Š)

β†’

β€’

β€’

β†’

Ξ¦(π‘₯) 𝑧 = 𝝈(π‘Šπ‘‡Ξ¦ π‘₯ ) Ξ˜π‘‡π‘§

π‘Š Θ

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β†’ π‘Š

β€’

β†’ π‘Š Θ

𝚯 π‘Š

π‘Š

β†’

𝚯 π‘Š

π‘Š

β†’

𝚯 π‘Š

argmaxπ‘Š1

𝑛 𝐹(π‘₯𝑖 , 𝑦𝑖𝑛

𝑖=1;π‘Š)

π‘Š

𝐹 π‘₯, 𝑦;π‘Š = βˆ’| π‘Šπ‘‡Ξ¦ π‘₯ βˆ’ Θ 𝑦 |2 𝐹 π‘₯, 𝑦;π‘Š = βˆ’| Ξ¦ π‘₯ βˆ’π‘ŠΞ˜ 𝑦 |2

β†’

𝐹 π‘₯, 𝑦; π‘ˆ, 𝑉 = βˆ’| π‘ˆΞ¦ π‘₯ βˆ’ π‘‰Ξ˜ 𝑦 |2

β†’

𝚯 π‘Š

π‘₯ = , 𝑦+ = , π‘¦βˆ’ =

𝐹 π‘₯, 𝑦+;π‘Š > 𝐹 π‘₯, π‘¦βˆ’;π‘Š

β†’

𝚯 π‘Š

β„“ π‘₯, 𝑦;π‘Š = max𝑗 Ξ” 𝑦, 𝑦𝑗 βˆ’ 𝐹 π‘₯, 𝑦;π‘Š + 𝐹 π‘₯, 𝑦𝑗;π‘Š

Ξ” 𝑦, 𝑦𝑗 𝑦 𝑦𝑗‒ 𝑦 = 𝑦𝑗 𝑦 β‰  𝑦𝑗

β€’

β†’ arg maxπ‘Š1

𝑛 β„“(π‘₯𝑖 , 𝑦𝑖𝑛𝑖=1 ;π‘Š)

π‘Š

𝚯 π‘Š

β„“ π‘₯, 𝑦;π‘Š = max 0, Ξ” 𝑦, 𝑦𝑗 βˆ’ 𝐹 π‘₯, 𝑦;π‘Š + 𝐹 π‘₯, 𝑦𝑗;π‘Šπ‘˜π‘—=1

𝚯 π‘Š

β„“ π‘₯, 𝑦;π‘Š = max 0, Ξ” 𝑦, 𝑦𝑗 βˆ’ 𝐹 π‘₯, 𝑦;π‘Š + 𝐹 π‘₯, 𝑦𝑗;π‘Šπ‘˜π‘—=1

𝑦 = , π‘₯+ = , π‘₯βˆ’ =

𝐹 π‘₯+, 𝑦;π‘Š > 𝐹 π‘₯βˆ’, 𝑦;π‘Š

𝚯 π‘Š

Ξ” 𝑦+, π‘¦βˆ’ βˆ’ 𝐹 π‘₯, 𝑦+;π‘Š + 𝐹 π‘₯, π‘¦βˆ’;π‘Š = Ξ” 𝑦+, π‘¦βˆ’ βˆ’ π‘₯π‘‡π‘Š 𝑦+ βˆ’ π‘¦βˆ’

β†’

π‘Š 𝚯

β€’

β€’

π‘Š 𝚯

arg maxπ‘Š,Θ1

𝑛 β„“(π‘₯𝑖 , 𝑦𝑖𝑛

𝑖=1;π‘Š, Θ) +

πœ†

2Θ βˆ’ Ξ˜π‘π‘Ÿπ‘–π‘œπ‘Ÿ

2

β†’

β€’ Θ = Ξ˜π‘π‘Ÿπ‘–π‘œπ‘Ÿ π‘Š

β€’ Θ π‘Š

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β†’

β€’

β†’

β€’

β†’

β†’

β†’

β†’

β€’

β€’

β†’

β€’

β€’

β€’

β†’

β†’

β†’

β†’

β€’

β€’

β†’

β†’

β†’

β†’

β†’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

β€’

∞