<Taskonomy>๊ฐ ๋ญ๋?
Taskonomy๋ ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ ๋ค์ํ ์์ ๊ฐ์ ์ํธ ์์กด์ฑ์ ํ๊ตฌํ๊ณ , ์ด๋ฅผ ํตํด ๋ฒ์ฉ ๋น์ ์์คํ ์ ๊ตฌ์ถํ๋ ์ฐ๊ตฌ.
Taskonomy๋ ๋ค์ํ ์์ ๋ค์ ์ํํ๊ธฐ ์ํด ํ์ํ ์๊ฐ์ ํน์ง๋ค์ด ์๋ก ๊ณต์ ๋ ์ ์๋์ง๋ฅผ ์กฐ์ฌํ๊ณ , ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ํ์ต ํจ์จ์ฑ๊ณผ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ ์ ์ด ํ์ต ๋ฐฉ๋ฒ์ ํ๊ตฌ.
Taskonomy์ ๋ชฉํ๋ ๋ค์ํ ์์ ๋ค ๊ฐ์ ๊ณต์ ๊ฐ๋ฅํ ์๊ฐ์ ํน์ง์ ํ์ํ์ฌ, ์์ ๊ฐ์ ํ์ต๊ณผ ์ผ๋ฐํ๋ฅผ ๊ฐ์ ํ๊ณ ์์ ์ ํ์ ๋ฐ๋ฅธ ๋น์ฉ๊ณผ ๋ ธ๋ ฅ์ ์ต์ํํ๋ ๊ฒ.
โป Transferability๋?
- ํ ์์ ์์ ํ์ตํ ์ง์์ด ๋ค๋ฅธ ๊ด๋ จ ์์ ์ ์ ์ฉ ๊ฐ๋ฅํ ์ ๋๋ฅผ ๋ํ๋ด๋ ๊ฐ๋
- ์ฆ, ํ ์์ ์์ ์ป์ ํ์ต ๊ฒฐ๊ณผ๋ ๋ชจ๋ธ์ด ๋ค๋ฅธ ์์ ์๋ ์ ์ฉ๋ ์ ์๋ ๋ฅ๋ ฅ์ ์๋ฏธํจ
0. Abstract
- ์ฌ๋ฌ Visual Task(detection, depth estimation, edge detection) ๋ฑ์ ์๋ก ์ฐ๊ด์ฑ, ์์กด์ฑ์ด ์๋ค๋ ๊ฐ์ ํ์ ๋ ผ๋ฌธ์ด ์์๋จ ⇒ transfer learning์ ๊ธฐ๋ณธ ๊ฐ๋ ์.
- ๋ ผ๋ฌธ์์๋ ์์กด์ฑ ์ฐพ๋ ๊ฒ์ ํตํด, transfer learning ์ ๋ํ ๊ณ์ฐ์ ์ธ ๋ถ๋ฅ๋ ‘Taskonomy’๋ฅผ ์ค๋ช ํจ
1. Introduction
- ์ค๋๋ ์ vision ๋ถ์ผ์์ ๋ค๋ค์ง๋ task๋ค์ classification, depth estimation(๊น์ด ์ถ์ ), edge detection(๊ฒฝ๊ณ์ ๊ฒ์ถ), pose estimation(ํฌ์ฆ ์ถ์ ) ๋ฑ ๋ค์ํจ
- ์ด๋ฌํ task๋ค์ ์๋ก ๊ฐ์ ๊ฐ์ง๊ณ ์๋ ์ ๋ณด๋ค์ด ์ ์ฌํด์ ๊ณต์ ๋ task๋ ๋ถ๋ช ํ ์์ํ ๋ฐ, ๊ฐ๊ฐ ํ์ต์ํค๋ฉด ๋ญ๋น ์๋๊ฐ์ ๋ํ ์๋ฌธ์ ์ด ์๊นโก๏ธ ์๋ก ๋ค๋ฅธ task๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ๊ทธ๋ํ ํํ๋ก ํํํ๊ณ , ์ด๋ฅผ ์ด์ฉํด ์๋ก์ด task์ ๋ํ ๋ชจ๋ธ์ ํ์ต์ ๋ณด๋ค ํจ์จ์ ์ผ๋ก ํ์ต์ํฌ ์ ์๋ ๋ฐฉ์์ ์ ์ํจ

- Target Task๋ฅผ ๋จ๋ ์ผ๋ก ํ์ตํ์ ๋ ๋๋น ์ฑ๋ฅ์ด ํฅ์๋ ์์ค์ ‘Transferability’ ์ฒ๋๋ก ์ธก์ ํ๊ณ , Task ๊ฐ์ ๊ด๊ณ๋ฅผ ์ ์ฌ๋ํ๋ ฌ(affinity matrix)๋ก ํํํ ํ, Target Task์ ๋ํ ์ต์ ์ Transfer policy๋ฅผ ์ฐพ์๋ ( ๋ชจ๋ ๊ณผ์ ์ ๊ฐ task์ ๋ํ prior knowledge๊ฐ ๊ฐ์ ์ํ๋๋ก ๊ตฌ์ฑ๋จ )โก๏ธ ๊ฒฐ๋ก ์ ์ผ๋ก ๋น์ฉ์ด ์ ๊ฒ ๋ค๊ณ , ์ผ๋ฐ์ ์ธ ๋ฐ์ดํฐ์ ์ ์ ํจํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค
2. Related Work
Taskonomy ๋ฐฉ๋ฒ๊ณผ ๊ด๋ จ๋ ๋งค์ฐ ๋ค์ํ ๊ด๋ จ ์ฐ๊ตฌ ์ฃผ์ ๋ค์ด ์กด์ฌ.
Self-Supervised Learning
- ๋ ์ด๋ธ์ด ์๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ชจ๋ธ์ ํ์ต์์ผ์ ๊ฐ์ง ๋ ์ด๋ธ ์์ฑ
- ๋ ์ด๋ธ๋ง ๋น์ฉ์ด ์๋์ ์ผ๋ก ๋ฎ์ task๋ก๋ถํฐ ํ์ตํ ์ ๋ณด๋ฅผ ํ์ฉํ์ฌ, ๊ทธ์ ๋ด์ฌ์ ์ผ๋ก ๊ด๋ จ๋์ด ์์ผ๋ฉด์ ๋ ์ด๋ธ๋ง ๋น์ฉ์ด ๋ ๋์ task์ ๋ํ ํ์ต์ ์๋ํ๋ ๋ฐฉ๋ฒ
- source task๋ฅผ ์ฌ์ ์ ์ฌ๋์ด ์๋์ผ๋ก ์ง์ ํด์ค์ผ ํ๋ค๋ ์ธก๋ฉด์์, Taskonomy ๋ฐฉ๋ฒ๊ณผ ์ฐจ์ด๊ฐ ์กด์ฌ
Unsupervised Learning
- ๋ ์ด๋ธ์ด ์๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ตํ๋ ๋ฐฉ๋ฒ์ผ๋ก, ๋ช ์์ ์ธ ์ง๋๋ ๋ ์ด๋ธ ์์ด ๋ฐ์ดํฐ์ ํจํด๊ณผ ๊ตฌ์กฐ๋ฅผ ๋ฐ๊ฒฌ
- (๋ ์ด๋ธ์ด ์๋ ์ํฉ์์) ๋ฐ์ดํฐ์ ์์ฒด์ ๊ณตํต์ ์ผ๋ก ๋ด์ฌ๋์ด ์๋ ์์ฑ์ ํํํ๋ feature representation์ ์ฐพ์๋
- Taskonomy ๋ฐฉ๋ฒ์ ๊ฒฝ์ฐ ๊ฐ task ๋ณ ๋ ์ด๋ธ์ ๋ช ์์ ์ผ๋ก ํ์๋ก ํจ.
Meta-Learning
- ๋ชจ๋ธ์ด ํ์ต ๋ฐฉ๋ฒ์ ํ์ตํ๋ ํ์ต ์ ๊ทผ ๋ฐฉ์์ผ๋ก, ๋ค์ํ ๊ณผ์ ๋ถํฌ์์ ์ง์์ด๋ ์ฌ์ ์ ๋ณด๋ฅผ ์ต๋ํ์ฌ ์๋ก์ด ๊ณผ์ ์ ๋ํ ์ผ๋ฐํ์ ์ ์ ๋ฅ๋ ฅ์ ํฅ์์ํค๋ ๊ฒ
- ๋ชจ๋ธ ํ์ต์ ์์ ๋ ๋ฒจ(meta-level)์์์ ์ข ๋ ‘์ถ์ํ๋’ ๊ด์ ์ผ๋ก ์กฐ๋ช ํ๊ณ ๋ชจ๋ธ์ ๋ ํจ๊ณผ์ ์ผ๋ก ํ์ตํ๊ธฐ ์ํ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ ์ฐพ์
- ๋ณต์ ๊ฐ์ task๋ค ๊ฐ์ transferability๋ฅผ ์ข ๋ meta-level์์ ์กฐ๋งํ๋ฉด์ ์ด๋ค์ structure๋ฅผ ์ฐพ๊ธฐ ์ํ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค๋ ์ ์์, Taskonomy ๋ฐฉ๋ฒ๊ณผ ์ผ์ข ์ ๊ณตํต์ ์ด ์กด์ฌ
Multi-Task Learning
- ์ ๋ ฅ ๋ฐ์ดํฐ๊ฐ ํ๋๋ก ์ ํด์ ธ ์์ ๋ ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ฌ๋ฌ task๋ค์ ๋ํ ์์ธก ๊ฒฐ๊ณผ๋ค์ ๋์์ ์ถ๋ ฅํ ์ ์๋๋ก ํ๋ ๋ฐฉ๋ฒ์ ์ฐ๊ตฌํ๋ ์ฃผ์
- Taskonomy ๋ฐฉ๋ฒ์ ๋ task๋ค ๊ฐ์ ๊ด๊ณ๋ฅผ ๋ช ์์ ์ผ๋ก ๋ชจ๋ธ๋งํจ
Domain Adaptation
- transfer learning์ ํํ๋ก, task๋ ๋์ผํ์ง๋ง, ์ ๋ ฅ ๋ฐ์ดํฐ์ domain์ด ํฌ๊ฒ ๋ฌ๋ผ์ง๋ ๊ฒฝ์ฐ(source domain -> target domain) ์ต์ ์ transfer policy๋ฅผ ์ฐพ๊ธฐ ์ํ ์ฐ๊ตฌ ์ฃผ์
- Taskonomy์ ๊ฒฝ์ฐ, domain์ด ์๋ task๊ฐ ๋ฌ๋ผ์ง๋ ๊ฒฝ์ฐ๋ฅผ ๊ฐ์
Learning Theoretic
- ๋ชจ๋ธ์ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋ณด์ฅํ๊ธฐ ์ํ ๋ฐฉ๋ฒ
- ์์ ์ฃผ์ ๋ค๊ณผ ์กฐ๊ธ์ฉ ๊ฒน์นจ
- ์์ ๋ฐฉ์๋ค์ ๋๋ถ๋ถ ๊ณ์ฐ์ด ๋ถ๊ฐ๋ฅํ ๊ณ์ฐ์ ํฌํจํจ
- ํน์ ๋ถ๊ฐ๋ฅํ ๊ณ์ฐ์ ํผํ๊ธฐ ์ํด task์ ๋ง์ ์ ํ์ ๋์์
- Taskonomy๋ ์์ ๋ฐฉ์์ผ๋ก๋ถํฐ ์๊ฐ์ ์ป์์ผ๋, ์ด๋ก ์ ์ฆ๋ช ์ ํผํ๊ณ ์ค์ฉ์ ์ธ ์ ๊ทผ์ผ๋ก ์๋ํจ
3. Method
Source Task๊ฐ ๊ฐ์ ๊ณ ์์ด์ ์ด๋ฏธ์ง ๋ถ๋ฅ ์์ ์ด๋ผ๊ณ ๊ฐ์ ํด๋ณด์. ์ด ์์ ์์ ๋ชจ๋ธ์ ์ฃผ์ด์ง ์ด๋ฏธ์ง๊ฐ ๊ฐ์ธ์ง ๊ณ ์์ด์ธ์ง๋ฅผ ํ๋ณํ๋ ๋ฐฉ๋ฒ์ ํ์ตํ ๊ฒ์. ๊ทธ๋ฆฌ๊ณ Target Task๋ก๋ ๊ฐ์ ์ผ๊ตด ๊ฒ์ถ ์์ ์ ํ๋ค๊ณ ๊ฐ์ . ์ด ์์ ์์๋ ์ด๋ฏธ์ง ๋ด์์ ๊ฐ์ ์ผ๊ตด ์์ญ์ ์ฐพ์๋ด๋ ๊ฒ์ ๋ชฉํ๋ก ํ ๊ฒ์.
Source Task์ธ ๊ฐ์ ๊ณ ์์ด์ ์ด๋ฏธ์ง ๋ถ๋ฅ ์์ ์์ ํ์ต๋ ๋ชจ๋ธ์ ์ด๋ฏธ์ง์ ํน์ง๊ณผ ํจํด์ ํ์ ํ๋ ๋ฐ ๋ฅ์ํด์ ธ์์. ์ด๋ฌํ ์ง์์ Target Task์ธ ๊ฐ์ ์ผ๊ตด ๊ฒ์ถ ์์ ์๋ ์ ์ฉํ ์ ์์. ์๋ฅผ ๋ค์ด, ๊ฐ์ ์ผ๊ตด์ ๊ฐ ์ด๋ฏธ์ง์์ ํน์ ํ ๋ชจ์๊ณผ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๊ณ , Source Task์์ ํ์ต๋ ๋ชจ๋ธ์ ์ด๋ฏธ์ง์์ ์ด๋ฌํ ํน์ง์ ์ ์ดํดํ๊ณ ์์ ๊ฒ์.
๋ฐ๋ผ์, Source Task์์ ํ์ต๋ ๋ชจ๋ธ์ ๊ฐ์ ธ์์ Target Task์ ์ ์ฉํ๋ฉด, ๊ฐ์ ์ผ๊ตด์ ๊ฒ์ถํ๋ ๋ฅ๋ ฅ์ ํฅ์์ํฌ ์ ์๋ค. Source Task์์ ํ์ตํ ์ด๋ฏธ์ง ๋ถ๋ฅ ์์ ์ ํตํด ์ป์ ์ง์์ ํ์ฉํ์ฌ Target Task์ธ ๊ฐ์ ์ผ๊ตด ๊ฒ์ถ ์์ ์์ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ ๊ฒ์ ๋งํจ. ์ฆ, Source Task์ Target Task๋ ์๋ก ๋ค๋ฅธ ์์ ์ด์ง๋ง, Source Task์์ ์ป์ ์ง์์ Target Task์ ์ ์ฉํ์ฌ ์ ์ด(transfer)ํ๋ ๊ฒ์ด ๋ฐ๋ก Taskonomy์ ํต์ฌ ๊ฐ๋ .
โป Taskonomy๋
: ์ฃผ์ด์ง Task Dictionary์์ Task ๊ฐ์ Transferability๋ฅผ ๋ํ๋ธ, ๊ณ์ฐ์ ์ผ๋ก ๋์ถ์ด ๊ฐ๋ฅํ Hypergraph
โป Hypergraph๋
: ํ๋์ edge๊ฐ ์ฌ๋ฌ Node๋ฅผ ์ฐ๊ฒฐํ ์ ์๋ ๊ทธ๋ํ (๋จ์ํ)
โก๏ธ ํ๋์ target task์ ์ฌ๋ฌ source task๊ฐ ์ฐ๊ฒฐ๋ผ์, ์ฑ๋ฅ ๊ทน๋ํ๋ฅผ ์ํด ์ฌ์ฉํ ์ ์๋ค๊ณ ํจ.

Taskonomy ๋ฐฉ๋ฒ ( ์ด 4๋จ๊ณ)
2. ์ง์ ๋ Transfer Order k ํ์์, ์๋ก ๊ฐ์ ์กฐํฉ ์ฐ์ฐ์ ํตํด ๋ง๋ค์ด์ง๋ source task(s) -> target task ์ ๊ฐ ์กฐํฉ ๋ณ transferability๊ฐ ์์นํ๋ ํํ๋ก ๊ณ์ฐ
3. 2๋ฒ์์ ๊ณ์ฐ๋ transferability์ ๋ํ ์ ๊ทํ๋ฅผ ํตํด affinity matrix๋ฅผ(์ ์ฌ๋ ํ๋ ฌ) ์ป์
4. ๊ฐ transfer policy๋ฅผ ํ์ํด์ ์ต์ ์ ์ฑ๋ฅ์ ๋ณด์ด๋ transfer policy๋ฅผ ์ฐพ์
โป Transfer Policy๋
: ๋ชจ๋ธ์ด ํ ์์ ์์ ํ์ตํ ์ง์์ ๋ค๋ฅธ ์์ ์ ์ ๋ฌํ๊ณ ํ์ฉํ๋ ๋ฐฉ๋ฒ์ ๊ฒฐ์ ํ๋ ์ ์ฑ ์ด๋ ์ ๋ต์ ์๋ฏธ
- ๋ณธ ๋ ผ๋ฌธ์์๋ Computer vision์์ ์ผ๋ฐ์ ์ผ๋ก ๋ค๋ฃจ๋ 26๊ฐ์ง์ task๋ฅผ ์ ์.
- Datasets: ์คํ์ ์ฐ์ธ ๋ฐ์ดํฐ์ ์ ๋ณธ์ธ๋ค์ด ์ง์ ์ ์. 600๊ฐ ๊ฑด๋ฌผ์ ์ค๋ด ์ฅ๋ฉด์ ๋ํ 400๋ง ๊ฐ์ ์ด๋ฏธ์ง ๋ฐ์ดํฐ์ ์ ์์ฑ, ์ด ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ 26๊ฐ์ง task์ ๋ํ ๋ ์ด๋ธ๋ง์ ๋ชจ๋ ์ํํจ.
3.1. Step I: Task-Specific Modeling (์์ ๋ณ ๋ชจ๋ธ๋ง)
- ๊ฐ Task-specific network๋ ๊ณตํต์ ์ผ๋ก encoder-decoder ๊ตฌ์กฐ๋ฅผ ์ง๋
โป ์ธ์ฝ๋๋ ๊ฐ๋ ฅํ ํํ์ ์ถ์ถํ๊ธฐ์ ์ถฉ๋ถํ ํฌ๊ณ , ๋์ฝ๋๋ ์ข์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ธฐ์ ์ถฉ๋ถํ ํฌ์ง๋ง ์ธ์ฝ๋๋ณด๋ค ํจ์ฌ ์๋ค๊ณ ํจ

3.2. Step II: Transfer Modeling


- ft(I): ์ ๋ ฅ ์ด๋ฏธ์ง I์ ๋ํ target task t์ Ground Truth
- L(t): ํด๋น task์ loss function
- D(s→t)์ ์ฑ๋ฅ์ด ์ข์์๋ก ๋ task s,t ๊ฐ์ transferability๊ฐ ๋์
- ๋ชจ๋ (s,t) ์กฐํฉ์ ๋ํ readout Function์ ๋ชจ๋ ๊ตฌํจ
- ์ด๋, ์ฌ๋ฌ source task๊ฐ target task๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ณด์์ ์ธ ์ ๋ณด๋ฅผ ํฌํจํ ์ ์์ (ํ๋์ ์ ๋ณด๋ณด๋ค๋ ์ฌ๋ฌ ์ ๋ณด๋ค์ ํตํด ๋ค์ํ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ฉด ์ฑ๋ฅ ์ฌ๋ฆด ์ ์๋ค๋ ๋ง)
- k๊ฐ ์ปค์ง์๋ก ์ ์ฒด ์กฐํฉ ๊ฒฝ์ฐ ์๋ ๋์ด๋๊ฒ ์ฃ ?
- TT x sCk_sC_k : ๋ชจ๋ target task์ ๋ํ ์ ์ฒด ์กฐํฉ ๊ฒฝ์ฐ์ ์โก๏ธ ํ์ง๋ง, ๊ณ์ฐ๋์ด ๋ฐฉ๋ํด์ง

- ์๋ฅผ ๋ค์ด, s=7, t=1, k=2๋ก ์ค์ ํ ๊ฒฝ์ฐ,
๊ฐ์ ์กฐํฉ์ด ๋์ฌ ๊ฒ์ด๊ณ , 5๊ฐ๋ง์ ๊ฐ์ ธ๊ฐ๋ค๊ณ ํ๋ฉด, 5C2์ด๋ฏ๋ก 10๊ฐ์ ์กฐํฉ์ ๊ฑธ์น๊ฒ ๋จ
(s1,s2~s5), (s2,s3~s5), (s3,s4~s5), (s4,s5) → ์ด 10๊ฐ์ง
3.3. Step III: Ordinal Normalization using Analytic Hierarchy Process (AHP)
- Target task์ ๋ฐ๋ผ Loss์ ๋ฒ์๊ฐ ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ Ordinal ์ ๊ทผ๋ฒ์ ์ฌ์ฉํ์ฌ ์ ๊ทํ ์ํ
โป [0,1] ๋ฒ์๋ก ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ์ง ์๋ ์ด์
- Loss ๊ฐ์ ๊ฐ์์ ๋ฐ๋ฅธ ์ค์ ์ฒด๊ฐ๋๋ ์์ธก ๊ฒฐ๊ณผ ํ์ง์ ์ฆ๊ฐ ์๋๋ task ๋ณ๋ก ์ฐจ์ด๊ฐ ์กด์ฌํ๋ค๊ณ ํจโก๏ธ ๋จ์ํ normalizeํ๋ ๊ฒ๋ง์ผ๋ก๋ ๋ชจ๋ target task๋ค์ ๋์ผ ์ ์์์ ์ปค๋ฒํ๊ธฐ์ ์ถฉ๋ถํ์ง ์์
โป ์ Target task๋ง๋ค Loss ๋ฒ์๊ฐ ๋ค๋ฅธ๊ฐ?
- ํด์ ๊ณต๊ฐ์ ๋ณต์ก์ฑ: target task์ ๋ฐ๋ผ ๊ฐ๋ฅํ ํด์ ๊ณต๊ฐ์ด ๋ค์ํ๊ณ ๋ณต์ก์ฑ์ด ๋ฌ๋ผ์ง. ์ผ๋ถ ํ์คํฌ์์๋ ํด์ ๊ณต๊ฐ์ด ์๋์ ์ผ๋ก ์๊ณ ๋จ์ํ ์ ์์ง๋ง, ๋ค๋ฅธ ํ์คํฌ์์๋ ๋งค์ฐ ํฌ๊ณ ๋ณต์กํ ๊ณต๊ฐ์ผ ์ ์์.
- target task์ ์๊ตฌ ์ฌํญ: ๊ฐ target task๋ ๋ค๋ฅธ ์๊ตฌ ์ฌํญ์ ๊ฐ์ง๊ณ ์์. ์ด๋ค task์์๋ ๋ง์ ํ๋ณด๋ฅผ ๊ณ ๋ คํ๋ ๊ฒ์ด ์ ๋ฆฌํ ์ ์์ผ๋ฉฐ, ์ด๋ ๋ ํฐ ๋น ํฌ๊ธฐ(K ๊ฐ)๋ฅผ ํ์๋ก ํจ. ๋ค๋ฅธ ํ์คํฌ์์๋ ์์ K ๊ฐ์ด ์ถฉ๋ถํ ์๋ ์์.
- ์ฑ๋ฅ๊ณผ ํจ์จ์ฑ์ ๊ท ํ: ๋น ํฌ๊ธฐ(K ๊ฐ)๋ ์ฑ๋ฅ๊ณผ ํจ์จ์ฑ ์ฌ์ด์ ๊ท ํ์ ๋ํ๋. ๋ ํฐ K ๊ฐ์ ๋ ๋ง์ ํ๋ณด๋ฅผ ๊ณ ๋ คํ๊ณ , ์ด๋ก ์ธํด ๋ ์ข์ ์ฑ๋ฅ์ ์ป์ ์ ์์. ๊ทธ๋ฌ๋ ๋์์ ์ฐ์ฐ ๋น์ฉ๋ ๋ ๋ง์ด ์๋ชจํ๊ฒ ๋จ. ๋ฐ๋ผ์, ์ค์ ๋ก ์ ํ๋๋ K ๊ฐ์ ์ฑ๋ฅ ๋ชฉํ์ ์ฐ์ฐ ๋น์ฉ์ ๊ณ ๋ คํ์ฌ ์กฐ์ ๋์ด์ผ ํจ.
- ๊ฐtt์ ๋ํด, ๋ชจ๋ source task๊ฐ์ transability๋ฅผ ๋น๊ตํ๋ ํ๋ ฌWtW_t์ ๋ง๋ฌ.
- ํ๋ ฌ์(i,j) (i, j)์ ์์wi,jw_{i, j}๋ test ๋ฐ์ดํฐ์์ si๊ฐ sj๋ณด๋ค t์ ๋ํด ๋ ์ฑ๋ฅ์ด ์ฐ์ํ๋ (์์ผ๋ก ํํํ ๊ฒ:Dsi→t(I)>Dsj→t(I){D_{s_i→t}}(I) > Ds_{j→t}(I)) ํ ์คํธ ์ด๋ฏธ์ง(I)์ ์๋ฅผ ์นด์ดํ ํ๊ณ , test set ๋ด์์์ ๋น์จ์ ๊ณ์ฐํจ.

- Wt๋ฅผ [0.001, 0.999] ๋ฒ์๋ก clipping ํจ.
- Wt์ ํฉ์ด 1์ด ๋๋๋ก ์๋ก์ด matrixWt‘W_t^`==Wt/WtTW_t / W_t^T(element-wise)๋ฅผ ๊ณ์ฐํจ.โปsi s_i๊ฐsjs_j์ ๋นํด ์ฑ๋ฅ์ด ์ผ๋ง๋ ๋ ์ฐ์ํ๋์ง ๋ํ๋ธ๋ค๊ณ ํจ.

- Wt‘W_t^`์ eigenvector(๊ณ ์ ๊ฐ์ด ๊ฐ์ฅ ํฐ ๊ณ ์ ๋ฒกํฐ)๋ฅผ ๊ณ์ฐํจ
- principal eigenvector์ i๋ฒ์งธ ์ฑ๋ถ์, ์ด์ ๋์๋๋ i๋ฒ์งธ source task๋ค๋ก ๊ตฌ์ฑํ centrality(์ค์ฌ์ฑ)๋ฅผ ๋ํ๋ด๊ฒ ๋จ (์ ๋ชจ๋ฅด๊ฒ ์ ๋ญ๋ง์ด์ผ. ์ด๋ ค์!!!~!~!~)
โก๏ธ ์ฆ, ์ฝ๊ฒ ๋งํด์ ํด๋น source task์ target task์ ๋ํ ์ผ์ข ์ ‘์ํฅ๋ ฅ’์ ๋ํ๋. ⇒ Analytic Hierarchy Process(AHP) → ๊ฒฝ์๊ณผํ์์ ๋ง์ด ์ฐ์ด๋ ๋ฐฉ์์ด๋ผ๊ณ .
โป AHP๋
์ํธ ๋ฐฐํ์ ์ธ ๋์๋ค์ ์ฒด๊ณ์ ์ผ๋ก ํ๊ฐํ์ฌ ์ฐ์ ์์๋ฅผ ๋์ถํ๋ ์์ฌ๊ฒฐ์ ๋ฐฉ๋ฒ

- ๋ชจ๋ t ∈ T์ ๋ํ W0t์ ์ฃผ์ ๊ณ ์ ๋ฒกํฐ๋ฅผ ์์์ ํ๋ ฌ P('p'๋ ์ฑ๋ฅ์ ๋ํ๋)์ ์ป์.
3.4. Step IV: Computing the Global Taxonomy
- task๊ฐ ๋ ธ๋(๋จธ๋ฆฌ)์ด๊ณ transfer๊ฐ ์ฃ์ง(๊ฐ์ )์ธ ํ์ ๊ทธ๋ํ(subgraph) ์ ํ์ผ๋ก์ ์ ์๋ ์ ์์

โก๏ธ ์ต์ ์ ํ์ ๊ทธ๋ํ๋ ์ด์์ ์ธ tast ๋ ธ๋์ ๋์์ผ๋ก๋ถํฐ์ ์ต์์ edge๋ฅผ ์ ํํ๋ฉด์tast ๋ ธ๋์ ์๊ฐ supervision budget ์ ์ด๊ณผํ์ง ์๋๋ก ํจ
โป supervision budget
- ๋ชจ๋ธ์ด ํน์ ์์ ์ ๋ํด ์ผ๋ง๋ ๋ง์ ๋ ์ด๋ธ ํน์ ๊ฐ๋ ์ ํธ๋ฅผ ๋ฐ์ ์ ์๋๊ฐ์ ๋ํ ๋ฒ์๋ผ๊ณ ์๊ฐํ๋ฉด ๋ ๋ฏ.
- Supervision Budget์ด ๋์์๋ก ๋ชจ๋ธ์ ํด๋น ์์ ์ ๋ํด ๋ ๋ง์ ๊ฐ๋ ์ ํธ๋ฅผ ํ์ฉํ์ฌ ๋ ์ ํํ๊ฒ ํ์ตํ ์ ์์

4. Experiments
- Step 1์์ ํ์ต์ํจ Task-specific network๋ค์ ๊ฐ task ๋ณ ์ฑ๋ฅ ๊ฒฐ๊ณผ

4.1. Evaluation of Computed Taxonomies
- Supervision budget γ ๋ฐ Transfer Order๋ฅผ ๋ณ๊ฒฝํด ๊ฐ๋ฉด์ ํ์ตํ ๊ฒฐ๊ณผ ์ป์ด์ง ๋ช ๊ฐ์ง ์์

- Taskonomy์ ๊ธฐ๋ฐํด์ ์ป์ด์ง transfer ๊ท์น๋ค์ ๊ฐ target task์ ์ ์ฉํด์ transfer learning์ ์ํํ์ ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค (2๊ฐ์ง ์งํ๋ฅผ ์ฌ์ฉ)

Gain
: Transfer network์ ํ์ต์ ์ฌ์ฉํ validation set(1.6๋ง)์ผ๋ก, target task์ task-specific network๋ฅผ ์ฒ์๋ถํฐ ํ์ตํ๋ ๋ฐฉ๋ฒ์ baseline์ผ๋ก ์ค์ ํ์ ์์, taskonomy ๋ฐฉ๋ฒ์ win rate(%)
Quality
Task-specific network์ ํ์ต์ ์ฌ์ฉํ training set(12๋ง)์ผ๋ก, target task์ task-specific network๋ฅผ ์ฒ์๋ถํฐ ํ์ตํ๋ ๋ฐฉ๋ฒ์ baseline์ผ๋ก ์ค์ ํ์ ์์, taskonomy ๋ฐฉ๋ฒ์ win rate(%)
- Maximum transfer order๋ฅผ ์ฆ๊ฐ์ํฌ์๋ก, ๊ทธ๋ฆฌ๊ณ supervision budget γ๋ฅผ ์ฆ๊ฐ์ํฌ์๋ก, Gain๊ณผ Quality๊ฐ ์ ์ฐจ์ ์ผ๋ก ์ฆ๊ฐํ๋ ๊ฒฝํฅ์ ๋ณด์
โก๏ธ ๋ ๋ง์ source task๋ก๋ถํฐ ์ป์ ์ง์์ transferํ ์๋ก ์ฑ๋ฅ์ด ๋์์ง ๊ฒ์ด๋ค๋ผ๋ ๊ฐ์ค์ด ์ฑ๋ฆฝ๋จ.
4.2. Generalization to Novel Tasks
- ์๋ก์ด task์ ๋ํ ์ผ๋ฐํ ์ฑ๋ฅ ๊ฒ์ฆ ๊ฒฐ๊ณผ

- ์ด์ ๊น์ง์ ์คํ์์๋ ์ฌ์ ์ ๊ฐ์ ํ source-target ์กฐํฉ๋ค์ ๊ณ ๋ คํ์ฌ taskonomy๋ฅผ ๊ณ์ฐํ๋ ๊ณผ์ ์ ๊ฑฐ์ณค์ง๋ง, ํ์ค์ ์ธ ์ํฉ์์๋ ์๋ก์ด target task์ ๋ํด์ ๊ธฐ์กด์ ์๋ source task๋ง์ ๊ฐ์ง๊ณ ์ต์ ์ transfer policy๋ฅผ ์ฐพ์์ผ ํจ.
โก๏ธ ๊ธฐ์กด Task๋ค์ ๋ชจ๋ Source๋ก ์ฎ๊ธฐ๊ณ , ์๋ก์ด Task๋ฅผ ๋จ์ผ Target์ผ๋กํ ์ผ๋ฐํ ์ฑ์ฆ ๊ฒ์ฆ ์คํ์ ์ํ
โก๏ธ ImageNet ๋ฐ์ดํฐ์ ์ผ๋ก ํ์ตํ AlexNet์ FC7์ features๋ก ์ฌ์ฉํ ๊ฒฝ์ฐ ๋ฑ์ ๋นํด, ์์ฑ๋ taskonomy์ ๊ธฐ๋ฐํ์ฌ ์ฐพ์ transfer policy์ ๋ฐ๋ผ ํ์ตํ ๊ฒฝ์ฐ์ ์ฑ๋ฅ์ด ์ ์ฒด์ ์ผ๋ก ๋ ์ฐ์ํ ๊ฒ์ผ๋ก ๋ํ๋จ (์ง๋ฌธ- ์ ๋ชจ๋ฅด๊ฒ ์)
5. Significance Test of the Structure
- Taskonomy๋ก ์ฐพ์ ์ต์ ์ Transfer policy ์ ์ฉ ์ฑ๋ฅ ๋น๊ต ๊ฒฐ๊ณผ (์ด๋ก์: ์ต์ ์ transfer policy, ํ์: ๋๋ค transfer Policy)

6. Limitations and Discussion
- Model Dependence: ํ์ต์ DNN, ๋ฐ์ดํฐ๋ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ง ์ฌ์ฉ → ์คํ ๊ฒฐ๊ณผ๊ฐ ํน์ ๋ชจ๋ธ๊ณผ ๋ฐ์ดํฐ์ ์ ๋๋ฌด ํนํ๋์ด์๋ค๊ณ ํํํ ์ ์์ ๋ฏ
- Compositionality: ๋ณธ ๋ ผ๋ฌธ์์ ๋ค๋ฃฌ task๋ค์ ๋ชจ๋ ์ฌ๋์ด ์ ์ํ task์ ํด๋น. → ์๋ก์ด ๋ถ๋ถ ์์ (Subtask)์ ๋ฐ๊ฒฌํ ๊ฐ๋ฅ์ฑ์ ๋ํ ์๋ฌธ์ ์ ๊ธฐํจ (๋ค์ํ task๋ฅผ ๋ค๋ฃจ์ง ๋ชปํ๋ค..)
- Space Regularity: 26๊ฐ์ task์์ ์ํ๋ง์ ํตํด ์ป์ task๋ง์ ์ฌ์ฉํ๊ธฐ์, ๊ณผ์ฐ ์ผ๋ฐ์ ์ธ task์ธ๊ฐ์ ๋ํด ์๋ฌธ ์ ๊ธฐ
- Transferring to Non-visual and Robotic Tasks: ์ด๋ฏธ์ง์ ๊ด๋ จ๋ visual task๋ค์ ๋ํด์๋ง ๊ฒ์ฆ์ ์ํํจ → ์๊ฐ์ ์ด์ง ์์ ๋ถ์ผ์์๋ Taskonomy ๋ฐฉ๋ฒ์ ํตํด transferability๋ฅผ ๊ทน๋ํํ ์ ์์์ง์ ๋ํ ์๋ฌธ ์ ๊ธฐ
- Lifelong Learning: ๋ณธ ๋ ผ๋ฌธ์์๋ Taskonomy๋ฅผ ์์ฑํ๋ ์์ ์ ๋จ ํ ๋ฒ์ ์ํํจ → ์์คํ ์ด ์ง์์ ์ผ๋ก ํ์ต์ ์งํํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ค task๋ฅผ ์ ์ง์ ์ผ๋ก ํ์ฅ์ํฌ ์ ์์์ง์ ๋ํ ๊ฒ์ฆ ํ์
7. Reference
https://rahites.tistory.com/179
๊ฐ์ฌํฉ๋๋ค.
์๊ฐ๋ณด๋ค ์ดํดํ๋๋ฐ ์ด๋ ค์ ๋ ๋ ผ๋ฌธ.'Deep Learning > [๋ ผ๋ฌธ] Paper Review' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
DETR: End-to-End Object Detection with Transformers (0) | 2023.07.23 |
---|---|
SRNet: Editing Text in the Wild Review (0) | 2023.07.17 |
Noisy Student: Self-training with Noisy Student improves ImageNet classification(2019) (0) | 2023.07.14 |
NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis (1) | 2023.07.13 |
XLM: Cross-lingual Language Model Pretraining (0) | 2023.07.09 |