Mixup์ด ๋ญ์ผ?
: Beyond Emprical Risk Minimization - ๊ฒฝํ์ ์ํ ์ต์ํ๋ฅผ ๋์ด? ์ด๊ฒ ๋๋์ฒด ๋ญ๋ง์ธ๊ฐ
: mixup ⇒ data augmentaion ๊ธฐ๋ฒ
: ์ ๋ง ์ฝ๊ฒ ๋งํ์๋ฉด, ์ฐ๋ฆฌ๊ฐ ์ผ๋ฐ์ ์ผ๋ก ํ๋ จ, ์์ธก๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ์ ์ฐ๋ฉด ๊ณผ์ ํฉ์ด ๋ฐ์ํ๊ธฐ ๋ง๋ จ์.
: ์๋? ํ๋ จ๋ฐ์ดํฐ๋ง ๋ณด๊ณ ํ์ต์ ์ํค๊ธฐ ๋๋ฌธ์, ๋น์ฐํ ํ์ตํ ๋ชจ๋ธ์ ํ์ต ๋ฐ์ดํฐ์ ์ ํธํฅ๋จ.
: ์ฆ, ๊ณผ์ ํฉ์ด ๋๋ค๋ ๋ง. ๊ฒฐ๊ตญ, ๋ค๋ฅธ ์กฐ๊ธ๋ง ๋ค๋ฅธ ๋ถํฌ๋ฅผ ๊ฐ์ง๋ ๋ฐ์ดํฐ์ ์ ์ ์ฉ๋ง ํด(Out of Distribution) ๋ชจ๋ธ์ด ์ทจ์ฝํ ์ ๋ฐ์ ์์
: ๋ฐ๋ผ์, ํ๋ จ ๋ฐ์ดํฐ์ ๋ง ํ์ต ์ํค๋๊ฒ ์๋๋ผ, ํ๋ จ ๋ฐ์ดํฐ์ ์
๊ทผ๋ฐฉ ๋ถํฌ๋ ํจ๊ป ํ์ต์ ์์ผ์ ๋ณด๋ค ๋ ์ผ๋ฐํ๋ ๋ชจ๋ธ์ ๋ง๋ค์ด๋ด์! ์ด๊ฒ์ด ๋ฐ๋ก mixup์ ์ฃผ์ ์์ .๊ฒฐ๋ก ์ ์ผ๋ก ์ฃผ์ด์ง ๋ฐ์ดํฐ๊ฐ ์๋ ์๋ก์ด ๋ฐ์ดํฐ์ง๋ง ํ๋ จ ๋ฐ์ดํฐ์ ๊ณผ ๊ทธ๋ ๊ฒ ๋ค๋ฅด์ง ์์ ๋ฐ์ดํฐ์ ์ ์ถ๊ฐ์ ์ผ๋ก ๋ง๋ค์ด์ฃผ์! ๋ผ๋๊ฒ ๋ ผ๋ฌธ์ ์ ๋ถ.
1. ERM(empirical risk minimization)
โป empirical : ๊ฒฝํ์
“๊ฒฝํํ ๊ฒ(training data)์ ๋ฐ๋ผ ๊ธฐ๋๋๋ ์ํ(์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด(์ค์ฐจ))์ ์ต์ํํ์”
: ์ง๋ ํ์ต์ ์ ๋ ฅ ๋ฐ์ดํฐ(X)์ ํด๋นํ๋ ํ๊ฒ ๋ฐ์ดํฐ(Y) ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ฐพ๋ ๊ณผ์ . ์ด๋, ๋ฐ์ดํฐ์ ์ ๊ฒฐํฉ ๋ถํฌ P(X, Y)๋ฅผ ๋ฐ๋ฆ
: ์์ค ํจ์๋ฅผ ์ ์ํ ํ, ์์ธก๊ฐ f(x)์ ์ค์ ํ๊ฒ๊ฐ y ์ฌ์ด์ ์ฐจ์ด๋ฅผ ๊ฐ์ง๊ณ , ๋ฐ์ดํฐ ๋ถํฌ P ์์์ ์์ค ํจ์ ์ ํ๊ท ์ ์ต์ํํ๋ ๊ฒ์ด ์ฐ๋ฆฌ์ ๋ชฉํ (๊ทธ๋ฅ ์ฐ๋ฆฌ๊ฐ ๋งจ๋ ํ๋ ์์คํจ์๋ฅผ ์๋ฏธํ๋๊ฑฐ)
⇒ ๋ ผ๋ฌธ์์๋ expected risk๋ผ๊ณ ํํํจ
: ํ์ง๋ง ์ฐ๋ฆฌ๋ ์ค์ ๋ฐ์ดํฐ ๋ถํฌ P๋ฅผ ๋ชจ๋ฅด๊ธฐ ๋๋ฌธ, ๊ทผ์ฌํ ๋งํ ๋ฐ์ดํฐ(ํ์ต๋ฐ์ดํฐ D)๋ฅผ ํ์ฉํจ
: ๋ชจ๋ธ์ ํ์ต์ํฌ ๋ training dataset์ ํตํด ๋ถํฌ๋ฅผ ํ์ฑ ⇒ empirical distribution(๊ฒฝํ์ ๋ถํฌ)
: ์ฆ, ๊ฐ์ฉํ ๋ฐ์ดํฐ(D)๋ก ๋ชจ์ง๋จ์ ๊ทผ์ฌ. ์ฌ๊ธฐ์ ๋ฐ์ดํฐ๊ฐ ๋ง์์๋ก(ํ๋ณธ์ด ๊ฒฐ๊ตญ ๋ง์ผ๋ฉด) ๋ชจ์ง๋จ(P)์ ๊ทผ์ฌ๋ ํ๋ฅ ์ด ๋์(๋ชจ์ง๋จ์ ๊ฐ๊น์์ง๋ค)
: R(f) ์์์๋ P(x,y) ์์ ์ ๋ถ๊ฐ์ผ๋ก ํํํ๋ฉด ์ต์ข ์์ด ์๋์ ๊ฐ์์ง (๊ฒฝํ์ ๊ธฐ๋ ์ํ(Empirical Expected Risk))
: Rδ(f)๋ฅผ ์ต์ํํ๊ฒ ๋จ์ผ๋ก์จ ERM์ ์ ์๊ฐ ์์ฑ๋๋ ๊ฒ์
โก๏ธ ๋ฅ๋ฌ๋๊ณผ ๊ฐ์ด ํ๋ผ๋ฏธํฐ๊ฐ ๋ง์ ๋ชจ๋ธ์ ํ์ตํ ๊ฒฝ์ฐ, empirical distribution(ํ์ต ๋ฐ์ดํฐ)์ ์ ๋ถ ์ธ์๋ฒ๋ฆฌ๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๊ฒ ๋จ (๋ ๋๊ฐ์ ์๊ธฐ)
โก๏ธ ๊ทธ๋์ ์ ์๋ ๊ฒ์ด VRM
2. VRM(vicinal risk minimization)
โป vicinal : ๊ทผ์ฌ์, ๊ทผ์ ์
: vicinal distrbitution ์ ์ฐ๋ฆฌ๊ฐ ๊ฐ์ง๊ณ ์๋, ๋ฐ์ดํฐ ์ x,y ์ ๊ทผ์ ํ ๋ค๋ฅธ ๋ฐ์ดํฐ ์ x', y' ๋ค์ ๋ถํฌ๋ฅผ ์๋ฏธํจ
: ์ด๋ฌํ ๋ถํฌ์์ ์ํ๋ง๋ ๋ฐ์ดํฐ๋ก expected risk๋ฅผ ์ต์ํํ๊ฒ ๋๋ฉด, emprical vicinal risk ๋ฅผ ๋ค๋ฃธ.
: ๊ฒฐ๊ตญ, ํ๋ จ ๋ฐ์ดํฐ์ ๋ํ ๋ถํฌ๋ฅผ ํฌํจํ๋ Pν(x~,y~)๋ฅผ ๋ชจ๋ธ๋ง ํ์ผ๋ฏ๋ก, ์๋ก์ด expected risk ๊ณ์ฐํ ์ ์์
: vicinal distribution์ ์ผ๋ฐํํ ์
: lambda ๊ฐ์ ์กฐ์ ํ๋ฉด์ data distribution์ ๊ฒฐ์ ํ๊ฒ ๋จ
: ๊ฒฐ๊ตญ์๋ ์๋์๋๋ก data augmentaionํ๋ ๊ฒ์ด mixup์ ์ ๋ถ
Mixup์ด ํ๋๊ฒ ๋ญ๊น์?
: mixup์ uncertainty๋ฅผ ์ธก์ ํ๋๋ฐ ๋ ํจ๊ณผ์ ์ ( ๋ ์ค๋ฌด์คํ๋ค )
ex) green: class 0, orange: class 1 ⇒ ํ๋์ ๋ถ๋ถ์ ๊ฒฝ์ฐ, ํด๋น ๋ฐ์ดํฐ x๊ฐ ์ฃผ์ด์ก์ ๋, class๊ฐ 1์ผ ํ๋ฅ ์ ๋ํ๋
: ERM์ ๋ ํด๋์ค ๊ฐ์ decision boundary๊ฐ ๋๋ ทํ๊ฒ ๋ถ๋ฆฌ๋์ด ์์ : mixup์ ๊ฐ๊น์ด ๋ถ๋ถ์ ๋ ์ง์ ํ๋์์ผ๋ก ๋ํ๋(๋ถ๋๋ฝ๊ฒ ๋ง๋ฌ)
โก๏ธ uncertainty๋ฅผ smoothํ๊ฒ ์ธก์ ํ ์ ์๊ฒ ๋จ
โก๏ธ mixup์ด ERM์ ๋ํด์ ๊ณผ์ ํฉ์ด ๋ ๋ฐ์ํ๋ค๊ณ ํด์ํ ์ ์์
โก๏ธ ERM์ ํ์ต๋ฐ์ดํฐ์ ๋๋ฌด ๋ฏผ๊ฐํ๊ฒ ๋ง์ถฐ์ง๋ ๊ฒ์ ๋ฐํด, mixup์ ๋ฐ์ดํฐ์ ๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ๋ ๋ถ๋๋ฝ๊ฒ ํจ์ผ๋ก์จ ์๋ก์ด ๋ฐ์ดํฐ์ ๋ํด ๋ ์ผ๋ฐํ๋๋ ๊ฒฝํฅ. ⇒ ๊ณผ์ ํฉ ํ๋ฅ ๋ฎ์์ง
โป ๋ ธ์ด์ฆ์ ๋ ๋ฏผ๊ฐํ๋ค
: ๋ถ๋๋ฌ์ด ๊ฒฐ์ ๊ฒฝ๊ณ๋ ๋ฐ์ดํฐ ํฌ์ธํธ๋ค ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ์กฐ๊ธ๋ง ๋ณํ์์ผ๋ ํฌ๊ฒ ๋ฐ๋์ง ์๊ฒ ๋จ. ์ด๋ ๊ฒ ๋๋ฉด ๋ ธ์ด์ฆ๋ ์์๋ผ์ด์ด์ ๋ ๋ฏผ๊ฐํด์ง.
: ๋ฐ๋ฉด, ๋๋ ทํ ๊ฒฐ์ ๊ฒฝ๊ณ๋ ํ์ต ๋ฐ์ดํฐ์ ๋ฏผ๊ฐํ๊ฒ ๋ง์ถ๊ธฐ ๋๋ฌธ์ ๋ ธ์ด์ฆ์๋ ์ฝ๊ฒ ์ํฅ์ ๋ฐ์.
โก๏ธ ์๋ก์ด ๋ฐ์ดํฐ์ ๋ํด์ ๋ ์ผ๋ฐํ๋ ์์ธก ๋ฐ ์์ ์ ์ด๊ณ ๊ฒฌ๊ณ ํ ๋ชจ๋ธ์ ๊ตฌ์ถํ ์ ์์
Prediction/Gradient
: (a)์ ๊ฒฝ์ฐ, mixup์ผ๋ก ํ์ต์ํจ ๊ฒ์ด ๋ prediction์ธก๋ฉด์์ ์ข์ ์ฑ๋ฅ์ ๋ณด์
: (b)์ ๊ฒฝ์ฐ, gradient norm์ด ๋ ์์. ์ด๋ ๋ ์์ ์ ์ธ ํ์ต์ ๋ณด์ด๊ณ ์๋ค๋ ๊ฒ์ ์๋ฏธํจ
EXPERIMENTS
[3.1 IMAGENET CLASSIFICATION][3.2 CIFAR10 AND CIFAR100] [3.4 MEMORIZATION OF CORRUPTED LABELS][3.5 ROBUSTNESS TO ADVERSARIAL EXAMPLES][3.6 TABULAR DATA] [3.7 STABILIZATION OF GENERATIVE ADVERSARIAL NETWORKS][3.8 ABLATION STUDIES]
<์ฐธ๊ณ >
https://everyday-image-processing.tistory.com/145
https://rroundtable.notion.site/mixup-467e0a5d4d284e05a5879007b9d1b97f
https://techy8855.tistory.com/19
https://medium.com/swlh/paper-mixup-beyond-empirical-risk-minimization-image-classification
'Deep Learning > [๋ ผ๋ฌธ] Paper Review' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Expressive Body Capture: 3D Hands, Face, and Body from a Single Image (0) | 2023.08.04 |
---|---|
BodyNet: Volumetric Inference of 3D Human Body Shapes (0) | 2023.08.03 |
SMPLify(Keep it SMPL): Automatic Estimation of 3D Human Pose and Shape from a Single Image (0) | 2023.07.31 |
SMPL: A Skinned Multi-Person Linear Model (0) | 2023.07.28 |
DETR: End-to-End Object Detection with Transformers (0) | 2023.07.23 |