0. ABSTRACT
1. ํจ์ฌ ๊ฐ๊ฒฐํ ๋ชจ๋ธ (๋งค๊ฐ๋ณ์์ ์ ๊ฐ์)
: SMPL๋ณด๋ค 80% ๋ ์์ ๋งค๊ฐ๋ณ์๋ง์ ์ฌ์ฉ
2. ์ฒดํ์ ๋ฐ๋ผ ๋ณํ๋ ํํ ๋ฐ ํฌ์ฆ๋ฅผ ํ์ต์ํด (์ฒดํ ๋ฐ BMI ํ์ฉ)
: SMPL์ ๊ฒฝ์ฐ, ์ฒดํ์ ๋ฐ๋ฅธ ๋ค์ํ ํํ์ ๋ณํ์ ๊ณ ๋ คํ์ง ์์์
(์ฒดํ์ ์๊ด์์ด ๋ค ๋์ผํ ๊ทผ์ก ํํ๋ก ํํ)
ex) ๋๊ตฐ๊ฐ ํ์ ๊ตฌ๋ถ๋ ธ์ ๋, ๊ฐ ์ฒดํ๋ง๋ค ํ๊ฟ์น ์ฃผ๋ณ์ ํผ๋ถ๋ ๊ทผ์ก์ ํํ๊ฐ ๋ ๋ค๋ฅด๊ฒ ๋ณํํจ(๊ณจ๊ฒฉ์ด ๋ ํฐ ์ฌ๋, ๊ทผ์ก์ด ๋ ๋ง๊ฑฐ๋ ์ ์ ์ฌ๋..)
3. ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋๋ฆผ
:์ผ๋ฐํ ์ฑ๋ฅ ๊ฐ์
๊ฒฐ๋ก : ์ํ ๋ชจ๋ธ์ด๋ฉฐ, ์๋ก์ด ์ฒดํ์ ๋ํด ๋ ์ ์ผ๋ฐํ๋จ, SMPL ๋์ฒด ๋ชจ๋ธ๋ก ์ฌ์ฉ ๊ฐ๋ฅ
1 INTRODUCTION
: ๊ธฐ์กด SMPL ๊ฐ์ ๊ฒฝ์ฐ๋ ๊ด์ ๋ถ์๋ณ๋ก ํ์ต์ํค์ง ์๊ณ , ํ ๋ฒ์ ๋ชจ๋ ์ฒดํ ๊ด์ ๋ถ๋ถ์ ํ๋๋ก ์ฐ๊ฒฐ์ง์ด์ ํ์ต์์ผฐ์
: ๋ชจ๋ธ ๋งค๊ฐ ๋ณ์์ ์๊ฐ 420๋ง ๊ฐ ์ด์์ผ๋ก ํฌ๊ฒ ๋์ด๋จ
: ๊ทธ๋ ๊ฒ ๋๋ฉด, ๊ณผ์ ํฉ ๊ฐ๋ฅ์ฑ๋ ๋์์ง๊ณ , ์๋ชป๋ ์๊ด๊ด๊ณ๋ฅผ ํ์ต, ๋ฐ ์๋ชป๋ ๊ธฐ์ธ๊ธฐ ์ ํ
: ์์ธ ๋ณํ๋ ๋๋ถ๋ถ ํน์ ๋ถ๋ถ์ ์ํฅ์ ๋ฏธ์น๋ ๊ฒฝ์ฐ๊ฐ ๋ง์์, ์์ธ ๋ณด์ ๋ณํ๋ ๋น์ทํ ๋ถ๋ถ์ ์ํฅ์ ์ฃผ์ด์ผ ํจ.
: ex) ํ์ ์์ผ์ก์ผ๋ฉด ์๋ชฉ๊ณผ ํ๊ฟ์น ๋ถ๋ถ๋ง ๋ณํํ๊ณ ๋๋จธ์ง ๋ชธํต์ ๊ทธ๋๋ก์ผ ๋๊ฐ ๋ง์
: ์ด๋ ๊ฒ ์ง์ญ์ ์ผ๋ก ๋ณํ๋ ๊ฒ์ ๊ณ ๋ คํ๋ ๋ชจ๋ธ์ ๋ง๋ค๋ฉด ๋ ์ ํํ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์
(ํ ๋ฒ์ ๋ชจ๋ ๊ด์ ์ ํ์ต์์ผฐ๊ธฐ ๋๋ฌธ์, ์ผ์ชฝ ํ์ ๊ตฌ๋ถ๋ ธ๋๋ฐ ์ค๋ฅธ์ชฝ ํ์ด ๋ถํ์ด ์ค๋ฅธ๋ค๋์ง ์ด๋ฐ ์์ ์๋ชป๋ ์๊ด๊ด๊ณ๋ฅผ ํ์ต ์์ผฐ๋ค๋ ์๋ฏธ์)
: ๊ด์ ๋ณ ํน์ฑ์ ๋ฌด์
: ๋ํ, ์ฒดํ์ ๋ฐ๋ผ ๊ฐ์ ์์ธ๋ฅผ ์ทจํด๋ ๋ชธ์ด ์ํฅ์ ๋ฐ๋ ๋ถ์๋ ๊ฐ๊ธฐ ๋ค๋ฆ (์ค๋ฅธ์ชฝ ์ฌ์ง ์ฐธ๊ณ )
: SMPL์ ์ด๋ฌํ ์ฌ์ค์ ๊ฐ๊ณผํจ (์ฒดํ์ ๊ด๊ณ์์ด ๋์ผํ๊ฒ ๋ชธ์ ์ํฅ์ ๊ฐ๋ค๊ณ ์ธก์ )
(๋ ๋ฑ๋ฑํ ์ฌ๋์ ์์์ ๋, ๋ฐฐ๋, ๊ฐ์ด์ชฝ์ ์ํฅ์ ๋ฐ๋๋ค๊ณ ํํํด์ผ ํ์ง๋ง, ๋๊ฐ์ด ๋ง๋ฅธ ์ฌ๋๊ณผ ํ๋ฒ ์ง ๋ถ๋ถ๋ง ์ํฅ์ ๋ฐ๋๋ค ๋ผ๊ณ ์ฒดํ์ ํํํ๋ค๋ ๊ฒ)
: ๊ธฐ์กด mesh ํ๋ฉด์ loss๋ ๊ฑฐ๋ฆฌ๊ฐ ๋จผ ๊ด์ ์ ๋ํด ์๋ชป๋ ๊ธฐ์ธ๊ธฐ๋ฅผ ์ ํ
: ๋ชจ๋ธ์ ๊ฐ๊ฒฐ์ฑ๊ณผ ์๊ฐ์ ํ์ค๊ฐ์ ์ ํํจ
⇒ ๊ฐ๊ฒฐํ ์ธ์ฒด ๋ชจ๋ธ์ ๋ง๋ฌ (STAR)
: ๊ด์ ์ด ์ฃผ๋ณ์ ๊ฐ๊น์ด ํฌ์ํ vertex์๋ง ์ํฅ์ ๋ฏธ์น๋๋ก ํ๊ณ (ํน์ ๊ด์ ์ฃผ์์ ์๋ ์ ์ ๋ค๋ง์ ๋ณํ), ์ง์ญ์ ์ธ blend shape๋ฅผ ๊ฐ์ง๋ ๋ชจ๋ธ๋ก ๊ตฌ์ฑํจ
โป Blend Shape
: ๋ค์ํ ์ ์ ๋ค์ ์์น๋ฅผ ์กฐ์ (๋ชจ๋ธ์ ํํ๋ฅผ ๋ณํ)
ex) ์ธ์ฒด ๋ชจ๋ธ์์ ํ์ ๊ตฌ๋ถ๋ฆฌ๊ฑฐ๋ ๋ค๋ฆฌ๋ฅผ ํด๊ฑฐ๋ ๋ค์ํ ์์ธ๋ฅผ ๋ง๋ค๊ธฐ ์ํด ๋ธ๋ ๋ ์์ดํ๋ฅผ ์กฐ์ ํ๋ ๊ฒ
โก๏ธ ์์ฝ: ๊ด์ ์ด ์์ง์ผ ๋ ํด๋น ๊ด์ ์ฃผ๋ณ์ ๋ช ๊ฐ์ ์ ์ ๋ค๋ง ๋ณํ
<๊ฐ๊ฒฐํ ๋ชจ๋ธ์ ๋ฐฉ๋ฒ>
: ๊ด์ ๋น ๋จ 4๊ฐ์ ์ซ์๋ฅผ ๊ฐ์ง ์ฟผํฐ๋์ธ ํํ(ํ์ ์ ๊ด๋ จ๋ ์) ์ผ๋ก ์ ํํ์ฌ ์ฑ๋ฅ ์์ค ์์ด ํ๋ผ๋ฏธํฐ๋ฅผ ์ค์๋ค๊ณ ํจ
(๋จ 4๊ฐ๋ง์ ์ฌ์ฉํด์ ๊ด์ ์ ์์ง์์ ํํํ๊ณ ์ ํ ๊ฒ ๊ฐ๋ค)
⇒ SMPL์ ํ๋ผ๋ฏธํฐ 20% ๋ง์ ์ฌ์ฉ
<์๋ชป๋ ์๊ด๊ด๊ณ ํด๊ฒฐ>
: SMPL์ ๊ฒฝ์ฐ, ์์ธ ๋ณด์ ์ ํ ๋์๋ ๊ด์ ์ ํ์ ์ ๋ํ ๋ณด์ (=๋ถ๋๋ฌ์ด ์กฐ์ง ๋ณํ) ๋ง์ ๊ณ ๋ คํ์ฌ blend shape๋ฅผ ๊ณ์ฐํจ.
: ํ์ง๋ง STAR๋ ์ฒดํ ๋ฟ๋ง ์๋๋ผ ์์ธ๊น์ง ํจ๊ป ๊ณ ๋ คํ์ฌ ๋ณด์ ์ ์งํํ๋ ๋ฐฉ์์ผ๋ก ๊ฐ์
: ์ฒดํ ํ๋ผ๋ฏธํฐ์ธ 'β'์ ๊ด์ ์ ์์ธ ํ๋ผ๋ฏธํฐ์ธ 'θ'๋ฅผ ๋ชจ๋ ์ฌ์ฉํ์ฌ ๋ณด์ ์ ๊ณ์ฐ.
: 'β'๋ ์ฒดํ์ ๋ฐ๋ผ ๋ค์ํ ํํ์ ๋ณํ์ ์๋ฏธํจ,
: 'θ'๋ ๊ด์ ์ ํ์ ์ ๋ํ๋ด๋ ํ๋ผ๋ฏธํฐ๋ฅผ ์๋ฏธ
: ์ด ๋, BMI(Body Mass Index)์ ๊ฐํ ์๊ด๊ด๊ณ๊ฐ ์๋ ์ฑ๋ถ์ ์ฌ์ฉํ๋ค๊ณ
โก๏ธ ๋ณด๋ค ํ์ค์ ์ธ ์์ธ ๊ธฐ๋ฐ ๋ณํ์ด ๊ฐ๋ฅํด์ง
<๊ธฐ์กด ๋ฐ์ดํฐ์ ์ ํ๊ณ>
: ๊ธฐ์กด CAESAR dataset์ ๊ฒฝ์ฐ, 1990๋ ๋ฏธ๊ตญ ์ธ๊ตฌ์ ๋ฐ๋ผ ๋ถํฌ๋์ด ์์ด์ ํ์ฌ์ ์ธ๊ณ์ ์ฒดํ ํต๊ณ๋ฅผ ๋ฐ์ํ์ง ์์
: CAESAR์ ๋ชจ๋ ์ฌ์ฑ์ ๋์ผํ ์คํฌ์ธ ๋ธ๋ผ ์ ํ์ ์์๋ก ์ฐ์๊ธฐ ๋๋ฌธ์, ๋ค์ํ ๋ชจ์์ ์ฌ์ฑ ๊ฐ์ด ํํ๋ฅผ ๋ฐ์ํ์ง ์์
โก๏ธ CAESAR + SizeUSA ์ค์บ์ ์กฐํฉ์์ STAR์ ํ๋ จํจ
2 RELATED WORK
Learned Models.
: ๊ธฐ์กด SMPL์์๋ ์์ธ ๋ณด์ ์ ์ํด ๋ถ์ ํ์ ํ๋ ฌ ์์๋ฅผ ๊ฐ์ง๊ณ ์ ํ ํจ์๋ฅผ ์ฌ์ฉํด์ ๋ชจ๋ธ๋ง ์งํ.
: ์ด๋ก ์ธํด ๊ฐ ๋ถ์๋ง๋ค ์ ์ฒด์ ์ธ ์ํฅ์ ๋ฏธ์น๋ 207๊ฐ์ pose blend shape๊ฐ ๋ง๋ค์ด์ง๋ค๊ณ ํจ
: STAR์ ๊ฒฝ์ฐ, ์์ธ์ ๋ํด์๋ ์ ํ ๋ชจ๋ธ + ๊ณต๊ฐ ๋ด์์์ ๋ณํ์ ๋น์ ํ ๋ชจ๋ธ์ ์ฌ์ฉ
** ์์ธ ex) ํ์ ๊ตฌ๋ถ๋ฆฌ๊ฑฐ๋ ํด๋ ๋์์ ๋จ์ํ ๊ด์ ์ ์ผ์ ๊ฐ๋๋ก ํ์ ์ํค๋ ๊ฒ์ผ๋ก ํํ
** ๊ณต๊ฐ ex) ์๋ชฉ์ ํ์ ์ํค๋ฉด์ ๋์์ ์๊ฐ๋ฝ๋ค์ด ๋ณต์กํ ๊ณก์ ํํ๋ก ์์ง์ด๋ ๊ฒ์ ํํํ๋ ๊ฒฝ์ฐ (๋ณด๋ค ๋ณต์กํ ํํ์ ๋ณํ์ด๋ ๋คํ๋ฆผ์ ํํ)
Sparse Pose Corrective Blend Shapes.
: ์์ธ ๋ณํ๋ ๋๋ถ๋ถ ํน์ ๋ถ๋ถ์ ์ํฅ์ ๋ฏธ์น๋ ๊ฒฝ์ฐ๊ฐ ๋ง์์, ์์ธ ๋ณด์ ๋ณํ๋ ๋น์ทํ ๋ถ๋ถ์ ์ํฅ์ ์ฃผ์ด์ผ ํจ.
: ex) ํ์ ์์ผ์ก์ผ๋ฉด ์๋ชฉ๊ณผ ํ๊ฟ์น ๋ถ๋ถ๋ง ๋ณํํ๊ณ ๋๋จธ์ง ๋ชธํต์ ๊ทธ๋๋ก์ผ ๋๊ฐ ๋ง์
โก๏ธ ์ด๋ ๊ฒ ์ง์ญ์ ์ผ๋ก ๋ณํ๋ ๊ฒ์ ๊ณ ๋ คํ๋ ๋ชจ๋ธ์ ๋ง๋ค๋ฉด ๋ ์ ํํ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์
: STAR๋ EigenSkin์ด๋ผ๋ ๋ชจ๋ธ๊ณผ ๋น์ทํ ์ ๊ทผ์ ์ฌ์ฉํ์ง๋ง, ๊ด์ ์ง์ ์์ญ์ ์๋์ผ๋ก ์กฐ์ ํ ํ์ ์์ด ์ด๋ฏธ ํฌ์ฆ๋ ์ค์บ ๋ฐ์ดํฐ์์ ์ง์ญ์ ์ธ ๊ด์ ์ง์์ ์ถ๋ก
: Neumann ๋ฑ์ ์ฐ๊ตฌ์์๋ ์์ธ์ ์ฒดํ ๋ณํ์ ํจ๊ป ๊ณ ๋ คํ ๋ชจ๋ธ์ ์ ์ํ๋๋ฐ, ์ด ๋ชจ๋ธ์ ์์ธ์ ๋ฐ๋ผ ๋ณํ๋ ์ฒดํ์ ํฌ์ํ PCA๋ฅผ ํตํด ํ์ตํ๋ ๋ฐฉ์
: ํ์ง๋ง ์ด ๋ชจ๋ธ์ ์ค์ ๋ก๋ ์ด๋ค ์์ธ์ ๋ฐ๋ผ ์ด๋ป๊ฒ ์ฒดํ์ด ๋ณํํ๋์ง๋ฅผ ์ง์ ํ์ตํ์ง ์์์
: STAR๋ ์ค์บ๋ ์ค์ ์ฒดํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์์ธ ๋ณํ์ ํ์ตํ๊ธฐ ๋๋ฌธ์, ๋ ์ ํํ ๊ฒฐ๊ณผ๋ฅผ ๋
3 MODEL
: ์์ ์๋ต
: SMPL๊ณผ ์ ์ฌํ ๋ฐฉ์์ผ๋ก ํ์ต
: ์ฐจ์ด์ : ํฌ์ฆ ๋ณด์ ํจ์๋ฅผ ํ๋ จํจ
: STAR ํฌ์ฆ ๋ณด์ ๋ธ๋ ๋ ํ์์ ๋ชจ๋ธ ์์ธก๊ณผ ์ค์ ๋ฑ๋ก ๊ฐ์ ์ ์ ๊ฐ ์ค์ฐจ๋ฅผ ์ต์ํํ๋๋ก ํ๋ จ๋จ
: (a)์ ์๋จ ⇒ ๋ชจ๋ธ์ด ์์ง ํ์ต๋๊ธฐ ์ ์ ์ด๊ธฐ ์ํ
: (a)์ ํ๋จ ⇒ ํ๋ จ๋ ํ์ ์ถ๋ ฅ์ ๋ณด์ฌ์ค (ํ์์ 0๊ฐ)
⇒ ์ ์ ์๋ ์ : ํน์ ๊ด์ ๋ถ๋ถ๋ง ํ์ต์ํจ๋ค๋ ๊ฒ (๋ถํ์ํ ๋ถ๋ถ์ 0์ผ๋ก) (์ง์ญ์ ํ์ต)
: (b) ์ผ์ชฝ ⇒ ๊ธฐ์กด SMPL์ ๋ฌธ์ ์ (์ ์ญ์ ํ์ต)
: (b) ์ค๋ฅธ์ชฝ ⇒ STAR ๋ชจ๋ธ (์ผ์ชฝ ๊ตฌ๋ถ๋ ธ๊ณ , ๋ค๋ฅธ ๊ณณ์๋ ์๋ฌด๋ฐ ์ํฅ์ ๋ฏธ์น์ง ์์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค)
'Deep Learning > [๋ ผ๋ฌธ] Paper Review' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization (0) | 2023.08.13 |
---|---|
DINO: Emerging Properties in Self-Supervised Vision Transformers (2021) (0) | 2023.08.10 |
Expressive Body Capture: 3D Hands, Face, and Body from a Single Image (0) | 2023.08.04 |
BodyNet: Volumetric Inference of 3D Human Body Shapes (0) | 2023.08.03 |
mixup: Beyond Emprical Risk Minimization (0) | 2023.08.03 |