SMPLify[Keep it SMPL] ์ด๋?
: 2D CNN(Deepcut)์ ํ์ฉํด ๊ด์ ์์น๋ฅผ ๋ฝ์ ํ, 3D SMPL์ ์ ์ฉํด 3D Mesh๋ฅผ ๊ตฌ์ฑํ๋ ๋ฐฉ์
์์ฝ(Abstract)
: ์ด๋ฏธ์ง์์ ์ธ๊ฐ์ 3D ํฌ์ฆ์ ํํ๋ฅผ ์๋์ผ๋ก ์ถ์ ํ๊ณ ์ ํจ
: CNN ๊ธฐ๋ฒ Deepcut์ ํ์ฉ, 3D SMPL์ ๊ฒฐํฉ
: Datasets์ ๊ฒฝ์ฐ, Leeds Spors, HumanEva, Human3.6M ์ฌ์ฉ
์ด์ ๋ฐ ํน์ง(Introduction)
: ์ด์ ๋ฐฉ์์ ๊ฒฝ์ฐ, ํฌ์ฆ ์ด์ ์๋ง ๋ง์ท๊ณ , 3D ํํ๋ฅผ ๋ฌด์ํ์
โก๏ธ 2D ์ด๋ฏธ์ง๋ก๋ถํฐ ํฌ์ฆ์ ํํ๋ฅผ ๋ชจ๋ ํฌํจํ๋ 3D ๋ฉ์ฌ๋ฅผ ์๋์ผ๋ก ์ถ์ ํ๋ ํด๊ฒฐ์ฑ ์ ์ ์ํจ
- Deepcut ํ์ฉํด 2D ๊ด์ ์ถ์
โป DeepCut์ด๋
๐ [์ฐธ๊ณ ] https://arxiv.org/pdf/1511.06645v2.pdf
: detection๊ณผ pose estimation ์์ ์ ๋์์ ์ํํ๋ ๋ฐฉ์ ์ ์
: ์ด๋ฏธ์ง ๋ด ์ฌ๋ ์๋ฅผ ์ถ์ ํ๊ณ , ๊ฐ๋ ค์ง ์ ์ฒด ๋ถ์ ์๋ณ, ์๋ก ๋ฐ์ ํ๊ฒ ์์นํ ์ฌ๋๋ค ์ฌ์ด์์ ์ ์ฒด ๋ถ์๋ฅผ ๊ตฌ๋ณํจ
- 2D ๊ด์ ๋ก๋ถํฐ 3D ํฌ์ฆ/ํํ ์ถ์ ํ๊ธฐ ์ํด 3D ์์ฑ ๋ชจ๋ธ SMPL ์ฌ์ฉ
⇒ SMPLify๋ผ๋ ์ด๋ฆ์ผ๋ก ์ ์ํจ
: ํํฅ์ ์ถ์ ์ด๋ผ๊ณ ๋งํจ (ํํฅ์ CNN ๊ฑฐ์น ํ, ์ํฅ์ ์์ฑ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค)
- 3D SMPL์ ํ์ฉํจ์ผ๋ก์จ ์ธ๊ตฌ ์ ์ฒด์ ํํ ๋ณ๋ ํต๊ณ์ ํฌ์ฆ์ ๋ฐ๋ฅธ ์ธ๊ฐ ๋ชธ์ฒด์ ๋ณํ์ ํฌ์ฐฉํ ์ ์์
- ๋ชฉ์ ํจ์๋ฅผ ์ ์, ํฌ์ฆ์ ํํ๋ฅผ ์ง์ ์ต์ ํ ⇒ 3D ๋ชจ๋ธ์ ํฌ์ฌ๋ ๊ด์ ์ด CNN์ผ๋ก ์ถ์ ๋ 2D ๊ด์ ๊ณผ ๊ฐ๊น์์ง๋๋ก ํจ
- interpenetration(์ํธ์นจํฌ) ๋ฅผ ์ดํดํ ์ ์์โป interpenetration: ๊ฐ์ฒด๊ฐ ์๋ก ํต๊ณผํ๊ฑฐ๋ ๊ฒน์น๋ ํ์์ ์๋ฏธ
- ์ด์ ์ฐ๊ตฌ์ ๊ฒฝ์ฐ, 2D ๊ด์ ๋ก๋ถํฐ 3D ์คํฑ ์ธ์ฒด๋ชจ๋ธ์ ์ถ์ ํ์์.
- ๋น์ ํ์ ์ธ ๊ด์ ๊ตฌ์กฐ
- 3D ์คํฑ ์ธ์ฒด๋ชจ๋ธ์ ๊ฒฝ์ฐ, ์ ๋ถ์ผ๋ก ๋ํ๋ธ ๊ฐ๋จํ 3D ๋ชจ๋ธ์ด๊ธฐ์ ํํํ๋๋ฐ ๋ถ๊ฐ๋ฅํ ์์ธ๊ฐ ๋ง์์. (๋๋ฌด ๋จ์ํด์)
- ๊ทธ๋ ๊ธฐ์ 2D ์ด๋ฏธ์ง๋ก๋ถํฐ 3D ์ ๋ณด๋ฅผ ์ถ๋ก ํ ๋, ๊น์ด ์ ๋ณด์ ์์ค๋ก ์ธํด ๋ชจํธํด์ง๋ค๋ ๋ฌธ์ ๊ฐ ์กด์ฌํ์ (์์ธ ์์ธก๊ณผ ๊ฐ์)
- ๋น์ฉ๋ ๋ง์ด ๋ฌ
- โก๏ธ ์๋ชป๋ ํฌ์ฆ๋ฅผ ๋ฐฉ์งํ๋๋ฐ ๋ ๋์์ด ๋๋๋ก ํจ
- โก๏ธ ‘์บก์’์ ํฌ๊ธฐ๊ฐ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๋ค๋ก ์ ํ ํ๊ท๋์๋ค๊ณ ํจ (๋น์ ํ์ ์ ํ์ผ๋ก)
<๊ธฐ์ฌ>
1) 2D ๊ด์ ๋ก๋ถํฐ 3D ๋ชธ์ฒด ํํ์ ํฌ์ฆ๋ฅผ ์๋์ผ๋ก ์ถ์ ํ๋ ์ต์ด์ ์์ ์๋ ๋ฐฉ๋ฒ
2) ํํ์ ํฌ์ฆ์ ๋ํด ๋ฏธ๋ถ ๊ฐ๋ฅํ ์ํธ์นจํฌ ํญ
3) 3D ๋ชธ์ฒด ๋ชจ๋ธ์ 2D ๊ด์ ์ ๋ง์ถ๊ธฐ ์ํ ์๋ก์ด ๋ชฉ์ ํจ์
DATA/Model
<data>
: ์ฌ์ฑ ๋ฐ ๋จ์ฑ์ ํํ ๊ณต๊ฐ์ ๊ตฌ๋ณ
: ์ฑ๋ณ ์ค๋ฆฝ์ ์ธ ๋ชจ๋ธ๋ ๋์ (์ฑ๋ณ์ ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ)
: ์ ์ ์ด๋ฏธ์ง ๋ฐฉ๋ฒ์ ์ด์ ์ ๋
: ๋ฐฐ๊ฒฝ ์ด๋ฏธ์ง ์๊ตฌํ์ง ์๊ณ , 2D ๊ด์ ๋ก๋ถํฐ 3D ์์ธ ์ถ๋ก ํ๋ ๋ฐฉ๋ฒ์ ์ด์ ์ ๋
<model>
: ์ธ ๊ฐ์ง ํํ์ ๋ชจ๋ธ ์ฌ์ฉ
: ๋จ์ฑ/์ฌ์ฑ/์ฑ๋ณ ์ค๋ฆฝ ๋ชจ๋ธ
: ์ฑ๋ณํ๋ SMPL ๋ชจ๋ธ๋ค์ ํ์ตํ ๋จ์ฑ, ์ฌ์ฑ์ผ๋ก๋ถํฐ ์๋ก์ด ์ฑ๋ณ ์ค๋ฆฝ ๋ชจ๋ธ์ ํ๋ จ
: ๋จ์ฑ ๋ฐ ์ฌ์ฑ์ ํํฌ, ์ฑ๋ณ ์ค๋ฆฝ์ ์ฐํ ํ๋
SMPLify ๋ฐฉ๋ฒ
: ํผ๋ถ ๋ฒ ์ด์ค ๋ชจ๋ธ์ธ SMPL [30]์ ์ฌ์ฉํ๋ฉฐ, ์ด๋ฅผ ํตํด 2D ์ด๋ฏธ์ง๋ฅผ ์ ๋ ฅ๋ฐ์ 3D ๋ฉ์ฌ๋ฅผ ์์ฑํ๊ณ ์ ํจ
: 23๊ฐ์ ๊ด์ ๋ก ๊ตฌ์ฑ
: SMPL ๋ชจ๋ธ๊ณผ DeepCut ์ค์ผ๋ ํค์ ์ฝ๊ฐ ๋ค๋ฅธ ๊ด์ ์ ๊ฐ์ง๊ณ ์๋ค๊ณ ํจ(๊ทธ๋์ Deepcut ๊ด์ ์ ๊ฐ์ฅ ์ ์ฌํ SMPL ๊ด์ ๊ณผ ์ฐ๊ฒฐํ๋ค๊ณ )
: SMPL ๊ด์ ์ ์ด๋ฏธ์ง๋ก ํฌ์์ํค๊ธฐ ์ํด ์๊ทผ ์นด๋ฉ๋ผ ๋ชจ๋ธ ์ฌ์ฉ
Approximating Bodies with Capsules
- interpenetration ์ผ๋ก ์ธํด ๋ถ๊ฐ๋ฅํ 3D ์์ธ๋ค์ ์์ฑํ๋ค๋ ๋ฌธ์ ์ ์ด ์กด์ฌํ์(3Dํ ํ๋ ๊ณผ์ ์์ ๊ฐ์ฒด๊ฐ ์๋ก ํต๊ณผํ๊ฑฐ๋ ๋ถ๋ชํ๋ ํํ์ด ์๊ธด๋ค๋..)
- ๋ฐ๋ผ์ ‘์บก์’์ ์งํฉ์ผ๋ก ์ธ์ฒด ํ๋ฉด์ ๊ทผ์ฌํ ํจ (๊ฐ ์บก์์ ๋ฐ์ง๋ฆ๊ณผ ์ถ ๊ธธ์ด๋ฅผ ๊ฐ์ง)
- ์ด ๋ ์๊ฐ๋ฝ ๋ฐ ๋ฐ๊ฐ๋ฝ์ ์ ์ธ
- 20๊ฐ์ ์บก์์ ์ธ์ฒด ํ์ ํ๋ฉด์ ๋ง์ถค
- ์๋์ผ๋ก ๋ถ์ฐฉํ ์บก์๋ค์ ์์์ผ๋ก, ์บก์๊ณผ ์ธ์ฒด ํ๋ฉด ์ฌ์ด ์๋ฐฉํฅ ๊ฑฐ๋ฆฌ๋ฅผ ์ต์ํํ๊ธฐ ์ํด ๋ฐ์ง๋ฆ๊ณผ ์ถ ๊ธธ์ด๋ฅผ ๊ฒฝ์ฌ ๊ธฐ๋ฐ ์ต์ ํ๋ฅผ ํ๋ค๊ณ . (์บก์ ๊ฐ์ ๊ฑฐ๋ฆฌ ์กฐ์ ํ๋ ๋๋?)
- ์ดํ, ๋ฆฟ์ง ํ๊ท๋ฅผ ์ฌ์ฉํด์ ์ ํ ํ๊ท๊ธฐ๋ฅผ ํ์ต
Objective Function
: ๋ชฉ์ ํจ์ ์ ์
: 5๊ฐ์ง ์ค์ฐจํญ์ ํฉํ๋ ๋ชฉ์ ํจ์๋ฅผ ์ต์
: ๊ด์ ์ด ๊ฐ๋ ค์ง ๊ฒฝ์ฐ, ๊ธฐ์กด ์์ธ ์ฌ์ ์ ์ํด ๊ฒฐ์ ํ๊ฑฐ๋, ํจ๋ํฐ๋ฅผ ์ ์ฉํจ
: ์ฒ์ถ์ ๋ฌด๋ฆ์ด ์์ฐ์ค๋ฝ๊ฒ ๊ตฝํ์ง์ง ์์ ๊ฒฝ์ฐ, ํจ๋ํฐ ์ ์ฉ
โก๏ธ ์์ธ๊ฐ ๋ถ์์ฐ์ค๋ฌ์ธ์๋ก ํจ๋ํฐ๋ฅผ ๋ถ๊ณผํด์ ์กฐ์ ํ๊ฒ ๋ค!
: ๊ทธ๋์ ๋๋ถ๋ถ์ 3D์ ๊ฒฝ์ฐ, ๊ฐ๋ฅ์ฑ์ด ๋ฎ์ ์์ธ๋ณด๋ค ๊ฐ๋ฅ์ฑ์ด ๋์ ์์ธ๋ฅผ ์ ํธํ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ค๊ณ .
Optimization
: ์นด๋ฉ๋ผ์ ์์น, ์ฆ ๋ชธ์ฒด์ ๋ฐฉํฅ์ด ์๋ ค์ง์ง ์์๋ค๊ณ ๊ฐ์
: ์นด๋ฉ๋ผ ์ด์ ๊ฑฐ๋ฆฌ or ๋๋ต์ ์ธ ์ถ์ ์น๋ ์๋ ค์ ธ ์๋ค๊ณ ๊ฐ์ ํจ
: ์ฌ๋์ด ์ด๋ฏธ์ง ํ๋ฉด๊ณผ ํํํ๊ฒ ์์๋ ๊ฒ์ผ๋ก ์ถ์ ํจ
โป (MPL ํ๊ท ํํ์ ์์ฒด ๊ธธ์ด์ ์์ธก๋ 2D ๊ด์ ๋ค์ ์ํด ์ ์๋ ์ ์ฌํ ์ผ๊ฐํ์ ๋น์จ์ ํตํด ๊น์ด๋ฅผ ์ถ์ )
: ๊ฐ์ ์ด ํญ์ ์ฐธ์ด๋ผ๊ณ ํ ์๋ ์๊ธฐ์ ์์ฒด ๊ด์ ๋ค์ ๋ํด์๋ง ์ต์ํํ์ฌ ์ถ์ ์น๋ฅผ ๊ฐ์ ์ํด
: ๋์์ด ์ธก๋ฉด์์ ์ดฌ์๋ ๊ฒฝ์ฐ, ๋ชธ์ฒด๊ฐ ์ด๋ ๋ฐฉํฅ์ ํฅํ๊ณ ์๋์ง ํ๋จํ๋ ๊ฒ์ด ๋ชจํธํ ์ ์์
ex) CNN์ด ์ถ์ ํ 2D ์ด๊นจ ๊ด์ ๊ฐ์ 2D ๊ฑฐ๋ฆฌ๊ฐ ์๊ณ๊ฐ ์๋(์ง์ง ๋น์ ์ ๊ฐ์ด์ข์ธ ๊ฒฝ์ฐ)์ธ ๊ฒฝ์ฐ ⇒ ์ด๊ธฐํ๋ฅผ ๋ ๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ์๋ํ๋ค๊ณ ํจ
- ๋ชธ์ฒด ๋ฐฉํฅ์ ์์ ๋ฐฉ๋ฒ๊ณผ ๊ฐ์ด ์ถ์ ํ๊ณ , ๊ทธ ๋ค์์ผ๋ก ๊ทธ ๋ฐฉํฅ์ 180๋๋ก ํ์ ์์ผ ์ถ์
- EJ(๋ชฉ์ ํจ์)๊ฐ ๊ฐ์ฅ ๋ฎ์ ํผํ ์ ์ฌ์ฉ
<์ฐธ๊ณ >
[Deepcut] https://arxiv.org/pdf/1511.06645v2.pdf
[SMPLify ์์ฝ] https://donologue.tistory.com/393
[MoSh] https://files.is.tue.mpg.de/black/papers/MoSh.pdf
'Deep Learning > [๋ ผ๋ฌธ] Paper Review' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
BodyNet: Volumetric Inference of 3D Human Body Shapes (0) | 2023.08.03 |
---|---|
mixup: Beyond Emprical Risk Minimization (0) | 2023.08.03 |
SMPL: A Skinned Multi-Person Linear Model (0) | 2023.07.28 |
DETR: End-to-End Object Detection with Transformers (0) | 2023.07.23 |
SRNet: Editing Text in the Wild Review (0) | 2023.07.17 |