728x90 ๋ฐ์ํ Deep Learning/[๋ ผ๋ฌธ] Paper Review38 SMPLify(Keep it SMPL): Automatic Estimation of 3D Human Pose and Shape from a Single Image SMPLify[Keep it SMPL] ์ด๋? : 2D CNN(Deepcut)์ ํ์ฉํด ๊ด์ ์์น๋ฅผ ๋ฝ์ ํ, 3D SMPL์ ์ ์ฉํด 3D Mesh๋ฅผ ๊ตฌ์ฑํ๋ ๋ฐฉ์ ์์ฝ(Abstract) : ์ด๋ฏธ์ง์์ ์ธ๊ฐ์ 3D ํฌ์ฆ์ ํํ๋ฅผ ์๋์ผ๋ก ์ถ์ ํ๊ณ ์ ํจ : CNN ๊ธฐ๋ฒ Deepcut์ ํ์ฉ, 3D SMPL์ ๊ฒฐํฉ : Datasets์ ๊ฒฝ์ฐ, Leeds Spors, HumanEva, Human3.6M ์ฌ์ฉ ์ด์ ๋ฐ ํน์ง(Introduction) : ์ด์ ๋ฐฉ์์ ๊ฒฝ์ฐ, ํฌ์ฆ ์ด์ ์๋ง ๋ง์ท๊ณ , 3D ํํ๋ฅผ ๋ฌด์ํ์ โก๏ธ 2D ์ด๋ฏธ์ง๋ก๋ถํฐ ํฌ์ฆ์ ํํ๋ฅผ ๋ชจ๋ ํฌํจํ๋ 3D ๋ฉ์ฌ๋ฅผ ์๋์ผ๋ก ์ถ์ ํ๋ ํด๊ฒฐ์ฑ ์ ์ ์ํจ Deepcut ํ์ฉํด 2D ๊ด์ ์ถ์ โป DeepCut์ด๋ ๐ [์ฐธ๊ณ ] https://arxiv.or.. 2023. 7. 31. SMPL: A Skinned Multi-Person Linear Model ๐ก SMPL: A Skinned Multi-Person Linear Model ๋ชฉ์ฐจ SMPL์ ์ ์ SMPL ์ฐ๊ตฌ ๋ชฉ์ ๊ธฐ์กด์ ๋ฐฉ๋ฒ ๋ฐ ํ๊ณ SMPL์ ์๋ฆฌ์ ์๋ ์ต์ข DMPL SMPL(Skinned Multi-Person Linear) ์ด๋? [์ฐธ๊ณ ] โก๏ธ SMPL์ ๋ํ ๊ฐ๋จํ ์ค๋ช : skinned vertex ๊ธฐ๋ฐ์ ๋ชจ๋ธ๋ก์, ๋ค์ํ ์ธ๊ฐ์ ์ฒดํ์ ํ์ค์ ์ผ๋ก ๋ํ๋ด๊ณ ์์ฐ์ค๋ฌ์ด ์์ธ์ ๋ฐ๋ฅธ ๋ณํ์ ์ทจํ ์ ์์ผ๋ฉฐ ์ฐ์กฐ์ง ์์ง์์ ๋ํ๋ธ๋ค. โป skinned vertex: ์คํจ(ํผ๋ถ)์ ์์์ง ๋ผ๊ตฌ์กฐ์ ์ํ ๋ฉ์์ ์ ์ (๋ผ์ ์์ง์์ ๋ฐ๋ผ ๋ณํ๋๋ ์ ์ ) SMPL ์ฐ๊ตฌ์ ๋ชฉ์ : ๋ค์ํ ์ฒดํ์ ๋ํํ ์ ์๋ ์ค์ ์ ์ธ ์ ๋๋ฉ์ด์ ์ธ๊ฐ ์ ์ฒด๋ฅผ ๋ง๋ค๊ณ , ์์ฐ์ค๋ฌ์ด ์์ธ์ ๋ฐ๋ผ ์์ฐ์ค๋ฝ๊ฒ ๋ณํ๋๋ฉฐ, .. 2023. 7. 28. DETR: End-to-End Object Detection with Transformers ๐ ๋ณธ ๋ ผ๋ฌธ์์๋ object detection์ direct set prediction(์ผ๋์ผ๋์)์ผ๋ก ์ ์, transformer์ bipartite matching loss๋ฅผ ์ฌ์ฉํ DETR(DEtection TRansformer)์ ์ ์ํจ. DETR์ COCO dataset์ ๋ํ์ฌ Faster R-CNN๊ณผ ๋น์ทํ ์์ค์ ์ฑ๋ฅ์ ๋ณด์ ์ถ๊ฐ์ ์ผ๋ก, self-attention์ ํตํ global information(์ ์ญ ์ ๋ณด)๋ฅผ ํ์ฉํจ์ผ๋ก์จ ํฌ๊ธฐ๊ฐ ํฐ ๊ฐ์ฒด๋ฅผ Faster R-CNN๋ณด๋ค ํจ์ฌ ์ ํฌ์ฐฉ. ๐ 1. Backbone(ResNet)์ ์ ๋ ฅํด์ ํผ์ฒ๋งต์ ์ถ์ถ 2. ํผ์ฒ๋งต์ 1x1 conv์ ์ ๋ ฅํด์ flattenํ ํผ์ฒ๋งต์ ๋ํด positional encoding ๊ตฌํด์ ๋ํจ โป spatial.. 2023. 7. 23. SRNet: Editing Text in the Wild Review 0. Abstract ๋ณธ ๋ ผ๋ฌธ์์๋ ์์ฐ ์ด๋ฏธ์ง์ ํ ์คํธ ํธ์ง์ ๊ด์ฌ์ด ์์ผ๋ฉฐ, ์๋ณธ ์ด๋ฏธ์ง์ ๋จ์ด๋ฅผ ๋ค๋ฅธ ๋จ์ด๋ก ๊ต์ฒดํ๊ฑฐ๋ ์์ ํ์ฌ ์๋ณธ ์ด๋ฏธ์ง์ ์๊ฐ์ ์ผ๋ก ๊ตฌ๋ณํ๊ธฐ ์ด๋ ค์ด ํธ์ง๋ ์ด๋ฏธ์ง๋ฅผ ์ ์งํ๋ ์์ ์ ๋ชฉํ๋ก ํจ ์ธ ๊ฐ์ง ๋ชจ๋๋ก ๊ตฌ์ฑ๋ end-to-end ํ์ต ๊ฐ๋ฅํ ์คํ์ผ ๋ณด์กด ๋คํธ์ํฌ (SRNet)๋ฅผ ์ ์ ํ ์คํธ ๋ณํ ๋ชจ๋: ์๋ณธ ์ด๋ฏธ์ง์ ํ ์คํธ ๋ด์ฉ์ ๋์ ํ ์คํธ๋ก ๋ณ๊ฒฝํ๋ฉด์ ์๋์ ํ ์คํธ ์คํ์ผ์ ์ ์งํฉ๋๋ค. ๋ฐฐ๊ฒฝ ์ธํ์ธํ ๋ชจ๋: ์๋ณธ ํ ์คํธ๋ฅผ ์ง์ฐ๊ณ ์ ์ ํ ํ ์ค์ฒ๋ก ํ ์คํธ ์์ญ์ ์ฑ์๋๋ค. ํจ์ ๋ชจ๋: ๋ ๋ชจ๋์ ์ ๋ณด๋ฅผ ๊ฒฐํฉํ์ฌ ์์ ๋ ํ ์คํธ ์ด๋ฏธ์ง๋ฅผ ์์ฑ ๐ก 1. Text Editing(ํ ์คํธ ํธ์ง) 2. Text Synthesis(ํ ์คํธ ํฉ์ฑ) 3. Text Erasure(ํ ์คํธ ์ญ์ ).. 2023. 7. 17. Taskonomy: Disentangling Task Transfer Learning ๐ก ๊ฐ ๋ญ๋? Taskonomy๋ ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ ๋ค์ํ ์์ ๊ฐ์ ์ํธ ์์กด์ฑ์ ํ๊ตฌํ๊ณ , ์ด๋ฅผ ํตํด ๋ฒ์ฉ ๋น์ ์์คํ ์ ๊ตฌ์ถํ๋ ์ฐ๊ตฌ. Taskonomy๋ ๋ค์ํ ์์ ๋ค์ ์ํํ๊ธฐ ์ํด ํ์ํ ์๊ฐ์ ํน์ง๋ค์ด ์๋ก ๊ณต์ ๋ ์ ์๋์ง๋ฅผ ์กฐ์ฌํ๊ณ , ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ํ์ต ํจ์จ์ฑ๊ณผ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ ์ ์ด ํ์ต ๋ฐฉ๋ฒ์ ํ๊ตฌ. Taskonomy์ ๋ชฉํ๋ ๋ค์ํ ์์ ๋ค ๊ฐ์ ๊ณต์ ๊ฐ๋ฅํ ์๊ฐ์ ํน์ง์ ํ์ํ์ฌ, ์์ ๊ฐ์ ํ์ต๊ณผ ์ผ๋ฐํ๋ฅผ ๊ฐ์ ํ๊ณ ์์ ์ ํ์ ๋ฐ๋ฅธ ๋น์ฉ๊ณผ ๋ ธ๋ ฅ์ ์ต์ํํ๋ ๊ฒ. ๐ ๋ ผ๋ฌธ ์์ฝ: ์ฌ๋ฌ ์์ ๋ค ๊ฐ์ ๊ณต์ ๊ฐ๋ฅํ ํน์ง๋ค์ ๋ฐ๊ฒฌํ๊ณ ์ด๋ฅผ ํ์ฉํ์ฌ ํ ๋ชจ๋ธ์ด ๋ค์ํ ์์ (๊ฐ์ฒด ๊ฒ์ถ, ์ด๋ฏธ์ง ๋ถ๋ฅ, ์ธ๊ทธ๋ฉํ ์ด์ )์ ์ํํ ์ ์๋๋ก ํจ. ์ด๋ฅผ ์ํด ๋ค์ํ ์์ ๋ค์ ์ํํ๋ฉฐ ์์ง.. 2023. 7. 16. Noisy Student: Self-training with Noisy Student improves ImageNet classification(2019) ๋ฆฌ๋ทฐ๋ ์๋์ชฝ์ ์์ต๋๋น ! ! ๋ฒ์ญ ver 0. Abstract ์ฐ๋ฆฌ๋ Noisy Student Training์ ์ ์ํฉ๋๋ค. ์ด๋ ๋ ์ด๋ธ์ด ํ๋ถํ ๊ฒฝ์ฐ์๋ ์ ์๋ํ๋ ์ค์ง๋ ํ์ต ๋ฐฉ๋ฒ์ ๋๋ค. Noisy Student Training์ ImageNet์์ 88.4%์ top-1 ์ ํ๋๋ฅผ ๋ฌ์ฑํฉ๋๋ค. ์ด๋ 35์ต ๊ฐ์ ์ฝํ ๋ ์ด๋ธ์ด ๋ถ์ฐฉ๋ Instagram ์ด๋ฏธ์ง๊ฐ ํ์ํ ์ต์ฒจ๋จ ๋ชจ๋ธ๋ณด๋ค 2.0% ๋ ๋์ ์ฑ๋ฅ์ ๋๋ค. ๊ฐ๊ฑด์ฑ ํ ์คํธ ์ธํธ์์๋ ImageNet-A์ top-1 ์ ํ๋๋ฅผ 61.0%์์ 83.7%๋ก ํฅ์์ํค๋ฉฐ, ImageNet-C์ ํ๊ท ์์ ์ค์ฐจ๋ฅผ 45.7์์ 28.3์ผ๋ก ์ค์ด๊ณ , ImageNet-P์ ํ๊ท ๋ค์ง๊ธฐ ๋น์จ์ 27.8์์ 12.2๋ก ์ค์ ๋๋ค. Noisy Student Train.. 2023. 7. 14. ์ด์ 1 2 3 4 5 ยทยทยท 7 ๋ค์ 728x90 ๋ฐ์ํ