728x90 ๋ฐ์ํ network5 BodyNet: Volumetric Inference of 3D Human Body Shapes BodyNet์ด๋? : ๋จ์ผ ์ด๋ฏธ์ง๋ก๋ถํฐ 2D pose, segmentation ์ถ์ถ, ๋ ๊ฐ์ ์ ๋ณด๋ฅผ ํ์ฉํด 3D pose๋ฅผ ํ์ต, ์ดํ, 3๊ฐ์ง ์ ๋ณด์ RGB ์ ๋ณด๊น์ง ํ์ฉํด 3D์ ๋ถํผ ๊ธฐ๋ฐ ์ฒดํ์ ๊ตฌ์ฑํ๋ Network๋ฅผ ๋งํจ : end to end ํ์ 1. ์ ๋ ฅ RGB ์ด๋ฏธ์ง๋ ๋จผ์ 2D ํฌ์ฆ ์ถ์ ๊ณผ 2D ์ ์ฒด ๋ถ์ ์ธ๊ทธ๋ฉํ ์ด์ ์ ์ํ ํ์ ๋คํธ์ํฌ๋ฅผ ํต๊ณผ 2. 2D pose์ segmentation์ ํ๋ จ 3. ํ์ต๋ 2D pose์ Segmentation ๊ฐ์ค์น๋ฅผ ๊ณ ์ ํด์ 3D pose๋ฅผ ํ๋ จ์ํด 4. ์ดํ, ์ด์ ์ ๋ชจ๋ ๋คํธ์ํฌ ๊ฐ์ค์น๋ฅผ ๊ณ ์ ํ๊ณ 3D ํํ network๋ฅผ ํ๋ จ 5. ์ถ๊ฐ ์ฌํ๋ก์ ์ ์์ค๋ก ํํ ๋คํธ์ํฌ ํ๋ จํด์ ๋ถํผ ๊ธฐ๋ฐ ํํ ์ถ์ ์์ ์ ๋ํด ์ธ๋ฐ ์กฐ์ 6. ๊ฒฐํฉ๋ ์.. 2023. 8. 3. [2์ฃผ์ฐจ] SRNet: Editing Text in the Wild Review 0. Abstract ๋ณธ ๋ ผ๋ฌธ์์๋ ์์ฐ ์ด๋ฏธ์ง์ ํ ์คํธ ํธ์ง์ ๊ด์ฌ์ด ์์ผ๋ฉฐ, ์๋ณธ ์ด๋ฏธ์ง์ ๋จ์ด๋ฅผ ๋ค๋ฅธ ๋จ์ด๋ก ๊ต์ฒดํ๊ฑฐ๋ ์์ ํ์ฌ ์๋ณธ ์ด๋ฏธ์ง์ ์๊ฐ์ ์ผ๋ก ๊ตฌ๋ณํ๊ธฐ ์ด๋ ค์ด ํธ์ง๋ ์ด๋ฏธ์ง๋ฅผ ์ ์งํ๋ ์์ ์ ๋ชฉํ๋ก ํจ ์ธ ๊ฐ์ง ๋ชจ๋๋ก ๊ตฌ์ฑ๋ end-to-end ํ์ต ๊ฐ๋ฅํ ์คํ์ผ ๋ณด์กด ๋คํธ์ํฌ (SRNet)๋ฅผ ์ ์ ํ ์คํธ ๋ณํ ๋ชจ๋: ์๋ณธ ์ด๋ฏธ์ง์ ํ ์คํธ ๋ด์ฉ์ ๋์ ํ ์คํธ๋ก ๋ณ๊ฒฝํ๋ฉด์ ์๋์ ํ ์คํธ ์คํ์ผ์ ์ ์งํฉ๋๋ค. ๋ฐฐ๊ฒฝ ์ธํ์ธํ ๋ชจ๋: ์๋ณธ ํ ์คํธ๋ฅผ ์ง์ฐ๊ณ ์ ์ ํ ํ ์ค์ฒ๋ก ํ ์คํธ ์์ญ์ ์ฑ์๋๋ค. ํจ์ ๋ชจ๋: ๋ ๋ชจ๋์ ์ ๋ณด๋ฅผ ๊ฒฐํฉํ์ฌ ์์ ๋ ํ ์คํธ ์ด๋ฏธ์ง๋ฅผ ์์ฑ ๐ก 1. Text Editing(ํ ์คํธ ํธ์ง) 2. Text Synthesis(ํ ์คํธ ํฉ์ฑ) 3. Text Erasure(ํ ์คํธ ์ญ์ ).. 2023. 7. 17. SRNet: Editing Text in the Wild Review 0. Abstract ๋ณธ ๋ ผ๋ฌธ์์๋ ์์ฐ ์ด๋ฏธ์ง์ ํ ์คํธ ํธ์ง์ ๊ด์ฌ์ด ์์ผ๋ฉฐ, ์๋ณธ ์ด๋ฏธ์ง์ ๋จ์ด๋ฅผ ๋ค๋ฅธ ๋จ์ด๋ก ๊ต์ฒดํ๊ฑฐ๋ ์์ ํ์ฌ ์๋ณธ ์ด๋ฏธ์ง์ ์๊ฐ์ ์ผ๋ก ๊ตฌ๋ณํ๊ธฐ ์ด๋ ค์ด ํธ์ง๋ ์ด๋ฏธ์ง๋ฅผ ์ ์งํ๋ ์์ ์ ๋ชฉํ๋ก ํจ ์ธ ๊ฐ์ง ๋ชจ๋๋ก ๊ตฌ์ฑ๋ end-to-end ํ์ต ๊ฐ๋ฅํ ์คํ์ผ ๋ณด์กด ๋คํธ์ํฌ (SRNet)๋ฅผ ์ ์ ํ ์คํธ ๋ณํ ๋ชจ๋: ์๋ณธ ์ด๋ฏธ์ง์ ํ ์คํธ ๋ด์ฉ์ ๋์ ํ ์คํธ๋ก ๋ณ๊ฒฝํ๋ฉด์ ์๋์ ํ ์คํธ ์คํ์ผ์ ์ ์งํฉ๋๋ค. ๋ฐฐ๊ฒฝ ์ธํ์ธํ ๋ชจ๋: ์๋ณธ ํ ์คํธ๋ฅผ ์ง์ฐ๊ณ ์ ์ ํ ํ ์ค์ฒ๋ก ํ ์คํธ ์์ญ์ ์ฑ์๋๋ค. ํจ์ ๋ชจ๋: ๋ ๋ชจ๋์ ์ ๋ณด๋ฅผ ๊ฒฐํฉํ์ฌ ์์ ๋ ํ ์คํธ ์ด๋ฏธ์ง๋ฅผ ์์ฑ ๐ก 1. Text Editing(ํ ์คํธ ํธ์ง) 2. Text Synthesis(ํ ์คํธ ํฉ์ฑ) 3. Text Erasure(ํ ์คํธ ์ญ์ ).. 2023. 7. 17. EfficientNet 1. Intro ์ด์ ๊น์ง๋ depth, width, size ์ค ํ๋๋ง scale ํ๋ ๊ฒ์ ์ฃผ๋ก ๋ค๋ฃธ⇒ ๋ ๋์ ์ ํ๋ ํน์ ํจ์จ์ฑ์ผ๋ก convnet์ scale up ํ๋ ๋ฐฉ๋ฒ์ด ์์๊น?์์ ๋์จ ์น๊ตฌ depth, width, size ์ธ ๊ฐ์ง ๊ท ํ์ ์ ๋ง์ถ๋ ๊ฒ์ด ์ค์ํจ ์์ ๋น์จ๋ก ์ธ ๊ฐ์ง๋ฅผ ๊ฐ๊ฐ scalingํ๋ฉด ๋๋ค๋ ๊ฒ์ ์๊ฒ ๋จ 2. Model Scaling Convnet์ ์ ํ๋๋ฅผ ๋์ผ ๋ ์ ์ง์ฌ์ง ๋ชจ๋ธ์ ์ฐพ๋ ๋ฐฉ๋ฒ๋ ์์ง๋ง, ๊ธฐ์กด ๋ชจ๋ธ์ ๋ฐํ์ผ๋ก ๋ณต์ก๋๋ฅผ ๋์ด๋ ๋ฐฉ๋ฒ๋ ๋ง์ด ์ฌ์ฉ depth scaling: layer์ ๊ฐ์๋ฅผ ๋์ฌ์ค ex) ResNet width scaling: channel(ํํฐ) ๊ฐ์๋ฅผ ๋์ฌ์ค ex) MobileNet, ShuffleNet resolution sc.. 2023. 7. 7. Inception V2/3 1. Intro CNN์ด ๋ฐ์ ํ๋ฉด์ ๋ชจ๋ธ ํฌ๊ธฐ๋ ๊ณ์ฐ ํจ์จ์ฑ ๋๋ฌธ์ ํ๊ณ ๋ฐ์. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์๋์ ๊ฐ์ ๋ฐฉ์์ ์๊ฐํจ ์๋ ๋ฐฉ๋ฒ์ผ๋ก ILSVRC 2012 daset์ผ๋ก top1 error๊ฐ 17.2%, top5 error๊ฐ 3.58%๋ฅผ ๋ฌ์ฑ VGGNet์ ์ฑ๋ฅ์ ์ข์ง๋ง ํ๋ผ๋ฏธํฐ ๊ฐ์๊ฐ ๋ง์์ ๋น์ฉ ๋ง์ด ๋ฐ์ Inception์ ํ๋ผ๋ฏธํฐ ๊ฐ์ ์ค์ด๊ณ ์ฑ๋ฅ ์ข๋ค๋ ๊ฒฐ๋ก ์ด ๋์ด inception์ด ๊ตฌ์กฐ๊ฐ ๋ณต์กํด์ ์คํ๋ ค ์ต์ ํ ๋ฐฉํด๊ฐ ๋๋ค๋ ๊ฒฐ๊ณผ ๋ฐ์. ์คํ๋ ค ํจ์จ์ฑ์ด ๋จ์ด์ง⇒ ์ด ์น๊ตฌ๋ ๊ตฌ์กฐ๊ฐ ๋ณต์กํด์ ์์ ํ๊ธฐ ์ด๋ ต + ๋จ์ ํ์ฅ์ ๊ฒฝ์ฐ ์คํ๋ ค ๊ณ์ฐ ์ค๋ ๊ฑธ๋ฆฌ๊ฒ ๋จ ⇒ ์ด๋ค ์ด์ ๋ก ์ธํด ํจ์จ์ฑ์ด ์ข์์ง ์ ํํ๊ฒ ์ ์ ์์ด์ ์๋ก์ด ๊ณณ์ ์ ์ฉํ๊ธฐ ์ด๋ ต ํด์ ๋จ์ ๋ค์ ๊ฐ์ ํ๊ธฐ ์ํด ๋์จ ๊ฒ์ด ๋ ผ๋ฌธ์... 2023. 7. 6. ์ด์ 1 ๋ค์ 728x90 ๋ฐ์ํ