728x90 ๋ฐ์ํ CV15 Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization CAM(Class Activation Maps) ์ด๋? Global Max Pooling(GMP) vs Global Average Pooling(GAP) : ์ ์ฒด ์์ญ ๋ด์์ ๊ฐ์ฅ ํฐ ๊ฐ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ Global Max Pooling(GMP)๋ผ๊ณ ํจ : ๋ฐ๋ฉด, ๋ชจ๋ ๊ฐ์ ๊ณ ๋ คํ์ฌ ํ๊ท ๊ฐ์ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ Global Average Pooling(GAP)์ด๋ผ๊ณ ํจ : ๋ณดํต CNN์ ๊ตฌ์กฐ์์๋๋ง์ง๋ง feature map์ flattenํ์ฌ 1์ฐจ์ ๋ฒกํฐ๋ก ๋ง๋ ๋ค ์ด๋ฅผ Fully Connected Netowork๋ฅผ ํต๊ณผํ์ฌ softmax๋ก classification์ ํ์์. : ์ด FC layer๋ parameter์ ๊ฐ์๋ฅผ ๋งค์ฐ ์ปค์ง๋๋ก ๋ง๋ค๊ธฐ ๋๋ฌธ์ overfitting ์ํ์ด ์ฆ๊ฐํ ์ ์๊ณ , F.. 2023. 8. 13. DINO: Emerging Properties in Self-Supervised Vision Transformers (2021) Self Supervised learning https://brunch.co.kr/@b047a588c11b462/45 : ๋น์ง๋ ํ์ต ๋ฐฉ์์ ์ผ์ข ์ผ๋ก์ ๋ผ๋ฒจ๋ง๋์ง ์์ ๋ฐ์ดํฐ์ ์ ํ์ฉํ์ฌ ์ธ๊ณต์ง๋ฅ์ด ์ค์ค๋ก ๋ถ๋ฅ์์ ์ ์ํํ๋๋ก ํจ : ์ค์ค๋ก ํ์คํฌ๋ฅผ ์ค์ ํ์ฌ ๋ชจ๋ธ์ ํ์ตํ๋ค๋ ์ ์์ ๊ธฐ์กด์ ๋น์ง๋ ํ์ต ๋ฐฉ์๊ณผ ์ฐจ์ด๊ฐ ์กด์ฌํ๋ฉฐ, ์ธํฐ๋ท์ ํฌ๋กค๋ง์ ํตํด ์์งํ ์ ์๋ ํ ์คํธ, ์ด๋ฏธ์ง, ๋น๋์ค ๋ฑ ๋ค์ํ ์ข ๋ฅ์ ๋ฐ์ดํฐ์ ์ ํ์ฉํ ์๋ ์์ : ๋ชจ๋ธ์ด ํ์ฅ๋๊ธฐ ์ํด์๋ ๋๋์ ๋ฐ์ดํฐ๋ฅผ ํ์๋ก ํ์ง๋ง, ๋ผ๋ฒจ๋ง๋ ๋ฐ์ดํฐ๋ฅผ ์ง์์ ์ผ๋ก ํ๋ณดํ๊ธฐ ์ํด์๋ ๋ง์ ๋น์ฉ์ด ์๊ตฌ๋๋ค๋ ๋จ์ ์ด ์กด์ฌ : ์๊ธฐ ์ง๋ ํ์ต์ ๋ผ๋ฒจ๋ง๋์ง ์์ ํ์ต ๋ฐ์ดํฐ๋ง ํ๋ณดํ๋๋ผ๋ ๋ชจ๋ธ์ ๊ท๋ชจ๋ฅผ ์ฆ๊ฐ์ํฌ ์ ์์ผ๋ฉฐ ์ด์ ๋ฐ๋ผ ์ ํ๋ ์ญ์ ํฅ์์ํฌ.. 2023. 8. 10. [3์ฃผ์ฐจ] ๊ฑด๋ฌผ 3Dํ ๋ชจ๋ธ ์ฐพ๊ธฐ GitHub - chrise96/3D_building_reconstruction: MSc Computer Science project. Automatically enhance CityGML LOD2 buildings with facade details, by using a panoramic image sequence and building footprint data. NOTE: Amsterdam Panorama API is currently offline. MSc Computer Science project. Automatically enhance CityGML LOD2 buildings with facade details, by using a panoramic image sequence and buil.. 2023. 7. 28. DETR: End-to-End Object Detection with Transformers ๐ ๋ณธ ๋ ผ๋ฌธ์์๋ object detection์ direct set prediction(์ผ๋์ผ๋์)์ผ๋ก ์ ์, transformer์ bipartite matching loss๋ฅผ ์ฌ์ฉํ DETR(DEtection TRansformer)์ ์ ์ํจ. DETR์ COCO dataset์ ๋ํ์ฌ Faster R-CNN๊ณผ ๋น์ทํ ์์ค์ ์ฑ๋ฅ์ ๋ณด์ ์ถ๊ฐ์ ์ผ๋ก, self-attention์ ํตํ global information(์ ์ญ ์ ๋ณด)๋ฅผ ํ์ฉํจ์ผ๋ก์จ ํฌ๊ธฐ๊ฐ ํฐ ๊ฐ์ฒด๋ฅผ Faster R-CNN๋ณด๋ค ํจ์ฌ ์ ํฌ์ฐฉ. ๐ 1. Backbone(ResNet)์ ์ ๋ ฅํด์ ํผ์ฒ๋งต์ ์ถ์ถ 2. ํผ์ฒ๋งต์ 1x1 conv์ ์ ๋ ฅํด์ flattenํ ํผ์ฒ๋งต์ ๋ํด positional encoding ๊ตฌํด์ ๋ํจ โป spatial.. 2023. 7. 23. Taskonomy: Disentangling Task Transfer Learning ๐ก ๊ฐ ๋ญ๋? Taskonomy๋ ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ ๋ค์ํ ์์ ๊ฐ์ ์ํธ ์์กด์ฑ์ ํ๊ตฌํ๊ณ , ์ด๋ฅผ ํตํด ๋ฒ์ฉ ๋น์ ์์คํ ์ ๊ตฌ์ถํ๋ ์ฐ๊ตฌ. Taskonomy๋ ๋ค์ํ ์์ ๋ค์ ์ํํ๊ธฐ ์ํด ํ์ํ ์๊ฐ์ ํน์ง๋ค์ด ์๋ก ๊ณต์ ๋ ์ ์๋์ง๋ฅผ ์กฐ์ฌํ๊ณ , ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ํ์ต ํจ์จ์ฑ๊ณผ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์๋ ์ ์ด ํ์ต ๋ฐฉ๋ฒ์ ํ๊ตฌ. Taskonomy์ ๋ชฉํ๋ ๋ค์ํ ์์ ๋ค ๊ฐ์ ๊ณต์ ๊ฐ๋ฅํ ์๊ฐ์ ํน์ง์ ํ์ํ์ฌ, ์์ ๊ฐ์ ํ์ต๊ณผ ์ผ๋ฐํ๋ฅผ ๊ฐ์ ํ๊ณ ์์ ์ ํ์ ๋ฐ๋ฅธ ๋น์ฉ๊ณผ ๋ ธ๋ ฅ์ ์ต์ํํ๋ ๊ฒ. ๐ ๋ ผ๋ฌธ ์์ฝ: ์ฌ๋ฌ ์์ ๋ค ๊ฐ์ ๊ณต์ ๊ฐ๋ฅํ ํน์ง๋ค์ ๋ฐ๊ฒฌํ๊ณ ์ด๋ฅผ ํ์ฉํ์ฌ ํ ๋ชจ๋ธ์ด ๋ค์ํ ์์ (๊ฐ์ฒด ๊ฒ์ถ, ์ด๋ฏธ์ง ๋ถ๋ฅ, ์ธ๊ทธ๋ฉํ ์ด์ )์ ์ํํ ์ ์๋๋ก ํจ. ์ด๋ฅผ ์ํด ๋ค์ํ ์์ ๋ค์ ์ํํ๋ฉฐ ์์ง.. 2023. 7. 16. Noisy Student: Self-training with Noisy Student improves ImageNet classification(2019) ๋ฆฌ๋ทฐ๋ ์๋์ชฝ์ ์์ต๋๋น ! ! ๋ฒ์ญ ver 0. Abstract ์ฐ๋ฆฌ๋ Noisy Student Training์ ์ ์ํฉ๋๋ค. ์ด๋ ๋ ์ด๋ธ์ด ํ๋ถํ ๊ฒฝ์ฐ์๋ ์ ์๋ํ๋ ์ค์ง๋ ํ์ต ๋ฐฉ๋ฒ์ ๋๋ค. Noisy Student Training์ ImageNet์์ 88.4%์ top-1 ์ ํ๋๋ฅผ ๋ฌ์ฑํฉ๋๋ค. ์ด๋ 35์ต ๊ฐ์ ์ฝํ ๋ ์ด๋ธ์ด ๋ถ์ฐฉ๋ Instagram ์ด๋ฏธ์ง๊ฐ ํ์ํ ์ต์ฒจ๋จ ๋ชจ๋ธ๋ณด๋ค 2.0% ๋ ๋์ ์ฑ๋ฅ์ ๋๋ค. ๊ฐ๊ฑด์ฑ ํ ์คํธ ์ธํธ์์๋ ImageNet-A์ top-1 ์ ํ๋๋ฅผ 61.0%์์ 83.7%๋ก ํฅ์์ํค๋ฉฐ, ImageNet-C์ ํ๊ท ์์ ์ค์ฐจ๋ฅผ 45.7์์ 28.3์ผ๋ก ์ค์ด๊ณ , ImageNet-P์ ํ๊ท ๋ค์ง๊ธฐ ๋น์จ์ 27.8์์ 12.2๋ก ์ค์ ๋๋ค. Noisy Student Train.. 2023. 7. 14. ์ด์ 1 2 3 ๋ค์ 728x90 ๋ฐ์ํ