728x90 ๋ฐ์ํ Deep Learning78 [Standford_cs231n] Lecture 1 ) Introduction to Convolutional Neural Networks for Visual Recognition ์ปดํจํฐ ๋น์ ์ ์ญ์ฌ 1. ์ปดํจํฐ ๋น์ ์ด๋ ⇒ ์ต๊ทผ ์ธํฐ๋ท ํธ๋ํฝ ์ค 80%๊ฐ ๋น๋์ค ๋ฐ์ดํฐ์ผ ๋งํผ ์์ฒญ๋ ์์ ์๊ฐ์ ๋ฐ์ดํฐ๋ค์ด ์์์ ธ ๋์ค๋ ๊ฒ์ ์ ํ๋ธ๋ง ๋ด๋ ๋๋ ์ ์์. ⇒ ์ด ๋ฐ์ดํฐ๋ค์ ํจ๊ณผ์ ์ผ๋ก ์ดํดํ๊ณ ๋ถ์ํด์, ์ปดํจํฐ๋ก ํ์ฌ๊ธ ์ธ๊ฐ์ ์๊ฐ์ ์ธ ์ธ์ ๋ฅ๋ ฅ์ ๊ฐ์ง ์ ์๋๋ก ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ๊ธฐ ์์ํ๊ณ , ์ด๊ฒ์ ์ปดํจํฐ ๋น์ ์ด๋ผ ํจ. 2. ์ปดํจํฐ ๋น์ ์ ์ญ์ฌ 1950s Hubel๊ณผ Wiesel ์๋ฌผ์ ์๊ฐ์ ๋งค์ปค๋์ฆ์ ์ฐพ๊ณ ์ ๊ณ ์์ด ๋์ ์ ๊ทน์ ๊ฝ์ ์คํ ์งํ ๊ณ ์์ด์๊ฒ ์ด๋ ํ ์๊ฐ์ ์๊ทน์ ์ฃผ์ด์ผ ๊ณ ์์ด์ ๋์ 1์ฐจ ์๊ฐ ํผ์ง์ ๋ด๋ฐ๋ค์ด ๊ฒฉ๋ ฌํ๊ฒ ๋ฐ์ํ ์ง์ ๋ํด ์คํ ์งํ ์๊ฐ์ input์ edges๊ฐ ์์ง์ผ ๋ ๋ฐ์ํ๋ ๋จ์ํ ์ธํฌ์ ์ด์ ์ ๋ ⇒ "์๊ฐ ์ฒ๋ฆฌ๋ edges์ ๊ฐ์ ๋จ์ํ .. 2023. 7. 7. EfficientNet 1. Intro ์ด์ ๊น์ง๋ depth, width, size ์ค ํ๋๋ง scale ํ๋ ๊ฒ์ ์ฃผ๋ก ๋ค๋ฃธ⇒ ๋ ๋์ ์ ํ๋ ํน์ ํจ์จ์ฑ์ผ๋ก convnet์ scale up ํ๋ ๋ฐฉ๋ฒ์ด ์์๊น?์์ ๋์จ ์น๊ตฌ depth, width, size ์ธ ๊ฐ์ง ๊ท ํ์ ์ ๋ง์ถ๋ ๊ฒ์ด ์ค์ํจ ์์ ๋น์จ๋ก ์ธ ๊ฐ์ง๋ฅผ ๊ฐ๊ฐ scalingํ๋ฉด ๋๋ค๋ ๊ฒ์ ์๊ฒ ๋จ 2. Model Scaling Convnet์ ์ ํ๋๋ฅผ ๋์ผ ๋ ์ ์ง์ฌ์ง ๋ชจ๋ธ์ ์ฐพ๋ ๋ฐฉ๋ฒ๋ ์์ง๋ง, ๊ธฐ์กด ๋ชจ๋ธ์ ๋ฐํ์ผ๋ก ๋ณต์ก๋๋ฅผ ๋์ด๋ ๋ฐฉ๋ฒ๋ ๋ง์ด ์ฌ์ฉ depth scaling: layer์ ๊ฐ์๋ฅผ ๋์ฌ์ค ex) ResNet width scaling: channel(ํํฐ) ๊ฐ์๋ฅผ ๋์ฌ์ค ex) MobileNet, ShuffleNet resolution sc.. 2023. 7. 7. cGAN/Pix2Pix 1. GAN 2. cGAN ์ด๋ค ์ซ์๋ฅผ ๋ง๋ค์ด๋ผ์ง์ ๋ํ ์ ๋ณด๋ฅผ ๋ฃ์ด์ฃผ๋ ๊ฒ(์ด๋ค ํด๋์ค์ ํด๋นํ๋์ง์ ๋ํ ์ ๋ณด) ex) 7์ ๋ง๋ค๊ณ ์ ํ๋ค๋ฉด condition vector์ 7์ ๋ฃ์ด์ฃผ๊ณ , z(noise)์๋ ๋๋คํ๊ฒ ์ํ๋งํด์ 7์ด๋ผ๋ ์๋ฏธ๋ฅผ ๊ฐ์ง๋ ๋๋คํ ํํ๋ฅผ ๋ง๋ค์ด์ค 3. Pix2Pix image to image translation : ์ด๋ฏธ์ง์ ํน์ ์์์ ๋ค๋ฅธ ์์์ผ๋ก ๋ฐ๊ฟ์ฃผ๋ ๊ฒ์ ์๋ฏธ ex) ์๊ทธ๋ฆผ → ์ค์ ์ฌ์ง์ผ๋ก translation ์ด๋ฏธ์ง ์์ฒด๋ฅผ condition์ผ๋ก ๋ฐ์๋ฒ๋ฆผ (์ด๋ฏธ์ง ์์ฒด๊ฐ ์ ๋ณด๊ฐ ๋๋ ๊ฒ์) ์ฆ, ์ด๋ฏธ์ง๊ฐ ๋ค์ด์์ ๋, ๊ฑฐ๊ธฐ์ ๋ถํฉํ๋ output์ ํํ๋ก ๋ง๋ค์ด์ค noise vector z๋ฅผ ์์ pixel ์ ์ ๋ ฅ์ผ๋ก ๋ฐ์ pixel์ ์์ธกํจ (์ด๋ฏธ์ง๋ฅผ ์ด๋ฏธ.. 2023. 7. 7. R-CNN 1. Intro R-CNN 'Rich feature hierarchies for accurate object detection and semantic segmentation'. R-CNN์ region proposals์ CNN์ด ๊ฒฐํฉ๋ Regions with CNN์ ์ฝ์๋ก ์ง์นญ (1) region proposals๋ก object ์์น๋ฅผ ์์๋ด๊ณ , ์ด๋ฅผ CNN์ ์ ๋ ฅํ์ฌ class๋ฅผ ๋ถ๋ฅ. (2) Larger data set์ผ๋ก ํ์ต๋ pre-trained CNN์ fine-tunning. 2. Overall architecture ์ ๋ ฅ ์ด๋ฏธ์ง์ Selective Search ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ์ฌ bounding box(region proposal) 2000๊ฐ๋ฅผ ์ถ์ถ. ์ถ์ถ๋ bounding box๋ฅผ w.. 2023. 7. 6. GAN: Generative Adversarial Nets 0. Abstract ๋ณธ๋ฌธ We propose a new framework for estimating generative models via an adversarial process, in which we simultaneously train two models: a generative model G that captures the data distribution, and a discriminative model D that estimates the probability that a sample came from the training data rather than G. The training procedure for G is to maximize the probability of D making a m.. 2023. 7. 6. AE AutoEncoder ์ ๋ ฅ์ด ๋ค์ด์์ ๋, ํด๋น ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ต๋ํ ์์ถ ์ํจ ํ, ์์ถ ์ํจ ๋ฐ์ดํฐ๋ฅผ ๋ณธ๋์ ์ ๋ ฅ ํํ๋ก ๋ณต์์ํค๋ ์ ๊ฒฝ๋ง ์์ถํ๋ ๋ถ๋ถ์ encoder ๋ณต์ํ๋ ๋ถ๋ถ์ decoder ์์ถ๊ณผ์ ์์ ์ถ์ถํ ์๋ฏธ์๋ ๋ฐ์ดํฐ๋ฅผ latent vector AutoEncoder์ ์์๊ณผ ํ์ต ๋ฐฉ๋ฒ ์์ Input Data๋ฅผ Encoder Network์ ํต๊ณผ์์ผ ์์ถ๋ z๊ฐ์ ์ป์ ์์ถ๋ z vector๋ก๋ถํฐ Input Data์ ๊ฐ์ ํฌ๊ธฐ์ ์ถ๋ ฅ ๊ฐ์ ์์ฑ ์ด๋ Loss๊ฐ์ ์ ๋ ฅ๊ฐ x์ Decoder๋ฅผ ํต๊ณผํ y๊ฐ์ ์ฐจ์ด ํ์ต ๋ฐฉ๋ฒ Decoder Network๋ฅผ ํต๊ณผํ Output layer์ ์ถ๋ ฅ ๊ฐ์ Input๊ฐ์ ํฌ๊ธฐ์ ๊ฐ์์ผ ํจ(๊ฐ์ ์ด๋ฏธ์ง๋ฅผ ๋ณต์ํ๋ค๊ณ ์๊ฐํ๋ฉด ๋จ) ์ด๋ ํ์ต์ ์ํด์.. 2023. 7. 6. ์ด์ 1 ยทยทยท 7 8 9 10 11 12 13 ๋ค์ 728x90 ๋ฐ์ํ