728x90 ๋ฐ์ํ Deep Learning/2023 DL ๊ธฐ์ด ์ด๋ก ๊ณต๋ถ28 [Standford_cs231n] Lecture 6 ) Training Neural Networks I 1. Activation Functions ํ์ฑํ ํจ์: ์ถ๋ ฅ๊ฐ์ ํ์ฑํ๋ฅผ ์ผ์ผํค๊ฒ ํ ๊ฒ์ธ๊ฐ๋ฅผ ์ ํ๊ณ ๊ทธ ๊ฐ์ ๋ถ์ฌํ๋ ํจ์. ์ฌ์ฉํ๋ ์ด์ : Data๋ฅผ ๋น์ ํ์ผ๋ก ๋ฐ๊พธ๊ธฐ ์ํจ ์ ๋น์ ํ์ผ๋ก ๋ฐ๊พธ๋๊ฐ?: ๋ณต์กํ ๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ํด์⇒ ์ ํํจ์์ ๊ฒฝ์ฐ, ๋ง์ด ๊น์ด์ง์ง ์๋๋ค๋ ๋จ์ ์ด ์กด์ฌ. ์๋ฌด๋ฆฌ ๋ณต์กํ๊ฒ ๋ง๋ ๋ค๊ณ ํด๋ ex) h(x)= cx(์ผ์ฐจํจ์) ⇒ 3-layer ⇒ y(x)=h(h(h(x))) ⇒ y(x)=c^3x๋ก ๋ฐ์ ์๋จ. ๊ฒฐ๊ตญ ๊ฐ์ ์ ํ ํจ์์.๋ฐ๋ผ์, ๋ด๋ด๋คํธ์ํฌ์์ ์ธต์ ์๋ ํํ์ ์ป๊ณ ์ถ๋ค๋ฉด, ํ์ฑํํจ์๋ก๋ ๋ฐ๋์ ๋น์ ํ ํจ์๋ฅผ ์ฌ์ฉ. ํ์ฑํ ํจ์๋ฅผ ์ฌ์ฉํ๋ฉด ์ ๋ ฅ์ด ๋ค์ด๊ฐ ๋, ์ถ๋ ฅ๊ฐ์ด ์ ํ์ผ๋ก ๋์ค์ง ์๊ธฐ ๋๋ฌธ์ ๋ง์ ๊น๊ฒ ๋ง๋ค ์ ์๋ค๋ ์ฅ์ ์กด์ฌ. ⇒ ๊ฒฐ๊ตญ linearํ ์ฐ์ฐ.. 2023. 7. 7. [Standford_cs231n] Lecture 7 ) Training Neural Networks II 1. Optimization SGD: ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ๋ฐฉ๋ฒ (๊ฒฝ์ฌํ๊ฐ๋ฒ) Mini batch GD: ๋ฐฐ์น ๋จ์๋ก ๋๋ ์ ๋ฐฐ์น๋ง๋ค ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ SGD + Momentum: ๊ธฐ์กด์ ๊ด์ฑ ํฉ์น ๊ฒ(์๋) ⇒ ๊ณ์ ๊ฐ๋ ค๋ ์ฑ์ง ํ์ฉ NAG: ์ด์ ์๋๋ก ํ๊ฑธ์ ๋ฏธ๋ฆฌ ๊ฐ๋ณด๊ณ ๊ธฐ์ธ๊ธฐ ๊ตฌํด์ ์ ๋ฐ์ดํธํ๋ ๋ฐฉ๋ฒ Adagrad: ์ ์ฒด์ ์์คํจ์ ๊ณก๋ฉด์ ๋ณํ๋ฅผ ํ์ต์์ผ์ ๋ค์ ํ์ต๋ฅ ์ ํด์ฃผ๋ ๊ฒ PMSprop: Adagrad ๋จ์ ๋ณด์ ⇒ ์ต๊ทผ ๊ณก๋ฉด ๋ณํ๋๋ง ๊ฐ์ ธ์์ ํ์ต๋ฅ ์ ํด์ค Adam: pmsprop + momentum 1-1) optimization ์ค๋ช ๋ฅ๋ฌ๋์ ํ์ต์์๋ ์ต๋ํ ํ๋ฆฌ์ง ์๋ ๋ฐฉํฅ์ผ๋ก ํ์ตํด ๋๊ฐ์ผ ํจ. ์ฌ๊ธฐ์ ์ผ๋ง๋ ํ๋ฆฌ๋์ง ์๊ฒ ํ๋ ํจ์๊ฐ ๋ฐ๋ก loss function (์์คํจ์) ์. .. 2023. 7. 7. [Standford_cs231n] Lecture 8 ) Deep Learning Software 1. CPU vs GPU CPU๋ ์ปดํจํฐ์ ๋์ ํด๋นํ๋ ๋ถ๋ถ ์ปดํจํฐ์์ ๊ตฌ์ฑ ๋จ์ ์ค ๊ธฐ์ต, ํด์, ์ฐ์ฐ, ์ ์ด๋ถ๋ถ์ ์ํํ๋ ์ค์ํ ๋ ์์ด๋ค. ์ข ๋ ์ ์ core์ ์๋ก ์ฐ์์ ์ธ ์ผ์ ์ฒ๋ฆฌํ๋๋ฐ CPU๊ฐ ์์ฃผ ์ฐ์ธ๋ค GPU๋ computer graphics๋ฅผ Renderingํ๊ธฐ ์ํด ์ฐ์ด๋ ๋ ์์ด๋ค. ๋ ๋ง์ core๋ก ์ผ์ ๋ณ๋ ฌ์ ์ผ๋ก ์ํํ๊ณ ์ถ์ ๋ GPU๊ฐ ์์ฃผ ์ฐ์ธ๋ค. GPU๋ ๋ด๋ถ์ ์ผ๋ก ์์ฒด์ ์ธ RAM์ ๊ฐ์ง๊ณ ์๋ค. ⇒ GPU์ ์ข ๋ฅ๋ ํฌ๊ฒ ์ธ๊ฐ์ง CUDA OpenCL Udacity 2. Deep Learning Framework ๋ฅ๋ฌ๋ ํ๋ ์ ์ํฌ๋ฅผ ์ฌ์ฉํ๋ ์ด์ ๋? Computational Graph๋ฅผ ์ฝ๊ฒ buildํ๊ธฐ ์ํด Gradient ๊ณ์ฐ์ ์ฝ๊ฒ ํ๊ธฐ ์ํด GPU์์ ํจ๊ณผ์ .. 2023. 7. 7. [Standford_cs231n] Lecture 1 ) Introduction to Convolutional Neural Networks for Visual Recognition ์ปดํจํฐ ๋น์ ์ ์ญ์ฌ 1. ์ปดํจํฐ ๋น์ ์ด๋ ⇒ ์ต๊ทผ ์ธํฐ๋ท ํธ๋ํฝ ์ค 80%๊ฐ ๋น๋์ค ๋ฐ์ดํฐ์ผ ๋งํผ ์์ฒญ๋ ์์ ์๊ฐ์ ๋ฐ์ดํฐ๋ค์ด ์์์ ธ ๋์ค๋ ๊ฒ์ ์ ํ๋ธ๋ง ๋ด๋ ๋๋ ์ ์์. ⇒ ์ด ๋ฐ์ดํฐ๋ค์ ํจ๊ณผ์ ์ผ๋ก ์ดํดํ๊ณ ๋ถ์ํด์, ์ปดํจํฐ๋ก ํ์ฌ๊ธ ์ธ๊ฐ์ ์๊ฐ์ ์ธ ์ธ์ ๋ฅ๋ ฅ์ ๊ฐ์ง ์ ์๋๋ก ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ๊ธฐ ์์ํ๊ณ , ์ด๊ฒ์ ์ปดํจํฐ ๋น์ ์ด๋ผ ํจ. 2. ์ปดํจํฐ ๋น์ ์ ์ญ์ฌ 1950s Hubel๊ณผ Wiesel ์๋ฌผ์ ์๊ฐ์ ๋งค์ปค๋์ฆ์ ์ฐพ๊ณ ์ ๊ณ ์์ด ๋์ ์ ๊ทน์ ๊ฝ์ ์คํ ์งํ ๊ณ ์์ด์๊ฒ ์ด๋ ํ ์๊ฐ์ ์๊ทน์ ์ฃผ์ด์ผ ๊ณ ์์ด์ ๋์ 1์ฐจ ์๊ฐ ํผ์ง์ ๋ด๋ฐ๋ค์ด ๊ฒฉ๋ ฌํ๊ฒ ๋ฐ์ํ ์ง์ ๋ํด ์คํ ์งํ ์๊ฐ์ input์ edges๊ฐ ์์ง์ผ ๋ ๋ฐ์ํ๋ ๋จ์ํ ์ธํฌ์ ์ด์ ์ ๋ ⇒ "์๊ฐ ์ฒ๋ฆฌ๋ edges์ ๊ฐ์ ๋จ์ํ .. 2023. 7. 7. ์ด์ 1 2 3 4 5 ๋ค์ 728x90 ๋ฐ์ํ