728x90
๋ฐ์ํ
- ๊ธฐ์กด ์ ๊ฒฝ๋ง์ ๋จ์ :
- ๊ณผ์ ํฉ
- Gradient Vanishing
- ++ Internal Covariance Shift ํ์ ๋ฐ์ ( Input ๋ถํฌ๊ฐ ๋ฌ๋ผ์ง์ ๋ฐ๋ผ ํ์ต ์๋๊ฐ ๋๋ ค์ง๋ ํ์
⇒ ์ด๋ฅผ ์ํ์ํค๊ณ ์ ๋ฅ๋ฌ๋์ด ๋์ค๊ฒ ๋จ
๊ณผ์ ํฉ๊ณผ ๊ธฐ์ธ๊ธฐ ๊ฐํด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๋ฅ๋ฌ๋ ๋ฐฉ๋ฒ
drop - out
- ํ์ต ์์๋ dropout ์คํ
- ํ๊ฐ ์์๋ drop out ์ฌ์ฉx (๋ชจ๋ ๋ ธ๋๋ฅผ ํ์ฉํด output ๊ณ์ฐ)
activation ํจ์
- relu ํจ์
- ์ ๋ ฅ ๊ฐ์ด 0 ์ด์ ๋ถ๋ถ์ด๋ฉด ๊ธฐ์ธ๊ธฐ 1, 0 ์ดํ ๋ถ๋ถ์ 0 ⇒ ๋ฐ๋ผ์ ์์ ์์ด์ง๊ฑฐ๋ ์์ ํ ์ด๋ฆฌ๋ ๊ฒ์ผ๋ก ํด์ ๊ฐ๋ฅ
- ⇒ ๋ ์ด์ด๊ฐ ๊น์ด์ ธ๋ Gradient Vanishing์ด ์ผ์ด๋๋ ๊ฒ์ ์ํ์ํด
Batch Normalization
- Internal Covariance Shift ํ์ ๋ง๊ธฐ ์ํด ๋์ด
- ์ ๊ทํ ์ํด
Initialization
- LeCun Initialization
- Xavier Initialization (์ด์ ๋ ์ด์ด์ ๋ ธ๋์์ ๋ค์ ๋ ์ด์ด์ ๋ ธ๋ ์์ ๋ฐ๋ผ ๊ฐ์ค์น ๊ฒฐ์ ์ง์)
- He Initialization ( Relu ํจ์์์๋ ์ฉ์ดํ๊ฒ ์ฐ์ผ ์ ์๋ ์ด๊ธฐํ ๋ฐฉ๋ฒ)
๋งค๊ฐ๋ณ์ ๊ฐฑ์
SGD
- ์กฐ๊ธ์ฉ ์ต์ ํด๋ฅผ ์ฐพ์๊ฐ
- ์ ์ฒด ๋ฐ์ดํฐ์ ๋ํด Back Propagation x
- ๋ฐฐ์น ๋จ์๋ก ์ญ์ ํ ์งํ ⇒ ์ผ์ง์ ์ผ๋ก ๊ฐ์ง ์์
Momentum
- gradiant ๋ฐฉํฅ์ผ๋ก ๊ฐ๋ ๊ด์ฑ ์ถ๊ฐ
- ๋ณดํญ์ ํฌ๊ฒ ํ๋ ๊ฐ๋
- ๋ฐ๋ผ์ ์ต์ ํด๊ฐ ์๋ ์ง์ญํด๋ฅผ ์ง๋์น ์ ์๋ค๋ ์ฅ์
NAG(nesterov Accelerated Gradient)
- momentum์ผ๋ก( ๊ด์ฑ) ์ด๋ ํ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํด ์ด๋ํ๋ ๋ฐฉ์
Adagrad
- ๊ฐ๋ณด์ง ์์ ๊ณณ์ ๋ง์ด ์์ง์ด๊ณ ๊ฐ๋ณธ ๊ณณ์ ์กฐ๊ธ์ฉ ์์ง์ด์!
PMSProp
- Adagrad ๋จ์ ๋ณด์ํ ๋ฐฉ๋ฒ( ์ด์ ๊ฐ์ค์น๋ฅผ ๊ณ์ ๊ณฑํ๊ธฐ์ ์ด๋ ์๊ฐ 0์ด ๋จ)
Adadelta
- Adagrad ๋จ์ ๋ณด์ํ ๋ฐฉ๋ฒ
- ๊ธฐ์ธ๊ธฐ์ ์์ด ๋๋ฌด ์ ์ด์ง๋ฉด ์์ง์์ด ๋ฉ์ถ ์๋
Adam
- RMSProp + Momentum
RAdam
- ํ์ต ์ด๊ธฐ์ ๊ธฐ์ธ๊ธฐ๊ฐ ๋งค์ฐ ์์์ ธ์ ํ์ต์ด ๋์ด์ ์ผ์ด๋์ง ์๋ ํ์ ๋ฐ์ → ์ด๋ฅผ ๋ณด์ํ ๊ฒ์ด RAdam
๋น์ง๋ํ์ต
- ํ๊ท์ ๋ถ๋ฅ ๋ชจ๋ธ์ ๊ฒฝ์ฐ ์ง๋ํ์ต but ๋น์ง๋ ํ์ต๋ ์ ์ฐจ ๊ฐ๋ฐ๋จ
GAN
SAE(Stacked AutoEncoder) ์ธต์ผ๋ก ์์
- AE์ ์๋ก์ด ํผ์ฒ๊ฐ ์ ์๋ฏธ ํ๋ค๋ฉด ์ด ํผ์ฒ๋ฅผ ์์ ์ฌ๋ ค์ ํ์ต → ๋ ์ข์ ํ์ต ๋ชจ๋ธ์ด ๋ ๊ฒ์ด๋ค!
- input data๋ก AE1 ํ์ต
- 1์์ ํ์ต๋ ๋ชจํ์ ์๋์ธต(๋ฏผํธ์)์ ์ ๋ ฅ ๋ฐ์ดํฐ๋ก ๋ฐ์ ํ AE2 ํ์ต
- ๋ฐ๋ณต
- ๋ง์ง๋ง์๋ ๋ถ๋ฅ ๊ธฐ๋ฅ ํจ์ (softmax) ๋ฅผ ์ฌ์ฉ
- fine tuning์ผ๋ก ๋ค์ถฉ ์ ๊ฒฝ๋ง ๋ค์ ์ฌํ์ต
DAE(Denoising AutoEncoder) noise
- ์๊ฐ ๋ ์ํฉ์์ ์ด์ ์ ์ฐ์ตํ๋ฉด ์ค์ ์ ๋์์ด ๋๋ค!์ ์๋ฏธ
- input : x+ noise
- output: x
- ์ธํ์ noise๋ฅผ ์ฒ์์ ์ค์ ์ค์ ์ด๋ค ๋ฐ์ดํฐ๊ฐ ๋ค์ด์๋ ๊ฐ๊ฑดํ ๋ชจ๋ธ ๋ง๋ค๊ฒ ๋ค!
728x90
๋ฐ์ํ
'Deep Learning > 2023 DL ๊ธฐ์ด ์ด๋ก ๊ณต๋ถ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 1] chap7(ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง) (0) | 2023.07.08 |
---|---|
[๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 1] chap8 ๋ฅ๋ฌ๋ (0) | 2023.07.08 |
[ํ์ด์ฌ ๋ฅ๋ฌ๋ ํ์ดํ ์น] Part5 (0) | 2023.07.08 |
[Standford_cs231n] Lecture 2 ) Image Classification (0) | 2023.07.08 |
[Standford_cs231n] Lecture 3 ) Loss Functions and Optimization (0) | 2023.07.08 |