๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Deep Learning/2023 DL ๊ธฐ์ดˆ ์ด๋ก  ๊ณต๋ถ€

[Standford_cs231n] Lecture 4 ) Introduction to Neural Networks

by ์ œ๋ฃฝ 2023. 7. 8.
728x90
๋ฐ˜์‘ํ˜•

 

4-1) Computational graphs
4-2) Backpropagation
4-3) Gradient for vectorized code
  • ์•ž์—์„œ ํ•œ ๋‚ด์šฉ๋“ค์€ ์–ด๋–ค ํ•œ ๋ณ€์ˆ˜ ๊ฐ’์œผ๋กœ Gradient์„ ๊ณ„์‚ฐ
  • ํ•˜์ง€๋งŒ ์šฐ๋ฆฌ๊ฐ€ ์‹ค์ œ๋กœ ์‚ฌ์šฉํ•˜๋Š” ์ž…๋ ฅ๊ฐ’์€ scaler ๊ฐ’ ์ด ์•„๋‹Œ vector๊ฐ’
  • ์ด๋Ÿฌํ•œ vector๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋‹ค๋ณ€์ˆ˜ ๋ฒกํ„ฐ ํ•จ์ˆ˜(vector-valued function of multiple variables) ์— ๋Œ€ํ•œ ์ผ์ฐจ๋ฏธ๋ถ„๊ฐ’์ด ํ•„์š”
  • ์ด๋ฅผ Jacobian (์•ผ์ฝ”๋น„์•ˆ) matrix ๋ผ๊ณ  ํ•จ.
4-4) Neural Networks
  • Neural Networks(์ธ๊ณต ์‹ ๊ฒฝ๋ง)์€ ์•ž์—์„œ ๋ฐฐ์šด Linear Classifier์„ 2๊ฐœ ์ด์ƒ ์Œ“์•„์˜ฌ๋ฆฌ๋Š” ํ˜•ํƒœ.
  • ์ด ์‚ฌ์ด์— Non-linear function์„ ์‚ฌ์šฉ.⇒ ๊ธฐ์กด์—๋Š” ์„ ํ˜• ๋ ˆ์ด์–ด ํ•˜๋‚˜๋งŒ ์Œ“์•„์„œ ๋นจ๊ฐ„์ƒ‰ ์ž๋™์ฐจ๋งŒ ์ฐพ์Œ⇒ ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ๋ ˆ์ด์–ด๋ฅผ ์Œ“์•„๊ฐ€๋ฉด์„œ ์—ฌ๋Ÿฌ ํŠน์ง•์„ ์ถ”์ถœํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธ.
  • ⇒ NN์„ ์‚ฌ์šฉํ•˜๋ฉด ๋นจ๊ฐ„์ƒ‰, ๋…ธ๋ž€์ƒ‰ ์ž๋™์ฐจ์™€ ๊ฐ™์ด ์—ฌ๋Ÿฌ ์ƒ‰์„ ์ฐพ์„ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•จ.
  • ์ด์ฒ˜๋Ÿผ ์—ฌ๋Ÿฌ๊ฒน์ธต์˜ ์„ ํ˜• ๋ถ„๋ฅ˜๊ธฐ๋กœ ๊ตฌ์„ฑ๋œ Nerual Network ํ™œ์„ฑํ•จ์ˆ˜(์ž๋ฃŒ์—์„œ๋Š” sigmoid ์˜ˆ์ œ)๋ฅผ ์‚ฌ์šฉํ•ด 0๊ณผ 1์˜ ์‚ฌ์ด ๊ฐ’์œผ๋กœ ๋ถ„๋ฅ˜ํ•ด score๋ฅผ ํ‘œํ˜„.
  • ์ด์™ธ์—๋„ ์•„๋ž˜๊ณผ ๊ฐ™์ด ๋‹ค์–‘ํ•œ ํ™œ์„ฑํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ๋ถ„๋ฅ˜๋ฅผ ํ•จ

728x90
๋ฐ˜์‘ํ˜•