๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Deep Learning/2023 DL ๊ธฐ์ดˆ ์ด๋ก  ๊ณต๋ถ€

[Standford_cs231n] Lecture 5 ) Convolutional Neural Networks

by ์ œ๋ฃฝ 2023. 7. 7.
728x90
๋ฐ˜์‘ํ˜•

 

1. Convolutional Neural networks
1. Convolutional Layer Stride
  • ์ŠคํŠธ๋ผ์ด๋“œ(stride)
  • ์ด๋ฏธ์ง€๋ฅผ ์Šฌ๋ผ์ด๋”ฉ ํ•  ๋•Œ ์›€์ง์ด๋Š” step์˜ ํฌ๊ธฐ.
    • ์–˜๋Š” ์ŠคํŠธ๋ผ์ด๋“œ 2
2. Convolutional Layer Pad
  • ํ•„ํ„ฐ ํฌ๊ธฐ์— ๋”ฐ๋ผ์„œ ์ถœ๋ ฅ ๊ฐ€๋กœ ์„ธ๋กœ ๊ธธ์ด๊ฐ€ ์ค„์–ด๋“ฌ
  • padding์„ ์“ฐ๋ฉด ์›๋ณธ ํฌ๊ธฐ ์œ ์ง€, ์ด๋ฏธ์ง€ ๊ฐ€์žฅ์ž๋ฆฌ ๊ณ„์‚ฐ ๋œ ๋˜๋Š” ๊ฒƒ์„ ๋ง‰์„ ์ˆ˜ ์žˆ์Œ
3. Convolutional Layer Output Size
  • W : input image width
  • F : Filter width
  • S : Stride
  • P : Pad
  • Output W : (W - F + 2*P)/S + 1
4. Convolution Layer์˜ Backpropagation
  • ์ฒ˜์Œ์— ํ•„ํ„ฐ๊ฐ€ ๋นจํŒŒ๋…ธ์ดˆ ํ•„ํ„ฐ ์ด๋Ÿฐ์‹์œผ๋กœ ๊ฐ€๋ฉด
  • x11์˜ ๊ฒฝ์šฐ ๋นจ๊ฐ„์ƒ‰ ํ•„ํ„ฐ๋งŒ
  • x12์˜ ๊ฒฝ์šฐ ํŒŒ๋ž€์ƒ‰๊ณผ ๋นจ๊ฐ„์ƒ‰ ํ•„ํ„ฐ
  • x13์˜ ๊ฒฝ์šฐ ํŒŒ๋ž€์ƒ‰๋งŒ
  • x22์˜ ๊ฒฝ์šฐ ๋นจํŒŒ๋…ธ์ดˆ์˜ ํ•„ํ„ฐ๊ฐ€ ๋‹ค ๋“ค์–ด๊ฐ
  • ๊ทธ๋Ÿผ ๊ฒฐ๊ตญ์— S11,s12,s21,s22์˜ ๊ฐ’์ด ๊ฒฐ์ •์ ์œผ๋กœ ๋‚˜์˜ค๊ฒŒ ๋จ.
  • ์ด๋ฅผ ์—ญ์ „ํŒŒํ•  ๊ฒฝ์šฐ,
  • x22์˜ ๊ฒฝ์šฐ ๋นจํŒŒ๋…ธ์ดˆ์˜ 4๊ฐ€์ง€ ๊ฐ€์ค‘์น˜ํ•˜๊ณ  ํ•ฉ์„ฑ๊ณฑ์„ ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— 4๋ฒˆ์˜ ์—ญ์ „ํŒŒ๊ฐ€ ์ง„ํ–‰๋˜์–ด์•ผ ํ•จ.
  • x21์˜ ๊ฒฝ์šฐ, ๋…ธ๋ž€์ƒ‰ ๊ฐ€์ค‘์น˜, ๋นจ๊ฐ„์ƒ‰ ๋‘ ๊ฐœ์˜ ๊ฐ€์ค‘์น˜ํ•˜๊ณ  ํ•ฉ์„ฑ๊ณฑ์„ ์ง„ํ–‰ ⇒ 2๋ฒˆ์˜ ์—ญ์ „ํŒŒ ์ง„ํ–‰
  • ์ด๊ฒƒ์„ ํšจ๊ณผ์ ์œผ๋กœ ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ํ•„ํ„ฐ๋ฅผ ๋’ค์ง‘์œผ๋ฉด ์ˆ˜์›”ํ•˜๊ฒŒ ๊ฐ€๋Šฅ.
  • x22์— ๋Œ€ํ•œ ๋ฏธ๋ถ„ ๊ฐ’์„ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ €๋ ‡๊ฒŒ ๋„ค ๋ฒˆ์˜ ์—ญ์ „ํŒŒ๊ฐ€ ์ง„ํ–‰๋˜์–ด์•ผ ํ•จ.
  • x22 * s11 + x22*s12 + x22*s21 + x22*s22 ์ด ๊ฐ’์ด ๋ฐ”๋กœ ์—ญ์ „ํŒŒํ•œ ๋ฏธ๋ถ„์˜ ๊ฐ’์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Œ
  • ์ด ์›๋ฆฌ๋Š” ๊ฒฐ๊ตญ ํ•„ํ„ฐ๋ฅผ ๋’ค์ง‘์–ด์„œ ๊ณฑํ•œ ๊ฐ’๊ณผ ๊ฐ™์Œ.

๊ธฐ์กด์— ๋นจ-ํŒŒ-๋…ธ-์ดˆ ์˜€๋˜ ํ•„ํ„ฐ๋ฅผ ๋’ค์ง‘์–ด์„œ ์ดˆ-๋…ธ-ํŒŒ-๋นจ๋กœ ํ•˜๊ฒŒ ๋˜๋ฉด ์›ํ•˜๋Š” ๊ฐ’์ด ๊ฒฐ๊ตญ ๋‹ค์‹œ ๊ณ„์‚ฐ ๋จ ⇒ ํ›จ์”ฌ ์ˆ˜์›”ํ•˜๊ฒŒ ๊ณ„์‚ฐ์ด ๋จ. ( ์•„๋ž˜ ๊ทธ๋ฆผ ์ฐธ๊ณ  )

 
https://ratsgo.github.io/deep%20learning/2017/04/05/CNNbackprop/
 
https://www.philgineer.com/2021/02/cnn-5.html

2. Pooling Layer
1. Max Pooling Layer
  • ์ด๋ฏธ์ง€์˜ ํฌ๊ธฐ ์ค„์ด๋Š” ๊ฒƒ
  • ์—ฐ์‚ฐ๋Ÿ‰ ๋†’์ผ ์ˆ˜ ์žˆ์Œ
2. Max Pooling Layer Backpropagation
  • forward์—์„œ ๊ฐ€์žฅ ํฐ ๊ฐ’์„ ๊ฐ€์กŒ๋˜ gradient๋ฅผ ๋ณด๋‚ด๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Œ.
  • max activation ์œ„์น˜ ์ €์žฅํ–ˆ๋‹ค๊ฐ€ ์—ญ์ „ํŒŒ ๋•Œ ์‚ฌ์šฉ.
3. Pooling vs Conv Stride
  • pooling⇒ํฌ๊ธฐ๋ฅผ ์‹ฌํ•˜๊ฒŒ ์ค„์ด๊ธฐ ๋•Œ๋ฌธ์— ์˜ค๋ฒ„ํ”ผํŒ… ๋ฐฉ์ง€ํšจ๊ณผ ๋“ฑ์œผ๋กœ ํ™œ์šฉ
  • ์ ์  ์‚ฌ์šฉ x

 

728x90
๋ฐ˜์‘ํ˜•