๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Deep Learning/2023 DL ๊ธฐ์ดˆ ์ด๋ก  ๊ณต๋ถ€

[Standford_cs231n] Lecture 1 ) Introduction to Convolutional Neural Networks for Visual Recognition

by ์ œ๋ฃฝ 2023. 7. 7.
728x90
๋ฐ˜์‘ํ˜•

 

์ปดํ“จํ„ฐ ๋น„์ „์˜ ์—ญ์‚ฌ
1. ์ปดํ“จํ„ฐ ๋น„์ „์ด๋ž€

⇒ ์ตœ๊ทผ ์ธํ„ฐ๋„ท ํŠธ๋ž˜ํ”ฝ ์ค‘ 80%๊ฐ€ ๋น„๋””์˜ค ๋ฐ์ดํ„ฐ์ผ ๋งŒํผ ์—„์ฒญ๋‚œ ์–‘์˜ ์‹œ๊ฐ์  ๋ฐ์ดํ„ฐ๋“ค์ด ์Ÿ์•„์ ธ ๋‚˜์˜ค๋Š” ๊ฒƒ์„ ์œ ํŠœ๋ธŒ๋งŒ ๋ด๋„ ๋Š๋‚„ ์ˆ˜ ์žˆ์Œ.

์ด ๋ฐ์ดํ„ฐ๋“ค์„ ํšจ๊ณผ์ ์œผ๋กœ ์ดํ•ดํ•˜๊ณ  ๋ถ„์„ํ•ด์„œ, ์ปดํ“จํ„ฐ๋กœ ํ•˜์—ฌ๊ธˆ ์ธ๊ฐ„์˜ ์‹œ๊ฐ์ ์ธ ์ธ์‹ ๋Šฅ๋ ฅ์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋„๋ก ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฐœ๋ฐœํ•˜๊ธฐ ์‹œ์ž‘ํ–ˆ๊ณ , ์ด๊ฒƒ์„ ์ปดํ“จํ„ฐ ๋น„์ „์ด๋ผ ํ•จ.

2. ์ปดํ“จํ„ฐ ๋น„์ „์˜ ์—ญ์‚ฌ
  • 1950s
    • Hubel๊ณผ Wiesel
      • ์ƒ๋ฌผ์˜ ์‹œ๊ฐ์  ๋งค์ปค๋‹ˆ์ฆ˜์„ ์ฐพ๊ณ ์ž ๊ณ ์–‘์ด ๋‡Œ์— ์ „๊ทน์„ ๊ฝ‚์•„ ์‹คํ—˜ ์ง„ํ–‰
      • ๊ณ ์–‘์ด์—๊ฒŒ ์–ด๋– ํ•œ ์‹œ๊ฐ์  ์ž๊ทน์„ ์ฃผ์–ด์•ผ ๊ณ ์–‘์ด์˜ ๋‡Œ์˜ 1์ฐจ ์‹œ๊ฐ ํ”ผ์งˆ์˜ ๋‰ด๋Ÿฐ๋“ค์ด ๊ฒฉ๋ ฌํ•˜๊ฒŒ ๋ฐ˜์‘ํ• ์ง€์— ๋Œ€ํ•ด ์‹คํ—˜ ์ง„ํ–‰
      • ์‹œ๊ฐ์  input์˜ edges๊ฐ€ ์›€์ง์ผ ๋•Œ ๋ฐ˜์‘ํ•˜๋Š” ๋‹จ์ˆœํ•œ ์„ธํฌ์— ์ดˆ์ ์„ ๋‘ 
      "์‹œ๊ฐ ์ฒ˜๋ฆฌ๋Š” edges์™€ ๊ฐ™์€ ๋‹จ์ˆœํ•œ ๊ตฌ์กฐ๋กœ ์‹œ์ž‘๋˜์–ด ์ ์  ๋ณต์žกํ•œ ์š”์†Œ๋“ค์„ ์ฒ˜๋ฆฌํ•˜๊ณ , ๊ถ๊ทน์ ์œผ๋กœ ์‹ค์ œ ์‹œ๊ฐ์  input์„ ์ธ์ง€ํ•  ์ˆ˜ ์žˆ๊ฒŒ๋œ๋‹ค."
  • 1960 ์ดˆ
    • Larry Roberts์˜ Block World
      • ์‚ฌ๋ฌผ๋“ค์„ ๊ธฐํ•˜ํ•™์  ๋ชจ์–‘์œผ๋กœ ๋‹จ์ˆœํ™” ์‹œํ‚ด ⇒ ์‹œ๊ฐ์  ์„ธ์ƒ์„ ์žฌ๊ตฌ์„ฑ ์—ฐ๊ตฌ ์ง„ํ–‰
  • 1966
    • MIT Summer project ์ง„ํ–‰ ( ์‹œ๊ฐ ์ฒด๊ณ„ ๊ตฌํ˜„ )
  • 1970s
    • David Marr์˜ ์ฑ… VISION ์ €์ˆ . ์ปดํ“จํ„ฐ ๋น„์ „์˜ ๊ธฐ๋ณธ์„œ
    • Stanford, SRI์—์„œ๋Š” ๋‹จ์ˆœํ•œ ๋ชจ์–‘์ด๋‚˜ ๊ธฐํ•˜ํ•™์  ๊ตฌ์„ฑ์„ ํ†ตํ•ด ๋ณต์žกํ•œ ๊ฐ์ฒด๋ฅผ ๋‹จ์ˆœํ™”์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆ.
  • 1980s
    • David Lowe๋Š” ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ๋‹จ์ˆœํ•œ ๊ตฌ์กฐ๋กœ ์žฌ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ์„์ง€๋ฅผ ๊ณ ๋ฏผํ•จ.
    • lines, edges, straight lines์˜ ์กฐํ•ฉ๋“ค๋กœ ๊ตฌ์„ฑ.
    • ์—ฌ๊ธฐ๊นŒ์ง€ ์•ผ๋ง์žˆ๋Š” ์‹œ๋„์˜€์œผ๋‚˜ ๋‹จ์ˆœํ•œ ์ˆ˜์ค€์— ๋ถˆ๊ณผํ–ˆ์Œ.
    • ์ด๋•Œ๋ถ€ํ„ฐ ์—ฐ๊ตฌ์ž๋“ค์€ ๊ฐ์ฒด ๋ถ„ํ• ์—๋„ ์ดˆ์ ์„ ๋งž์ถ”์–ด ์ด๋ฏธ์ง€์˜ ๊ฐ ํ”ฝ์…€์„ ์˜๋ฏธ์žˆ๊ฒŒ ๊ตฐ์ง‘ํ™”ํ•˜๋Š” ์—ฐ๊ตฌ๋ฅผ ์‹œ์ž‘ํ•จ.
  • 1999/2000s
    • ๊ธฐ๊ณ„ํ•™์Šต
    • SVM, Boosting, Graphical models, ์ดˆ๊ธฐ NN
    • Paul Viola, Michael Jones: ์‹ค์‹œ๊ฐ„ ์–ผ๊ตด์ธ์‹ ์„ฑ๊ณต(2001)
    • David Lowe: SIFT feature
    • ํŠน์ง•๊ธฐ๋ฐ˜ ๊ฐ์ฒด์ธ์‹ ์•Œ๊ณ ๋ฆฌ์ฆ˜
    • ๋ณ€ํ™”์— ์ข€ ๋” ๊ฐ•์ธํ•˜๊ณ  ๋ถˆ๋ณ€ํ•œ ํŠน์ง•์„ ๋ฐœ๊ฒฌ
    • ์ด๋ฏธ์ง€ ์ „์ฒด๋ฅผ ๋งค์นญํ•˜๋˜ ๊ฒƒ์—์„œ -> ์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ์ค‘์š”ํ•œ ํŠน์ง•๋“ค์„ ์ฐพ์•„๋‚ด์–ด ๋‹ค๋ฅธ ๊ฐ์ฒด์— ๋งค์นญ์‹œํ‚ค๋Š” ๊ฒƒ์ด ๋” ์‰ฝ๋‹ค.
3. + a
  • Spatial Pyramid Matching, Support Vector Algorithm21์„ธ๊ธฐ, ์ธํ„ฐ๋„ท๊ณผ ์นด๋ฉ”๋ผ์˜ ๋ฐœ์ „์œผ๋กœ ์‹คํ—˜ ๋ฐ์ดํ„ฐ๋“ค์˜ ์งˆ์ด ๊ธ‰๊ฒฉํžˆ ์ƒ์Šน.
  • ์ด ๋•Œ๋ถ€ํ„ฐ ์–‘์งˆ์˜ ๋ฐ์ดํ„ฐ์…‹์„ ๋ชจ์œผ๊ธฐ ์œ„ํ•ด ์›€์ง์ด๊ธฐ ์‹œ์ž‘ํ•จ.
  • PASCAL Visual Object Challenge(VOC)์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ…Œ์ŠคํŠธ์— ์‚ฌ์šฉ๋˜์—ˆ๊ณ , ๋ฐ‘์˜ ๊ทธ๋ž˜ํ”„๋Š” 2007๋…„๋ถ€ํ„ฐ 2012๊นŒ์ง€์˜ ๊ฐ์ฒด์ธ์‹ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
  • ImageNet๊ฐ€์žฅ ํฐ ๋ฐ์ดํ„ฐ์…‹์„ ๋งŒ๋“ค์–ด Overfitting์„ ๋ฐฉ์ง€ํ•˜๊ณ  ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ํ‚ค์›Œ ์ด ์„ธ์ƒ ๋ชจ๋“  ๊ฐ์ฒด๋“ค์„ ์ธ์‹ํ•  ์ค€๋น„ํ•จ.2010๋…„๋ถ€ํ„ฐ 2015๋…„๊นŒ์ง€์˜ ์‹คํ—˜ ๊ฒฐ๊ณผ.
    • 2012๋…„์˜ NN ⇒ ์˜ค๋ฅ˜์œจ ๊ธ‰๊ฒฉํžˆ ๊ฐ์†Œ์‹œํ‚ด.⇒ ์ด๋ฅผ ๊ธฐ์ ์œผ๋กœ ๋ฐœ์ „ํ•˜๊ฒŒ ๋จ.
  • ILSVRC ๋Œ€ํšŒ๋ฅผ ์—ด์–ด ํ•ด๋‹น ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ์ง€์†์ ์ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ…Œ์ŠคํŠธ๋ฅผ ์ง„ํ–‰.
728x90
๋ฐ˜์‘ํ˜•