๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Deep Learning/2023 DL ๊ธฐ์ดˆ ์ด๋ก  ๊ณต๋ถ€

[Standford_cs231n] Lecture 2 ) Image Classification

by ์ œ๋ฃฝ 2023. 7. 8.
728x90
๋ฐ˜์‘ํ˜•

 

 

0. Image Classification
  • Semantic gap: ์ด๋ฏธ์ง€๊ฐ€ ๊ณ ์–‘์ด๋ผ๋Š” ์‚ฌ์‹ค๊ณผ, ์‹ค์ œ ์ปดํ“จํ„ฐ๊ฐ€ ๋ณด๋Š” ์ € ์ˆซ์ž๊ฐ’์—๋Š” ํฐ ๊ฒฉ์ฐจ๊ฐ€ ์กด์žฌ ⇒ ์ด๋ฅผ ์‹œ๋ฉ˜ํ‹ฑ ๊ฐญ์ด๋ผ๊ณ  ์นญํ•จ.
  • ์ฐ๋Š” ๊ตฌ๋„๋‚˜ ์กฐ๋ช…, ์ž์„ธ ๋ณ€ํ™”, ์‚ฌ๋ฌผ์— ๊ฐ€๋ ค์ง€๋Š” ๋“ฑ ์ด๋Ÿฌํ•œ ๋ณ€ํ™”์— ๋”ฐ๋ผ ํ”ฝ์…€๊ฐ’๋“ค์€ ๋ณ€ํ•˜๊ฒŒ ๋˜๋Š”๋ฐ, ๊ทธ๋Ÿผ์—๋„ ์ปดํ“จํ„ฐ๋Š” ‘๊ณ ์–‘์ด’๋ผ๊ณ  ์ธ์‹ ํ•  ์ˆ˜ ์žˆ์–ด์•ผํ•จ.
  • ๊ทธ๋ž˜์„œ ์ด๋ฏธ์ง€์—์„œ edges์„ ์ถ”์ถœํ•˜๊ณ , ๊ท€๋ชจ์–‘์ด๋‚˜ ์ฝ”๋ชจ์–‘ ๊ฐ™์€ ๊ณ ์–‘์ด์—๊ฒŒ ํ•„์š”ํ•œ ์ง‘ํ•ฉ๋“ค์„ ํ•˜๋‚˜์”ฉ ์ฐพ์•„์„œ ์ด๋Ÿฌํ•œ ์ง‘ํ•ฉ๋“ค์ด ๋‹ค ์žˆ์œผ๋ฉด ๊ณ ์–‘์ด๋‹ค ๋ผ๊ณ  ์ธ์‹ํ•˜๊ฒŒ ํ•จ.⇒ ํ•˜์ง€๋งŒ ๋น„ํšจ์œจ์ , ์ž˜ ์ž‘๋™ํ•˜์ง€ ์•Š์Œ
  • ⇒ ๋‹ค๋ฅธ ๊ฐ์ฒด(๊ฐ•์•„์ง€๋‚˜ ์ง‘)๋“ค์„ ์ธ์‹ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๊ทธ ํด๋ž˜์Šค์— ๋งž๋Š” ์ง‘ํ•ฉ์„ ๋˜ ํ•˜๋‚˜์”ฉ ๋‹ค ๋งŒ๋“ค์–ด์ค˜์•ผ ํ•˜๋Š” ๋ฌธ์ œ ๋ฐœ์ƒ.

↔ ์ด๋ž˜์„œ ๋‚˜์˜จ ๋ฐฉ๋ฒ•์ด ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ ์ ‘๊ทผ ๋ฐฉ๋ฒ•(Data-Driven Approach)

  • ํ•œ ๊ฐ์ฒด์— ํ•„์š”ํ•œ ์ง‘ํ•ฉ๋“ค(๊ทœ์น™)์„ ๋งŒ๋“ค์ง€ ์•Š์Œ
  • ์ˆ˜๋งŽ์€ ๊ณ ์–‘์ด ์‚ฌ์ง„๋“ค์„ ์ปดํ“จํ„ฐ์—๊ฒŒ ์ฃผ๊ณ  machine learning classifier์„ ํ•™์Šต์‹œํ‚ด.
1. K-Nearest Neighbor (KNN)
  • Data Driven Approach ์—์„œ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ถ„๋ฅ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•จ.
  • ๊ทธ ์ค‘ ํ•˜๋‚˜๊ฐ€ K-Nearest Neighbor Algorithm
  • K-Nearest Neighbor Algorithm์€ ๋ถ„๋ฅ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ์จ, ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด์™”์„ ๋•Œ ์–ด๋– ํ•œ ๊ธฐ์ค€์œผ๋กœ ๋ถ„๋ฅ˜๋ฅผ ํ•  ๊ฒƒ์ธ๊ฐ€๋ฅผ ์ •ํ•ด์ฃผ๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜.
  • KNN ๊ณผ์ •
    • Train: ๊ทธ๋ƒฅ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์•”๊ธฐ์‹œํ‚ด
    • Predict: ์ƒˆ ์ด๋ฏธ์ง€๋“ค์„ ๋ฐ›์•„ ํ•™์Šต ๋ฐ์ดํ„ฐ ์ค‘ ๊ฐ€์žฅ ๋น„์Šทํ•œ ๊ฒƒ์„ ์ฐพ์•„ ๊ทธ ์ด๋ฏธ์ง€์˜ ๋ ˆ์ด๋ธ”๋กœ ์˜ˆ์ธก.
  • Parameter 1) K๊ฐ’
    • K-NN ์€ Distance metric ์„ ์ด์šฉํ•ด์„œ K๊ฐœ์˜ ๊ฐ€๊นŒ์šด ์ด์›ƒ(๋ฐ์ดํ„ฐ)๋ฅผ ์ฐพ๊ณ , ์ด์›ƒ๋ผ๋ฆฌ ํˆฌํ‘œ๋ฅผ ํ•˜์—ฌ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋ถ„๋ฅ˜๋ฅผ ํ•˜๋Š” ๋ฐฉ๋ฒ•.
    • K๊ฐ’์— ์˜ํ•ด Overfitting (๊ณผ์ ํ•ฉ) ๋ฐฉ์ง€.
    • ๋˜ํ•œ K ๊ฐ’์„ ์กฐ์ ˆํ•˜๋ฉด์„œ, ๊ฒฝ๊ณ„์„ ์„ ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ๋งŒ๋“ค๊ฑฐ๋‚˜ ์˜์—ญ์„ ์ •ํ™•ํ•˜๊ฒŒ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ์Œ.
    • K ๊ฐ’์„ ๋Š˜๋ ค ๋” ๋งŽ์€ ์ด์›ƒ์ด ํˆฌํ‘œ์— ์ฐธ์—ฌํ•˜๋ฉด ๊ฐ์ข… ๋…ธ์ด์ฆˆ๋“ค์— ๋Œ€ํ•ด ์กฐ๊ธˆ ๋” robost ํ•ด์งˆ ๊ฒƒ(๋” ๋‘”๊ฐํ•ด์ง)
    • ๊ฐ€๊นŒ์šด ์ด์›ƒ K๊ฐœ๋ฅผ ์ฐพ๊ณ , ํˆฌํ‘œ๋ฅผ ํ†ตํ•ด ๊ฐ€์žฅ ๋งŽ์€ ๋ ˆ์ด๋ธ”๋กœ ์˜ˆ์ธกํ•จ.
    • K๊ฐ€ ์ฆ๊ฐ€ํ•จ์— ๋”ฐ๋ผ ๊ฒฝ๊ณ„๊ฐ€ ๋ถ€๋“œ๋Ÿฌ์›Œ์ง.
  • Parameter 2) Distance Metric(๊ฑฐ๋ฆฌ์ฒ™๋„)
    • Distance Metric ๋Š” ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ๊ฑฐ๋ฆฌ๋ฅผ ์žด ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ๊ธฐ์ค€
    • ์ฆ‰, ์ƒˆ๋กœ์šด ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜(์˜ˆ์ธก) ํ•  ๋•Œ, ํ•™์Šตํ•œ ์ด๋ฏธ์ง€ ์ค‘ ์–ด๋–ค ์ด๋ฏธ์ง€์™€ ๋น„์Šทํ•œ์ง€ ๋น„๊ตํ•˜๋Š” ์ฒ™๋„.
      • ์™ผ์ชฝ ์ด๋ฏธ์ง€: ์šฐ๋ฆฌ๊ฐ€ ๊ถ๊ธˆํ•œ ํ…Œ์ŠคํŠธ ์ด๋ฏธ์ง€
      • ์˜ค๋ฅธ์ชฝ ์ด๋ฏธ์ง€๋“ค: ํ•™์Šต ์ด๋ฏธ์ง€(ํ…Œ์ŠคํŠธ ์ด๋ฏธ์ง€์™€ ์œ ์‚ฌํ•œ ์ˆœ์„œ๋กœ ์ •๋ ฌ)
      ⇒ ๊ทธ๋ ‡๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ์œ ์‚ฌํ•จ์„ ํŒ๋‹จํ•ด์„œ ์ •๋ ฌ์„ ํ–ˆ์„๊นŒ?
      • Distance Metric - L1 / L2 distance
        1. L1 distance
        • ๊ฐ ํ”ฝ์…€๊ฐ’์„ ๋น„๊ตํ•˜๊ณ , ๊ทธ ์ฐจ์ด์˜ ์ ˆ๋Œ“๊ฐ’์„ ๋ชจ๋‘ ํ•ฉํ•˜์—ฌ ํ•˜๋‚˜์˜ ์ง€ํ‘œ๋กœ ์„ค์ •ํ•จ.
        • ์œ„์˜ ์˜ˆ์ œ๋Š” ๋‘ ์ด๋ฏธ์ง€๊ฐ„์— 456๋งŒํผ ์ฐจ์ด๊ฐ€ ๋‚˜๋Š” ๊ฒƒ์„ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ์Œ.
        1. L2 distance
        • L2 distance ๋Š” ํ•™์Šต๋œ ์ด๋ฏธ์ง€์™€ ํ…Œ์ŠคํŠธ ์ด๋ฏธ์ง€์˜ ํ”ฝ์…€ ๊ฐ„์˜ ์ฐจ์ด์˜ ์ œ๊ณฑ ํ•ฉ์˜ ์ œ๊ณฑ๊ทผ์„ ๊ฑฐ๋ฆฌ๋กœ ์ด์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•.
        • L1 distance ๋Š” ์ขŒํ‘œ์ถ•์— ๋”ฐ๋ผ ๊ฑฐ๋ฆฌ๊ฐ€ ๋‹ฌ๋ผ์ง€๊ธฐ ๋•Œ๋ฌธ์— ํŠน์ • ๋ฒกํ„ฐ๊ฐ€ ๊ฐœ๋ณ„์ ์ธ ์˜๋ฏธ (ex. ํ‚ค, ๋ชธ๋ฌด๊ฒŒ) ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์„๋•Œ ์‚ฌ์šฉํ•จ.
        • ์ผ๋ฐ˜์ ์ธ ๋ฒกํ„ฐ ์š”์†Œ๋“ค์˜ ์˜๋ฏธ๋ฅผ ๋ชจ๋ฅด๊ฑฐ๋‚˜ ์˜๋ฏธ๊ฐ€ ๋ณ„๋กœ ์—†์„ ๋•Œ๋Š” L2 distance๋ฅผ ์‚ฌ์šฉํ•จ.
1.2) + Hyper parameter
  • ์œ„์™€ ๊ฐ™์ด K๊ฐ’ Distance Metric ๊ณผ ๊ฐ™์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋“ค์„ Hyper Parameter ์ด๋ผ๊ณ  ํ•จ.
  • ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์–ด๋–ค ๊ธฐ์ค€์œผ๋กœ ์ •ํ•ด์•ผ ํ•˜๋Š”๊ฐ€?

1. ๋จธ์‹ ๋Ÿฌ๋‹ task ๋Š” training data ๋ฅผ ์ž˜ ๋ถ„๋ฅ˜(์˜ˆ์ธก)ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์ƒˆ๋กœ์šด unseen data ์— ๋Œ€ํ•ด ์ž˜ ๋ถ„๋ฅ˜ํ•ด์•ผ ์˜๋ฏธ๊ฐ€ ์žˆ์Œ.

2. ์ „์ฒด ๋ฐ์ดํ„ฐ์…‹์„ train data ์™€ test data ๋กœ ๋‚˜๋ˆ„์–ด train data๋กœ ํ•™์Šต์„ ์‹œํ‚จ ๋’ค, test data ์—์„œ ๊ฐ€์žฅ ์„ฑ๋Šฅ์ด ๋†’๊ฒŒ ๋‚˜์˜ค๋Š” hyperparameter ๋ฅผ ์‚ฌ์šฉ.

⇒ ํ•˜์ง€๋งŒ test data set์œผ๋กœ๋งŒ ์„ฑ๋Šฅ์„ ๋งค๊ธด ๊ฒƒ์ด unseen data๋ฅผ ๋Œ€ํ‘œํ•˜์ง€๋Š” ๋ชปํ•จ.

3. trainning set, validation set, test set ์œผ๋กœ ๋‚˜๋ˆ„๋Š” ๋ฐฉ๋ฒ•

trainning set, validation set์„ ํ†ตํ•ด hyperparmeter ์— ๋Œ€ํ•ด ์‹คํ—˜ํ•ด๋ณด๊ณ  ๋งˆ์ง€๋ง‰์œผ๋กœ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์ธ test set์„ ํ†ตํ•ด ํ‰๊ฐ€ํ•˜๋Š” ๋ฐฉ๋ฒ•.

4. cross validation

๋งˆ์ง€๋ง‰์— ๋”ฑ ํ•œ๋ฒˆ ์‚ฌ์šฉํ•  ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ๋Š” ๋นผ๋†“์Œ.

๋‚˜๋จธ์ง€ ๋ฐ์ดํ„ฐ๋“ค์„ ์—ฌ๋Ÿฌ ๋ถ€๋ถ„์œผ๋กœ ๋‚˜๋ˆ„์–ด์คŒ.

์ดˆ๋ก์ƒ‰ ๋ฐ์ดํ„ฐ๋กœ ํ•˜์ดํผ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ•™์Šต์‹œํ‚ค๊ณ , ๋…ธ๋ž€์ƒ‰์—์„œ ์ด๋ฅผ ํ‰๊ฐ€ ํ›„ ์ตœ์ ์˜ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฒฐ์ •

  • K-NN ์˜ K ๊ฐ’์„ 5-fold cross-validation ์„ ํ†ตํ•ด ๋‚˜ํƒ€๋‚ด๋ฉด ์•„๋ž˜์˜ ๊ทธ๋ž˜ํ”„์™€ ๊ฐ™์ด ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๊ณ , ์•„๋ž˜์˜ ๊ทธ๋ž˜ํ”„์˜ ๊ฒฝ์šฐ์—๋Š” k ๊ฐ€ ์•ฝ 7์ผ๋•Œ ์ตœ์ ์˜ hyperparameter ๊ฐ€ ๋จ.
1.3) KNN์˜ ํ•œ๊ณ„
  • ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜์— ์ž˜ ์“ฐ์ด์ง€ ์•Š์Œ.
  • 1. test ํ•˜๋Š”๋ฐ ์‹œ๊ฐ„์ด ์˜ค๋ž˜ ๊ฑธ๋ฆผ
  • 2. Distance Metric์€ ํ”ฝ์…€ ๋‹จ์œ„์—์„œ ์œ ์šฉํ•œ ์ •๋ณด๊ฐ€ ์•„๋‹˜
    • 3๊ฐœ์˜ ์™œ๊ณก๋œ ์ด๋ฏธ์ง€๊ฐ€ ์กด์žฌ
    • ์ž…์„ ๋ง‰์€ ์ด๋ฏธ์ง€, ๋ช‡ ํ”ฝ์…€์„ ์•„๋ž˜๋กœ ๋‚ด๋ฆฐ ์ด๋ฏธ์ง€, ํŒŒ๋ž€์ƒ‰ ์ƒ‰์กฐ๋ฅผ ๋„๋„๋ก ๋งŒ๋“  ์ด๋ฏธ์ง€
    • ์›๋ณธ๊ณผ ๋ฐ•์Šค๋ฅผ ๊ทธ๋ฆฐ ์ด๋ฏธ์ง€์˜ ์œ ํด๋ฆฌ๋“œ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ„์‚ฐํ•ด ๋ณด๋ฉด, ์›๋ณธ๊ณผ ์ด๋™ํ•œ ๊ฒƒ, ์›๋ณธ๊ณผ ์ƒ‰์กฐ๊ฐ€ ๋ณ€ํ•œ ๊ฒƒ, ์ด ๋ชจ๋“  ๊ฒƒ์€ ๊ฐ™์€ L2 ๊ฑฐ๋ฆฌ๋ฅผ ๊ฐ€์ง.
    • ์ด๋Ÿฌํ•œ ์ด์œ ๋กœ ์ด๋ฏธ์ง€ ๊ฐ„์˜ ์ด๋Ÿฐ ์ธ์‹์  ์ฐจ์ด๋ฅผ ์žก์•„๋‚ด๋Š”๋ฐ L2 ๊ฑฐ๋ฆฌ๋Š” ์ข‹์€ ๊ฒฐ๊ณผ๋ฅผ ๋‚ด์ง€ ๋ชปํ•จ.
  • 3. ์ฐจ์›์˜ ์ €์ฃผ
    • ํ•™์Šต ๋ฐ์ดํ„ฐ ์ฃผ๋ณ€์œผ๋กœ ํŽ˜์ธํŠธ๋ฅผ ๋–จ์–ด๋œจ๋ ค์„œ ๊ณต๊ฐ„ ๋ถ„๋ฆฌํ•˜๋Š”๋ฐ ์‚ฌ์šฉ
    • ์ฆ‰, Knn์ด ์ž˜ ๋™์ž‘ํ•˜๋ ค๋ฉด ์ „์ฒด ๊ณต๊ฐ„์„ ์กฐ๋ฐ€ํ•˜๊ฒŒ ์ปค๋ฒ„ํ•  ๋งŒํผ์˜ ์ถฉ๋ถ„ํ•œ ํŠธ๋ ˆ์ด๋‹ ์ƒ˜ํ”Œ์ด ํ•„์š”ํ•จ.
    • ๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด ์ตœ๊ทผ์ ‘ ์ด์›ƒ์ด ๊ฝค ๋ฉ€๊ฒŒ ๋˜๊ณ , ํ…Œ์ŠคํŒ… ํฌ์ธํŠธ์™€ ์œ ์‚ฌํ•˜์ง€ ์•Š์„ ์ˆ˜๋„.
    • ๊ณ ์ฐจ์›์˜ ์ด๋ฏธ์ง€์˜ ๊ฒฝ์šฐ ๋ชจ๋“  ๊ณต๊ฐ„์„ ์ปค๋ฒ„ํ•  ๋งŒํผ์˜ ๋ฐ์ดํ„ฐ(ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ)๋ฅผ ๋ชจ์œผ๋Š” ์ผ์€ ํ˜„์‹ค์ ์œผ๋กœ ๋ถˆ๊ฐ€๋Šฅํ•จ.
2. Linear Classification
  • NN(Neural Network)๊ณผ CNN์˜ ๊ธฐ๋ฐ˜์ด ๋˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜
  • ์ปค๋‹ค๋ž€ ๋ ˆ๊ณ  ๋ชจํ˜•์„ Neural Network๋ผ๊ณ  ํ•  ๋•Œ, ๋ ˆ๊ณ  ํ•˜๋‚˜ํ•˜๋‚˜์˜ ์—ญํ• ์„ ํ•˜๋Š” ๊ฒƒ์ด Linear classifier.
  • ๋”ฐ๋ผ์„œ Linear classifier์„ ์ •ํ™•ํžˆ ์ดํ•ดํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•จ.
  • input : 32*32*3, 10๊ฐœ ์นดํ…Œ๊ณ ๋ฆฌ ์ค‘ ํ•˜๋‚˜ ๋ถ„๋ฅ˜
  • W(๊ฐ€์ค‘์น˜): train data์— ๋Œ€ํ•œ ์š”์•ฝ๋œ ์ •๋ณด๊ฐ€ ๋“ค์–ด์žˆ์Œ
  • ๋”ฅ๋Ÿฌ๋‹์€ f(x,W)๋กœ ๋œ ๊ฐ€์„ค ํ•จ์ˆ˜๋ฅผ ์ ์ ˆํ•˜๊ฒŒ ์„ค๊ณ„ํ•˜๋Š” ์ผ.⇒ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ W๋ฅผ ์กฐํ•ฉํ•ด ๊ด€๊ณ„์‹์„ ๋งŒ๋“ฌ ⇒ linear classification (f=wx)
  • B๋Š” bias๋กœ ๋ฐ์ดํ„ฐ์™€ ๋ฌด๊ด€ํ•˜๊ฒŒ ํŠน์ • ํด๋ž˜์Šค์˜ ์šฐ์„ ๊ถŒ์„ ๋ถ€์—ฌํ•จ. ์ฃผ๋กœ dataset์ด unbalanceํ•  ๋•Œ ์‚ฌ์šฉํ•จ.
  • b์˜ ๊ฐ’์„ ์ด์šฉํ•ด์„œ ๋‚ด๊ฐ€ ์›ํ•˜๋Š” ์„ ํ˜•(linear classifier)์— ์ข€ ๋” ์ž˜ ๊ทผ์‚ฌํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•จ.
  • ์ž…๋ ฅ์ด๋ฏธ์ง€๋Š” ํ–‰๋ ฌ์˜ ํ˜•ํƒœ๋กœ W(weight)์™€ ๊ณฑ(๋‚ด์ )ํ•ด์ง€๊ฒŒ ๋˜๊ณ  ๊ฑฐ๊ธฐ์— bias ๋ฅผ ๋”ํ•ด ๊ฐ class ์— ๋Œ€ํ•œ ์ ์ˆ˜๊ฐ€ ๋‚˜์˜ด.
  • ์ฆ‰, ์—ฌ๊ธฐ์„œ ๊ณฑํ•ด์ง€๋Š” w ์˜ ๊ฐ๊ฐ์˜ ํ–‰(row)์ด ๊ฐ ํด๋ž˜์Šค์˜ ํ‰๊ท ์ ์ธ ํ…œํ”Œ๋ฆฟ์ด๋ผ๊ณ  ํ•  ์ˆ˜
  • ์ด๋Š” ๊ฒฐ๊ตญ ํด๋ž˜์Šค์˜ ํƒฌํ”Œ๋ฆฟ๊ณผ ์ธํ’‹ ์ด๋ฏธ์ง€(x)์˜ ์œ ์‚ฌ๋„๋ฅผ ์ธก์ •ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Œ.
  • CIFAR10 ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต์‹œํ‚จ Linear classifier ์˜ ๊ฐ€์ค‘์น˜(W) ํ–‰๋ ฌ์˜ ๊ฐ ํ–‰์„ ์‹œ๊ฐํ™” ํ•œ ์ด๋ฏธ์ง€
  • Linear classifier ์˜ ๋ฌธ์ œ์ ์€ ํ•œ class ๋‚ด์— ๋‹ค์–‘ํ•œ ํŠน์ง•๋“ค์ด ์กด์žฌํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ชจ๋“  ๊ฒƒ๋“ค์„ ํ‰๊ท ํ™” ์‹œํ‚จ๋‹ค๋Š” ์ ์ด ์žˆ์Œ.
  • horse class ์— ๋Œ€ํ•œ W ํ–‰์„ ์‹œ๊ฐํ™”ํ•œ ์ด๋ฏธ์ง€๋ฅผ ํ™•์ธํ•˜๋ฉด ๋ง์˜ ๋จธ๋ฆฌ๊ฐ€ ์–‘์ชฝ์œผ๋กœ ์žˆ๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Œ.
  • ์ด๋Ÿฌํ•œ ์ ์ด ํ•˜๋‚˜์˜ linear classifier ์ด ๊ฐ€์ง€๋Š” ๋ฌธ์ œ๊ฐ€ ๋“œ๋Ÿฌ๋‚˜๋Š” ๋ชจ์Šต์ž„์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ด๋ฏธ์ง€๋ฅผ ๊ณ ์ฐจ์›์˜ ํ•œ ์ ์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด linear classifier์€ ๊ฐ ํด๋ž˜์Šค๋ฅผ ๊ตฌ๋ถ„ํ•˜๋Š” ์„ ํ˜• boundary ์—ญํ• ์„ ํ•˜๊ฒŒ ๋จ

⇒ ํ•˜์ง€๋งŒ ์ด์™€ ๊ฐ™์€ ๋ฐ์ดํ„ฐ๋“ค์€ ์„ ํ˜• ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ†ตํ•ด ๋ถ„๋ฅ˜ํ•˜๊ธฐ ์–ด๋ ค์›€.

 

⇒> lecture 3์—์„œ ์ ํ•ฉํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ๊ณ ๋ฅด๊ธฐ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ๋Œ€ํ•ด ์„ค๋ช…ํ•จ. (์†์‹คํ•จ์ˆ˜)


728x90
๋ฐ˜์‘ํ˜•