๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Deep Learning/[๋…ผ๋ฌธ] Paper Review

AE

by ์ œ๋ฃฝ 2023. 7. 6.
728x90
๋ฐ˜์‘ํ˜•

 

 

AutoEncoder

  • ์ž…๋ ฅ์ด ๋“ค์–ด์™”์„ ๋•Œ, ํ•ด๋‹น ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์ตœ๋Œ€ํ•œ ์••์ถ• ์‹œํ‚จ ํ›„, ์••์ถ• ์‹œํ‚จ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณธ๋ž˜์˜ ์ž…๋ ฅ ํ˜•ํƒœ๋กœ ๋ณต์›์‹œํ‚ค๋Š” ์‹ ๊ฒฝ๋ง
  • ์••์ถ•ํ•˜๋Š” ๋ถ€๋ถ„์„ encoder
  • ๋ณต์›ํ•˜๋Š” ๋ถ€๋ถ„์„ decoder
  • ์••์ถ•๊ณผ์ •์—์„œ ์ถ”์ถœํ•œ ์˜๋ฏธ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ latent vector

AutoEncoder์˜ ์ˆ˜์‹๊ณผ ํ•™์Šต ๋ฐฉ๋ฒ•

  • ์ˆ˜์‹
    • Input Data๋ฅผ Encoder Network์— ํ†ต๊ณผ์‹œ์ผœ ์••์ถ•๋œ z๊ฐ’์„ ์–ป์Œ
    • ์••์ถ•๋œ z vector๋กœ๋ถ€ํ„ฐ Input Data์™€ ๊ฐ™์€ ํฌ๊ธฐ์˜ ์ถœ๋ ฅ ๊ฐ’์„ ์ƒ์„ฑ
    • ์ด๋•Œ Loss๊ฐ’์€ ์ž…๋ ฅ๊ฐ’ x์™€ Decoder๋ฅผ ํ†ต๊ณผํ•œ y๊ฐ’์˜ ์ฐจ์ด
  • ํ•™์Šต ๋ฐฉ๋ฒ•
    • Decoder Network๋ฅผ ํ†ต๊ณผํ•œ Output layer์˜ ์ถœ๋ ฅ ๊ฐ’์€ Input๊ฐ’์˜ ํฌ๊ธฐ์™€ ๊ฐ™์•„์•ผ ํ•จ(๊ฐ™์€ ์ด๋ฏธ์ง€๋ฅผ ๋ณต์›ํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•˜๋ฉด ๋จ)
    • ์ด๋•Œ ํ•™์Šต์„ ์œ„ํ•ด์„œ๋Š” ์ถœ๋ ฅ ๊ฐ’๊ณผ ์ž…๋ ฅ๊ฐ’์ด ๊ฐ™์•„์ ธ์•ผ ํ•จ

Decoder์˜ ์—ญํ• 

  • latent feature์˜ ๊ฒฝ์šฐ, encoder๋กœ๋ถ€ํ„ฐ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•ด๋‚ด๋Š”๋ฐ, ์ด๋•Œ ์ •๋ง ์ž ์žฌ์ ์ธ ํŠน์ง•์„ ๋ฝ‘์•„๋ƒˆ๋Š”๊ฐ€๋ฅผ ํ™•์ธํ•˜๋Š” ์ฐจ์›์—์„œ decoder ๋ถ€ํ„ฐ input x๋ฅผ ๋‹ค์‹œ ํ™œ์šฉ ์—ญ์ „ํŒŒ๋ฅผ ํ•˜๋ฉด์„œ ํŠน์ง•์„ ์ž˜ ๋ฝ‘์•˜๋Š”์ง€๋ฅผ ํ™•์ธํ•˜๋Š” ์šฉ๋„๋กœ ์“ฐ์ž„
  • ์ฆ‰, decoder๋Š” latent vector์„ ์ž˜ ์ฐพ์•„์ฃผ๊ธฐ ์œ„ํ•œ ๋„์šฐ๋ฏธ ์—ญํ• ์ด๋ผ๊ณ  ๋งํ•  ์ˆ˜ ์žˆ์Œ

AutoEncoder ํ™œ์šฉ ์˜ˆ์‹œ

  • AutoEncoder๋Š” ์‹ค์ œ๋กœ Input Data์˜ Feature๋ฅผ ์ถ”์ถœํ•  ๋•Œ ๋งŽ์ด ์‚ฌ์šฉ
  • ์ฃผ๋กœ Dimension Reduction์— ์‚ฌ์šฉ
    • Network parameter ์ดˆ๊ธฐํ™”, pre-training์— ๋งŽ์ด ์‚ฌ์šฉ๋จ
    • ์ด ๋•Œ๋Š” Batch-Norm, Xavier Initialization๊ณผ ๊ฐ™์€ ๊ธฐ๋ฒ•๋“ค์ด ์—†์—ˆ์Œ

Stacking AutoEncoder for pre-training

  • weight ํ•™์Šต์‹œํ‚ค๊ณ  ์ดˆ๊ธฐํ™” ํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•จ

Denoising AutoEncoder

  • AutoEncoder๋Š” Noise๊ฐ€ ์žˆ๋Š” ๋ฐ์ดํ„ฐ์—์„œ๋„ ์ž˜ ์ž‘๋™ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ฐœ์ „๋จ
  • Denoising AutoEncoder๋Š” Encoder์— Noise๊ฐ€ ์žˆ๋Š” Input data๋ฅผ ๋„ฃ์–ด์ฃผ๊ณ , Decoder๋กœ๋ถ€ํ„ฐ ๋‚˜์˜จ Output์ด Noise๊ฐ€ ์ ์šฉ๋˜์ง€ ์•Š์€ Input data์™€ ๊ฐ€๊น๋„๋ก ํ•™์Šต
    • ์ด๋ฅผ ํ†ตํ•ด Noise๊ฐ€ ์žˆ๋Š” ์ƒํ™ฉ์—์„œ๋„ ์•ˆ์ •์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋„์ถœํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•จ
728x90
๋ฐ˜์‘ํ˜•

'Deep Learning > [๋…ผ๋ฌธ] Paper Review' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

R-CNN  (0) 2023.07.06
GAN: Generative Adversarial Nets  (0) 2023.07.06
SPPNet  (0) 2023.07.06
Faster R-CNN  (0) 2023.07.06
YOLO: You Only Look Once: Unified, Real-Time Object Detection  (1) 2023.07.06