๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
728x90
๋ฐ˜์‘ํ˜•

Deep Learning/2023 DL ๊ธฐ์ดˆ ์ด๋ก  ๊ณต๋ถ€28

[๋ชจ๋‘๋ฅผ ์œ„ํ•œ ๋”ฅ๋Ÿฌ๋‹ ์‹œ์ฆŒ 2] lab-10-1~2 lab-10-1~2 2023. 7. 9.
[๋ชจ๋‘๋ฅผ ์œ„ํ•œ ๋”ฅ๋Ÿฌ๋‹ ์‹œ์ฆŒ 2] lab-09-1~4 lab-09-1~4 09-1 ReLU sigmoid์˜ ๊ฒฝ์šฐ, ๋ฏธ๋ถ„๊ฐ’์ด ๊ฑฐ์˜ 0์ด๊ธฐ์— ์—ญ์ „ํŒŒ๋ฅผ ํ•  ๊ฒฝ์šฐ, ์•ž ๋‹จ์—์„œ๋Š” ๊ฑฐ์˜ 0์— ์ˆ˜๋ ดํ•˜๊ฒŒ ๋จ. ๋”ฐ๋ผ์„œ ReLU๊ฐ€ ๋‚˜์˜ค๊ฒŒ ๋จ. 09-2 Weight initialization RBM์€ ๋‘ ๊ฐœ์˜ ์ธต(์ž…๋ ฅ์ธต 1๊ฐœ, ์€๋‹‰์ธต 1๊ฐœ)์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์€ ์•„๋‹˜ ๋‹ค๋งŒ RBM์€ ์‹ฌ์ธต ์‹ ๋ขฐ ์‹ ๊ฒฝ๋ง(DBN:Deep Belief Network)์„ ๊ตฌ์„ฑํ•˜๋Š” ์š”์†Œ๋กœ ์‚ฌ์šฉ X→Y ์ถœ๋ ฅ, ๋ฐ˜๋Œ€๋กœ Y-X’๋กœ๋„ ๋ณต์› ๊ฐ€๋Šฅ ๋ ˆ์ด์–ด ์•ˆ์— ์žˆ๋Š” ๋…ธ๋“œ๋ผ๋ฆฌ๋Š” ์„œ๋กœ ์—ฐ๊ฒฐ x ๋‹ค๋ฅธ layer ์‚ฌ์ด์—๋Š” ์„œ๋กœ ์—ฐ๊ฒฐ o ๋‘ ๋ถ„ํฌ๊ฐ€ ์–ผ๋งˆ๋‚˜ ์œ ์‚ฌํ•œ์ง€ ์ธก์ •ํ•˜๋Š” ๋ฐฉ๋ฒ• (forward ↔ backprop์„ ๋ฐ˜๋ณตํ•˜๋ฉด์„œ bias์™€ weight ์กฐ์ •) RBM์„ ์—ฌ๋Ÿฌ๋ฒˆ ํ•™์Šต ํ•˜๋Š” ๊ฒƒ: DBM pre-tra.. 2023. 7. 9.
[๋ชจ๋‘๋ฅผ ์œ„ํ•œ ๋”ฅ๋Ÿฌ๋‹ ์‹œ์ฆŒ 2] lab-01-1~08-2 lab-01-1~08-2 01-1~2 Tensor Manipulation 1~2 1์ฐจ์›: ๋ฒกํ„ฐ 2์ฐจ์›: ํ–‰๋ ฌ 3์ฐจ์›: ํ…์„œ(๋ฐฐ์—ด์„ ์˜๋ฏธ) 4์ฐจ์›: ํ…์„œ๋ฅผ ์œ„๋กœ ์Œ“์€ ๊ฒƒ 5์ฐจ์›: ํ…์„œ๋ฅผ ์˜†์œผ๋กœ ์Œ“์€ ๊ฒƒ 6์ฐจ์›: 5์ฐจ์›์„ ๋’ค๋กœ ์Œ“์€ ๊ฒƒ batch size=64 dim=256 *๊ฐ€์žฅ ์ „ํ˜•์ ์ธ 2์ฐจ์› ํ…์„œ ๊ฐ€๋กœ: ๋„ˆ๋น„(width) ์„ธ๋กœ: ๋†’์ด(height) length: ๋ฌธ์žฅ๊ธธ์ด dim: ๋‹จ์–ด ๋ฒกํ„ฐ์˜ ์ฐจ์› ex)['๋‚˜๋Š” ์‚ฌ๊ณผ๋ฅผ ์ข‹์•„ํ•ด'] ๋ฌธ์žฅ๊ธธ์ด(length=3) '๋‚˜๋Š”'=[0.1,0.2,0.9] '์‚ฌ๊ณผ๋ฅผ'=[0.3,0.5,0.1] '์ข‹์•„ํ•ด'=[0.5,0.6,0.7] => [[0.1,0.2,0.9], [0.3,0.5,0.1], [0.5,0.6,0.7]] ํŒŒ์ดํ† ์น˜์˜ ๊ฒฝ์šฐ, ์ž๋™์ ์œผ๋กœ ํ–‰๋ ฌ ์ฐจ์›์˜ ์‚ฌ์ด์ฆˆ๋ฅผ ๋งž์ถฐ์ค€๋‹ค.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap1(์‹ ๊ฒฝ๋ง ๋ณต์Šต) 1-3) ์‹ ๊ฒฝ๋ง์˜ ํ•™์Šต ๊ณ„์‚ฐ๊ทธ๋ž˜ํ”„ 1. ๋ง์…ˆ ๋…ธ๋“œ 2. ๊ณฑ์…ˆ ๋…ธ๋“œ 3. ๋ถ„๊ธฐ ๋…ธ๋“œ ๋ณต์ œ ๋…ธ๋“œ๋ผ๊ณ ๋„ ํ•จ. 4. Repeat ๋…ธ๋“œ ๋ถ„๊ธฐ ๋…ธ๋“œ๊ฐ€ N๊ฐœ๋กœ ์ผ๋ฐ˜ํ™”(ํ™•์žฅ๋œ ๊ฒฝ์šฐ) 5. Sum ๋…ธ๋“œ Repeat ๋…ธ๋“œ์™€ ๋ฐ˜๋Œ€์ธ ๊ฒฝ์šฐ 6. MatMul ๋…ธ๋“œ affine ๊ณ„์ธต๊ณผ ๊ฐ™๋‹ค๊ณ  ๋ณด๋ฉด ๋จ ( ํ–‰๋ ฌ์˜ ๊ณฑ์…ˆ์„ MatMul ๋…ธ๋“œ๋ผ๊ณ  ํ•จ) 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap2(์ž์—ฐ์–ด) 2.1) ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ž€ ํ‰์†Œ์— ์“ฐ๋Š” ๋ง์„ ์ž์—ฐ์–ด๋ผ๊ณ  ์นญํ•จ(NLP- natural language processing) ์ธ๊ฐ„์˜ ๋ง์„ ์ปดํ“จํ„ฐ์—๊ฒŒ ์ดํ•ด์‹œํ‚ค๊ธฐ ์œ„ํ•œ ๊ธฐ์ˆ ์ด๋ผ๊ณ  ํ•จ ์ถ”๊ตฌํ•˜๊ณ ์ž ํ•˜๋Š” ๋ชฉํ‘œ: ์ปดํ“จํ„ฐ์—๊ฒŒ ์šฐ๋ฆฌ์˜ ๋ง์„ ์ดํ•ด์‹œ์ผœ ์šฐ๋ฆฌ์—๊ฒŒ ๋„์›€์ด ๋˜๋Š” ์ผ์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ํ•˜๊ณ ์ž ํ•จ. 2.1-1) ์ปดํ“จํ„ฐ์—๊ฒŒ ๋‹จ์–ด์˜ ์˜๋ฏธ ์ดํ•ด์‹œํ‚ค๊ธฐ ์‹œ์†Œ๋Ÿฌ์Šค๋ฅผ ํ™œ์šฉํ•œ ๊ธฐ๋ฒ• ํ†ต๊ณ„ ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ• ์ถ”๋ก  ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ•(word2vec) 2.2) ์‹œ์†Œ๋Ÿฌ์Šค ์‹œ์†Œ๋Ÿฌ์Šค๋ž€: ์œ ์˜์–ด ์‚ฌ์ „( ๋™์˜์–ด, ์œ ์˜์–ด ) ๊ฐ€ ํ•œ ๊ทธ๋ฃน์œผ๋กœ ๋ถ„๋ฅ˜๋˜์–ด ์žˆ๋Š” ๊ฒƒ ๋˜๋Š” ํ•˜์œ„, ์ƒ์œ„ ๊ฐœ๋…์„ ๋ฌถ์–ด๋‘” ๊ฒƒ (WordNet) ์‹œ์†Œ๋Ÿฌ์Šค์˜ ๋ฌธ์ œ์ : ์‚ฌ๋žŒ์ด ์ง์ ‘ ๋งŒ๋“ค๊ธฐ์— ์‹œ๋Œ€์˜ ๋ณ€ํ™”์— ์–ด๋ ค์›€ ์ธ๊ฑด๋น„ ๋งŽ์ด ๋“ฌ ๋‹จ์–ด์˜ ๋ฏธ๋ฌ˜ํ•œ ์ฐจ์ด๋ฅผ ํ‘œํ˜„ํ•˜๊ธฐ ์–ด๋ ค์›€ (ex) ๋นˆํ‹ฐ์ง€๋‚˜ ๋ ˆํŠธ๋กœ๋‚˜ ์˜๋ฏธ๋Š” ๊ฐ™์Œ) →๊ตฌ๋ณ„.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap3(word2vec) ์ถ”๋ก  ๊ธฐ๋ฐ˜์˜ ๊ธฐ๋ฒ• ⇒ ๋‹จ์–ด๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜์‹œ์ผœ์„œ ํ•™์Šตํ•˜๋Š” ๊ฒƒ ์ด ๋˜ํ•œ ๋ถ„ํฌ๊ฐ€์„ค์„ ๊ธฐ๋ฐ˜์œผ๋กœ(๋‹จ์–ด์˜ ์˜๋ฏธ๋Š” ์ฃผ๋ณ€ ๋‹จ์–ด์— ์˜ํ•ด ํ˜•์„ฑ๋œ๋‹ค) ํ†ต๊ณ„ ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ•์˜ ๋ฌธ์ œ์  ํ†ต๊ณ„ ๊ธฐ๋ฐ˜์˜ ๊ฒฝ์šฐ, ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ํ•œ๋ฒˆ์— ํ•™์Šต์‹œํ‚ค๊ฒŒ ๋จ. ๋”ฐ๋ผ์„œ ์‹œ๊ฐ„์ด ๊ต‰์žฅํžˆ ์˜ค๋ž˜ ๊ฑธ๋ฆผ ์ด์— ๋”ฐ๋ผ word2vec(์ถ”๋ก ๊ธฐ๋ฐ˜๊ธฐ๋ฒ•)์˜ ๊ฒฝ์šฐ, ๋ฏธ๋‹ˆ๋ฐฐ์น˜๋ฅผ ํ™œ์šฉํ•ด ํ•™์Šตํ•จ ์ถ”๋ก  ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ• ์ถ”๋ก  ๋ฌธ์ œ๋ฅผ ๋ฐ˜๋ณตํ•ด ๋‹จ์–ด์˜ ์ถœํ˜„ ํŒจํ„ด์„ ํ•™์Šตํ•˜๋Š”. ์‹ ๊ฒฝ๋ง์„ ํ™œ์šฉํ•ด ๋‹จ์–ด๋ฅผ ์ฒ˜๋ฆฌ ๋งฅ๋ฝ → ๋ชจ๋ธ → ํ™•๋ฅ ๋ถ„ํฌ ์‹ ๊ฒฝ๋ง์˜ ๊ฒฝ์šฐ, ๋‹จ์–ด๋ฅผ ๊ทธ๋Œ€๋กœ ์ฒ˜๋ฆฌํ•˜์ง€ ๋ชปํ•จ ๋”ฐ๋ผ์„œ ‘๊ณ ์ • ๊ธธ์ด์˜ ๋ฒกํ„ฐ’๋กœ ๋ณ€ํ™˜ํ•ด์•ผ ํ•จ → ์›ํ•ซ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜. ๊ฒฐ๊ตญ์—๋Š” c์—์„œ 1์ธ ์• ๋“ค์˜ ๊ฐ€์ค‘์น˜์˜ ํ–‰ ๋ฒกํ„ฐ๋งŒ ์ถœ๋ ฅ๋จ (๋‚˜๋จธ์ง€๋Š” 0์ด๋ฏ€๋กœ) ๊ตณ์ด ํ–‰๋ ฌ๊ณฑ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์€ ์‹œ๊ฐ„ ๋‚ญ๋น„. ๊ทธ๋ž˜์„œ embedded ๊ณ„์ธต์„ ์‚ฌ์šฉํ•˜๊ฒŒ ๋จ.. 2023. 7. 9.
728x90
๋ฐ˜์‘ํ˜•