๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
728x90
๋ฐ˜์‘ํ˜•

๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 27

[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap1(์‹ ๊ฒฝ๋ง ๋ณต์Šต) 1-3) ์‹ ๊ฒฝ๋ง์˜ ํ•™์Šต ๊ณ„์‚ฐ๊ทธ๋ž˜ํ”„ 1. ๋ง์…ˆ ๋…ธ๋“œ 2. ๊ณฑ์…ˆ ๋…ธ๋“œ 3. ๋ถ„๊ธฐ ๋…ธ๋“œ ๋ณต์ œ ๋…ธ๋“œ๋ผ๊ณ ๋„ ํ•จ. 4. Repeat ๋…ธ๋“œ ๋ถ„๊ธฐ ๋…ธ๋“œ๊ฐ€ N๊ฐœ๋กœ ์ผ๋ฐ˜ํ™”(ํ™•์žฅ๋œ ๊ฒฝ์šฐ) 5. Sum ๋…ธ๋“œ Repeat ๋…ธ๋“œ์™€ ๋ฐ˜๋Œ€์ธ ๊ฒฝ์šฐ 6. MatMul ๋…ธ๋“œ affine ๊ณ„์ธต๊ณผ ๊ฐ™๋‹ค๊ณ  ๋ณด๋ฉด ๋จ ( ํ–‰๋ ฌ์˜ ๊ณฑ์…ˆ์„ MatMul ๋…ธ๋“œ๋ผ๊ณ  ํ•จ) 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap2(์ž์—ฐ์–ด) 2.1) ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ž€ ํ‰์†Œ์— ์“ฐ๋Š” ๋ง์„ ์ž์—ฐ์–ด๋ผ๊ณ  ์นญํ•จ(NLP- natural language processing) ์ธ๊ฐ„์˜ ๋ง์„ ์ปดํ“จํ„ฐ์—๊ฒŒ ์ดํ•ด์‹œํ‚ค๊ธฐ ์œ„ํ•œ ๊ธฐ์ˆ ์ด๋ผ๊ณ  ํ•จ ์ถ”๊ตฌํ•˜๊ณ ์ž ํ•˜๋Š” ๋ชฉํ‘œ: ์ปดํ“จํ„ฐ์—๊ฒŒ ์šฐ๋ฆฌ์˜ ๋ง์„ ์ดํ•ด์‹œ์ผœ ์šฐ๋ฆฌ์—๊ฒŒ ๋„์›€์ด ๋˜๋Š” ์ผ์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ํ•˜๊ณ ์ž ํ•จ. 2.1-1) ์ปดํ“จํ„ฐ์—๊ฒŒ ๋‹จ์–ด์˜ ์˜๋ฏธ ์ดํ•ด์‹œํ‚ค๊ธฐ ์‹œ์†Œ๋Ÿฌ์Šค๋ฅผ ํ™œ์šฉํ•œ ๊ธฐ๋ฒ• ํ†ต๊ณ„ ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ• ์ถ”๋ก  ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ•(word2vec) 2.2) ์‹œ์†Œ๋Ÿฌ์Šค ์‹œ์†Œ๋Ÿฌ์Šค๋ž€: ์œ ์˜์–ด ์‚ฌ์ „( ๋™์˜์–ด, ์œ ์˜์–ด ) ๊ฐ€ ํ•œ ๊ทธ๋ฃน์œผ๋กœ ๋ถ„๋ฅ˜๋˜์–ด ์žˆ๋Š” ๊ฒƒ ๋˜๋Š” ํ•˜์œ„, ์ƒ์œ„ ๊ฐœ๋…์„ ๋ฌถ์–ด๋‘” ๊ฒƒ (WordNet) ์‹œ์†Œ๋Ÿฌ์Šค์˜ ๋ฌธ์ œ์ : ์‚ฌ๋žŒ์ด ์ง์ ‘ ๋งŒ๋“ค๊ธฐ์— ์‹œ๋Œ€์˜ ๋ณ€ํ™”์— ์–ด๋ ค์›€ ์ธ๊ฑด๋น„ ๋งŽ์ด ๋“ฌ ๋‹จ์–ด์˜ ๋ฏธ๋ฌ˜ํ•œ ์ฐจ์ด๋ฅผ ํ‘œํ˜„ํ•˜๊ธฐ ์–ด๋ ค์›€ (ex) ๋นˆํ‹ฐ์ง€๋‚˜ ๋ ˆํŠธ๋กœ๋‚˜ ์˜๋ฏธ๋Š” ๊ฐ™์Œ) →๊ตฌ๋ณ„.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap3(word2vec) ์ถ”๋ก  ๊ธฐ๋ฐ˜์˜ ๊ธฐ๋ฒ• ⇒ ๋‹จ์–ด๋ฅผ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜์‹œ์ผœ์„œ ํ•™์Šตํ•˜๋Š” ๊ฒƒ ์ด ๋˜ํ•œ ๋ถ„ํฌ๊ฐ€์„ค์„ ๊ธฐ๋ฐ˜์œผ๋กœ(๋‹จ์–ด์˜ ์˜๋ฏธ๋Š” ์ฃผ๋ณ€ ๋‹จ์–ด์— ์˜ํ•ด ํ˜•์„ฑ๋œ๋‹ค) ํ†ต๊ณ„ ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ•์˜ ๋ฌธ์ œ์  ํ†ต๊ณ„ ๊ธฐ๋ฐ˜์˜ ๊ฒฝ์šฐ, ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ํ•œ๋ฒˆ์— ํ•™์Šต์‹œํ‚ค๊ฒŒ ๋จ. ๋”ฐ๋ผ์„œ ์‹œ๊ฐ„์ด ๊ต‰์žฅํžˆ ์˜ค๋ž˜ ๊ฑธ๋ฆผ ์ด์— ๋”ฐ๋ผ word2vec(์ถ”๋ก ๊ธฐ๋ฐ˜๊ธฐ๋ฒ•)์˜ ๊ฒฝ์šฐ, ๋ฏธ๋‹ˆ๋ฐฐ์น˜๋ฅผ ํ™œ์šฉํ•ด ํ•™์Šตํ•จ ์ถ”๋ก  ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ• ์ถ”๋ก  ๋ฌธ์ œ๋ฅผ ๋ฐ˜๋ณตํ•ด ๋‹จ์–ด์˜ ์ถœํ˜„ ํŒจํ„ด์„ ํ•™์Šตํ•˜๋Š”. ์‹ ๊ฒฝ๋ง์„ ํ™œ์šฉํ•ด ๋‹จ์–ด๋ฅผ ์ฒ˜๋ฆฌ ๋งฅ๋ฝ → ๋ชจ๋ธ → ํ™•๋ฅ ๋ถ„ํฌ ์‹ ๊ฒฝ๋ง์˜ ๊ฒฝ์šฐ, ๋‹จ์–ด๋ฅผ ๊ทธ๋Œ€๋กœ ์ฒ˜๋ฆฌํ•˜์ง€ ๋ชปํ•จ ๋”ฐ๋ผ์„œ ‘๊ณ ์ • ๊ธธ์ด์˜ ๋ฒกํ„ฐ’๋กœ ๋ณ€ํ™˜ํ•ด์•ผ ํ•จ → ์›ํ•ซ ๋ฒกํ„ฐ๋กœ ๋ณ€ํ™˜. ๊ฒฐ๊ตญ์—๋Š” c์—์„œ 1์ธ ์• ๋“ค์˜ ๊ฐ€์ค‘์น˜์˜ ํ–‰ ๋ฒกํ„ฐ๋งŒ ์ถœ๋ ฅ๋จ (๋‚˜๋จธ์ง€๋Š” 0์ด๋ฏ€๋กœ) ๊ตณ์ด ํ–‰๋ ฌ๊ณฑ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์€ ์‹œ๊ฐ„ ๋‚ญ๋น„. ๊ทธ๋ž˜์„œ embedded ๊ณ„์ธต์„ ์‚ฌ์šฉํ•˜๊ฒŒ ๋จ.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap4(word2vec ์†๋„ ๊ฐœ์„ ) Embedding ๊ณ„์ธต negative sampling ์†์‹คํ•จ์ˆ˜ ๋„์ž… ๊ธฐ์กด word2vec์˜ ๋ฌธ์ œ์  ์–ดํœ˜๊ฐ€ 100๋งŒ๊ฐœ๋กœ ๋Š˜์–ด๋‚˜๊ฒŒ ๋  ๊ฒฝ์šฐ, [1] ์ž…๋ ฅ์ธต์˜ ์›ํ•ซ ํ‘œํ˜„๊ณผ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ W_in ์˜ ๊ณฑ ๊ณ„์‚ฐ : 4.1 ์ž„๋ฒ ๋”ฉ ๊ณ„์ธต ๊ตฌํ˜„์œผ๋กœ ํ•ด๊ฒฐ [2] ์€๋‹‰์ธต๊ณผ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ W_out์˜ ๊ณฑ ๋ฐ Softmax ๊ณ„์ธต์˜ ๊ณ„์‚ฐ : 4.2 ๋„ค๊ฑฐํ‹ฐ๋ธŒ ์ƒ˜ํ”Œ๋ง์œผ๋กœ ํ•ด๊ฒฐ 1. Embedding ๊ณ„์ธต matmul ๊ณ„์ธต์„ ๋ณด๋ฉด, ํ•ด๋‹น ์›ํ•ซ๋ฒกํ„ฐ์— ๋งž๋Š” ๋ฒกํ„ฐ๋ฅผ ๋ฝ‘์•„๋‚ด๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Œ → ๋”ฐ๋ผ์„œ ํŠน์ • ํ–‰๋งŒ ์ถ”์ถœํ•˜์ž์˜ ์˜๋ฏธ๋กœ embedding ๊ณ„์ธต์„ ํ™œ์šฉ. forward์˜ ๊ฒฝ์šฐ, index๋งŒ ๋„˜๊ฒจ ์€๋‹‰์ธต(h)๋ฅผ ์–ป๋Š”๋‹ค backward ๋•Œ๋Š” dW ์—…๋ฐ์ดํŠธ ํ•ด์•ผํ•  index๊ฐ€ ๊ฒน์น˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ‘ํ• ๋‹น’์ด ์•„๋‹Œ ‘๋”ํ•˜๊ธฐ’๋ฅผ ํ•ด์•ผ ํ•œ.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap5(์ˆœํ™˜ ์‹ ๊ฒฝ๋ง RNN) 5.1 ํ™•๋ฅ ๊ณผ ์–ธ์–ด ๋ชจ๋ธ 1. ์–ธ์–ด๋ชจ๋ธ ๋‹จ์–ด ๋‚˜์—ด์— ํ™•๋ฅ ์„ ๋ถ€์—ฌ ํŠน์ •ํ•œ ๋‹จ์–ด์˜ ์‹œํ€€์Šค์— ๋Œ€ํ•ด ๊ทธ ์‹œํ€€์Šค๊ฐ€ ์ผ์–ด๋‚  ๊ฐ€๋Šฅ์„ฑ์ด ์–ด๋Š ์ •๋„์ธ๊ฐ€(์–ผ๋งˆ๋‚˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ๋‹จ์–ด ์ˆœ์„œ์ธ์ง€)๋ฅผ ํ™•๋ฅ ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ.ex) you say goodbye ⇒ 0.092 but, you say good die ⇒ 0.0000000032 ์‚ฌ์šฉ ์˜ˆ์‹œ: ๊ธฐ๊ณ„ ๋ฒˆ์—ญ ๋ฐ ์Œ์„ฑ ์ธ์‹์— ์ฃผ๋กœ ์‚ฌ์šฉ, ์ƒˆ๋กœ์šด ๋ฌธ์žฅ ์ƒ์„ฑ ์šฉ๋„ CBOW์™€ ๋‹ฌ๋ฆฌ ์™ผ์ชฝ ์œˆ๋„์šฐ๋งŒ ๋งฅ๋ฝ์œผ๋กœ ๊ณ ๋ คํ•จ. ์ฆ‰, ์–ธ์–ด๋ชจ๋ธ์€ ๋ณ€๊ฒฝ๋œ ์ˆ˜์‹์ฒ˜๋Ÿผ t-2๋ฒˆ์งธ ๋‹จ์–ด, t-1๋ฒˆ์งธ ๋‹จ์–ด๊ฐ€ ๋ฐœ์ƒํ–ˆ์„ ๋•Œ, ๋‹ค์Œ ์ˆœ์„œ๋กœ ๋‚˜์˜ฌ ๋‹จ์–ด์ธ t๋ฒˆ์งธ ๋‹จ์–ด๊ฐ€ ๋ฌด์—‡์œผ๋กœ ๋‚˜์˜ฌ์ง€ ์˜ˆ์ธกํ•˜๋Š” ๋ชจ๋ธ์„ ์˜๋ฏธ. ๋‹ค์Œ ์ˆœ์„œ์— ๋‚˜์˜ฌ ๋‹จ์–ด์˜ ์ž์—ฐ์Šค๋Ÿฌ์›€์„ ํ•˜๋‚˜์˜ ํ™•๋ฅ  ์ง€ํ‘œ๊ฐ’์œผ๋กœ ์˜ˆ์ธก. ๋™์‹œ ํ™•๋ฅ ์ด๋ž€: m๊ฐœ์˜ ๋‹จ์–ด๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•  ๋•Œ, ๋‹จ.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap6(๊ฒŒ์ดํŠธ๊ฐ€ ์ถ”๊ฐ€๋œ RNN) 6.1 RNN์˜ ๋ฌธ์ œ์  ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ ์žฅ๊ธฐ ์˜์กด ๊ด€๊ณ„ ํ•™์Šตํ•˜๋Š”๋ฐ ์–ด๋ ค์›€ ์กด์žฌ ๊ธฐ์šธ๊ธฐ ์†Œ์‹ค ๋ฐ ๊ธฐ์šธ๊ธฐ ํญ๋ฐœ ๋ฌธ์ œ ๋ฐœ์ƒ 1. ๊ธฐ์šธ๊ธฐ ์†Œ์‹ค ์—ญ์ „ํŒŒ์˜ ๊ฒฝ์šฐ, tanh์„ ๋ฏธ๋ถ„ํ•˜๊ฒŒ ๋˜๋ฉด ์ ์  0์— ์ˆ˜๋ ดํ•˜๊ฒŒ ๋จ. ์ด์ „์˜ ๊ธฐ์šธ๊ธฐ ๊ฐ’์„ ๊ณ„์† ๊ณฑํ•˜๋ฉด์„œ ๊ฐฑ์‹ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์†Œ์‹ค์ƒํƒœ ๋ฐœ์ƒ 2. ๊ธฐ์šธ๊ธฐ ํญ๋ฐœ ์—ญ์ „ํŒŒ์˜ ๊ฒฝ์šฐ, matmul ๋…ธ๋“œ์—์„œ dhWh๋ผ๋Š” ํ–‰๋ ฌ ๊ณฑ์œผ๋กœ ๊ธฐ์šธ๊ธฐ ๊ณ„์‚ฐํ•จ ์ด ๋•Œ, ๋งค๋ฒˆ ๊ฐ™์€ ๊ฐ€์ค‘์น˜์ธ Wh๊ฐ€ ์‚ฌ์šฉ๋จ(ํ–‰๋ ฌ๊ณฑ์…ˆ ์œผ๋กœ ์ธํ•ด) ๊ฒฐ๊ตญ ์ž…๋ ฅ์ธต์œผ๋กœ ๊ฐˆ์ˆ˜๋ก ์ ์ฐจ ์ปค์ง€๋‹ค๊ฐ€ ๊ฐ€์ค‘์น˜๋“ค์ด ๋น„์ •์ƒ์ ์œผ๋กœ ํฐ ๊ฐ’์ด ๋˜์–ด๋ฒ„๋ฆผ ๊ธฐ์šธ๊ธฐ ํญ๋ฐœ์— ๋Œ€ํ•œ ํ•ด๊ฒฐ๋ฐฉ์•ˆ ๊ธฐ์šธ๊ธฐ ํด๋ฆฌํ•‘(gradients clipping) ์‚ฌ์šฉ ์‹ ๊ฒฝ๋ง์—์„œ ์‚ฌ์šฉ๋˜๋Š” ๋ชจ๋“  ๋งค๊ฐœ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๊ธฐ์šธ๊ธฐ๋ฅผ ํ•˜๋‚˜๋กœ ์ฒ˜๋ฆฌ g−bar๋Š” L2 ๋…ธ๋ฆ„์„ ์˜๋ฏธ, L2 ๋…ธ๋ฆ„์ด ๋ฌธํ„ฑ๊ฐ’์„ ์ดˆ๊ณผํ•˜๋ฉด.. 2023. 7. 9.
728x90
๋ฐ˜์‘ํ˜•