๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
728x90
๋ฐ˜์‘ํ˜•

Deep Learning/2023 DL ๊ธฐ์ดˆ ์ด๋ก  ๊ณต๋ถ€28

[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap4(word2vec ์†๋„ ๊ฐœ์„ ) Embedding ๊ณ„์ธต negative sampling ์†์‹คํ•จ์ˆ˜ ๋„์ž… ๊ธฐ์กด word2vec์˜ ๋ฌธ์ œ์  ์–ดํœ˜๊ฐ€ 100๋งŒ๊ฐœ๋กœ ๋Š˜์–ด๋‚˜๊ฒŒ ๋  ๊ฒฝ์šฐ, [1] ์ž…๋ ฅ์ธต์˜ ์›ํ•ซ ํ‘œํ˜„๊ณผ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ W_in ์˜ ๊ณฑ ๊ณ„์‚ฐ : 4.1 ์ž„๋ฒ ๋”ฉ ๊ณ„์ธต ๊ตฌํ˜„์œผ๋กœ ํ•ด๊ฒฐ [2] ์€๋‹‰์ธต๊ณผ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ W_out์˜ ๊ณฑ ๋ฐ Softmax ๊ณ„์ธต์˜ ๊ณ„์‚ฐ : 4.2 ๋„ค๊ฑฐํ‹ฐ๋ธŒ ์ƒ˜ํ”Œ๋ง์œผ๋กœ ํ•ด๊ฒฐ 1. Embedding ๊ณ„์ธต matmul ๊ณ„์ธต์„ ๋ณด๋ฉด, ํ•ด๋‹น ์›ํ•ซ๋ฒกํ„ฐ์— ๋งž๋Š” ๋ฒกํ„ฐ๋ฅผ ๋ฝ‘์•„๋‚ด๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Œ → ๋”ฐ๋ผ์„œ ํŠน์ • ํ–‰๋งŒ ์ถ”์ถœํ•˜์ž์˜ ์˜๋ฏธ๋กœ embedding ๊ณ„์ธต์„ ํ™œ์šฉ. forward์˜ ๊ฒฝ์šฐ, index๋งŒ ๋„˜๊ฒจ ์€๋‹‰์ธต(h)๋ฅผ ์–ป๋Š”๋‹ค backward ๋•Œ๋Š” dW ์—…๋ฐ์ดํŠธ ํ•ด์•ผํ•  index๊ฐ€ ๊ฒน์น˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ‘ํ• ๋‹น’์ด ์•„๋‹Œ ‘๋”ํ•˜๊ธฐ’๋ฅผ ํ•ด์•ผ ํ•œ.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap5(์ˆœํ™˜ ์‹ ๊ฒฝ๋ง RNN) 5.1 ํ™•๋ฅ ๊ณผ ์–ธ์–ด ๋ชจ๋ธ 1. ์–ธ์–ด๋ชจ๋ธ ๋‹จ์–ด ๋‚˜์—ด์— ํ™•๋ฅ ์„ ๋ถ€์—ฌ ํŠน์ •ํ•œ ๋‹จ์–ด์˜ ์‹œํ€€์Šค์— ๋Œ€ํ•ด ๊ทธ ์‹œํ€€์Šค๊ฐ€ ์ผ์–ด๋‚  ๊ฐ€๋Šฅ์„ฑ์ด ์–ด๋Š ์ •๋„์ธ๊ฐ€(์–ผ๋งˆ๋‚˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ๋‹จ์–ด ์ˆœ์„œ์ธ์ง€)๋ฅผ ํ™•๋ฅ ๋กœ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ.ex) you say goodbye ⇒ 0.092 but, you say good die ⇒ 0.0000000032 ์‚ฌ์šฉ ์˜ˆ์‹œ: ๊ธฐ๊ณ„ ๋ฒˆ์—ญ ๋ฐ ์Œ์„ฑ ์ธ์‹์— ์ฃผ๋กœ ์‚ฌ์šฉ, ์ƒˆ๋กœ์šด ๋ฌธ์žฅ ์ƒ์„ฑ ์šฉ๋„ CBOW์™€ ๋‹ฌ๋ฆฌ ์™ผ์ชฝ ์œˆ๋„์šฐ๋งŒ ๋งฅ๋ฝ์œผ๋กœ ๊ณ ๋ คํ•จ. ์ฆ‰, ์–ธ์–ด๋ชจ๋ธ์€ ๋ณ€๊ฒฝ๋œ ์ˆ˜์‹์ฒ˜๋Ÿผ t-2๋ฒˆ์งธ ๋‹จ์–ด, t-1๋ฒˆ์งธ ๋‹จ์–ด๊ฐ€ ๋ฐœ์ƒํ–ˆ์„ ๋•Œ, ๋‹ค์Œ ์ˆœ์„œ๋กœ ๋‚˜์˜ฌ ๋‹จ์–ด์ธ t๋ฒˆ์งธ ๋‹จ์–ด๊ฐ€ ๋ฌด์—‡์œผ๋กœ ๋‚˜์˜ฌ์ง€ ์˜ˆ์ธกํ•˜๋Š” ๋ชจ๋ธ์„ ์˜๋ฏธ. ๋‹ค์Œ ์ˆœ์„œ์— ๋‚˜์˜ฌ ๋‹จ์–ด์˜ ์ž์—ฐ์Šค๋Ÿฌ์›€์„ ํ•˜๋‚˜์˜ ํ™•๋ฅ  ์ง€ํ‘œ๊ฐ’์œผ๋กœ ์˜ˆ์ธก. ๋™์‹œ ํ™•๋ฅ ์ด๋ž€: m๊ฐœ์˜ ๋‹จ์–ด๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•  ๋•Œ, ๋‹จ.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap6(๊ฒŒ์ดํŠธ๊ฐ€ ์ถ”๊ฐ€๋œ RNN) 6.1 RNN์˜ ๋ฌธ์ œ์  ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ ์žฅ๊ธฐ ์˜์กด ๊ด€๊ณ„ ํ•™์Šตํ•˜๋Š”๋ฐ ์–ด๋ ค์›€ ์กด์žฌ ๊ธฐ์šธ๊ธฐ ์†Œ์‹ค ๋ฐ ๊ธฐ์šธ๊ธฐ ํญ๋ฐœ ๋ฌธ์ œ ๋ฐœ์ƒ 1. ๊ธฐ์šธ๊ธฐ ์†Œ์‹ค ์—ญ์ „ํŒŒ์˜ ๊ฒฝ์šฐ, tanh์„ ๋ฏธ๋ถ„ํ•˜๊ฒŒ ๋˜๋ฉด ์ ์  0์— ์ˆ˜๋ ดํ•˜๊ฒŒ ๋จ. ์ด์ „์˜ ๊ธฐ์šธ๊ธฐ ๊ฐ’์„ ๊ณ„์† ๊ณฑํ•˜๋ฉด์„œ ๊ฐฑ์‹ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์†Œ์‹ค์ƒํƒœ ๋ฐœ์ƒ 2. ๊ธฐ์šธ๊ธฐ ํญ๋ฐœ ์—ญ์ „ํŒŒ์˜ ๊ฒฝ์šฐ, matmul ๋…ธ๋“œ์—์„œ dhWh๋ผ๋Š” ํ–‰๋ ฌ ๊ณฑ์œผ๋กœ ๊ธฐ์šธ๊ธฐ ๊ณ„์‚ฐํ•จ ์ด ๋•Œ, ๋งค๋ฒˆ ๊ฐ™์€ ๊ฐ€์ค‘์น˜์ธ Wh๊ฐ€ ์‚ฌ์šฉ๋จ(ํ–‰๋ ฌ๊ณฑ์…ˆ ์œผ๋กœ ์ธํ•ด) ๊ฒฐ๊ตญ ์ž…๋ ฅ์ธต์œผ๋กœ ๊ฐˆ์ˆ˜๋ก ์ ์ฐจ ์ปค์ง€๋‹ค๊ฐ€ ๊ฐ€์ค‘์น˜๋“ค์ด ๋น„์ •์ƒ์ ์œผ๋กœ ํฐ ๊ฐ’์ด ๋˜์–ด๋ฒ„๋ฆผ ๊ธฐ์šธ๊ธฐ ํญ๋ฐœ์— ๋Œ€ํ•œ ํ•ด๊ฒฐ๋ฐฉ์•ˆ ๊ธฐ์šธ๊ธฐ ํด๋ฆฌํ•‘(gradients clipping) ์‚ฌ์šฉ ์‹ ๊ฒฝ๋ง์—์„œ ์‚ฌ์šฉ๋˜๋Š” ๋ชจ๋“  ๋งค๊ฐœ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๊ธฐ์šธ๊ธฐ๋ฅผ ํ•˜๋‚˜๋กœ ์ฒ˜๋ฆฌ g−bar๋Š” L2 ๋…ธ๋ฆ„์„ ์˜๋ฏธ, L2 ๋…ธ๋ฆ„์ด ๋ฌธํ„ฑ๊ฐ’์„ ์ดˆ๊ณผํ•˜๋ฉด.. 2023. 7. 9.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2] chap8(์–ดํ…์…˜) seq2seq ⇒ 2๊ฐœ์˜ RNN์„ ์—ฐ๊ฒฐํ•ด ํ•˜๋‚˜์˜ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฅธ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋กœ ๋ณ€ํ™˜. ์–ดํ…์…˜์˜ ์—ญํ•  ⇒ seq2seq๋ฅผ ๋” ๊ฐ•๋ ฅํ•˜๊ฒŒ ํ•ด์คŒ. 8.1 ์–ดํ…์…˜์˜ ๊ตฌ์กฐ 8.1.1 seq2seq์˜ ๋ฌธ์ œ์  ๊ณ ์ •๊ธธ์ด๋ฒกํ„ฐ ex) ์•„๋ฌด๋ฆฌ ๋ฌธ์žฅ ๊ธธ์ด๊ฐ€ ๊ธธ์–ด์ ธ๋„ ๊ณ ์ •๊ธธ์ด๋ฒกํ„ฐ → ๊ฐ™์€ ๊ธธ์ด์˜ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•ด๋ฒ„๋ฆผ ⇒ ๋งŽ์€ ์ •๋ณด๋ฅผ ์••์ถ•ํ•˜๋‹ค๋ณด๋‹ˆ ํ•œ๊ณ„์ ์ด ๋ถ„๋ช…์ด ์˜ฌ ๊ฒƒ์ž„. ex) ์˜ท์„ ์šฐ๊ฑฐ์ง€๋กœ ๋„ฃ์œผ๋ฉด ๊ฒฐ๊ตญ ์˜ท์žฅ์—์„œ ์‚์ ธ๋‚˜์˜ค๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ๊ฒƒ. 8.1.2 Encoder ๊ฐœ์„  encoder ์ถœ๋ ฅ ๊ธธ์ด๋ฅผ ์ž…๋ ฅ ๋ฌธ์žฅ์˜ ๊ธธ์ด์— ๋”ฐ๋ผ ๋ฐ”๊ฟ”์ฃผ๋Š” ๊ฒƒ. ๊ทธ๋Ÿฌ๊ธฐ ์œ„ํ•ด์„  ์‹œ๊ฐ๋ณ„(๋‹จ์–ด๋ณ„) LSTM ๊ณ„์ธต์˜ ์€๋‹‰ ์ƒํƒœ ๋ฒกํ„ฐ๋ฅผ ๋ชจ๋‘ ์ด์šฉ. ex) 5๊ฐœ์˜ ๋‹จ์–ด๊ฐ€ ์ž…๋ ฅ๋œ ๊ฒฝ์šฐ, encoder์€ 5๊ฐœ ๋ฒกํ„ฐ๋ฅผ ์ถœ๋ ฅํ•จ. 8.1.3 Decoder ๊ฐœ์„  1(์„ ํƒ ์ž‘์—….. 2023. 7. 8.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 1] chap5(์˜ค์ฐจ์—ญ์ „ํŒŒ๋ฒ•) 5-1) ๊ณ„์‚ฐ ๊ทธ๋ž˜ํ”„ ๊ณ„์‚ฐ ๊ณผ์ •์„ ๊ทธ๋ž˜ํ”„๋กœ ๋‚˜ํƒ€๋‚ธ ๊ฒƒ ๋…ธ๋“œ(node)/ ์—์ง€(edge): ๋…ธ๋“œ ์‚ฌ์ด์˜ ์ง์„ ์„ ์—์ง€๋ผ๊ณ  ๋ถ€๋ฆ„ ⇒ ์ˆœ์ „ํŒŒ๋ผ๊ณ  ํ•จ(์™ผ์ชฝ์—์„œ ์˜ค๋ฅธ์ชฝ์œผ๋กœ ์ง„ํ–‰) ๊ตญ์†Œ์  ๊ณ„์‚ฐ ์ „์ฒด์ ์œผ๋กœ ๋ณด๋ฉด ๋ณต์žกํ•œ ๊ณ„์‚ฐ์‹์ด์ง€๋งŒ ํŒŒ๊ณ ๋“ค๋ฉด ๊ฐ„๋‹จํ•œ ์ˆ˜์‹์œผ๋กœ ์ด๋ฃจ์–ด์ ธ ์žˆ๋Š” ⇒ ๊ตญ์†Œ์  ๊ณ„์‚ฐ์ด๋ผ๊ณ  ํ•จ.( ์ „์ฒด ์‹์€ ๊ฐœ๋ณต์žก but, ์•ˆ์œผ๋กœ ๋“ค์–ด๊ฐ€๋ฉด ๋ง์…ˆ ๋บ„์…ˆ์œผ๋กœ ์ด๋ฃจ์–ด์ง) ๊ณ„์‚ฐ ๊ทธ๋ž˜ํ”„์˜ ์ด์  ๊ตญ์†Œ์  ๊ณ„์‚ฐ ์ „์ฒด๊ฐ€ ๋ณต์žกํ•ด๋„ ์•ˆ์—์„œ๋Š” ๊ฐ„๋‹จํ•˜๊ฒŒ ๋ฌธ์ œ ๋‹จ์ˆœํ™”ํ•ด์„œ ํ’€ ์ˆ˜ ์žˆ์Œ ์ค‘๊ฐ„ ์ค‘๊ฐ„์˜ ๊ณ„์‚ฐ ๊ฒฐ๊ณผ ์ €์žฅ ๊ฐ€๋Šฅ ์—ญ์ „ํŒŒ๋ฅผ ํ†ตํ•ด ‘๋ฏธ๋ถ„’์„ ํšจ์œจ์ ์œผ๋กœ ๊ณ„์‚ฐ ๊ฐ€๋Šฅ 5-2) ์—ฐ์‡„ ๋ฒ•์น™ ํ•ฉ์„ฑ ํ•จ์ˆ˜์˜ ๋ฏธ๋ถ„์— ๋Œ€ํ•œ ์„ฑ์งˆ ํ•ฉ์„ฑ ํ•จ์ˆ˜์˜ ๋ฏธ๋ถ„: ํ•ฉ์„ฑ ํ•จ์ˆ˜๋ฅผ ๊ตฌ์„ฑํ•˜๋Š” ๊ฐ ํ•จ์ˆ˜์˜ ๋ฏธ๋ถ„์˜ ๊ณฑ์œผ๋กœ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋‹ค 5-3) ์—ญ์ „ํŒŒ 5-3-1) ๋ง์…ˆ ๋…ธ๋“œ์˜ ์—ญ์ „ํŒŒ ๊ทธ๋ƒฅ.. 2023. 7. 8.
[๋ฐ‘๋ฐ”๋‹ฅ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 1] chap2(ํผ์…‰ํŠธ๋ก ) 2-1) ํผ์…‰ํŠธ๋ก  ์‹ ๊ฒฝ๋ง์˜ ๊ธฐ์›์ด ๋˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ž…์ถœ๋ ฅ์„ ๊ฐ–์ถ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ž…๋ ฅ์„ ์ฃผ๋ฉด ์ •ํ•ด์ง„ ๊ทœ์น™์— ๋”ฐ๋ฅธ ๊ฐ’์„ ์ถœ๋ ฅ ๋‹ค์ˆ˜์˜ ์‹ ํ˜ธ๋ฅผ ์ž…๋ ฅ๋ฐ›์•„ ํ•˜๋‚˜์˜ ์‹ ํ˜ธ๋ฅผ ์ถœ๋ ฅํ•จ (1 or 0) ๋งค๊ฐœ๋ณ€์ˆ˜: ๊ฐ€์ค‘์น˜, ํŽธํ–ฅ x1: ์ž…๋ ฅ์‹ ํ˜ธ(์ž…๋ ฅ๊ฐ’) w1: ๊ฐ€์ค‘์น˜(๊ฐ ์‹ ํ˜ธ๊ฐ€ ๊ฒฐ๊ณผ์— ์ฃผ๋Š” ์˜ํ–ฅ๋ ฅ์„ ์กฐ์ ˆํ•จ) ์„ธํƒ€: ์ž„๊ณ„๊ฐ’ (์ •ํ•ด์ง„ ํ•œ๊ณ„๋ฅผ ๋„˜์œผ๋ฉด 1๋กœ ์ถœ๋ ฅ) ์„ธํƒ€ → -b๋กœ ์น˜ํ™˜ (ํŽธํ–ฅ) ex) b= -0.1์ธ ๊ฒฝ์šฐ, ๊ฐ’๋“ค์˜ ํ•ฉ์ด 0.1์„ ์ดˆ๊ณผํ•  ๋•Œ๋งŒ ๋‰ด๋Ÿฐ ํ™œ์„ฑํ™” b=-20์ธ ๊ฒฝ์šฐ, ํ•ฉ์ด 20์ด ๋„˜์ง€ ์•Š์œผ๋ฉด ๋‰ด๋Ÿฐ ํ™œ์„ฑํ™”x 2-2) ๋‹จ์ธต / ๋‹ค์ธต ํผ์…‰ํŠธ๋ก  ๋‹จ์ธต ํผ์…‰ํŠธ๋ก (์„ ํ˜•) AND ๊ฒŒ์ดํŠธ(๋‘˜ ๋‹ค 1์ผ ๋•Œ๋งŒ 1 ์ถœ๋ ฅ) NAND ๊ฒŒ์ดํŠธ(๋‘˜ ๋‹ค 1์ผ ๋•Œ๋งŒ 0์ถœ๋ ฅ) OR ๊ฒŒ์ดํŠธ(์ž…๋ ฅ๊ฐ’ ํ•˜๋‚˜ ์ด์ƒ์ด 1์ด๋ฉด 1์ถœ๋ ฅ) ๋‹ค์ธต ํผ์…‰ํŠธ๋ก (๋น„์„ ํ˜•) XO.. 2023. 7. 8.
728x90
๋ฐ˜์‘ํ˜•