728x90 ๋ฐ์ํ Deep Learning/2023 DL ๊ธฐ์ด ์ด๋ก ๊ณต๋ถ28 [๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 2] chap4(word2vec ์๋ ๊ฐ์ ) Embedding ๊ณ์ธต negative sampling ์์คํจ์ ๋์ ๊ธฐ์กด word2vec์ ๋ฌธ์ ์ ์ดํ๊ฐ 100๋ง๊ฐ๋ก ๋์ด๋๊ฒ ๋ ๊ฒฝ์ฐ, [1] ์ ๋ ฅ์ธต์ ์ํซ ํํ๊ณผ ๊ฐ์ค์น ํ๋ ฌ W_in ์ ๊ณฑ ๊ณ์ฐ : 4.1 ์๋ฒ ๋ฉ ๊ณ์ธต ๊ตฌํ์ผ๋ก ํด๊ฒฐ [2] ์๋์ธต๊ณผ ๊ฐ์ค์น ํ๋ ฌ W_out์ ๊ณฑ ๋ฐ Softmax ๊ณ์ธต์ ๊ณ์ฐ : 4.2 ๋ค๊ฑฐํฐ๋ธ ์ํ๋ง์ผ๋ก ํด๊ฒฐ 1. Embedding ๊ณ์ธต matmul ๊ณ์ธต์ ๋ณด๋ฉด, ํด๋น ์ํซ๋ฒกํฐ์ ๋ง๋ ๋ฒกํฐ๋ฅผ ๋ฝ์๋ด๋ ๊ฒ๊ณผ ๊ฐ์ → ๋ฐ๋ผ์ ํน์ ํ๋ง ์ถ์ถํ์์ ์๋ฏธ๋ก embedding ๊ณ์ธต์ ํ์ฉ. forward์ ๊ฒฝ์ฐ, index๋ง ๋๊ฒจ ์๋์ธต(h)๋ฅผ ์ป๋๋ค backward ๋๋ dW ์ ๋ฐ์ดํธ ํด์ผํ index๊ฐ ๊ฒน์น๋ ๊ฒฝ์ฐ๊ฐ ์์ ์ ์์ผ๋ฏ๋ก ‘ํ ๋น’์ด ์๋ ‘๋ํ๊ธฐ’๋ฅผ ํด์ผ ํ.. 2023. 7. 9. [๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 2] chap5(์ํ ์ ๊ฒฝ๋ง RNN) 5.1 ํ๋ฅ ๊ณผ ์ธ์ด ๋ชจ๋ธ 1. ์ธ์ด๋ชจ๋ธ ๋จ์ด ๋์ด์ ํ๋ฅ ์ ๋ถ์ฌ ํน์ ํ ๋จ์ด์ ์ํ์ค์ ๋ํด ๊ทธ ์ํ์ค๊ฐ ์ผ์ด๋ ๊ฐ๋ฅ์ฑ์ด ์ด๋ ์ ๋์ธ๊ฐ(์ผ๋ง๋ ์์ฐ์ค๋ฌ์ด ๋จ์ด ์์์ธ์ง)๋ฅผ ํ๋ฅ ๋ก ํ๊ฐํ๋ ๊ฒ.ex) you say goodbye ⇒ 0.092 but, you say good die ⇒ 0.0000000032 ์ฌ์ฉ ์์: ๊ธฐ๊ณ ๋ฒ์ญ ๋ฐ ์์ฑ ์ธ์์ ์ฃผ๋ก ์ฌ์ฉ, ์๋ก์ด ๋ฌธ์ฅ ์์ฑ ์ฉ๋ CBOW์ ๋ฌ๋ฆฌ ์ผ์ชฝ ์๋์ฐ๋ง ๋งฅ๋ฝ์ผ๋ก ๊ณ ๋ คํจ. ์ฆ, ์ธ์ด๋ชจ๋ธ์ ๋ณ๊ฒฝ๋ ์์์ฒ๋ผ t-2๋ฒ์งธ ๋จ์ด, t-1๋ฒ์งธ ๋จ์ด๊ฐ ๋ฐ์ํ์ ๋, ๋ค์ ์์๋ก ๋์ฌ ๋จ์ด์ธ t๋ฒ์งธ ๋จ์ด๊ฐ ๋ฌด์์ผ๋ก ๋์ฌ์ง ์์ธกํ๋ ๋ชจ๋ธ์ ์๋ฏธ. ๋ค์ ์์์ ๋์ฌ ๋จ์ด์ ์์ฐ์ค๋ฌ์์ ํ๋์ ํ๋ฅ ์งํ๊ฐ์ผ๋ก ์์ธก. ๋์ ํ๋ฅ ์ด๋: m๊ฐ์ ๋จ์ด๊ฐ ์๋ค๊ณ ๊ฐ์ ํ ๋, ๋จ.. 2023. 7. 9. [๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 2] chap6(๊ฒ์ดํธ๊ฐ ์ถ๊ฐ๋ RNN) 6.1 RNN์ ๋ฌธ์ ์ ์๊ณ์ด ๋ฐ์ดํฐ์ ์ฅ๊ธฐ ์์กด ๊ด๊ณ ํ์ตํ๋๋ฐ ์ด๋ ค์ ์กด์ฌ ๊ธฐ์ธ๊ธฐ ์์ค ๋ฐ ๊ธฐ์ธ๊ธฐ ํญ๋ฐ ๋ฌธ์ ๋ฐ์ 1. ๊ธฐ์ธ๊ธฐ ์์ค ์ญ์ ํ์ ๊ฒฝ์ฐ, tanh์ ๋ฏธ๋ถํ๊ฒ ๋๋ฉด ์ ์ 0์ ์๋ ดํ๊ฒ ๋จ. ์ด์ ์ ๊ธฐ์ธ๊ธฐ ๊ฐ์ ๊ณ์ ๊ณฑํ๋ฉด์ ๊ฐฑ์ ํ๊ธฐ ๋๋ฌธ์ ์์ค์ํ ๋ฐ์ 2. ๊ธฐ์ธ๊ธฐ ํญ๋ฐ ์ญ์ ํ์ ๊ฒฝ์ฐ, matmul ๋ ธ๋์์ dhWh๋ผ๋ ํ๋ ฌ ๊ณฑ์ผ๋ก ๊ธฐ์ธ๊ธฐ ๊ณ์ฐํจ ์ด ๋, ๋งค๋ฒ ๊ฐ์ ๊ฐ์ค์น์ธ Wh๊ฐ ์ฌ์ฉ๋จ(ํ๋ ฌ๊ณฑ์ ์ผ๋ก ์ธํด) ๊ฒฐ๊ตญ ์ ๋ ฅ์ธต์ผ๋ก ๊ฐ์๋ก ์ ์ฐจ ์ปค์ง๋ค๊ฐ ๊ฐ์ค์น๋ค์ด ๋น์ ์์ ์ผ๋ก ํฐ ๊ฐ์ด ๋์ด๋ฒ๋ฆผ ๊ธฐ์ธ๊ธฐ ํญ๋ฐ์ ๋ํ ํด๊ฒฐ๋ฐฉ์ ๊ธฐ์ธ๊ธฐ ํด๋ฆฌํ(gradients clipping) ์ฌ์ฉ ์ ๊ฒฝ๋ง์์ ์ฌ์ฉ๋๋ ๋ชจ๋ ๋งค๊ฐ๋ณ์์ ๋ํ ๊ธฐ์ธ๊ธฐ๋ฅผ ํ๋๋ก ์ฒ๋ฆฌ g−bar๋ L2 ๋ ธ๋ฆ์ ์๋ฏธ, L2 ๋ ธ๋ฆ์ด ๋ฌธํฑ๊ฐ์ ์ด๊ณผํ๋ฉด.. 2023. 7. 9. [๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 2] chap8(์ดํ ์ ) seq2seq ⇒ 2๊ฐ์ RNN์ ์ฐ๊ฒฐํด ํ๋์ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฅธ ์๊ณ์ด ๋ฐ์ดํฐ๋ก ๋ณํ. ์ดํ ์ ์ ์ญํ ⇒ seq2seq๋ฅผ ๋ ๊ฐ๋ ฅํ๊ฒ ํด์ค. 8.1 ์ดํ ์ ์ ๊ตฌ์กฐ 8.1.1 seq2seq์ ๋ฌธ์ ์ ๊ณ ์ ๊ธธ์ด๋ฒกํฐ ex) ์๋ฌด๋ฆฌ ๋ฌธ์ฅ ๊ธธ์ด๊ฐ ๊ธธ์ด์ ธ๋ ๊ณ ์ ๊ธธ์ด๋ฒกํฐ → ๊ฐ์ ๊ธธ์ด์ ๋ฒกํฐ๋ก ํํํด๋ฒ๋ฆผ ⇒ ๋ง์ ์ ๋ณด๋ฅผ ์์ถํ๋ค๋ณด๋ ํ๊ณ์ ์ด ๋ถ๋ช ์ด ์ฌ ๊ฒ์. ex) ์ท์ ์ฐ๊ฑฐ์ง๋ก ๋ฃ์ผ๋ฉด ๊ฒฐ๊ตญ ์ท์ฅ์์ ์์ ธ๋์ค๋ ๊ฒ๊ณผ ๊ฐ์ ๊ฒ. 8.1.2 Encoder ๊ฐ์ encoder ์ถ๋ ฅ ๊ธธ์ด๋ฅผ ์ ๋ ฅ ๋ฌธ์ฅ์ ๊ธธ์ด์ ๋ฐ๋ผ ๋ฐ๊ฟ์ฃผ๋ ๊ฒ. ๊ทธ๋ฌ๊ธฐ ์ํด์ ์๊ฐ๋ณ(๋จ์ด๋ณ) LSTM ๊ณ์ธต์ ์๋ ์ํ ๋ฒกํฐ๋ฅผ ๋ชจ๋ ์ด์ฉ. ex) 5๊ฐ์ ๋จ์ด๊ฐ ์ ๋ ฅ๋ ๊ฒฝ์ฐ, encoder์ 5๊ฐ ๋ฒกํฐ๋ฅผ ์ถ๋ ฅํจ. 8.1.3 Decoder ๊ฐ์ 1(์ ํ ์์ .. 2023. 7. 8. [๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 1] chap5(์ค์ฐจ์ญ์ ํ๋ฒ) 5-1) ๊ณ์ฐ ๊ทธ๋ํ ๊ณ์ฐ ๊ณผ์ ์ ๊ทธ๋ํ๋ก ๋ํ๋ธ ๊ฒ ๋ ธ๋(node)/ ์์ง(edge): ๋ ธ๋ ์ฌ์ด์ ์ง์ ์ ์์ง๋ผ๊ณ ๋ถ๋ฆ ⇒ ์์ ํ๋ผ๊ณ ํจ(์ผ์ชฝ์์ ์ค๋ฅธ์ชฝ์ผ๋ก ์งํ) ๊ตญ์์ ๊ณ์ฐ ์ ์ฒด์ ์ผ๋ก ๋ณด๋ฉด ๋ณต์กํ ๊ณ์ฐ์์ด์ง๋ง ํ๊ณ ๋ค๋ฉด ๊ฐ๋จํ ์์์ผ๋ก ์ด๋ฃจ์ด์ ธ ์๋ ⇒ ๊ตญ์์ ๊ณ์ฐ์ด๋ผ๊ณ ํจ.( ์ ์ฒด ์์ ๊ฐ๋ณต์ก but, ์์ผ๋ก ๋ค์ด๊ฐ๋ฉด ๋ง์ ๋บ์ ์ผ๋ก ์ด๋ฃจ์ด์ง) ๊ณ์ฐ ๊ทธ๋ํ์ ์ด์ ๊ตญ์์ ๊ณ์ฐ ์ ์ฒด๊ฐ ๋ณต์กํด๋ ์์์๋ ๊ฐ๋จํ๊ฒ ๋ฌธ์ ๋จ์ํํด์ ํ ์ ์์ ์ค๊ฐ ์ค๊ฐ์ ๊ณ์ฐ ๊ฒฐ๊ณผ ์ ์ฅ ๊ฐ๋ฅ ์ญ์ ํ๋ฅผ ํตํด ‘๋ฏธ๋ถ’์ ํจ์จ์ ์ผ๋ก ๊ณ์ฐ ๊ฐ๋ฅ 5-2) ์ฐ์ ๋ฒ์น ํฉ์ฑ ํจ์์ ๋ฏธ๋ถ์ ๋ํ ์ฑ์ง ํฉ์ฑ ํจ์์ ๋ฏธ๋ถ: ํฉ์ฑ ํจ์๋ฅผ ๊ตฌ์ฑํ๋ ๊ฐ ํจ์์ ๋ฏธ๋ถ์ ๊ณฑ์ผ๋ก ๋ํ๋ผ ์ ์๋ค 5-3) ์ญ์ ํ 5-3-1) ๋ง์ ๋ ธ๋์ ์ญ์ ํ ๊ทธ๋ฅ.. 2023. 7. 8. [๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 1] chap2(ํผ์ ํธ๋ก ) 2-1) ํผ์ ํธ๋ก ์ ๊ฒฝ๋ง์ ๊ธฐ์์ด ๋๋ ์๊ณ ๋ฆฌ์ฆ ์ ์ถ๋ ฅ์ ๊ฐ์ถ ์๊ณ ๋ฆฌ์ฆ ์ ๋ ฅ์ ์ฃผ๋ฉด ์ ํด์ง ๊ท์น์ ๋ฐ๋ฅธ ๊ฐ์ ์ถ๋ ฅ ๋ค์์ ์ ํธ๋ฅผ ์ ๋ ฅ๋ฐ์ ํ๋์ ์ ํธ๋ฅผ ์ถ๋ ฅํจ (1 or 0) ๋งค๊ฐ๋ณ์: ๊ฐ์ค์น, ํธํฅ x1: ์ ๋ ฅ์ ํธ(์ ๋ ฅ๊ฐ) w1: ๊ฐ์ค์น(๊ฐ ์ ํธ๊ฐ ๊ฒฐ๊ณผ์ ์ฃผ๋ ์ํฅ๋ ฅ์ ์กฐ์ ํจ) ์ธํ: ์๊ณ๊ฐ (์ ํด์ง ํ๊ณ๋ฅผ ๋์ผ๋ฉด 1๋ก ์ถ๋ ฅ) ์ธํ → -b๋ก ์นํ (ํธํฅ) ex) b= -0.1์ธ ๊ฒฝ์ฐ, ๊ฐ๋ค์ ํฉ์ด 0.1์ ์ด๊ณผํ ๋๋ง ๋ด๋ฐ ํ์ฑํ b=-20์ธ ๊ฒฝ์ฐ, ํฉ์ด 20์ด ๋์ง ์์ผ๋ฉด ๋ด๋ฐ ํ์ฑํx 2-2) ๋จ์ธต / ๋ค์ธต ํผ์ ํธ๋ก ๋จ์ธต ํผ์ ํธ๋ก (์ ํ) AND ๊ฒ์ดํธ(๋ ๋ค 1์ผ ๋๋ง 1 ์ถ๋ ฅ) NAND ๊ฒ์ดํธ(๋ ๋ค 1์ผ ๋๋ง 0์ถ๋ ฅ) OR ๊ฒ์ดํธ(์ ๋ ฅ๊ฐ ํ๋ ์ด์์ด 1์ด๋ฉด 1์ถ๋ ฅ) ๋ค์ธต ํผ์ ํธ๋ก (๋น์ ํ) XO.. 2023. 7. 8. ์ด์ 1 2 3 4 5 ๋ค์ 728x90 ๋ฐ์ํ