part5-1 Data & Task: ์ด๋ค ๋ฐ์ดํฐ๊ฐ ์์๊น
- ์์ฐ์ด ์ฒ๋ฆฌ(NLP) : text ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ ๋ชจ๋ธ๋ง ํ๋ ๋ถ์ผ (NLU+NLG)
- ์์ฐ์ด ์ดํด(NLU): ์์ฐ์ด ์ดํดํ๋ ์์ญ
- ์์ฐ์ด ์์ฑ(NLG): ์์ฐ์ด ์์ฑ
- ๊ฐ์ ๋ถ์ (sentiment analysis)
- ์์ฝ(summarization)
- ๊ธฐ๊ณ ๋ฒ์ญ(machine translation)
- ์ง๋ฌธ ์๋ต(question answering)
- +a (ํ์ฌ ์์ธก ๋ถ์ผ, ์ฑ๋ด ์ฐ๊ตฌ, ๋ฌธ์ฅ ๊ฐ์ ๋ ผ๋ฆฌ์ ๊ด๊ณ์ ๋ํ ๋ถ๋ฅ ๋ชจ๋ธ, ์ค์์ ํํ ๊ตฌ๋ณ, ์ด๋ฏธ์ง ์ ์ํฉ ์ค๋ช ๊ธ ๋ง๋ค๊ธฐ ๋ฑ๋ฑ
part5-2 ๋ฌธ์๋ฅผ ์ซ์๋ก ํํํ๋ ๋ฐฉ๋ฒ
- Tokenization: ๋ฌธ์ฅ์ ์๋ฏธ ์๋ ๋ถ๋ถ์ผ๋ก ๋๋๋ ๊ณผ์
- ์ฐ์๋ ๋ฌธ์์ ๋์ด(๋ฌธ์ฅ)์ ์ ์ ํ๊ฒ ์๋ฏธ๋ฅผ ์ง๋ ๋ถ๋ถ์ ๋์ด๋ก ๋ฐ๊พธ๋ ๊ณผ์
⇒ ์ฌ๊ธฐ์๋ถํฐ ์ฌ๊ธฐ๊น์ง์ ๋ฌธ์์ ๋์ด์ ํน์ ์๋ฏธ๊ฐ ์๋ ๋ถ๋ถ์ด๋ ํ๋๋ก ์ธ์ํด๋ผ~
- ๋์ด์ฐ๊ธฐ
- ๊ธ์(Character)
Corpus & Out-of-Vocabulary(OOV)
- ์ ์ฅํด๋ vocabulary์๋ Token์ด ์์ด์ ์ฒ์ ๋ณธ token์ด ๋์ค๋ ํ์
- ๋ชจ๋ฅด๋ ๋จ์ด๋ก ์ธํด ๋ฌธ์ ๋ฅผ ํธ๋ ๊ฒ์ด ๊น๋ค๋ก์์ง๋ ์ํฉ์ OOV(Out-Of-Vocabulary) ๋ฌธ์ ๋ผ๊ณ ํจ
⇒ <unk>๋ก ๋ณํํ๋ ๊ฒ๋ณด๋ค ์์ ๋ฌธ์ฅ์ ๋๋ฆฌ๊ธฐ(corpus-๋ง๋ญ์น ๋ฐ์ดํฐ)
⇒ ๊ฒฐ๊ตญ ์ฌ์ ์ ํฌ๊ธฐ๊ฐ ์ ์ ์ปค์ง ⇒ ๋ชจ๋ธ ์ฌ์ด์ฆ๋ ์ปค์ง๊ฒ ๋๋ ๋ฌธ์ ์ ๋ฐ์
Byte Pair Encoding(BPE)
- ํ๋์ ๋จ์ด๋ ๋ ์์ ๋จ์์ ์๋ฏธ ์๋ ์ฌ๋ฌ ์๋ธ์๋๋ค(Ex) birthplace = birth + place)์ ์กฐํฉ์ผ๋ก ๊ตฌ์ฑ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์
- ํ๋์ ๋จ์ด๋ฅผ ์ฌ๋ฌ ์๋ธ์๋๋ก ๋ถ๋ฆฌํด์ ๋จ์ด๋ฅผ ์ธ์ฝ๋ฉ ๋ฐ ์๋ฒ ๋ฉ(๋ฒกํฐ๋ก) ํ๊ฒ ๋ค๋ ์๋๋ฅผ ๊ฐ์ง ์ ์ฒ๋ฆฌ ์์
⇒ ์ด์ : ์ฌ์ ์ ํฌ๊ธฐ๊ฐ ์ค์ด๋ฌ, oov ํ์์ ์์จ ์ ์์
1. Character based tokenization(๊ธ์๋ฅผ ํ ํฐ์ผ๋ก ํ์ฉํ๋ค)
- ๊ธ์: ์ต์์ ๋จ์(๊ฐ~ํฃ)
- ์ด์ :
- ์ค์๋ง ๋ฐ ์ ์กฐ์ด์ ๋ํด ๊ฑฑ์ ํ ํ์x ⇒ ใ ใ ใ ใ or ใณ ๊น์ง๋ก ๋๋
- ์ฌ์ด์ฆ ํฌ๊ธฐ ํฌ์ง x
- ๋จ์ :
- ์ค์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์์ ์ฌ์ฉํ๋ token์ ๋๋ถ๋ถ ๊ธ์ ๋จ์๊ฐ ์๋.
- ํํ๋ฒ์ ๋ํ ํ์ต์ด ์ด๋ ค์ ex) ๊ธ์ ํ๋์ ๊ฒฝ์ฐ ํน์ ์๋ฏธ๋ฅผ ๊ฐ์ง๋ ์์
→ ex) ‘ํ’ or b ๊ฐ์ ๊ธ์ ํ๋๋ ์๋ฏธ๊ฐ ๋ณดํต ์์
- ๊ทธ๋ ๊ธฐ์ ์ฐ์๋ ๊ธ์๋ฅผ ํตํด ํน์ ์๋ฏธ๋ฅผ ๋ง๋ค์ด ๋ด์ผ ํจ. ⇒ ํ์ง๋ง ์ด๋ ๊ฒ ๋ชจ๋ธ ๋ง๋ค๊ธฐ๊ฐ ์ด๋ ค์
2. n-gram Tokenization
- ๊ธฐ์กด ๊ธ์๋ฅผ ํตํด ํ์ต์ํค๋ ๊ฒฝ์ฐ, ๊ธ์ ํ๋ํ๋์ ์๋ฏธ๋ ๊ฑฐ์ ์๊ธฐ ๋๋ฌธ์ ๊ธ์์ ํน์ฑ ์ฐ์์ฑ์ด ์๋ฏธ๋ฅผ ๊ฐ์ง ๋จ์ด๋ผ๋ ๊ฒ์ ํ์ต์์ผ์ผ ํจ → ์ด๋ฅผ ํตํด ๋ฌธ์ฅ๊ณผ ๊ฐ์ด ๋ ๊ธด ํํ์ ๊ธ์ ์ดํดํ๋๋ก ๋ง๋ค์ด์ผ ํจ → ๋นํจ์จ์
- ๊ธ์๋ณด๋ค ๋ ๊ธด ํํ์ token์ ๋ง๋ค์! ํ๊ณ ๋์จ ๊ฒ์ด n-gram ๋ฐฉ์์.

์ด์ :
- n-gram์ ์ฌ์ฉํ๊ฒ ๋๋ฉด ex) ‘๊ฐ ๋จ์ด์ง ๋ปํ๋ค’ ์ ๊ฐ์ด ํ๋ฒ์ token์ ๋ฝ์๋ผ ์ ์์ → ์ด๋ฅผ ํตํด ‘๋งค์ฐ ๋๋ผ๋ค’ ๋ผ๋ ์๋ฏธ๋ฅผ ํ๋ฒ์ ๋ง๋ค์ด ๋ผ ์ ์์
๋จ์ :
- ์ธ๋ชจ์๋ ์กฐํฉ์ด ๋ง์ด ์์ฑ๋จ.
- ์ฌ์ ์ด ๊ณผํ๊ฒ ์ปค์ง (์๋ฏธ์๋ ๋ป์ด๋, ์์ฃผ ์ฌ์ฉ๋์ง ์๋ token์ด ๋ ๊ฒฝ์ฐ ํจ์จx)
3. BPE(Byte pari Encoding)
- ๊ธฐ์กด n-gram์์ ์ฌ๋ฌ๋ฒ ๋ํ๋๋ ๊ธ์์ ๋์ด์ ๊ฒฝ์ฐ, ์๋ฏธ๊ฐ ์๋ ๊ฒ์ผ๋ก ํ๋จํด์ ๋ฐ๋ก token์ ๋ง๋ค๊ฒ ๋จ ⇒ BPE
- ๋ฐ๋ณต์ ์ผ๋ก ๋์ค๋ ๋ฐ์ดํฐ์ ์ฐ์๋ ํจํด์ ์นํํ๋ ๋ฐฉ์์ ์ฌ์ฉ→ ๋ฐ์ดํฐ ํจ์จ์ ์ ์ฅ์ด ๊ฐ๋ฅ
- → EX) ab⇒ X๋ก ์นํ, cX ⇒ Y๋ก ์นํ ⇒ ๋ฌธ์์ด ์งง๊ฒ ํํ ๊ฐ๋ฅ
Word Embedding
- ๊ธฐ์กด ๋ฌธ์ ์

- ์ด์ ๊ฐ์ด ์ธ๋ฑ์ค๋ฅผ ์ด๋ ๊ฒ ์ค์ ํ ๋ํ๊ฑฐ๋ ๊ณฑํ์ ๋์ ๋ฌธ์ ์ธ๋ฑ์ค๋ฅผ ๋ณด๋ฉด ๋ฌธ์๊ฐ ๋ค๋ฅธ ๊ฑธ ํ์ธํ ์ ์์

- ์ด์ ๊ฐ์ ๋ฐฉ์์ ํด๊ฒฐํ๊ธฐ ์ํด ๋์จ ๊ฒ์ด ์ํซ ์ธ์ฝ๋ฉ
2. Frequency-Based Method
- ๋จ์ด์ ํ์๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํํํ๋ ๋ฐฉ์์ ์ผ์ปซ์
- ๋ฌธ์ฅ์ ์๋ ๋ฑ์ฅ ํ์๋ฅผ ์ธ์ด ํํํ๋ ๋ฐฉ์
- ์ ํซ ์ธ์ฝ๋ฉ์ ๊ฑฐ์น๋ ๋ฐฉ๋ฒ

- ๋ฌธ๋จ์ token์ ์ง์ ์ธ์ด์ ํํ → ๋จ์ด ๋น๋๋ฅผ ์ด์ฉํ ๋ฐฉ์
→ ๋ฌธ์ ์ : ๊ด์ฌ๊ฐ์ a, the, of ์ ๊ฒฝ์ฐ, ๋ง์ด ๋ฑ์ฅํ๊ฒ ๋์ด ๋์ ๊ฐ์ ๊ฐ๊ฒ ๋จ → ๋น๋๊ฐ ์ ์ token์๊ฒ๋ ๋์ ์ํฅ์ด ๋์ฌ ์ ๋ฐ์ ์์
→ ์ด๋ฅผ ๋ณด์ํ๊ธฐ ์ํด ๋์จ ๊ฒ์ด IDF(Term Frequency - Inverse Document Frequency)
- IDF (Term Frequency- Inverse Document Frequency)

- ์ ์ฒด corpus ๋ฌธ์ฅ ์์์ ํด๋น token์ด ๋ฑ์ฅํ๋ ๋ฌธ์ฅ ์์ ๋น์จ์ ์ญ์
- ๊ด์ฌ์ ๊ฒฝ์ฐ, ๋น๋์๊ฐ ๋๊ธฐ์ log1์ ๊ฐ๊น์์ง → 0์ ๊ฐ๊น์ด ์
- ๋ฐ๋ผ์ TF * IDF๋ฅผ ๊ณฑํด์ค์ผ๋ก์จ TF ์์น๋ฅผ ๋ฎ์ถฐ์ค
๋จ์ : ๋จ์ด์ ์ถํ ํ์๋ง ์ ์ ์๊ณ ๋จ์ด์ ์์๋ ์์ ํ ๋ฌด์ ๋๋ค. ๋จ์ด์ ์์๊ฐ ๋ฌด์๋๋ค๋ ๊ฒ์ ๋ค๋ฅธ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋ฌธ์ฅ์ด ๋์ผํ ๊ฒฐ๊ณผ๋ก ํด์๋ ์ ์๋ค๋ ๊ฒ์ด๋ค.

- ํ์ ๊ธฐ๋ฐ์ ํํ ๋ฐฉ์ ์ด๊ธฐ ๋๋ฌธ์ ๋์ผ ๊ฒฐ๊ณผ๋ก ํด์ํ ์๋.
3. Dense Representation(ํฌ์ ํํ)
↔ ๋ฐ์ง ํํ
- ์-ํซ ์ธ์ฝ๋ฉ์ ๋ฌธ์ ์ : ๋ณ์์ ํฌ์์ฑ(Sparseness)
- ํฌ์ ํ๋ ฌ: ํ๋ ฌ ๋๋ถ๋ถ ๊ฐ์ด 0์ธ ๊ฒฝ์ฐ ↔ ๋ฐ์งํ๋ ฌ
- ๋นํจ์จ์ ์
Word2vec
- ๊ด๊ณ๋ฅผ ์ฐ์ฐ์ผ๋ก ์ค๋ช ํ ์ ์๋ ๋ฒกํฐ ํํ
- token์ ์๋ฏธ๋ ์ฃผ๋ณ token์ ์ ๋ณด๋ก ํํ๋๋ค
- ํน์ token์ ๊ธฐ์ค์ผ๋ก ์ฃผ๋ณ์ ๋น์ทํ token์ด ์๋ค๋ฉด ํด๋น token์ ๋น์ทํ ์์น์ ๋ฒกํฐ๋ก ํํ๋๋๋ก ํ์ต์ํด
- ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋์จ ๋ฐฉ๋ฒ 2๊ฐ์ง 1. cbow, skip-gram
1. CBOW
2. skip-gram
3. GloVe
- LSA๋ ์นด์ดํธ ๊ธฐ๋ฐ์ผ๋ก ์ฝํผ์ค์ ์ ์ฒด์ ์ธ ํต๊ณ ์ ๋ณด๋ฅผ ๊ณ ๋ คํ๊ธฐ๋ ํ์ง๋ง, ์:๋จ์ = ์ฌ์:? (์ ๋ต์ ์ฌ์)์ ๊ฐ์ ๋จ์ด ์๋ฏธ์ ์ ์ถ ์์ (Analogy task)์๋ ์ฑ๋ฅ์ด ๋จ์ด์ง๋๋ค.
- Word2Vec๋ ์์ธก ๊ธฐ๋ฐ์ผ๋ก ๋จ์ด ๊ฐ ์ ์ถ ์์ ์๋ LSA๋ณด๋ค ๋ฐ์ด๋์ง๋ง, ์๋ฒ ๋ฉ ๋ฒกํฐ๊ฐ ์๋์ฐ ํฌ๊ธฐ ๋ด์์๋ง ์ฃผ๋ณ ๋จ์ด๋ฅผ ๊ณ ๋ คํ๊ธฐ ๋๋ฌธ์ ์ฝํผ์ค์ ์ ์ฒด์ ์ธ ํต๊ณ ์ ๋ณด๋ฅผ ๋ฐ์ํ์ง ๋ชปํฉ๋๋ค.
- GloVe๋ ์ด๋ฌํ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ก ๋ค์ ๊ฐ๊ฐ์ ํ๊ณ๋ฅผ ์ง์ ํ๋ฉฐ, LSA์ ๋ฉ์ปค๋์ฆ์ด์๋ ์นด์ดํธ ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ๊ณผ Word2Vec์ ๋ฉ์ปค๋์ฆ์ด์๋ ์์ธก ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ๋ก ๋ ๊ฐ์ง๋ฅผ ๋ชจ๋ ์ฌ์ฉ
- ์นด์ดํธ ๊ธฐ๋ฐ๊ณผ ์์ธก ๊ธฐ๋ฐ์ ๋ชจ๋ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ → Word2Vec์ ์์ธก๋ง ์ฌ์ฉ
- ์๋ฒ ๋ฉ ๋ ์ค์ฌ ๋จ์ด์ ์ฃผ๋ณ ๋จ์ด ๋ฒกํฐ์ ๋ด์ ์ด ์ ์ฒด ์ฝํผ์ค์์์ ๋์ ๋ฑ์ฅ ํ๋ฅ ์ด ๋๋๋ก ๋ง๋๋ ๊ฒ
- ํ์ตํ ๋ ๋์ ๋ฑ์ฅ ํ๋ ฌ์ ๋ฐ๋ก ๊ณ์ฐ ํด์ค
- ๋์ ๋ฑ์ฅ ํ๋ ฌ: ํน์ ๋จ์ด๊ฐ ๋์ ๋ฑ์ฅ ํ์๋ฅผ ์นด์ดํธ๋ฅผ ํ๊ณ ํน์ ๋จ์ด๊ฐ ๋ฑ์ฅํ์ ๋ ๋ค๋ฅธ ๋จ์ด๊ฐ ๋ฑ์ฅํ ์กฐ๊ฑด๋ถ ํ๋ฅ
- ๋์ ๋ฑ์ฅ ํ๋ ฌ์ ํ์ฉํ ์์คํจ์
4. fasttext
- ์๋ธ ์๋๋ฅผ ๊ณ ๋ คํด์ ํ์ต ( ํ๋์ ๋จ์ด ์์๋ ์ฌ๋ฌ ๋จ์ด๋ค์ด ์กด์ฌํ๋ ๊ฒ์ผ๋ก ๊ฐ์ฃผ) (word2vec์ ๊ฐ์ ๊ตฌ์กฐ, subword ์ ๋ฌด ์ฐจ์ด)
- ex) apple, n=3์ธ ๊ฒฝ์ฐ, <ap, app, ppl, ple, le>, <apple>์ผ๋ก ์ชผ๊ฐฌ → ์ดํ ๋ฒกํฐํ ์งํ ํ, ๋ฒกํฐ๊ฐ๋ค์ ์ดํฉ์ผ๋ก ๊ตฌ์ฑ
→ subwords๋ก ํํํ๋ฉด oov ์๋ฌ๊ฐ ๋ฐ์ํ ํ๋ฅ ์ด ์ ์ด์ง.
→ ํ์ต ๋ ํฌํจ๋์ง ์์ ๋จ์ด๋ค์ ๋ํด์๋ subwords์ ๋ฒกํฐ๊ฐ์ ํ์ฉํ๋ฉด ์๋ฏธ์ ์ผ๋ก ์ ์ฌํ ๋จ์ด๋ผ๋ฆฌ ๊ณต๊ฐ์ ๊ทผ์ ํ ์์น ๊ฐ์ ๊ฐ๊ฒ ๋จ.
- ์ด์ : ex birthplace(์ถ์์ง)๋ผ๋ ๋จ์ด๋ฅผ ํ์ตํ์ง ์์ ์ํ๋ผ๊ณ ๊ฐ์
- ๋ง์ฝ ๋ค๋ฅธ ๋จ์ด์์ birth์ place๋ผ๋ ๋ด๋ถ ๋จ์ด๊ฐ ์กด์ฌํ๋ค๋ฉด fasttext๋ birthplace์ ๋ฒกํฐ๋ฅผ ์ป์ ์ ์์.
→ word2vec๊ณผ glove์ ๋ค๋ฅธ ์ ์ด๋ผ๊ณ ํ ์ ์์.
5. BERT
- ์๋ฐฉํฅ์ฑ์ ํ์ฉ
- ์ด์ ๋ชจ๋ธ๋ค์ ๊ฒฝ์ฐ, ๋งฅ๋ฝ์ ์ผ→์ค๋ฅธ์ชฝ์ผ๋ก ์งํํด ๋ฌธ๋งฅ ํ์ .
- ex)
- ์ฌ์ ํ์ต๋ ๋์ฉ๋์ ๋ ์ด๋ธ๋ง ๋์ง ์๋(unlabeled) ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ ์ธ์ด ๋ชจ๋ธ(Language Model)์ ํ์ตํ๊ณ ์ด๋ฅผ ํ ๋๋ก ํน์ ์์ ( ๋ฌธ์ ๋ถ๋ฅ, ์ง์์๋ต, ๋ฒ์ญ ๋ฑ)์ ์ํ ์ ๊ฒฝ๋ง์ ์ถ๊ฐํ๋ ์ ์ด ํ์ต ๋ฐฉ๋ฒ.
- pre-training์ด ๊ฐ๋ฅํ ๋ชจ๋ธ
์ด๋ค ๋ฌธ์ ์ ์ ์ฉํ ์ ์์๊น?
- Question and Answering→ ์ฃผ์ด์ง ์ง๋ฌธ์ ์ ํฉํ๊ฒ ๋๋ตํด์ผ ํ๋ ๋งค์ฐ ๋ํ์ ์ธ ๋ฌธ์ ์ ๋๋ค. KoSQuAD, Visual QA etc.
- Machine Translation→ ๊ตฌ๊ธ ๋ฒ์ญ๊ธฐ, ๋ค์ด๋ฒ ํํ๊ณ ์ ๋๋ค.
- ๋ฌธ์ฅ ์ฃผ์ ์ฐพ๊ธฐ ๋๋ ๋ถ๋ฅํ๊ธฐ→ ์ญ์๋ ๊ธฐ์กด NLP์์๋ ํด๊ฒฐํ ์ ์๋ ๋ฌธ์ ๋ ๋น์ฐํ ํด๊ฒฐํ ์ ์์ต๋๋ค.
- ์ฌ๋์ฒ๋ผ ๋ํํ๊ธฐ→ ์ด์ ๊ฐ์ ์ฃผ์ ์์ ๋งค์ฐ ๊ฐ๋ ฅํจ์ ๋ณด์ฌ์ค๋๋ค.
์ธ๊ฐ์ง ์๋ฒ ๋ฉ ์ฌ์ฉ
- token embedding→ ๋๊ฐ์ง ํน์ ํ ํฐ(CLS, SEP)๋ฅผ ์ฌ์ฉํด ๋ฌธ์ฅ ๊ตฌ๋ณ.→ SEP(special separator token)์ ์ฌ์ฉํด ์ฒซ๋ฒ ์งธ ๋ฌธ์ฅ ๋ฐ ๋๋ฒ ์งธ ๋ฌธ์ฅ ๊ตฌ๋ณ.
- → ๋ฌธ์ฅ ์ฒซ๋ฒ์งธ ํ ํฐ์ผ๋ก ์ฝ์
- segment embedding→ ์ฌ๊ธฐ์ segment embedding์ ๋ํด ์ ๋ค ๋ฌธ์ฅ์ ์ฝ๊ฒ ๊ตฌ๋ณํ ์ ์๋๋ก ๋์์ค.
- → ๊ฐ ๋ฌธ์ฅ์ ๋์ ์ฝ์ ๋จ.
- position embedding→ ๊ฐ ํ ํฐ์ ์์น๋ฅผ ์๋ ค์ฃผ๋ ์๋ฒ ๋ฉ
- ⇒ ์ต์ข ์ ์ผ๋ก ์ธ ๊ฐ์ง ์๋ฒ ๋ฉ์ ๋ํ ์๋ฒ ๋ฉ์ input์ผ๋ก ํ์ฉ
ํ์ต ๋ฐฉ๋ฒ
- masked language model
- ๋ฌธ์ฅ์์ ๋จ์ด ์ค ์ผ๋ถ๋ฅผ mask ํ ํฐ์ผ๋ก ๋ฐ๊ฟ ๊ฐ๋ ค์ง ๋จ์ด๋ฅผ ์์ธก
- next sentence model
- ๋ฌธ์ฅ์ด ์ฌ๋ฐ๋ฅธ ๋ฌธ์ฅ์ธ์ง ๋ง์ถ๋ ๋ฌธ์ .
- ์ด๋ฅผ ํตํด ๋ ๋ฌธ์ฅ ์ฌ์ด์ ๊ด๊ณ๋ฅผ ํ์ตํ๊ฒ ๋จ.
- ๋ฌธ์ฅ A์ B๋ฅผ ์ด์ด ๋ถ์ด๋๋ฐ, B๋ 50% ํ๋ฅ ๋ก ๊ด๋ จ ์๋ ๋ฌธ์ฅ(IsNext label) ๋๋ ๊ด๋ จ ์๋ ๋ฌธ์ฅ(NotNext label)์ ์ฌ์ฉํจ.
→ ์ด๋ฐ ๋ฐฉ์์ผ๋ก ํ์ต๋ BERT๋ฅผ fine-tuningํ ๋๋ (Classification task๋ผ๋ฉด)Image task์์์ fine-tuning๊ณผ ๋น์ทํ๊ฒ class label ๊ฐ์๋งํผ์ output์ ๊ฐ์ง๋ Dense Layer๋ฅผ ๋ถ์ฌ์ ์ฌ์ฉํจ.
- masked language model
part 5-3 models
1. RNN
2. LSTM
3. Bi-RNNs
4. GRUS
5. Attention Machanism
6. BERT
'Deep Learning > 2023 DL ๊ธฐ์ด ์ด๋ก ๊ณต๋ถ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ฐ๋ฐ๋ฅ๋ถํฐ ์์ํ๋ ๋ฅ๋ฌ๋ 1] chap8 ๋ฅ๋ฌ๋ (0) | 2023.07.08 |
---|---|
[ํ์ด์ฌ ๋ฅ๋ฌ๋ ํ์ดํ ์น] Part3 (0) | 2023.07.08 |
[Standford_cs231n] Lecture 2 ) Image Classification (0) | 2023.07.08 |
[Standford_cs231n] Lecture 3 ) Loss Functions and Optimization (0) | 2023.07.08 |
[Standford_cs231n] Lecture 4 ) Introduction to Neural Networks (0) | 2023.07.08 |