๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Deep Learning/[LLM] ์ด๋ก  ๊ณต๋ถ€

LLM์˜ ๋ชจ๋“  ๊ฒƒ 1 [RAG-Retrieval Augmented Generation]

by ์ œ๋ฃฝ 2024. 3. 5.
728x90
๋ฐ˜์‘ํ˜•

1. RAG - Retrieval Augmented Generation

: ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ

: ์ƒˆ๋กœ์šด ์ง€์‹์— ๊ด€ํ•œ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋ฅผ Embeddingํ•ด์„œ Vector stores์— ์ €์žฅํ•˜๊ณ , ํ”„๋กฌํ”„ํŠธ ๊ตฌ์„ฑ์„ ์ง„ํ–‰ํ•  ๋•Œ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋กœ๋ถ€ํ„ฐ ๊ฐ€์ ธ์˜จ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ํ•จ๊ป˜ ์ด์šฉํ•ด์„œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๊ตฌ์„ฑํ•œ ๋’ค LLM์œผ๋กœ๋ถ€ํ„ฐ ๋‹ต๋ณ€์„ ์–ป์–ด๋‚ธ๋‹ค.

 

  1. ์‚ฌ์šฉ์ž ์งˆ๋ฌธ
  2. ์งˆ๋ฌธ ์ž„๋ฒ ๋”ฉ ๋ฐ ๋‚ด ๋ฐ์ดํ„ฐ๋„ ์ž„๋ฒ ๋”ฉ ์ง„ํ–‰
  3. ์ดํ›„, ๋ฒกํ„ฐ DB(์ €์žฅ์†Œ)์— ์ž„๋ฒ ๋”ฉ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅ
  4. ์งˆ๋ฌธ์„ ์ด์šฉํ•ด ์ €์žฅํ•ด๋†“์€ DB ์ €์žฅ์†Œ์—์„œ ๊ฒ€์ƒ‰
  5. ์ง€์‹œ ํ”„๋กฌํ”„ํŠธ ๊ตฌ์„ฑ + ์งˆ๋ฌธ(query ์žฌ์ƒ์„ฑ) + ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ n๊ฐœ > ์–ธ์–ด๋ชจ๋ธ GPT์—๊ฒŒ ์ œ๊ณต
  6. ์–ธ์–ด ๋ชจ๋ธ์ด ๋‹ต๋ณ€ ์ƒ์„ฑ
  7. ๋‹ต๋ณ€ ์ถœ๋ ฅ

2-2) ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ

: AI๊ฐ€ ์‚ฌ๋žŒ์˜ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ์ˆซ์ž๋กœ ๋ณ€ํ™˜ ํ•ด์ฃผ๋Š” AI๋ชจ๋ธ

: ์ง€์ •๋œ ์ฐจ์› ์ˆ˜๋ฅผ ๊ฐ€์ง

OpenAI

text-embedding-ada-002 1536์ฐจ์› ์ œ๊ณต

text-search-davinci-*001

text-search-curie-*-001

text-search-babbage-*-001

text-search-ada-*-00`

Google

BERT

SBERT

Claude, Cohere (Bert fine tuning)

 

 

 

2. LangChain

: ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ๊ณผ ์–ดํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ ํ†ตํ•ฉ์„ ๊ฐ„์†Œํ™”ํ•˜๋Š” SDK(์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ํ‚คํŠธ - ๊ฐœ๋ฐœ ๋„๊ตฌ์˜ ์ง‘ํ•ฉ์ฒด)

 

 


 

 

 

 

https://www.youtube.com/watch?v=KDM6UM-msZk

๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(Retrieval-augmented generation, RAG) - Google Search

 

๐Ÿ”Ž ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(Retrieval-augmented generation, RAG): Google ๊ฒ€์ƒ‰

 

www.google.com

 

728x90
๋ฐ˜์‘ํ˜•