๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Deep Learning/[LLM] ์ด๋ก  ๊ณต๋ถ€

LLM์˜ ๋ชจ๋“  ๊ฒƒ 2 [RAG-Retrieval Augmented Generation]

by ์ œ๋ฃฝ 2024. 3. 22.
728x90
๋ฐ˜์‘ํ˜•

LangChain(๋žญ์ฒด์ธ)


: ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ๊ณผ ์–ดํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ ํ†ตํ•ฉ์„ ๊ฐ„์†Œํ™”ํ•˜๋Š” SDK(์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ํ‚คํŠธ - ๊ฐœ๋ฐœ ๋„๊ตฌ์˜ ์ง‘ํ•ฉ์ฒด)

: ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•œ ์˜คํ”ˆ ์†Œ์Šค ํ”„๋ ˆ์ž„์›Œํฌ

: ์‰ฝ๊ฒŒ ๋งํ•˜๋ฉด LLM ๋ฐ€ํ‚คํŠธ๋ผ๊ณ  ์ƒ๊ฐํ•˜๋Š” ๊ฒƒ์ด ํŽธํ•˜๋‹ค.

: LLM์„ ๊ตฌ์„ฑํ•˜๊ธฐ ์œ„ํ•œ ๋ชจ๋“ˆ๋“ค์ด ์กด์žฌ

  • ๋ชจ๋ธ I/O : ์–ธ์–ด ๋ชจ๋ธ๊ณผ์˜ ์ธํ„ฐํŽ˜์ด์Šค
    • ํ”„๋กฌํ”„ํŠธ๋ฅผ ๊ด€๋ฆฌํ•˜๊ณ  ๊ณตํ†ต ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ํ†ตํ•ด ์–ธ์–ด ๋ชจ๋ธ์„ ํ˜ธ์ถœํ•˜๊ณ  ๋ชจ๋ธ ์ถœ๋ ฅ์—์„œ ์ •๋ณด ์ถ”์ถœ
  • ๋ฐ์ดํ„ฐ ์—ฐ๊ฒฐ : ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜๋ณ„ ๋ฐ์ดํ„ฐ์™€์˜ ์ธํ„ฐํŽ˜์ด์Šค
    • ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œ, ๋ณ€ํ™˜, ์ €์žฅ ๋ฐ ์ฟผ๋ฆฌํ•˜๊ธฐ ์œ„ํ•œ ๋นŒ๋”ฉ ๋ธ”๋ก์„ ์ œ๊ณต
  • ์ฒด์ธ : ํ˜ธ์ถœ ์‹œํ€€์Šค ๊ตฌ์ถ•
    • ๋ณต์žกํ•œ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์€ LLM์„ ์ƒํ˜ธ, ๋˜๋Š” ๋‹ค๋ฅธ ๊ตฌ์„ฑ์š”์†Œ์™€ ์ฒด์ธ์œผ๋กœ ์—ฐ๊ฒฐํ•ด์•ผ ํ•œ๋‹ค. ๋žญ์ฒด์ธ์€ ์ด๋ ‡๊ฒŒ ‘์ฒด์ธ์œผ๋กœ ์—ฐ๊ฒฐ๋œ’ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์œ„ํ•œ ์ฒด์ธ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ์ œ๊ณตํ•œ๋‹ค.
  • ์—์ด์ „ํŠธ : ์ƒ์œ„ ์ง€์‹œ๋ฌธ์ด ์ฃผ์–ด์ง€๋ฉด ์ฒด์ธ์ด ์‚ฌ์šฉํ•  ํˆด์„ ์„ ํƒํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•จ
    • ์‹œํ€€์Šค๋ฅผ ํ•˜๋“œ ์ฝ”๋”ฉํ•˜๋Š” ์ฒด์ธ๊ณผ ๋‹ฌ๋ฆฌ, ์—์ด์ „ํŠธ๋Š” ์–ธ์–ด ๋ชจ๋ธ์„ ์ถ”๋ก  ์—”์ง„์œผ๋กœ ์‚ฌ์šฉํ•ด ์–ด๋–ค ์ž‘์—…์„ ์–ด๋Š ์ˆœ์„œ์— ๋”ฐ๋ผ ์ˆ˜ํ–‰ํ• ์ง€๋ฅผ ๊ฒฐ์ •ํ•œ๋‹ค.
  • ๋ฉ”๋ชจ๋ฆฌ : ์ฒด์ธ ์‹คํ–‰ ๊ฐ„ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ์ƒํƒœ ์œ ์ง€
  • ์ฝœ๋ฐฑ : ์ฒด์ธ์˜ ์ค‘๊ฐ„ ๋‹จ๊ณ„๋ฅผ ๊ธฐ๋ก ๋ฐ ์ŠคํŠธ๋ฆฌ๋ฐ
728x90
๋ฐ˜์‘ํ˜•