1. RAG - Retrieval Augmented Generation
: ๊ฒ์ ์ฆ๊ฐ ์์ฑ
: ์๋ก์ด ์ง์์ ๊ดํ ํ ์คํธ ๋ฐ์ดํฐ ์์ค๋ฅผ Embeddingํด์ Vector stores์ ์ ์ฅํ๊ณ , ํ๋กฌํํธ ๊ตฌ์ฑ์ ์งํํ ๋ ์ธ๋ถ ๋ฐ์ดํฐ ์์ค๋ก๋ถํฐ ๊ฐ์ ธ์จ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํจ๊ป ์ด์ฉํด์ ํ๋กฌํํธ๋ฅผ ๊ตฌ์ฑํ ๋ค LLM์ผ๋ก๋ถํฐ ๋ต๋ณ์ ์ป์ด๋ธ๋ค.
- ์ฌ์ฉ์ ์ง๋ฌธ
- ์ง๋ฌธ ์๋ฒ ๋ฉ ๋ฐ ๋ด ๋ฐ์ดํฐ๋ ์๋ฒ ๋ฉ ์งํ
- ์ดํ, ๋ฒกํฐ DB(์ ์ฅ์)์ ์๋ฒ ๋ฉ๋ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅ
- ์ง๋ฌธ์ ์ด์ฉํด ์ ์ฅํด๋์ DB ์ ์ฅ์์์ ๊ฒ์
- ์ง์ ํ๋กฌํํธ ๊ตฌ์ฑ + ์ง๋ฌธ(query ์ฌ์์ฑ) + ๊ฒ์ ๊ฒฐ๊ณผ n๊ฐ > ์ธ์ด๋ชจ๋ธ GPT์๊ฒ ์ ๊ณต
- ์ธ์ด ๋ชจ๋ธ์ด ๋ต๋ณ ์์ฑ
- ๋ต๋ณ ์ถ๋ ฅ
2-2) ์๋ฒ ๋ฉ ๋ชจ๋ธ
: AI๊ฐ ์ฌ๋์ ์ธ์ด๋ฅผ ์ดํดํ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ผ๋ก ์ซ์๋ก ๋ณํ ํด์ฃผ๋ AI๋ชจ๋ธ
: ์ง์ ๋ ์ฐจ์ ์๋ฅผ ๊ฐ์ง
OpenAI
text-embedding-ada-002 1536์ฐจ์ ์ ๊ณต
text-search-davinci-*001
text-search-curie-*-001
text-search-babbage-*-001
text-search-ada-*-00`
BERT
SBERT
Claude, Cohere (Bert fine tuning)
2. LangChain
: ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ๊ณผ ์ดํ๋ฆฌ์ผ์ด์ ์ ํตํฉ์ ๊ฐ์ํํ๋ SDK(์ํํธ์จ์ด ๊ฐ๋ฐ ํคํธ - ๊ฐ๋ฐ ๋๊ตฌ์ ์งํฉ์ฒด)
https://www.youtube.com/watch?v=KDM6UM-msZk
๊ฒ์ ์ฆ๊ฐ ์์ฑ(Retrieval-augmented generation, RAG) - Google Search
'Deep Learning > [LLM] ์ด๋ก ๊ณต๋ถ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
LLM์ ๋ชจ๋ ๊ฒ 3 [PEFT-Parameter-efficient fine Tuning] (1) | 2024.03.22 |
---|---|
LLM์ ๋ชจ๋ ๊ฒ 2 [RAG-Retrieval Augmented Generation] (0) | 2024.03.22 |