RAG:沒有改變大模型,在大模型原有的基礎(chǔ)上加入了一些知識(shí),用來回答用戶的問題。
微調(diào):原有大模型的基礎(chǔ)上加上新的知識(shí)改造大模型,是一個(gè)新的模型。
場(chǎng)景:
1.動(dòng)態(tài)數(shù)據(jù):經(jīng)常變化的數(shù)據(jù), 一些業(yè)務(wù)數(shù)據(jù)經(jīng)常變化,適用于RAG,因?yàn)槲⒄{(diào)的成本太高。
2.模型能力的定制:微調(diào)
3.幻覺:降低模型的幻覺,RAG對(duì)模型的效果大于微調(diào)
4.可解釋性:RAG優(yōu)于為微調(diào),微調(diào)類似一種于端到端的,黑盒,不可解釋性
5.成本:在成本方面,RAG也是首選,因?yàn)椴恍枰?xùn)練模型,只需要像搭建一個(gè)工程一樣把RAG搭建起來。
6.依賴通用能力:RAG也是首選,微調(diào)會(huì)導(dǎo)致原有模型的一些能力減低,模型的遺忘
7.低延遲的場(chǎng)景:微調(diào),RAG流程多。
8.智能設(shè)備:選擇使用小模型,小模型需要的通用能力沒那么強(qiáng),亦或者需要某些方面的能力,使用微調(diào)。