RAG

Retrieval-Augmented Generation，核心是三个部分 ——

~~（废话~~

简单来说，就是把知识进行存储，之后在LLM给出答案前，先进行一次检索，把与提问相关的知识塞进 prompt 中，使得LLM给出的答案可以基于真实的知识库，从而缓解大语言模型（LLM）知识更新滞后、且容易“胡编乱造”（幻觉）的问题。

类似于“开卷考试”，模型在训练结束的瞬间，自己积累的知识就存在各个权重之中。引入 RAG 相当于外接一块知识库（开卷），允许在考试（交互）的时候查阅知识库给出答案。

流程

在基本的框架下有很多 Trick，比如把用户的 Prompt 先调用小点的模型进行规范化或者增强再进行数据库中的查找等

（继续留钩子