RAG,即Retrieval-Augmented Generation,是一种结合了检索(Retrieval)和生成(Generation)的人工智能技术。这种技术主要用于自然语言处理(NLP)领域,特别是在构建能够理解和生成自然语言的系统时。RAG模型由Facebook AI Research (FAIR) 提出,它结合了检索模型的长处和生成模型的能力,以提高语言生成任务的性能。
RAG的关键特点包括:
- 检索阶段(Retrieval Phase):
-
在这个阶段,模型会从一个大型的文档集合中检索出与输入查询最相关的文档片段。这通常通过使用向量检索技术实现,如基于BERT的嵌入。
- ...