7种RAG 架构及其核心组件概览

原创鸿煊鸿煊的学习笔记

2024年12月20日 13:50

Retrieval-Augmented Generation（RAG）架构正发挥着日益重要的作用。它通过在 AI 生成过程中引入外部知识检索，极大地提升了 AI 回答的准确性和全面性，从基础的文档查询逐步发展为多模态、多智能体协同的智能架构。本文将概览 RAG 架构从基础到高级的 7 种模式及其核心组件。

一、RAG 的 7 种模式

（一）Naive RAG：基础架构的构建

Naive RAG 是 RAG 架构的最基础形式。其工作流程主要包含三个关键步骤：文档检索、处理和生成响应。在文档检索阶段，系统会根据用户的查询在文档库中查找相关内容；接着对检索到的文档进行处理，为后续生成响应做准备；最后，生成模型利用这些处理后的信息生成最终的回答。这种简单直接的架构为 RAG 技术奠定了基石，让我们初步领略到如何将外部知识引入 AI 生成过程。

（二）Retrieve-and-rerank：优化检索结果

在 Naive RAG 的基础上，Retrieve-and-rerank 模式增加了重排序步骤。当完成初始的文档检索后，重排序模型会根据一定的标准对检索结果进行重新排序。这样做的目的是优化检索结果的相关性，使得最终提供给生成模型的上下文信息更加精准。通过这种方式，系统能够更好地筛选出与用户查询最为相关的文档片段，从而进一步提高生成响应的质量。

（三）Multimodal RAG：突破文本限制

Multimodal RAG 的独特之处在于它能够处理多种类型的数据，而不仅仅局限于文本。在当今数字化时代，信息的形式多种多样，如图像、音频等。Multimodal RAG 可以将这些不同模态的数据进行整合处理，例如在处理包含图像的文档时，它能够同时理解图像中的信息以及与之相关的文本描述。这一模式拓宽了 RAG 架构的应用范围，使其能够适应更加复杂和多样化的信息环境。

（四）Graph RAG：挖掘知识连接

Graph RAG 利用图数据库来增强知识连接。在这种模式下，文档之间的关系不再是孤立的，而是通过图结构进行表示。图数据库可以更好地捕捉文档之间的语义关联和逻辑关系，例如一篇关于科技的文章可能与其他相关的技术文档、研究报告等通过引用、相似主题等关系连接起来。这样，当进行查询时，系统能够基于这种知识图谱更深入地理解文档间的关系，提供更有深度和广度的上下文信息，从而提升回答的准确性和全面性。

（五）Hybrid RAG：融合多种技术优势

Hybrid RAG 正如其名，结合了多种技术的优势。它既包含了图结构所带来的知识关系理解能力，又融合了传统检索方法的高效性。这种融合使得 Hybrid RAG 在处理复杂查询时能够灵活运用不同技术的长处。例如，在某些情况下，传统检索方法可以快速定位到相关文档，而图结构则有助于进一步挖掘文档之间深层次的联系，从而为生成模型提供更丰富、更准确的信息，以生成高质量的响应。

（六）Agentic RAG Router：智能路由查询

Agentic RAG Router 引入了 AI Agent 来路由和处理查询。AI Agent 在这里扮演着智能决策的角色，它能够根据用户查询的特点、当前系统的状态以及可用资源等因素，选择最适合的处理路径。例如，当面对不同类型的查询时，它可以决定是直接从向量数据库中检索信息，还是需要调用其他外部工具或服务。这种智能路由机制提高了系统的效率和灵活性，使得 RAG 架构能够更好地应对多样化的用户需求。

（七）Agentic RAG Multi - Agent：多智能体协同工作

Agentic RAG Multi - Agent 模式则更进一步，它使用多个专门的 AI Agent 协同工作。这些智能体可以分别负责不同的任务，并且能够调用不同的工具，如向量搜索、网页搜索、Slack、Gmail 等。例如，一个智能体负责在向量数据库中进行高效的信息检索，另一个智能体则可以通过网页搜索获取最新的外部信息，还有的智能体可以与 Slack 或 Gmail 等通信工具交互，获取相关的团队协作或邮件信息。通过多智能体的协同合作，RAG 架构能够整合来自多个渠道和资源的信息，为用户提供更加全面和准确的回答。

二、RAG 架构的核心组件

（一）嵌入模型

嵌入模型在 RAG 架构中起着关键作用，它负责将文本转换为向量表示。这种向量表示能够将文本的语义信息以一种数学形式呈现，使得计算机能够更好地理解和处理文本之间的相似性和相关性。例如，在文档检索阶段，通过将查询和文档都转换为向量，系统可以快速计算它们之间的相似度，从而找到与查询最相关的文档。

（二）生成模型

生成模型是负责最终内容生成的核心组件。它基于检索到的上下文信息，运用自身的算法和训练知识，生成回答用户查询的文本内容。生成模型的性能和质量直接影响着 RAG 架构输出的准确性和流畅性。不同的生成模型可能具有不同的特点和优势，如某些模型在生成自然语言描述方面表现出色，而另一些模型则在处理特定领域知识时更加准确。

（三）重排序模型

重排序模型专注于优化检索结果的相关性。在文档检索完成后，重排序模型会根据预先设定的规则和算法，对检索到的文档进行重新评估和排序。这些规则可能涉及文档与查询的关键词匹配程度、语义相关性、文档的质量和权威性等多个因素。通过重排序，系统能够确保提供给生成模型的上下文信息是最相关和最有价值的。

（四）向量数据库

向量数据库是存储和检索向量化内容的重要设施。它为 RAG 架构提供了高效的数据存储和检索能力，能够快速定位与查询向量相似的文档向量。向量数据库的设计和性能对于整个 RAG 系统的效率至关重要，它需要能够处理大规模的向量数据，并支持快速的相似性搜索操作。

（五）提示模板

提示模板在 RAG 架构中起到规范化查询处理的作用。它为用户查询提供了一种标准化的格式，使得系统能够更好地理解用户的意图。同时，提示模板也可以包含一些预定义的指令或引导信息，帮助生成模型更好地生成响应。例如，模板可以规定查询的结构、需要包含的关键信息等，从而提高整个系统的准确性和一致性。

（六）AI Agent

AI Agent 是 RAG 架构中的智能决策和任务协调者。在不同的模式中，AI Agent 发挥着不同的作用，如在 Agentic RAG Router 中进行查询路由决策，在 Agentic RAG Multi - Agent 中协调多个智能体的工作。它能够根据系统的目标、环境和用户需求，动态地调整系统的行为，实现高效的任务执行和资源利用。

大模型61

rag2

大模型 · 目录

上一篇AI Agent：7个国内框架 & Agent应用下一篇BERT新版本：ModernBERT -- Smarter, Better, Faster, Longer

继续滑动看下一个