cover_image

7种RAG 架构及其核心组件概览

鸿煊 鸿煊的学习笔记
2024年12月20日 13:50

Retrieval-Augmented Generation(RAG)架构正发挥着日益重要的作用。它通过在 AI 生成过程中引入外部知识检索,极大地提升了 AI 回答的准确性和全面性,从基础的文档查询逐步发展为多模态、多智能体协同的智能架构。本文将概览 RAG 架构从基础到高级的 7 种模式及其核心组件。

图片

一、RAG 的 7 种模式

(一)Naive RAG:基础架构的构

Naive RAG 是 RAG 架构的最基础形式。其工作流程主要包含三个关键步骤:文档检索、处理和生成响应。在文档检索阶段,系统会根据用户的查询在文档库中查找相关内容;接着对检索到的文档进行处理,为后续生成响应做准备;最后,生成模型利用这些处理后的信息生成最终的回答。这种简单直接的架构为 RAG 技术奠定了基石,让我们初步领略到如何将外部知识引入 AI 生成过程。

(二)Retrieve-and-rerank:优化检索结果

在 Naive RAG 的基础上,Retrieve-and-rerank 模式增加了重排序步骤。当完成初始的文档检索后,重排序模型会根据一定的标准对检索结果进行重新排序。这样做的目的是优化检索结果的相关性,使得最终提供给生成模型的上下文信息更加精准。通过这种方式,系统能够更好地筛选出与用户查询最为相关的文档片段,从而进一步提高生成响应的质量。

(三)Multimodal RAG:突破文本限制

Multimodal RAG 的独特之处在于它能够处理多种类型的数据,而不仅仅局限于文本。在当今数字化时代,信息的形式多种多样,如图像、音频等。Multimodal RAG 可以将这些不同模态的数据进行整合处理,例如在处理包含图像的文档时,它能够同时理解图像中的信息以及与之相关的文本描述。这一模式拓宽了 RAG 架构的应用范围,使其能够适应更加复杂和多样化的信息环境。

(四)Graph RAG:挖掘知识连接

Graph RAG 利用图数据库来增强知识连接。在这种模式下,文档之间的关系不再是孤立的,而是通过图结构进行表示。图数据库可以更好地捕捉文档之间的语义关联和逻辑关系,例如一篇关于科技的文章可能与其他相关的技术文档、研究报告等通过引用、相似主题等关系连接起来。这样,当进行查询时,系统能够基于这种知识图谱更深入地理解文档间的关系,提供更有深度和广度的上下文信息,从而提升回答的准确性和全面性。

(五)Hybrid RAG:融合多种技术优势

Hybrid RAG 正如其名,结合了多种技术的优势。它既包含了图结构所带来的知识关系理解能力,又融合了传统检索方法的高效性。这种融合使得 Hybrid RAG 在处理复杂查询时能够灵活运用不同技术的长处。例如,在某些情况下,传统检索方法可以快速定位到相关文档,而图结构则有助于进一步挖掘文档之间深层次的联系,从而为生成模型提供更丰富、更准确的信息,以生成高质量的响应。

(六)Agentic RAG Router:智能路由查询

Agentic RAG Router 引入了 AI Agent 来路由和处理查询。AI Agent 在这里扮演着智能决策的角色,它能够根据用户查询的特点、当前系统的状态以及可用资源等因素,选择最适合的处理路径。例如,当面对不同类型的查询时,它可以决定是直接从向量数据库中检索信息,还是需要调用其他外部工具或服务。这种智能路由机制提高了系统的效率和灵活性,使得 RAG 架构能够更好地应对多样化的用户需求。

(七)Agentic RAG Multi - Agent:多智能体协同工作

Agentic RAG Multi - Agent 模式则更进一步,它使用多个专门的 AI Agent 协同工作。这些智能体可以分别负责不同的任务,并且能够调用不同的工具,如向量搜索、网页搜索、Slack、Gmail 等。例如,一个智能体负责在向量数据库中进行高效的信息检索,另一个智能体则可以通过网页搜索获取最新的外部信息,还有的智能体可以与 Slack 或 Gmail 等通信工具交互,获取相关的团队协作或邮件信息。通过多智能体的协同合作,RAG 架构能够整合来自多个渠道和资源的信息,为用户提供更加全面和准确的回答。

二、RAG 架构的核心组件

(一)嵌入模型

嵌入模型在 RAG 架构中起着关键作用,它负责将文本转换为向量表示。这种向量表示能够将文本的语义信息以一种数学形式呈现,使得计算机能够更好地理解和处理文本之间的相似性和相关性。例如,在文档检索阶段,通过将查询和文档都转换为向量,系统可以快速计算它们之间的相似度,从而找到与查询最相关的文档。

(二)生成模型

生成模型是负责最终内容生成的核心组件。它基于检索到的上下文信息,运用自身的算法和训练知识,生成回答用户查询的文本内容。生成模型的性能和质量直接影响着 RAG 架构输出的准确性和流畅性。不同的生成模型可能具有不同的特点和优势,如某些模型在生成自然语言描述方面表现出色,而另一些模型则在处理特定领域知识时更加准确。

(三)重排序模型

重排序模型专注于优化检索结果的相关性。在文档检索完成后,重排序模型会根据预先设定的规则和算法,对检索到的文档进行重新评估和排序。这些规则可能涉及文档与查询的关键词匹配程度、语义相关性、文档的质量和权威性等多个因素。通过重排序,系统能够确保提供给生成模型的上下文信息是最相关和最有价值的。

(四)向量数据库

向量数据库是存储和检索向量化内容的重要设施。它为 RAG 架构提供了高效的数据存储和检索能力,能够快速定位与查询向量相似的文档向量。向量数据库的设计和性能对于整个 RAG 系统的效率至关重要,它需要能够处理大规模的向量数据,并支持快速的相似性搜索操作。

(五)提示模

提示模板在 RAG 架构中起到规范化查询处理的作用。它为用户查询提供了一种标准化的格式,使得系统能够更好地理解用户的意图。同时,提示模板也可以包含一些预定义的指令或引导信息,帮助生成模型更好地生成响应。例如,模板可以规定查询的结构、需要包含的关键信息等,从而提高整个系统的准确性和一致性。

(六)AI Agent

AI Agent 是 RAG 架构中的智能决策和任务协调者。在不同的模式中,AI Agent 发挥着不同的作用,如在 Agentic RAG Router 中进行查询路由决策,在 Agentic RAG Multi - Agent 中协调多个智能体的工作。它能够根据系统的目标、环境和用户需求,动态地调整系统的行为,实现高效的任务执行和资源利用。

大模型 · 目录
上一篇AI Agent:7个国内框架 & Agent应用下一篇BERT新版本:ModernBERT -- Smarter, Better, Faster, Longer
继续滑动看下一个
鸿煊的学习笔记
向上滑动看下一个