一文搞懂 RAG 检索增强生成

原创玄姐玄姐聊AGI

▼最近直播超级多，预约保你有收获

今晚直播：《大模型应用案例实战》

—1—

RAG 检索增强介绍

检索增强生成（Retrieval Augmented Generation，RAG）是一种强大的工具，它通过将外部知识整合到生成过程中，增强了大型语言模型（LLM）的性能。

让我们探索 RAG 的关键组成部分。

第一、定制知识库

定制知识库是指一系列紧密关联且始终保持更新的信息集合，它构成了 RAG 的核心基础。这个知识库可以表现为一个结构化的数据库形态，也可以表现为一套详尽的文档体系，甚至可能是两者兼具的综合形式。

第二、分块

分块技术是指将大规模的输入文本有策略地拆解为若干个较小、更易管理的片段的过程。这一过程旨在确保所有文本内容均能适应嵌入模型所限定的输入尺寸，同时也有助于显著提升检索效率。

实施一种明智且高效的分块策略，在优化信息处理流程方面具有关键作用，能够极大地增强您的 RAG 系统的性能与响应能力。

第三、Embedding 嵌入 & Embedding Model 嵌入模型

一种将文本数据表示为数值向量的技术，可以输入到机器学习模型中。

嵌入模型负责将文本转换成这些向量。

第四、向量数据库

一系列预先计算的文本数据向量表示，用于快速检索和相似性搜索，具有SQL CRUD 操作、元数据过滤和水平扩展等功能。

第五、用户聊天界面

一个用户友好的界面，允许用户与 RAG 系统互动，提供输入查询并接收输出。

查询转换为嵌入，用于从向量数据库检索相关上下文！

第六、提示模板

为 RAG 系统生成合适提示的过程，可以是用户查询和定制知识库的组合。

这作为输入给 LLM，产生最终回复。

参考引用：https://mp.weixin.qq.com/s/CAcmAOJ6SC7JU80AqAsyuQ

—2—

新年领取《AI 大模型技术知识图谱》

我们梳理了下 AI 大模型的知识图谱，包括12项核心技能：大模型内核架构、大模型开发 API、开发框架、向量数据库、AI 编程、AI Agent、缓存、算力、RAG、大模型微调、大模型预训练、LLMOps 等。

为了帮助同学们掌握 AI 大模型开发技能，我们准备了一系列免费直播干货，扫码全部领取！

END

继续滑动看下一个