▼最近直播超级多,预约保你有收获
今晚直播:《大模型应用案例实战》
—1—
RAG 检索增强介绍
检索增强生成(Retrieval Augmented Generation,RAG)是一种强大的工具,它通过将外部知识整合到生成过程中,增强了大型语言模型(LLM)的性能。
让我们探索 RAG 的关键组成部分。
第一、定制知识库
定制知识库是指一系列紧密关联且始终保持更新的信息集合,它构成了 RAG 的核心基础。这个知识库可以表现为一个结构化的数据库形态,也可以表现为一套详尽的文档体系,甚至可能是两者兼具的综合形式。
第二、分块
第三、Embedding 嵌入 & Embedding Model 嵌入模型
一种将文本数据表示为数值向量的技术,可以输入到机器学习模型中。
嵌入模型负责将文本转换成这些向量。
第四、向量数据库
一系列预先计算的文本数据向量表示,用于快速检索和相似性搜索,具有SQL CRUD 操作、元数据过滤和水平扩展等功能。
第五、用户聊天界面
一个用户友好的界面,允许用户与 RAG 系统互动,提供输入查询并接收输出。
查询转换为嵌入,用于从向量数据库检索相关上下文!
第六、提示模板
为 RAG 系统生成合适提示的过程,可以是用户查询和定制知识库的组合。
这作为输入给 LLM,产生最终回复。
参考引用:https://mp.weixin.qq.com/s/CAcmAOJ6SC7JU80AqAsyuQ
新年领取《AI 大模型技术知识图谱》
END