课程学习心得

高晨昊 202422080940

RAG（Retrieval-Augmented Generation，检索增强生成）是一种将信息检索技术与大语言模型生成能力相结合的智算方法。它的核心思想是通过实时检索外部知识库来增强语言模型的生成能力，从而解决传统大语言模型存在的知识局限性、事实性错误和时效性不足等问题。

在技术实现上，RAG系统首先会对用户输入的问题进行分析，然后使用高效的检索算法从海量的知识库中查找最相关的文档片段。这些检索到的内容会被整合到生成模型的输入中，为语言模型提供事实依据和上下文参考。这种架构既保留了大型语言模型的强大语言理解和生成能力，又通过外部知识检索弥补了模型内在知识的不足。

一个典型的RAG开发流程通常从知识库准备开始。开发者需要收集和整理相关的文本资料，使用文本分割工具将长文档切分成适当大小的片段。然后借助嵌入模型将这些文本转化为高维向量表示，存储在专门的向量数据库中。当用户提出问题时，系统会先将问题同样转化为向量，在向量空间中找到最相似的文档片段。这些检索到的相关内容会与原始问题一起输入到语言模型中，指导模型生成准确可靠的回答。

在实际应用中，RAG系统可以通过多种方式优化。比如采用更先进的嵌入模型来提高检索精度，设计更智能的提示模板来优化生成质量，或者引入重排序机制来确保返回最相关的参考资料。这种架构特别适合需要处理专业知识或时效性信息的应用场景，如智能客服、医疗咨询、法律文书处理等。通过持续更新知识库内容，RAG系统可以保持知识的及时性，而无需重新训练整个语言模型。

检索：根据用户的查询内容，从外挂知识库获取相关信息。具体来说，就是将用户的查询通过嵌入模型转换成向量，以便与向量数据库中存储的知识相关的向量进行比对。通过相似性搜索，从向量数据库中找出最匹配的前 K 个数据。
增强：将用户的查询内容和检索到的相关知识一起嵌入到一个预设的提示词模板中。
生成：将经过检索增强的提示词内容输入到大语言模型（LLM）中，以此生成所需的输出。