开源大模型学习笔记

在参与开源大模型应用 GPU 软件工程实践课的过程中，我对 RAG（检索增强生成）和 Prompt 工程有了更深刻的认知。
在 RAG 技术的实践中，我深刻体会到其对模型输出质量的提升作用。传统的大语言模型在处理知识密集型任务时，容易出现 “幻觉” 问题，生成看似合理却与事实不符的内容。而 RAG 通过检索外部知识库，将相关信息与模型生成能力相结合，有效缓解了这一困境。例如，在构建企业智能客服系统时，通过将企业文档、产品手册等资料构建成知识库，当用户提问时，系统先检索出相关文档片段，再将其融入模型的输入中，引导模型生成更准确、更贴合实际业务的回答。这一过程让我认识到，RAG 不仅是技术的叠加，更是对数据、算法和计算资源的系统性整合，GPU 强大的算力为 RAG 的高效运行提供了坚实保障。
Prompt 工程同样让我大开眼界。看似简单的文本输入，实则蕴含着巨大的优化空间。通过精心设计的示例和逻辑引导，大模型能够更好地理解任务要求，输出更符合预期的结果。例如，在进行文本分类任务时，通过在 Prompt 中加入少量标注样本和推理步骤，模型的分类准确率得到了显著提升。这让我意识到，Prompt 不仅仅是与模型的 “对话语言”，更是一种对模型能力的挖掘和引导艺术。同时，在实践中我也发现，Prompt 的效果会受到模型特性、任务类型和数据分布等多种因素影响，需要不断调试和优化才能达到最佳效果。
在未来我希望能将这些实践经验应用到更多实际场景中，探索大模型技术与不同领域的深度融合