• Members 1 post
    2025年7月7日 09:36

    在参与开源大模型应用 GPU 软件工程实践课的过程中,我对 RAG(检索增强生成)和 Prompt 工程有了更深刻的认知。
    在 RAG 技术的实践中,我深刻体会到其对模型输出质量的提升作用。传统的大语言模型在处理知识密集型任务时,容易出现 “幻觉” 问题,生成看似合理却与事实不符的内容。而 RAG 通过检索外部知识库,将相关信息与模型生成能力相结合,有效缓解了这一困境。例如,在构建企业智能客服系统时,通过将企业文档、产品手册等资料构建成知识库,当用户提问时,系统先检索出相关文档片段,再将其融入模型的输入中,引导模型生成更准确、更贴合实际业务的回答。这一过程让我认识到,RAG 不仅是技术的叠加,更是对数据、算法和计算资源的系统性整合,GPU 强大的算力为 RAG 的高效运行提供了坚实保障。​
    Prompt 工程同样让我大开眼界。看似简单的文本输入,实则蕴含着巨大的优化空间。通过精心设计的示例和逻辑引导,大模型能够更好地理解任务要求,输出更符合预期的结果。例如,在进行文本分类任务时,通过在 Prompt 中加入少量标注样本和推理步骤,模型的分类准确率得到了显著提升。这让我意识到,Prompt 不仅仅是与模型的 “对话语言”,更是一种对模型能力的挖掘和引导艺术。同时,在实践中我也发现,Prompt 的效果会受到模型特性、任务类型和数据分布等多种因素影响,需要不断调试和优化才能达到最佳效果。​
    在未来我希望能将这些实践经验应用到更多实际场景中,探索大模型技术与不同领域的深度融合