• Members 1 post
    2025年7月6日 14:53

    202421110302杨英琦
    最近参加了沐曦开源大模型应用GPU软件工程实践课程。这次课程更偏向应用实践,老师讲得非常具体,从大模型的原理、调用方式到实际场景中的使用技巧,尤其是围绕 智算GC的部分内容,讲得非常系统。课程中不仅讲解了大模型在文本生成、代码补全、问答系统等方面的应用,还穿插了很多真实案例,让我感受到这些技术离我们的工作和生活其实没有那么远。
    老师还专门讲解了 RAG 和微调的区别。之前总以为要让模型更“懂”某个领域,必须进行微调,但实际上 RAG(检索增强生成)技术通过引入外部知识库,能够让大模型在不改动本体参数的情况下也具备更强的问答和内容生成能力。这种思路非常适合我们做轻量级应用开发,不仅节省资源,而且灵活性更高。通过这次课程,我逐渐意识到,合理设计提示词、组织上下文、处理模型输出,比一味追求参数微调更“工程化”,也更贴近实际应用需求。
    实操部分是我最喜欢的环节。在老师的引导下,学习了如何申请 API Key,如何通过 Python 的 requests 或 SDK 接口调用模型服务,还了解了温度、最大生成长度等参数对模型输出风格的影响。我尝试实现了几个小功能,比如文本摘要、文章润色、知识问答等,让我真正体会到大模型作为“可调用服务”的强大和便利。过程中我也遇到了一些问题,比如长文本处理不连贯、模型回复不稳定等,这让我认识到提示词设计和输入分段策略在实际应用中非常关键。
    总之,这次课程不仅让我更系统地理解了大模型的工作原理,也让我第一次感受到“用得上”的成就感。从理论到实操,从模型选择到参数调优,从 RAG 到 智算GC,课程内容覆盖得很广,但并不空洞,很多都是能直接带到实践中的方法和经验。这门课对我之后深入大模型开发,尤其是构建具备智能能力的实际应用,提供了非常宝贵的起点和思路。