• Members 1 post
    2025年7月6日 19:43

    近期,在开源大模型课程中,我深入学习了开源技术、智算 模型应用(如 RAG、扩散模型等)以及相关平台工具(如 Gitee 智算、阿里云 “百炼” )的知识,收获颇丰,专业视野与实践认知都得到极大拓展。
    在开源技术学习中,我清晰认识到开源生态的双面性。开源通过开放分发、代码共享与社区传播,构建起协同创新的广阔平台,加速技术迭代与知识普惠;但开源代码的漏洞也会带来潜在风险,这让我明白技术发展需在开放与安全间找平衡。同时,了解沐曦参与的开源项目(如 FlashMLA、KTransformers 等 ),感受到企业在开源生态的积极作为,也懂得甄别不同项目价值,为后续参与开源贡献或技术选型积累经验。
    智算 模型与应用板块的学习,刷新了我对智能技术落地的认知。RAG 技术针对大模型知识过时、推理过程不透明等痛点,借助 Embedding 模型、向量数据库与知识召回,拓展模型知识边界并提升可解释性,让我看到突破模型固有局限的创新路径;扩散模型从随机噪声去噪生成图像的独特逻辑,以及 LDM 对 DPM 在潜在空间压缩、条件控制等方面的改进,展现出生成模型在创意领域的强大潜力;视频生成因算力需求、训练难度与冗余信息等特点,多阶段训练策略成为优化关键,这背后是对复杂任务精细拆解与分步攻克的思路,也让我意识到技术落地需适配场景特性。此外,强化学习中智能体与环境交互、LLM 撰写 Prompt 的技巧等内容,细化了我对 智算 应用全流程的理解,从模型底层逻辑到实际使用细节,逐步构建起完整知识链。
    平台工具与协议规范的学习,让我触摸到技术落地的 “最后一公里”。Gitee 智算 等平台运营模式,以及 DeepSeek - V3 资源包的访问与应用,展现出大模型生态的丰富生态;Meta 为 智算 Infra 设计的层级架构、阿里云 “百炼” 等平台定位,明晰了技术从底层算力到上层应用的流转路径;RESTful API、Python requests 库使用、Open智算 SDK 方法调用等内容,夯实了技术实践的工具基础,让我能将理论知识向实际开发转化。这些学习,不仅是知识积累,更是思维重塑 —— 从关注单一技术点,转向理解技术生态、产业协同与落地逻辑,为未来投身 智算 与开源领域实践,储备了认知与技能。
    这段学习旅程,让我深知技术发展的多元与深邃。未来,我将持续深耕,把所学融入实践,在开源贡献中锤炼,于 智算 应用里创新,追赶技术浪潮,探索更多可能,让知识真正转化为推动技术进步与个人成长的动力。