• Members 1 post
    2025年7月4日 20:30

    通过课程学习,深入了解了开源软件的优势和发展模式。沐曦公司的FlashMLA、KTransformers等开源项目展示了GPU软件工程在实际应用中的价值。
    RAG技术通过检索增强生成,有效解决了大模型的幻觉问题。核心流程包括文档向量化、相似度匹配和知识融合。Embedding模型将文本转换为高维向量,向量数据库实现高效检索,这种架构在实际应用中显著提升了生成内容的准确性。扩散模型采用逐步去噪的生成机制,从随机噪声开始,通过多轮迭代得到目标图像。LDM相比DDPM的改进主要体现在潜在空间操作和条件控制能力的增强。视频生成领域的多阶段训练策略平衡了模型收敛性和计算资源需求。
    掌握了REST API的基本操作,POST方法对应CRUD中的Create操作。Python requests库的json参数简化了数据传输。Open智算兼容SDK的chat.completion.create()方法是聊天补全的标准接口,异步版本acreate()适用于高并发场景。Bearer Token认证是API安全访问的关键。
    智算 Agent框架中,Memory组件负责长期信息存储,Planner模块处理行动序列规划,LLM作为系统的核心控制器。LangCh智算n框架提供了LLM连接与编排的完整解决方案,Tool抽象封装了外部功能调用。这种模块化设计提高了系统的可扩展性。
    Ch智算n-of-Thought提示技术通过引导模型进行逐步推理,显著提升了逻辑推理和计算任务的表现。提示工程需要保持简洁明确,避免冗长复杂的描述。实际使用了Gitee 智算的DeepSeek-V3模型,体验了标准化API接口的便利性。MetaX的智算 Infrastructure架构从GPU算力基座到集群再到云服务,展现了完整的技术栈。阿里云百炼作为企业级大模型平台,为实际应用提供了完整的开发环境。