6月5日,近日,深圳河套学院Al训练平台项目团队,联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为有关团队,协同深智城AI算力平台,面向国产算力大模型训练开展联合攻关。依托昇腾910C国产AI算力集群,完成1.6万亿参数大模型DeepSeek-V4-Pro全参数后训练。此次实践为全球第三方机构在国产算力平台上完成该级别模型训练的相关探索积累了重要经验,也印证了国产AI芯片可支撑世界级超大参数模型训练工作。从技术应用角度来看,调用已有模型开展业务推理,与从零完成模型全参数训练分属不同技术环节,二者在技术难度、硬件要求上存在明显区别。本次试验结果表明,国产AI算力已可承担顶级大模型训练任务,相关技术路径具备可行性。(深圳发布)
⚠️ 免责声明:本文内容仅为区块链技术资讯与知识分享,不构成任何投资建议。虚拟货币相关活动属国家明令禁止的非法金融活动,请严格遵守法律法规,理性判断,风险自担。