文章详情

专注互联网科技,赋能企业数字化发展

硬核突破!昇腾千卡集群成功训练DeepSeek

作者:硬核突破!昇腾千卡集群成功训练DeepSeek

6月5日深圳官方官宣,华为联合多所高校与研究院,用1000颗昇腾910C国产芯片组成集群,成功完成1.6万亿参数DeepSeek-V4-Pro大模型的全参数后训练! 先给小白通俗解读一下 很多人分不清AI推理和训练: 推理:模型已经训练好,正常问答输出答案,国产芯片之前就能胜任 训练(尤其是全参数后训练):要对模型上亿万个参数逐一更新调优,对芯片互联、软件栈、集群稳定性要求拉满,也是长期以来国产算力的短板 这次训练稳定运行超1500步,训练算子效率直接提升14%,实打实的工业级成果。 还记得去年,这款系列模型还无法在昇腾芯片上完成完整训练,短短不到一年实现逆袭,进步速度肉眼可见! 当然客观来说,目前完成的是后训练阶段,和从零开始的大规模预训练还有距离,部分核心数据也待进一步公开验证。 但不可否认,这是国产AI算力从「只能推理」迈向「可支撑训练」的关键一步 在外部芯片管制的大环境下,我们一步步补齐短板,自主可控的AI算力生态正在稳步成型。! #华为昇腾 #国产芯片 #AI大模型 #科技突破 #DeepSeek #算力自主

返回新闻列表