文章详情

专注互联网科技,赋能企业数字化发展

终于知道为啥之前用不好DeepSeek3.2了

作者:终于知道为啥之前用不好DeepSeek3.2了

国庆前,DeepSeek 发布了 DeepSeek-V3.2-Exp,官方报告性能挺强的,但有开发者说,实际部署时,总感觉结果不太满意,以为是用法不对。 最近谜底揭晓! DeepSeek官方发了一条消息,说之前的版本确实代码有一点小bug,现在已经修复。听说还是百度百舸团队在部署时发现了问题,还及时反馈给了DeepSeek团队。 bug一修复,3.2性能立刻回来了,用上了DSA 架构的3.2性能,确实比3.1强很多,关键用的算力还少了! 现在已经有点开始期待同样是DSA架构的DS4.0了! #大厂#互联网大厂#大模型#千帆#人工智能#开源#AI工具#百度智能云 #百度百舸 #deepseek #DeepSeekV4

返回新闻列表