文心又登顶，⼤模型的基本盘还是⽂本能⼒？

作者：文心又登顶，⼤模型的基本盘还是⽂本能⼒？

说出来可能都没人信，就算AI卷到DeepSeek V4这代，文本能力还是大模型的绝对基本盘，多模态似乎只是锦上添花的 “外挂”。前段时间热议的DeepSeek V4，最猛的升级，不是看懂图片，而是把长文本处理效率拉满了，百万字上下文成本砍到极致，推理稳定且快。这算不算是从侧面证明，大模型的核心竞争力，一直是读懂复杂文字、输出靠谱逻辑？因为本质上，人类的知识、逻辑、思考，99%都沉淀在文字里。几千年的书籍、论文、代码、聊天记录，全是文本。有效信息占比足够大，所以AI时代，⼤模型的基本盘还是⽂本能⼒。多模态看着炫酷，本质更像一位“翻译官”，把图像、语音转成文本，再让文本模型处理，最后转回去。如果没有文本能力打底，多模态可能就是一个空架子？有意思的是，就在刚刚LMArena⼤模型竞技场公布最新排名，文心5.1 Preview以1476分登上LMArena文本排行榜，而且是唯一一个登上该榜单前15的中国模型，像GPT-5.5和DeepSeek-V4-Pro等多款国内外“明星”模型，都被甩在了后面。现在大模型都卷，你追我赶的，尤其是文本模型。这次文心登顶，业内普遍认为，是因为用了“弹性训练”技术，据说能一次训练生成多种规模模型，做到以业界同规模模型约6%的预训练成本。这是真有点东西，听小道消息下个月在Create2026百度AI开发者大会上，文心5.1 会正式亮相，到时候可以看看，到底强在哪其实，不管是DeepSeek V4还是文心5.1 Preview，感觉未来3到5年，文本依然是大模型的核心。因为AI的终极目标是理解人类，而语言，就是理解的第一步。 #科技 #ai #大模型 #百度 #文心 #deepseek #文心大模型 #百度Create大会2026

文章详情

文心又登顶，⼤模型的基本盘还是⽂本能⼒？

推荐阅读