说出来可能都没人信,就算AI卷到DeepSeek V4这代,文本能力还是大模型的绝对基本盘,多模态似乎只是锦上添花的 “外挂”。 前段时间热议的DeepSeek V4,最猛的升级,不是看懂图片,而是把长文本处理效率拉满了,百万字上下文成本砍到极致,推理稳定且快。 这算不算是从侧面证明,大模型的核心竞争力,一直是读懂复杂文字、输出靠谱逻辑? 因为本质上,人类的知识、逻辑、思考,99%都沉淀在文字里。几千年的书籍、论文、代码、聊天记录,全是文本。有效信息占比足够大,所以AI时代,⼤模型的基本盘还是⽂本能⼒。 多模态看着炫酷,本质更像一位“翻译官”,把图像、语音转成文本,再让文本模型处理,最后转回去。如果没有文本能力打底,多模态可能就是一个空架子? 有意思的是,就在刚刚LMArena⼤模型竞技场公布最新排名,文心5.1 Preview以1476分登上LMArena文本排行榜,而且是唯一一个登上该榜单前15的中国模型,像GPT-5.5和DeepSeek-V4-Pro等多款国内外“明星”模型,都被甩在了后面。 现在大模型都卷,你追我赶的,尤其是文本模型。这次文心登顶,业内普遍认为,是因为用了“弹性训练”技术,据说能一次训练生成多种规模模型,做到以业界同规模模型约6%的预训练成本。 这是真有点东西,听小道消息下个月在Create2026百度AI开发者大会上,文心5.1 会正式亮相,到时候可以看看,到底强在哪 其实,不管是DeepSeek V4还是文心5.1 Preview,感觉未来3到5年,文本依然是大模型的核心。因为AI的终极目标是理解人类,而语言,就是理解的第一步。 #科技 #ai #大模型 #百度 #文心 #deepseek #文心大模型 #百度Create大会2026