文章详情

专注互联网科技,赋能企业数字化发展

deepseek-V4某些方面有点“蠢”…

作者:deepseek-V4某些方面有点“蠢”…

最近很多人包括我在内,都感觉V4在普通日常、轻型角色扮演等方面的对话质量不如V3.2,所以我个人在这里弄了个以日常闲聊对话为基础的小对比实验,找V3.2和V4差异的原因… 叠个甲:本人完全是菜鸟小白门外汉,如果哪里说错了欢迎大佬指正。 1、选择了以前的一个和官网V3.2关于苏式园林设计的闲聊对话窗口(P2)为基础,原版对话轮次截图之上至少还有十几轮关于苏式园林资料构建的上文环境,软件设置全部是默认值。 官网V3.2在我提供的园林场景描述上给出了非常全面的补充,空间布局合理(瀑布三级跌水)物品用途清晰(生态池的循环);景物命名(从亭榭名称到奇石用典)和装饰物选择(宋氏轱辘、雨链风铎等)符合描述场景苏式园林所属的中式古典文化和风雅意境,推荐的十几种植物品种的商品名也是对应现实的,甚至还描述了一天时间内不同的场景画面。 2、打包原版窗口的全部十几轮上文,创建对话分支让官网V4Pro来进行回复(P3),然后就出现了非常诡异的一幕,V4Pro先是思考链使用了英文,之后的输出只是把我上轮对话给他的场景描述全部复述了一遍,没有添加什么细节补充,使用的描述语言(“网红打卡点”、“哈喇园”)也不符合整场对话产生的古典风雅的文化氛围,某些细节信息还给错了(穗莼,也就是水盾草和莼菜不是一种植物,穗莼也不能吃)对话质量和信息密度急剧暴跌… 3、因为V4Pro的诡异表现,我就又去翻了翻官方的报告和一些讲解视频…… 个人推测的可能是,V4使用的注意力和前代V3不一样,如果说前代V3是将上文弄成一个摘要速记,那么V4就是把上文压缩成了一个目录,这样可以极大提高模型的记忆能力(V4能完全回顾上文)和节约算力。但是极致的信息压缩带来就是信息细节的丢失,你可以记住三天前吃了猪排饭很好吃,但你很难再想起吃时的每一口感觉。所以如果没有指令约束,每轮对话要不要回顾上文、怎样回顾上文就交给了模型本身来决定,而这可能就是为何P3 V4Pro会语境大幅漂移和回复质量急剧下降的原因…… 4、抱着以上的这种猜测,于是再次创建了原版P2对话的分支,这次同样交给V4Pro来进行回复(P4),唯一不同的变量是在我给V4Pro的段落末尾加了一句“补充提示:请全部回顾上文环境”,可以看到,P4这次V4Pro的回复无论是从格式、内容、风格和氛围上都很接近P2原版V3.2的回复了,虽然从美感、发散性和质量上来讲个人仍觉得比V3.2差太多 另外V4Pro回复一股子GPT-5.2味儿,有点🤢… #DeepSeek #deepseek

返回新闻列表