昨天发完DeepSeek的解读和测试内容, 群里细心的小伙伴问了一个问题,就是测得是high模式还是max模式, 很明显是high。 我相信很多人在一手测试的时候,都不会注意,或者说用的都是默认参数。 我今天又测试了3千万 Tokens,使用max之后,在coding和agentic方面,有了很大程度提高, 尤其是coding方面。 如果详细看论文,你也会发现,max模式下的各项分数比high高出一大截。 网上一些说工具调用和skills无法使用的, 我在max模式下,也没有出现。 如果你用claude code,可以执行, claude --effort max 如果你用openclaw,配置上增加, "thinkingDefault": "xhigh", 如果你是代码调用,你直接增加参数, reasoning_effort="max" 测试下来之后,max模式下,DeepSeek-V4-Pro的效果还是可以跟GLM5.1、K2.6这些模型一较高下的。 #大模型 #开源 #deepseek #deepseekv4