近期对DeepSeek V4的1M上下文窗口进行了实际测试,以《三体》全集(约46万字)为测试文本,分6批次加载(累计46.3万字),重点验证其长文本处理能力【开启专家模式后应该就是V4了】 测试步骤: 分批上传《三体》文本(第1段至第6段,涵盖《三体I》和《三体II》全文); 提问“仅存在于上传文本中”的细节问题(如《三体I》结尾“更多精彩,更多好书”后的内容、《三体II》中的盗版网站标记位置); 观察回复的准确性和速度。 测试结果: 准确性: 模型准确回答了《三体I》结尾为盗版网站宣传语(非正文),并精准定位《三体II》中的盗版标记(如:【马赛克URL部分!!!】),证明其确实处理了上传的文本内容,而非依赖训练数据; 速度: 分批加载下,回复速度与V3相当,思考链响应迅速,无明显延迟; 功能限制: 测试期间图片/文档上传功能暂时关闭(专家模式限制),前端输入大概只有200K,但纯文本多段输入的测试已验证上下文窗口的有效性。 结论: DeepSeek V4的1M上下文窗口应该是真的,而且DSV4大抵是来了,对长文本的处理能力显著,适合处理大部头文献或长文档,所以应该特别适合openclaw用,具体代码能力只有web的chatbot不太好测试。虽当前前端输入限制需分批上传,但核心功能已达到预期。 #openclaw #DeepSeek #AI测试 #上下文窗口 #长文本处理 #科技评测 #DeepSeekV4#deepseekv4 #大模型