DeepSeek百万上下文，我踩了一周的坑才搞懂

作者：DeepSeek百万上下文，我踩了一周的坑才搞懂

100万token能塞70万字，但不是说塞进去就完了。分享一下我用了一个月的血泪经验👇 1. 100万token到底能装什么你以为：把整个代码库丢进去让它自己看；实际是：给阅读计划，让它按顺序读 70万字什么概念？《三体》三部曲全文。但实测下来，一次性全塞进去反而让它"泛"了——能答出来但不精准。正确的做法是先丢目录结构让模型了解全貌，再分批喂代码。我直接说数据：一次全塞响应时间70-90秒，分阶段喂降到了20-40秒，而且回答质量明显更高。 2. 缓存命中和未命中，价格差10倍这个太关键了。DeepSeek缓存命中和未命中的价格差将近10倍： - 缓存命中：0.028美元/百万token（Flash） - 缓存未命中：0.14美元/百万token 怎么提高命中率？固定内容（系统提示词、工具定义、示例模板）放开头，用户动态提问放末尾。格式有一点不一样缓存就失效了——空格、换行都要保持一致。 3. 模型名要加[1m]才能解锁这个坑我踩了一周才发现。调用API时，默认模型名只有200K上下文。必须在模型名末尾加 `[1m]` 才能解锁完整100万。 - 错误：`deepseek-v4-pro`（只有200K） - 正确：`deepseek-v4-pro[1m]`（完整100万） 4. Pro和Flash都支持，但用法不同两个模型都支持100万上下文，区别在于： - Flash：速度快成本低，适合跑长文档摘要、知识库问答 - Pro：推理更严，适合代码仓库分析、复杂文档理解我现在的做法：日常分析用Flash，关键项目审查用Pro，两边都加[1m]。你用过DeepSeek的百万上下文吗？感觉怎么样👇 关注我，每天给你推送DeepSeek最新消息 🔔 #DeepSeek #百万上下文 #AI教程 #大模型 #避坑指南

文章详情

DeepSeek百万上下文，我踩了一周的坑才搞懂

推荐阅读