这几天在 Claude Code 里接入 DeepSeek V4,体验确实很爽,token 成本也不高。 但我遇到一个问题: 在 Claude Code 里,DeepSeek V4 不能直接读取图片,所以我自己写了一个Skill 来解决这个问题: deepseek-v4-vision-ocr 原理很简单: 图片进来后,先在本地用 OCR 提取文字,再把识别出来的内容交给模型处理。 适合这些场景: 截图里的报错信息 网页 / 软件界面截图 图片里的中文、英文文字 让 DeepSeek V4 在 Claude Code 里处理“看不见”的图片内容 安装方式我写在 GitHub README 里了,几步就能配置好,感兴趣的小伙伴可以试试: https://github.com/sjx417/deepseek-v4-vision-ocr #deepseek #deepseekv4 #claudecode #skill #ocr