😭 痛点场景 你有没有遇到过这种情况: 你:发了一张图片给 AI AI:抱歉,我是文本模型,无法识别图片内容... 你:😭 只能换个支持视觉的模型? 别急!今天教你一招,让文本模型也能"看图"! 💡 解决方案 核心思路:配置 imageModel,实现自动切换! 文本消息 → glm-5 处理(省钱) 图片消息 → 自动切换 kimi-k2.5(能看图) 🛠️ 配置步骤(3步搞定) Step 1:检查可用模型 cat ~/.openclaw/openclaw.json | grep -A5 "image" 找到 "input": ["text", "image"] 这样的配置 Step 2:添加 imageModel 配置 打开配置文件,在 agents.defaults 下添加: "imageModel": { "primary": "bailian/kimi-k2.5" } Step 3:测试验证 发一张图片给你的 AI 助手 AI:✅ 图片已识别! 📊 效果对比 场景 | 之前 | 现在 文本对话 | glm-5 | glm-5 ✅ 图片识别 | ❌ 不支持 | kimi-k2.5 ✅ 成本 | - | 按需使用视觉模型 🎯 原理解释 OpenClaw 智能路由自动检测消息类型: - 纯文本?→ glm-5 处理 - 有图片?→ 自动切换 kimi-k2.5 ⚠️ 注意事项 1. 模型需已配置 - 确保 imageModel 里的模型已配置 2. API Key 有效 - 检查对应模型的 API Key 3. 重启生效 - 某些情况需要重启 Gateway 📚 支持图像的主流模型 - OpenAI: GPT-4V, GPT-4o - Anthropic: Claude 3.5/4 - Google: Gemini Pro Vision - 阿里云: Qwen-VL - 月之暗面: Kimi K2.5 🐯 总结 ✅ 一行配置,让文本模型也能识图 ✅ 自动切换,无需手动干预 ✅ 成本优化,按需使用视觉模型 你还知道哪些让 AI 变"聪明"的小技巧?评论区聊聊! #AI技巧 #OpenClaw #多模态 #效率提升