下一波AI流量：不在聊天框里！

作者：下一波AI流量：不在聊天框里！

很多人判断 AI 产品时，还停留在一个问题：这个聊天机器人回答得准不准？但用户真正愿意下载、打开、分享的功能，可能正在从“聊天”转向“视觉”。 TechCrunch 引用 Appfigures 的报告说，图像模型发布给 AI 移动应用带来的下载增长，是传统模型升级的 6.5 倍。这个数字很有意思。因为它说明一件事：普通用户对 AI 的感知，不一定来自“模型参数更强了”，而是来自“我马上能看见效果”。比如一张图能不能生成海报？一张截图能不能读懂？一张表格能不能整理？一个网页截图能不能还原成 HTML？这些事情比“模型推理能力提升 10%”更容易被用户理解。这也是 DeepSeek 识图模式值得关注的原因。目前公开报道里提到，DeepSeek 正在网页端和 App 端灰度测试“识图模式”，可以上传图片，做 OCR、表格解析、网页截图转 HTML 等任务。但也有报道提醒，它在部分任务里仍然存在幻觉和过度推理问题。所以我不会把它讲成“DeepSeek 已经全面补齐多模态”。更准确的说法是： DeepSeek 正在补一个很关键的入口。过去 AI 的主入口是文字输入框。你要会提问，会描述需求，会把问题拆清楚。但视觉入口不一样。用户不需要解释太多，只要上传截图、拍照、丢一张表格，AI 就可以直接进入任务现场。这对普通用户更友好，也更容易形成传播。我觉得未来 AI 应用的竞争，会越来越像这样：文字问答负责深度思考，视觉模型负责低门槛入口，Agent 负责把结果真正执行下去。谁能把“看见、理解、操作”连起来，谁就更接近真实生产力工具。你平时最想让 AI 帮你处理哪类图片：截图、表格、票据，还是设计图？ #AI #DeepSeek #多模态AI #图像生成 #人工智能 #小红书科技AMA #AI人工智能 #AI工具 #大模型 #ai

文章详情

下一波AI流量：不在聊天框里！

推荐阅读