文章详情

专注互联网科技,赋能企业数字化发展

下一波AI流量:不在聊天框里!

作者:下一波AI流量:不在聊天框里!

很多人判断 AI 产品时,还停留在一个问题: 这个聊天机器人回答得准不准? 但用户真正愿意下载、打开、分享的功能,可能正在从“聊天”转向“视觉”。 TechCrunch 引用 Appfigures 的报告说,图像模型发布给 AI 移动应用带来的下载增长,是传统模型升级的 6.5 倍。 这个数字很有意思。 因为它说明一件事:普通用户对 AI 的感知,不一定来自“模型参数更强了”,而是来自“我马上能看见效果”。 比如一张图能不能生成海报? 一张截图能不能读懂? 一张表格能不能整理? 一个网页截图能不能还原成 HTML? 这些事情比“模型推理能力提升 10%”更容易被用户理解。 这也是 DeepSeek 识图模式值得关注的原因。 目前公开报道里提到,DeepSeek 正在网页端和 App 端灰度测试“识图模式”,可以上传图片,做 OCR、表格解析、网页截图转 HTML 等任务。但也有报道提醒,它在部分任务里仍然存在幻觉和过度推理问题。 所以我不会把它讲成“DeepSeek 已经全面补齐多模态”。 更准确的说法是: DeepSeek 正在补一个很关键的入口。 过去 AI 的主入口是文字输入框。你要会提问,会描述需求,会把问题拆清楚。 但视觉入口不一样。 用户不需要解释太多,只要上传截图、拍照、丢一张表格,AI 就可以直接进入任务现场。 这对普通用户更友好,也更容易形成传播。 我觉得未来 AI 应用的竞争,会越来越像这样: 文字问答负责深度思考,视觉模型负责低门槛入口,Agent 负责把结果真正执行下去。 谁能把“看见、理解、操作”连起来,谁就更接近真实生产力工具。 你平时最想让 AI 帮你处理哪类图片:截图、表格、票据,还是设计图? #AI #DeepSeek #多模态AI #图像生成 #人工智能 #小红书科技AMA #AI人工智能 #AI工具 #大模型 #ai

返回新闻列表