DeepSeek能不能吃图? 其实大家都在说DeepSeek没有多模态的能力,但是我看网页端是可以上传图片识别的,但是我今天接入Hermes之后,尝试让他修改一下我的ppt,结果提示说将“图像作为输入”。 不能将图像作为输入意味着很多工作都没有办法交给DeepSeek来做了,就类似于PPT的制作,以及对于研究领域的一些深度调研工作,等等。 我还以为,不支持多模态是不能支持多种模态的输入,原来不支持多模态的意思就是只支持文本输入。 那接下来只能期待更新了吗?
DeepSeek能不能吃图? 其实大家都在说DeepSeek没有多模态的能力,但是我看网页端是可以上传图片识别的,但是我今天接入Hermes之后,尝试让他修改一下我的ppt,结果提示说将“图像作为输入”。 不能将图像作为输入意味着很多工作都没有办法交给DeepSeek来做了,就类似于PPT的制作,以及对于研究领域的一些深度调研工作,等等。 我还以为,不支持多模态是不能支持多种模态的输入,原来不支持多模态的意思就是只支持文本输入。 那接下来只能期待更新了吗?