文章详情

专注互联网科技,赋能企业数字化发展

DeepSeek识图模式灰度1个月,真实体验感受

作者:DeepSeek识图模式灰度1个月,真实体验感受

作为重度AI用户,过去想让DeepSeek处理图片内容,直接给DeepSeek上传图片本质上只是ocr识别图片中的字,如果图片中没有字,ai根本无法感知图片的内容是什么,只能通过其他ai去转换图片为文本内容发给ds或者直接使用其他ai。 获得识图模式的灰度内测资格后,高强度用了一个月,现在来交作业。 一句话总结:识图模式相当精准,上传功能有一点问题,推理能力有待提高。 我都利用识图模式做了什么? 1.上传资料进行复习,以前给deekseek上传资料,deekseek完全无法识别资料中的pdf流程图,数据表格结构,现在不同了,我在复习水课考试的时候上传的资料deekseek完全可以理解,我同时对比了claudecode(deekseekv4pro)和deekseek发现deekseek网页版的复习呈现效果更好,一方面在于网页版是免费的,另一方面在于网页版你可以让网页版去画Mermaid,html直接呈现内容更加方便,而claudecode(deepseekv4pro)则是通过python的pdf依赖去转化pdf内容的效果不如ds直接识图。 2.让ai根据进行逆向工作,帮我去实现图形验证码识别,包括最简单的验证码提取,和旋转验证码,滑动验证码,验证码拼图等等,对于AI来说这些都是小case了,比如旋转验证码和滑动验证码 让deekseek识别图片之后去告诉你旋转多少度,滑动多少px 在通过代码去验证完全可以实现,希望未来出识图模式接口 3.在网页版中直接推理图片的信息,比如让ai去识别打乱魔方的图片,并告诉ai帮我实现魔方解法,deekseek推理能力在这方面就显得不足了,毕竟只是通用模型,但是从他的推理内容中可以看出deekseek识别到了图片的颜色状态,但是无法去根据状态制定合理的解法,连我说的复原开始的坐标都错误的理解为了复原公式字母含义 deekseek目前的上传功能还有一定的问题,对于大文件上传,有时候可以成功,有时候又会失败,大文件需要我手动分片上传之后才能上传成功,错误提示只有上传失败,看不到具体错误内容。 希望deekseek可以继续优化迭代,快点把api端上来供穷比开发者使用吧。 #oc #deepseek #大模型 #开发 #算法 #效率神器 #交互 #开发者选项 @DeepSeek

返回新闻列表