文章详情

专注互联网科技,赋能企业数字化发展

做一下简单演示

作者:做一下简单演示

随便找一个简单课题,主要展示一下基本操作:短视频使用行为与青少年注意力水平的关联分析&预测建模。 图一是google search (ai mode)检索的结果,我们直接打开对应网页,注意到,图2的侧边栏显示了对应的信息来源的,这说明不是幻觉。与此同时gemini已经通过share tab,充分读取了我提供的三个网页的信息,降低了幻觉(图一的gemini悬浮窗口)。现在很多ai都有共享屏幕功能,但这样其实在很多场景下还是很不方便,它读取的只是截图,你需要自己再用鼠标滑动页面。而gemini in chrome则是直接把网页完整内容给读完了,甚至有时候会自动读完整个网站信息(auto browse)。这下子幻觉可以算是大大降低了。(图3到图5) 既然gemini已经充分理解任务,我们让gemini给出这个任务的方案(图6),以及给deepseek的提示词(图7)。我这里选用deepseek做执行层或者说“苦力”,是因为我觉得它的token没什么限制,任务完成的也还可以。当然,deepseek只是我为执行层选的一个代表,你完全可以换成你习惯使用的ai,比如我之前还用过ai studio,chatGPT。然后我们打开deepseekseek,开始复制提示词,粘贴到deepseek聊天框(图8)紧接着我们把deepseek网页版也共享给gemini,让gemini分析deepseek的输出结果。可以看到,gemini毫不留情指出:存在两个致命问题(图9-11)然后把gemini的建议传达给deepseek,然后再次让gemini检查,这样迭代几次或许就没什么问题了。如果一直不行,那说明deepseek太差劲,你可以换成其他ai比如chatGPT,同样的操作(gemini其实除了给出修改建议,也可以让它直接给出修改后的结果,但是一般它会偷懒,省略很多,总之不会给你太长的输出)关于多次迭代修改的截图,限于篇幅不再展示。 那现在的话,三驾马车的协作流程基本上就演示完了。这之中最关键的是gemini in chrome,可以说,如果没有其精准读取网页信息的能力,所谓的三驾马车,就只能复制粘贴 复制粘贴,效率极其低。但现在,你可以共享多个网页,包括三驾马车本身,也包括所有的信息界面和操作界面,比如在线编程界面share之后,gemini就像一个在 你编程时站在你身边盯着你屏幕的助手,随时给你建议#gemini

返回新闻列表