做一下简单演示

作者：做一下简单演示

随便找一个简单课题，主要展示一下基本操作：短视频使用行为与青少年注意力水平的关联分析&预测建模。图一是google search （ai mode）检索的结果，我们直接打开对应网页，注意到，图2的侧边栏显示了对应的信息来源的，这说明不是幻觉。与此同时gemini已经通过share tab，充分读取了我提供的三个网页的信息，降低了幻觉（图一的gemini悬浮窗口）。现在很多ai都有共享屏幕功能，但这样其实在很多场景下还是很不方便，它读取的只是截图，你需要自己再用鼠标滑动页面。而gemini in chrome则是直接把网页完整内容给读完了，甚至有时候会自动读完整个网站信息（auto browse）。这下子幻觉可以算是大大降低了。（图3到图5）既然gemini已经充分理解任务，我们让gemini给出这个任务的方案（图6），以及给deepseek的提示词（图7）。我这里选用deepseek做执行层或者说“苦力”，是因为我觉得它的token没什么限制，任务完成的也还可以。当然，deepseek只是我为执行层选的一个代表，你完全可以换成你习惯使用的ai，比如我之前还用过ai studio，chatGPT。然后我们打开deepseekseek，开始复制提示词，粘贴到deepseek聊天框（图8）紧接着我们把deepseek网页版也共享给gemini，让gemini分析deepseek的输出结果。可以看到，gemini毫不留情指出：存在两个致命问题（图9-11）然后把gemini的建议传达给deepseek，然后再次让gemini检查，这样迭代几次或许就没什么问题了。如果一直不行，那说明deepseek太差劲，你可以换成其他ai比如chatGPT，同样的操作（gemini其实除了给出修改建议，也可以让它直接给出修改后的结果，但是一般它会偷懒，省略很多，总之不会给你太长的输出）关于多次迭代修改的截图，限于篇幅不再展示。那现在的话，三驾马车的协作流程基本上就演示完了。这之中最关键的是gemini in chrome，可以说，如果没有其精准读取网页信息的能力，所谓的三驾马车，就只能复制粘贴复制粘贴，效率极其低。但现在，你可以共享多个网页，包括三驾马车本身，也包括所有的信息界面和操作界面，比如在线编程界面share之后，gemini就像一个在你编程时站在你身边盯着你屏幕的助手，随时给你建议#gemini

文章详情

做一下简单演示

推荐阅读