6A娱乐
10月27日消息,据The Information报道,谷歌最早可能在 12 月预览其对 Rabbit 大型动作模型概念的看法。
据该媒体采访的三位直接了解该项目的人士称,该项目的代号为Project Jarvis,将为用户执行任务,包括收集研究、购买产品或预订航班。
据悉,Jarvis搭载了谷歌 Gemini 的未来版本,只能与网络浏览器配合使用(它专门针对 Chrome 进行了调整)。
据The Information报道,该工具旨在通过截取和解释屏幕截图,然后点击按钮或输入文本,帮助人们自动执行日常的基于网络的任务。
在目前的状态下,操作之间似乎需要几秒钟。
最大的人工智能公司都在研究能够完成The Information所描述的任务的模型。微软的 Copilot Vision可让您与它谈论您正在浏览的网页。预计 Apple Intelligence 将在明年某个时候了解您屏幕上的内容,并在多个应用程序中为您执行操作。
Anthropic 推出了一款繁琐且容易出错的 Claude 测试版更新,它可以为您使用计算机,而 OpenAI 据称也在开发该版本。
The Information提醒称,谷歌 12 月展示 Jarvis 的计划可能会发生变化。据报道,该公司正考虑向少数测试人员发布该功能,以查找并帮助公司解决漏洞。