谷歌今天推出了Project Mariner,这是其首个能够自主浏览网页的AI代理。该代理通过Chrome扩展程序控制光标移动和表单填写,以模拟人类在线互动。由谷歌的DeepMind部门开发的Gemini驱动原型目前仅向部分测试者开放。 在演示中,该代理能够在杂货网站上创建购物车,但行动之间有明显五秒的延迟。该系统通过捕获浏览器屏幕截图并在云中处理,以生成导航命令。Project Mariner仅在Chrome的活动标签中操作,用户必须观察其操作,无法在后台运行。 该项目在WebVoyager基准测试中实现了83.5%的成功率。代理具有内置限制,包括无法完成购买、接受cookies或同意服务条款。 谷歌实验室主任Jaclyn Konzelmann将该项目描述为“根本的新用户体验范式转变”,可能改变用户与网站的互动方式。随着开发的继续,谷歌表示正在与网络生态系统利益相关者进行互动。