Google Chrome加入Gemini “自动浏览”功能 可代办多步骤上网任务

摘要:

Google近日在桌面版 Chrome 浏览器中上线全新的 Gemini “自动浏览(auto browse)”功能,为用户代办一系列复杂、耗时的在线操作。这一功能由 Gemini AI 提供支持,率先向美国地区的 Google AI Pro 和 Ultra 订阅用户开放,能够帮用户查询机票和酒店价格、安排预约、填写在线表单、管理订阅等多步骤任务。

Gemini 最初集成进 Chrome 时,只是充当一个可以回答问题、概括当前网页内容的 AI 助理。随后,Google又为其加入跨多个标签页比价商品、根据浏览历史回忆页面等能力,并在当时就暗示,未来会让这套 AI 代理替用户处理更多“繁琐任务”。

在这次更新中,Gemini 的“自动浏览”体验被进一步具体化。Google举例称,当用户在浏览某张带有家居摆设的图片时,Gemini 可以自动识别其中的装饰品,在全网帮你找相似商品,加入购物车,并在结账时尝试套用可用折扣码,同时遵守你预先设定的预算范围。如果任务需要登录帐号,Gemini 还可以调用浏览器的密码管理器完成登录操作。

界面层面,Gemini 在 Chrome 中的呈现方式也有所调整,从原先的弹出小窗口改为固定在屏幕右侧的面板。所有用户现在都可以在这一侧边面板中使用与 Gmail、日历、地图、Google Shopping 和 Google Flights 的整合能力,让 Gemini 在响应时能参考你在这些服务中的相关信息,并在这些服务内直接执行操作。

Google在示例中描述了一个典型使用场景:如果你正准备出差参会,需要订机票,Gemini 可以先从旧邮件里找到会议通知邮件,提取日期和地点,再结合 Google Flights 的机票数据给出推荐航班,并在完成预订后,自动起草一封邮件,通知同事你的到达时间。此外,Google还提到,Gemini 在 Chrome 中可以借助名为 Nano Banana 的技术对屏幕上的图像进行编辑,但具体细节尚未在该报道中展开。

随着“自动浏览”功能落地,Gemini 在 Chrome 中从内容理解与信息检索类助手,进一步走向可以直接代替用户执行链式操作的“AI 代理”,也凸显了Google在浏览器中深化 AI 一体化体验的最新方向。

查看评论