返回上一页  首页 | cnbeta报时: 02:58:58
Google Chrome加入“自动浏览”代理式AI功能
发布日期:2026-01-30 00:29:43  稿源:Win10s.COM

Google正通过一项名为“Auto Browse”(自动浏览)的新功能,将 Chrome 浏览器悄然改造为一个更具自主性的 AI 平台,并与 ChatGPT 等产品展开正面竞争。 该功能基于Google的 Gemini 系统,目标是把在网页上填写表单、收集数据、规划行程等常规操作,从用户手中转移给数字代理来完成。

Google表示,Auto Browse 是其向“代理式 AI”(agentic AI)迈出的最重要一步之一,这类系统可以通过具备上下文理解能力的推理,对用户界面进行自动化操作。 当前,该功能处于预览阶段,仅向付费用户开放,包括 AI Pro 和 AI Ultra 订阅方案,并基于最新一代 Gemini 3 模型运行,其架构受到Google早期实验性代理框架 Project Mariner 的影响。

当用户启动一次 Auto Browse 任务时,Chrome 会打开专用标签页,并以动态 AI 图标加以标识。 这一代理可以在不同网站之间跳转、跟随链接,并通过模拟键盘与鼠标输入来与表单字段互动。 用户无需全程盯着进度,系统会在任务完成后发出通知;若涉及访问密码、发起支付等敏感操作,则会中途弹出请求用户授权的提示。

类似 OpenAI 的 Atlas 工具,Auto Browse 在用户意图与网页界面之间增加了一个新的抽象层。 用户不再直接操控浏览器,而是以自然语言描述目标,由 Gemini 将这些目标拆解为一系列操作并逐步执行。 这种方式允许多个后台任务并行运行,旨在降低用户在重复性网页操作上的认知负担。

围绕 Auto Browse,Chrome 的界面也进行了调整。 过去静态的 Gemini 按钮如今默认以侧边栏(Sidepanel)的形式常驻,而不是弹出式窗口,从而让 AI 能够持续访问当前页面内容。 在这一侧边栏中,Gemini 可以直接在 Chrome 内协调 Gmail、日历、地图、YouTube、购物和机票等Google服务,实现跨服务联动。

Google同时在浏览器中引入了 Nano Banana 图像编辑功能,使用户无需下载文件即可在本地对图片进行编辑。 在处理视觉任务时,用户可以在速度更快的标准模型与画质更高的 Gemini Pro 之间切换,以兼顾效率与质量。 不过,Auto Browse 的运行高度依赖云端:代理在网页上执行的所有互动操作,会被实时传输至Google服务器,由 Gemini 模型进行处理。

根据Google的说明,网页内容可能会在用户账户下被临时记录,并保存在 Gemini 应用活动(Gemini Apps Activity)数据中,具体取决于用户的隐私设置。 Google尚未明确,这些在 Auto Browse 会话中访问的内容是否会被用于训练未来的 AI 系统。

在使用门槛方面,AI Pro 订阅用户每天可启动最多 20 次浏览任务,AI Ultra 用户每天可获得 200 次会话配额。 虽然目前的预览功能无需额外购买,但Google尚未公布何时向免费用户开放访问权限。 为减少误操作风险,Google称已为 Auto Browse 设置保护规则,禁止其在未经用户明确确认的情况下执行交易性操作,例如直接提交支付信息。 实际使用中,自动浏览可以识别待购买商品并代填订单表单,但会在最终结账步骤前停止,等待用户亲自确认。

Auto Browse 能否从实验性预览走向主流应用,仍取决于用户是否足够信任这样一个代理,让它在网络世界中代表自己浏览和行动。

查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 02:58:58

文字版  标准版  电脑端

© 2003-2026