Google Chrome加入“自动浏览”代理式AI功能

Google正通过一项名为“Auto Browse”（自动浏览）的新功能，将 Chrome 浏览器悄然改造为一个更具自主性的 AI 平台，并与 ChatGPT 等产品展开正面竞争。该功能基于Google的 Gemini 系统，目标是把在网页上填写表单、收集数据、规划行程等常规操作，从用户手中转移给数字代理来完成。

Google表示，Auto Browse 是其向“代理式 AI”（agentic AI）迈出的最重要一步之一，这类系统可以通过具备上下文理解能力的推理，对用户界面进行自动化操作。当前，该功能处于预览阶段，仅向付费用户开放，包括 AI Pro 和 AI Ultra 订阅方案，并基于最新一代 Gemini 3 模型运行，其架构受到Google早期实验性代理框架 Project Mariner 的影响。

当用户启动一次 Auto Browse 任务时，Chrome 会打开专用标签页，并以动态 AI 图标加以标识。这一代理可以在不同网站之间跳转、跟随链接，并通过模拟键盘与鼠标输入来与表单字段互动。用户无需全程盯着进度，系统会在任务完成后发出通知；若涉及访问密码、发起支付等敏感操作，则会中途弹出请求用户授权的提示。

类似 OpenAI 的 Atlas 工具，Auto Browse 在用户意图与网页界面之间增加了一个新的抽象层。用户不再直接操控浏览器，而是以自然语言描述目标，由 Gemini 将这些目标拆解为一系列操作并逐步执行。这种方式允许多个后台任务并行运行，旨在降低用户在重复性网页操作上的认知负担。

围绕 Auto Browse，Chrome 的界面也进行了调整。过去静态的 Gemini 按钮如今默认以侧边栏（Sidepanel）的形式常驻，而不是弹出式窗口，从而让 AI 能够持续访问当前页面内容。在这一侧边栏中，Gemini 可以直接在 Chrome 内协调 Gmail、日历、地图、YouTube、购物和机票等Google服务，实现跨服务联动。

Google同时在浏览器中引入了 Nano Banana 图像编辑功能，使用户无需下载文件即可在本地对图片进行编辑。在处理视觉任务时，用户可以在速度更快的标准模型与画质更高的 Gemini Pro 之间切换，以兼顾效率与质量。不过，Auto Browse 的运行高度依赖云端：代理在网页上执行的所有互动操作，会被实时传输至Google服务器，由 Gemini 模型进行处理。

根据Google的说明，网页内容可能会在用户账户下被临时记录，并保存在 Gemini 应用活动（Gemini Apps Activity）数据中，具体取决于用户的隐私设置。 Google尚未明确，这些在 Auto Browse 会话中访问的内容是否会被用于训练未来的 AI 系统。

在使用门槛方面，AI Pro 订阅用户每天可启动最多 20 次浏览任务，AI Ultra 用户每天可获得 200 次会话配额。虽然目前的预览功能无需额外购买，但Google尚未公布何时向免费用户开放访问权限。为减少误操作风险，Google称已为 Auto Browse 设置保护规则，禁止其在未经用户明确确认的情况下执行交易性操作，例如直接提交支付信息。实际使用中，自动浏览可以识别待购买商品并代填订单表单，但会在最终结账步骤前停止，等待用户亲自确认。

Auto Browse 能否从实验性预览走向主流应用，仍取决于用户是否足够信任这样一个代理，让它在网络世界中代表自己浏览和行动。