OpenAI 周二正式发布新一代默认模型 GPT‑5.3 Instant,并开始向全部 ChatGPT 用户推送更新。相比此前的 GPT‑5.2 Instant,新模型在高风险场景中的错误“幻觉”率最高下降 26.8%,同时明显减少不必要的拒答与带有说教色彩的免责声明式开场。GPT‑5.2 Instant 将被移入付费用户可见的“旧版模型”专区,并计划于 6 月 3 日正式下线。

根据 OpenAI 发布的博客和系统卡片,团队在两类内部评估中衡量了这次升级的效果:一是聚焦医疗、法律、金融等高风险领域的测试,二是对真实 ChatGPT 对话中被用户标记为事实错误的回答进行回溯评估。在高风险测试中,启用联网搜索时,GPT‑5.3 Instant 的幻觉率较 5.2 版下降 26.8%,仅依赖自身知识时则下降 19.7%;在用户标记错误的对话样本上,联网场景下降 22.5%,离线场景下降 9.6%。不过,OpenAI 仅给出了相对改善幅度,并未披露 GPT‑5.2 的绝对错误基线,这也让“降低了 27%”这一表述的实际含义仍留有空间。
此次更新落地的时间点并不轻松。就在上周,OpenAI 与美国国防部签署部署协议的消息引发强烈反弹,美国区 ChatGPT 卸载量在 2 月 28 日单日激增 295%,抗议者在旧金山总部外集会,竞品 Anthropic 的 Claude 一度登上苹果 App Store 榜首。OpenAI 首席执行官 Sam Altman 随后公开将这份国防部协议称为“草率”,并承诺修订条款。在这样的舆论背景下继续按计划发版,既可以被视为“顶住压力”,也可能只是团队坚持不随舆情打乱技术发布节奏。
在具体产品层面,GPT‑5.3 Instant 首先瞄准的是用户日常使用中最“硌手”的体验——那些难以在基准测试中量化,却频繁出现在对话里的小摩擦。OpenAI 罕见地坦率承认,5.2 版本过于保守,经常在可以正常作答的场景下先行拒绝,或对用户进行不请自来的风险提醒和道德说教,甚至在开头堆叠冗长的免责声明式前言。
在新版中,模型的拒答阈值被重新校准:当问题本身存在明确、合理的回答空间时,GPT‑5.3 Instant 会更直接给出有用信息,而不是先解释“自己不能做什么”。例如在一条关于射箭弹道计算的测试提示中,GPT‑5.2 Instant 先是一大段关于限制和风险的铺垫,才进入物理推导;GPT‑5.3 Instant 则直接从相关物理公式切入,不再附带多余前缀。
联网回答的策略也有所调整。此前的版本容易“过度倚重”搜索结果,给出的回复更像拼凑出的研究摘要,把检索到的网页内容逐条转述。GPT‑5.3 Instant 在权衡模型自有知识与外部搜索时更加克制,优先组织和呈现对当前问题最相关的信息,而不是罗列类似“链接列表式”的综合概览。
除了准确率和拒答策略,OpenAI 将这次升级中的“语气调整”视作明确的产品决策。官方在系统卡片中直言,GPT‑5.2 Instant 的对话风格有时会让人感觉“cringe”(尴尬、让人起鸡皮疙瘩),典型表现包括在用户仅提出事实性问题时,模型却主动给出诸如“首先,你并没有问题”“先停一下,深呼吸”这类心理安抚式开场,好像默认对方正处于情绪危机。
在 GPT‑5.3 Instant 中,这类未经请求的安抚与“鸡汤式”话术被系统性剔除。用户仍可以在设置中调整模型的亲和度和热情程度,但默认人格不再预设用户需要“情绪治疗”,而是更聚焦于任务本身。OpenAI 将此归类为一致性工程的一部分,希望未来每次能力升级,不再让用户觉得“人格被换了一个”,而是体验到同一个助手能力的平滑增强。
文案和创作方面的能力同样获得打磨。OpenAI 声称 GPT‑5.3 Instant 在小说、文风润色与创意探索上的表现更有层次。在官方给出的诗歌对比示例中,新模型生成的作品在意象和画面感上更紧凑、更具可感性,而 GPT‑5.2 Instant 则更依赖抽象概念和情绪宣泄。尽管这类评估带有主观色彩,但也反映出团队将写作质量视作差异化的一个方向。
在多语言体验上,OpenAI 则态度谨慎。公司坦承,目前 GPT‑5.3 Instant 在日语、韩语等语言上的回复依旧显得生硬,语气自然度与英语存在明显差距,多语言的语气与风格优化仍是长期工作。目前这轮“去说教化”的语气调整主要集中在英语场景,尚未能全面覆盖其他语言。
就产品生命周期而言,GPT‑5.2 Instant 仍将在未来三个月内以“旧版模型”形式对付费用户开放,正式退役时间定于 2026 年 6 月 3 日。开发者则可通过 API 使用新模型,模型标识为“gpt‑5.3‑chat‑latest”。OpenAI 表示,面向更复杂推理场景的 Thinking 版以及 Pro 高级版本也将迎来相应更新,但尚未给出具体时间表,目前本次发布仅涉及 Instant 系列。
在安全架构上,GPT‑5.3 Instant 延续了 GPT‑5.2 阶段确立的整体框架,相关说明在此前的系统卡片中已有披露。这意味着,OpenAI 押注的不是重写安全基建,而是在现有框架下更精细地调校拒答边界与内容策略,将“该说不说”与“过度防御”的比例压低。至于更少的拒绝、更直接的语气能否转化为切实可感的产品改善,则要看每周与模型交互的 9 亿用户在接下来一段时间内给出的反馈,而非系统卡片中的曲线与百分比。
在常见问答部分,OpenAI 将 GPT‑5.3 Instant 定义为 ChatGPT 的最新默认模型,用以取代 GPT‑5.2 Instant,核心特征是降低幻觉、减少不必要的拒答,并提供更加克制、少说教的对话语气;该模型同时向普通用户和开发者开放,后者可通过“gpt‑5.3‑chat‑latest”访问。OpenAI 也再次重申幻觉降低的具体数据区间,明确 5.2 版将在 6 月 3 日退场,而 GPT‑5.3 Thinking 和 Pro 的发布时间则仍待后续公告,多语言语气自然度的提升被列为正在推进中的长期任务。