OpenAI苹果化：ChatGPT就是iOS 几分钟造出的Agent要代替App

当地时间10月6日，OpenAI在旧金山举办DevDay 2025开发者大会。在大会正式开场前5小时，AMD与OpenAI的合作消息公布，OpenAI将在未来数年部署高达6GW（千兆瓦）的AMD Instinct GPU。AMD已向OpenAI发行最高1.6亿股认股权证，行权条件与芯片部署进度及股价里程碑挂钩，如果OpenAI全额行权，可能获得AMD约10%的股权，AMD股价一度暴涨30%。

有开发者吐槽“又被资本操作抢戏”，也有人认为这是刻意编排，先讲底层算力，再讲上层工具，恰好符合OpenAI从芯片到模型到应用的一体化叙事。

回到这次DevDay上，OpenAI发布了Apps SDK（在ChatGPT内构建应用的完整框架）、AgentKit（快速构建AI Agent的工具套件）、Codex正式版以及GPT-5系列和Sora2等模型的API。Sam Altman开场公布了一组增长数据，开发者数量从2023年的200万增长到400万，翻了一番。ChatGPT的周活跃用户从1亿飙升至8亿，增长了8倍；API每分钟处理的token量从3亿暴涨到60亿，这是20倍的增长。

8亿周活意味着超级应用，这个体量已经具备了成为平台的基础设施。DevDay中Apps SDK是最值得关注的重点，它标志着ChatGPT更像一个平台和操作系统了。Altman的判断很直接，AI已经从人们玩耍的东西，变成了人们每天构建的东西。这次DevDay的目标，就是让更多开发者能直接在ChatGPT上构建应用和Agent，并且在这个拥有8亿用户的平台上开发和分发。

OpenAI开始苹果化了。

Apps SDK：在ChatGPT内做应用

OpenAI曾经尝试过让开发者在ChatGPT上构建应用，那就是2023年推出的GPTs。但GPTs本质上只是Prompt模板，能力有限且生态混乱，已经被OpenAI放弃。去年底Anthropic推出了MCP开放标准，试图为AI应用互操作性提供统一框架，而今天发布的Apps SDK，则是OpenAI基于MCP标准，再次尝试让ChatGPT成为一个应用平台。

Apps SDK是一个完整的开发框架，让开发者能在ChatGPT内部构建真正的交互式应用。开发者可以用TypeScript或JavaScript编写后端逻辑，通过MCP接口连接数据、触发操作，并渲染完全交互式的用户界面。这不是简单的API调用，而是在ChatGPT对话框里运行的“小程序”。

举几个现场演示的例子就能明白它的能力，Coursera应用可以在对话中嵌入视频播放器，用户边看课程边向ChatGPT提问；Zillow能展示可筛选的交互地图，用户说“找带院子的三居室”，地图实时过滤结果；Canva则能直接根据对话生成海报，并把海报转换成完整的PPT。

OpenAI还推出了应用对话（Talking to Apps）机制。Apps SDK提供了一套API，允许第三方应用将内部上下文实时暴露给ChatGPT。当你在Coursera应用里看到视频第5分钟，ChatGPT知道你正在学什么章节，当你在Zillow地图上点开某套房子，ChatGPT能准确理解你关注的是哪个地址、什么价位。深度集成让对话式交互真正有了实用价值。

现场演示中，当演示者说“Spotify，给我周五派对做个歌单”，ChatGPT自动调出Spotify应用，屏幕上显示“使用Spotify生成此答案”的提示，几秒后歌单就出现在对话框里，可以直接点击播放。整个过程流畅自然，就像在iOS上切换App一样。

首批合作应用包括Booking.com、Expedia、Figma、Spotify、Zillow、Canva和Coursera，未来几周还会加入DoorDash、Uber、Target、OpenTable等。Apps SDK今天开放预览版，开发者可以在Developer Mode中测试应用。今年晚些时候，OpenAI将开放正式提交通道，并提供应用目录供用户浏览。

面向Apps SDK开发者的设计规范配图

Altman还透露了商业化计划，Apps SDK未来将支持新的Agentic Commerce Protocol，允许用户直接在ChatGPT内部即时结账。

很多人会问GPTs不是已经失败了吗，Apps SDK会重蹈覆辙吗？GPTs门槛接近零代码，但能力也被局限，回复始终是一条条消息。

Apps SDK则是代码为中心。开发者需要在自己的服务器上编写真正的应用代码，实现MCP服务器接口，声明OAuth 2.0登录和交互式UI组件。ChatGPT只是把App嵌入对话流里，真正的逻辑、状态管理和数据存储都在开发者手中。Apps可以弹出富交互组件（地图、表单、视频播放器）、长时间保持session，并可在后台自行拉取和推送数据。换句话说，GPTs是模板，Apps in ChatGPT是完整的小程序。

GPTs和GPTStore既不像App Store那样标准化，也不像插件那样通用，多数GPT缺乏区别化价值，用户难以形成持续使用习惯，开发者又难以变现、用户难以发现优质内容，最终生态陷入空转。

Apps SDK则完全不同。开发者必须通过实名验证、服务器验证和功能测试才能上架。审核前置，并引入了年龄分级和权限管理，类似App Store的标准。Altman还暗示会有更正式的收入分成方案。

在ChatGPT上，一个新的iOS的雏形就这样长了出来。

AgentKit：8分钟造出的Agent

Apps SDK构建的是ChatGPT的应用生态，而AgentKit则是OpenAI给开发者提供的Agent开发工具箱。Altman的判断是，AI已经从“你提问的系统”进化到“能为你做很多事情的系统”，也就是Agent。但他也坦言，符合定义的Agent成功落地的很少。

AgentKit是一个完整的工具套件，包含四个核心组件：

Agent Builder，这是一个可视化画布平台，让开发者能像使用Canva一样拖拽设计Agent的逻辑、步骤和工作流。它建立在OpenAI的Responses API之上，支持if-else逻辑节点、循环、用户审批节点、文件搜索和数据转换等模块化组件。开发者可以从预设模板开始（如客服机器人、数据增强、文档对比），也可以从零搭建自定义流程。

ChatKit，一个可嵌入的聊天界面组件。开发者可以把这个界面集成到自己的网站或应用中，带来ChatGPT级别的对话体验，同时保留自己的品牌、工作流和产品特色。它能处理流式响应、管理对话线程、显示模型思考过程，让集成聊天UI的复杂工作变得简单。

Connector Registry，一个企业级的连接管理中心。管理员可以通过控制面板统一管理Agent如何连接内部工具和第三方系统，设置权限、监控使用情况，同时保证安全性和合规性。

Agent Evals（评估工具），提供性能测量和优化能力。包括逐步追踪评分（Trace Grading，理解Agent的决策步骤）、评估数据集、自动化提示词优化，以及在OpenAI平台上直接对外部模型运行评估的能力。

在现场OpenAI工程师Christina Huang8分钟的演示中。她从零开始，用Agent Builder构建了一个名为Ask Froge的DevDay网站Agent。快速地将一个静态的会议网站创建一个智能问答助手，以提升用户体验。

她先设置了Agent的基本指令，然后添加了预构建的Guardrails（防护栏）用于PII信息掩码，接着连接了DevDay的日程数据，最后加入了自定义Widget来显示会议时间表。整个过程不到8分钟，Agent就部署到了DevDay官网，观众可以现场访问使用。

企业案例中，零售巨头Albertsons用AgentKit构建了帮门店经理分析销量的Agent，当某个品类销量下降（比如冰淇淋），系统会基于季节性趋势、历史数据和外部因素（天气、节假日）给出诊断和建议。营销软件公司HubSpot则用它改进了Breeze AI客服工具，Agent能整合知识库、查找当地治疗方案和保险政策细节，生成更有针对性的回复。Box、Canva和Evernote也已开始使用该平台。

Altman说这是我们当初造第一个Agent时希望拥有的工具。降低门槛的逻辑很清晰，让更多人能造Agent，OpenAI才能抢占Agent开发生态的制高点。

而这个生态的门槛因为模型能力提升而足够低的时候，app就会被agent们替代。

Codex和模型更新

除了应用和Agent，OpenAI还宣布了一系列基础设施更新。

Codex正式可用，OpenAI的软件工程Agent Codex结束研究预览，进入通用可用（GA）阶段。Codex现在运行在专门训练的GPT-5-Codex模型上，这个模型在代码重构和代码审查等Agentic编程任务上表现更出色。自8月初以来，Codex的日均消息量增长了10倍，已处理超过40万亿个token。

过去两三个月里，开发者社区能明显感觉到Codex很火。一方面，OpenAI用GPT-5-Codex把"AI代码这条垂直赛道往前推了一步，在代码质量和推理能力上形成优势，另一方面，Codex提供了价格透明、场景统一、稳定可预期的开发体验。相比之下，不少开发者抱怨Claude Code存在限流、质量波动等问题，甚至有人已经把主要精力转到Codex上。这次正式发布，是OpenAI在代码生成领域持续发力的一步。

OpenAI展示了内部数据，工程师在使用Codex后，每周完成的Pull Request数量提升了70%，几乎所有OpenAI的PR都经过Codex审查。Codex还新增了三个企业功能：Slack集成（可以直接在团队频道里让Codex写代码或回答问题）、Codex SDK（让开发者在自己的工作流中嵌入Codex能力）、以及管理工具（包括环境控制、监控和分析仪表板）。

模型和API更新方面，GPT-5 Pro API向所有开发者开放，这是OpenAI目前最智能的模型，专为需要高精度和深度推理的场景设计，如金融建模、法律文件分析和医疗诊断，定价为每百万输入token 15美元、每百万输出token 120美元。

OpenAI刚刚发布全新的Sora 2模型及同名Sora App，应用上线后迅速走红，Sora 2、Sora 2 Pro API也进入预览阶段，这个新一代视频生成模型在可控性上有巨大飞跃，能根据详细指令生成风格化、构图精良的视频，还能配上丰富的声音景观、环境音频和同步音效。Sora 2 输出每秒 0.1 美元，Pro 输出每秒0.3 美元。

GPT-Realtime-Mini则是一个更小、更便宜的语音模型，比之前的高级语音模型便宜70%，但音质和表达力保持一致。OpenAI认为语音将成为人们与AI互动的主要方式之一，更经济的模型能让语音应用更快普及。

平台化的野心

这次DevDay最重要的信号是，ChatGPT不再只是一个Chatbot，而是正在成为一个完整的应用平台。Apps SDK让开发者能触达8亿用户，AgentKit降低了Agent开发门槛，Codex提升了软件开发效率。OpenAI正在构建一个从应用分发、开发工具到基础设施的完整生态。

从现场演示来看，这些Agent更像是对话式的App，它们依然需要后端逻辑、数据管理和UI交互，只是把入口从图标点击变成了自然语言对话。这是交互方式的革命，但软件开发的本质没有改变，你还是需要懂业务、懂技术、懂用户需求。

苹果推出App Store时，没人想到十年后会有几百万个App。OpenAI推出了Apps SDK，现在的问题不是Agent是否会替代App，而是开发者们是否真的会来，在ChatGPT上“Build something new”。