返回上一页  首页 | cnbeta报时: 13:49:17
OpenAI苹果化:ChatGPT就是iOS 几分钟造出的Agent要代替App
发布日期:2025-10-07 11:52:34  稿源:硅星人

当地时间10月6日,OpenAI在旧金山举办DevDay 2025开发者大会。在大会正式开场前5小时,AMD与OpenAI的合作消息公布,OpenAI将在未来数年部署高达6GW(千兆瓦)的AMD Instinct GPU。AMD已向OpenAI发行最高1.6亿股认股权证,行权条件与芯片部署进度及股价里程碑挂钩,如果OpenAI全额行权,可能获得AMD约10%的股权,AMD股价一度暴涨30%。

有开发者吐槽“又被资本操作抢戏”,也有人认为这是刻意编排,先讲底层算力,再讲上层工具,恰好符合OpenAI从芯片到模型到应用的一体化叙事。

回到这次DevDay上,OpenAI发布了Apps SDK(在ChatGPT内构建应用的完整框架)、AgentKit(快速构建AI Agent的工具套件)、Codex正式版以及GPT-5系列和Sora2等模型的API。Sam Altman开场公布了一组增长数据,开发者数量从2023年的200万增长到400万,翻了一番。ChatGPT的周活跃用户从1亿飙升至8亿,增长了8倍;API每分钟处理的token量从3亿暴涨到60亿,这是20倍的增长。

8亿周活意味着超级应用,这个体量已经具备了成为平台的基础设施。DevDay中Apps SDK是最值得关注的重点,它标志着ChatGPT更像一个平台和操作系统了。Altman的判断很直接,AI已经从人们玩耍的东西,变成了人们每天构建的东西。这次DevDay的目标,就是让更多开发者能直接在ChatGPT上构建应用和Agent,并且在这个拥有8亿用户的平台上开发和分发。

OpenAI开始苹果化了。

Apps SDK:在ChatGPT内做应用

OpenAI曾经尝试过让开发者在ChatGPT上构建应用,那就是2023年推出的GPTs。但GPTs本质上只是Prompt模板,能力有限且生态混乱,已经被OpenAI放弃。去年底Anthropic推出了MCP开放标准,试图为AI应用互操作性提供统一框架,而今天发布的Apps SDK,则是OpenAI基于MCP标准,再次尝试让ChatGPT成为一个应用平台。

Apps SDK是一个完整的开发框架,让开发者能在ChatGPT内部构建真正的交互式应用。开发者可以用TypeScript或JavaScript编写后端逻辑,通过MCP接口连接数据、触发操作,并渲染完全交互式的用户界面。这不是简单的API调用,而是在ChatGPT对话框里运行的“小程序”。

举几个现场演示的例子就能明白它的能力,Coursera应用可以在对话中嵌入视频播放器,用户边看课程边向ChatGPT提问;Zillow能展示可筛选的交互地图,用户说“找带院子的三居室”,地图实时过滤结果;Canva则能直接根据对话生成海报,并把海报转换成完整的PPT。


OpenAI还推出了应用对话(Talking to Apps)机制。Apps SDK提供了一套API,允许第三方应用将内部上下文实时暴露给ChatGPT。当你在Coursera应用里看到视频第5分钟,ChatGPT知道你正在学什么章节,当你在Zillow地图上点开某套房子,ChatGPT能准确理解你关注的是哪个地址、什么价位。深度集成让对话式交互真正有了实用价值。

现场演示中,当演示者说“Spotify,给我周五派对做个歌单”,ChatGPT自动调出Spotify应用,屏幕上显示“使用Spotify生成此答案”的提示,几秒后歌单就出现在对话框里,可以直接点击播放。整个过程流畅自然,就像在iOS上切换App一样。

首批合作应用包括Booking.com、Expedia、Figma、Spotify、Zillow、Canva和Coursera,未来几周还会加入DoorDash、Uber、Target、OpenTable等。Apps SDK今天开放预览版,开发者可以在Developer Mode中测试应用。今年晚些时候,OpenAI将开放正式提交通道,并提供应用目录供用户浏览。


面向Apps SDK开发者的设计规范配图

Altman还透露了商业化计划,Apps SDK未来将支持新的Agentic Commerce Protocol,允许用户直接在ChatGPT内部即时结账。

很多人会问GPTs不是已经失败了吗,Apps SDK会重蹈覆辙吗?GPTs门槛接近零代码,但能力也被局限,回复始终是一条条消息。

Apps SDK则是代码为中心。开发者需要在自己的服务器上编写真正的应用代码,实现MCP服务器接口,声明OAuth 2.0登录和交互式UI组件。ChatGPT只是把App嵌入对话流里,真正的逻辑、状态管理和数据存储都在开发者手中。Apps可以弹出富交互组件(地图、表单、视频播放器)、长时间保持session,并可在后台自行拉取和推送数据。换句话说,GPTs是模板,Apps in ChatGPT是完整的小程序。

GPTs和GPTStore既不像App Store那样标准化,也不像插件那样通用,多数GPT缺乏区别化价值,用户难以形成持续使用习惯,开发者又难以变现、用户难以发现优质内容,最终生态陷入空转。

Apps SDK则完全不同。开发者必须通过实名验证、服务器验证和功能测试才能上架。审核前置,并引入了年龄分级和权限管理,类似App Store的标准。Altman还暗示会有更正式的收入分成方案。

在ChatGPT上,一个新的iOS的雏形就这样长了出来。

AgentKit:8分钟造出的Agent

Apps SDK构建的是ChatGPT的应用生态,而AgentKit则是OpenAI给开发者提供的Agent开发工具箱。Altman的判断是,AI已经从“你提问的系统”进化到“能为你做很多事情的系统”,也就是Agent。但他也坦言,符合定义的Agent成功落地的很少。

AgentKit是一个完整的工具套件,包含四个核心组件:

Agent Builder,这是一个可视化画布平台,让开发者能像使用Canva一样拖拽设计Agent的逻辑、步骤和工作流。它建立在OpenAI的Responses API之上,支持if-else逻辑节点、循环、用户审批节点、文件搜索和数据转换等模块化组件。开发者可以从预设模板开始(如客服机器人、数据增强、文档对比),也可以从零搭建自定义流程。


ChatKit,一个可嵌入的聊天界面组件。开发者可以把这个界面集成到自己的网站或应用中,带来ChatGPT级别的对话体验,同时保留自己的品牌、工作流和产品特色。它能处理流式响应、管理对话线程、显示模型思考过程,让集成聊天UI的复杂工作变得简单。

Connector Registry,一个企业级的连接管理中心。管理员可以通过控制面板统一管理Agent如何连接内部工具和第三方系统,设置权限、监控使用情况,同时保证安全性和合规性。

Agent Evals(评估工具),提供性能测量和优化能力。包括逐步追踪评分(Trace Grading,理解Agent的决策步骤)、评估数据集、自动化提示词优化,以及在OpenAI平台上直接对外部模型运行评估的能力。


在现场OpenAI工程师Christina Huang8分钟的演示中。她从零开始,用Agent Builder构建了一个名为Ask Froge的DevDay网站Agent。快速地将一个静态的会议网站创建一个智能问答助手,以提升用户体验。

她先设置了Agent的基本指令,然后添加了预构建的Guardrails(防护栏)用于PII信息掩码,接着连接了DevDay的日程数据,最后加入了自定义Widget来显示会议时间表。整个过程不到8分钟,Agent就部署到了DevDay官网,观众可以现场访问使用。

企业案例中,零售巨头Albertsons用AgentKit构建了帮门店经理分析销量的Agent,当某个品类销量下降(比如冰淇淋),系统会基于季节性趋势、历史数据和外部因素(天气、节假日)给出诊断和建议。营销软件公司HubSpot则用它改进了Breeze AI客服工具,Agent能整合知识库、查找当地治疗方案和保险政策细节,生成更有针对性的回复。Box、Canva和Evernote也已开始使用该平台。

Altman说这是我们当初造第一个Agent时希望拥有的工具。降低门槛的逻辑很清晰,让更多人能造Agent,OpenAI才能抢占Agent开发生态的制高点。

而这个生态的门槛因为模型能力提升而足够低的时候,app就会被agent们替代。

Codex和模型更新

除了应用和Agent,OpenAI还宣布了一系列基础设施更新。

Codex正式可用,OpenAI的软件工程Agent Codex结束研究预览,进入通用可用(GA)阶段。Codex现在运行在专门训练的GPT-5-Codex模型上,这个模型在代码重构和代码审查等Agentic编程任务上表现更出色。自8月初以来,Codex的日均消息量增长了10倍,已处理超过40万亿个token。


过去两三个月里,开发者社区能明显感觉到Codex很火。一方面,OpenAI用GPT-5-Codex把"AI代码这条垂直赛道往前推了一步,在代码质量和推理能力上形成优势,另一方面,Codex提供了价格透明、场景统一、稳定可预期的开发体验。相比之下,不少开发者抱怨Claude Code存在限流、质量波动等问题,甚至有人已经把主要精力转到Codex上。这次正式发布,是OpenAI在代码生成领域持续发力的一步。

OpenAI展示了内部数据,工程师在使用Codex后,每周完成的Pull Request数量提升了70%,几乎所有OpenAI的PR都经过Codex审查。Codex还新增了三个企业功能:Slack集成(可以直接在团队频道里让Codex写代码或回答问题)、Codex SDK(让开发者在自己的工作流中嵌入Codex能力)、以及管理工具(包括环境控制、监控和分析仪表板)。

模型和API更新方面,GPT-5 Pro API向所有开发者开放,这是OpenAI目前最智能的模型,专为需要高精度和深度推理的场景设计,如金融建模、法律文件分析和医疗诊断,定价为每百万输入token 15美元、每百万输出token 120美元。


OpenAI刚刚发布全新的Sora 2模型及同名Sora App,应用上线后迅速走红,Sora 2、Sora 2 Pro API也进入预览阶段,这个新一代视频生成模型在可控性上有巨大飞跃,能根据详细指令生成风格化、构图精良的视频,还能配上丰富的声音景观、环境音频和同步音效。Sora 2 输出每秒 0.1 美元,Pro 输出每秒0.3 美元。


GPT-Realtime-Mini则是一个更小、更便宜的语音模型,比之前的高级语音模型便宜70%,但音质和表达力保持一致。OpenAI认为语音将成为人们与AI互动的主要方式之一,更经济的模型能让语音应用更快普及。

平台化的野心

这次DevDay最重要的信号是,ChatGPT不再只是一个Chatbot,而是正在成为一个完整的应用平台。Apps SDK让开发者能触达8亿用户,AgentKit降低了Agent开发门槛,Codex提升了软件开发效率。OpenAI正在构建一个从应用分发、开发工具到基础设施的完整生态。

从现场演示来看,这些Agent更像是对话式的App,它们依然需要后端逻辑、数据管理和UI交互,只是把入口从图标点击变成了自然语言对话。这是交互方式的革命,但软件开发的本质没有改变,你还是需要懂业务、懂技术、懂用户需求。

苹果推出App Store时,没人想到十年后会有几百万个App。OpenAI推出了Apps SDK,现在的问题不是Agent是否会替代App,而是开发者们是否真的会来,在ChatGPT上“Build something new”。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 13:49:17

文字版  标准版  电脑端

© 2003-2025