← 返回列表

OpenAI 把 Agents SDK 推向“原生执行层”,代理开发开始从拼装框架转向标准化基础设施

OpenAI 把 Agents SDK 推向“原生执行层”,代理开发开始从拼装框架转向标准化基础设施

2026年4月15日 · 校长 · AI

核心摘要

OpenAI 宣布为 Agents SDK 增加模型原生 harness、容器化 sandbox 执行、Manifest 工作区抽象、可配置 memory,以及更标准化的 MCP、AGENTS.md、skills、shell 和 apply patch 能力。这不是普通 SDK 小版本更新,而是在把“代理怎么安全运行、如何跨文件和工具持续工作”从开发者自拼组件,推进到平台级基础设施。

【版权说明】本文为中文深度解读与观点整理,基于公开资料综合分析,不是原文逐字翻译。原始内容版权归 OpenAI 及相关信源所有。

原始信源:

1) OpenAI(2026-04-15)openai.com · the next evolution of the agents sdk

2) OpenAI Developers(Agents SDK 文档)developers.openai.com · agents

一、发生了什么

OpenAI 在 4 月 15 日宣布扩展 Agents SDK,核心不是再加几个 API 参数,而是把代理执行最麻烦的一层直接产品化了。新版能力包括:模型原生 harness、原生 sandbox 执行、可配置 memory、Manifest 工作区抽象,以及与 MCP、AGENTS.md、skills、shell、apply patch 等代理常用原语的标准化集成。

官方给出的方向很明确,Agents SDK 不再只是“帮你调用模型和工具”的薄封装,而是开始承担代理运行时的职责,覆盖文件读写、命令执行、状态延续、隔离环境、长任务恢复,以及多工具协同。

二、为什么这次更新重要

过去一年,行业里大量所谓 agent 产品,真正难的部分并不是提示词,而是执行层。团队要自己搭文件系统权限、shell 执行、sandbox 隔离、任务恢复、输出目录约定、依赖安装、工具桥接、记忆机制,最后还要想办法让这些东西和模型的工作方式对齐。OpenAI 这次升级,本质上是在说:这些不该再由每个团队从零拼一次。

这意味着代理基础设施竞争,开始从“谁封装得快”转向“谁能提供标准化且更贴近模型天然工作方式的运行时”。如果这个方向成立,未来开发者评估 agent 平台时,看的不只是模型能力,还会看执行环境是不是稳定、可迁移、可恢复、可审计。

三、最值得关注的三个信号

第一,OpenAI 明确强调 model-native harness。它实际上在争夺代理运行时标准的话语权。过去很多框架强调模型无关,但代价往往是牺牲前沿模型的最佳工作模式。OpenAI 现在反过来主张,执行层应该围绕模型擅长的操作模式设计,这会提升复杂长任务中的可靠性。

第二,sandbox 从“可选外接能力”变成 SDK 的原生部分。官方支持开发者自带 sandbox,也可接入 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel 等提供方,还引入 Manifest 描述工作区、挂载本地文件和云存储。这个动作很关键,因为它把 agent 从 API 调用器,推进成真正能在受控计算环境里持续工作的执行体。

第三,官方把 MCP、skills、AGENTS.md、shell、apply patch 这些社区里已经逐渐成型的原语直接写进产品叙事里。信号很明确,OpenAI 不只是想提供模型,还想把外围 agent 生态里的高频模式吸收到自己平台的标准层。谁定义这些“默认原语”,谁就更可能吃到下一阶段的开发者心智。

四、这对行业意味着什么

对创业团队和企业内部平台组来说,这会降低把 agent 从 demo 推向生产的工程摩擦。以前很多团队卡在“模型能做,但运行不稳、审计困难、环境易脏、任务一长就断”,现在至少有了更成体系的默认方案。

但另一个更大的变化是平台收口。OpenAI 这次不是只发一个 SDK 功能,而是在向上吃框架层、向下吃执行层。长期看,独立 agent 框架、sandbox 供应商、workflow 平台不会立刻消失,但会被迫更清楚地回答一个问题:如果 OpenAI 官方已经提供默认运行时,你的差异化还剩什么?

五、编者观察

我认为这条更新的真正价值,不在“OpenAI 又发了一个新工具”,而在于它说明代理开发正在从实验性拼装时代,进入基础设施标准化时代。接下来行业比的将不只是模型有多强,而是谁能把 agent 的文件系统、工具调用、隔离执行、状态恢复和权限边界做成一套可靠产品。

如果这个趋势继续,2026 年的 agent 竞争主线,很可能不再只是模型榜单,而是谁先把“代理运行时”做成事实标准。OpenAI 这次,明显在往那个位置抢。