OpenAI抢后台,马斯克抢前台

来源:盒饭财经

模型之后,AI巨头开抢软件生产线。

作者 | 许有阳

头图及封面来源 | 山姆·奥特曼与埃隆·马斯克,来源网络

造火箭的买了个“编辑器”,做AI的买了个“云沙盒”。两笔相隔不到一周的交易,看起来隔着十万八千里,却把AI编程下一个争夺点摆到了同一台面上。

当地时间6月16日,SpaceX向美国证券交易委员会(SEC)提交文件,披露其已与Cursor母公司Anysphere签署合并协议,拟以全股票方式完成交易,隐含股权价值约600亿美元,预计于2026年第三季度交割,仍需满足监管审批等条件。

SpaceX宣布收购Cursor的五天前,也就是当地时间6月11日,OpenAI在官网宣布了一则收购消息。消息透露,这次OpenAI拟收购对象为一家名为Ona的德国公司。据了解,Ona提供安全、持久、客户可控的云端执行和编排环境。

表面看,Ona和Cursor不是同一赛道的公司:一个做云端执行环境,一个做AI IDE;一个在后台,一个在前台。但放在AI编程的演进里,它们刚好拼成同一条生产线:Cursor代表的是开发者面对的前台和入口,而Ona是AI把任务完成的环境,代表着后台执行环境。

一个输入框、一段回答、连续对话,让OpenAI成为过去几年最具标志性的AI产品之一。而这也是Grok很长以来产品形态。后来,这个经典的界面逐渐加上了文件、图片、语音、画布、搜索和工具调用。

它们最核心的交互仍然没有变:用户说一句,模型回一句。

然而,真正的商业金矿,隐藏在能直接接管工作流的“全自动开发”中。Gartner曾预测,到2028年,75%的企业软件工程师将使用AI代码助手;同时,agentic AI正在从试点走向企业软件流程,但成本、ROI和风险控制仍是主要变量。

而多份相关投行与研报更是指出,生成式AI在软件工程与自动化基础设施领域的B2B市场规模,预计将在未来数年内飙升至数千亿美元量级。企业客户不再满足于为单纯的“算力与Token”买单,他们真正愿意掷重金购买的,是能独立查代码、跑测试并直接交付成果的“全职数字员工”。

AI编程正把这个逻辑往前推一步。

过去,AI编程的核心问题是:模型能不能补全一行代码、生成一个函数、解释一段逻辑。现在,核心问题变成:AI能不能理解一个真实代码库,完成一个真实工程任务,运行测试,提交 PR,并在企业允许的边界内留下可审计、可回滚、可追责的过程。

马斯克为Grok抢个“前台”

收购消息宣布不久,Cursor就预告了一个1.5万亿+参数的新模型。

据机器之心等媒体报道,Cursor近期推出了新的自研模型,报道称其训练规模达到1.5万亿参数级别,并使用超过10万块GPU。Cursor官方changelog中可确认的是,其Bugbot 已由Composer 2.5驱动,review时间从约5分钟降至约90秒。

其年仅25岁的CEO Michael Truell表示,新模型规模和Opus、GPT一样大。

对大部分Cursor的用户来说,Cursor更像是一个编程工具。其作为操作前台,可调用各种顶级模型,以完成相关编程任务。其中,多模型入口又是Cursor吸引用户的重要原因之一。这一方式下,用户可在同一编程前台中调用不同头部模型完成复杂任务。

截至6月17日上午11点,盒饭财经在Cursor相关页面发现中,目前可调用Fable 5、Opus4.8、GPT-5.5、Codex5.3等。

这件事反常识的地方就在于,马斯克刚宣布要收购Cursor,Cursor就开始预告自己的模型。

原因,或许藏在马斯克的AI野心里。

Cursor很容易被误解成一个“更好用的VS Code”。这当然没错,但它真正有价值的地方,并不是AI编辑器的壳子,而是它已是开发者每天和AI协作的第一界面。

传统IDE里,开发者写代码、查文档、跑测试、提交PR,AI只是其中一个插件。而Cursor 反过来做了一件事:把AI放在工作流中央。补全、聊天、多文件修改、agent、代码审查、CLI、Cloud Agents,都围绕一个问题展开:开发者什么时候愿意把一个任务交给AI。

而这也是马斯克要回答的问题。

按照SEC文件,这次收购的法律买方是Space Exploration Technologies Corp.,并不是xAI。但从产业逻辑看,Cursor给Grok补了很难自己长出来的手和眼。模型可以在基准测试里追赶,真正的开发者入口却需要产品、社区、习惯和日复一日的交互数据。

多家媒体披露,Cursor年化收入已经超过10亿美元,服务数万家企业,并进入Nvidia、Adobe、Uber、Shopify等客户的开发流程。这不是一个普通编辑器能解释的增长。

对马斯克来说,Cursor是AI战场的又一次机会。

自2023年xAI成立以来,马斯克一直试图将其大模型Grok打造为横跨X(原推特)、特斯拉与SpaceX的底层“AI大脑”。然而,这三大板块的发展却呈现出极度割裂的走向。

一方面,SpaceX凭借近期的历史性IPO实现了市值狂飙,成为马斯克手中弹药最充足的资本武器。但另一方面,被寄予厚望的xAI却在激烈的底层模型军备竞赛中逐渐显露疲态,尤其在复杂代码生成与逻辑推理领域,Grok的迭代速度已被OpenAI和Anthropic拉开身位。

更致命的是内部的动荡。多家媒体曾报道,xAI今年早些时候经历多位联合创始人和高管离职。至于离职原因,外界报道涉及战略方向、产品安全、组织压力等多重因素,但难以归结为单一原因。

能确定的是,这场突如其来的“人才失血”不仅打乱了Grok原定的演进节奏,也让外界对马斯克能否继续留在纯基础大模型赛道的第一梯队,打上了巨大的问号。

对于现在的Grok来说,可以继续追模型能力,但模型追赶需要时间。同时,开发者入口、工作流数据和工程反馈这些新的竞争维度,不能只靠堆GPU获得。

而Cursor近期的模型更新,进一步说明它不甘心只做一个多模型外壳。

6月10日,Cursor在changelog中称,Bugbot的平均review时间从约5分钟降至约90秒,单次review发现的bug平均数从0.56提高到0.62,成本下降约22%。而这些提升来自Composer 2.5训练进展,Bugbot已由Composer 2.5驱动。

Cursor还在6月4日的SDK更新中提到,仍然调用composer-2的SDK客户端会自动路由到Composer 2.5。Cursor的竞争点已经从“接入谁的模型”变成“自己如何训练、路由和产品化模型”。

Bugbot并不是一个普通代码审查插件。它连接GitHub、GitLab、/review命令、Security Review、模型block list和SDK,能把模型能力嵌进代码审查和交付流程。

SpaceX买下Cursor,买的是开发者入口、工程反馈、代码交互数据,以及一个可以承载 Grok、Claude、GPT或自研模型的前台操作系统。

Cursor是驾驶舱,谁控制驾驶舱,谁就更接近开发者发号施令的位置。

OpenAI想给Codex装个“后台”

如果Cursor是驾驶舱,Ona就是工位。

“我曾一直以为,出售公司会像是一种终结。可没想到,我们倾注毕生心血的事业,反而变得规模更大,也更重要了。”Ona的CEOJohannes Landgraf在公告中这样写道。

三个月前,他没想过有朝一日会卖掉公司,还以Codex团队一员的身份加入OpenAI。

改变走向的,是Ona今年以来的增长。

Landgraf透露,自今年年初以来,在全球一些要求最严苛的机构中,周度agent sessions增长到原来的13倍。其中,它的客户包括美国历史最悠久的银行之一、欧洲大型制药公司、亚洲大型主权财富基金等机构。

于是,一个原本做云开发环境的创业者,突然站到了AI agent企业化的入口处。

OpenAI对Ona的官方表述很直白:这次拟收购是为了把Ona的安全云执行和编排技术带入Codex,让Codex拥有一个“persistent place to work”。OpenAI同时披露,Codex每周用户已经超过500万,较年初增长400%。

一个13倍,一个400%,这一数据能直观看到Codex和Ona的合作基础,也侧面回答了一个问题:OpenAI为什么要买一家德国的云开发环境企业。

要理解云开发环境,得先理解Ona的前身Gitpod。Gitpod是德国开发工具平台,长期做Cloud Development Environment,翻译过来可以叫云开发环境。

过去开发者入职新团队,常常要花几个小时甚至几天配置本地环境。比如,装依赖、配数据库、拉私有包、对齐编译器版本,等等。但,最后还是有可能会遇到那句老话:“在我机器上能跑”。

Gitpod这类产品的价值,就是把开发环境提前配置好,放在云端。开发者打开浏览器或连接IDE,就能进入一个可复现的工作区。人类开发者时代,这确实有价值,但并不是什么必需品。面对类似问题的解决办法非常多,比如开发者的本地机器虽然复杂,却足够灵活;环境坏了,人可以自己排查;配置慢一点,也只是效率问题。

AI agent时代,这可能会变成了刚需。

2026年年初,OpenClaw火爆全球科技圈。在OpenClaw的助攻和普及下,AI Agent也进入到了“生产”阶段,让更多人看到AI不只能“回答”,还能“执行”。

但相关的安全研究迅速给行业泼了盆冷水。

论文《ClawSafety: “Safe”LLMs, Unsafe Agents》在120个对抗场景和2520次沙盒实验中发现,当LLM以agent形态接触工作区技能文件、邮件和网页等外部内容时,攻击成功率可达40%到75%。

另一篇《Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw》则显示,攻击者只要污染agent的Capability、Identity、Knowledge任一维度,平均攻击成功率就可能从24.6%上升到64%至74%。

这说明,大模型本身“安全”不等于agent系统安全。

只要它拥有外部网络、终端、文件系统和凭证权限,就可能被间接提示词注入、恶意网页、污染配置或伪造指令带偏。既然大模型容易被骗,企业真正需要的不是让它更“听话”的提示词,而是给它的手脚加上系统级边界。

而现实工作场景下,真实的软件任务不是”请帮我写一个函数”那么简单。它要clone repo,安装依赖,读取构建配置,跑测试,访问私有包,理解CI失败日志,修改多个文件,再把结果交给人review。这个过程可能持续数小时甚至数天。

OpenAI 在公告中也说,Codex最有价值的工作正在从分钟级延展到小时或天级。

Ona在其官方宣传中,已把自己定义为background agents的平台,核心模型包括 environments、agents和runners。这一体系内,每个任务有自己的隔离环境,agent在里面读代码、改文件、运行测试、生成PR。而Ona的runner是接触代码和凭证的执行层,可以运行在Ona Cloud,也可以运行在客户自己的AWS或GCP VPC中。

理论上来看,这一套下来企业不一定要把最敏感的代码和密钥交给一个外部SaaS,可以把执行层放在自己可控的界线内。

相关的技术研究也在朝着这个方向持续展开。

SWE-bench把评测对象从算法题变成真实GitHub issue。SWE-agent和OpenHands证明,模型需要终端、文件系统和工具接口才能完成真实工程任务。

《SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering》截图

《A Survey of Context Engineering for Large Language Models》一文中,则把提示词之外的上下文、记忆、工具、反馈和环境组织成一门新方法。换句话说,AI编程正在从“模型会不会写”转向“系统能不能让模型持续做对”。

而这也是OpenAI必须补的一层。

不是一个ToC的商业模式

最大成本不是生成,而是验收。

早期AI编程主要是completion。也就是根据上下文补一行、补一个函数。GitHub Copilot的早期研究显示,在特定JavaScript任务中,使用Copilot的开发者完成速度提升55.8%。

而这类研究证明的是“局部输入效率”,并不是完整软件交付能力。

后来战场转向SWE-bench。SWE-bench不再问模型能不能写一道算法题,而是让模型解决真实GitHub issue,需要理解代码库、定位bug、修改多文件、跑测试。这把评价标准从“代码生成”推向“软件工程任务完成”。

再往后,才是大家熟悉的SWE-agent、OpenHands、Claude Code、Codex这类agent系统。它们的关键不是模型多说一句解释,而是能不能拥有一个“工作现场”:文件系统、终端、依赖、测试、日志、权限和回滚。

在这样发展中,AI编程逐渐衍生出了模型层、上下文层、工具层、执行层和治理层这5层核心技术栈。也因此,AI编程从一个产品形态转变为一条生产链。

不同的企业,正根据自身的特点,抢占相应的位置。

AI编程竞争格局情况不完全统计,各抢一段软件生产线

但抢到前台和后台,不等于拿下生产线。

企业真正需要的不是“一个更聪明的插件”,而是一套完整机制。这套机制中,或许会包含SSO、SCIM、RBAC,审计日志,私有化或VPC runner,分支保护,secret scanning,高风险目录禁写,可回放、可追责、可回滚等等。

这就也是Ona、GitHub Actions runner、Claude Code sandbox、Cursor Cloud Agents 这些能力变得重要的原因。

这些能力和要求,注定这不是一个ToC的商业模式。

当企业为专用的runner、VPC、私有化、审计、合规、数据驻留、模型网关、CMEK、专属支持等付费时,AI编程产品的收入结构可能不是简单的“20美元/月”的个人订阅。

另一种形态

国内并不缺AI编程助手。

阿里有通义灵码/Qoder CN,字节有Trae,腾讯有CodeBuddy,百度有Comate,华为云有CodeArts代码智能体,智谱有CodeGeeX,Kimi、MiniMax等模型公司也在强化coding 和agent能力。

国内相关玩家情况统计表

它们与海外的格局、生态不同。Cursor抢AI IDE,Ona占agent 执行环境,GitHub守代码资产入口,这几个独立玩家已在这条生产线上扎根。

这是不同生态和资源中长出来的。

海外有GitHub这个超级代码入口,国内没有一个绝对中心。代码资产分散在Gitee、GitCode、CODING、自建GitLab、云效、CodeArts和企业内部平台里。同时,任务入口也不一定来自GitHub issue,更多时候来自钉钉、飞书、企业微信、TAPD、禅道、会议纪要、需求文档和审批流。

现在,缺的是企业敢放进去干活的agent runtime。

在盒饭财经陆续发布的《微信让路,但不让权》《钉钉的新CEO,也要还“旧账”》两篇文章中,也不同程度地涉及到了这个话题:AI如果想完成企业的现实任务,它需要让任务、权限、责任和结果在企业里闭环,需要面对各种复杂的“上下文”,以及需要企业对它足够的信任。

现在,OpenAI们已经瞄准了这里。

参考资料:

1.《瞄准AI代理赛道OpenAI收购云端平台强化Codex竞争力》,财联社

2.《OpenAI to acquire Ona》, OpenAI,

3.《Ona is joining OpenAI》, Ona

4.《How Ona Works》,Ona Docs

5.《Runner infrastructure》,Ona Docs

6.《Cursor,为什么上了马斯克的飞船?》,腾讯科技

7.《刚被马斯克收购,Cursor掏出新模型:10万卡加持,和Opus、GPT一样大》,机器之心

8.《SWE-bench: Can Language Models Resolve Real-World GitHub Issues?》,

https://arxiv.org/abs/2310.06770

9.《SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering》,

https://arxiv.org/abs/2405.15793

10.《OpenHands: An Open Platform for AI Software Developers as Generalist Agents》,https://arxiv.org/abs/2407.16741

11.《A Survey of Context Engineering for Large Language Models》,

https://arxiv.org/abs/2507.13334

12.《ClawSafety: “Safe” LLMs, Unsafe Agents》,https://arxiv.org/abs/2604.01438

13.《Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw》,

https://arxiv.org/abs/2604.04759

14.《Bugbot is now over 3x faster, 22% cheaper, and finds 10% more bugs》,

https://cursor.com/changelog

15.《Custom stores, custom tools, and auto-review for the Cursor SDK》,

https://cursor.com/changelog

16.《Business Insider, SpaceX is buying AI coding startup Cursor for $60 billion》,

https://www.businessinsider.com/spacex-confirms-cursor-acquisition-60-billion-ai-coding-startup-2026-6

17.《About Copilot coding agent》,

https://docs.github.com/en/copilot/concepts/agents/cloud-agent/about-cloud-agent

18.《Gartner预估2028年75%的企业软件工程师使用AI代码助手》,it之家

19.《Curso成造富神器!四位不到30岁的创始人,全部晋身亿万富豪》,福布斯中国

上一篇:美团滴滴北京共享单车涨价 节假日起步价最高2.5元
免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。