热点新闻

来源：盒饭财经

模型之后，AI巨头开抢软件生产线。

作者 | 许有阳

头图及封面来源 | 山姆·奥特曼与埃隆·马斯克，来源网络

造火箭的买了个“编辑器”，做AI的买了个“云沙盒”。两笔相隔不到一周的交易，看起来隔着十万八千里，却把AI编程下一个争夺点摆到了同一台面上。

当地时间6月16日，SpaceX向美国证券交易委员会（SEC）提交文件，披露其已与Cursor母公司Anysphere签署合并协议，拟以全股票方式完成交易，隐含股权价值约600亿美元，预计于2026年第三季度交割，仍需满足监管审批等条件。

SpaceX宣布收购Cursor的五天前，也就是当地时间6月11日，OpenAI在官网宣布了一则收购消息。消息透露，这次OpenAI拟收购对象为一家名为Ona的德国公司。据了解，Ona提供安全、持久、客户可控的云端执行和编排环境。

表面看，Ona和Cursor不是同一赛道的公司：一个做云端执行环境，一个做AI IDE；一个在后台，一个在前台。但放在AI编程的演进里，它们刚好拼成同一条生产线：Cursor代表的是开发者面对的前台和入口，而Ona是AI把任务完成的环境，代表着后台执行环境。

一个输入框、一段回答、连续对话，让OpenAI成为过去几年最具标志性的AI产品之一。而这也是Grok很长以来产品形态。后来，这个经典的界面逐渐加上了文件、图片、语音、画布、搜索和工具调用。

它们最核心的交互仍然没有变：用户说一句，模型回一句。

然而，真正的商业金矿，隐藏在能直接接管工作流的“全自动开发”中。Gartner曾预测，到2028年，75%的企业软件工程师将使用AI代码助手；同时，agentic AI正在从试点走向企业软件流程，但成本、ROI和风险控制仍是主要变量。

而多份相关投行与研报更是指出，生成式AI在软件工程与自动化基础设施领域的B2B市场规模，预计将在未来数年内飙升至数千亿美元量级。企业客户不再满足于为单纯的“算力与Token”买单，他们真正愿意掷重金购买的，是能独立查代码、跑测试并直接交付成果的“全职数字员工”。

AI编程正把这个逻辑往前推一步。

过去，AI编程的核心问题是：模型能不能补全一行代码、生成一个函数、解释一段逻辑。现在，核心问题变成：AI能不能理解一个真实代码库，完成一个真实工程任务，运行测试，提交 PR，并在企业允许的边界内留下可审计、可回滚、可追责的过程。

马斯克为Grok抢了个“前台”

收购消息宣布不久，Cursor就预告了一个1.5万亿+参数的新模型。

据机器之心等媒体报道，Cursor近期推出了新的自研模型，报道称其训练规模达到1.5万亿参数级别，并使用超过10万块GPU。Cursor官方changelog中可确认的是，其Bugbot 已由Composer 2.5驱动，review时间从约5分钟降至约90秒。

其年仅25岁的CEO Michael Truell表示，新模型规模和Opus、GPT一样大。

对大部分Cursor的用户来说，Cursor更像是一个编程工具。其作为操作前台，可调用各种顶级模型，以完成相关编程任务。其中，多模型入口又是Cursor吸引用户的重要原因之一。这一方式下，用户可在同一编程前台中调用不同头部模型完成复杂任务。

截至6月17日上午11点，盒饭财经在Cursor相关页面发现中，目前可调用Fable 5、Opus4.8、GPT-5.5、Codex5.3等。

这件事反常识的地方就在于，马斯克刚宣布要收购Cursor，Cursor就开始预告自己的模型。

原因，或许藏在马斯克的AI野心里。

Cursor很容易被误解成一个“更好用的VS Code”。这当然没错，但它真正有价值的地方，并不是AI编辑器的壳子，而是它已是开发者每天和AI协作的第一界面。

传统IDE里，开发者写代码、查文档、跑测试、提交PR，AI只是其中一个插件。而Cursor 反过来做了一件事：把AI放在工作流中央。补全、聊天、多文件修改、agent、代码审查、CLI、Cloud Agents，都围绕一个问题展开：开发者什么时候愿意把一个任务交给AI。

而这也是马斯克要回答的问题。

按照SEC文件，这次收购的法律买方是Space Exploration Technologies Corp.，并不是xAI。但从产业逻辑看，Cursor给Grok补了很难自己长出来的手和眼。模型可以在基准测试里追赶，真正的开发者入口却需要产品、社区、习惯和日复一日的交互数据。

多家媒体披露，Cursor年化收入已经超过10亿美元，服务数万家企业，并进入Nvidia、Adobe、Uber、Shopify等客户的开发流程。这不是一个普通编辑器能解释的增长。

对马斯克来说，Cursor是AI战场的又一次机会。

自2023年xAI成立以来，马斯克一直试图将其大模型Grok打造为横跨X（原推特）、特斯拉与SpaceX的底层“AI大脑”。然而，这三大板块的发展却呈现出极度割裂的走向。

一方面，SpaceX凭借近期的历史性IPO实现了市值狂飙，成为马斯克手中弹药最充足的资本武器。但另一方面，被寄予厚望的xAI却在激烈的底层模型军备竞赛中逐渐显露疲态，尤其在复杂代码生成与逻辑推理领域，Grok的迭代速度已被OpenAI和Anthropic拉开身位。

更致命的是内部的动荡。多家媒体曾报道，xAI今年早些时候经历多位联合创始人和高管离职。至于离职原因，外界报道涉及战略方向、产品安全、组织压力等多重因素，但难以归结为单一原因。

能确定的是，这场突如其来的“人才失血”不仅打乱了Grok原定的演进节奏，也让外界对马斯克能否继续留在纯基础大模型赛道的第一梯队，打上了巨大的问号。

对于现在的Grok来说，可以继续追模型能力，但模型追赶需要时间。同时，开发者入口、工作流数据和工程反馈这些新的竞争维度，不能只靠堆GPU获得。

而Cursor近期的模型更新，进一步说明它不甘心只做一个多模型外壳。

6月10日，Cursor在changelog中称，Bugbot的平均review时间从约5分钟降至约90秒，单次review发现的bug平均数从0.56提高到0.62，成本下降约22%。而这些提升来自Composer 2.5训练进展，Bugbot已由Composer 2.5驱动。

Cursor还在6月4日的SDK更新中提到，仍然调用composer-2的SDK客户端会自动路由到Composer 2.5。Cursor的竞争点已经从“接入谁的模型”变成“自己如何训练、路由和产品化模型”。

Bugbot并不是一个普通代码审查插件。它连接GitHub、GitLab、/review命令、Security Review、模型block list和SDK，能把模型能力嵌进代码审查和交付流程。

SpaceX买下Cursor，买的是开发者入口、工程反馈、代码交互数据，以及一个可以承载 Grok、Claude、GPT或自研模型的前台操作系统。

Cursor是驾驶舱，谁控制驾驶舱，谁就更接近开发者发号施令的位置。

OpenAI想给Codex装个“后台”

如果Cursor是驾驶舱，Ona就是工位。

“我曾一直以为，出售公司会像是一种终结。可没想到，我们倾注毕生心血的事业，反而变得规模更大，也更重要了。”Ona的CEOJohannes Landgraf在公告中这样写道。

三个月前，他没想过有朝一日会卖掉公司，还以Codex团队一员的身份加入OpenAI。

改变走向的，是Ona今年以来的增长。

Landgraf透露，自今年年初以来，在全球一些要求最严苛的机构中，周度agent sessions增长到原来的13倍。其中，它的客户包括美国历史最悠久的银行之一、欧洲大型制药公司、亚洲大型主权财富基金等机构。

于是，一个原本做云开发环境的创业者，突然站到了AI agent企业化的入口处。

OpenAI对Ona的官方表述很直白：这次拟收购是为了把Ona的安全云执行和编排技术带入Codex，让Codex拥有一个“persistent place to work”。OpenAI同时披露，Codex每周用户已经超过500万，较年初增长400%。

一个13倍，一个400%，这一数据能直观看到Codex和Ona的合作基础，也侧面回答了一个问题：OpenAI为什么要买一家德国的云开发环境企业。

要理解云开发环境，得先理解Ona的前身Gitpod。Gitpod是德国开发工具平台，长期做Cloud Development Environment，翻译过来可以叫云开发环境。

过去开发者入职新团队，常常要花几个小时甚至几天配置本地环境。比如，装依赖、配数据库、拉私有包、对齐编译器版本，等等。但，最后还是有可能会遇到那句老话：“在我机器上能跑”。

Gitpod这类产品的价值，就是把开发环境提前配置好，放在云端。开发者打开浏览器或连接IDE，就能进入一个可复现的工作区。人类开发者时代，这确实有价值，但并不是什么必需品。面对类似问题的解决办法非常多，比如开发者的本地机器虽然复杂，却足够灵活；环境坏了，人可以自己排查；配置慢一点，也只是效率问题。

AI agent时代，这可能会变成了刚需。

2026年年初，OpenClaw火爆全球科技圈。在OpenClaw的助攻和普及下，AI Agent也进入到了“生产”阶段，让更多人看到AI不只能“回答”，还能“执行”。

但相关的安全研究迅速给行业泼了盆冷水。

论文《ClawSafety: “Safe”LLMs, Unsafe Agents》在120个对抗场景和2520次沙盒实验中发现，当LLM以agent形态接触工作区技能文件、邮件和网页等外部内容时，攻击成功率可达40%到75%。

另一篇《Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw》则显示，攻击者只要污染agent的Capability、Identity、Knowledge任一维度，平均攻击成功率就可能从24.6%上升到64%至74%。

这说明，大模型本身“安全”不等于agent系统安全。

只要它拥有外部网络、终端、文件系统和凭证权限，就可能被间接提示词注入、恶意网页、污染配置或伪造指令带偏。既然大模型容易被骗，企业真正需要的不是让它更“听话”的提示词，而是给它的手脚加上系统级边界。

而现实工作场景下，真实的软件任务不是”请帮我写一个函数”那么简单。它要clone repo，安装依赖，读取构建配置，跑测试，访问私有包，理解CI失败日志，修改多个文件，再把结果交给人review。这个过程可能持续数小时甚至数天。

OpenAI 在公告中也说，Codex最有价值的工作正在从分钟级延展到小时或天级。

Ona在其官方宣传中，已把自己定义为background agents的平台，核心模型包括 environments、agents和runners。这一体系内，每个任务有自己的隔离环境，agent在里面读代码、改文件、运行测试、生成PR。而Ona的runner是接触代码和凭证的执行层，可以运行在Ona Cloud，也可以运行在客户自己的AWS或GCP VPC中。

理论上来看，这一套下来企业不一定要把最敏感的代码和密钥交给一个外部SaaS，可以把执行层放在自己可控的界线内。

相关的技术研究也在朝着这个方向持续展开。

SWE-bench把评测对象从算法题变成真实GitHub issue。SWE-agent和OpenHands证明，模型需要终端、文件系统和工具接口才能完成真实工程任务。

《SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering》截图

《A Survey of Context Engineering for Large Language Models》一文中，则把提示词之外的上下文、记忆、工具、反馈和环境组织成一门新方法。换句话说，AI编程正在从“模型会不会写”转向“系统能不能让模型持续做对”。

而这也是OpenAI必须补的一层。

不是一个ToC的商业模式

最大成本不是生成，而是验收。

早期AI编程主要是completion。也就是根据上下文补一行、补一个函数。GitHub Copilot的早期研究显示，在特定JavaScript任务中，使用Copilot的开发者完成速度提升55.8%。

而这类研究证明的是“局部输入效率”，并不是完整软件交付能力。

后来战场转向SWE-bench。SWE-bench不再问模型能不能写一道算法题，而是让模型解决真实GitHub issue，需要理解代码库、定位bug、修改多文件、跑测试。这把评价标准从“代码生成”推向“软件工程任务完成”。

再往后，才是大家熟悉的SWE-agent、OpenHands、Claude Code、Codex这类agent系统。它们的关键不是模型多说一句解释，而是能不能拥有一个“工作现场”：文件系统、终端、依赖、测试、日志、权限和回滚。

在这样发展中，AI编程逐渐衍生出了模型层、上下文层、工具层、执行层和治理层这5层核心技术栈。也因此，AI编程从一个产品形态转变为一条生产链。

不同的企业，正根据自身的特点，抢占相应的位置。

AI编程竞争格局情况不完全统计，各抢一段软件生产线

但抢到前台和后台，不等于拿下生产线。

企业真正需要的不是“一个更聪明的插件”，而是一套完整机制。这套机制中，或许会包含SSO、SCIM、RBAC，审计日志，私有化或VPC runner，分支保护，secret scanning，高风险目录禁写，可回放、可追责、可回滚等等。

这就也是Ona、GitHub Actions runner、Claude Code sandbox、Cursor Cloud Agents 这些能力变得重要的原因。

这些能力和要求，注定这不是一个ToC的商业模式。

当企业为专用的runner、VPC、私有化、审计、合规、数据驻留、模型网关、CMEK、专属支持等付费时，AI编程产品的收入结构可能不是简单的“20美元/月”的个人订阅。

另一种形态

国内并不缺AI编程助手。

阿里有通义灵码/Qoder CN，字节有Trae，腾讯有CodeBuddy，百度有Comate，华为云有CodeArts代码智能体，智谱有CodeGeeX，Kimi、MiniMax等模型公司也在强化coding 和agent能力。

国内相关玩家情况统计表

它们与海外的格局、生态不同。Cursor抢AI IDE，Ona占agent 执行环境，GitHub守代码资产入口，这几个独立玩家已在这条生产线上扎根。

这是不同生态和资源中长出来的。

海外有GitHub这个超级代码入口，国内没有一个绝对中心。代码资产分散在Gitee、GitCode、CODING、自建GitLab、云效、CodeArts和企业内部平台里。同时，任务入口也不一定来自GitHub issue，更多时候来自钉钉、飞书、企业微信、TAPD、禅道、会议纪要、需求文档和审批流。

现在，缺的是企业敢放进去干活的agent runtime。

在盒饭财经陆续发布的《微信让路，但不让权》《钉钉的新CEO，也要还“旧账”》两篇文章中，也不同程度地涉及到了这个话题：AI如果想完成企业的现实任务，它需要让任务、权限、责任和结果在企业里闭环，需要面对各种复杂的“上下文”，以及需要企业对它足够的信任。

现在，OpenAI们已经瞄准了这里。

参考资料：

1.《瞄准AI代理赛道OpenAI收购云端平台强化Codex竞争力》，财联社

2.《OpenAI to acquire Ona》, OpenAI,

3.《Ona is joining OpenAI》, Ona

4.《How Ona Works》，Ona Docs

5.《Runner infrastructure》，Ona Docs

6.《Cursor，为什么上了马斯克的飞船？》，腾讯科技

7.《刚被马斯克收购，Cursor掏出新模型：10万卡加持，和Opus、GPT一样大》，机器之心

8.《SWE-bench: Can Language Models Resolve Real-World GitHub Issues?》，

https://arxiv.org/abs/2310.06770

9.《SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering》，

https://arxiv.org/abs/2405.15793

10.《OpenHands: An Open Platform for AI Software Developers as Generalist Agents》，https://arxiv.org/abs/2407.16741

11.《A Survey of Context Engineering for Large Language Models》，

https://arxiv.org/abs/2507.13334

12.《ClawSafety: “Safe” LLMs, Unsafe Agents》，https://arxiv.org/abs/2604.01438

13.《Your Agent, Their Asset: A Real-World Safety Analysis of OpenClaw》，

https://arxiv.org/abs/2604.04759

14.《Bugbot is now over 3x faster, 22% cheaper, and finds 10% more bugs》，

https://cursor.com/changelog

15.《Custom stores, custom tools, and auto-review for the Cursor SDK》，

https://cursor.com/changelog

16.《Business Insider, SpaceX is buying AI coding startup Cursor for $60 billion》，

https://www.businessinsider.com/spacex-confirms-cursor-acquisition-60-billion-ai-coding-startup-2026-6

17.《About Copilot coding agent》，

https://docs.github.com/en/copilot/concepts/agents/cloud-agent/about-cloud-agent

18.《Gartner预估2028年75%的企业软件工程师使用AI代码助手》，it之家

19.《Curso成造富神器！四位不到30岁的创始人，全部晋身亿万富豪》，福布斯中国

OpenAI抢后台，马斯克抢前台

Cursor截图

来源：Ona官网

相关推荐