Cursor的终局游戏:从IDE到基础设施的完整堆栈

2026年6月16日,SpaceX签署协议收购Cursor母公司Anysphere,交易隐含估值600亿美元,预计第三季度完成。几乎同一时刻,Cursor在首届用户大会Compile上推出Origin平台,并宣布自研新模型的路线。这两件事的时间巧合不是偶然。Cursor正在从"AI代码编辑器"扩展成为一个完整的软件工程生态。从底层的基础模型,到中间的Agent工作流,再到顶层的开发环境和代码协作平台,他们在尝试把整个价值链握在手里。要理解这个转变的真实含义,我们需要看清楚:Cursor到底在推翻什么。

第一部分:从工具到基础设施的转变

IDE的黄昏

2023年初,Cursor刚面世时的定位很谦卑:一个"更聪明的VS Code"。三年过去,事情起了变化。根据Cursor总裁Oskar Schulz的说法,95%的用户现在把Cursor当成Agent在使用。这不仅仅是一个数字变化,它标志着一个根本性的产品转变。

从2024年到2025年,开发社区经历了一次集体顿悟。代码补全能让你少敲几下键盘,但天花板太低。你依然是执行者,AI只是打字员。但当你给AI足够的权限和上下文,它就不再只是补全代码。它理解意图、规划步骤、执行重构、验证结果。这就是Agent的本质。这个转变推倒了第一张多米诺骨牌。

平台依赖的诅咒

向Agent转型让Cursor获得爆发式增长,但也暴露了它的软肋:它太依赖Anthropic了。根据Business Insider,知情员工表示Cursor早期贡献了Anthropic近一半的收入。这是一种极度危险的共生关系。当一家公司的收入来源中有40%-50%来自单一客户,这个客户同时又是你的竞争对手,风险就变成了现实。Claude Code于2025年2月以research preview亮相,2025年5月面向公众开放。这款工具凭借出色的Agent能力迅速在开发者中蔓延。到2026年2月,其年化收入已超过25亿美元。这不是一个缓慢的市场侵蚀,而是一场快速的市场重新洗牌。

与此同时,Cursor面临的压力越来越大。根据JetBrains的开发者调查,Cursor的增速明显放缓,Claude Code与Cursor在工作场景采用率上均为18%,快速追平。2026年1月5日,Truell召开紧急全体会议。他向团队强调,Cursor必须拥有自己的AI模型,以避免被前沿模型厂商甩开。这个决定标志着Cursor正式放弃"套壳IDE"的身份,决定亲自下场做基础设施。这不是一个战术调整,而是一个战略转向。

第二部分:为什么要从零开始?

通用模型的局限性

在这个节骨眼上,Cursor面临一个艰难的选择:是拿开源模型继续微调,还是从零训练?微调更省钱、更快速。但Michael在Compile大会上说得很清楚:从零训练能让他们完全掌控模型行为,精准覆盖开发者真正需要的工作负载。这不是公关辞令,而是技术现实。

独家数据的壁垒

Cursor手里握着一张王牌:大量的开发者交互数据。这些数据包含什么?不仅仅是最终的代码,还有修改、拒绝、调试的完整过程。当一个开发者拒绝AI生成的代码并进行修改时,这个动作本身就是一个极具价值的训练信号。它告诉模型:"你刚才的思路是错的,这才是人类想要的解法。"这种包含完整试错循环的动态数据,在GitHub上根本爬不到。GitHub只有最终的成品,没有思考的过程。

华尔街投资者Gavin Baker说得直白:除了Anthropic,Cursor拥有比世界上任何其他实验室更多的"专有代码训练数据"。这些数据如何被使用涉及数据政策问题,但毫无疑问,这是Cursor相比其他模型厂商的一个独特优势。

摆脱通用模型的枷锁

如果只是微调,你就得忍受开源模型的设计缺陷。分词方式、架构选择、注意力机制——这些都是为通用对话优化的,不适合高强度的代码库分析和Agent工作流。从零开始,Cursor能问出真正关键的问题:什么架构最适合理解跨文件的代码逻辑?如何设计才能让模型在处理几十万行代码时保持敏锐?如何优化Token化以最大化代码理解能力?他们不再需要在为聊天设计的模型上打补丁。

突破代码生成的边界

Michael的野心不止于此。新模型要具备"通用的工程智能",而不仅仅是会写代码。一个真正的工程智能体需要什么?它得会规划系统架构、看懂复杂的报错日志、写测试用例、查数据库状态。它需要理解业务需求,而不仅仅是代码语法。微调通用大模型根本喂不出这种工程直觉。

这种能力需要从基础模型层面就进行设计。这就是为什么Cursor选择了从零开始。

第三部分:1.5T参数的真实含义

新模型的规模

根据现场信息,Cursor正在训练一个约1.5T参数的新模型。这个模型从零开始训练,使用了大规模GPU集群。新模型的训练算力是上一代Composer的10到20倍。这里我要说明一下作者的视角:这些细节目前主要来自现场转述和媒体报道。Cursor官方的完整技术文档还未公开。但基于已有的信息,我们可以推断出Cursor的战略意图很清晰——他们在投入frontier级别的计算资源来构建一个专为工程任务优化的模型。

参数规模的真实含义

有一个常见的误解需要澄清。1.5T参数听起来很大,但参数规模本身不是决定模型能力的唯一因素。社交媒体上有各种关于其他模型参数规模的猜测,但闭源模型的具体参数量通常不会被官方公开。这些猜测可能有一定的参考价值,但不应该作为权威出处。真正重要的是什么?是数据、是强化学习、是集成。Cursor的竞争优势在于三个方面的组合:第一,独特的编程行为数据;第二,在Agent工作流上的深度RL优化;第三,从模型到IDE到协作平台的完整集成。

计算资源的10-20倍增长

Michael透露了一个关键数据:新模型的训练算力是上一代Composer的10到20倍。这个数字的含义是什么?过去,从Composer 1到Composer 2.5,Cursor使用的计算资源相对较小。许多改进模型的方法都遇到了同一个问题:能否运行更多实验?能否训练更长时间?这些问题的答案受到计算资源的限制。现在,计算资源达到了frontier级别。

实验的自由度:Cursor可以尝试更多的架构、训练方法、优化策略。他们不再需要在有限的资源下做出妥协。RL的规模:可以进行大规模的强化学习,从生产流量中持续学习。这种规模的RL训练,需要同时运行数百万个沙箱环境,让模型在其中不断试错。差异化能力:能够创造其他实验室无法创造的能力。当你有10倍的计算资源时,你就有机会做出质的飞跃。Michael强调:"这个数量级的计算增长确实让我们能够创造差异化的能力,希望很快就能把这些能力交到你们手中。"这不仅仅是一个技术进步,而是一个战略转折点。

第四部分:Origin——为Agent时代重建基础设施

Git的危机

从头训练模型只是故事的一部分。在Compile大会上,Cursor还宣布了另一个同样重磅的产品:Origin——一个为AI Agent设计的Git平台。为什么需要新的Git平台?传统的Git和GitHub是为人类开发者设计的。它们的假设是:开发者一天clone仓库几次,一天push代码几次,PR审查是异步的、人工的,冲突解决是手动的。但在Agent时代,这些假设完全崩溃了。

Cursor工程师Austin Nick Piel说得直接:人类开发者每天最多clone几次仓库、提交几次代码。但Agent可能每天要执行几千次提交。传统的PR和分支工作流不适配这种高频并行的场景。想象一下数十个Agent同时在一个代码库里疯狂修改、提交。GitHub那套基于分支的合并机制和人工代码审查流程,瞬间就会崩溃。

Origin的核心创新

Origin的设计从根本上不同。根据现场演示和参会者转述,Origin的设计目标包括自动化冲突解决、支持高频并行提交等Agent时代的需求。这代表了什么?工具不再是为人类设计的,而是为Agent设计的。其次是Stacked Diffs的集成。2025年12月,Cursor宣布达成收购Graphite的最终协议。Graphite的核心是Stacked Diffs,这是Facebook为应对海量代码提交而开发的工作流。它允许开发者创建相互依赖的PR,而不是把所有东西都塞进一个庞大的Pull Request里。在Agent时代,这个能力变得更加关键。当一个Agent需要跨越多个文件进行大规模重构时,Stacked Diffs允许它以一种有序、可追踪的方式进行。这不仅仅是技术问题,更是一个协作问题。第三是Agent-Native架构。根据官方宣传,Origin的设计目标是为Agent时代的高频并行工作流进行优化。Cursor官方将其定位为"agentic era的git forge"。这不是"GitHub加上一些Agent功能"。这是从底层重新设计的基础设施。

完整堆栈的控制

现在,Cursor控制了整个AI软件工程的价值链:

这不是一个"更好的GitHub"。这是一个为Agent时代从底到顶重新设计的整个软件工程基础设施。

第五部分:编程范式的转变

三种未来的对比

但为什么需要这样的完整堆栈?答案在于Michael对编程未来的设想里。他把目前对编程未来的看法分成三派。保守派认为未来依然是敲击键盘写代码,AI只是更快的打字机。激进派认为未来只需要对着聊天框提需求,代码完全不用看。Michael觉得这两种都不对。他描绘了一个"更奇怪"的未来:"你将拥有一个代表软件逻辑的载体,它看起来更像英文文档或伪代码。你只需要在这个高层次上进行编辑和修改,而不是去死磕那几百万行晦涩的代码。"

从精确到意图的转变

这个愿景的核心是把编程从"精确控制"变成"意图表达"。传统编程的工作流是这样的:开发者想到一个想法,用编程语言精确地表达这个想法,编译器/解释器执行这个想法。但在Agent时代,工作流可能是这样的:开发者描述一个高层的意图,Agent理解这个意图,Agent生成精确的实现,开发者审查并修改高层意图,循环回到第二步。

这个新工作流需要什么?一个真正理解编程意图的模型。这个模型需要理解高层意图、进行推理和规划、处理复杂性和抽象、与人类协作。(注:Cursor的数据使用政策明确指出,在用户启用Privacy Mode时客户数据不会用于训练;仅在用户关闭Privacy Mode或明确授权的范围内,才可能使用codebase data、prompts、editor actions等用于模型训练。)这种能力无法通过微调一个通用模型来实现。它需要从基础模型层面就进行设计和优化。这就是为什么需要从零开始训练。

第六部分:SpaceX的角色

计算资源的关键性

从零训练一个大规模模型并进行无休止的强化学习,需要顶级的计算基础设施。SpaceX通过与xAI的合作拥有Colossus超级计算机。根据xAI官方公开信息,Colossus当前拥有20万H100 GPU级别的算力,并规划扩展到100万GPU。这不仅仅是一个数字,这意味着什么?这意味着Cursor可以进行大规模的强化学习和实验。这意味着他们可以快速迭代模型。这意味着他们可以做出其他实验室无法做出的决策。

战略的完美互补

这笔交易的逻辑很清晰。Cursor通过与SpaceX/xAI的合作获得Colossus算力支持,终于可以甩开对Anthropic单一模型的依赖。而SpaceX则直接收编了全球最顶尖的AI编程团队和最活跃的开发者社区。

对Cursor而言,这意味着获得了无限的算力弹药,可以毫无顾忌地扩大RL的规模,彻底摆脱对Anthropic等底层模型厂商的依赖。对SpaceX/xAI而言,这意味着补齐了在垂直领域模型上的短板,直接向OpenAI和Anthropic的腹地发起冲击。这是一个战略上的完美互补。

第七部分:市场竞争的新格局

完整堆栈的力量

现在看市场格局。

Anthropic有强悍的模型和Claude Code,但缺乏统一的IDE入口和完整的代码协作平台。OpenAI的模型很强,但在垂直编程场景的深度整合上还在追赶。GitHub垄断了代码托管,但被传统Git工作流绑死了。Cursor在尝试把IDE、Agent、模型、协作入口放在同一个产品闭环中。这个闭环的完整性是它的优势。但需要注意的是,竞争者也在快速补齐。Anthropic有Claude Code,OpenAI有Codex,GitHub也在加强其AI功能。这不是一个已经确定的胜负,而是一场正在进行的竞争。

飞轮效应

当一个开发者在Cursor里敲下第一行代码时,飞轮就开始转动。行为数据喂给模型,模型变得更聪明,Agent处理更复杂的任务,Origin平台处理后端的代码合并。

每一个循环都让Cursor变得更强——前提是用户在授权范围内共享了行为数据。这是一个自我强化的系统。

结语:新基建的诞生

Cursor已经不再是一个工具。工具可以被轻易替换,但基础设施不行。Cursor正在从AI编辑器扩展到Agent、模型和代码协作基础设施。这个战略方向已经很清楚。无论细节如何演变,他们在为一个新的编程时代铺设基础设施。未来的编程,不再是几家编辑器或几个大模型的单打独斗,而是完整生态系统的降维打击。Cursor,正在铺设这条通向未来的铁轨。