Cursor的终局游戏：从IDE到基础设施的完整堆栈

2026年6月16日，SpaceX签署协议收购Cursor母公司Anysphere，交易隐含估值600亿美元，预计第三季度完成。几乎同一时刻，Cursor在首届用户大会Compile上推出Origin平台，并宣布自研新模型的路线。这两件事的时间巧合不是偶然。Cursor正在从"AI代码编辑器"扩展成为一个完整的软件工程生态。从底层的基础模型，到中间的Agent工作流，再到顶层的开发环境和代码协作平台，他们在尝试把整个价值链握在手里。要理解这个转变的真实含义，我们需要看清楚：Cursor到底在推翻什么。

第一部分：从工具到基础设施的转变

IDE的黄昏

2023年初，Cursor刚面世时的定位很谦卑：一个"更聪明的VS Code"。三年过去，事情起了变化。根据Cursor总裁Oskar Schulz的说法，95%的用户现在把Cursor当成Agent在使用。这不仅仅是一个数字变化，它标志着一个根本性的产品转变。

从2024年到2025年，开发社区经历了一次集体顿悟。代码补全能让你少敲几下键盘，但天花板太低。你依然是执行者，AI只是打字员。但当你给AI足够的权限和上下文，它就不再只是补全代码。它理解意图、规划步骤、执行重构、验证结果。这就是Agent的本质。这个转变推倒了第一张多米诺骨牌。

平台依赖的诅咒

向Agent转型让Cursor获得爆发式增长，但也暴露了它的软肋：它太依赖Anthropic了。根据Business Insider，知情员工表示Cursor早期贡献了Anthropic近一半的收入。这是一种极度危险的共生关系。当一家公司的收入来源中有40%-50%来自单一客户，这个客户同时又是你的竞争对手，风险就变成了现实。Claude Code于2025年2月以research preview亮相，2025年5月面向公众开放。这款工具凭借出色的Agent能力迅速在开发者中蔓延。到2026年2月，其年化收入已超过25亿美元。这不是一个缓慢的市场侵蚀，而是一场快速的市场重新洗牌。

与此同时，Cursor面临的压力越来越大。根据JetBrains的开发者调查，Cursor的增速明显放缓，Claude Code与Cursor在工作场景采用率上均为18%，快速追平。2026年1月5日，Truell召开紧急全体会议。他向团队强调，Cursor必须拥有自己的AI模型，以避免被前沿模型厂商甩开。这个决定标志着Cursor正式放弃"套壳IDE"的身份，决定亲自下场做基础设施。这不是一个战术调整，而是一个战略转向。

第二部分：为什么要从零开始？

通用模型的局限性

在这个节骨眼上，Cursor面临一个艰难的选择：是拿开源模型继续微调，还是从零训练？微调更省钱、更快速。但Michael在Compile大会上说得很清楚：从零训练能让他们完全掌控模型行为，精准覆盖开发者真正需要的工作负载。这不是公关辞令，而是技术现实。

独家数据的壁垒

Cursor手里握着一张王牌：大量的开发者交互数据。这些数据包含什么？不仅仅是最终的代码，还有修改、拒绝、调试的完整过程。当一个开发者拒绝AI生成的代码并进行修改时，这个动作本身就是一个极具价值的训练信号。它告诉模型："你刚才的思路是错的，这才是人类想要的解法。"这种包含完整试错循环的动态数据，在GitHub上根本爬不到。GitHub只有最终的成品，没有思考的过程。

华尔街投资者Gavin Baker说得直白：除了Anthropic，Cursor拥有比世界上任何其他实验室更多的"专有代码训练数据"。这些数据如何被使用涉及数据政策问题，但毫无疑问，这是Cursor相比其他模型厂商的一个独特优势。

摆脱通用模型的枷锁

如果只是微调，你就得忍受开源模型的设计缺陷。分词方式、架构选择、注意力机制——这些都是为通用对话优化的，不适合高强度的代码库分析和Agent工作流。从零开始，Cursor能问出真正关键的问题：什么架构最适合理解跨文件的代码逻辑？如何设计才能让模型在处理几十万行代码时保持敏锐？如何优化Token化以最大化代码理解能力？他们不再需要在为聊天设计的模型上打补丁。

突破代码生成的边界

Michael的野心不止于此。新模型要具备"通用的工程智能"，而不仅仅是会写代码。一个真正的工程智能体需要什么？它得会规划系统架构、看懂复杂的报错日志、写测试用例、查数据库状态。它需要理解业务需求，而不仅仅是代码语法。微调通用大模型根本喂不出这种工程直觉。

这种能力需要从基础模型层面就进行设计。这就是为什么Cursor选择了从零开始。

第三部分：1.5T参数的真实含义

新模型的规模

根据现场信息，Cursor正在训练一个约1.5T参数的新模型。这个模型从零开始训练，使用了大规模GPU集群。新模型的训练算力是上一代Composer的10到20倍。这里我要说明一下作者的视角：这些细节目前主要来自现场转述和媒体报道。Cursor官方的完整技术文档还未公开。但基于已有的信息，我们可以推断出Cursor的战略意图很清晰——他们在投入frontier级别的计算资源来构建一个专为工程任务优化的模型。

参数规模的真实含义

有一个常见的误解需要澄清。1.5T参数听起来很大，但参数规模本身不是决定模型能力的唯一因素。社交媒体上有各种关于其他模型参数规模的猜测，但闭源模型的具体参数量通常不会被官方公开。这些猜测可能有一定的参考价值，但不应该作为权威出处。真正重要的是什么？是数据、是强化学习、是集成。Cursor的竞争优势在于三个方面的组合：第一，独特的编程行为数据；第二，在Agent工作流上的深度RL优化；第三，从模型到IDE到协作平台的完整集成。

计算资源的10-20倍增长

Michael透露了一个关键数据：新模型的训练算力是上一代Composer的10到20倍。这个数字的含义是什么？过去，从Composer 1到Composer 2.5，Cursor使用的计算资源相对较小。许多改进模型的方法都遇到了同一个问题：能否运行更多实验？能否训练更长时间？这些问题的答案受到计算资源的限制。现在，计算资源达到了frontier级别。

实验的自由度：Cursor可以尝试更多的架构、训练方法、优化策略。他们不再需要在有限的资源下做出妥协。RL的规模：可以进行大规模的强化学习，从生产流量中持续学习。这种规模的RL训练，需要同时运行数百万个沙箱环境，让模型在其中不断试错。差异化能力：能够创造其他实验室无法创造的能力。当你有10倍的计算资源时，你就有机会做出质的飞跃。Michael强调："这个数量级的计算增长确实让我们能够创造差异化的能力，希望很快就能把这些能力交到你们手中。"这不仅仅是一个技术进步，而是一个战略转折点。

第四部分：Origin——为Agent时代重建基础设施

Git的危机

从头训练模型只是故事的一部分。在Compile大会上，Cursor还宣布了另一个同样重磅的产品：Origin——一个为AI Agent设计的Git平台。为什么需要新的Git平台？传统的Git和GitHub是为人类开发者设计的。它们的假设是：开发者一天clone仓库几次，一天push代码几次，PR审查是异步的、人工的，冲突解决是手动的。但在Agent时代，这些假设完全崩溃了。

Cursor工程师Austin Nick Piel说得直接：人类开发者每天最多clone几次仓库、提交几次代码。但Agent可能每天要执行几千次提交。传统的PR和分支工作流不适配这种高频并行的场景。想象一下数十个Agent同时在一个代码库里疯狂修改、提交。GitHub那套基于分支的合并机制和人工代码审查流程，瞬间就会崩溃。

Origin的核心创新

Origin的设计从根本上不同。根据现场演示和参会者转述，Origin的设计目标包括自动化冲突解决、支持高频并行提交等Agent时代的需求。这代表了什么？工具不再是为人类设计的，而是为Agent设计的。其次是Stacked Diffs的集成。2025年12月，Cursor宣布达成收购Graphite的最终协议。Graphite的核心是Stacked Diffs，这是Facebook为应对海量代码提交而开发的工作流。它允许开发者创建相互依赖的PR，而不是把所有东西都塞进一个庞大的Pull Request里。在Agent时代，这个能力变得更加关键。当一个Agent需要跨越多个文件进行大规模重构时，Stacked Diffs允许它以一种有序、可追踪的方式进行。这不仅仅是技术问题，更是一个协作问题。第三是Agent-Native架构。根据官方宣传，Origin的设计目标是为Agent时代的高频并行工作流进行优化。Cursor官方将其定位为"agentic era的git forge"。这不是"GitHub加上一些Agent功能"。这是从底层重新设计的基础设施。

完整堆栈的控制

现在，Cursor控制了整个AI软件工程的价值链：

这不是一个"更好的GitHub"。这是一个为Agent时代从底到顶重新设计的整个软件工程基础设施。

第五部分：编程范式的转变

三种未来的对比

但为什么需要这样的完整堆栈？答案在于Michael对编程未来的设想里。他把目前对编程未来的看法分成三派。保守派认为未来依然是敲击键盘写代码，AI只是更快的打字机。激进派认为未来只需要对着聊天框提需求，代码完全不用看。Michael觉得这两种都不对。他描绘了一个"更奇怪"的未来："你将拥有一个代表软件逻辑的载体，它看起来更像英文文档或伪代码。你只需要在这个高层次上进行编辑和修改，而不是去死磕那几百万行晦涩的代码。"

从精确到意图的转变

这个愿景的核心是把编程从"精确控制"变成"意图表达"。传统编程的工作流是这样的：开发者想到一个想法，用编程语言精确地表达这个想法，编译器/解释器执行这个想法。但在Agent时代，工作流可能是这样的：开发者描述一个高层的意图，Agent理解这个意图，Agent生成精确的实现，开发者审查并修改高层意图，循环回到第二步。

这个新工作流需要什么？一个真正理解编程意图的模型。这个模型需要理解高层意图、进行推理和规划、处理复杂性和抽象、与人类协作。（注：Cursor的数据使用政策明确指出，在用户启用Privacy Mode时客户数据不会用于训练；仅在用户关闭Privacy Mode或明确授权的范围内，才可能使用codebase data、prompts、editor actions等用于模型训练。）这种能力无法通过微调一个通用模型来实现。它需要从基础模型层面就进行设计和优化。这就是为什么需要从零开始训练。

第六部分：SpaceX的角色

计算资源的关键性

从零训练一个大规模模型并进行无休止的强化学习，需要顶级的计算基础设施。SpaceX通过与xAI的合作拥有Colossus超级计算机。根据xAI官方公开信息，Colossus当前拥有20万H100 GPU级别的算力，并规划扩展到100万GPU。这不仅仅是一个数字，这意味着什么？这意味着Cursor可以进行大规模的强化学习和实验。这意味着他们可以快速迭代模型。这意味着他们可以做出其他实验室无法做出的决策。

战略的完美互补

这笔交易的逻辑很清晰。Cursor通过与SpaceX/xAI的合作获得Colossus算力支持，终于可以甩开对Anthropic单一模型的依赖。而SpaceX则直接收编了全球最顶尖的AI编程团队和最活跃的开发者社区。

对Cursor而言，这意味着获得了无限的算力弹药，可以毫无顾忌地扩大RL的规模，彻底摆脱对Anthropic等底层模型厂商的依赖。对SpaceX/xAI而言，这意味着补齐了在垂直领域模型上的短板，直接向OpenAI和Anthropic的腹地发起冲击。这是一个战略上的完美互补。

第七部分：市场竞争的新格局

完整堆栈的力量

现在看市场格局。

Anthropic有强悍的模型和Claude Code，但缺乏统一的IDE入口和完整的代码协作平台。OpenAI的模型很强，但在垂直编程场景的深度整合上还在追赶。GitHub垄断了代码托管，但被传统Git工作流绑死了。Cursor在尝试把IDE、Agent、模型、协作入口放在同一个产品闭环中。这个闭环的完整性是它的优势。但需要注意的是，竞争者也在快速补齐。Anthropic有Claude Code，OpenAI有Codex，GitHub也在加强其AI功能。这不是一个已经确定的胜负，而是一场正在进行的竞争。

飞轮效应

当一个开发者在Cursor里敲下第一行代码时，飞轮就开始转动。行为数据喂给模型，模型变得更聪明，Agent处理更复杂的任务，Origin平台处理后端的代码合并。

每一个循环都让Cursor变得更强——前提是用户在授权范围内共享了行为数据。这是一个自我强化的系统。

结语：新基建的诞生

Cursor已经不再是一个工具。工具可以被轻易替换，但基础设施不行。Cursor正在从AI编辑器扩展到Agent、模型和代码协作基础设施。这个战略方向已经很清楚。无论细节如何演变，他们在为一个新的编程时代铺设基础设施。未来的编程，不再是几家编辑器或几个大模型的单打独斗，而是完整生态系统的降维打击。Cursor，正在铺设这条通向未来的铁轨。