Cursor自研新模型反超Opus 4.6华尔街日报

3/20/2026

Cursor发布新模型Composer 2,宣称性能超Opus 4.6且价格大降,却迅速被曝底层基座实为月之暗面Kimi K2.5,引发马斯克及网友“套壳”群嘲。Cursor创始人随后致歉承认未标明基座,但强调进行了大量强化学习;月之暗面则回应确认系合规授权合作并表祝贺。

AI编程工具Cursor高调发布自研模型Composer 2,宣称性能超越Claude Opus 4.6且价格大幅压低,却在不到3小时内遭开发者揭穿——其底层基座正是中国月之暗面的开源模型Kimi K2.5。

这场"自研"风波迅速席卷AI社区,马斯克亲自下场认证,最终以Cursor联合创始人公开致歉、Kimi官方发文祝贺收场。

3月21日,据硬AI消息,Cursor联合创始人Aman Sanger在事件发酵后发文承认,"没有在博客中从一开始就提及Kimi基础模型是我们的疏漏,会在下一个模型中修正这一点。"

月之暗面官方账号随即回应:"恭喜Cursor推出Composer 2,很骄傲看到Kimi K2.5成为基础模型,这就是我们喜欢的开源生态。"月之暗面同时澄清,Cursor系通过Fireworks AI托管的强化学习与推理平台访问Kimi K2.5,属于授权商业合作。

性能超越Opus 4.6,价格"脚踝斩"

Cursor本周五正式上线Composer 2,并在发布博客中宣称,该模型在其衡量的所有基准测试上均取得大幅提升,包括Terminal-Bench 2.0和SWE-bench Multilingual。

在衡量智能体终端操作能力的Terminal-Bench 2.0上,Composer 2的表现位于GPT-5.4和Claude Opus 4.6之间,在CursorBench基准上的性价比表现则明显超过上述两款模型。

定价是Cursor此次发布的核心卖点。标准版Composer 2的输入价格为0.5美元/百万tokens、输出价格为2.5美元/百万tokens,与Claude Opus 4.6相比几乎是"脚踝斩"级别的降幅。

Cursor同步推出速度更快的变体Composer 2 Fast,定价为每百万输入tokens 1.5美元、每百万输出tokens 7.5美元,在延续价格优势的同时主打响应速度。

Cursor将这一性价比突破归因于一种新的强化学习方法,并强调这是"实实在在训练出来的能力,而非推理技巧"。

发布不到3小时,底层基座遭曝光

然而,Composer 2的高光时刻极为短暂。发布后不到3小时,X平台用户@fynnso发现该模型的模型ID显示为kimi-k2p5-rl-0317-s515-fast,随即得出结论:"Composer 2其实就是经过强化学习的Kimi K2.5。"

这一发现迅速在X和Hacker News等技术社区扩散,梗图与讨论齐飞。马斯克亦在@fynnso的帖子下直接回复"Yeah, it's Kimi 2.5",进一步放大了话题热度。

Reddit社区r/singularity的讨论同样热烈。有用户评论称:"最搞笑的是,大家还在夸Composer 2是巨大飞跃,结果全程用的是别人的模型。这让人不禁想,有多少所谓'专有模型'其实只是套了个logo的开源微调版。"

也有观点认为,Cursor的真正护城河在于其从大量开发者使用中积累的任务解决数据,而非预训练本身,"每个投资人都知道他们没有在做自己的基础模型,他们本应从一开始就坦诚说明。"

Cursor致歉,Kimi确认授权合作

面对舆论压力,Cursor团队做出正面回应。

Aman Sanger公开确认,团队对多个基座模型进行了困惑度评测,Kimi K2.5"证明是最强的",随后在此基础上叠加了持续预训练和4倍规模的高算力强化学习,并通过Fireworks AI的推理与RL采样器进行部署。

Cursor开发者教育副总裁Lee Robinson补充披露了更多技术细节:最终模型中来自基座的算力约占1/4,其余3/4来自Cursor自身训练。

Robinson同时表示,虽然Composer 2基于开源模型开发,但未来团队也会进行完整的预训练。

月之暗面官方随后明确表态,强调此次合作符合许可证要求,属于授权商业合作,并对Cursor发布Composer 2表示祝贺。

至此,这场争议的法律与授权层面基本厘清,但Cursor在发布时刻意回避底座信息的做法,在开发者社区仍留有余波。

Scroll for more