编程新王Composer 2.5来了新智元

基于Kimi 2.5的Cursor新版Composer 2.5来了，狂飙10倍效率，百万Token只要2.5美元！最惊人的是，它在RL训练里嫌任务太难，竟然学会了逆向缓存、反编译字节码去「作弊钻空子」…… 大规模强化学习的潘多拉魔盒已被打开，AI黑客成精了。

今天，AI编程领域的强势玩家——Cursor，毫无预兆地推出了一位强悍选手。

官方正式宣布，全新升级的AI编程模型Composer 2.5正式上线！

基准测试显示，Composer 2.5在部分编程基准测试上的表现，已经非常接近Claude 4.7 Opus和GPT-5.5。

这是一场从底层训练架构、工程效率到商业定价的全面颠覆。

官方数据显示，Composer 2.5在长任务持续性和复杂指令遵循上实现了显著突破，实际运行效率竟然比当前市面上的主流竞品高出整整10倍！

更让人感到震撼的是，伴随着这次升级，大规模强化学习的潘多拉魔盒似乎被打开了。

在训练过程中，这个AI模型竟然学会了「作弊」和「钻空子」——为了完成任务，它不仅自主逆向了Python的缓存格式，甚至还学会了去反编译Java字节码！

在官方X上，Cursor承认，Composer 2.5是基于Kimi K2.5构建的。

所以，Cursor究竟用了什么黑魔法？

性能掀翻天花板

10倍效率与硬刚GPT-5.5的底气

在AI编程赛道，很多开发者最头疼的痛点就是后劲不足。

很多模型在写个十几行的简单函数时表现得像个天才，但只要把它扔进一个数十万行代码的大型真实项目里，它就会开始胡言乱语。

而Composer 2.5，就是为了终结这个痛点而生的！

长任务与复杂指令的性能王者

根据Cursor官方的说法，Composer 2.5是他们迄今为止最强大的模型。相较于前代，它在智能水平、长周期任务的持续工作能力，以及复杂指令的依从性上，都实现了跨越式的提升。

在长达数天或涉及数万个Token的长轨迹开发场景中，Composer 2.5表现出了令人惊叹的稳定性。

它不再是一个只会对单次Prompt做出反应的复读机，而变成了一个能够真正理解上下文演变的「资深全栈工程师」。

它的运行效率与资源占用表现均远优于当前的主流AI编程工具，运行效率最高提升了10倍。

这意味着，以前需要开发者反复调试、等待数分钟的大型项目代码迭代，现在在秒级内就能得到更精准的反馈。

百万Token仅2.5美元：极致的工程性价比

如果说性能让人兴奋，那么它的价格则让整个行业感到震撼！

Composer 2.5 定价白皮书：

- 标准版：每百万（1M）输入Token仅需0.50美元，每百万（1M）输出Token仅需2.50美元。

- Fast变体版：智能水平相同但速度极快，价格为每百万输入Token 3.00美元，每百万输出Token 15.00美元。

Composer 2.5在部分编程基准测试上已经接近Claude 4.7 Opus和GPT-5.5，然而，它的成本却仅仅是它们的一小部分！

这揭示了一个残酷而关键的行业新趋势：未来的AI编程竞争，就是看谁能用更低的成本，打出更强、更极致的实际工程体验。

最后Cursor更是不讲武德地宣布：在发布后的第一周，平台将直接双倍赠送所有用户的免费使用额度！

这一波降维打击，无疑将大大降低开发者的试用门槛。

底层黑魔法之一

定向文本反馈RL，解决「信用分配」百年难题

为什么Composer 2.5能变得这么聪明且稳定？这得归功于Cursor在强化学习训练上引入的全新机制。