编程新王Composer 2.5来了新智元
基于Kimi 2.5的Cursor新版Composer 2.5来了,狂飙10倍效率,百万Token只要2.5美元! 最惊人的是,它在RL训练里嫌任务太难,竟然学会了逆向缓存、反编译字节码去「作弊钻空子」…… 大规模强化学习的潘多拉魔盒已被打开,AI黑客成精了。
今天,AI编程领域的强势玩家——Cursor,毫无预兆地推出了一位强悍选手。
官方正式宣布,全新升级的AI编程模型Composer 2.5正式上线!
基准测试显示,Composer 2.5在部分编程基准测试上的表现,已经非常接近Claude 4.7 Opus和GPT-5.5。
这是一场从底层训练架构、工程效率到商业定价的全面颠覆。
官方数据显示,Composer 2.5在长任务持续性和复杂指令遵循上实现了显著突破,实际运行效率竟然比当前市面上的主流竞品高出整整10倍!
更让人感到震撼的是,伴随着这次升级,大规模强化学习的潘多拉魔盒似乎被打开了。
在训练过程中,这个AI模型竟然学会了「作弊」和「钻空子」——为了完成任务,它不仅自主逆向了Python的缓存格式,甚至还学会了去反编译Java字节码!
在官方X上,Cursor承认,Composer 2.5是基于Kimi K2.5构建的。
所以,Cursor究竟用了什么黑魔法?
性能掀翻天花板
10倍效率与硬刚GPT-5.5的底气
在AI编程赛道,很多开发者最头疼的痛点就是后劲不足。
很多模型在写个十几行的简单函数时表现得像个天才,但只要把它扔进一个数十万行代码的大型真实项目里,它就会开始胡言乱语。
而Composer 2.5,就是为了终结这个痛点而生的!
长任务与复杂指令的性能王者
根据Cursor官方的说法,Composer 2.5是他们迄今为止最强大的模型。相较于前代,它在智能水平、长周期任务的持续工作能力,以及复杂指令的依从性上,都实现了跨越式的提升。
在长达数天或涉及数万个Token的长轨迹开发场景中,Composer 2.5表现出了令人惊叹的稳定性。
它不再是一个只会对单次Prompt做出反应的复读机,而变成了一个能够真正理解上下文演变的「资深全栈工程师」。
它的运行效率与资源占用表现均远优于当前的主流AI编程工具,运行效率最高提升了10倍。
这意味着,以前需要开发者反复调试、等待数分钟的大型项目代码迭代,现在在秒级内就能得到更精准的反馈。
百万Token仅2.5美元:极致的工程性价比
如果说性能让人兴奋,那么它的价格则让整个行业感到震撼!
Composer 2.5 定价白皮书:
- 标准版: 每百万(1M)输入Token仅需0.50美元,每百万(1M)输出Token仅需2.50美元。
- Fast变体版: 智能水平相同但速度极快,价格为每百万输入Token 3.00美元,每百万输出Token 15.00美元。
Composer 2.5在部分编程基准测试上已经接近Claude 4.7 Opus和GPT-5.5,然而,它的成本却仅仅是它们的一小部分!
这揭示了一个残酷而关键的行业新趋势:未来的AI编程竞争,就是看谁能用更低的成本,打出更强、更极致的实际工程体验。
最后Cursor更是不讲武德地宣布:在发布后的第一周,平台将直接双倍赠送所有用户的免费使用额度!
这一波降维打击,无疑将大大降低开发者的试用门槛。
底层黑魔法之一
定向文本反馈RL,解决「信用分配」百年难题
为什么Composer 2.5能变得这么聪明且稳定?这得归功于Cursor在强化学习训练上引入的全新机制。


