重磅发现：AI已开始自我进化快科技

"6月5日，Anthropic发布题为《When AI Builds Itself》的重磅论文，指出当前AI已出现自我进化、自我构建的迹象，提及“递归自我提升”概念，即AI未来可能完全自主设计开发自身继任者。

论文披露，截至2026年5月，Claude已承担Anthropic代码库中超过80%的合并代码编写工作，其在代码生产、AI相关研究环节的能力正快速提升。

当地时间5月28日，Anthropic宣布完成H轮650亿美元融资，投后估值达9650亿美元，成为全球估值最高的AI创企。该公司呼吁全球前沿AI实验室协同暂停前沿人工智能发展，为社会结构与对齐研究留出跟进时间。"

快科技6月5日消息，AI已经开始有自我进化和自我构建的迹象了！

这一大胆判断，是刚刚Anthropic在最新的一篇重磅论文《When AI Builds Itself》中提出的。文章提到，如果这一趋势持续发展并获得足够算力支撑，最终将指向能够完全自主设计和开发自身继任者的人工智能系统，这被称为 "递归自我提升"。

“我们还没到那个阶段，递归式自我提升也不是必然的。但这可能比大多数机构准备得更早到来。”

Anthropic呼吁，世界能够选择放缓或暂时暂停前沿人工智能的发展，以便社会结构和对齐研究跟上技术进步，将是件好事。

同时，Anthropic宣布："Anthropic研究所将与外部利益相关者合作，开展研究，深入思考日益强大、可能自我改进的系统所带来的影响，以及如何让世界有能力对这项技术的未来发展做出深思熟虑的选择。"

尽管Anthropic官方X账号上补充澄清："这一切都不能保证递归自我提升即将到来。目前尚不清楚Claude是否具备研究判断力 ---- 即选择正确问题去解决的能力。但如果这些趋势继续下去，AI系统设计和构建自己的继任者是合理的。这可能会在医学、技术、经济等方面为社会带来革命性的改善，但也可能加剧对齐问题，最终导致失控。"

但论文中披露的一系列数据和事实，还是让整个科技界感到了前所未有的震撼。因为这篇论文不是在预测遥远的未来，而是在描述正在发生的现实。

顺便提一嘴，当地时间5月28日，Anthropic宣布完成H轮650亿美元融资，投后估值达9650亿美元，一举超越OpenAI 8520亿美元的估值，成为全球估值最高的AI创企。

作为当下全球AI行业双寡头之一、企业级大模型领域龙头，Anthropic在商用大模型、代码AI赛道份额稳居行业前列，也是全球前沿通用AI与AI安全规则的核心制定方，其技术结论与行业表态常年左右全球AI研发风向。

80%的Claude代码，已经是Claude自己写的

据Anthropic官方披露，截至2026年5月，Anthropic代码库中超过80%的合并代码，都是由Claude自己编写的。

要知道，就在一年多以前的2025年2月，Claude Code还只是一个研究预览版，当时这个数字还停留在个位数。

短短15个月，AI 就从一个偶尔提提建议的助手，变成了代码生产的绝对主力。

这种转变直接体现在了工程师的生产力上。论文显示，在Anthropic成立的前四年（2021-2024年），每位工程师每天的代码行数基本保持不变。

但从2025年开始，这条曲线突然向上拐了，当Claude不再只是建议代码让工程师复制粘贴，而是能够直接运行代码时，生产力开始爆发。到了2026年第二季度，这个斜率变得更加陡峭，普通工程师每天合并的代码量已经是2024年的8倍。

当然，Anthropic也坦诚，代码行数是一个不完美的衡量标准，它只看数量不看质量，8倍的数字很可能高估了真实的生产力提升。

2026年3月对130名研究团队员工的调查显示，中位数受访者估计使用Mythos Preview后，自身产出约为不使用任何AI工具时的4倍。但即便如此，这也是一个革命性的变化。现在的工程师，已经不再是主要的代码编写者，而是变成了代码的指导者和审核者。

更可怕的是，Claude写的代码质量还在飞速提升。多数内部员工认为，2025年底Claude编写的代码质量仍逊于人类工程师，但到了今天，两者已经基本持平。Anthropic预测，不出一年，Claude写的代码质量就会全面超过人类。

这已经不是理论了，而是正在发生的事实。有Anthropic员工在内部表示：

"我大约一年前开始全力使用Claude，这是一段疯狂的经历，现在我已经有5个月没有自己写过一行代码了。"

Claude不仅能写代码，还能大规模修复人类遗留的问题。

2026年4月，Claude一次性提交了800多个修复，将一类长期存在的API错误减少了1000倍。负责监督的工程师估计，人类完成同等工作量需要整整四年。甚至在代码审查环节，Claude也已经超越了人类，自动审查系统可以发现人类工程师漏掉的约1/3会导致生产事故的bug。

在最开放、无明确规范的复杂工程任务上，Claude 的成功率在2026年5月达到了 76%，较六个月前提升了50个百分点。一个典型案例是，一次常规升级导致数万个训练任务崩溃，工程师只给了Claude一些文本内容和集群访问权限，它就自主排查出了一个极其隐蔽的调试标志问题，重现并修复了故障，整个过程只用了两个小时，而人类通常需要两到三天。

AI已经开始做AI研究了

如果说写代码还只是 "体力活"，那么做研究就是 AI 真正开始挑战人类智力边界的标志。

事实上，AI能力的增长速度本身就在加速。论文显示，AI 能够可靠完成的任务时长，从最初每7个月翻一番，提升到了现在每4个月翻一番。2024年3月，Claude Opus 3只能完成人类约4分钟的工作。一年后，Claude Sonnet 3.7可以完成1.5小时的任务。又过了一年，Claude Opus 4.6已经能连续工作12小时。

按此趋势，2026年内AI就能完成需要人类数天的工作，2027年将能完成数周的任务。

这种能力提升在研究领域表现得尤为明显。论文中披露了一个惊人的实验，Anthropic 给Claude一段训练小型AI模型的代码，让它在保证正确性的前提下尽可能提速。2025年5月，Claude Opus 4平均能实现3倍的速度提升；仅仅11个月后，Claude Mythos Preview就能实现52倍的速度提升。作为对比，一个熟练的人类研究员需要4到8小时才能达到4倍的速度。

在 "执行明确指定的实验" 这个环节，Claude 已经在不到一年的时间里，从 "非常有用" 变成了 "超越人类"。

更令人不安的是，Claude已经开始能够独立设计实验了。今年4月，Anthropic展示了Claude端到端完成一个开放研究项目的能力。研究人员给了Claude一个 AI 安全领域的开放问题："较弱的模型能否可靠地监督较强的模型？"，然后就放手让它自己去解决。