重磅发现:AI已开始自我进化快科技
"6月5日,Anthropic发布题为《When AI Builds Itself》的重磅论文,指出当前AI已出现自我进化、自我构建的迹象,提及“递归自我提升”概念,即AI未来可能完全自主设计开发自身继任者。
论文披露,截至2026年5月,Claude已承担Anthropic代码库中超过80%的合并代码编写工作,其在代码生产、AI相关研究环节的能力正快速提升。
当地时间5月28日,Anthropic宣布完成H轮650亿美元融资,投后估值达9650亿美元,成为全球估值最高的AI创企。该公司呼吁全球前沿AI实验室协同暂停前沿人工智能发展,为社会结构与对齐研究留出跟进时间。"
快科技6月5日消息,AI已经开始有自我进化和自我构建的迹象了!
这一大胆判断,是刚刚Anthropic在最新的一篇重磅论文《When AI Builds Itself》中提出的。文章提到,如果这一趋势持续发展并获得足够算力支撑,最终将指向能够完全自主设计和开发自身继任者的人工智能系统,这被称为 "递归自我提升"。
“我们还没到那个阶段,递归式自我提升也不是必然的。但这可能比大多数机构准备得更早到来。”
Anthropic呼吁,世界能够选择放缓或暂时暂停前沿人工智能的发展,以便社会结构和对齐研究跟上技术进步,将是件好事。
同时,Anthropic宣布:"Anthropic研究所将与外部利益相关者合作,开展研究,深入思考日益强大、可能自我改进的系统所带来的影响,以及如何让世界有能力对这项技术的未来发展做出深思熟虑的选择。"
尽管Anthropic官方X账号上补充澄清:"这一切都不能保证递归自我提升即将到来。目前尚不清楚Claude是否具备研究判断力 ---- 即选择正确问题去解决的能力。但如果这些趋势继续下去,AI系统设计和构建自己的继任者是合理的。这可能会在医学、技术、经济等方面为社会带来革命性的改善,但也可能加剧对齐问题,最终导致失控。"
但论文中披露的一系列数据和事实,还是让整个科技界感到了前所未有的震撼。因为这篇论文不是在预测遥远的未来,而是在描述正在发生的现实。
顺便提一嘴,当地时间5月28日,Anthropic宣布完成H轮650亿美元融资,投后估值达9650亿美元,一举超越OpenAI 8520亿美元的估值,成为全球估值最高的AI创企。
作为当下全球AI行业双寡头之一、企业级大模型领域龙头,Anthropic在商用大模型、代码AI赛道份额稳居行业前列,也是全球前沿通用AI与AI安全规则的核心制定方,其技术结论与行业表态常年左右全球AI研发风向。
80%的Claude代码,已经是Claude自己写的
据Anthropic官方披露,截至2026年5月,Anthropic代码库中超过80%的合并代码,都是由Claude自己编写的。
要知道,就在一年多以前的2025年2月,Claude Code还只是一个研究预览版,当时这个数字还停留在个位数。
短短15个月,AI 就从一个偶尔提提建议的助手,变成了代码生产的绝对主力。
这种转变直接体现在了工程师的生产力上。论文显示,在Anthropic成立的前四年(2021-2024年),每位工程师每天的代码行数基本保持不变。
但从2025年开始,这条曲线突然向上拐了,当Claude不再只是建议代码让工程师复制粘贴,而是能够直接运行代码时,生产力开始爆发。到了2026年第二季度,这个斜率变得更加陡峭,普通工程师每天合并的代码量已经是2024年的8倍。
当然,Anthropic也坦诚,代码行数是一个不完美的衡量标准,它只看数量不看质量,8倍的数字很可能高估了真实的生产力提升。
2026年3月对130名研究团队员工的调查显示,中位数受访者估计使用Mythos Preview后,自身产出约为不使用任何AI工具时的4倍。但即便如此,这也是一个革命性的变化。现在的工程师,已经不再是主要的代码编写者,而是变成了代码的指导者和审核者。
更可怕的是,Claude写的代码质量还在飞速提升。多数内部员工认为,2025年底Claude编写的代码质量仍逊于人类工程师,但到了今天,两者已经基本持平。Anthropic预测,不出一年,Claude写的代码质量就会全面超过人类。
这已经不是理论了,而是正在发生的事实。有Anthropic员工在内部表示:
"我大约一年前开始全力使用Claude,这是一段疯狂的经历,现在我已经有5个月没有自己写过一行代码了。"
Claude不仅能写代码,还能大规模修复人类遗留的问题。
2026年4月,Claude一次性提交了800多个修复,将一类长期存在的API错误减少了1000倍。负责监督的工程师估计,人类完成同等工作量需要整整四年。甚至在代码审查环节,Claude也已经超越了人类,自动审查系统可以发现人类工程师漏掉的约1/3会导致生产事故的bug。
在最开放、无明确规范的复杂工程任务上,Claude 的成功率在2026年5月达到了 76%,较六个月前提升了50个百分点。一个典型案例是,一次常规升级导致数万个训练任务崩溃,工程师只给了Claude一些文本内容和集群访问权限,它就自主排查出了一个极其隐蔽的调试标志问题,重现并修复了故障,整个过程只用了两个小时,而人类通常需要两到三天。
AI已经开始做AI研究了
如果说写代码还只是 "体力活",那么做研究就是 AI 真正开始挑战人类智力边界的标志。
事实上,AI能力的增长速度本身就在加速。论文显示,AI 能够可靠完成的任务时长,从最初每7个月翻一番,提升到了现在每4个月翻一番。2024年3月,Claude Opus 3只能完成人类约4分钟的工作。一年后,Claude Sonnet 3.7可以完成1.5小时的任务。又过了一年,Claude Opus 4.6已经能连续工作12小时。
按此趋势,2026年内AI就能完成需要人类数天的工作,2027年将能完成数周的任务。
这种能力提升在研究领域表现得尤为明显。论文中披露了一个惊人的实验,Anthropic 给Claude一段训练小型AI模型的代码,让它在保证正确性的前提下尽可能提速。2025年5月,Claude Opus 4平均能实现3倍的速度提升;仅仅11个月后,Claude Mythos Preview就能实现52倍的速度提升。作为对比,一个熟练的人类研究员需要4到8小时才能达到4倍的速度。
在 "执行明确指定的实验" 这个环节,Claude 已经在不到一年的时间里,从 "非常有用" 变成了 "超越人类"。
更令人不安的是,Claude已经开始能够独立设计实验了。今年4月,Anthropic展示了Claude端到端完成一个开放研究项目的能力。研究人员给了Claude一个 AI 安全领域的开放问题:"较弱的模型能否可靠地监督较强的模型?",然后就放手让它自己去解决。


