卡帕西开源Agent自进化训练框架:5分钟一轮量子位

3/10/2026

大神 Karpathy 又开源了新项目 —— 一个能够自主进化的 AI 科研循环系统。

这个项目名叫 autoresearch,主打让智能体完全自主地搞科研,只要在 Markdown 文档里写好指令,剩下的流程全都由 AI 自动完成。

而且整个框架十分精简,一共只有 630 行代码,单个 GPU 就能跑得动。

它每 5 分钟就会跑一轮测试,并根据验证结果决定是保留还是丢弃改动,就像一个 24 小时从不休息且能自我进化的虚拟研究员。

Karpathy 还希望,未来能让成千上万个智能体在海量分支里异步协作,不再受限于单一的 master 分支,从而通过群体智慧实现科研效率的爆发。

发布才不到两天,autoresearch 斩获的星标数就已经超过了 9.5k。

在 X 上,Karpathy 的帖子也有 580 多万次围观。

Shopify CEO 看了 Karpathy 的项目之后表示膜拜,直言这个项目实在是太疯狂了。

5 分钟自动化实验

autoresearch 这个项目的思路非常简单,就是把 AI 训练的循环试错自动化。

AI 自己修改代码、跑 5 分钟的短实验、看效果好不好再决定下一步怎么走。

基于 nanochat 模型训练核心,定了两条铁律:

一是每次实验的纯训练时间固定为 5 分钟,避免因为不同改动下的训练时长不同而影响结果;

二是只看 val_bpb,这个指标的数值越低,就代表模型效果越好,而且它和模型的大小无关。

这样就把训练逻辑浓缩成了单 GPU 就能跑的版本,代码也就 630 行。

一眼看过去,整个代码库就靠三个核心文件 ——

设置好后全程不用动的 prepare.py;需要 AI 自己改的 train.py;只有人类能改的 program.md。

prepare.py 用于定义训练的固定常量,比如模型基础维度、下载模型训练需要的原始数据、训练适配的分词器等,同时还提供实验过程中需要的工具。

train.py 是 AI 唯一可以编辑、修改的文件,相当于 AI 的实验笔记本。

Scroll for more