卡帕西开源Agent自进化训练框架：5分钟一轮量子位

大神 Karpathy 又开源了新项目 —— 一个能够自主进化的 AI 科研循环系统。

这个项目名叫 autoresearch，主打让智能体完全自主地搞科研，只要在 Markdown 文档里写好指令，剩下的流程全都由 AI 自动完成。

而且整个框架十分精简，一共只有 630 行代码，单个 GPU 就能跑得动。

它每 5 分钟就会跑一轮测试，并根据验证结果决定是保留还是丢弃改动，就像一个 24 小时从不休息且能自我进化的虚拟研究员。

Karpathy 还希望，未来能让成千上万个智能体在海量分支里异步协作，不再受限于单一的 master 分支，从而通过群体智慧实现科研效率的爆发。

发布才不到两天，autoresearch 斩获的星标数就已经超过了 9.5k。

在 X 上，Karpathy 的帖子也有 580 多万次围观。

Shopify CEO 看了 Karpathy 的项目之后表示膜拜，直言这个项目实在是太疯狂了。

5 分钟自动化实验

autoresearch 这个项目的思路非常简单，就是把 AI 训练的循环试错自动化。

AI 自己修改代码、跑 5 分钟的短实验、看效果好不好再决定下一步怎么走。

基于 nanochat 模型训练核心，定了两条铁律：

一是每次实验的纯训练时间固定为 5 分钟，避免因为不同改动下的训练时长不同而影响结果；

二是只看 val_bpb，这个指标的数值越低，就代表模型效果越好，而且它和模型的大小无关。

这样就把训练逻辑浓缩成了单 GPU 就能跑的版本，代码也就 630 行。

一眼看过去，整个代码库就靠三个核心文件 ——

设置好后全程不用动的 prepare.py；需要 AI 自己改的 train.py；只有人类能改的 program.md。

prepare.py 用于定义训练的固定常量，比如模型基础维度、下载模型训练需要的原始数据、训练适配的分词器等，同时还提供实验过程中需要的工具。

train.py 是 AI 唯一可以编辑、修改的文件，相当于 AI 的实验笔记本。