0产品10个亿：老黄投了量子位

Anthropic员工离职创业自进化AI，老黄黄仁勋又投了。

公司名为「Mirendil」，a16z和凯鹏华盈领投、NVIDIA跟投，出道便是独角兽：

0产品种子轮即拿下2亿美元融资（约合人民币13.6亿元），最新估值10个亿。

就这么说吧，虽然比不上AI圈最顶的一档（比如Mira的Thinking Machines Lab，种子轮20亿美元、估值100亿），但它已经是近年来AI领域最大的种子轮之一。

△图为Mirendil四位联合创始人

一家0产品公司为何能获得老黄和顶级风投青睐？

答案就藏在Mirendil这个名字里。

Mirendil来自《指环王》精灵语，意思是那些隐藏的、未被发现的珍宝的朋友，而这家公司要做的，就是把被锁在少数几家实验室里的前沿AI研发能力释放出来，让所有科学家都能用上。

看看Fable 5你就知道了，虽然最新传闻重新上线了，但这种顶尖模型能不能用都是Anthropic一句话的事。

所以，整件事的脉络就很清晰了：

当前沿AI研发能力正在变成一种特权，Mirendil站出来了。它要干的第一件事，就是拆掉老东家Anthropic的围墙。

这出戏，怎么不算精彩呢（doge）。

「AI最重要的应用，是AI本身」

Mirendil的核心信念，官网已经写得足够直白：

Democratizing frontier AI R&D to accelerate science and technology（普及前沿人工智能研发，加速科学技术发展）

CEO Behnam Neyshabur对此作了进一步阐释，归纳起来就是他提到的一个观点：

AI最重要的应用，是AI本身。

怎么理解这句话？

先看一个事实。截至2026年5月，Anthropic披露Claude已经写了公司80%以上的代码，OpenAI、Google DeepMind同样在大规模用AI加速自家研发。

也就是说，用AI做AI研发，在头部实验室内部早就是现实了。

但这种能力并没有真正对外开放，具体有两层限制：

第一层在「使用条款」上。

几乎所有头部模型提供商都禁止外部开发者使用其模型训练竞品。

你想借力打力？条款直接堵死了这条路。

第二层在「基础设施」上。

顶尖模型可以用于科研，代码生成、实验设计、论文分析都没问题，但这只是使用层的开放。

一旦进入模型训练、评估、对齐与迭代的完整闭环，就需要GPU集群、训练框架和长期积累的工程经验，而这些能力仍然高度集中在少数实验室手中。

科学家们不是不想用AI做研发，是根本迈不过这道门槛。

Mirendil要做的，就是拆掉它。

具体怎么做？核心思路是一个自加速循环：

训练擅长AI研发的前沿模型，围绕它们重新设计整个实验室流程。更好的模型产出更好的研究，更好的研究训出更好的模型。循环本身就是产品。

a16z给了一个很直观的类比，这就像一个为AI研究打造的coding agent，自己控制自己的GPU。

他们还给这种工作方式起了个名字：vibe research。

技术路线上，Mirendil押注的是业内最具争议的方向之一——递归自改进（recursive self-improvement），即让AI系统参与构建更强的后继系统。

Anthropic在6月初刚发了一篇专文讨论这个话题，标题就叫《When AI builds itself》，态度相当审慎。

多数头部实验室也对此持安全顾虑。很多AI安全研究人员认为，模型在无人监督的情况下重写自己代码的能力可能导致AI能力迅速增长到超出人类控制的局面。

但Mirendil团队的立场很明确：

自改进是加速科学研究的最短路径，安全问题是工程问题，在足够严格的监督下可以解决。

CEO在面对这个问题时更是表示：

当人们说这不可能时，我不买账，这只是一个难题。

目前Mirendil还处于0产品状态，官网上连技术细节都没有，但招聘JD透露了一些线索：

他们计划开发新型transformer注意力机制变体，用强化学习沙盒训练自改进AI（类似AlphaGo Zero的思路），并自动化数据准备、调试等超过六项研发任务。

凯鹏华盈的投资人Mamoon Hamid在博文中则透露了一个关键信号：

这支团队在短短几个月内，用自己的系统已经做出了令人难以置信的进展。

0产品，但不是0进展。

这或许就是2亿美元种子轮的真正底气。

四位联创、团队仅20人左右

而除了「要做的事」，「人」也是老黄他们押注Mirendil的一大关键因素。

Mirendil整个团队目前大约有20人，有四位联合创始人：

CEO Behnam Neyshabur

CTO Harsh Mehta

xAI大逃亡中的7年老兵Shayan Salehian

23岁的奥赛选手Tara Rezaei Kheirkhah

四个人来自Anthropic、Google DeepMind、xAI、OpenAI，几乎覆盖了所有头部实验室。

Behnam和Harsh是7年学术搭档，Shayan是谢里夫校友圈出身，Tara代表下一代。

一封冷邮件、一个校友网络、一次xAI大逃亡、一个23岁的奥赛选手。

这就是Mirendil 20人团队的起点。

CEO Behnam的「前半生」几乎就是标准的学术路线，从伊朗谢里夫理工硕士→芝加哥TTIC博士→普林斯顿高等研究院（与Sanjeev Arora合作）→NYU博后（导师是Yann LeCun），最终进入Google DeepMind。

外界最容易记住他的，是4.3万引用和SAM优化器、Minerva这些成果，但更关键的其实是另一件事——

他长期处在「训练AI如何学习」的那一侧，从优化到推理，从数学到代码，再到Gemini的预训练体系。

在DeepMind的最后几年，他已经不再只是做单点算法，而是开始负责整个Blueshift团队，直接参与Gemini的数学与代码推理训练。

这意味着他从研究者变成了训练系统的设计者。