0产品10个亿:老黄投了量子位

6/27/2026

Anthropic员工离职创业自进化AI,老黄黄仁勋又投了。

公司名为「Mirendil」,a16z和凯鹏华盈领投、NVIDIA跟投,出道便是独角兽:

0产品种子轮即拿下2亿美元融资(约合人民币13.6亿元),最新估值10个亿。

就这么说吧,虽然比不上AI圈最顶的一档(比如Mira的Thinking Machines Lab,种子轮20亿美元、估值100亿),但它已经是近年来AI领域最大的种子轮之一。

△图为Mirendil四位联合创始人

一家0产品公司为何能获得老黄和顶级风投青睐?

答案就藏在Mirendil这个名字里。

Mirendil来自《指环王》精灵语,意思是那些隐藏的、未被发现的珍宝的朋友,而这家公司要做的,就是把被锁在少数几家实验室里的前沿AI研发能力释放出来,让所有科学家都能用上。

看看Fable 5你就知道了,虽然最新传闻重新上线了,但这种顶尖模型能不能用都是Anthropic一句话的事。

所以,整件事的脉络就很清晰了:

当前沿AI研发能力正在变成一种特权,Mirendil站出来了。它要干的第一件事,就是拆掉老东家Anthropic的围墙。

这出戏,怎么不算精彩呢(doge)。

「AI最重要的应用,是AI本身」

Mirendil的核心信念,官网已经写得足够直白:

Democratizing frontier AI R&D to accelerate science and technology(普及前沿人工智能研发,加速科学技术发展)

CEO Behnam Neyshabur对此作了进一步阐释,归纳起来就是他提到的一个观点:

AI最重要的应用,是AI本身。

怎么理解这句话?

先看一个事实。截至2026年5月,Anthropic披露Claude已经写了公司80%以上的代码,OpenAI、Google DeepMind同样在大规模用AI加速自家研发。

也就是说,用AI做AI研发,在头部实验室内部早就是现实了。

但这种能力并没有真正对外开放,具体有两层限制:

第一层在「使用条款」上。

几乎所有头部模型提供商都禁止外部开发者使用其模型训练竞品。

你想借力打力?条款直接堵死了这条路。

第二层在「基础设施」上。

顶尖模型可以用于科研,代码生成、实验设计、论文分析都没问题,但这只是使用层的开放。

一旦进入模型训练、评估、对齐与迭代的完整闭环,就需要GPU集群、训练框架和长期积累的工程经验,而这些能力仍然高度集中在少数实验室手中。

科学家们不是不想用AI做研发,是根本迈不过这道门槛。

Mirendil要做的,就是拆掉它。

具体怎么做?核心思路是一个自加速循环:

训练擅长AI研发的前沿模型,围绕它们重新设计整个实验室流程。更好的模型产出更好的研究,更好的研究训出更好的模型。循环本身就是产品。

a16z给了一个很直观的类比,这就像一个为AI研究打造的coding agent,自己控制自己的GPU。

他们还给这种工作方式起了个名字:vibe research。

技术路线上,Mirendil押注的是业内最具争议的方向之一——递归自改进(recursive self-improvement),即让AI系统参与构建更强的后继系统。

Anthropic在6月初刚发了一篇专文讨论这个话题,标题就叫《When AI builds itself》,态度相当审慎。

多数头部实验室也对此持安全顾虑。很多AI安全研究人员认为,模型在无人监督的情况下重写自己代码的能力可能导致AI能力迅速增长到超出人类控制的局面。

但Mirendil团队的立场很明确:

自改进是加速科学研究的最短路径,安全问题是工程问题,在足够严格的监督下可以解决。

CEO在面对这个问题时更是表示:

当人们说这不可能时,我不买账,这只是一个难题。

目前Mirendil还处于0产品状态,官网上连技术细节都没有,但招聘JD透露了一些线索:

他们计划开发新型transformer注意力机制变体,用强化学习沙盒训练自改进AI(类似AlphaGo Zero的思路),并自动化数据准备、调试等超过六项研发任务。

凯鹏华盈的投资人Mamoon Hamid在博文中则透露了一个关键信号:

这支团队在短短几个月内,用自己的系统已经做出了令人难以置信的进展。

0产品,但不是0进展。

这或许就是2亿美元种子轮的真正底气。

四位联创、团队仅20人左右

而除了「要做的事」,「人」也是老黄他们押注Mirendil的一大关键因素。

Mirendil整个团队目前大约有20人,有四位联合创始人:

CEO Behnam Neyshabur

CTO Harsh Mehta

xAI大逃亡中的7年老兵Shayan Salehian

23岁的奥赛选手Tara Rezaei Kheirkhah

四个人来自Anthropic、Google DeepMind、xAI、OpenAI,几乎覆盖了所有头部实验室。

Behnam和Harsh是7年学术搭档,Shayan是谢里夫校友圈出身,Tara代表下一代。

一封冷邮件、一个校友网络、一次xAI大逃亡、一个23岁的奥赛选手。

这就是Mirendil 20人团队的起点。

CEO Behnam的「前半生」几乎就是标准的学术路线,从伊朗谢里夫理工硕士→芝加哥TTIC博士→普林斯顿高等研究院(与Sanjeev Arora合作)→NYU博后(导师是Yann LeCun),最终进入Google DeepMind。

外界最容易记住他的,是4.3万引用和SAM优化器、Minerva这些成果,但更关键的其实是另一件事——

他长期处在「训练AI如何学习」的那一侧,从优化到推理,从数学到代码,再到Gemini的预训练体系。

在DeepMind的最后几年,他已经不再只是做单点算法,而是开始负责整个Blueshift团队,直接参与Gemini的数学与代码推理训练。

这意味着他从研究者变成了训练系统的设计者。

Scroll for more