0产品10个亿:老黄投了量子位
Anthropic员工离职创业自进化AI,老黄黄仁勋又投了。
公司名为「Mirendil」,a16z和凯鹏华盈领投、NVIDIA跟投,出道便是独角兽:
0产品种子轮即拿下2亿美元融资(约合人民币13.6亿元),最新估值10个亿。
就这么说吧,虽然比不上AI圈最顶的一档(比如Mira的Thinking Machines Lab,种子轮20亿美元、估值100亿),但它已经是近年来AI领域最大的种子轮之一。
△图为Mirendil四位联合创始人
一家0产品公司为何能获得老黄和顶级风投青睐?
答案就藏在Mirendil这个名字里。
Mirendil来自《指环王》精灵语,意思是那些隐藏的、未被发现的珍宝的朋友,而这家公司要做的,就是把被锁在少数几家实验室里的前沿AI研发能力释放出来,让所有科学家都能用上。
看看Fable 5你就知道了,虽然最新传闻重新上线了,但这种顶尖模型能不能用都是Anthropic一句话的事。
所以,整件事的脉络就很清晰了:
当前沿AI研发能力正在变成一种特权,Mirendil站出来了。它要干的第一件事,就是拆掉老东家Anthropic的围墙。
这出戏,怎么不算精彩呢(doge)。
「AI最重要的应用,是AI本身」
Mirendil的核心信念,官网已经写得足够直白:
Democratizing frontier AI R&D to accelerate science and technology(普及前沿人工智能研发,加速科学技术发展)
CEO Behnam Neyshabur对此作了进一步阐释,归纳起来就是他提到的一个观点:
AI最重要的应用,是AI本身。
怎么理解这句话?
先看一个事实。截至2026年5月,Anthropic披露Claude已经写了公司80%以上的代码,OpenAI、Google DeepMind同样在大规模用AI加速自家研发。
也就是说,用AI做AI研发,在头部实验室内部早就是现实了。
但这种能力并没有真正对外开放,具体有两层限制:
第一层在「使用条款」上。
几乎所有头部模型提供商都禁止外部开发者使用其模型训练竞品。
你想借力打力?条款直接堵死了这条路。
第二层在「基础设施」上。
顶尖模型可以用于科研,代码生成、实验设计、论文分析都没问题,但这只是使用层的开放。
一旦进入模型训练、评估、对齐与迭代的完整闭环,就需要GPU集群、训练框架和长期积累的工程经验,而这些能力仍然高度集中在少数实验室手中。
科学家们不是不想用AI做研发,是根本迈不过这道门槛。
Mirendil要做的,就是拆掉它。
具体怎么做?核心思路是一个自加速循环:
训练擅长AI研发的前沿模型,围绕它们重新设计整个实验室流程。更好的模型产出更好的研究,更好的研究训出更好的模型。循环本身就是产品。
a16z给了一个很直观的类比,这就像一个为AI研究打造的coding agent,自己控制自己的GPU。
他们还给这种工作方式起了个名字:vibe research。
技术路线上,Mirendil押注的是业内最具争议的方向之一——递归自改进(recursive self-improvement),即让AI系统参与构建更强的后继系统。
Anthropic在6月初刚发了一篇专文讨论这个话题,标题就叫《When AI builds itself》,态度相当审慎。
多数头部实验室也对此持安全顾虑。很多AI安全研究人员认为,模型在无人监督的情况下重写自己代码的能力可能导致AI能力迅速增长到超出人类控制的局面。
但Mirendil团队的立场很明确:
自改进是加速科学研究的最短路径,安全问题是工程问题,在足够严格的监督下可以解决。
CEO在面对这个问题时更是表示:
当人们说这不可能时,我不买账,这只是一个难题。
目前Mirendil还处于0产品状态,官网上连技术细节都没有,但招聘JD透露了一些线索:
他们计划开发新型transformer注意力机制变体,用强化学习沙盒训练自改进AI(类似AlphaGo Zero的思路),并自动化数据准备、调试等超过六项研发任务。
凯鹏华盈的投资人Mamoon Hamid在博文中则透露了一个关键信号:
这支团队在短短几个月内,用自己的系统已经做出了令人难以置信的进展。
0产品,但不是0进展。
这或许就是2亿美元种子轮的真正底气。
四位联创、团队仅20人左右
而除了「要做的事」,「人」也是老黄他们押注Mirendil的一大关键因素。
Mirendil整个团队目前大约有20人,有四位联合创始人:
CEO Behnam Neyshabur
CTO Harsh Mehta
xAI大逃亡中的7年老兵Shayan Salehian
23岁的奥赛选手Tara Rezaei Kheirkhah
四个人来自Anthropic、Google DeepMind、xAI、OpenAI,几乎覆盖了所有头部实验室。
Behnam和Harsh是7年学术搭档,Shayan是谢里夫校友圈出身,Tara代表下一代。
一封冷邮件、一个校友网络、一次xAI大逃亡、一个23岁的奥赛选手。
这就是Mirendil 20人团队的起点。
CEO Behnam的「前半生」几乎就是标准的学术路线,从伊朗谢里夫理工硕士→芝加哥TTIC博士→普林斯顿高等研究院(与Sanjeev Arora合作)→NYU博后(导师是Yann LeCun),最终进入Google DeepMind。
外界最容易记住他的,是4.3万引用和SAM优化器、Minerva这些成果,但更关键的其实是另一件事——
他长期处在「训练AI如何学习」的那一侧,从优化到推理,从数学到代码,再到Gemini的预训练体系。
在DeepMind的最后几年,他已经不再只是做单点算法,而是开始负责整个Blueshift团队,直接参与Gemini的数学与代码推理训练。
这意味着他从研究者变成了训练系统的设计者。


