谷歌Gemini顶级华人科学家离职创业新智元
谷歌 Gemini 数据联合负责人 Andrew Dai 联手苹果首席研究科学家 Yinfei Yang,隐身创办 AI 新秀 Elorian。首轮将融资 5000 万美元,剑指「视觉推理」这个下一代大模型的核心问题。
硅谷的 AI 创业热潮中,最昂贵的筹码永远押注在最资深的「大脑」上。
曾在谷歌 DeepMind 效力长达 14 年的资深研究员 Andrew Dai,正在筹建一家名为 Elorian 的 AI 初创公司。
这家尚不为人所知的公司,种子轮融资目标即高达 5000 万美元。
与 Andrew Dai 联手的,是刚于去年 12 月离职的苹果研究科学家 Yinfei Yang。
这两位分别来自谷歌和苹果的技术老兵,正在试图解决大模型领域的下一个核心问题:视觉推理(Visual Reasoning)。
领投这轮融资的,极有可能是由前 CRV 普通合伙人 Max Gazor 创立的 Striker Venture Partners。
如果交易达成,这将是硅谷近期最受瞩目的早期融资之一,也再次印证了资本市场对于「谷歌毕业生」的疯狂追捧。
14 年,从 BERT 早期到 Gemini 幕后
在 AI 研究圈,Andrew Dai 这个名字代表着一种「长期主义」。
不同于那些在 Transformer 浪潮爆发后才匆匆入局的创业者,Andrew Dai 在谷歌的工号可以追溯到 2012 年。
这意味着他完整经历了深度学习从边缘学科走向世界中心的整个周期。
在他的 LinkedIn 履历中,最引人注目的是他作为 Gemini 模型预训练(Pre-training)数据工作的联合负责人。
在当前的大模型战争中,数据质量和预训练策略被认为是决定模型智商上限的关键因素。
能够在这个核心环节担任负责人,足以证明他在谷歌内部的权重。
Andrew Dai 的学术贡献不仅限于此。
他曾与谷歌首席科学家 Jeff Dean 以及 Quoc V. Le(Google Brain 的传奇人物)共同撰写过多篇论文。
早在 2015 年,他发表的一篇关于半监督序列学习(Semi-supervised Sequence Learning)的论文,就被认为对后来 OpenAI 的 GPT 系列模型产生了深远的启发。
一位熟悉 Andrew Dai 的人士评价道:「他是语言模型的先驱之一,过去二十年一直专注于预训练相关的研究。他最擅长的,就是如何从海量、嘈杂的数据源中提炼出高质量的“知识”。」
如果说 Andrew Dai 代表了谷歌在大数据处理上的暴力美学,那么联合创始人 Yinfei Yang 则带来了苹果系的精致与多模态视角。
Yinfei Yang 此前在苹果机器学习团队担任首席研究科学家(Principal Research Scientist),主要参与苹果自研 AI 模型的开发。
在加入苹果之前,他也曾在 Google Research 工作过四年,专注于多模态表示学习。
他在图像-文本共嵌入(Image-text Co-embedding)领域的专长,恰好填补了单纯语言模型的感知短板。
不只是「看见」,更要「理解」
Elorian 究竟想做什么?
根据 Andrew Dai 的说法,Elorian 并不是要再造一个 ChatGPT,而是要构建一个能够「同时理解和处理文本、图像、视频和音频」的原生多模态模型。
目前的 AI 模型大多是基于文本训练,再通过「补丁」的方式接入视觉能力。
而 Elorian 的愿景是构建一个天生的「通感者」。
这种模型不再是将图片转化为文字标签,而是像人类一样,通过视觉直接感知物理世界的逻辑。
「视觉推理」被认为是通向 AGI 的必经之路。
Andrew Dai 提到,机器人将是 Elorian 技术的一个潜在应用场景,但他强调公司的愿景远不止于此。
在硅谷的投资人眼中,这通常意味着 Elorian 瞄准的是 AI 智能体的广阔市场——一个能够像人类一样看着电脑屏幕、理解图形用户界面(GUI)、处理退货流程、审核法律文件、操作其他软件的超级助手。
它不需要你通过 API 喂给它数据,而是直接像你一样「看」着 Excel 表格、「听」着电话录音,同时「读」懂屏幕上的邮件,并实时做出决策。
这就是 Elorian 试图构建的未来。
为「血统」买单
5000 万美元的种子轮融资,在几年前听起来像是天方夜谭,但在今天的 AI 泡沫中,这似乎成了顶级团队的「入场费」。
正在与 Elorian 洽谈领投的 Striker Venture Partners,本身也是一家极具话题性的新锐基金。
其创始人 Max Gazor 曾是老牌风投 CRV 的合伙人,以眼光毒辣著称。
他在去年 10 月刚刚自立门户,Elorian 很可能是该基金成立后的首批标志性赌注之一。


