谷歌Gemini联席负责人,被OpenAI挖了智东西
据6月19日消息,今日,谷歌DeepMind研究员、Gemini联席负责人Noam Shazeer已正式加入OpenAI,将担任架构研究负责人(Lead for Architecture Research),负责探索新一代AI模型架构,并推动Transformer架构的进一步演进。
Shazeer本人也在海外社交平台X上发文官宣加入OpenAI,他说:“我很高兴加入OpenAI,并期待与这里卓越的团队一起工作。”
与此同时,他也向谷歌团队表达感谢:“离开是一个艰难的决定。我为谷歌团队以及我们共同完成的一切感到无比自豪。能够与你们共事是一种荣幸。”谷歌发言人则向路透社回应称,公司感谢Shazeer多年来的重要贡献,并祝愿他未来一切顺利。
Noam Shazeer是AI领域的传奇人物之一。他是2017年经典论文《Attention Is All You Need》的核心作者之一,该论文首次提出Transformer架构,直接奠定了GPT系列、Gemini、Claude等现代大模型的技术基础。
《Attention Is All You Need》
在加入OpenAI前,Shazeer曾于2021年离开谷歌创办Character.AI。Shazeer最广为人知的身份其实是Character.AI联合创始人兼CEO。
这家公司比ChatGPT爆发还要早一步押注“AI陪伴”赛道,允许用户与各种AI角色进行长期对话,一度成为全球增长最快的消费级AI应用之一。2023年,Character.AI的估值已突破10亿美元(约合人民币67.65亿元)。
2024年,谷歌与Character.AI达成一项价值约27亿美元(约合人民币182.66亿元)的技术授权协议,将Noam Shazeer及部分核心团队重新招入DeepMind,并任命Noam Shazeer为Gemini联席负责人,参与Gemini新一代模型的预训练研发工作。
对于正与Anthropic展开激烈竞争的OpenAI而言,这被外界视为近年来最重要的一次顶级人才引进。消息公布后,OpenAI高层和多位知名研究员第一时间在X上留言欢迎。
OpenAI首席研究官Mark Chen发文称:“非常高兴欢迎Noam Shazeer加入OpenAI,担任架构研究负责人。他在Transformer、MoE以及高效解码领域的工作塑造了现代AI。”
随后,多位AI研究人员也在评论区送上祝贺,包括谷歌DeepMind研究员、Gemini Thinking与Coding团队华人成员Yuchen Zhuang,OpenAI研究员、o系列推理模型核心贡献者Noam Brown,以及前微软AI副总裁、现OpenAI研究员Sebastien Bubeck等。
谷歌DeepMind华人研究员Yuchen Zhuang
OpenAI o系列推理模型核心贡献者Noam Brown
OpenAI研究员Sebastien Bubeck
与此同时,也有网友感叹:“失去一位Transformer作者和Gemini联席负责人,对谷歌来说无疑是一次沉重打击。”
一、知名Transformer作者,在谷歌工作近18年
如果从生成式AI的发展史来看,Noam Shazeer几乎参与了每一个关键节点。他于2000年加入谷歌,先后担任软件工程师和首席软件工程师,累计工作超过18年。
Noam Shazeer工作经历与教育经历(图源:领英)
2017年,他与Ashish Vaswani、Jakob Uszkoreit等8位谷歌研究员共同发表经典论文《Attention Is All You Need》,提出Transformer架构。相比此前主流的RNN和LSTM模型,Transformer能够更高效地处理长文本,并具备更强的扩展能力。
过去几年,无论是OpenAI的GPT系列、谷歌Gemini、Anthropic Claude,还是DeepSeek、Llama等模型,底层几乎都建立在Transformer架构之上。换句话说,今天这场席卷全球的大模型浪潮,很大程度上都建立在这篇论文奠定的技术基础之上。
不过,Transformer只是Noam Shazeer众多代表作中的一个。
在谷歌任职期间,他还参与推动了多项影响深远的大模型技术。2017年,他作为第一作者提出稀疏门控混合专家(MoE)架构,为后来的GPT-4、Gemini、DeepSeek-V3等模型提供了重要技术思路;2018年,他又参与开发Mesh TensorFlow,为超大规模Transformer训练提供基础工具;此后,他还参与T5模型以及谷歌对话模型LaMDA等多个关键项目研发。
二、从谷歌离职创业,又被182亿买回
2021年,Shazeer离开谷歌,与Daniel De Freitas共同创办Character.AI。
当时,大语言模型尚未迎来ChatGPT时刻,但Character.AI已经率先尝试将聊天机器人产品推向大众市场,并迅速积累大量用户。
2024年,谷歌以约27亿美元(约合人民币182.66亿元)的合作交易重新将Shazeer及其核心团队纳入DeepMind体系。随后,他成为Gemini项目的重要负责人之一,并参与Gemini新一代模型的预训练工作。
Shazeer回归的时间点,正值谷歌AI业务承受巨大压力。彼时ChatGPT爆火,Gemini仍处于追赶阶段。重返DeepMind后,Shazeer参与模型研发,并最终出任Gemini联席负责人,成为谷歌AI技术领军人物之一。
此后,Gemini 3系列模型在编程、推理等多个基准测试中跻身行业前列,成为谷歌与OpenAI、Anthropic竞争的重要筹码。
从谷歌研究员,到创业者,再到Gemini联席负责人,Shazeer几乎见证了谷歌近十年来AI发展的每一次重要转折。因此,此次离开谷歌加入OpenAI,也被不少业内人士视为谷歌近年来最重要的人才流失事件之一。
三、OpenAI的人才争夺战还在升级
Shazeer加盟的背景,是AI行业愈发激烈的人才竞争。
过去一年里,OpenAI与Anthropic之间的竞争持续升温。双方不仅围绕模型能力展开较量,也在不断争夺顶级研究员和核心工程师。
英国《金融时报》报道称,OpenAI内部将Shazeer的加入视为一次重要补强。未来他将重点研究Transformer之后的新架构方向,以及如何进一步提升模型能力。


