Transformer之父告别谷歌:您猜去了哪儿?新智元
奥特曼赢麻了!Transformer八子之一、Gemini技术联合负责人Noam Shazeer正式加盟OpenAI,任新的「架构负责人」,去造下一个超级智能。
Transformer核心奠基人之一,入职OpenAI了!
今天,Noam Shazeer亲自官宣:他将加入OpenAI,担任「架构研究负责人」。
这位用一篇《Attention Is All You Need》改写了整个AI世界的传奇人物,在回到谷歌不到2年后,再一次选择转身离开。
随着官宣落地,OpenAI成员已在X上齐刷刷列队,欢迎大佬的到来!
亲手写下AI时代,第一行代码
要理解今天这条消息的分量,得先搞清楚Noam Shazeer是谁。
一句话,他是「现代AI的地基」的浇筑者之一。
2017年,那篇标题狂得有点嚣张的论文《Attention Is All You Need》横空出世,提出了Transformer架构。
今天每一个大模型,GPT、Gemini、Claude,底层全部脱胎于这篇15页的论文。
八位作者,被业界封为「Transformer八子」,Shazeer便是其中之一。
而Shazeer,不只是挂名作者。
多头注意力(multi-head attention)是他亲手设计的,残差结构是他搭的,第一个跑赢SOTA的可用实现,是他一行一行敲出来的。
然而,属于Noam Shazeer的「封神榜」,远不止这一篇划时代的论文——
2016年,稀疏门控的混合专家(MoE),现代LLM省算力的命门技术;
2018年,Mesh-TensorFlow,第一个能在超算上训练巨型Transformer的实用系统;
2019年,T5;
还有谷歌对话系统LaMDA的核心贡献者。
毫不夸张地说,现代大模型赖以生存的几大底层技术,几乎全都在他的名下。
难怪有知名播客主持人,直接给出最高评价,「他是这场AI革命背后,那个最该『负责』的男人。」
两次出走,谷歌为他砸了27亿
而这段开挂的履历,还要从更早讲起。Shazeer是个不折不扣的天才少年。
1994年国际数学奥林匹克金牌,满分,随后进入杜克大学攻读数学与计算机。
2000年,他加入了当时才两岁的谷歌,第一份大活儿是改进搜索引擎的拼写纠错;
后来写下PHIL算法,成了谷歌AdSense系统的内核。
这一干,就是9年。
2021年,Shazeer正式离开谷歌,与Daniel De Freitas创办了Character.AI。
2024年8月,谷歌做了一件震动全行业的事:
为了把Shazeer请回来,谷歌以27亿美元授权了他的创业公司Character.AI的技术。
这笔钱名义上买的是技术,业内都心知肚明——谷歌真正想买的,是那个人。
Shazeer持有Character.AI三到四成股份,仅这一笔,他个人就套现了约7.5亿到10亿美元。
回来之后,他和Jeff Dean、Oriol Vinyals一起,成了谷歌Gemini的技术掌舵人。
坊间传闻,正是他回来后揪出了Gemini训练里一个深藏的bug,让模型训练效率暴涨。
最终,把Gemini 3推上各大榜单第一,逼得奥特曼在OpenAI内部拉响「红色警报」。
换句话说,谷歌这两年的翻身仗,他是头号功臣之一。
所以今天他走,谷歌的痛,不只是少了一个VP那么简单。
OpenAI火速官宣:


