OpenAI推理第一人离职量子位

刚开年，OpenAI再出人事动荡：推理模型第一人离职了！

Jerry Tworek——构建o3、o1、GPT-4、ChatGPT以及 OpenAI首个AI编程模型Codex的关键人物，OpenAI研究副总裁——宣布了他的艰难决定：离开OpenAI，去尝试探索一些在OpenAl难以开展的研究领域。

好奇，他所说的“在OpenAI难以开展的研究”包括哪些部分？

他表示，在OpenAI快七年的时间里，经历了许多美好和疯狂的时刻，但更多的是美好的时光。

（大佬也和OpenAI有七年之痒？）

不少OpenAI在职人员都在这篇推文上回顾了和Jerry共事的愉快经历。

也祝他拥有美好的未来。

网友看客们嘛，留言中的关键词主要是“感谢”和“赞叹”。

依旧有因OpenAI流失重要人才感到沮丧的朋友。

但这条朋友的评论区更好笑。

很多人可能从Jerry断断续续的采访、演讲中认识他，了解得并不那么全面。

现在，让我们正经全方位认识一下这位推理模型大佬，以此送别，并祝愿他开启一个新的航程。

OpenAI推理模型第一人

Jerry Tworek，出生、成长于波兰，在华沙大学数学专业取得硕士学位，属于强理论与数理功底出身。

他并不是一出校门就进入AI界打拼的。

离开学校后的头五年，他先在阿姆斯特丹从事量化研究，主要研究期货市场的量化交易策略。

这期间，Jerry使用优化理论和从噪声数据集中提取信号的技术来研究和开发期货市场的量化交易策略，这最终引导他开始研究强化学习。

2019年，Jerry加入OpenAI，担任研究科学家，主要方向是神经程序合成、强化学习等。

当时GPT‑2刚发布不久，OpenAI还以非营利研究实验室为主，规模小，名气不算大。

早期，他参与了机器人项目“用机器人手解决魔方”，并就这一项目在NeurIPS 2019深度强化学习研讨会作了展示。

Jerry也是最早一批参与“大规模预训练+算力扩展”路线的研究者之一，并且在前ChatGPT时期，他就已经展现出对模型推理的极大兴趣，

2020年GPT-3发布后，他开始着手研究评估和训练GPT-3以解决推理和逻辑问题。

截至今日，Jerry在各种公开演讲和访谈中，多次强调对“推理”而不仅仅是“模式匹配式生成”的重视，倾向把大模型看作可以通过训练“学会思考过程”的系统，而不仅是一个黑盒文本预测器。

2019–2022年间，他在OpenAI做神经程序综合与大模型推理研究，涉及Codex、Copilot这类代码大模型，同时利用强化学习提升复杂任务上的推理与决策能力。

2022年起，Jerry开始担任OpenAI的Research Lead，负责带团队研究“如何让大语言模型使用工具、解决STEM领域的困难问题”，包括插件和Code Interpreter等等。

ChatGPT出现之后，他逐渐被更多人认识——以ChatGPT和GPT系列模型主要贡献者之一的名义。

Jerry是GPT-4的首席研究员，领导了第一个推理模型o1的研究开发，对外被介绍为GPT-5推理机制和长思考能力的核心负责人。

还在各种各样的访谈、播客节目中系统讲解GPT-5的思考方式和推理模型的路线演化。

2025年，Jerry升任OpenAI研究副总裁。

2026年1月6日，Jerry宣布从OpenAI离职，并未公布具体去向。