GPT-6倒计时,陶哲轩已上手:AGI真的要来了?小王讲AI
陶哲轩在用它。
这位菲尔兹奖得主、当代最伟大的数学家之一,据传已经拿到了GPT-6的内测资格。
更让人惊讶的是,他不是在玩票。他在用GPT-6做数学推理——真正的那种,不是帮学生做作业,而是在研究级别的数学问题上测试它的能力。
4月14日,OpenAI就要正式发布GPT-6了。
这次发布距离GPT-5.4只有半年,距离GPT-5不到两年。但如果是两年前,这个速度并不奇怪。奇怪的是,OpenAI内部给这个项目起了一个代号:"Spud"。
一个可能改变人类历史的东西,代号叫土豆。
从"土豆"说起
"Spud"这个项目,OpenAI保密了整整两年。
2023年底开始,他们就悄悄在德克萨斯州建起了Stargate数据中心。这个名字来自科幻电影《星际之门》——一扇通往其他世界的门。
OpenAI确实想打开一扇门。
3月24日,GPT-6在Stargate完成了预训练。我查了一下时间线,从开始到完成,大概用了15个月。
15个月训练一个模型,这在GPT时代算是很长的了。GPT-4的训练周期大约是6-8个月。为什么GPT-6花了这么久?
我猜有两点。
第一,模型更大了。虽然OpenAI没有公开参数量,但从200万token的上下文窗口来看,这东西的规模不会小。上下文窗口从100万翻倍到200万,听起来只是个数字,但你想想:这意味着模型一次性能"读"完一本中等长度的小说,或者几百篇论文,还能记住所有内容。
第二,架构不一样了。GPT-6是原生多模态——文本、图像、音频、视频统一架构。不是像GPT-4那样把图像识别模块"嫁接"上去,而是从底层设计就是多模态的。这就像把房子拆了重建,而不是在老房子上加盖。
OpenAI内部数据显示,编码、推理、Agent任务能力比GPT-5.4提升40%以上。
这个数据还挺猛的。
40%听起来不算夸张,但你要知道,从GPT-4到GPT-5,推理能力的提升大概在15-20%左右。40%意味着什么?意味着在某些任务上,GPT-6可能真的接近了"临界点"。
什么是临界点?
就是那个越过之后,AI能做的事情开始超过人类大部分专家的界限。
一边发布,一边砍项目
但就在GPT-6发布前夕,OpenAI做了一个让外界大跌眼镜的决定:
砍掉Sora。
Sora是OpenAI的视频生成模型,去年2月发布时轰动一时。很多人期待它能彻底改变视频制作行业。迪士尼甚至和OpenAI签了10亿美元的合作协议,要把Sora用在电影制作上。
现在,合作取消了。Sora项目停了。
我反复想了这个问题。一个合理的解释是:OpenAI在all-in AGI。
Sora很酷,但它是"单点能力"——生成视频。而OpenAI现在想要的是"通用能力"。Greg Brockman(OpenAI联合创始人)最近说了一句话:
AGI已经实现了70-80%,GPT-6将弥合剩余差距。
这句话让我想了很久。
70-80%是个很微妙的数字。它不是"已经实现",也不是"还很遥远"。它正好在那个"近在咫尺但又触不可及"的位置。
Brockman不是随口说说的人。他是个工程师,说话一向谨慎。他能说出这个数字,说明OpenAI内部确实有某种指标,某种测量方式,让他们相信AGI已经走了四分之三的路。
砍掉Sora、取消迪士尼合作,可能就是为了让资源集中到这最后20-30%上。
代价是巨大的。10亿美元的合作,说不要就不要了。这个数字让我有点意外——要知道,Sora可是OpenAI去年最亮眼的产品之一,迪士尼的背书也很有分量。但OpenAI还是砍了。这说明什么?说明他们认为最后这20%的价值,远超10亿美元。
产品组织也改名了,从"Product"改成"AGI Deployment"。不是"AGI Research",是"Deployment"——部署。
这意味着什么?
意味着他们不只是在研究AGI,而是准备把AGI部署出去,变成真正的产品。
"超级应用"的野心
ChatGPT + Codex + Atlas浏览器。
这是OpenAI正在规划的"超级应用"。
我第一次看到这个组合的时候,愣了一下。因为这三个东西,分别代表了三种能力:
ChatGPT是对话和推理能力;
Codex是编程和执行能力;
Atlas浏览器是自主浏览和操作能力。
合在一起是什么?
是一个能理解你的需求、自己写代码执行、还能自己上网查资料、操作网页的AI Agent。
这不就是科幻片里那种"助理机器人"吗?
想想看,你对它说"帮我研究一下特斯拉2024年的财报,做个分析报告"。
自己打开浏览器
找到特斯拉的财报页面
全程不用你动手。
OpenAI把这个叫"AGI Deployment"。我觉得这个名字起得很准确。因为部署AGI,就是把"通用智能"变成一个能干活的"助手"。
而不是一个只会回答问题的聊天机器人。
但OpenAI内部在"着火"
就在GPT-6要发布的节骨眼上,OpenAI内部出现了问题。
先是一个数据:二级市场上,有6亿美元的OpenAI股票挂了好几个星期,没人接盘。
这很不正常。
要知道,OpenAI是现在硅谷最炙手可热的公司之一。按理说,员工要卖股票,应该有一堆投资人抢着买。但这次,没人买。
我看到的另一个数据:OpenAI的估值从8500亿美元跌到了7650亿美元,折价10%。
8500亿,这个数字本身就很疯狂。7650亿,也很疯狂。但跌了10%,说明市场对OpenAI的预期在下降。
更不妙的是,CEO奥特曼和CFO Sarah Friar在IPO时机上吵了起来。
吵架本身不奇怪,硅谷高管吵架多了去了。奇怪的是后续:CFO不再向CEO直接汇报。
在硅谷,CFO通常直接向CEO汇报。如果不汇报了,只有两种可能:
要么CFO快走了;
要么CEO对财务失去了控制。
哪种都不是好兆头。
还有一个细节:OpenAI花2.5亿美元收购了一个叫TBPN的播客。这个播客是个AI播客,每周聊科技新闻。收购之后,很多人质疑:一个播客,值2.5亿?
这些事放在一起,我有个猜测:
OpenAI在经历转型期的阵痛。
从"研究机构"变成"产品公司",从"技术驱动"变成"商业驱动",这种转型从来都不容易。内部的分歧、外部的质疑、股价的波动,都是转型的代价。
但有意思的是,就在这些负面消息传出的同时,GPT-6还是要发布了。
说明OpenAI认为,GPT-6足够强,强到可以让这些问题都不再是问题。


