OpenAI总裁:界面会消失,算力永不够51CTO技术栈
“现在和微软产生竞争关系,会觉得怪怪的吗?”
主持人 Alex Kantrowitz 在这场会议上直接对 OpenAI 联合创始人兼总裁Greg Brockman 提出了这个问题。
要知道,OpenAI 和微软之间原本是深度绑定的战略合作关系,微软直到2032年都能访问 OpenAI 的IP。但随着前段时间的松绑,同一技术栈上的上下游,在产品层面重叠竞争。
Greg Brockman 认为眼下正在发生的最重要的事情,是 AI 在经济体中的应用,它正在真正颠覆整个经济并造福每一个人。
除了微软之外,主持人还问到 OpenAI 与“苹果Siri”之间可能存在的竞争。
ChatGPT 不仅建议你下一步想做什么,而且直接替你去做将会成为现实。这样一来,实际上让你们变成了一个操作系统,你不觉得吗?
在 Greg Brockman 看来,他们拥有的是某种从根本上全新的东西,但竞争一定是存在的。并判断我们正处于全新“智能体时代”的开端。在 AI 领域,事情的发展规律向来如此:每当你的能力水平跨上一个新台阶,就意味着你获得了一个重新思考一切的机会,重新思考人们如何进行交互,重新思考技术的极限在哪里。
在与 Siri 之间的竞争中,一个非常重要的问题是“应用界面”该如何变化。
还讲到了算力问题,Greg Brockman 始终认为:我们正在走向一个根本不会有足够的算力来满足所有的需求的世界,一个由算力驱动的经济体,每个人都会无时无刻不在使用这些模型来完成他们感兴趣的任务。
至于面临算力上疯狂投资的成本以及价格战中的降价,主持人问到“如果满足这种不断增长的需求需要耗费如此庞大的资源,而在一个可能会降价的环境中,如何让这笔账算得通?”
而在 Greg Brockman 看来,这是作为一家公司正在经历的转变。对他来说,在这场大博弈的早期阶段,整个市场绝对规模的扩张速度之快、他们收入水平的飙升速度之快,现在还没有人能预料到这条曲线未来会走得有多陡峭。
当然,还有更多硬核的观点和内容!
全文就在下面!
界面即将消失,语言模型到AGI之间有巨大鸿沟
主持人:Greg,之前大家有一种讨论,认为用“超级应用”来形容你们当时做的事情可能不太准确,也就是把作为编程端的 Codex 和 ChatGPT 结合起来。当时人们会觉得,“不对,真正的超级应用应该是让你能在里面使用其他所有应用的东西。”但现在随着这些产品的融合,我们从外部视角来看,其实“超级应用”可能反而是个准确的词。因为我们开始发现,现在当你需要做任何事情时,往往都是从 ChatGPT 的一句话提示词开始,然后 OpenAI 的技术就会利用你的浏览器或电脑去帮你把事情办成。这样理解对吗?
Greg:我觉得这是一个相当不错的视角。如果真正放大来看,我们实际上努力在构建的是 AGI。如果你想想自 ChatGPT 问世以来大家一直在使用的就是一个语言模型,这两者之间有着巨大的鸿沟。现在的体验确实很神奇,你可以跟它对话,它也会回应你。
但我们在 2022 年刚推出它时,它还没有记忆功能,没有连接任何工具,也没有上下文概念。所以,这种对话式的智能其实只是人们完成工作、实现目标真正所需能力的其中一部分。我们未来的方向是让 AI 真正成为你的贴身管家,你提供目标和方向,它会不停地思考“我今天能为 Alex 做点什么?”它不仅能去解决超级复杂的难题,也能处理非常琐碎的日常事务。比如你醒来时,发现收件箱已经帮你整理好了;或者如果你在考虑某个健康计划,它可以帮你出谋划策、查明医疗方案,或者至少能通过反复沟通为你提供这类信息。
我们花了很多时间在思考“你到底想要什么样的界面?想要什么样的产品?”而答案是,你几乎不想要任何界面,也不想要任何产品。就像你我之间的界面是什么?仅仅是能够与某个形式的、持久存在的实体进行对话,而它能够去帮你达成目标。构建这样的系统非常困难,需要时间。但我们已经拥有了很多核心拼图,我们正在加速整合产品层,努力让模型变得更好、让整个系统更加丝滑,从而减少点击按钮、切换开关、变换模式等操作。这并不是说在发展过程中完全不会有这些操作,但长期的趋势一定是走向简化和统一。
Greg:我们的目标是把 Codex 的能力带给每一个人,
把智能体带给每一个人
主持人:你说“界面将会消失”这一点非常有趣。我们很多现在使用 ChatGPT 这类产品的人都会注意到,机器人最后往往会给出一个建议。未来在 ChatGPT 内部将会发生的是:比如你和它聊到你的健康决定,它可能会说“你可能需要去看这位专家,让我帮你预约一下吧”,然后它就会真正代表你去执行这个操作。也就是说,它从单纯的对话界面,进化到能够真正理解你的意图,并走出去为你完成这件事。
Greg:没错,完全正确。如果你用过 Codex,我们的目标是真正把 Codex 的能力带给每一个人,把智能体带给每一个人。这项技术其实现在已经存在了,比如我就把我的 Codex 接到了 Slack、Gmail 和我的日历上。在 OpenAI 内部,有很多非技术用户也在这么用。虽然它名字里带个“Code”,但它其实跟写代码没太大关系,它本质上是一个可以通过智能体来驾驭的通用工具。举个例子,我们公关团队的一位同事之前在筹备一场活动,她只是让 AI 去询问所有活动参与者的饮食偏好,接着 AI 就排出了完整的座位表,把所有这些繁重的工作全干了。这样她就能把精力集中在自己真正想做的事情上,专注于构思她想要达成的活动愿景。我认为这种改变将在各个领域全面铺开。所以,想象一个连接了这些工具的 AI 已经不再是科幻小说了。
模型的进步速度太快了!
我们正处于智能体时代的边缘,一切将被彻底颠覆
Greg:我还记得在 2023 年(大概是 3 月或 4 月),我们在 ChatGPT 中进行了第一次工具使用的尝试,推出了插件功能。大家还记得 ChatGPT 早期的插件吗?那时候根本行不通,完全失败了,因为当时的模型还没准备好。虽然产品的形态是对的,但当时我们一次只能给模型开放三个不同的接口,再多它就开始遗忘了。因为当时我们可能只有 2K、最多 4K tokens 的上下文长度,几乎没有记忆力。这很像 20 世纪 60 或 70 年代早期的计算机,只有小得可怜的内存库;而今天你手里的手机,性能已经超越了那个时代的任何超级计算机。
我觉得这些模型的发展也是这个轨迹,因为它们的进步速度太陡峭、太快了。现在你可以让模型同时访问成百上千种不同的工具,我们有能力将它们连接到整个文件系统。所以它几乎把整个互联网的力量以及你想要的任何应用都放在了指尖。而且它很聪明,它拥有高达 52M tokens 的上下文长度(这取决于你怎么看)。它的能力水平也变得如此强大,这些模型现在正在解决未解的数学和物理难题,真正帮助人们做到他们靠自己无法完成的事情。我们正处在智能体时代的边缘,它们将彻底颠覆我们所有人的工作方式,无论是在软件工程、金融、法律、销售领域,还是在我们的个人生活中。
智能体时代的核心产品壁垒是“信任”
主持人:帮我们梳理一下你刚才举的那个例子,你的同事在 ChatGPT 里聊到活动安排,AI 建议说“嘿,我们应该怎么就某事联系活动参与者呢?”基本上,一旦这位同事说“好主意”并表示同意,界面就会从那一刻起接管接下来的工作,自动切入你正在使用的任何工具,然后替你把事情办好。
Greg:没错。所以它会利用它的 Gmail 接口,在你的收件箱里搜寻所有参加活动的人,然后看看大家有什么饮食限制。它会发现:“哦,这些人的饮食限制我已经有了,但这几个人的我还没有。”接着它会撰写一封邮件。根据你具体的设置,它可能会说:“嘿,我写好了这些邮件,我可以发送吗?”如果你设置的接口甚至不允许它直接发邮件,它就会说:“我写好了,你需要自己发一下。”而在另一种更进一步的情境中,你可以想象,如果你对这个系统已经建立了足够的信任,它会直接告诉你:“邮件写好了,我已经发出去了。”我认为这实际上指向了智能体时代一个非常重要的维度,那就是信任。我们真的需要学习如何与这些系统建立信任,了解它们在哪些方面擅长、哪些方面不擅长,从而弄清楚你想把什么任务委派给它们,以及你想赋予它们多大的责任。而我们认为这种信任是赢来的,不是我们直接赋予的。通过向操作者提供大量的工具、控制权、可追溯性和监督手段,我们认为这将是至关重要的一环,也是核心的产品功能和差异化优势。
ChatGPT 会被传统用户界面抵制吗?
主持人:回看早期的一些尝试,OpenAI 曾有一阵子让你能在 ChatGPT 内部叫一辆 Uber 。其实在它之前,已经有一长串的公司尝试过让你在聊天界面里执行操作,但从来没有真正流行起来。而这次的不同之处可能在于,聊天机器人可以直接控制你的浏览器或控制你的电脑。这样你就不必担心“这个插件能不能用”的问题了,它通过直接接管你的机器来替你完成任务。所以我在想,你是否预期会遭到来自现有用户界面的抵制?因为要实现真正的实用,ChatGPT 必须保持畅通无阻,才能代表用户出去执行这些操作。
Greg:首先我想说的是,这在目前已经不是理论探讨了。大家其实一直在使用 Codex,它最初真的只是专注于软件工程,但在 Codex 上发生的非软件类工作量最近绝对是在爆炸式增长。这是一条令人难以置信的指数级曲线,正如你所预料的那样。在 OpenAI 内部,Codex 的普及率和使用率目前基本上和 Slack 处于同一水平。OpenAI 就像是一家完全基于 Slack 运转的公司,我们大部分时间都不用邮件。说真的,如果你不用 Slack,你根本没法开展工作。而现在大家对 Codex 应用的感觉也是这样,每个人的 Codex 都连接了所有这些工具。
至于生态系统会如何演变,我认为这将是一个非常微妙的过程。因为非常重要的一点是,我们坚信应该有一个充满活力、蓬勃发展的生态系统,让人们能够真正参与构建并从中获益。
现在每个人都在思考,在 AI 时代,自己作为一家公司如何不仅生存下来,而且还能发展壮大?你如何真正利用“未来将会有多得多的活动”这一事实所带来的优势?如果你不融入 AI,如果你把它拒之门外,那么你实际上是在走下坡路,而不是在繁荣发展。
OpenAI 是想成为下一代 AI 操作系统?
个人 AGI 的理想界面是我们现在正使用的界面
主持人:你们已经把 ChatGPT 引入了 Codex,这基本上意味着,如果我们是 ChatGPT 的用户,我们刚才探讨的这种体验,ChatGPT 不仅建议你下一步想做什么,而且直接替你去做将会成为现实。这样一来,实际上让你们变成了一个操作系统,你不觉得吗?但它不像 iOS 那种操作系统(你需要打开手机然后点击不同的应用),它更像是与所有应用的所有交互都将通过这个界面发生。这是你们的雄心吗?
Greg:我觉得你可以用这种方式来形容它,但我个人的思考方式有点不同。我是这样看待这件事的:一个通用人工智能或者我们所说的“个人 AGI”的理想界面是什么?我认为,它依然是你和我现在正在使用的这种界面。


