李飞飞即兴纵横:就业、机器人、下一个前沿Paper
李飞飞(Dr. Fei-Fei Li)很少在播客里聊得如此尽兴。作为斯坦福大学教授、ImageNet 创始人、前 Google Cloud 首席 AI 科学家,以及如今 World Labs 的创始人,她被《时代》杂志评为"AI 百大影响力人物",业界称她为"人工智能教母"。
在这场长达 1 小时 19 分钟的 Lenny's Podcast 深度访谈中,她从 1940 年代图灵之问一路讲到 2025 年世界模型的最新突破,不仅梳理了 AI 从寒冬到爆发的完整历史,更抛出了一个关键判断:语言模型只是开始,世界模型才是下一个前沿。
本期访谈发生在 World Labs 刚刚发布全球首个大型世界模型产品 Marble 的同一时间。李飞飞不仅详细介绍了这款"从提示到世界"的产品,还罕见地谈到了她对 AGI 的质疑、机器人领域的"苦涩教训"、创办公司 18 个月来的真实感受,以及她对年轻人职业选择的建议。
7. AI 属于每个人:无论你是护士、艺术家、农民还是教师,AI 都与你有关。"任何技术都不应剥夺人的尊严。"
一、AI 简史:从"脏词"到全民热词
"我很难记住 AI 对每个人来说都是新事物。"李飞飞说,"当我的整个职业生涯都在 AI 中度过,看到我从青少年时期就开始的个人好奇心,现在已经成为我们文明的变革力量——这让我感到非常满足。"
二、ImageNet:一场始于 2006 年的豪赌
李飞飞选择从视觉智能切入 AI,因为她坚信"人类是深度视觉动物"。但她很快发现了一个被严重忽视的关键要素:大数据。
三、AGI 之辩:营销术语还是科学目标?
当被问到 AGI(通用人工智能)时,李飞飞给出了一个相当直接的回答:
"AGI 更像是一个营销术语,而非科学术语。没有人真正定义过 AGI。"
她进一步解释:"图灵如果在世,可能会耸耸肩说:'我在 1940 年代问的就是同一个问题。'"
四、世界模型:为什么空间智能是下一个前沿?
空间智能不只是为了机器人,它将增强人类自身:从建筑工业设计到灾难救援,从科学发现到创意表达。
五、Marble:全球首个"从提示到世界"的大型世界模型
为了将空间智能从理论推向产品,李飞飞创办了 World Labs,团队仅约 30 人,成立约 18 个月。
他们刚刚发布了全球首个大型世界模型产品 Marble。核心能力只有一句话:
"从提示到世界。"
用户输入一句话或上传一张图片,Marble 就能生成真正具有 3D 结构、可自由导航和漫游的世界。你可以戴着 VR 眼镜"走进去",也可以导出视频和 3D mesh 用于其他工具。
李飞飞详细介绍了已验证的应用场景:
这与视频生成模型(如 Sora/V3)有本质区别。视频生成模型输出的是"一次性视频",看完就完了;而 Marble 输出的是具有 3D 结构的、可交互的世界。
"你可以走进一个霍比特人洞穴,以导演脑海中特定的轨迹移动摄像机,然后导出成视频。"李飞飞解释道,"我们关注的是让创作者、设计师、开发者手中拥有一个能给他们具有 3D 结构的世界的模型。"
六、苦涩的教训:为什么机器人更难?
AI 领域有一句名言——Richard Sutton 的"苦涩的教训"(The Bitter Lesson):简单模型 + 海量数据,永远胜过复杂模型 + 少量数据。
李飞飞说,这对她来说其实是"甜蜜的教训",因为 ImageNet 正是这一教训的受益者。但她话锋一转:这个教训对机器人并不完全成立。
那么机器人的数据从哪里来?李飞飞认为,世界模型本身就是答案——它可以生成无限多样化的合成训练环境,为机器人提供前所未有的仿真数据。
"我们的大脑只消耗约 20 瓦,比房间里任何灯泡都暗,却能做这么多事。"李飞飞说,"我在 AI 领域工作得越多,越尊重人类。"
七、AI 与就业:没有人应该被抛下


