前OpenAI工程师掀起网页革命:HTML死了51CTO技术栈
想象一下:你打开浏览器,没有代码、没有 HTML、没有 CSS 布局引擎。屏幕上每一帧画面,都是 AI 模型实时生成的像素视频流。
它能瞬间理解你的意图,动态重塑整个界面——从巴黎旅行规划到复杂数据可视化,全是手绘级插图般生动,还能随点击无缝变形、交互。
满满的科幻降临既视感!
这就是 Zain Shah(前 OpenAI、YC 校友)和团队刚刚发布的 Flipbook 原型。
体验地址:flipbook.page
短短一天,X 平台爆火两百百万浏览。网友们已经玩疯了!手机上也能玩。
如果你开启 live video stream 模式,体感会更震撼~
Zain 放出了优化后的 LTX Studio 视频模型实现的真实演示:1080p 24fps 实时流式传输,背后是 Modal GPU 服务器。
传统 Web 开发范式被彻底击穿:
无需前端布局、上网像翻书一样
现在的网页阅读,“是由僵硬的代码和规则生成的,这使得传达复杂而详尽的想法变得困难。”
而 Flipbook 摒弃了这一点,它的理念是:一图胜千言。你落到的每一个“页面”都是一张图像。
奇妙之处在于,点击图像中的任何一个角落,你都会得到一张新的图像,可以继续对该事物进行更深入的探索。
你所看到的内容都不包含任何 HTML、代码、特定的链接或字段。整个网络仅仅是显示在你屏幕上的生成像素,甚至连文字也都是图片中的像素构成。
真正的翻书页一样的体验。
过去 20 年,我们依赖 HTML + CSS + JavaScript + React 等构建界面。现在,Flipbook 把一切简化为“像素流”:模型直接决定你看到什么、怎么交互。
▪︎无需布局引擎:插图随窗口自适应变形,不再被 CSS 框死。
▪︎全屏互动:任何像素都能响应点击,模型实时判断意图,不再局限于预定义按钮。
▪︎视觉优先:复杂概念用插图、动画、真实渲染表达,而不是枯燥文字和矩形框。
转给我的一个信号就是:前端工程师的“写代码搭界面”时代可能走向终结。
AI原生浏览,真的无敌
小编立刻去体验来一把,的确有一种“无限探索式阅读”的感觉。
例如:今天Qwen3.6-27B 模型发布了,之前总要仔细看下各项基准评分的对比,现在我直接交给 Flipbook 帮我解读了。
我点击了业界现在非常关注的“SWE-bench Verified”,片刻后,它就像一个放大镜工具一样,帮我生成了更为具体对比数字和分析。
我继续点击强相关的 Agentic Flow,它就给出了可视觉化的Loop图。
这种自带强烈探索感的交互方式前所未有。
如果你想返回上个页面怎么办,导航栏里已经帮你做好了路径记忆,只需要回溯点击即可。
别小看这个小工具,外界对此视为一个行业地震信号。
除了解读复杂的图表,我还发现了别的妙用:解读现实人物微表情。
解读明星的表情特质。本着不浪费的原则,我把“沈腾时代周刊封面”喂给了 Flipbook。这表情,从眉毛、眼睛到鼻子、嘴,就连酒窝也被解读的明明白白的。
得,沈腾这张脸,太权威了。
其实还有很多奇怪的用途,只有你想不到,没有 Flipbook 做不到的。


