AI PPT,这次是真不用返工了量子位

5/6/2026

过去一两年,AI做PPT这事儿一直处在一个比较尴尬的位置。

能用,但不好用。

虽然速度是比手搓快,但细看全是“幻觉数据”和“拼凑式模板”,后续改起来比从头做还累。

所以圈内有个心照不宣的判断:AI PPT不说是个伪需求,但至少是被高估的需求。

然而进入“龙虾时代”后,这个判断开始松动了。

起因是,市面上开始出现以多智能体驱动为代表的AI产品了——比如我最近刚刷到的讯飞智文Vision Agent(以下简称“讯飞智文”)。

抱着试一试的心态,我就随手丢了一句,“做一份伊犁+赛里木湖5天4夜自驾环线实用攻略PPT、公路胶片质感、呼吸感拉满”,结果没多久,17页PPT直接出来。

一看效果,它已经不是套模板那种凑合,而是可以直接拿去用的完整攻略,结构、信息、视觉都在一个专业水准上。(P.S.测完反手问了五一去新疆旅游的朋友,回复说攻略基本准确。)

更关键的还是后面这件事。

同一个工具,我又跑了“龙虾”科普教程、《西方艺术史》期末汇报、AI漫短剧行业研究报告……几种完全不同的应用场景和风格,没想到它都hold住了。

这就有点意思了。几个case好可以靠运气,但换什么题都能做对,只能说明它底层能力是稳的。

而这种“稳”,恰恰是这一年“龙虾”们的共同画像——从代码到设计,凡是被它碾过的赛道,都不再是“能不能用”的问题,而是“商业级好不好用”的问题。

放在PPT这个赛道,讯飞智文Vision Agent,无疑就是那只“龙虾”。而它显然也代表着:

AI PPT,正在从“能不能生成”的1.0阶段,跨进“能不能用于商业级表达”的2.0阶段。

那么问题来了——

讯飞智文背后做了什么?这一代AI PPT,到底卷到哪一步了?

咱实测说话。

抽卡变协作,AI PPT终于进化了

先说怎么打开。

进入讯飞智文官网,登录后点击Vision Agent(Beta)模式,然后直接往对话框里丢需求就行。

以制作赛里木湖(小团体版)旅游攻略为例,整个PPT生成流程一共分四步:

意图洞察→大纲构建→内容精炼→设计渲染。

划重点,每一步都可干预(风格可自由选、大纲/内容可编辑),不过在选择时需要注意时间——系统默认30s,过时按默认选项生成。

这个设计有点意思,既保留了用户的控制权,又不让选择困难症拖慢节奏。J人福音,P人也不至于卡死。

P.S.目前Beta版本生成的PPT只支持下载为PDF格式,可编辑的PPTX跑步入场中。

了解完流程,接下来咱跑步进入真刀真枪环节——

直接丢几个完全不同的需求进去,康康它到底能不能接住。

开测之前,得先交代一个背景。

讯飞智文这位选手其实不是突然冒出来的——过去一年,它已经在“一句话生成结构清晰的PPT”这件事上,跑通了千万级用户。

这次升级,主要就是冲着“内容水、排版土、没设计感”这些AI PPT的老毛病去的。

所以咱接下来也主要往这些方面测。

PPT,当然要一眼好看了

第一题先考审美。

PPT说白了就是用来展示的,好不好看,基本就是第一关。

为了考验讯飞智文的设计sense,我直接让它帮咱量子位虚拟茶饮品牌“量量不喝茶”做一期春季营销策划案。

为“量量不喝茶”制作春季营销策划案PPT。先分析2026春季茶饮趋势,然后基于趋势提出3款春季限定新品,并设计传播主题与快闪活动。整体视觉为高端杂志风。

老实说,第一眼就被封面吸引了。

深咖底铺满,右侧一只玻璃杯,几片樱花落在黑色台面上,光影很克制,氛围一下就有了。上面一行“SPRING EXCLUSIVE”,左边大标题拉开字距——真有点时尚杂志那味儿。

点进去也很对味。深色底+低饱和粉+米白字,从封面到内页风格统一。目录、正文、图表都挺克制,没有那种东拼西凑的“PPT味”。

要知道这种深色风很容易翻车,一不小心就变电商banner,但这次还挺稳的——该黑的黑,该空的空,看着舒服。

而且也没有那些熟面孔素材,什么“商务握手图”“齿轮全球图”,一张都没见。

Scroll for more