00后下场整顿Agent：啥都不学就能用好AI量子位

AI圈有个怪现象：

模型越来越强，确实是好事；但随着AI用法越发多样，用起来的门槛却越来越高。

ChatGPT、Gemini、Claude……即便这些模型的能力已经够强了，但真到上手干活的时候，就会发现一个尴尬的事情——

能不能用好AI，不光取决于AI有多聪明，还取决于你会不会跟它说话。

像Prompt工程、思维链、Few-shot、MCP配置、Skill调用……这些词堆在一起，就已经构成了使用上的隐形的“壁垒”，让会用AI的人和不会用AI 的人，在生成结果上拉开差距。

除此之外，像在多轮对话的过程中，还得专门花时间来审视结果；不同工作内容也需要悉心调教、引导AI来生成正确结果……实属是浪费时间。

但最近，一个由00后技术团队打造的产品，开始在科技圈引起关注。它的核心卖点简单到有些反直觉：低提示词。

说白了就是，你不用学怎么用AI，不用配什么工具链——

说句话的功夫，AI就能把活干了。直接拉近了会AI和不会AI的人之间的距离。

例如有这样一个参考视频：

现在只需要简单说一句“参考这个视频，制作胖鹅开赛车竞速的视频”，就可以模仿生成类似的视频：

这款产品叫胖鹅AI，我们拿它跟市面上一些主流AI工具做了几轮实测对比，发现结果确实有点意思。

一句话生成1分钟电商广告，直接能用

先看一个最直观的场景：AI生成视频。

我们设计了一个电商卖家的真实需求：给一款蒸汽眼罩产品做一个1分钟的宣传视频，要有分镜、有旁白、有对比画面，能直接发小红书的那种。

Prompt是这样的：

制作1分钟视频，画面从蒸汽眼罩从冰箱取出开始，特写水珠凝结；旁白是产品卖点；中间分镜展示使用场景；结尾放使用前后对比图。

在选择了Auto模式后，等了几分钟，直接出来一个1分钟的完整视频。

特写有了，旁白卡点对了，分镜节奏完整，结尾的使用对比画面也安排上了。

效果不能说完美，但作为一个直接能发小红书或者朋友圈的素材，已经跨过了“能用”那道门槛。

相比来看，Gemini的效果是这样的：

整体时长显示只有8秒钟，旁白说话有误，字幕还乱码，完全不能做到直接拿来用。

这不是个例。

我们又测了另一个场景：一句话生成可交互的数据看板网页。

对比苹果、微软、谷歌、腾讯、阿里巴巴最近三年的营收增长率、净利润率和研发投入占比，生成可交互对比看板。

等了大概一分钟，胖鹅AI直接给出了一个完整的深色主题网页。

顶部三个Tab切换指标，右上角选年份，五家公司各一张数据卡片，往下是分组柱状图、趋势折线图、排名横条图。

鼠标悬停能看数值，一切可交互。

同样的任务，用传统方式做，打开数据终端、拉数据、建表、调格式、画图，熟练工少说也得一小时。

现在，只要一句话。

这个体验跟通用问答类基础AI工具确实拉开了差距。

大部分问答类AI给你的是文字回答，分析给你，建议给你，但要变成能用的文件，对不起，得你自己整理。

而胖鹅AI交出来的，是直接可用的视频、带公式的Excel、可交互的网页看板。

做金融的朋友都懂这里面的区别：一个是Bloomberg终端的导出文件，而一个是截屏。

背后的关键是SOP

这种低提示词的体验是怎么实现的？

我们深扒了一下它的技术逻辑，发现核心不是模型本身，而是一套工程化的SOP体系。

SOP（Standard Operating Procedure），标准作业流程，这词大家不陌生。

任何成熟公司都有SOP，因为让员工自由发挥，平均结果大概率比不过一个经过验证的标准流程。

胖鹅AI团队的逻辑是：AI也一样。

即便是AGI级别的通用模型，丢给它一个验证过的SOP，效果还是会更好。

所以他们做的事情，不是造一个什么都能聊的通用AI实习生，而是造一个AI职业技术学院——

针对不同垂直任务，提前训练好一堆专科毕业的AI Agent。

用户来了不是面对一个空白对话框，而是系统自动匹配一个已经训练好的专业技工。

举个例子，当你输入“帮我做1分钟的产品视频”，系统不会把这个任务直接丢给一个通用Agent从头开始跑。

它会先识别你的需求属于“1分钟视频制作”这个垂直任务，然后把这个任务分配给专门为此优化过的SOP来执行。

这个SOP是提前训练好的，它知道1分钟视频需要规划分镜结构、匹配旁白节奏、设计转场逻辑，而不是像通用模型那样默认生成10秒片段。

这套系统背后有两个核心技术模块：