中国开源“PS模型”强过Nano Banana量子位
太香了太香了,妥妥完爆ChatGPT和Nano Banana!
刚刚,ViT核心作者、Meta超级智能团队成员Lucas Beyer连发三条帖子,怒赞通义千问不久前发布的开源模型Qwen—Image—Layered。
在他看来,这才是图像生成的正确打开方式~
他还顺便自补了一句:这个模型方向自己其实也想做来着,只是太忙,一直没来得及动手……(笑)
实话实说,Qwen—Image—Layered模型确实不一般,因为它可以让我们真正实现ps级别的拆图自由。
也就是说现在图片元素也支持精细化修改了:
连网友们看了模型效果后都不禁感叹:咋有种开源PhotoShop的感觉,amazing啊~
所以,这套让Lucas Beyer反复点赞的模型到底强在哪儿,咱一起来看!
图片也能像PS一样拆拆拆了
如果说Nano Banana技能点在生图,那Qwen—Image—Layered模型则厉害在:《拆图》。
相信大家都有过类似的经历,我们平时用大模型生图时总会碰的到一个抓狂问题,那就是图片生成so easy,细节修改so抓狂!!!
AI生出来的图片里,经常会有一些小细节不太到位,但我们又没法只改局部,只能整张丢回模型重新生成,结果往往还不如上一版…
Qwen—Image—Layered模型的核心能力,就是专治「一图定生死」这事儿的。
它能将一张普通图片分解成多个包含透明度信息的RGBA分离图层,实现真正意义上的图片素材的可编辑性。
光说概念有点抽象,咱直接看例子~
在官方案例中,一张完整图片输入之后,模型会自动把画面拆成6个包含不同元素的图层,背景是背景,人物是人物,装饰是装饰,互不干扰。
看到这儿大家是不是突然感觉,这个非常适合用在海报制作等细节较多的图片上??(雀实
但是Qwen—Image—Layered模型能做的还不止只是分离图层这么简单,我们还可以对图层进行二次编辑修改。
比如最基础的:改背景,不动主体。
只替换背景图层的颜色,一张橙色背景的海报,瞬间就能换成蓝色版本:
再比如,直接换主体。
保持构图不变,把原图里的长发女孩,换成短发女孩,几乎看不出拼接修改痕迹:
再来看下面这个——文字编辑。
我们可以只修改图片中的局部文字,哪怕第一次生成的文字有幻觉问题也不怕了:
除了基本的替换编辑功能外,Qwen—Image—Layered模型还支持调整元素的大小、删除不想要的元素等等。
例如像这样,我们可以删除掉画面中不想要的元素对象,只保留自己想留的画面元素:
又或者在不拉伸、不失真的前提下,轻松调整元素的大小比例,其实有点像PS里的自由缩放功能:
值得注意的是,Qwen—Image—Layered模型分层不限于固定的图层数量,支持可变层分解,例如我们可以根据需要将图像分解为3层或8层:
这个能力非常适合我们在不同的编辑需求场景下使用,可以根据我们想局部编辑的元素数量多或少而定。


