阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照”

抖音秀百科网 网络资讯 2

12 月 25 日消息,阿里通义千问今日宣布 Qwen-Image-Edit-2511正式开源。

Qwen-Image-Edit 是阿里通义团队推出的图像编辑模型。2511 版本中着重进行了包括一致性提升在内的多项增强,新版本的整体生成质量、尤其是人物生成质量,得到显著提升。

Qwen-Image-Edit-2511 的主要特性包括:

  • 提升了角色一致性

  • 集成了 Lora 能力,例如打光、多场景

  • 提升了工业设计能力

  • 提升了几何推理能力

从具体案例来看,Qwen-Image-Edit-2511 提升了角色的一致性在 Qwen-Image-Edit-2511 中,角色的一致性获得了提升,模型可以依据输入肖像图进行具有想象力的编辑,并维持输入肖像的人物一致性。

此外,Qwen-Image-Edit-2511 的多人合照的一致性也进一步提升了。Qwen-Image-Edit-2509 相比于 Qwen-Image-Edit 提升了单人合照的一致性,而 Qwen-Image-Edit-2511 又进一步提升了多人合照的一致性,这种一致性使得可以输入两张人物照片,并返回一致性很好的合照。

Qwen-Image-Edit-2511 的一个新的特色是集成了部分社区的有趣 Lora Qwen-Image-Edit。Qwen-Image-Edit-2511 集成了这些 Lora,因此基础模型本身就具备一些 Lora 效果,例如打光的 Lora 效果可以在基础模型中展现:

再比如,新视角生成 Lora 效果也可以通过基础模型直接达成:

Qwen-Image-Edit-2511 在实际工程场景中的应用,比如进行批量的工业产品设计:

或是,进行工业材质替换:

值得一提的是,在 Qwen-Image-Edit-2511 版本中,模型增加了几何推理能力,模型可以直接生成一些辅助线效果:

附 Qwen-Image-Edit-2511 开源地址如下:

ModelScope:

https://modelscope.cn/models/Qwen/Qwen-Image-Edit-2511?spm=a2ty_o06.30285417.0.0.2304c9216VPArP

Hugging Face:

https://huggingface.co/Qwen/Qwen-Image-Edit-2511