LayerDiffusion:直接生成透明的PNG图片
一个非常有意思的项目可以用 SD 直接生成透明的 PNG 图片,也可以直接生成带有透明度分层的图片。
LayerDiffusion使得大型已经过预训练的潜在扩散模型(latent diffusion model)能够创造透明图像。
这项技术不仅可以生成单独的透明图像,还能生成多层透明图层。它通过一种被称为“潜在透明度”的方法,将透明度(即 alpha 通道)整合到预训练的潜在扩散模型的潜在结构中。
这样做的好处是,它通过以潜在偏移的形式加入透明度,几乎不改变模型原有的潜在分布,从而保持了模型的高质量输出能力。基于这种方法,任何一个潜在扩散模型都可以通过对潜在空间的微调,转化为透明图像生成器。
我们训练这个模型时,使用了一种涉及人机互动的方法,收集了一百万组透明图像层数据。
我们的研究显示,这种潜在透明技术不仅可以应用于不同的开源图像生成器,还可以适配多种条件控制系统,实现例如基于前景/背景条件的层生成、层的联合生成、对层内容进行结构控制等多种应用。
目前已经可以在forge的扩展上使用了,你可以在这里下载:https://github.com/layerdiffusion/sd-forge-layerdiffusion
同时ComfyUI也有人适配了插件,这里下载:https://github.com/huchenlei/ComfyUI-layerdiffusion