Kandinsky 2.1:开源图像生成模型,基准比 SD 2.1 更好

Kandinsky 2.1:开源图像生成模型,基准比 SD 2.1 更好

Kandinsky2.1继承了Dall-E 2和潜在扩散的最佳实践,同时引入了一些新的想法。

作为文本和图像编码器,它使用CLIP模型和扩散图像先验(映射)在CLIP模态的潜在空间之间。这种方法提高了模型的视觉性能,并在混合图像和文本引导图像处理方面开辟了新的视野。

78572b4f9f4f49759f90d5dcbee42b29_2076989541495611392

未经允许不得转载:表盘吧 » Kandinsky 2.1:开源图像生成模型,基准比 SD 2.1 更好