部分截图
该模型基于Würstchen架构构建,与稳定扩散等其他模型的主要区别在于它在更小的潜在空间中工作。为什么这很重要?潜在空间越小,推理速度就越快,训练成本也就越低。潜在空间有多小?稳定扩散使用压缩因子 8,从而将 1024×1024 图像编码为 128×128。 Stable Cascade 的压缩系数为 42,这意味着可以将 1024×1024 图像编码为 24×24,同时保持清晰的重建。然后在高度压缩的潜在空间中训练文本条件模型。与稳定扩散 1.5 相比,该架构的先前版本实现了 16 倍的成本降低。
由于资源皆是存于网盘,可能会存在失效情况,建议第一时间保存到自己网盘,如遇失效,请在评论区反馈,我会第一时间处理。
数据统计
相关导航
暂无评论...