Stable Diffusion WebUI Forge 是一个基于Stable Diffusion WebUI(基于Gradio)的平台,可简化开发、优化资源管理并加快推理速度。
“Forge”这个名字的灵感来自于“Minecraft Forge”。该项目旨在成为 SD WebUI 的 Forge。
与原始 WebUI(针对 1024 像素的 SDXL 推理)相比,您可以期待以下加速:
如果您使用常见的 GPU(如 8GB vram),您可以预期推理速度(it/s)会提高约 30~45% ,GPU 内存峰值(在任务管理器中)将下降约 700MB 至 1.3GB,最大扩散分辨率(不会 OOM)将增加约 2 倍到 3 倍,最大扩散批量大小(不会 OOM)将增加约 4 倍到 6 倍。
如果您使用功能较弱的 GPU(例如 6GB vram),您可以预期推理速度(it/s)会提高约 60~75% ,GPU 内存峰值(在任务管理器中)将下降约 800MB 至 1.5GB(最大)扩散分辨率(不会 OOM)将增加约 3 倍,最大扩散批量大小(不会 OOM)将增加约 4 倍。
如果您使用像 4090 这样具有 24GB vram 的强大 GPU,您可以预期推理速度 (it/s) 会提高约 3~6%,GPU 内存峰值(在任务管理器中)将下降约 1GB 至 1.4GB,最大扩散分辨率(不会 OOM)将增加约 1.6 倍,最大扩散批量大小(不会 OOM)将增加约 2 倍。
如果使用 ControlNet for SDXL,最大 ControlNet 数量(不会 OOM)将增加约 2 倍,使用 SDXL+ControlNet 的速度将加快约 30~45%。
Forge 带来的另一个非常重要的变化是Unet Patcher。使用 Unet Patcher,Self-Attention Guidance、Kohya High Res Fix、FreeU、StyleAlign、Hypertile 等方法都可以在大约 100 行代码中实现。
感谢 Unet Patcher,许多新的东西现在都可以在 Forge 中实现并得到支持,包括 SVD、Z123、masked Ip-adapter、masked controlnet、photomaker 等。
无需再对 UNet 进行 Monkeypatch 并与其他扩展发生冲突!
Forge 还添加了一些采样器,包括但不限于 DDPM、DDPM Karras、DPM++ 2M Turbo、DPM++ 2M SDE Turbo、LCM Karras、Euler A Turbo 等(LCM 从 1.7.0 开始就已经在原始 webui 中)。
由于资源皆是存于网盘,可能会存在失效情况,建议第一时间保存到自己网盘,如遇失效,请在评论区反馈,我会第一时间处理。