淘天技术团队

diffusers SD推理加速方案的调研实践总结

目前主流的加速思路包含算子优化、模型编译、模型缓存、模型蒸馏等

如果使用的SD pipeline没有对unet的各种子模块进行复杂修改,oneflow仍然值得尝试;否则,确保pytorch版本为最新的稳定版本以及适度使用deepcache可能是更省心且有效的选择。

  1. FlashAttention:
  2. oneflow
  3. stable-fast
  4. deepcache
  5. lcm-lora
  6. pytorch 2.2

https://pytorch.org/blog/pytorch2-2/