淘天技术团队
diffusers SD推理加速方案的调研实践总结
目前主流的加速思路包含算子优化、模型编译、模型缓存、模型蒸馏等
如果使用的SD pipeline没有对unet的各种子模块进行复杂修改,oneflow仍然值得尝试;否则,确保pytorch版本为最新的稳定版本以及适度使用deepcache可能是更省心且有效的选择。
- FlashAttention:
- oneflow
- stable-fast
- deepcache
- lcm-lora
- pytorch 2.2
https://pytorch.org/blog/pytorch2-2/