内容AI: 目标驱动的图像生成

mp.weixin.qq.com

IP-Adapter + ReferenceNet(Anymate-anyone)

  1. 研究现状
  2. 测试时微调
  3. 免测试时微调

SDXL和 Flux 作为基模。SDXL 和 Flux 对文字等具有较好的还原能力。  在方案选择上,我们尝试了基于 ControlNet [6]、ReferenceNet 和一些虚拟试衣的范式,并且最终基于虚拟试衣的范式并进行相应修改调整来进行参考图生成。

对于一些特定场景还在进行进一步的优化,后续完善后会逐步开源,敬请期待!