<참고자료>
https://ffighting.net/deep-learning-paper-review/diffusion-model/diffusion-model-basic/
https://www.youtube.com/watch?v=1pgiu--4W3I&t=696s
이 글을 정리하는 목적
https://ffighting.net/deep-learning-paper-review/diffusion-model/diffusion-model-basic/
위 블로그를 참고하는 것을 추천한다.
강점 (왜 많이 쓰나)
- 샘플 품질: 텍스처·디테일 복원력이 뛰어나 고해상도 이미지·비디오 품질이 매우 좋음.
- 조건부 제어가 용이: 텍스트, 스케치, 세그맵, 포즈, 깊이, 음성 등 다양한 조건을 깔끔히 얹기 쉬움(멀티모달 확장에 유리).
- 데이터 분포 커버리지: 모드붕괴가 적어 다양성 확보가 좋음.
- 훈련 안정/재현성: 하이퍼 민감도가 상대적으로 낮아 대규모 학습 파이프라인 구축에 적합.
- 안전·편집 친화성: 점진적 복원이라 인페인팅/아웃페인팅/스타일 컨트롤 같은 편집이 자연스러움

