FLUX.2-klein-4B 리포지토리에 VAE가 포함되어 있지 않아, black-forest-labs/FLUX.2-dev 리포지토리에서 ae.safetensors 파일만 별도로 추출하여 통합함.단순히 4B 모델이라고 해서 4GB가 아님. 텍스트 이해를 담당하는 Encoder가 매우 거대함.
Transformer (Diffusion Core): 7.75 GB (핵심 생성 엔진)
Text Encoder: 약 8.05 GB (프롬프트 이해)
VAE (Autoencoder): 336 MB (이미지 압축/복원)
Total Footprint: 약 16.1 GB (초기 로드 시 시스템 RAM 부하의 주원인)
(※ 실제 구동 시 메모리 점유율 변화는 4. 인프라 최적화 섹션의 작업관리자 캡처 화면 참조)
📂 기반 코드: Black Forest Labs 공식 GitHub 리포지토리(https://github.com/black-forest-labs/flux2)를
git clone하여 베이스라인 구축.
input_images 경로 파싱 과정에서 역슬래시(\\) 처리 문제 및 os.path.exists의 엄격한 체크로 인해 유효한 경로를 인식하지 못함.scripts/cli.py의 인자 파싱 로직을 재설계하여, 경로 존재 여부 체크를 완화하고 Path 객체로 직렬화하도록 수정.# [Before] 수정 전 코드: 경로가 완벽하지 않으면 리스트에 추가조차 안 됨
if os.path.exists(part):
items.append(Path(part))
else:
print(f"File {part} not found. Skipping for now...")
# [After] 수정 후 코드: Windows 경로 호환성을 위해 체크 로직 우회 및 강제 주입
items.append(Path(part))
# Windows 환경 변수 문제로 인한 False Negative 방지
klein 모델 사용 시에도, 업샘플링과 안전 검사를 위해 무거운 FLUX.2-dev (Mistral 기반) 모델을 추가로 로드하도록 하드코딩되어 있음. 이로 인해 불필요한 VRAM/RAM 점유가 발생하고, 경량화 모델(Qwen)과는 호환되지 않는 메서드(test_image) 호출로 에러 발생.FLUX.2-dev 모델 로딩 로직을 제거하고, 이미 로드된 text_encoder를 재사용하도록 변경하여 메모리 스파이크 방지.