[논문] SRGAN 리뷰 : Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
참고하면 좋을 곳
SRGAN에서 소개한 Loss이다.
VGG Loss라고도 함
VGG network의 high level feature maps와 discriminator를 결합한 새로운 perceptual loss
Mean Absolute Error, Mean Square Error




둘 다 평균에 기반한 error 함수이므로,
generator의 목표 : 실제 이미지에 가까운 이미지 만들어내기
그런데 MSE나 MAE같은 평균 기반 오차를 사용하게되면 실제같은 이미지 하나( a라고 하자 )를 만들어내기보다는 데이터의 평균 ( a + b + c+ d / 4 ) 정도를 크게 벗어나지 않는 이미지를 만들어내는 것을 목표로 하게된다. 그래서 매우 흐릿한 결과를 야기한다(high frequency값 부족). 대신 데이터들의 평균적인 형체를 반영하기 때문에 형체는 잘 보존이 된다.
그래서 GAN Loss 같은 경우에는 평균에 근접하지 않아도 되고, 그저 D에게 real data로 분류만 되면 되기 때문에 이러한 현상은 발생하지 않는다. 그러나 data들의 평균적인 형체(골격)은 반영하지 않기 때문에 data의 형체가 잘 보존되지 않을 수도 있다.

SRGAN의 task는 super resolution이기에,
목표는 low resolution input image → high resolution input : $I^{LR} → I^{HR}$ 변환이다

objective
$I^{SR}$이 이 SRGAN에서 제안하는 perceptual loss이다.