2015년에 먼저 발표된 논문은 Image Style Transfer Using Convolutional Neural Networks과 같은 연구팀의 논문이다.
A Neural Algorithm of Artistic Style
2016년 발표된 이 논문은 "A Neural Algorithm of Artistic Style"과 많은 내용이 중복된다.
Content Reconstructions → Target Image.
Style Reconstructions → Artworks.
Style Reconstructions를 위해 CNN Representations 위에 Feature Space를 구축했다.
Style은 같은 Layer의 다른 Features Map 사이의 Correlation으로 정의된다.
여러 Layer를 포함하는 Multi-scale이다.
Lower Layer에서는 '원본 Content' 정보는 대부분 무시하고 Texture만 복원한다.
복원이 잘 이루어지므로 Correlation이 높다.
Higher Layer에서는 '원본 Content' 정보를 포함하여 미술 작품과 비슷한 이미지가 나온다.
복원이 잘 이루어지지 않으므로 Correlation이 낮다.
Content Representations와 Style Representations는 분리할 수 있다.
같은 Network를 사용하여 Content와 Style을 복원하고, 그 둘로 새로운 의미 있는 이미지를 만들 수 있다.
논문에서 CNN Base Network로 VGG19를 사용한다.
VGG19의 구조를 모두 사용하지는 않고, 16개의 Conv Layer와 5개의 Pooling Layer를 사용한다.
Pooling Layer는 Image Reconstruction이라는 목적에 맞게, 기존의 Max Pooling이 아닌 Average Pooling을 사용한다.