Intuition
AutoEncoder 구조를 사용
Encoder : 입력(이미지 등)을 latent space로 mapping 해주는 역할
-q(z|x) 를 학습
Decoder : latent space에서 sampling된 latent vector를 입력 형태의 데이터로 복원
-p(z|x) 를 학습
착각할 수도 있어서.. mean이랑 sigma 라고 말한 게, 평균이랑 분산을 구하라는 말이 아니라.. layer 이름이 mean이랑 sigma입니다. 각각은 layer에요 ㅎㅎ
Variance Inference를 사용
학습 방법
왼쪽이 latent space(n차원)을 2차원으로 차원 축소를 해서 내린 그림인데, 보면은, 비슷한 숫자끼리는 비슷하게 모여서 학습이 되는 것을 볼 수 있습니다. 그리고 이걸 가지고 latent를 부드럽게 바꿔가면서 숫자를 뽑아내면 오른쪽처럼 서서히 변화하는 것을 볼 수 있습니다
(여기서 보면 latent vector가 숫자만 표현할 수 있는 10개를 넘어갔기 때문에(아마??) 숫자 뿐만 아니라 기울기도 특징으로 학습이 된 것을 확인해 볼 수 있습니다)