Fig 1
Optical flow
Spatial Transformer Network (STN)
Volume Tweening Network (VTN)
unsupervised training of end-to-end CNNs that perform voxel-level 3D medical image registration
Fig 2
To find a displacement field (or flow field) $f_{12}:\Omega\rightarrow\mathbb{R}^3$
$$ I_1(x)\approx I_2(x+f(x)) \tag{1} $$
$\text{warp}(I_2,f)(x)=I_2(x+f(x))$ : $f$에 의해 warping된 이미지 $I_2$
$I_1$과 $\text{warp}(I_2,f)$간 similarity를 최대화하는 것이 목표
$g_1,g_2$로 warping 2번한다면
$$ \begin{aligned} &\text{warp}(\text{warp}(I,g_1),g_2)(x) \\ =&\text{warp}(I,g_1)(x+g_2(x)) \\ =&I(x+g_2(x)+g_1(x+g_2(x))) \\ =&\text{warp}(I,g_2+\text{warp}(g_1,g_2))(x) \tag{2} \end{aligned} $$
the composition of two flows
$$ g_1 \star g_2=g_2+\text{warp}(g_1,g_2) \tag{3} $$
$$ \text{warp}(\text{warp}(I,g_1),g_2)=\text{warp}(I,g_1\star g_2) \tag{4} $$
STN처럼 trilinear interpolation으로 enclosing cuboid를 이어감
이미지 바깥 index는 nearest-point interpolation
→ 격자에 있는 어떤 점 $x$에 대해, 가장 가까이 있는 enclosing cuboid로 $x$를 옮기고 8 nearest lattice points들에 대해 interpolation
Regularization loss
: flow field가 unrealistic or overfitting되는 것으로 부터 방지
a) Correlation Coefficient as the similarity measurement
$$ \text{Cov}[I_1,I_2]=\frac{1}{|\Omega|}\sum_{x\in\Omega}I_1(x)I_2(x)-\frac{1}{ |\Omega|^2}\sum_{x\in\Omega}I_1(x)\sum_{y\in\Omega}I_2(y) \tag{5} $$
$$ \text{CorrCoef}[I_1,I_2]=\frac{\text{Cov}[I_1,I_2]}{\sqrt{\text{Cov}[I_1,I_1]\text{Cov}[I_2,I_2]}} \tag{6} $$
the range of correlation coefficient : [-1, 1]
영상에 non-degenerate linear function을 적용해도 correlation coefficient는 변하지 않기 때문에, $L_2$ loss를 적용하는 것보다 robust
real-world image에서 correlation coefficient는 한 이미지가 negative film이 아니라면 항상 non-negative
The correlation coefficient loss
$$ L_\text{Corr}(I_1,I_2)=1-\text{CorrCoef}[I_1,I_2] \tag{7} $$
b) Total Variation Loss (Smooth Term) as the regularization term for dense flow predictions
$$ L_\text{TV}=\frac{1}{3|\Omega|}\sum_x\sum^3_{i=1}(f(x+e_i)-f(x))^2 \tag{8} $$
Orthogonality loss and Determinant loss as the regularization terms for the affine registration subnetwork
: gradient가 너무 커지는 것을 막고 학습 안정성 확보
affinely align되기 전에 small scaling과 rotation만 필요로 함
overly non-rigid transform을 생성하는 것에 대해 penalize
→ a loss on the non-orthogonality of $I+A$
$$ L_\text{ortho}=-6+\sum^3_{i=1}(\lambda^2_i+\lambda^{-2}_i) \tag{9} $$
orthogonality loss를 계산하는 것은 $I+A$의 singular value와 관련이 있음
이미지들은 같은 비대칭성(chirality)을 가지고 있다고 가정
→ reflection과 관련된 affine transform은 허락되지 않음
$$ L_\text{det}=(-1+\text{det}(A+I))^2 \tag{10} $$
Fig 2