Abstract


이 논문에서는 object detection을 위한 Fast R-CNN을 제안합니다. deep CNN을 이용하여 이전의 방식들보다 더 효율적으로 object proposal을 classify합니다. 이전의 방식들과 비교하여 traing, test speed가 향상되었고, detection accuracy도 증가했습니다.

Introduction


object detection은 image classification보다 더 challenging하고 해결하기 위해서 더 복잡한 방법이 요구됩니다. 복잡성 때문에, model을 multi stage로 train하고 이로 인해서 속도가 느립니다.

이러한 복잡성은 detection이 정확한 object의 위치와 2가지 primary challenge를 요구하기 때문입니다.

  1. 많은 proposal들이 process되어야 합니다.
  2. 이 proposal들은 rough한 localization이기 정확한 localization을 얻기 위해서는 정제되어야 합니다.

이러한 문제를 해결하는 방법들은 속도, 정확도, 심플함과는 어느정도 타협이 필요합니다.

이 논문에서는 single-stage training algorithm으로 object proposal을 classify하는 것과 spatial location을 정제하는 것을 같이 학습하는 방식을 제안합니다.

R-CNN and SPPnet

R-CNN

R-CNN은 deep CNN을 이용하여 object proposal을 classify하여 object detection accuracy를 향상시켰습다. 그러나 다음과 같은 단점이 존재합니다.

  1. Training is a multi-stage pipeline
  2. Training is expensive in space and time