
이 논문에서는 object detection을 위한 Fast R-CNN을 제안합니다. deep CNN을 이용하여 이전의 방식들보다 더 효율적으로 object proposal을 classify합니다. 이전의 방식들과 비교하여 traing, test speed가 향상되었고, detection accuracy도 증가했습니다.
object detection은 image classification보다 더 challenging하고 해결하기 위해서 더 복잡한 방법이 요구됩니다. 복잡성 때문에, model을 multi stage로 train하고 이로 인해서 속도가 느립니다.
이러한 복잡성은 detection이 정확한 object의 위치와 2가지 primary challenge를 요구하기 때문입니다.
이러한 문제를 해결하는 방법들은 속도, 정확도, 심플함과는 어느정도 타협이 필요합니다.
이 논문에서는 single-stage training algorithm으로 object proposal을 classify하는 것과 spatial location을 정제하는 것을 같이 학습하는 방식을 제안합니다.
R-CNN
R-CNN은 deep CNN을 이용하여 object proposal을 classify하여 object detection accuracy를 향상시켰습다. 그러나 다음과 같은 단점이 존재합니다.