OCR 프로젝트를 진행하면서 맞닥뜨린 가장 큰 문제 중 하나는 Annotation 이 없다는 것이었습니다. 기존의 데이터셋이 Segmentation Mask 로만 구성되었기 때문에, 텍스트 영역을 찾는 것은 불가능해 보였습니다. [1] Keyword Spotting 과 같은 방법들이 존재했지만, line-level 의 Segmentation Mask 가 필요하였고 이는 단지 신분증 영역의 Segmentation Mask 만 존재했던 데이터셋에서는 불가능한 접근법이었습니다. 따라서 Label 이 없어도 Visual Features 만으로도 Landmarks 를 탐지할 수 있는 알고리즘이 필요하였습니다. 따라서 가장 기본이 되는 모델인 Random Sample Consensus(이하 RANSAC)부터 시도해보기로 하였습니다. 이론에 관한 설명은 *Epipolar Geometry* 를 참조합니다.
[1] Retsinas, G., Louloudis, G., Stamatopoulos, N., Sfikas, G., & Gatos, B. (2019). An alternative deep feature approach to line level keyword spotting. 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), pp. 12650-12658.