로민(Lomin)은 인공지능 기술을 사용하여 실생활과 산업 전반의 여러 문제를 해결하고자 하는 3년차 기술 스타트업입니다. 로민은 인공지능 분야에 탄탄한 전문성을 가진 엔지니어 위주로 구성되어있으며, 특히, 컴퓨터비전이 필요한 다양한 어플리케이션에 적용되는 핵심 엔진들을 개발해왔습니다. 현재까지 로민이 관심을 가진 분야는 업무자동화(서류인식), 보안(CCTV), 의료, 인프라 등 다양한 영역에 걸쳐있습니다.

로민이 지금 집중하고 있는 분야는 사진으로부터 글자 정보를 추출해내는 문자인식(OCR) 기술입니다. 문자인식 기술은 컴퓨터비전 커뮤니티에서 오랜기간 연구, 개발되어 왔음에도 불구하고 여전히 충분한 성능을 보이지 않고 있으며 상용 소프트웨어들 중 클라이언트의 요구를 만족시키는 수준의 제품을 찾기 힘들기 때문입니다. 특히 문서인식의 수요가 많은 금융권에서 요구되는 기준은 매우 높기 때문에 사람과 같은 인식률의, 고신뢰 SW를 만드는 작업은 매우 도전적입니다.

로민은 2019년 과기정통부 주최의 그랜드 AI 챌린지 문자인식 트랙에서 1위를 기록하여 OCR 엔진의 높은 성능을 입증받고, 2020년부터 본격적으로 국민카드, 교보생명, 삼성화재, 신한생명, 국가기록원 등의 다양한 기업 및 기관들과 협업하여 금융사를 비롯한 다양한 기업들에서 단순반복되는 서류 처리 업무를 자동화할 수 있는 솔루션을 개발 및 공급하고 있습니다.

Textscope는 로민의 기업용 AI OCR 솔루션으로, 이번 채용으로 저희가 함께하기 원하는 분은 Textscope의 제품 개발을 함께하시게 됩니다. 자연어처리 엔지니어 포지션에서는 로민의 컴퓨터비전 엔지니어, 제품개발 엔지니어, 데이터팀 등과 유기적으로 협력하며 양식이 다양한 비정형 문서 이미지에서 문서의 구조를 인식하고, OCR로 인식된 텍스트 간의 관계를 예측하는 기술 개발을 담당하게 됩니다.

구체적으로, 자연어처리 엔지니어는 General OCR 엔진으로 인식된 텍스트의 transcription, 위치 정보, 그리고 시각특징 정보를 결합한 멀티모달 데이터를 기반으로 문서에 있는 텍스트의 key-vlaue 관계를 유추하고, 문서 양식의 구조를 인식하여, 해당 문서에서 고객이 찾고자 하는 정보의 쿼리에 매칭되는 결과텍스트를 정형화된 데이터로 추출해내는 기술을 개발합니다. 예를 들면, 선적사 마다 다른 양식을 가진 무역서류(선하증권, 상업송장 등)에서 선적물품내역, 선적지, 선적사명, 거래번호 등의 정보를 정확하게 찾아내기 위한 머신러닝 알고리즘을 만들게 됩니다.