로민(Lomin)은 컴퓨터비전 기술을 사용하여 실생활과 산업 전반의 여러 문제를 해결하고자 하는 3년차 기술 스타트업입니다. 로민은 컴퓨터비전 분야에 탄탄한 전문성을 가진 엔지니어 위주로 구성되어있으며, 컴퓨터비전이 필요한 다양한 어플리케이션에 적용되는 핵심 엔진들을 개발해왔습니다. 현재까지 로민이 관심을 가진 분야는 업무자동화(서류인식), 보안(CCTV), 의료, 인프라 등 다양한 영역에 걸쳐있습니다.

로민이 지금 집중하고 있는 분야는 사진으로부터 글자 정보를 추출해내는 문자인식(OCR) 기술입니다. 문자인식 기술은 컴퓨터비전 커뮤니티에서 오랜기간 연구, 개발되어 왔음에도 불구하고 여전히 충분한 성능을 보이지 않고 있으며 상용 소프트웨어들 중 클라이언트의 요구를 만족시키는 수준의 제품을 찾기 힘들기 때문입니다. 특히 문서인식의 수요가 많은 금융권에서 요구되는 기준은 매우 높기 때문에 사람과 같은 인식률의, 고신뢰 SW를 만드는 작업은 매우 도전적입니다.

로민은 2019년 과기정통부 주최의 그랜드 AI 챌린지 문자인식 트랙에서 1위를 기록하여 OCR 엔진의 높은 성능을 입증받고, 2020년부터 본격적으로 국민카드, 교보생명, 삼성화재, 신한생명, 국가기록원 등의 다양한 기업 및 기관들과 협업하여 금융사를 비롯한 다양한 기업들에서 단순반복되는 서류 처리 업무를 자동화할 수 있는 솔루션을 개발 및 공급하고 있습니다.

Textscope는 로민의 기업용 AI OCR 솔루션으로, 이번 채용으로 팀에 합류하시는 분은 Textscope의 제품 개발에 참여하시게 됩니다. 컴퓨터비전 엔지니어 포지션은 로민의 머신러닝 엔지니어, 제품개발(프론트엔드/백엔드) 엔지니어, 데이터팀 등과 유기적으로 협력하며, OCR 엔진 및 문서 인식 엔진 개발 전반을 담당합니다.

구체적으로, 컴퓨터비전 엔지니어는 다양한 상황(스마트폰 촬영/팩스 전송/스캔 등)에서 획득된 이미지에서 자유로운 형태와 배치를 가지는 텍스트를 인식하는 OCR 엔진의 성능을 개선하고, 양식이 다양한 비정형 문서 이미지에서 멀티모달 정보(텍스트의 transcription, 위치, 시각적 특징)를 기반으로 문서 구조 인식 및 텍스트 간의 관계를 예측하는 기술 개발, 문서 인식을 위한 다양한 전처리/후처리 알고리즘 개발 등을 담당하게 됩니다. 또한, 딥러닝 모델이 사용하는 메모리를 절감하고 처리속도를 향상 시키기 위해 모델 경량화 및 inference 전용 모델 변환하는 업무에도 참여합니다.

Lomin Tech Blog:

https://www.notion.so/lomin/Lomin-Tech-blog-326712e9079540709c0e117f2af2dc03

개발 직군 인터뷰 :

http://www.jobkorea.co.kr/Starter/Interview/View/21714?showHidden=True

담당업무