(paper link : https://arxiv.org/pdf/1909.11065v6.pdf)

Untitled

OCR이라는 모듈을 사용하면 성능을 올릴 수 있음을 나타낸 표. (papers with code 참조)

0. Abstract

Semantic Segmentation → 픽셀 위치에 Class Index가 매겨져 있다.

이는 곧, 픽셀과 Object Class의 연관성(=Context)을 찾으면 성능을 올릴 수 있음을 의미한다.

알고리즘은 다음과 같다:

  1. Semantic Segmentation 학습을 수행한다. = Object Region을 학습한다 → 자동차는 창문이 있고, 앞에 헤드라이트가 있고, 평평한 바닥 같은 것 위에 있다 등등…
  2. 객체 영역(ex. colormap)에 있는 실제 픽셀 값의 표현을 수집(aggregation) → “Object region representation” 을 학습할 수 있음.
  3. 각각의 Object 영역 ↔ 각 Pixel 간의 relation 을 계산한다. 각 픽셀의 representation을 수집, 해당 Object 별로 가중치를 다르게 준다(weighted).

0-1. HRNet

High-Resolution Network

ref : https://paperswithcode.com/method/hrnet

ref : https://paperswithcode.com/method/hrnet