(paper link : https://arxiv.org/pdf/1909.11065v6.pdf)

OCR이라는 모듈을 사용하면 성능을 올릴 수 있음을 나타낸 표. (papers with code 참조)
0. Abstract
Semantic Segmentation → 픽셀 위치에 Class Index가 매겨져 있다.
이는 곧, 픽셀과 Object Class의 연관성(=Context)을 찾으면 성능을 올릴 수 있음을 의미한다.
알고리즘은 다음과 같다:
- Semantic Segmentation 학습을 수행한다. = Object Region을 학습한다
→ 자동차는 창문이 있고, 앞에 헤드라이트가 있고, 평평한 바닥 같은 것 위에 있다 등등…
- 객체 영역(ex. colormap)에 있는 실제 픽셀 값의 표현을 수집(aggregation)
→ “Object region representation” 을 학습할 수 있음.
- 각각의 Object 영역 ↔ 각 Pixel 간의 relation 을 계산한다.
각 픽셀의 representation을 수집, 해당 Object 별로 가중치를 다르게 준다(weighted).
0-1. HRNet
High-Resolution Network

ref : https://paperswithcode.com/method/hrnet