트랙장 : 이승준
<aside> 💡
Computer Vision은 기계로 하여금 이미지와 비디오에서 의미 있는 데이터를 해석하고 분석하며 추출할 수 있게 합니다. 딥러닝과 신경망 등 다양한 기술이 사용되며, 이를 통해 기계가 사물을 인식하거나, 상황을 인지하고, 심지어 새로운 이미지를 생성 하기도 합니다. 다시 말해, Computer Vision이란 인간의 시각과 시각 데이터를 해석하는 인지 능력을 복제하는 것입니다.
</aside>
Computer Vision은 이미지를 다루는 모든 task를 포함하지만, 대표적인 task는 다음과 같습니다.
Classification - 분류
미리 정의된 레이블에 따라 이미지 내의 개체를 분류할 수 있습니다.
Ex ) 강아지, 고양이, 사람 이미지를 모델에 넣으면 → “강아지입니다” “고양이입니다” “사람입니다”
Object Detection - 객체 탐지
이미지 속에서 특정 객체가 어디에 위치하고 있는지 찾아낼 수 있습니다.
Ex ) 1번 객체는 고양이이며, 고양이의 위치는 다음과 같습니다. ( x = 30, y = 50, w = 40, h = 80 )
Semantic Segmentation / Instance Segmentation - 의미론적 분할, 객체 분할
분할은 이미지를 구별되는 영역으로 나누어 시스템이 개별 개체와 그 경계를 인식할 수 있도록 합니다.
Ex ) (1, 1) 픽셀은 나무입니다 … (50, 70) 픽셀은 강아지입니다 (50, 71) 픽셀은 강아지입니다.