오후 5시 팀 회의 시작합니다!!
파인튜닝 다양한 방법으로 해보기!
미학습(Pretrained) 테스트 → 에러 분석
케이스별 오차를 분류
작은 글씨 누락
특수 폰트 오인식
컬러 글자/배경 간섭, 숫자· 특히 !! 기호(mg/%/–) 혼동
EXP/LOT 패턴 오류로 분해
탐지(det) : 문장/라인 단위 통일 → 타이트해서 에러 발생할 수도? → 여백 포함 라벨 만들기
라벨 설계
인식(rec) : 크롭 이미지 ↔ 텍스트 쌍
필드 태그(도전!💥): 제품명 / 성분/ 함량/ 용량 등등 필드 라벨 별도로 유지한 뒤에 후처리때 결합
합성 데이터 : 예를 들어서 V-어쩌고 , B-저쩌고 이런게 많았다. → 실제+합성(6:4~7:3) 구성해보는 것도 좋을듯!
환경·전처리
배경균일화만 하면 될듯..?