의제

회의내용

  1. 진행상황 공유

-> 형미: 데이터셋이 서희님이 돌리셨다는 몇 백개가 다인가요..? 원래 많았던거 같은데 -> 서희: 코드 작성을 위해 샘플 데이터만 돌린 것. 지금 작성한 코드가 loss가 괜찮게 나오는 거 같아서 사용할 -> 형미: 그럼 빠른 시일 내에 전체 데이터를 돌려야 성능 확인, 파인튜닝이 가능할 듯해요..! 그리고 언어모델 쪽이랑 학습시키는 사투리 지방 통일 필요해서, 우선 경상도만 다 학습합시다.. 아 그리고 충청도로만 파인튜닝 했을 경우엔 경상도는 성능이 떨어지는 게 맞지 않나요?(과적합이라 하나요..?) -> 서희: 그래도 한국어여서 경상도 억양에 대해서도 어느 정도 이상 성능이 나올 줄 알았다


→ 서희: 테스트해볼 웹사이트를 따로 구현해둠 : https://github.com/decembix/HeardU

image.png

image.png

image.png

이후 디자인 변경

조용한 곳에서 말한 경우는 비슷하게 맞춤을 보였음 학습시킨 데이터들에 노이즈가 부족해서 이런 문제가 발생했다고 추측

image.png

음식점같이 시끄러운 곳에서 인식한 경우 잘 인식하지 못했고