배경
2023 겨울방학 딥러닝 스터디
- ResNet, MobileNetV2, EfficientNet 논문 리뷰와 코드 구현
- 세 모델의 공통점: 이미지 분류, 객체 탐지, 이미지 생성 등의 컴퓨터 비전 작업에 주로 사용된다. CNN 구조를 기반으로 한다.
- 모델 테스트는 cifar10 데이터셋을 이용했다
이론적으로 공부한 내용을 다른 데이터셋에도 적용해보고자 함 → MIMII 데이터셋 선택
기존 아이디어:

- MIMII Dataset은 기계의 정상적인 작동 소리와 고장 상태에서의 작동 소리를 포함하는 데이터셋이다.
- MIMII Dataset의 소리 데이터를 Mel Spectrogram으로 변환해 2D 데이터 형태로 만든다.
- 변환된 2D 데이터를 ResNet, MobileNetV2, EfficientNet에 input으로 넣는다.
- Supervised 방식으로 모델을 학습시킨다.
- 학습 결과 각 모델이 정상, 비정상을 잘 구분하는지 확인한다.
결과:
높은 accuracy, 낮은 F1-score
→ 정상, 비정상 데이터를 잘 분류하지 못했다.

Mobilenet epoch 50일 때의 confusion matrix
결과에 대한 이유 분석