3일차 (06.19)

NPZ 파일은 NumPy에서 사용하는 압축된 데이터 저장 형식

예시

np.savez_compressed('파일명.npz', X_train=X_train, X_test=X_test, y_train=y_train, y_test=y_test)

합성곱 신경망은 이미지 인식에 특화된 딥러닝 아키텍처

2차원 이미지에 적용되는 합성곱 연산을 수행하는 층

특징 맵의 크기를 줄이고 중요한 특징만 선택적으로 추출하는 층

<aside> 📢

전이 학습은 하나의 문제를 위해 학습된 모델을 다른 관련 문제에 적용하는 기계학습 방법론입니다

</aside>

기본 개념: 이미 훈련된 모델(사전 훈련 모델)의 지식을 새로운 작업에 활용합니다.
장점:
- 적은 양의 데이터로도 좋은 성능 달성 가능
- 학습 시간 단축
- 컴퓨팅 리소스 절약
- 일반화 성능 향상
주요 사용 분야: 이미지 인식, 자연어 처리, 음성 인식 등
대표적인 사전 훈련 모델:
- 이미지: VGG, ResNet, Inception, EfficientNet
- 자연어: BERT, GPT, T5
- 음성: Wav2Vec, HuBERT
구현 방법:
1. 사전 훈련된 모델 불러오기
2. 모델의 일부 또는 전체 층 동결(freeze)
3. 새로운 작업에 맞는 출력층 추가
4. 미세 조정(fine-tuning) 수행

<aside> 📌

전이 학습은 특히 대규모 데이터셋으로 학습된 모델의 지식을 활용하여, 데이터가 부족한 도메인에서도 효과적인 학습이 가능하게 합니다.

</aside>

<aside> 📌

딥러닝에서 최적화 함수는 모델의 파라미터를 업데이트하여 손실 함수를 최소화하는 알고리즘

</aside>

Batch Size 사용 이유 및 특징

배치 사이즈는 모델이 한 번에 학습하는 데이터 샘플의 개수입니다. 전체 데이터셋을 한번에 학습할 경우 메모리 문제가 발생할 수 있어, 데이터셋을 작은 단위로 나누어 모델에 입력합니다.