매주 “배우기 → 바로 실습 → 작은 산출물” 루틴으로 밀어붙이자. (하루 60–120분 기준, 주 5일)
환경: Python 3.10+, CUDA가 깔린 머신(또는 Colab/Kaggle).
설치: pip install torch torchvision torchaudio (CUDA 버전에 맞춤), pip install deepspeed
개발 규칙: 프로젝트 구조
project/
data/ # 원본/중간 데이터
src/
models/ # nn.Module
data/ # Dataset, transforms
train.py # 학습 루프(단일 GPU)
train_ddp.py # DDP 버전
train_ds.py # DeepSpeed 버전
eval.py
utils.py
configs/
base.yaml # 하이퍼파라미터
deepspeed.json # DeepSpeed 설정
scripts/
run_train.sh
run_ddp.sh
run_ds.sh
outputs/ # 로그, 체크포인트
README.md
목표: 텐서 조작, autograd, GPU 이동을 자연스럽게.
torch.Tensor 기초, view/reshape, broadcasting, requires_grad, backward, with torch.no_grad(), to(device)목표: nn.Module로 모델 구조화, DataLoader로 배치 학습.