<aside>
💡
자 그럼 저 단계들을 전부 다 읽고 공부를 했다고 치자. 그럼 그 이후에는 어떤 방향으로 공부를 확장시켜야해?
</aside>
정말 좋은 질문이에요! 이미지의 기법들을 다 소화했다면, 이제 실전 응용 능력을 키울 단계예요. 몇 가지 방향을 제시해볼게요.
1. Domain-Specific 전문화
기초 기법들을 특정 분야에 적용:
Vision
- 최신 Architecture: Vision Transformer (ViT), Swin Transformer, ConvNeXt
- 특화 Task: Object Detection (YOLO, DETR), Segmentation, 3D Vision
- 응용: Medical Imaging, Autonomous Driving, Video Understanding
NLP/LLM
- LLM 특화: GPT 계열, LLaMA, Instruction Tuning, RLHF
- 효율화: Efficient Attention (FlashAttention, PagedAttention)
- 응용: RAG (Retrieval-Augmented Generation), Agent, Tool Use
Multimodal
- CLIP, DALL-E 계열: Vision-Language 결합
- Speech + Text: Whisper, Audio LM
- 최신: GPT-4V, Gemini 같은 Multimodal LLM
Audio/Speech