LLM | Notion

<aside> 💡

자 그럼 저 단계들을 전부 다 읽고 공부를 했다고 치자. 그럼 그 이후에는 어떤 방향으로 공부를 확장시켜야해?

</aside>

정말 좋은 질문이에요! 이미지의 기법들을 다 소화했다면, 이제 실전 응용 능력을 키울 단계예요. 몇 가지 방향을 제시해볼게요.

1. Domain-Specific 전문화

기초 기법들을 특정 분야에 적용:

Vision

최신 Architecture: Vision Transformer (ViT), Swin Transformer, ConvNeXt
특화 Task: Object Detection (YOLO, DETR), Segmentation, 3D Vision
응용: Medical Imaging, Autonomous Driving, Video Understanding

NLP/LLM

LLM 특화: GPT 계열, LLaMA, Instruction Tuning, RLHF
효율화: Efficient Attention (FlashAttention, PagedAttention)
응용: RAG (Retrieval-Augmented Generation), Agent, Tool Use

Multimodal

CLIP, DALL-E 계열: Vision-Language 결합
Speech + Text: Whisper, Audio LM
최신: GPT-4V, Gemini 같은 Multimodal LLM

Audio/Speech

TTS: VITS, StyleTTS