| 🧠 생성형 AI (Generative AI) |
데이터를 기반으로 새로운 콘텐츠를 생성함 (텍스트, 이미지, 음성 등) |
- GPT-4 (OpenAI): 텍스트 생성-DALL·E 3 (OpenAI): 이미지 생성-Midjourney: 이미지 생성- Stable Diffusion: 오픈소스 이미지 생성- MusicLM (Google): 음악 생성 |
| 🔍 자연어 처리 (NLP) |
인간 언어를 이해하고 처리하는 AI |
- BERT (Google)- RoBERTa (Meta)- T5 (Google)- GPT 시리즈 (OpenAI) |
| 🧾 언어 번역 AI |
다양한 언어 간의 번역을 수행 |
- Google Translate AI- DeepL Translator- Meta NLLB (No Language Left Behind) |
| 👁️ 컴퓨터 비전 (CV) |
이미지나 영상을 인식하고 해석 |
- YOLO (You Only Look Once)- ResNet- ViT (Vision Transformer)- CLIP (OpenAI) |
| 🔉 음성 인식 및 합성 AI |
음성을 텍스트로 전환하거나 반대로 텍스트를 음성으로 변환 |
- Whisper (OpenAI): 음성 인식- Tacotron 2 (Google): 음성 합성- Voicebox (Meta) |
| 🧮 강화학습 (Reinforcement Learning) |
보상을 통해 스스로 학습하며 의사결정을 최적화 |
- AlphaGo / AlphaZero (DeepMind)- OpenAI Five (Dota2 AI)- MuZero (DeepMind) |
| 📈 예측 및 분류 AI |
데이터를 바탕으로 예측/분류 작업 수행 |
- XGBoost- Random Forest- LightGBM |
| 🧑🏫 대화형 AI (Conversational AI) |
인간과의 자연스러운 대화를 목표로 하는 AI |
- ChatGPT (OpenAI)- Claude (Anthropic)- Gemini (Google, 구 Bard)- Cohere Command R+ |
| 🤖 멀티모달 AI |
텍스트, 이미지, 음성 등 여러 입력을 동시에 처리 |
- GPT-4o (OpenAI)- Gemini 1.5 (Google)- CLIP (OpenAI)- Flamingo (DeepMind) |