Tổng hợp về RAG

Ứng dụng RAG trong việc hỏi đáp tài liệu bài học

https://github.com/scalliontor/RAG.git:

  1. Nhận vào một PDF(file dữ liệu text)
  2. Thông qua một mô hình: chia file thành các đoạn thông tin ⇒ đẩy vào cơ sở dữ liệu (Vector Database)
  3. Nhận câu hỏi ⇒ đẩy vào Prompt
  4. Retriever: kiểm tra prompt liên quan tới phần nộ dung nào nhất
  5. Đẩy thông tin vào một model (mô hình ngôn ngữ LLM) để đưa ra phản hồi

Leaderboard VN LLM: https://vmlu.ai/leaderboard

LLMs Quantization

Retriever

Load File → Text Splitter → Vectorization (Embedding) → Vector Database

image.png

Embedding Model

image.png