RAGとは? 一言でいうと…
- *「AIのための、超優秀なアシスタント付き『オープンブックテスト』の仕組み」**のことです。
AIに質問をするとき、AIが自分の記憶(学習済みデータ)だけで答えさせようとすると、情報が古かったり、ウソ(ハルシネーション)をついてしまったりすることがあります。
そこで、AIが答える直前に、質問に関連する**最新で正確な資料(カンニングペーパー)**をアシスタントに探させて、それを読ませてから答えさせる。この一連の賢い仕組み全体がRAGです。
「超優秀な生徒のテスト」でイメージしてみよう
これまでのAI技術を、一人の「物知りだけど、知識が少し古い生徒」に例えてみます。
状況1: 普通のテスト(AI単体)
- この生徒(AI)は、2023年までの教科書の内容はすべて暗記しています。非常に優秀です。
- しかし、先生が「2024年に起こった経済ニュースについて教えて」というテスト問題を出しました。
- 生徒は2023年までの知識しかないので、「分かりません」と答えるか、知っている知識からそれっぽいウソの答えを創作してしまいます。(これがハルシネーションです)
状況2: オープンブックテスト(RAGの仕組み)
先生は、この生徒に超優秀な図書館司書のアシスタントを付けてあげることにしました。これがRAGの導入です。
テストの流れがこう変わります。
- 先生が質問を出す
- 「2024年に起こった経済ニュースについて、A社が発表した新技術が市場に与えた影響を教えてください」
- アシスタントが資料を探す(これが『検索』:Retrieval)
- 生徒が答える前に、アシスタント(RAGの検索システム)が図書館へダッシュします。
- 図書館には、最新のニュース記事や社内文書といった、生徒が知らない新しい本がたくさんあります。
- アシスタントは、質問にピッタリ関連する「A社の新技術に関する2024年の記事」を数ページ見つけてきます。
- (※この時、どうやって関連ページを探すのか? → 先日解説したEmbeddingの技術がここで活躍します! 質問と資料の「意味の住所」が近いものを探しているのです。)
- 生徒に参考資料を渡す(これが『補強』:Augmentation)
- アシスタントは、見つけてきた資料のコピーを、問題用紙と一緒に生徒の机に置きます。
- 生徒への指示は、こうなります:「この参考資料を必ず読んだ上で、質問に答えてください」
- 生徒が資料を読んで回答する(これが『生成』:Generation)
- 生徒(AI)は、自分の元々の知識に加えて、たった今渡された最新の資料を読み込みます。
- そして、その新鮮で正確な情報に基づいて、質の高い回答をスラスラと書き上げます。
- 「2024年にA社が発表したXXXという技術は、参考資料によれば市場に〜〜という影響を与えました。」のように、情報源に基づいた信頼性の高い答えになるのです。
RAGと、これまでの技術との決定的な違い