RAGとファインチューニング。AIを業務で使い始めると、この2つの言葉に必ず出くわす。でも「何が違うの?」と聞かれたとき、すっきり答えられる人は意外と少ない。結論から言うと、RAGは「AIに資料を渡して調べさせる方法」、ファインチューニングは「AIの頭の中を書き換える方法」だ。この違いを頭に入れるだけで、どちらを選ぶべきかがかなりはっきりしてくる。

RAGとは、AIに「カンニングペーパー」を渡すようなもの

RAG(Retrieval-Augmented Generation)というのは、質問に答える前にAIが関連する文書を検索して、その内容を参照しながら回答を生成する仕組みだ。

試験で例えるなら、答案用紙に向かう前に「この資料集の中から必要なページを探していい」と許可される感じに近い。AIが丸暗記で答えるのではなく、都度ドキュメントを参照して答える。

社内の議事録、マニュアル、製品カタログ、契約書——こういった「最新の情報」や「特定の組織にしかない情報」を扱うのが得意な方法だ。AIが学習した時点では存在しなかった情報でも、検索対象に加えておけばきちんと答えられる。

ファインチューニングとは、AIの「価値観や知識」を植え付けること

ファインチューニングは、ベースとなるAIモデルに対して、追加のデータでさらに訓練をかける手法だ。特定の口調、特定の知識、特定の判断基準をAIに染み込ませる、というイメージが近い。

「この会社のカスタマーサポートらしい話し方をする」「医療用語を正確に使う」「法律文書特有の表現に慣れている」——こういった「スタイルや専門性」を身につけさせるのに向いている。

ただし、ファインチューニングは一度学習させたらその時点で止まる。新しい情報を追加するたびに再学習が必要で、コストも時間もかかる。情報が頻繁に更新される用途には向かない。

RAGとファインチューニング、どちらを選ぶべきか

正直に言うと、多くのビジネス用途ではRAGのほうが使いやすい。理由は3つある。

1つ目は更新のしやすさ。社内のナレッジベースや製品情報は日々変わる。RAGならドキュメントを差し替えるだけで対応できる。ファインチューニングだと、変更のたびに再学習が必要になる。

2つ目はコスト。ファインチューニングには、データ整備と計算資源にまとまった投資がいる。RAGは既存のAPIに検索機能を組み合わせることで比較的低コストで動かせる。

3つ目は透明性。RAGは「この文書を参照した」というトレーサビリティが残せる。医療・法律・金融など、根拠の提示が重要な領域では特に重宝される。

一方でファインチューニングが光るのは、特定の文体や判断パターンを徹底させたいときだ。カスタマーサポートのトーン統一、業界特有の略語の扱い方、といったケースでは効果を発揮する。

両方を組み合わせることも選択肢のひとつ

RAGとファインチューニングは二択ではない。「ファインチューニングで専門的なトーンを身につけさせつつ、最新情報はRAGで補う」という組み合わせも実際に使われている。

どちらか一方で解決しようとするより、それぞれの得意なことを整理して組み合わせるほうが、たいていうまくいく。