生成AIは、存在しない論文を引用したり、実在しない人物の発言をでっち上げたりする。これは「バグ」ではなく、大規模言語モデルの動作原理そのものに起因する現象だ。対策を知る前に、まず「なぜ起きるのか」を理解しておくと、AIとの付き合い方が根本から変わる。
生成AIがハルシネーションを起こす根本的な理由
大規模言語モデル(LLM)は、大量のテキストデータから「次にどんな単語が来そうか」を学習したシステムだ。検索エンジンのように「正しい情報を引き出す」仕組みではなく、「それらしい文章を生成する」ことに最適化されている。
つまり、モデルの目標は「もっともらしい答えを出すこと」であって、「事実を確認すること」ではない。結果として、知識の外側にある質問に対しても、自信満々で回答を生成してしまう。
これを「幻覚(ハルシネーション)」と呼ぶ。英語の hallucination からきており、AIが存在しない情報を実在するかのように出力する現象を指す。
ハルシネーションが起きやすい状況
現場での経験から、特に注意が必要なケースをまとめると次のようになる。
具体的な数字や固有名詞を求める質問 「〇〇社の2023年の売上高は?」「〇〇氏の発言は?」といった問いに対して、AIは学習データにそれらしい情報があれば引っ張り出し、なければ作り上げる。数字や名前は特に確認が必要だ。
学習データのカットオフより後の情報 モデルの学習データには期限がある。そのカットオフ以降に起きた出来事については、AIは「知らない」とは言わず、それらしい推測で補完することがある。
ニッチな専門分野 医療・法律・会計など、専門性が高く訓練データが少ない領域ほどリスクは高い。表面上は正確に見える文章でも、細部が誤っているケースが多い。
出典や根拠を求める質問 「〇〇という研究を教えて」と聞くと、存在しない論文のタイトルと著者名と掲載誌を生成することがある。これが一番やっかいだ。
現場で使えるハルシネーション対策
ゼロにはできないが、リスクを下げる方法はいくつかある。
まず、AIに「わからない場合はわからないと言って」と明示的に伝えることが効果的だ。これだけでも不確かな情報の出力が減る。
次に、重要な情報は必ず別の手段で裏取りする習慣をつける。AIが生成した文章をそのまま信頼するのではなく、引用元や数字は公式サイトや一次資料で確認する。
RAG(Retrieval-Augmented Generation)という技術も有効だ。AIが回答を生成する前に、信頼できるデータベースや文書から関連情報を検索させる仕組みで、企業での業務利用ではこのアーキテクチャが標準になりつつある。
また、プロンプトに具体的なコンテキストを与えることでも精度は上がる。「一般的に教えて」より「この資料を踏まえて教えて」のほうが、AIが作り話をする余地が減る。
ハルシネーションは「欠陥」ではなく「特性」として扱う
生成AIを正しく使うためには、この特性を理解した上で役割を与えることが大切だ。
AIが作った文章をそのままで出すのは、まだ早い。でも下書きや構成案として使うなら話は別で、そこから人間がファクトチェックして仕上げる分業体制が今のところ現実的な落としどころだと思っている。
AIは「記憶装置」ではなく「推論エンジン」だと捉え直すと、使い方の方針が見えてくる。