ハルシネーション

用語解説

ハルシネーション（幻覚）とは、LLMが事実と異なる情報・存在しないデータ・誤った引用などを、まるで正確な情報であるかのように自信を持って出力する現象を指します。意図的な虚偽ではなく、テキストの統計的パターンから「それらしい」文章を生成する過程で生じる構造的な問題です。

ハルシネーションが起きやすい状況は以下の通りです。

主な対策として、①RAGシステムで外部ソースを参照させる、②出力に根拠・引用を付けさせる、③事実確認が必要なアウトプットは必ず人間がレビューする、があります。

ハルシネーションのリスクが特に高い業務場面は以下の通りです。

逆に、創作・アイデア発散・初稿生成など「正確性よりも多様性」が求められる場面ではリスクが相対的に低くなります。

GPT-4やClaude 3などの最先端モデルでも発生します。モデルの精度向上でリスクは減少しますが、完全な解消は困難です。どのLLMを使う場合でも確認プロセスは必要です。

LLMに指示してもハルシネーションを防ぐ保証にはなりません。モデルは訓練の仕方によっては「知らない」と言いにくい傾向があることも確認されています。

RAGは大幅な削減効果がありますが、検索結果自体が不正確だったり、LLMが誤解釈したりするケースは残ります。常に人間レビューのプロセスを組み込むことが重要です。

ハルシネーション対策の優先度が高いサインは以下の通りです。

設計段階からRAG・根拠付き回答・人間レビューの組み込みを検討してください。