ファインチューニング

用語解説

ファインチューニングとは、汎用的な事前学習済みLLMに対して特定業務やドメインのデータで追加学習を行い、そのタスクへの精度・適合性を高める手法です。基盤LLMの重みパラメータを更新する点がRAGとの最大の違いで、モデル自体がドメイン知識を「覚える」形になります。

ファインチューニングが有効なケースは以下の通りです。

現在はLoRA（Low-Rank Adaptation）などの効率的な手法により、比較的少ないデータと計算リソースでファインチューニングが可能になっています。まずはプロンプトエンジニアリングやRAGで解決できないか確認してから着手することを推奨します。

ファインチューニングは与えたデータのパターンを学習しますが、知識の鮮度を維持し続けることはできません。最新情報を継続的に反映させるにはRAGの方が適しています。

高品質な少量データで優れた成果が出るケースも多く、数百〜数千件の良質なデータで十分な効果が得られることが実証されています。データ量よりも質と多様性が重要です。

ファインチューニングはモデルの「ふるまい」を変えるものであり、リアルタイムの外部情報参照にはRAGが依然として必要です。ハイブリッドアプローチが最も高い精度を発揮します。

ファインチューニングへの投資を検討すべきタイミングは以下の通りです。

まず少量の高品質データで試験的にファインチューニングを実施し、精度・コスト改善の見込みを確認してから本格投資を判断することを推奨します。