用語解説
反省型エージェントとは、自身の出力や行動結果を自己評価し、改善すべき点を言語化して次の試みに反映させるフィードバックループを持つAIエージェントです。
Reflexionフレームワーク(Shinn et al., 2023)で提唱されたこのアプローチでは、アクター・評価者・自己反省の3つの役割を組み合わせることで、追加の学習なしに反復的な品質改善を実現します。
どんな場面で活用するか
- コード生成エージェントがテスト失敗の原因を自己分析して修正ループを回したい場合
- 文章作成エージェントが品質基準に照らして自己評価・改訂を繰り返して高品質なアウトプットを得たい場合
- 数学的推論・論理問題でエージェントが誤答を検出して再試行する精度向上の仕組みを実装したい場合
よくある誤解
「反省型エージェントは無限に改善し続ければ必ず正解に到達できる」というのは誤りです。正しくは、反省の質はLLMの推論能力に依存するため、最大試行回数の上限設定とフォールバック処理が必須です。
判断のヒント
設計ポイント:評価基準(ルーブリック)を明示的にプロンプトに組み込むことで、自己評価の一貫性が高まり、反省ループの収束が速くなります。