用語解説
エージェントAIセキュリティ(Agentic AI Security)とは、自律的に行動するAIエージェントが引き起こしうるセキュリティリスクを特定・評価・軽減するための取り組みの総称です。通常のAIセキュリティに加え、エージェントが「行動する」ことで生じる固有のリスクに対処します。
AIエージェントは外部システムへの書き込みや実行ができるため、悪意ある入力によって意図しない操作を引き起こされる「プロンプトインジェクション」が特に深刻な脅威となります。
エージェント固有の主なセキュリティリスク
- プロンプトインジェクション:悪意ある文書・ウェブページからエージェントに不正な命令を埋め込む
- 過剰権限実行:エージェントが必要以上の操作権限を持って動作する
- 情報漏洩:エージェントが処理した機密情報が外部ツールに送信される
- サプライチェーン攻撃:MCPサーバーや外部ツール経由での悪意あるコード実行
どんな場面で活用するか
最小権限原則の適用
エージェントに付与する権限を「タスクに必要な最低限」に絞ります。「読み取りは全て可」ではなく、「このツールは特定のDBの読み取りのみ」「この操作は管理者承認が必要」という粒度での権限設計がセキュリティの基本です。
入力のサニタイズとスコープ制限
外部データ(ウェブページ・メール・ユーザー入力)をエージェントが処理する際に、システムプロンプトの書き換えを防ぐためのサニタイズ処理とスコープ制限を実装します。
監査ログの整備
エージェントが実行した全操作のログを取り、不審な動作を検知・追跡できる体制を整えます。事後の原因究明と継続的なリスク評価に不可欠です。
よくある誤解
❌ 誤解1:エージェントをファイアウォール内に置けば安全
プロンプトインジェクションは外部からのネットワーク攻撃ではなく、エージェントが読み込むデータに埋め込まれるため、ネットワーク防御だけでは防げません。
❌ 誤解2:信頼できるAIモデルを使えばリスクはない
モデル自体の信頼性と、エージェントのアーキテクチャ・権限設計のセキュリティは別問題です。優れたモデルでも不適切な権限設計では被害が発生します。
❌ 誤解3:セキュリティ対策は開発完了後に行う
エージェントの権限設計・入力検証・監査ログは設計段階から組み込む必要があります。後付けではカバーできない構造的なリスクが生じます。
判断のヒント
以下のいずれかに該当する場合はエージェントセキュリティの優先対応が必要です。
- エージェントが外部ウェブサイト・メール・ユーザー入力を処理する
- エージェントがCRM・DB・ファイルシステム等への書き込み操作を行う
- エージェントが顧客情報・社外秘情報を取り扱う
- 複数ユーザーが同一エージェントを利用する(テナント分離が必要)