用語解説
どんな場面で活用するか
- 請求書の画像をアップロードして自動でデータ抽出・会計システムへ登録したい場合
- 会議の音声録音をテキスト化・要約・アクションアイテム抽出まで一括自動処理したい場合
- 製品画像を分析してECサイトの商品説明文を自動生成したい場合
よくある誤解
「マルチモーダルエージェントはすべてのモダリティを同等に処理できる」というのは誤りです。正しくは、モダリティごとに精度・コストが異なるため、タスクに応じた適切なモデル選択が必要です。
判断のヒント
設計ポイント:入力モダリティごとに前処理パイプラインを整備し、品質チェックを挟むことで、後続のLLM処理精度を大幅に向上させることができます。