用語解説
エッジAIとは、クラウドサーバーではなくスマートフォン・IoTデバイス・産業機器などの端末(エッジ)側でAI推論処理を実行するアーキテクチャです。
クラウドへのデータ送信が不要なため、低レイテンシ・オフライン動作・プライバシー保護のメリットがあります。工場の異常検知・自動車の運転支援・スマートフォンの顔認証などが代表的なユースケースです。
TensorFlow Lite・ONNX Runtime・CoreML・TensorRTなどのランタイムが端末上での推論を可能にします。モデル量子化・プルーニングでモデルを軽量化し、エッジデバイスの限られた計算資源に適合させます。
どんな場面で活用するか
- 製造ラインのカメラ映像をエッジデバイス上でリアルタイム解析し、不良品を即時検出する
- スマートフォンのオンデバイスLLMを使い、インターネット接続なしで文書要約・翻訳を行う
- 医療機器にエッジAIを搭載し、患者データをクラウド送信せずにプライバシーを保ちながら異常を検知する
よくある誤解
「エッジAIとクラウドAIはどちらか一方を選ぶものだ」は誤りです。正しくは、リアルタイム処理・プライバシーが必要な部分はエッジ、複雑な学習・大規模推論はクラウドという「ハイブリッドエッジ」構成が現実的な選択です。
判断のヒント
導入判断の基準:「レイテンシが100ms以下必要か」「データをクラウドに送れないプライバシー制約があるか」「オフライン環境で動く必要があるか」のいずれかに該当する場合、エッジAIの検討が有効です。