NRIセキュア、AIエージェント内部を可視化 Red Teamでセキュリティ高度化

2025年12月16日、NRIセキュアテクノロジーズは、AIエージェントの内部状態を直接分析する新たなセキュリティ診断サービスを国内で提供開始した。外部挙動に依存しない診断により、見えにくかったリスクへの対応を強化する。
AIエージェント内部を診断する深層型AI Red Team
NRIセキュアテクノロジーズは、AIエージェントシステムの内部状態を可視化し、従来手法では把握が難しかった脅威を検出する「深層型AI Red Team」の提供を開始した。
独自開発ツール「ai-guard」を用い、推論過程やメモリの変化、エージェント間通信をリアルタイムで分析できる点が特徴となる。
AIエージェントは非決定論的な挙動や自律的な連鎖実行を行うため、入力と出力のみを確認する従来型診断では限界があった。NRIセキュアの分析では、OWASPが定義する15の脅威のうち11項目(73%)が、外部インターフェース中心の検証では検出困難とされている。
本サービスは、目的の改変や正当な権限の組み合わせによる攻撃など、内部動作に起因するリスクも診断対象に含める。マルチエージェント構成にも対応し、顧客のプログラムを変更せずに内部挙動を把握できる設計を採用した。
さらに、可視化結果を基に専門家が攻撃シナリオを設計し、AIによる自動検出と組み合わせるハイブリッド方式を導入する。
加えて、診断で得られた脅威パターンを監視に生かす「深層型AI Blue Team」を2026年前半に提供予定とし、現在はPoC参加企業を募集している。
内部可視化がもたらす恩恵と新たな運用課題
内部状態を前提にした診断は、企業にとってセキュリティ対策の解像度を高める利点がありそうだ。表面的には正常に見える挙動でも、内部で目的逸脱や権限悪用が進行していれば早期に把握できるため、インシデントの未然防止につながる可能性が高い。
こうした診断手法が普及すれば、AI活用プロジェクトにおけるセキュリティ設計の考え方自体が変わる可能性がある。開発段階から内部挙動を前提にした評価を行う流れが定着すれば、より堅牢なAIシステム構築が期待できる。
一方で、内部データを扱う以上、診断結果の解釈や運用には高度な専門性が求められるだろう。
可視化された情報量が多いほど、適切な判断を下す体制整備が不可欠となるため、導入企業側のリテラシー向上も課題となりそうだ。
将来的には、診断と監視を連続的につなぐ運用モデルが一般化する余地もある。内部可視化を起点とした取り組みは、AI時代のセキュリティ標準を再定義する試みとして重要な意味を持つと言える。
関連記事:
NRIセキュア、AI Yellow Team提供 AIエージェントの設計リスクを可視化

NRIセキュア、「Alli LLM App Market」専用のAIセキュリティ対策を提供 AI特有の脅威を監視












