NTT東日本、AIで電話音声フェイク検知技術 なりすましや特殊詐欺抑止へ

2025年8月25日、NTT東日本はAIを活用した「電話音声フェイク検知技術」の実証を開始したと発表した。
総務省採択事業としてNABLASと共同で取り組み、特殊詐欺や偽・誤情報の拡散を防ぐ新たな仕組みの構築を目指す。
電話音声を解析しAIがフェイク判定
NTT東日本とAI開発ベンチャーのNABLASは、生成AIの急速な普及に伴う詐欺や情報操作のリスクに対応するため、電話音声を対象としたフェイク検知技術の開発に着手した。
実証は総務省の採択の事業として実施され、特殊詐欺やなりすまし被害を防ぐ実用的な仕組みづくりが狙いである。
この技術は、最新の音声合成システムが生み出す高精度なフェイク音声を識別するもので、電話環境別の音質劣化や形式の違いにも対応可能とされる。
開発したアルゴリズムは専用アプリに実装し、着信パターンや通話環境を再現したテストを通じて安定した検知精度を検証する。
さらに、自治体向けの偽・誤情報対策も並行して進められている。
具体的には、情報の出所を明示するDID(※1)やVC(※2)技術の開発、画像・映像のフェイク判定技術、改ざんを見破る電子透かし技術、そしてAIによる自動ファクトチェックエージェントの構築が含まれる。
これらのシステムは統合され、長野県伊那市での実証実験に展開される予定だ。
役割分担としては、NABLASがAI技術開発と全体管理を担い、NTT東日本は電話音声検知システムや認証技術の開発、システム評価を担当する。
※1 DID:Decentralized Identifier。分散型のデジタルIDで、中央機関に依存せずに個人や組織の認証を可能にする仕組み。
※2 VC:Verifiable Credential。発行元を明確にし、改ざんが困難なデジタル証明書。信頼性の高い情報共有を実現する技術。
拡大する生成AIリスク 実用化と社会浸透の課題
生成AIの進化は利便性を高める一方で、偽音声や偽映像を利用した犯罪を助長する危険性を伴う。
特に本人そっくりの声で電話をかける「なりすまし手口」が現実的な脅威となっており、自治体や通信事業者が対策を急ぐ必要がある。
今回の技術開発は、その喫緊の課題に直接応える取り組みと位置付けられる。
メリットとしては、電話サービスや自治体システムに組み込むことで、利用者が自然に安全性を享受できる点が挙げられる。個人が特別な操作をしなくても、着信時点でAIが危険を検知する仕組みが普及すれば、詐欺被害の大幅な抑止につながる可能性がある。
一方で、音声合成技術の進化速度に検知精度が追随できるかは不透明である。
詐欺側が検知システムを回避する手法を編み出せば、いたちごっこの構図になるかもしれない。
また、自治体システムにDIDやVCを導入する場合、利用者にとって複雑さやプライバシー上の懸念が生じる危険性がある。技術が高度化するほど、社会受容性と利便性の両立が課題になると考えられる。
それでも、AIを活用したフェイク検知の取り組みは、情報信頼性を確保する上で不可欠な要素になりつつある。社会全体で「声の信頼性」を保証する基盤が整えば、フェイク音声を利用した犯罪のリスクは一定程度抑制されるだろう。
今後は、民間サービスや金融機関への展開も視野に入ると思われる。