韓国、AI偽コメントを高精度で検出 世論操作に対抗する新技術「XDAC」開発

2025年6月23日、韓国の国家保安研究所とKAISTの研究チームが、韓国語のAI生成コメントを98.5%の精度で見抜く検出技術「XDAC」を開発したと発表した。
AIによる世論操作への抑止力として注目されている。
韓国語特化のAI「XDAC」 偽投稿を98.5%の精度で検出
韓国・国家保安研究所とKAISTのキム・ヨンデ教授率いる研究チームは、AIが生成した韓国語コメントを高精度で検出する新技術「XDAC」を開発したと明かした。
XDACは、生成AIを悪用した偽コメントを98.5%の精度で見抜くことができるほか、コメントを生成したLLM自体の特定にも成功している。
背景には、オンライン上の世論操作の拡大がある。短く感情的な韓国語コメントは、従来の英語ベースの検出技術では対応が困難だった。
AIは記事の内容に合わせた調整も可能で、数時間で数十万件のコメントを自動生成できる水準に達しており、深刻な情報操作のリスクが懸念されていた。
OpenAIのGPT-4o APIを例にすると、1件あたりの生成コストは1ウォン(約0.1円)と極めて低価格で、主要ニュースサイトの平均コメント数20万件を約2万円で作成できる計算だ。
研究チームは、AIと人間が書いた計210件のコメントを比較評価し、AI生成コメントの67%が人間の書いたものと誤認されたと報告。さらに、AIのコメントのほうが文脈との整合性や流暢さで人間を上回る傾向も確認された。
XDACでは、韓国語特有の俗語や繰り返し文字、絵文字、改行などに着目し、AI生成文の特徴を精緻に分析。AIは「〜のようだ」「〜について」など形式的な表現や接続詞を多用し、人間のようなフォーマットの崩れや感情表現が乏しいことを検出根拠として活用している。
また、14種のLLMを活用した生成パターンを網羅し、各モデルごとの「話し方の癖」も識別。LLMの特定では84.3%の精度を記録した。
AI世論操作への抑止力に期待
XDACの最大のメリットは、高精度な検出によって生成AIによる悪質な世論操作の「費用対効果」を著しく下げ、抑止効果をもたらす点にある。仮に自動生成が可能でも、高確率で検出・識別されるリスクがあれば、投稿者はリスク回避のため利用を躊躇する可能性が高まる。
さらに、韓国語という非英語圏における短文・口語の対応に成功した点は、他言語圏への技術応用の可能性も示唆する。
実際に、SNSやニュースメディアがXDACのような検出技術を導入すれば、コメント欄における透明性や信頼性が向上し、AI時代における言論空間の健全化に貢献するだろう。
一方で、実装面ではいくつかの課題も残る。リアルタイムでの大規模運用や、LLMの進化に追従する継続的なアップデートが求められるほか、検出結果の誤認による濫用リスクも否定できない。
将来的には、他言語対応やプラットフォーム統合、違反投稿の自動通報などといった拡張機能が実装されることで、XDACはグローバルなデジタルセキュリティの要となる可能性を秘めている。