共同通信とソフトバンクが提携 AI向けデータ基盤を共同構築へ

2025年5月23日、共同通信社とソフトバンクは、日本国内のAI産業発展を見据え、生成AI向けデータ基盤の整備と新サービス開発に向けた業務提携を発表した。
報道機関と通信企業の連携は、メディア活用の在り方に新たな展開をもたらす可能性がある。
ニュース記事を活用したAIデータセット基盤の構築に着手
共同通信とソフトバンクは、AI開発に不可欠な高品質な学習データの整備を目的に提携する。両社は、共同通信が保有する膨大なニュース記事と、ソフトバンクが持つAI技術を組み合わせ、企業や研究機関が活用できるデータセット基盤を共同で構築する。
この取り組みでは、生成AIに適したコンテンツ構造のデータ化と、不正利用を防ぐ認証・保護機能の実装が重要視されている。コンテンツの品質と信頼性を担保しながら、安全にAIに学習させるための仕組みを整備することで、国内における生成AIの持続可能な成長を支援する方針だ。
今回の提携は、ソフトバンク傘下の「SB Intuitions」と共同通信がすでに進めている生成AI向け言語モデル研究の延長線上にある。
昨年11月に始まったこの連携では、ニュース記事を活用した大規模言語モデル(LLM)の精度向上に注力しており、今回の新たな枠組みでその成果が拡張されることが期待できる。
メディアの信頼性とAIの活用が両立する未来へ
今回の提携によって、ニュースメディアが持つ信頼性とAIの活用可能性を両立する、新たなモデルが形成できるのではないだろうか。
従来、報道コンテンツのAI利用には著作権やフェイクニュースの問題が立ちはだかっていたが、信頼性の高いニュースを基に学習したAIにより、より健全で透明性のある技術活用が可能になると思われる。
一方で、コンテンツ使用のルール整備や監視体制の強化といった点では、課題も残るはずだ。
とりわけ、生成AIが学習したデータの出典や使用範囲は、明確にする必要があるだろう。法的・倫理的配慮がなされなければ、メディア価値の毀損や著作権侵害のリスクが表面化するおそれもある。
それでもなお、両社の連携は、国内における生成AIの信頼性と品質向上を牽引する試金石といえる。
今後、他のメディアや通信事業者がこの動きに追随することで、日本発の信頼性あるAI開発のエコシステムが形成される可能性は高いだろう。