NHK技研、番組制作向け生成AIを開発 40年分のニュース学習で回答精度を向上

2025年5月26日、NHK放送技術研究所(技研)は、過去約40年分のニュースデータを学習させた独自の大規模言語モデル(LLM)を開発したことを発表した。
報道された事実に関する誤回答の割合を1割減少させる精度を実現しており、番組制作の業務支援ツールとしての実用化を視野に入れている。
40年分の放送データを学習し誤回答率を削減
NHKの研究開発機関である技研は、番組制作を支援する目的で、報道資料に特化した生成AIを開発した。
今回構築されたLLMは、既存の言語モデルに対して、NHKが過去に放送した約40年分のニュース原稿や記事、字幕データなど約2,000万文を追加学習させたものである。
この追加学習により、モデルは報道内容の正確な理解を獲得し、ニュース番組に頻出する用語や文脈表現への理解度も高まったとされる。
評価は、外部機関が実施するニュース報道に関する検定試験を用いて実施され、報道に基づく問いに対する誤答率が従来比で約1割低減されたという。
NHKでは、これまでも機械翻訳や要約支援など番組制作の効率化に資する技術開発を進めてきたが、今回のLLMはその延長線上に位置づけられる。
今後は、大量文書の要約や情報収集の補助、翻訳、文章校正といった業務支援への応用も見据え、2026年までの実用化を目指している。
技研は、5月29日から6月1日まで開催される「技研公開2025」にて本LLMを一般公開し、フィードバックを得ながら改良を加えていく予定である。
誤回答の削減へ継続開発 マルチモーダル化も視野に
今回のLLM開発は、放送局ならではの正確性と専門性が求められる環境において、生成AIの業務活用の可能性を示す一歩となった。
ただし、NHKは実用化にはなお改善が必要であるとし、引き続き誤回答のさらなる低減に向けた研究を継続する方針を示している。
また、将来的には映像や音声などの非テキスト情報も取り扱う「マルチモーダル型LLM」への進化も見据えており、テキスト処理に加え、より多様な素材に対応可能な生成AIの構築が目標とされている。
これにより、番組制作の質と効率をさらに高めることが期待される。
一方で、生成AIにおける「事実と異なる出力」という根本的課題は依然として残る。
特に公共放送においては、誤情報の拡散リスクを最小化する必要があり、開発には高い倫理基準と透明性が求められる。