TBSがAIナレーション「音六AI」販売開始 誰でも放送品質の音声を生成可能に

2025年11月10日、株式会社TBSグロウディアはTBSテレビと共同開発したAIナレーションシステム「音六AI(おとろくエーアイ)」の販売を開始した。テキストを入力するだけで放送品質の音声を自動生成でき、テレビ局以外の企業利用にも広がる可能性がある。
TBS、放送ノウハウとAIを融合した音声変換AIを提供開始
TBSグロウディアとTBSテレビが共同開発した「音六AI」は、テキストを入力し、十数種類の音声サンプルから声を選ぶだけで高品質なナレーションを生成できるAI音声システム(※)である。
放送局が培ったナレーション技術とAIによる音声合成を融合し、誰でも手軽に“テレビ局クオリティ”の音声を作成できるのが特徴だ。
再生時間を指定すると、AIが自動で話速を調整するため、たとえば「10秒で読み上げてほしい」という指示にも正確に対応する。発音の微調整や調整した内容の登録も可能だ。
また、英語・中国語・ベトナム語などの多言語にも対応しており、今後は日本語入力から翻訳できる機能も予定されている。
同システムの利用対象は放送関係者にとどまらない。企業の教育用VTRや顧客向けPR動画など、音声コンテンツを必要とする分野での導入も想定されている。
これまでコストや人員の制約でナレーション制作が難しかった中小企業にも新たな選択肢をもたらすものとなりそうだ。
※AI音声システム:人工知能がテキストを解析し、人の声のような自然な音声を自動合成して読み上げる技術。
映像制作の民主化へ 生産性向上の裏に残る課題も
「音六AI」の普及は、映像制作や教育現場の効率を飛躍的に高める可能性を秘めている。ナレーター手配や収録の工程が不要になれば、従来比で制作時間を大幅に短縮できるほか、コスト削減や作業の自動化にもつながるだろう。特に、社内教育や商品説明動画など大量制作が求められる場面では、生産性向上の効果が大きいと考えられる。
一方で、懸念点も存在する。AI音声の自然さは急速に進化しているものの、感情の抑揚や人間らしい間の取り方といった「表現力」では、依然として人のナレーターに及ばない領域もある。声の温度感や物語性が求められる映像では、完全自動化には限界があるだろう。
今後は、AIと人間の使い分けが鍵となる。感情表現をAIがどこまで再現できるか、あるいは人間の声を学習して個性を再現できるかが、次の競争軸になると考えられる。
音声生成技術の進化は、映像制作の民主化と新しいクリエイティブの形をもたらす転換点に差しかかっていると言える。
関連記事:
全国初、葛飾区が窓口に音声認識AI導入へ 職員対応を支援し業務効率化狙う












