グーグルが音楽生成AI「リリア」を発表 動画・画像・音声と統合可能な新時代の創作支援ツール

2025年4月9日、米グーグルは音楽生成AI「リリア」の提供を開始した。テキストを入力するだけで最大30秒の楽器音を生成できる新技術であり、同社が展開する動画、画像、音声生成AIとの統合も可能となる。
創作の流れを変える「リリア」、AI連携による一括コンテンツ生成が現実に
グーグルがリリースした音楽生成AI「リリア」は、ユーザーが文章を入力することで、最大30秒の楽器音を自動生成する。
たとえば「目まぐるしいサックスとトランペット、激しいドラム、深夜のジャズクラブの雰囲気」といった指示を入力すれば、そのイメージに沿った演奏が返ってくる仕組みだ。
こうした自然言語入力による音楽生成は、従来の音楽制作に比べて大幅な時間短縮と表現の自由度向上をもたらす。
「リリア」が注目されるのは、その単体機能だけでなく、グーグルが提供する他の生成AIとの統合が可能である点にある。
具体的には、動画生成AI「ベオ」や画像生成AI「イマジェン」、音声生成AI「チャープ」と連携させることで、ひとつのプロンプトから映像・音楽・ナレーション付きのコンテンツを一括で作成できる。
特に「チャープ」は日本語音声にも対応しており、10秒程度の音声を模倣して様々な文言を読み上げることが可能だ。
これにより、動画制作者やマーケティング担当者、SNS運用者などが短時間で高品質なマルチメディアコンテンツを制作できる環境が整う。
単なる技術的な革新にとどまらず、創作プロセスの効率化と民主化を推進するものであり、グーグルが生成AI分野での主導権を握るための戦略的布石と位置づけられる。
著作権と安全性の両立へ、今後の展開に求められる技術的・倫理的対応
新たな創作ツールとしてのポテンシャルを持つリリアだが、著作権侵害や偽情報のリスクといった課題も浮上している。グーグルはこれに対応する形で、生成された音楽データにAI生成であることを示す電子透かしを自動的に付与する機能を実装した。
これにより、無断利用や誤認識を未然に防ぐとともに、AI作品としての出所を明確化できる仕組みを整えている。
一方で、音声模倣技術が高度化する中で「偽音声」の生成も可能になってきており、なりすましや詐欺への悪用といった懸念も払拭されていない。
CEOのサンダー・ピチャイは発表の中で、「AIは人々の創造性を広げる力を持つ一方、責任ある開発と利用が不可欠である」と強調。
今後は技術の進化とともに、倫理的・社会的ガイドラインの策定が不可避となる見通しである。
AIによる創作支援が一般化すれば、コンテンツ制作における専門性の在り方も問われるようになるだろう。
誰もがプロ並みの映像や音声作品を短時間で作成できる一方で、オリジナリティや人間性をどう担保していくかという課題も表面化しつつある。