Google、最新動画生成AIモデル「Veo 3」を発表 「音声付き動画」の生成が可能に

人工知能、AI
Web3/AI領域に特化した転職エージェント「Plus Web3 Agent」

最先端のテクノロジー領域で働きたい人材と優良企業のマッチングを支援しています。
少しでも興味のある方は、お気軽に「無料キャリア相談」をご利用ください!

📖 読了時間: 約1分

現地時間2025年5月20日、米Googleは年次開発者会議「Google I/O 2025」にて、最新の動画生成AI「Veo 3」と画像生成AI「Imagen 4」を発表した。
Veo 3では初めて「音声付き動画」の生成が可能となり、映像表現の自由度が大幅に向上した。

目次

動画に“音”が加わったVeo 3、映像生成の常識を塗り替える

Googleが新たに発表した「Veo 3」は、従来の動画生成モデルに音声生成機能を統合した先進的なAIツールである。街の雑踏や風の音、小鳥のさえずりといった環境音に加え、登場人物の会話までも自動生成できるのが最大の特徴だ。

また、前バージョンである「Veo 2」と比べ、映像品質や物理挙動の再現性も大きく向上した。
たとえば、人物の口の動きと台詞が一致するリップシンク精度が高まったことで、実写さながらの自然な映像表現が可能になった。

このVeo 3は、月額249.99ドルのサブスクリプションサービス「Google AI Ultra」の米国内ユーザーおよび、法人向けクラウドサービス「Vertex AI」上のエンタープライズ顧客向けに提供される。
さらに旧モデルVeo 2にも、動画内オブジェクトの追加・削除や、映像のフレーム拡張が可能なアウトペインティング(※)機能が新たに搭載され、利便性が大きく向上した。

映画制作向けツール「Flow」との連携により、参照画像をもとに動画を生成や、カメラコントロールも可能になるという。

※アウトペインティング:画像の外枠部分をAIが推測・補完し、画面を拡張する画像生成技術

映像制作が再定義される可能性、動画生成AIの展望

Veo 3の登場は、映像制作の常識を再定義する可能性を持っている。音と映像を同時に生成できるという技術は、AIによる映画やアニメーションの工程全体を自動化する基盤になり得るだろう。
今後は、声優の声を学習させたモデルによる音声再現や、多言語対応によるグローバル展開などが進む可能性が高い。

一方で、動画生成の高精度化と共に、実写と見分けがつかないディープフェイク表現なども増加する危険性がある。これに伴い、「コンテンツ制作のための生成AI利活用ガイドブック」のような規範の整備が、より重要になってくるだろう。

今後の鍵を握るのは、「誰が、どのように使うか」であると思われる。
Veo 3は単なるツールではなく、新たな表現技法と産業構造の変化をもたらす起爆剤になりうる。持続的な進化と社会的な受容が両立できるかどうかが、真価を決める分岐点となるだろう。

参考:「コンテンツ制作のための生成AI利活用ガイドブック」(経済産業省)
https://www.meti.go.jp/policy/mono_info_service/contents/aiguidebook.html

Plus Web3は「先端テクノロジー領域(Web3/AI)に特化したキャリア支援サービス」


運営会社のプロタゴニストは、AI開発やブロックチェーン技術など、急成長する先端技術分野への転職をサポートする専門エージェントです。
経験者はもちろん、異業種からの転身を検討される方にも最適な機会をご紹介しています。

  • 成長産業であるAI業界やWeb3領域でのキャリアを検討している
  • 未経験からでもAI・Web3業界に挑戦できる道を探している
  • 自分のスキルを最先端技術分野でどう活かせるか知りたい

こんな方におすすめです

業界に精通したキャリアアドバイザーが、あなたの経験・スキル・志向性を丁寧にヒアリングし、最適な企業とポジションをマッチングします。
まずは無料キャリア相談で、あなたの可能性を広げるチャンスを掴みませんか?

Web3企業

AI企業

人工知能、AI

この記事が気に入ったら
フォローしてね!

Please Share
  • URLをコピーしました!
目次