Google、動画生成AI「Veo 3」正式公開 テキストから映像制作が可能に

米Googleは2025年7月30日(現地時間)、動画生成AI「Veo 3」およびその軽量版「Veo 3 Fast」の一般提供を開始した。
ユーザーがテキストで指示するだけで、高解像度の短編動画を生成できる機能を備えており、AI活用による動画制作のあり方が大きく変わる可能性がある。
Veo 3が正式公開、テキストから1080p動画を自動生成
Googleが発表した「Veo 3」は、同社のクラウドAI基盤「Vertex AI」(※)上で提供される最先端の動画生成モデルである。文章による指示(プロンプト)を与えるだけで、8秒間のフルHD(1080p)ショートビデオを自動的に生成する。
すでに「Gemini」アプリ内では動画生成エンジンとして活用されていたが、今回の正式公開により、開発者や企業も広く利用可能となった。
Veo 3は音声生成にも対応しており、テキストに応じたナレーションをAIが自動生成する。その音声は数十の言語にローカライズすることができ、グローバルな視聴者への対応力も備えている点が特徴だ。
また、併せてリリースされた「Veo 3 Fast」は、速度と操作性を重視した軽量モデルであり、繰り返し試作・編集を行うクリエイティブ用途に最適化されている。
「Veo 3」は、6月からプレビュー版として提供されていたが、今回の正式リリースにより本格的な実用段階へと移行した。
8月には、画像をもとに映像を生成する追加機能もパブリックプレビューされる予定で、映像制作の工程に新たな自動化の波が押し寄せている。
※Vertex AI:Google Cloudが提供する機械学習モデルの開発・運用プラットフォーム。企業向けに各種AI機能を提供している。
動画制作の民主化進む Veoがもたらす可能性と課題
Veo 3の登場により、映像制作で求められる専門スキルが大幅に軽減する可能性がある。
これまで映像編集やナレーションの作成には、複数のツールや人的リソースが求められていたが、Veo 3はそれらの工程を一括で処理できる。
これにより、スタートアップや個人クリエイターにとっても、プロレベルの映像表現が手の届くものとなるだろう。
また、グローバル市場向けの動画コンテンツを展開する企業にとって、言語ローカライズ機能は極めて有用であり、マーケティングのスピードと汎用性が飛躍的に向上すると期待される。
一方で、課題も存在する。
生成される映像が著作権や倫理の観点でどのような管理を受けるのか、またAIが誤ったナレーションや不適切な映像を生成するリスクは完全には排除できない。プロンプトの設計次第で出力が大きく左右されるため、クリエイティブディレクションの重要性は依然として残るだろう。
AIによる動画生成は今後、教育、広告、SNS運用など多分野に応用が見込まれる。
今後は、バージョンアップや他社との連携も含め、映像表現の門戸がどこまで広がるかに注目したい。
関連記事
グーグルGemini、写真から動画生成が可能に Veo 3活用で日常に動きと音を
https://plus-web3.com/media/latestnews_1000_4168/