グーグルGemini、写真から動画生成が可能に Veo 3活用で日常に動きと音を

2025年7月10日、米グーグルは生成AI「Gemini」において写真から動画を生成する新機能を公開した。動画生成モデル「Veo 3」を活用し音声付きのショートムービーを自動作成できる機能で、日本国内ではGoogle AI ProおよびUltraプランの有料会員向けに提供が始まっている。
Geminiが静止画を動画化 Veo 3で誰でも簡単に映像生成
この機能はGeminiのプロンプト入力画面において「動画」メニューを選択し、任意の写真とシーン説明、音声指示を入力することで利用可能となる。画像1枚から約7秒のアニメーション映像が作成でき、音声も自動生成される点が特徴だ。
同機能の中核を担うのはGoogle DeepMindが開発した映像生成AI「Veo 3」である。
風景写真に風の動きを加えたり、人物画にまばたきや表情変化を加えたりといった高度なアニメーション演出が実現可能となった。
生成した動画はウォーターマークが自動的に挿入され、AIによる合成映像であることが視覚的にも明示される。また、すべてのファイルには「SynthID(※)」と呼ばれるデジタル透かしも埋め込まれており、AI生成物の判別が可能な構造となっている。
この新機能はGemini以外にもGoogleが提供する動画作成アプリ「Flow」からも同様にアクセスできる。WorkspaceのGemini Pro環境でも使用可能で、法人向け活用も想定される。
※SynthID(シンスID):Google DeepMindが開発したAI生成コンテンツ識別技術。目視では見えないデジタル透かしをコンテンツに埋め込み、AIによって生成されたことを後から検出できる。静止画・音声・動画などに対応。
誰もが映像クリエイターになれる時代に、一方で懸念も
今回の機能追加により、静止画から高品質な映像を誰もが手軽に生成できる時代が本格的に到来したと言える。特にデザイナーやマーケターにとっては、プレゼン用のモックアップ映像やSNS向けコンテンツ制作が短時間で可能になるだろう。
AIによる動きの補完や演出は、人手では難しかった映像表現を実現するツールとして期待できる。
一方で懸念も予想される。映像のリアルさが増す中で、フェイク動画や誤情報の拡散に悪用されるリスクは依然として存在するだろう。Google側は不適切な利用を抑制するための対策として生成動画すべてにウォーターマークを入れる仕様を導入しているが、その抜本的な効果は今後の運用に委ねられるはずだ。今後はGemini Ultraに実装予定の長尺動画対応機能や、複数の静止画をつなぐストーリー生成機能の追加も見込まれており、動画生成AIの進化はさらに加速する可能性がある。
誰もが映像クリエイターになれる世界は近づいているが、その倫理的枠組みの整備も同時に求められていると言える。