Google DeepMind、リアルタイム仮想世界生成AI「Genie 3」発表 操作・記憶・物理法則を統合

2025年8月5日、英Google DeepMindがリアルタイムで一貫性ある仮想世界を自動生成する新モデル「Genie 3」を発表した。物理法則や記憶機能を備え、AIエージェントによるタスク訓練にも応用が期待される。
DeepMind、仮想世界を即時生成するAIモデル「Genie 3」発表
Google DeepMindは、ユーザーのテキスト入力をもとにインタラクティブな仮想世界をリアルタイム生成する「Genie 3」を公開した。本モデルは720pの映像を生成し、ユーザーやAIエージェントが操作できる物理的整合性を備えた空間を構築する。
Genie 3は水や照明、風などの自然現象や動物の行動、植物の成長など複雑な生態系の振る舞いも再現できる。フィクションの世界観の構築にも対応しており、ファンタジーやゲーム環境なども自由に設計可能である。
本技術の中核には「ワールドメモリ」があり、ユーザーの操作や視界に含まれていた情報を約1分間記憶することで、時間経過による不整合を回避する。この仕組みにより、動的かつ一貫性あるフレーム生成が可能になっている。
また、同社の汎用AIエージェント「SIMA」との連携も想定されており、仮想世界内でエージェントにタスクを与え、行動を観察することもできる。
Genie 3は現在、研究者およびクリエイター向けの限定的なプレビュー提供が開始されている。
創造性と汎用性の融合 訓練用途と倫理的課題への期待と懸念
Genie 3の最大のメリットは、AIやユーザーが現実世界に依存せず訓練やシミュレーションを行える柔軟な環境を提供する点にあると考えられる。
プロンプト一つで世界の構成要素を即時変更できるため、AI開発やゲーム制作、教育用途での活用が見込まれる。
さらに、操作性と記憶機能が統合されたことにより、エージェントが長期的なタスクを学習できる素地が整いつつある。これは将来的なAGI(汎用人工知能)開発において、試行錯誤型学習の土台となると考えられる。
一方で、数分間に限られる一貫性保持や記憶の持続範囲には制約がある。
仮想世界の連続性や多様性を長期的に維持するには、今後さらなる技術的進化が不可欠とされている。また、高精度な生成ゆえのフェイク映像や倫理的問題への対処も求められるだろう。
将来的には、Genie 3が持つ生成能力がメタバースやAI社会実験の基盤技術となる可能性もある。
今回の研究者に限定されたプレビュー提供は、技術成熟の前段階と考えられるため、今後の商用展開とルール整備の動向にも注目したい。