Google DeepMind CEO、AI開発加速とAGI向け新基準を発表

2025年8月12日、Google DeepMindのデミス・ハサビスCEOは「Google AI: リリースノート ポッドキャスト」で、AI技術開発が「前例のない勢い」で進んでいると述べた。
Gemini 2.5のDeep ThinkやGenie 3の進展、AGI(汎用人工知能)実現に向けた課題と新ベンチマーク「Game Arena」について説明した。
Gemini 2.5やGenie 3を発表、AGI課題へ新評価基準導入
ハサビス氏は、Gemini 2.5に搭載された思考モデル(※)「Deep Think」や、物理世界を理解する世界モデル「Genie 3」の進展を紹介した。
Deep Thinkは数学やコーディング、科学問題など推論・計画を要する分野で高い性能を発揮し、国際数学オリンピックで金メダルを獲得可能な水準に達しているという。
Genie 3は物質や液体、生物の行動まで理解可能なモデルで、ユーザーが操作をやめても世界の状態が維持される特性を持つ。
Google DeepMindはGenie 3をAIエージェント「SIMA」の訓練に活用しており、無制限のトレーニングデータを生成している。
また、現行モデルが数学や論理問題、ゲームで誤答する課題に対応するため、Kaggleと提携して新ベンチマーク「Game Arena」を開設した。
ゲーム形式でモデル同士を対戦させ、性能に応じて難易度を自動調整する。
将来的には、チェスから数千種類のゲームへ拡張する計画を明らかにしている。
※思考モデル:推論や計画などの高度な認知タスクを実行するために設計されたAIモデルのこと。
新基準導入でAGI開発の加速と応用拡大に期待
Game Arenaの導入は、既存ベンチマークの限界を超え、AGIの能力評価を長期的かつ体系的に行える基盤となる可能性がある。
難易度が自動調整されるゲーム形式は、開発の進展に応じた継続的な検証を可能にし、推論や記憶など弱点の克服を促すと考えられる。
Deep ThinkやGenie 3のような高性能モデルの進化は、ロボット工学や科学研究、教育分野での活用を広げると同時に、インタラクティブエンターテインメント分野でも新たな市場を生む可能性がある。
特にGenie 3の世界生成能力は、現実に近い環境でのAI訓練や没入型ゲーム体験に大きな変革をもたらすだろう。
一方で、高度な世界モデルや思考モデルが社会実装される際には、倫理的課題や安全性確保が不可欠となるだろう。
AGIが持つ潜在的リスクを管理する枠組みづくりを並行して進められれば、産業界と社会にとって持続可能な成長が期待できそうだ。