メインコンテンツへスキップ
最新ニュース 3分で読める

Google DeepMind、汎用ロボットAI「Gemini Robotics 1.5」発表 複雑作業に自律対応

PlusWeb3 編集部
PlusWeb3 編集部 Web3・AI専門メディア

2025年9月25日、英Google DeepMindは新モデル「Gemini Robotics 1.5」と「Gemini Robotics-ER 1.5」を発表した。
実際にロボットを動かす「Gemini Robotics 1.5」とタスクの流れを設計する「Gemini Robotics-ER 1.5」によって、自律的に遂行できるロボットの実現を推進する。

DeepMind、新モデルでロボットに高度な思考と行動を実装

Google DeepMindが発表した「Gemini Robotics 1.5」は、視覚・言語・動作を統合するビジョン・ランゲージ・アクション(※)モデルだ。
従来の単純な命令処理型ロボットとは異なり、行動前に推論を行い、そのプロセスを自然言語で説明する機能を備える。対話形式で指令を下すことが可能だ。

併せて公開された「Gemini Robotics-ER 1.5」は、物理環境を理解し複数の行動計画を立てる役割を担う。
デジタルツールをネイティブに呼び出すことも可能で、空間認識ベンチマークでは最先端の精度を記録した。

両モデルは高次の計画と具体的動作を分担し、複雑な現実世界の課題を協調して解決する仕組みを構築する。

さらにRobotics 1.5は、異なるロボット間で動作学習を転移できる「クロスエンボディメント学習」に対応。
これにより、一機種で習得した技能を他機種へと応用でき、産業応用における導入効率を高める可能性がある。

DeepMindは安全性確保にも注力している。独自の「ASIMOVベンチマーク」をアップグレードし、リスク認識や衝突回避を含む多層的な安全設計を行った。
発表資料では、本技術を「物理世界におけるAGI実現へのマイルストーン」と位置づけている。

※ビジョン・ランゲージ・アクション(VLA):画像や映像などの視覚情報と言語指示を統合し、実際の動作に変換するAIモデルの仕組み。

汎用ロボットの普及がもたらす利益と課題

Gemini Roboticsシリーズの進化は、物流や製造、家庭支援といった分野に大きな波及効果を与えると考えられる。
複雑なタスクを自律処理できれば、省人化や効率化が加速し、ロボット導入コストも下がる可能性がある。特にクロスエンボディメント学習は、これまで個別最適化に依存していたロボティクス分野において、新たなアプローチとして評価できる。

一方で懸念もある。高度な自律性を持つAIは、実社会での安全性や人間との協働に関するリスクを抱える。
誰が最終的に責任を負うのかというガバナンスの問題は避けられず、技術進展と同時に規制や倫理枠組みの整備が求められる。

今後は研究者や開発者コミュニティによる検証を経て、実環境での適用が進むとみられる。
商業化が進展するほど社会的議論も激化する可能性が高く、利便性とリスクの均衡をどう図るかが焦点となるだろう。

Share this article コピーしました
WRITTEN BY

PlusWeb3 編集部

Web3・AI専門メディア

PlusWeb3 編集部は、ブロックチェーン・Web3・AIの最新動向をわかりやすくお届けする専門メディアチームです。業界経験豊富な編集者とリサーチャーが、信頼性の高い情報を厳選してお届けします。

この記事が役に立ったら、ニュースレターも登録しませんか?

Web3・AI業界の厳選ニュースを定期配信。いつでも解除可能。

スパムは送りません。プライバシーポリシーに基づいて管理します。

コピーしました

Web3・AI・ディープテック領域のキャリアに興味がありますか?

業界特化メディアを運営する専門エージェントが、企業のカルチャー・技術スタック・選考ポイントまで踏まえてキャリアをご提案します。相談は完全無料です。