メインコンテンツへスキップ
最新ニュース 3分で読める

NVIDIA、フィジカルAI向け基盤モデル「Cosmos 3」を公開 ロボット開発の常識を変える可能性

PlusWeb3 編集部
PlusWeb3 編集部 Web3・AI専門メディア

2026年6月1日、米NVIDIAはフィジカルAI向けのオープン基盤モデル「Cosmos 3」を発表した。ロボットや自動運転車向けの世界基盤モデルとして提供され、従来は数カ月を要していた学習・評価サイクルを数日へ短縮できるとしている。

NVIDIA、オープン世界基盤モデルを発表

NVIDIAは、ロボットや自動運転車、ビジョンAI向けの新たな基盤モデル「Cosmos 3」を発表した。視覚理解、世界生成、アクション予測を単一システムに統合したフィジカルAI向けモデルであり、テキスト、画像、動画、環境音、動作データをネイティブに理解・生成できる点が特徴である。

Cosmos 3は「mixture-of-transformers(※)」アーキテクチャを採用する。推論を担うモデルと生成を担うモデルを組み合わせることで、物体の動きや空間・時間的な関係を理解しながらシミュレーションや行動生成を行う仕組みだ。

同社によると、Cosmos 3は数十億規模のマルチモーダルデータで事前学習されており、少ない追加データでも高性能なフィジカルAIシステムを構築できるという。世界生成やアクションポリシー、視覚理解に関する複数のベンチマークでトップクラスの性能を記録したとしている。

またNVIDIAは、Agile RobotsやRunway、Skild AIなどと共同で「Cosmos Coalition」を設立した。オープンな世界基盤モデルの発展を目的としたエコシステムであり、参加企業はモデルや評価手法、研究成果などを共有しながら開発を進める。

※mixture-of-transformers:複数のトランスフォーマーモデルを組み合わせ、それぞれの役割を分担させることで推論性能と生成性能の向上を目指すAIアーキテクチャ。

フィジカルAIの民主化進む一方で競争は激化へ

今回の発表は、フィジカルAI開発の裾野を大きく広げる可能性がある。これまでロボットや自動運転システムの開発には膨大な実世界データやシミュレーション環境が必要だったが、事前学習済みのオープンモデルが利用可能になれば、スタートアップや研究機関でも高度な開発に取り組みやすくなる。

特に製造業や物流、スマートシティ分野では、現実世界を理解して行動できるAIの導入が加速する可能性がある。AIが物理空間を認識しながら判断できるようになれば、自律ロボットや自動運転技術の実用化もさらに前進すると考えられる。

一方で、オープンモデルの普及によって基盤モデルへのアクセスが広がれば、フィジカルAI分野への参入障壁が下がり、開発競争が活発化する可能性もある。今後は基盤モデルそのものよりも、独自データや運用ノウハウ、実環境での検証能力が競争力の源泉となる可能性がある。

NVIDIAのジェンスン・フアンCEOは「フィジカルAIのビッグバンが近づいている」と述べた。今後は大規模言語モデルが生成AI市場の発展を支えたように、世界基盤モデルがロボティクスや自動運転分野において重要な役割を担う可能性もあり、その動向に注目が集まりそうだ。

NVIDIA プレスリリース

Share this article コピーしました
WRITTEN BY

PlusWeb3 編集部

Web3・AI専門メディア

PlusWeb3 編集部は、ブロックチェーン・Web3・AIの最新動向をわかりやすくお届けする専門メディアチームです。業界経験豊富な編集者とリサーチャーが、信頼性の高い情報を厳選してお届けします。

コピーしました

Web3・AI・ディープテック領域のキャリアに興味がありますか?

業界特化メディアを運営する専門エージェントが、企業のカルチャー・技術スタック・選考ポイントまで踏まえてキャリアをご提案します。相談は完全無料です。