Googleが「Gemini 2.5 Pro」に新機能「Deep Think」搭載 思考性能はOpenAIモデルを上回る水準

2025年5月20日、米GoogleはAIモデル「Gemini 2.5 Pro」に、高度な思考処理を可能にする新モード「Deep Think」を発表した。
複雑な数式やコーディングに対応できる能力を持ち、複数のベンチマークでOpenAIの「o3」や「o4-mini」を上回る性能を記録したという。
Googleの新機能「Deep Think」、AIの思考力を大幅強化
Googleは、AIモデル「Gemini 2.5 Pro」に新たな思考モード「Deep Think」を追加した。
これは従来の推論能力を拡張し、複数の仮説を同時に検討することで、応答の精度や深さを飛躍的に向上させる機能である。
発表によれば、「Deep Think」は特に数学、プログラミング、マルチモーダル処理の3領域において、既存モデルの限界を超えた成果を示した。
具体的には、OpenAIが開発した「o3」および「o4-mini」との比較ベンチマークにおいて、全ての指標で上回るパフォーマンスを達成した。
AIの認知的能力の新たな基準を提示した形だ。
なお、この技術は非常に高度であるため、Googleは一般提供に先立ち、安全性と信頼性に関する専門家の意見を収集中だ。
今後、限定的なテスト運用を経て、Gemini API経由で段階的に展開される予定である。
複雑思考AIの実装が進む中で問われる倫理と安全性
「Deep Think」の登場は、AIにおける「思考の質」の新たな段階を示すものといえる。
特に、複雑な課題をAIに委ねるシーンが広がる中で、単なる情報処理ではなく、「仮説を立て、検証する」といった高度な認知プロセスを担える点は大きな利点となるだろう。
プログラミング支援や科学計算分野では即時の実務効果が期待される一方で、誤った仮説展開による、誤解答のリスクも想定される。
Googleが慎重な導入を進めている背景には、AIの判断に対する社会的信頼の維持という観点があると考えられる。
特に医療・法務など高リスク領域への応用を視野に入れる場合、安全性検証やトレーサビリティ(※)の確保が不可欠だ。
また、競合各社にとっても「Deep Think」は技術的挑戦の指標となり、今後はより多くのAIモデルが「思考の透明性」と「判断の妥当性」を争点とすることが予想される。
※トレーサビリティ:AIが出力した結果の根拠や思考プロセスを、後から検証・追跡可能にする仕組みのこと。説明責任や安全性の観点で注目されている。