OpenAIがGPT-5.2を公開 知的労働タスクで専門家水準に到達

OpenAIは最新の生成AIモデル「GPT-5.2」を公開した。
汎用・推論・最上位の3モデルを展開し、知識労働タスクで人間の専門家レベルの性能を示したとしている。
GPT-5.2公開、3モデル展開で実務性能を大幅強化
2025年12月11日、OpenAIは、最新AIモデル「GPT-5.2」を正式に公開した。
ラインアップは、高速で汎用的な「GPT-5.2 Instant」、高度な推論を担う「GPT-5.2 Thinking」、最上位モデルの「GPT-5.2 Pro」の3種類で構成される。
ChatGPT Plus、Pro、Business、Enterpriseの各有料プラン利用者から順次利用可能となる。
GPT-5.2は、汎用知能や長文文脈の理解、エージェント型ツール呼び出し、視覚認識処理などで性能を高めた。
実務能力を測定するベンチマーク「GDPval(※)」では、GPT-5.2 Thinkingが70.9%の最高スコアを記録した。
評価対象は44職種の知識労働タスクで、プレゼンテーション作成やスプレッドシート作成などが含まれる。
コーディング分野では、SWE-Bench Proで55.6%、RC-AGI-2で52.9%、Frontier Mathで40.3%を記録した。
また、視覚認識では科学論文の図表理解やGUIスクリーンショット解析への対応力が向上している。
安全面では、18歳未満へのセンシティブコンテンツ制限を自動適用する年齢予測モデルを導入した。
GPT-5.2の開発背景として、Googleが高性能モデル「Gemini 3」を公開した後、OpenAI社内で「コードレッド(非常事態)」が宣言され、ChatGPTの性能向上が最優先方針として定められたと報じられている。
ChatGPT上での利用に加え、Microsoft 365 Copilot、GitHub Copilot、Microsoft Foundry、Copilot Studioなど、マイクロソフトの主要な業務・開発向けサービスでも対応するとしている。
※GDPval:44職種の知識労働タスクを対象に、AIの実務遂行能力を評価するベンチマーク。資料作成や分析など、現実の業務に近い課題で人間の専門家との比較を行う指標。
業務効率化を加速する一方、依存と統制が課題に
GPT-5.2が示した性能は、知的労働の効率化を大きく前進させる点が最大のメリットと言える。
資料作成、分析、コーディングといった業務を短時間かつ低コストで実行できるため、企業の生産性向上や人材不足の補完に寄与する可能性がある。
特に、推論モデルの精度向上は、複雑な業務フローの整理や意思決定支援において価値を持つと考えられる。
一方で、課題も発生し得る。
業務の中核をAIに委ねるほど、特定モデルへの依存度が高まり、障害発生時や仕様変更時の影響が大きくなる可能性もある。
加えて、AIの判断根拠が可視化されにくい場合、誤った出力が業務判断に用いられるリスクも残る。
今後は、AIを全面的に代替手段とするのではなく、人間の確認や責任範囲を明確にした運用設計が重要になるだろう。
GPT-5.2は、知的労働を置き換える存在というより、業務構造そのものを再設計する契機として位置付けられそうだ。
関連記事:
OpenAIがChatGPT改良へ総動員 競合激化でアルトマンCEOが「非常事態」宣言












