OpenAIがコーディングエージェント「Codex」公開 エンジニア業務で「o3-high」を凌駕

2025年5月17日、米OpenAIはソフトウェア開発に特化した新たなコーディングエージェント「Codex」のプレビュー版を発表した。
大規模言語モデル「o3」系列を最適化した「codex-1」を搭載し、従来の「o3-high」を上回る性能を実現したという。
複数タスクを並行処理 開発支援に特化した「Codex」登場
OpenAIが新たに発表した「Codex」は、ChatGPTを通じてコーディング、バグ修正、技術的質問への回答などを依頼できるAIエージェントである。
モデルには、ソフトウェアエンジニアリング用途に最適化された「codex-1」が採用されており、同社の社内ベンチマークにおいて「o1-high」「o4-mini-high」「o3-high」を上回る正確性を示した。
Codexは、ユーザーのリポジトリを読み込んだクラウド上の独立したコンテナ環境で動作する。
コードの読み取りや編集、テスト実行、型チェックなどのタスクを実行し、進行状況はリアルタイムで可視化される。
作業中にテスト失敗や不明点が発生した場合は、ユーザーに通知される仕組みだ。さらに、Markdown形式でリポジトリに手順書を配置すれば、作業フローの指示も可能となる。
プレビュー提供はまず「Pro」「Enterprise」「Team」プランのユーザーが対象で、今後は「Plus」や教育機関向けにも拡大予定としている。
開発業務の効率化に期待 価格体系とリスク管理も鍵に
Codexの導入によって、開発現場の生産性は大きく向上する可能性がある。
ユーザーはタスクの難易度に応じて1分〜30分程度で処理完了を期待できるため、コード修正後にはGitHubへのプルリクエスト送信やローカル環境への統合も行える。複数タスクの並行処理も可能なため、エンジニアの負担軽減に直結する。
すでに米Ciscoなどの企業がCodexを先行利用し、フィードバックを提供しているという。
また、悪意あるソフトウェア開発リクエストはブロックされる設計で、外部APIやWebサイトへのアクセスは行われない。
これにより、セキュリティと倫理面のリスクを最小限に抑える構造となっているが、完全な防止策とは言い切れず、引き続き運用上の監視体制が求められる。
OpenAIは、今後数週間は追加料金なしでCodexを提供するとし、その後はレート制限と利用上限を超えた場合の有料化を見据えている。
総じて、Codexが業務インフラとして定着するには、透明性の高い課金モデルと継続的な機能改善が鍵となるだろう。