Anthropic、最上位AI「Claude Opus 4.5」公開 コード生成とエージェント強化

2025年11月25日、米Anthropicが最新大規模言語モデル「Claude Opus 4.5」の提供開始を発表した。
コード生成精度やエージェント型タスク処理能力が大幅に向上し、多言語開発や業務自動化での実用性が高まったと報じられている。
エンジニア向け試験で他最新モデルを上回る性能を示す
Anthropicが公開した「Claude Opus 4.5」は、従来モデルから一段進んだ高度処理能力を特徴とする。
特にソフトウェアエンジニア向け性能試験「SWEベンチ」で競合モデルを超えるスコアを記録し、Gemini 3.0 ProやGPT-5.1-Codex-Maxを上回ったという。
さらに、多言語環境でのコード生成性能を測る「SWE-bench Multilingual」ではCやJava、PHP、Rubyなど主要言語に対応し、8言語中7言語で他モデルを凌ぐ最高評価となった。
また、実世界に近い自律業務処理を評価する「τ2ベンチ」では、柔軟かつ創造的な問題解決力が確認された。
安全性の強化も行われ、プロンプトインジェクション(※)への耐性も向上したと発表されている。
そのほか開発者向けのDeveloper Platformでは、出力精度と速度・コストを調整できる「Effort Parameter」が導入され、用途に応じた制御が可能になった。
記憶機能やコンテキスト圧縮の改善により、長時間タスクでも処理効率が最適化されている。
今回の発表に合わせ、MaxおよびTeam Premiumユーザー向けには、Opus固有の使用制限が緩和され、標準モデルのSonnetと同程度のトークンが使用できるようになった。
Claude APIでは、100万トークンあたり入力は5ドル、出力は25ドルの価格設定がなされている。
※プロンプトインジェクション:入力文を悪用しAIモデルの意図しない出力を誘発させる攻撃手法。モデル安全性評価の重要指標となっている。
利便性向上とコスト課題が焦点に
Claude Opus 4.5では、多言語コード生成とエージェント性能の向上が強調されており、実務に直結するメリットがあると言える。
特にSWEベンチでの高スコアは、既存モデルとの差別化につながり、エンジニアリング領域における競争力を押し上げる材料になったと考えられる。
ただ、100万トークンあたり5ドル/25ドルという料金体系は強気な価格設定だ。
例えば、OpenAIのモデルである「GPT-5」は、100万トークンあたり入力が1.25ドル、出力は10ドルという価格設定となっている。
Opusシリーズはこれまでも高性能モデルとして標準のSonnetや軽量のHaikuと差別化されてきたが、使用するタイミングや場面には相変わらず注意が必要だ。
今後は、多言語コード生成能力の強化が、ソフトウェア開発の国際化とローカル領域の両面で波及する見通しである。
また、エージェント性能の進展により、単発の生成ではなく「継続的・自律的な運用」に価値の重心が移行する流れが進みつつあると考えられる。
関連記事:
Anthropic、Claude Sonnet 4.5公開 日常利用と開発支援を強化












