2026年6月30日、米Anthropicは新たな大規模言語モデル「Claude Sonnet 5」を発表した。エージェントAIとしての性能を大幅に強化しながら、上位モデルに迫る能力と低価格を両立した点が特徴である。FreeからEnterpriseまで全プランで提供を開始し、開発者向けAPIでも利用可能となった。
エージェント性能が大幅向上 上位モデル級の能力を低価格で実現
Claude Sonnet 5は、計画立案からブラウザーやターミナルなどのツール操作、自律的なタスク実行までを一貫してこなせるよう設計された。Anthropicによれば、従来はより大規模かつ高価なモデルでなければ難しかった処理を、Sonnetクラスで実現したという。
前世代のSonnet 4.6と比較すると、推論やコーディング、ツール利用、知識労働といったエージェント性能が大きく向上した。各種ベンチマークでもSonnet 4.6を上回り、高い推論負荷では上位モデルのOpus 4.8に匹敵する性能を示した一方、中程度の負荷では優れたコスト効率を実現している。
早期アクセス利用者からは、従来モデルでは途中で停止していた複雑な作業を最後まで完了できるようになったほか、指示されなくても出力結果を自ら確認するなど、自律性の向上を評価する声が寄せられた。
価格面では2026年8月31日まで導入価格として入力100万トークンあたり2ドル、出力100万トークンあたり10ドルで提供される。その後は通常価格へ移行する予定であり、性能と価格のバランスを重視する開発者にとって有力な選択肢となりそうだ。
安全性も強化 企業でのAI活用拡大を後押しする可能性
Anthropicは性能向上だけでなく、安全性の改善もSonnet 5の重要な特徴として挙げている。評価では悪意ある要求への拒否能力やプロンプトインジェクション攻撃への耐性が向上し、ハルシネーションや迎合的な応答の発生率も前世代より低下した。
一方で、ソフトウェアの脆弱性を悪用するコードの生成など、高リスクなサイバーセキュリティ能力はOpus 4.8を大きく下回る結果となった。
このためAnthropicは、危険なサイバー利用を検知・遮断する保護機能を標準で有効化しつつ、一般用途では高い利便性を維持する設計を採用している。
こうした性能と安全性の両立は、企業がAIエージェントを実務へ導入する際の障壁を下げる可能性がある。特にソフトウェア開発や情報収集、業務自動化では、コストを抑えながら高度な自律処理を利用できる環境が整いつつある。
利便性とセキュリティ性のバランスがうまく保てていると評価できるだろう。
もっとも、より高度な推論や専門的なサイバー分析が求められる用途では、依然として上位モデルが優位となる場面も残る。今後は用途ごとに性能とコストを最適化しながらAIモデルを使い分ける流れが一段と加速すると考えられる。