Anthropic、AIモデル「Claude 3.7 Sonnet」を発表 ハイブリッド推論とコーディング能力の向上

Anthropicは2025年2月25日、AIモデル「Claude 3.7 Sonnet」を発表した。このモデルは、初のハイブリッド推論モデルとして、迅速な応答と深い思考を両立させる「標準モード」と「拡張思考モード」を搭載している。
コーディング能力が向上し、安全性と信頼性も強化された。
Claude 3.7 Sonnet 進化したAIモデルの特長
Claude 3.7 Sonnetは、従来のLLM(大規模言語モデル)(※)と推論モデル(※)の機能を統合したハイブリッド推論モデルである。このモデルの最大の特徴は、状況に応じて2つのモードを切り替えることができる点にある。
標準モードでは、簡単な質問に対して瞬時に応答を生成する。
一方、拡張思考モードでは、複雑な問題に対して段階的な推論を行い、詳細な解説を提供する。
コーディング能力の向上も注目すべき点である。
Claude 3.7 Sonnetは、前モデルよりも大幅にコーディングタスクの性能が向上しており、特にフロントエンド開発や複雑なコードベースの解析において優れた結果を示している。ベンチマーク「SWE-bench Verified(※)」では、標準モードで62.3%、拡張思考モードで70.3%の正答率を記録した。
また、安全性と信頼性も向上している。
新しいモデルでは、有害リクエストと無害リクエストをより細かく判別できるようになり、誤った拒否を45%削減することに成功した。ユーザーは、より安心して利用できるようになったと思われる。
Claude 3.7 Sonnet 利用方法と市場の反応
Claude 3.7 Sonnetは、Anthropic API、Amazon Bedrock、Google CloudのVertex AIなど、複数のプラットフォームで利用可能である。価格は、入力トークン100万あたり3ドル、出力トークン100万あたり15ドルと設定されている。
市場では、Claude 3.7 Sonnetが他のAIモデルと比較して高い性能を示しており、特にコーディング能力において優位性を持つと評価されている。ユーザーからのフィードバックも良好で、今後の展開が期待される。
※ 大規模言語モデル(LLM): 大量のテキストデータを学習したAIモデル。自然言語処理能力が高く、文章生成、翻訳、要約など様々なタスクに利用される。
※ 推論モデル: 与えられた情報に基づいて論理的な推論を行うAIモデル。複雑な問題を解決するために、段階的な思考プロセスを模倣する。
※ SWE-bench Verified: ソフトウェア開発タスクにおけるAIモデルの性能を評価するためのベンチマーク。
Plus Web3は「Web3領域に特化したキャリア支援サービス」

Plus Web3では、Web3で働きたい人材と、個人に合わせた優良企業をマッチングする求人サービスを行っています。
- Web3で働くことも考えている…
- Web3のインターン先はどこがいいか分からない…
- どんな知識やスキルがあれば良いのか分からない…
このような悩みを抱える人は、一度「無料キャリア相談」にお越しください。あなたにマッチした優良企業をご紹介いたします。