OpenAIの新テストで奇しくもClaudeが最高得点　3.5 Sonnetのシステム開発能力を探る

2025-02-19

Web3/AI領域に特化した転職エージェント「Plus Web3 Agent」

上場企業のグループ会社として最先端のテクノロジー領域で働きたい人材と技術に投資する大手事業会社・スタートアップのマッチングを支援しています。お気軽に「無料キャリア相談」をご利用ください。

キーワードで記事・企業を探す

OpenAIは2025年2月19日、人間のエンジニアのような能力を評価する新しいベンチマーク「SWE-Lancer」を発表した。実際のフリーランス開発案件をベースとしたテストで、コーディングに留まらない総合的なエンジニアリング能力を評価するテストとなっている。

参考 : OpenAI、人間のエンジニアのような能力を評価する新たなベンチマークテストを発表

ただ、今回の新しいテストでは、興味深い結果が見られた。このテストで最高点を記録したのは、OpenAIの最新モデルGPT-4oではなく、AnthropicのClaude 3.5 Sonnetだったのだ。Sonnet 3.5は2024年6月に公表されたモデルだが、最新のテストでその性能が再評価された形になる。

OpenAIの新テストで証明された実力

AnthropicはOpenAIの元従業員によって設立された企業で、安全性と倫理性を重視したモデル開発を進めている。主力製品であるClaudeは、特にプログラミングと論理的思考において高い評価を受けているAIモデルだ。

OpenAIが発表したSWE-Lancerは、1,400以上の実際のフリーランス案件を評価基準として採用し、単純なコーディングだけではなく、総合的な開発力をテストするものだ。このテストでClaude 3.5 Sonnetは、26.2%の課題解決率を記録し、GPT-4oの8.0%を大きく上回る結果となった。特にマネジメント判断を要する課題では44.9%の成功率を示した。コーディングにとどまらない総合的な能力に長けていることが証明されたのである。

システム開発でのClaudeの有効性

システム開発において、3.5 Sonnetを評価する声は以前からあった。
qodoの記事によると、Claude 3.5 Sonnetは、複雑なコード構造の生成やデバッグ作業などの複雑なタスクでも、高い精度を維持したという。
さらに16x Promptのレポートでは、大規模なシステムの設計において、将来の拡張性や業界での標準的な手法を考慮した提案が可能だと指摘している。予期せぬ状況や例外的な場合への対応も充実しており、実際の開発現場で求められる品質水準を実現しているとのことだ。

Claudeの今後

9metersの報道によると、2025年2月末から3月初旬にかけて、次世代モデルとなるClaude 4.0がリリースされる見込みだという。新モデルは深い推論能力と迅速な応答性を組み合わせることで、さらなる性能向上が期待されるとのこと。
また、法的調査、科学的発見、データに基づく意思決定などの分野で、GPT-4を上回る論理的推論能力を発揮する可能性があるということだ。
ただし、現時点でAnthropic社からの公式発表はなく、業界関係者からの情報に基づくものであることに注意が必要だ。

今回のSWE-Lancerでの好成績は、システム開発におけるClaudeの有効性を改めて示すものとなった。Claude 4.0の登場が待ち望まれる。

🚀 AI・Web3業界への転職を考えているあなたへ

「最先端技術に関わる仕事がしたい」「成長市場でキャリアを築きたい」そんな想いを抱いていませんか？

Plus Web3は、AI・Web3領域などテクノロジーに投資する企業の採用に特化したキャリア支援サービスです。
運営する株式会社プロタゴニストは、上場企業グループの安定した経営基盤のもと
10年以上のコンサルタント歴を持つ転職エージェントが
急成長する先端技術分野への転職を専門的にサポートしています。

表に出てこない優良企業との出会い

求人サイトには掲載されない非公開求人を抱える企業が全体の約8割を占めています。

特にAI・Web3業界では正しい情報が中々表に出てこず

▼大手VCから資金調達したばかりのAIスタートアップ
▼Web3技術で新事業を立ち上げる上場企業の新部
▼著名な起業家が立ち上げた次世代AI企業
▼海外展開を控える国内有力ブロックチェーン企業

こうした隠れた成長企業へアクセスできるのが専門エージェントとしての価値です。

こんな方におすすめです

▼成長産業であるAI・Web3業界で新しいキャリアを始めたい
▼「未経験だけど挑戦してみたい」という熱意がある
▼今のスキルを最先端技術分野でどう活かせるか相談したい
▼表に出ない優良企業の情報を知りたい

業界に精通したキャリアアドバイザーが、
あなたの経験・スキル・志向性を丁寧にヒアリングし、
最適な企業とポジションをマッチングします。

まずは無料キャリア相談で、あなたの可能性を広げるチャンスを掴みませんか？

キャリア相談する

Web3企業

AI企業

キャリア相談する

この記事が気に入ったら
フォローしてね！

Follow @PlusWeb3_

Please Share

URLをコピーしました！

OpenAIの新テストで奇しくもClaudeが最高得点　3.5 Sonnetのシステム開発能力を探る

OpenAIの新テストで証明された実力

システム開発でのClaudeの有効性