OpenAI、新モデル「GPT-4.1」を公開 GPT-4o超えの高性能・低コストを両立

米OpenAIは2025年4月14日、最新AIモデル「GPT-4.1」をAPI向けに正式公開した。
従来のGPT-4oを大きく上回る性能を持ちながら、コストも抑えられており、実用性の面で大きな前進といえる。
100万トークン処理の「GPT-4.1」、コーディング・長文脈処理・推論力で飛躍的進化
GPT-4.1の最大の特徴は、最大100万トークン(※)のコンテキスト処理能力である。
GPT-4oの12万8000トークンから約8倍の拡張であり、Reactコードベースの8倍以上の情報を一括で処理可能になる。
コンテキスト処理能力が顕著に向上したことで、より長く複雑な文脈が理解できるようになり、文章のつながりや矛盾、意図をより正確に把握できるようになった。
従来のモデルでは長すぎる文書を分割して処理する必要があったが、GPT-4.1では全体を一度に把握できるため、情報の抜けや意味の取り違えが格段に減ることが期待される。
ベンチマーク評価でも頭ひとつ抜けた評価を獲得している。
ソフトウェア開発タスクの性能を示す「SWE-bench Verified」では54.6%を記録し、GPT-4oから21.4ポイントの上昇が見られた。
加えて、推論力を試す「Scale MultiChallenge」では38.3%、視覚・映像理解を評価する「Video-MME」では72.0%と、高度な多分野タスクにおける安定した性能が示された。
モデル構成は、最上位のGPT-4.1に加えて、高速化しつつコストを削減した「GPT-4.1 mini」、高速応答性と学術知識保持を両立させた「GPT-4.1 nano」の3種。
特にnanoは、100万トークン対応とMMLUスコア80.1%を両立し、128kトークンの長文に対しても初動5秒以内で応答できるという。
※トークン:
文章をAIが処理する際の最小単位で、単語や記号を分割して扱う単語片のこと。トークン数の上限はAIが一度に理解・出力できる情報量を表す。
GPT-4.5 Previewを凌ぐ実用性とコスト競争力
GPT-4.1の導入により、研究段階モデルとして提供されてきたGPT-4.5 Previewは2025年7月14日をもって廃止される予定である。
コスト面では、GPT-4.1の問い合わせ単価がGPT-4oより26%安く、プロンプトキャッシュ(※)割引も75%に拡大。さらに、Batch API経由では最大50%の追加割引が適用される。入力100万トークンあたりの料金も、GPT-4.1が2ドル、miniが0.40ドル、nanoが0.10ドルと明瞭で、企業利用を強く意識した価格設定だ。
しかし、コンテキストの肥大化は良い面だけでなく、ユーザーが意図せずノイズとなる情報を含めてしまうことがあり、出力の精度が下がるリスクも存在する。
場合によってモデルを切り替える柔軟性が、より求められることになるだろう。
GPT-4.1の公開は、GPT-4.5 Previewの廃止予定からも、モデルの安定性とコスト性能が一定の基準に達したと判断していることがうかがえる。
今後、企業や自治体を中心に、GPT-4.1ベースのAIシステムを業務に統合する動きが活発化していくと見られる。
※プロンプトキャッシュ:
過去の類似リクエストを再利用することで、処理負荷を抑えコストを削減する仕組み。効率的なリソース利用に貢献する。