OpenAIがGPT-5.4を公開｜実務を変える新世代モデルとは

2026年3月5日、OpenAIはChatGPT、API、CodexでGPT-5.4の提供を始めました。今回のモデルは、推論、コーディング、エージェント型ワークフローの強みを一つにまとめ、スプレッドシートやプレゼンテーション、文書作成といった実務での使いやすさを高めた点が特徴です。加えて、コンピュータ操作やウェブ調査、長い文脈の保持、安全対策の面でも改善が打ち出されており、従来より少ないやり取りで成果物を作りやすくなったと見られます。業務向けAIの進化がどこまで進んだのかを整理するため、本プロジェクトの詳細を考察します。

業務の現場に寄せて進化したGPT-5.4の現在地

生成AIの進化はここ数年で一気に進みましたが、GPT-5.4はその中でも特に「仕事で使う」ことを強く意識したモデルとして位置づけられます。OpenAIは、GPT-5.4を業務用途向けに設計した高性能かつ効率的なモデルと案内しており、ChatGPTではGPT-5.4 Thinkingとして、APIとCodexでも利用できるようにしました。今回の特徴は、文章を作るだけでなく、調べる、考える、資料を作る、ツールを使うといった一連の流れを、より少ない指示で進めやすくした点にあります。

実際にOpenAIは、推論、コーディング、エージェント型ワークフローの進歩を一つのモデルに統合したと説明しています。さらに、スプレッドシートやプレゼンテーション、ドキュメントを扱う業務タスクでの動作改善も示しており、日常業務の補助ではなく、成果物づくりそのものに踏み込むモデルへ近づいたと受け取れます。単なる会話AIの更新ではなく、実務の流れに組み込む前提で整えられたことが、GPT-5.4の大きな意味だと考えられます。

参考：OpenAI「GPT‑5.4 が登場」
https://openai.com/ja-JP/index/introducing-gpt-5-4/

知識業務で発揮されるGPT-5.4の実務性能

GPT-5.4では、文章生成だけでなく、専門職の業務に近いタスクで成果物を作る能力が強化されています。営業資料や分析資料、スプレッドシートなど、企業の知識業務に必要なアウトプットをより安定して作成できるよう改善されています。本項では、業務パフォーマンスの向上を示すポイントを3つの観点から整理します。

専門職レベルの知識業務タスクへの対応

GPT-5.4は、知識業務の成果物を作れるかを測る評価指標「GDPval」で大きな改善を示しました。この指標では、営業プレゼンテーション、会計用スプレッドシート、医療現場のシフト計画、製造図面、短い動画など、実際の業務に近い成果物の作成能力が評価されます。GPT-5.4はこの評価で83％という結果を示し、前世代モデルよりも高い成果を出しています。これはAIが単に文章をまとめるだけではなく、専門職が日常業務で行う分析や資料作成の作業に近い領域まで踏み込んでいることを示しています。44の職種に関わるタスクを対象とした評価でこの結果が出ていることから、AIが複数の業界で実務補助として機能する可能性が高まっていると考えられます。

スプレッドシートや資料作成の精度向上

OpenAIは、今回のモデルで特にスプレッドシート、プレゼンテーション、ドキュメント作成の改善に力を入れたと説明しています。たとえば、投資銀行の初級アナリストが行うようなスプレッドシート分析を想定した評価では、GPT-5.4の平均スコアは87.5％に達しました。これはGPT-5.2の68.4％を大きく上回る結果です。またプレゼンテーションの評価では、人間の評価者がGPT-5.4の資料をより好む割合が68％となりました。理由としては、視覚表現の多様さやデザイン性の高さ、画像生成の活用などが挙げられています。こうした結果から、AIが資料作成の初期作業だけでなく、完成度の高いアウトプットを作る補助として使われる可能性が高まっていると考えられます。

事実性の向上と誤情報の減少

AIの実務利用では、回答の正確性が重要な課題となります。GPT-5.4では、この点に対する改善も進められています。OpenAIが実施した評価では、ユーザーが誤りを指摘した過去のプロンプトを使ったテストで、個々の主張が誤っている確率がGPT-5.2と比べて相対的に33％低下しました。また、回答全体に誤りが含まれる確率も18％低くなったと報告されています。これにより、AIが生成する情報の信頼性がより高まり、ビジネス用途でも使いやすくなったと考えられます。完全な正確性を保証するものではありませんが、誤りを減らす取り組みが続けられている点は、業務利用を広げるうえで重要な進歩といえます。

コンピュータ操作と開発ワークフローの進化

GPT-5.4では、単に文章を作るAIから一歩進み、コンピュータやソフトウェアを扱う能力も強化されています。特に開発者や企業のシステム環境で使われることを想定し、アプリケーション操作、ツール連携、長時間の作業計画といった領域で改善が進められました。これにより、AIが単発の回答を返すだけでなく、複数の工程をまたぐ作業を進める役割を担うことが期待されています。本項では、その具体的な進化を3つの観点から整理します。

AIがコンピュータを操作する新しい仕組み

GPT-5.4は、コンピュータ操作能力を備えた汎用モデルとして設計されています。開発者は、ウェブサイトやソフトウェアを操作するエージェントを構築でき、AIが複数のアプリケーションを横断しながらタスクを進めることが可能になります。たとえば、スクリーンショットを読み取りながらマウスやキーボードの操作を判断するなど、人間が画面を見て作業するようなプロセスをAIが補助できる仕組みが整えられました。こうした能力は、デスクトップ環境での操作能力を測る評価でも高い結果が示されており、成功率は75％に達しています。この数値は従来モデルを大きく上回り、人間の平均的な成績を上回る結果となりました。これにより、AIが単なる回答生成ツールではなく、実際の操作を伴う作業の補助役として使われる可能性が広がっています。

開発者向けコーディング性能の強化

GPT-5.4には、GPT-5.3-Codexのコーディング能力が取り込まれており、プログラム開発の分野でも性能が向上しています。ソフトウェア開発の課題解決能力を測るSWE-Bench Proの評価では、従来モデルと同等以上の精度を維持しながら、処理の待ち時間を短縮する結果が示されました。さらにCodexでは「/fast」モードを利用することで、処理速度を最大1.8倍まで高めることができます。モデルの知能そのものは変えず、処理のスピードを上げる仕組みです。これにより、コード生成、デバッグ、改良といった作業を繰り返しながら進める開発プロセスを止めずに続けられるようになります。こうした改善は、AIを開発環境の一部として活用する流れを後押しすると考えられます。

長いタスクを扱うためのコンテキスト拡張

GPT-5.4では、最大100万トークンという大きなコンテキストを扱えるようになりました。これは、長い文書や複数のデータをまとめて扱う際に重要な要素となります。長時間にわたる作業では、途中の情報を忘れずに計画や判断を続けることが必要になりますが、大きなコンテキスト容量はその課題を補う役割を果たします。たとえば、複数の資料を読み込みながら分析を進めたり、長いプロジェクトの作業手順を整理したりする場面で活用される可能性があります。AIエージェントが計画を立て、作業を実行し、結果を確認するといった一連のプロセスを支える基盤として、この拡張は重要な意味を持つと考えられます。

AIエージェント時代を見据えたGPT-5.4の設計思想

近年の生成AIは、質問に答えるだけでなく、複数の作業を順番に進める「AIエージェント」としての役割が注目されています。GPT-5.4もこの流れを踏まえ、ツールの利用、ウェブ調査、作業の進め方の提示など、長い作業プロセスを扱う能力が強化されています。AIは単発の質問応答から、タスク全体を見ながら作業を進めるアシスタントとしての使い方が広がりつつあります。

GPT-5.4では、外部ツールと連携する仕組みも改善されています。APIでは「tool search」が導入され、AIが必要なツールをその場で探して利用できるようになりました。従来はすべてのツール定義を最初から読み込む必要がありましたが、新しい方式では簡易一覧を受け取り、必要な時に詳細を取得します。この仕組みにより、ツールを多く扱う環境でも効率的に動作しやすくなり、トークン使用量を約47％削減できる構成例も示されています。

また、ウェブ検索を使った情報収集の能力も向上しています。複数回の検索を行いながら関連性の高い情報を整理して回答できるようになり、情報量が多いテーマでも調査を進めやすくなっています。

さらにChatGPTでは、GPT-5.4 Thinkingとして作業の進め方を最初に示す機能も追加されています。途中で方向を調整しながら結果を整えやすくなり、長い会話の文脈を保ちながら回答を作る能力も改善されています。

今後の展望

生成AIはここ数年で急速に進化し、企業の業務や開発の現場でも活用が広がっています。GPT-5.4では、文章生成にとどまらず、資料作成、コンピュータ操作、ツール連携など、実務に近い領域までAIの役割が広がりました。今後は、AIが単なる補助ツールではなく、業務の一部として機能する可能性が高まっていくと考えられます。ここでは、GPT-5.4の特徴から見えてくる今後の活用の方向性について、3つの視点から考察します。

業務AIエージェントの本格的な普及

GPT-5.4の特徴の一つは、ツールを選択して使いながら複数の作業を進められる点です。これまでの生成AIは文章作成や質問回答が中心でしたが、今後は業務の流れそのものをAIが補助する形へと変わる可能性があります。例えば、営業活動では顧客情報の整理、資料作成、メールの下書き、スケジュール調整など複数の作業が発生します。AIエージェントがこれらの工程を連携して進めるようになれば、人が行う作業の多くが自動化される可能性があります。特に企業システムとAIが連携する環境では、AIが必要なツールを選びながら業務を進める仕組みが重要になります。GPT-5.4で導入されたツール検索やエージェント型ワークフローの改善は、その基盤になる技術だと考えられます。今後は、企業ごとの業務に合わせてAIエージェントを設計する取り組みが広がり、AIが業務の一部として自然に組み込まれていく可能性があります。

専門職の仕事を支えるAIパートナーの進化

GPT-5.4では、スプレッドシート作成やプレゼンテーション作成など、専門職の業務に近い成果物を作れる能力が向上しました。この流れが続けば、AIは単なる文章生成ツールではなく、専門職の仕事を支えるパートナーとして活用される可能性があります。例えば、金融分析ではデータ整理や計算モデルの作成、レポート作成といった作業が必要になりますが、AIがこれらの作業の下準備を行うことで、人間は判断や戦略立案に集中できるようになります。また、法律、医療、研究などの分野でも、資料整理や情報収集の負担を減らす形でAIが活用される可能性があります。AIが完全に専門職を代替するわけではありませんが、調査や分析の補助として機能することで、仕事の進め方が大きく変わる可能性があります。今後はAIをどのように業務に組み込むかが、企業や組織の競争力に影響する要素になっていくと考えられます。

人とAIの協働による新しい働き方

GPT-5.4では、作業計画を提示するThinking機能や長い文脈を扱える能力など、人との協働を前提とした設計が見られます。これはAIが単に結果を出すだけではなく、人と一緒に作業を進める役割を担う方向へ進んでいることを示しています。例えば、企画を考える場面ではAIが複数の案を出し、人間がそれを評価しながら方向を決めるといった使い方が考えられます。また、開発や研究の分野でも、AIが試行や調査を補助することで、人間のアイデアを形にするスピードが高まる可能性があります。こうした環境では、人とAIの役割分担が重要になります。AIは大量の情報処理や反復作業を担当し、人間は判断や創造的な部分を担う形です。GPT-5.4のようなモデルが普及すれば、AIと協力して仕事を進めることが一般的な働き方になっていく可能性があります。

OpenAIがGPT-5.4を公開｜実務を変える新世代モデルとは

業務の現場に寄せて進化したGPT-5.4の現在地

知識業務で発揮されるGPT-5.4の実務性能

専門職レベルの知識業務タスクへの対応

スプレッドシートや資料作成の精度向上

事実性の向上と誤情報の減少

コンピュータ操作と開発ワークフローの進化

AIがコンピュータを操作する新しい仕組み

開発者向けコーディング性能の強化

長いタスクを扱うためのコンテキスト拡張

AIエージェント時代を見据えたGPT-5.4の設計思想

今後の展望

業務AIエージェントの本格的な普及

専門職の仕事を支えるAIパートナーの進化

人とAIの協働による新しい働き方

PlusWeb3 編集部

記事を寄稿しませんか？

Web3・AI・DeepTech領域でのキャリアをお考えですか？

OpenAIがGPT-5.4を公開｜実務を変える新世代モデルとは

業務の現場に寄せて進化したGPT-5.4の現在地

知識業務で発揮されるGPT-5.4の実務性能

専門職レベルの知識業務タスクへの対応

スプレッドシートや資料作成の精度向上

事実性の向上と誤情報の減少

コンピュータ操作と開発ワークフローの進化

AIがコンピュータを操作する新しい仕組み

開発者向けコーディング性能の強化

長いタスクを扱うためのコンテキスト拡張

AIエージェント時代を見据えたGPT-5.4の設計思想

今後の展望

業務AIエージェントの本格的な普及

専門職の仕事を支えるAIパートナーの進化

人とAIの協働による新しい働き方

PlusWeb3 編集部

記事を寄稿しませんか？

この記事が役に立ったら、ニュースレターも登録しませんか？

関連する最新記事

Coin Estate、口座開設で1,500円相当 入金で最大6,500円分の暗号資産購入ポイント

アンソロピック、米国防総省を提訴 AI供給網リスク指定で政府契約停止巡り

AIドローン実用化へ ACSLとPFNが協業、2028年発売を目指す

Web3・AI・DeepTech領域でのキャリアをお考えですか？

Coin Estate、口座開設で1,500円相当　入金で最大6,500円分の暗号資産購入ポイント

アンソロピック、米国防総省を提訴　AI供給網リスク指定で政府契約停止巡り

AIドローン実用化へ　ACSLとPFNが協業、2028年発売を目指す