OpenAI、GPT-5提供開始 ハルシネーションをo3比で6分の1に低減

2025年8月8日、米OpenAIは新たな大規模言語モデル「GPT-5」を発表し、同日より提供を開始した。
事実誤認を大幅に低減し、無料版から有料版まで幅広く利用可能となる。
GPT-5、思考精度と応答品質を大幅強化
OpenAIは新モデル「GPT-5」を正式発表し、ChatGPTのPlus、Pro、Team、無料版の全ユーザーに向けて提供を開始した。
EnterpriseおよびEdu版は来週以降の展開を予定している。
GPT-5は従来複数あったモデルを統合し、タスクに応じて自動で高度な思考機能を起動する設計を採用した。
特に複雑な課題向けには「GPT-5 Thinkingモード」を搭載し、従来のo3モデルに代わる性能を提供する。
ハルシネーション(※)の低減は今回の大きな進化点で、GPT-4o比で20%、Thinkingモードではo3比で70%の削減に成功した。自由回答形式ではo3比で6分の1まで発生率を抑制したという。
また、GPT‑5は推論時、実行困難なタスクは明確に理由を示して対応を拒否するという。
さらにコーディング、文章作成、ヘルスケア分野でも性能を向上させた。
特に大規模コードのデバッグや高度なデザイン理解、詩的表現を含む文章生成、医療分野の「HealthBench」評価では、従来モデルを大きく上回る結果を示している。
加えて、不要な絵文字使用や過度な迎合を減らし、博士号レベルの知性を持つ人物と対話しているような自然な会話体験を実現した。
安全性面では「セーフコンプリーション」を導入。センシティブな質問に対しては、安全性の範囲内で最大限有益な応答を提供する。適切か危険かを判断して完全拒否または完全対応を行う従来の拒否ベースと異なり、拒否が必要な際には「なぜ応えられないか」を明確に説明し、安全な代替案を提示する。
※ハルシネーション:生成AIが事実と異なる情報をもっともらしく提示してしまう現象。信頼性確保のため、低減は重要課題とされてきた。
業務利用の拡大期待も、依存リスクへの警戒必要
GPT-5の大幅な精度向上は、企業の業務プロセスにおけるAI活用を一段と後押しすると見られる。
特にハルシネーション低減と限界の明示は、法務や医療など高い正確性が求められる分野での導入障壁を下げる要因となる。
コーディング能力や文章表現の強化は、ソフトウェア開発やコンテンツ制作における生産性向上にも寄与するだろう。
加えて「セーフコンプリーション」の採用は、ユーザー体験を損なわずに安全性を確保する新たな試みとして注目される。
一方で、高度化したAIに業務判断を委ねすぎることで、人間側のスキル低下や依存リスクが拡大する懸念もある。
モデルが「できない」と判断した領域での人間による補完や検証プロセスを怠れば、誤判断や情報欠落につながる可能性は否定できない。
また、無料版を含めた広範な提供は利用者層の急拡大を招く一方で、悪用や情報の誤伝播リスクを伴う。
特にセンシティブな分野での利用ルール整備や利用者教育が追いつかなければ、信頼性確保の取り組みが十分に機能しない恐れもある。
今後は、GPT-5の実運用における効果検証とリスクマネジメントの両面での評価が、普及スピードと社会的受容度を左右するだろう。