2026年2月16日、東京大学大学院農学生命科学研究科は、ChatGPTに搭載される人工知能モデルGPTが日本獣医師国家試験で合格基準を大幅に上回る成績を記録したと発表した。
日本語原文のまま高精度で解答できることが確認され、専門職分野でのAI活用の現実性が示された。
GPT、日本語試験で92.9%の高得点
研究チームは過去3年分の日本獣医師国家試験(※)を用い、複数のGPTモデルの解答性能を比較検証した。
その結果、最新のo3モデルが最も高い精度を示し、日本語原文の問題をそのまま入力した条件でも全セクションで合格基準(60〜70%)を大きく上回り、総合正答率92.9%を記録したという。
これまで医師国家試験などでは英語翻訳を介した評価例が多かったが、本研究は日本語環境下で専門知識を要する獣医学領域でも高い理解能力を持つことを示した。
プロンプト最適化を行わない標準条件でも高精度を維持したことから、実運用に近い性能が確認されたと言える。
一方、不正解の傾向分析では、国内法規に関する設問、画像読解問題、複数情報の統合を必要とする臨床推論で正答率の低下が確認された。分野ごとの強弱が存在することも明らかになっている。
※日本獣医師国家試験:獣医師免許取得のための国家試験。全330問で構成され、必須問題7割、その他問題6割が合格基準となる。
教育・業務支援で広がる可能性と限界
今回の成果は、GPTが日本の獣医学教育や実務において、学習支援や知識検索などの補助ツールとして活用できる可能性を示す基盤研究と位置付けられる。
専門知識の網羅性と日本語理解力が確認されたことで、医療・ライフサイエンス領域における業務効率化の現実性が一段と高まったと考えられる。
一方で、研究チームは本結果が診断や治療といった専門判断の代替を意味するものではないと明確にしている。法規解釈や臨床判断、画像評価などで精度のばらつきが見られる以上、人間の監督を前提とした利用が不可欠となるだろう。
今後は、AIの強みを生かした教育設計や業務フローの再構築が重要なテーマとなる考えられる。
今回の成果は、専門資格レベルの知識を持つAIが実務環境に組み込まれる可能性を示すものと言える。
関連記事:
生成AIが共通テスト満点、得点率96.9% ライフプロンプトが検証結果公表

