マイクロソフトAIが医師超え 診断精度80%、NEJM難症例で実証

2025年6月30日、米Microsoftは医療診断AI「MAI Diagnostic Orchestrator(MAI-DxO)」が、医師を上回る診断精度とコスト効率を達成したと発表した。
評価には世界的医学誌、NEJMの難症例を用いた新指標「SDBench」が採用された。
NEJM難症例でAIが医師を圧倒、精度は4倍差に
Microsoftは、医療診断分野におけるAI性能評価の新基準として「Sequential Diagnosis Benchmark(SDBench)」を導入し、自社開発AI「MAI-DxO」の結果を公表した。SDBenchは、医学誌「New England Journal of Medicine(NEJM)」に掲載された304件の臨床病理カンファレンス(CPC)症例を基に、現実の医療現場を模した逐次的な診断シナリオでAIをテストする仕組みである。
診断者は、限られた初期情報から段階的に追加質問や検査指示を行い、最終診断に至る。
このプロセスは、診断精度だけでなく、検査コスト面も含めて評価される。
その結果、OpenAIの大規模言語モデル「o3」を統合したMAI-DxOは80%という診断正解率を記録した。これは、経験豊富な一般医の平均診断制度20%を大きく上回る数値である。
さらに、コスト面でも優位性が示された。
素のo3モデルでは78.6%の精度を達成するのに平均7850ドルの検査費用がかかったのに対し、MAI-DxOは79.9%の精度で2397ドルに抑えた。
今後の展望の予測
今回の成果は、AIが医師の診断業務を補完し、医療の質とアクセス性を向上させる未来像を現実味のあるものにしたと言える。
低コストで高精度なAI診断は、発展途上国や医療インフラが脆弱な地域にとって極めて有望なソリューションとなり得る。特に、医師不足が深刻な地域や、遠隔地医療、初期トリアージなど、限定的な用途から段階的に実装が進められる可能性は高い。
しかし、課題もある。
臨床現場での実証試験の拡大と、各国規制当局による医療機器としての承認取得が必要不可欠だ。加えて、医療従事者側のAIリテラシー向上や、AIによる誤診時の対応フロー整備といった運用面の課題も浮上すると考えられる。安全性・説明責任・データ倫理といった多層的な議論も避けられないだろう。
今後は、Microsoftのみならず、他のテック企業や医療機関も巻き込んだ形で、AI診断システムの実地検証が加速する見通しである。
最終的には、AIが診断支援だけでなく、予防医療や個別化医療、治療方針決定支援など、より広範な医療プロセスに組み込まれると予想できる。