日本電気株式会社は、生成AIを活用した医療データの二次利用に向けた実証を実施したと発表した。
15万人規模の医療合成データを生成し、異なる形式のデータを国際標準に変換することで、研究活用の有効性を検証した。
生成AIで医療データ活用を実証
NECは医療データの二次利用を促進するため、生成AIと医療情報の知見を組み合わせた実証を実施したと2026年3月25日に公表した。
従来、医療データの分析には形式の違いや前処理の負担が障壁となっていたが、本取り組みはその解消に向けた具体的な一歩と位置付けられる。
実証では、AIによる学習と生成AIによる妥当性チェックを組み合わせ、日本人の統計的特徴を再現した15万人規模の医療合成データが短期間で生成された。
さらに、レセプト(診療報酬明細書)やDPC(※1)、FHIR(※2)といった異なる形式のデータを統合し、国際的な共通規格であるOMOP(※3)に変換することで、横断的な分析が可能であることが確認された。
また、終末期医療や救急医療、薬剤使用動向など複数のユースケースに基づき、有識者とともに研究プロセスでの有用性を検証した。
その結果、OMOPへの適合率98%を達成し、各研究で有効な解析環境を構築できたことが確認された。
※1 DPCデータ:急性期病院が提出する入院医療データ。診断名や手術、投薬、在院日数、診療報酬などを含み、医療分析や研究に活用される。
※2 FHIRデータ:医療情報のやり取りに用いる国際標準規格「HL7 FHIR」に基づくデータ。医療システム間の情報連携をしやすくする。
※3 OMOP:形式の異なる医療データを共通の形にそろえて扱う国際的な共通データモデル。研究の効率化や国際共同研究に役立つ。
合成データが拓く医療研究の新基盤
本取り組みの利点は、実データを用いずに研究初期の検証を進められた点だろう。
倫理面や個人情報の制約を回避しながら仮説検証を先行できるため、研究開発のスピード向上に寄与する可能性がある。
さらに、標準化されたデータ設計は国際共同研究への接続を容易にし、データ活用の幅を広げる方向に作用しそうだ。
一方で、合成データは稀少症例や例外的なケースの再現に限界があり、分析の網羅性には課題が残ると見られる。
加えて、元データのバイアスが反映されるリスクや、品質評価基準の未整備も無視できず、過信による判断ミスを招く懸念もある。
慎重な検証体制が不可欠になると考えられる。
今後は、合成データと実データを組み合わせたハイブリッド型の研究基盤が主流になる可能性が高い。
初期段階では合成データで高速に検証し、後工程で実データにより精度を担保する流れが定着しそうだ。
この枠組みが確立すれば、創薬や医療政策の意思決定がより迅速化していく展開も期待できる。
関連記事:
NEC×弘前大、10年先の健康リスクを個別予測 AIが予防医療を再定義

Microsoft、医療AI「Copilot Health」発表 健康データ統合で個人医療の新基盤へ

電通総研とTOPPANなど、延岡市でPHR×都市OS連携 AIが健康行動を個別勧奨
