2026年5月27日、Finatextとナウキャストは、メディケア生命において生成AIを活用した給付金支払査定の実証実験結果を発表した。高難度案件でも正答率90%以上を記録し、査定業務の変革が現実段階に入った。
高難度査定でAI正答率90%超
Finatextとナウキャストは、メディケア生命と共同で、生成AIを活用した給付金支払査定業務の実証実験(PoC)を実施した。期間は2025年9月から2026年2月にかけてで、査定の一連のプロセスをAIに担わせる形で検証が行われた。
Phase2では、実務で頻出する高難度案件を対象に、請求書類の読み取りから支払可否判断、給付金額の算出までを一貫してAIが処理した。その結果、査定正答率は90%以上に達し、同一条件下での繰り返し検証でも出力のばらつきは抑制された。
技術面では、Agentic RAG(※)を用いてAIが約款やマニュアルを自律的に探索・参照する仕組みを構築。加えて、過去の査定事例を要約・蓄積する長期記憶を活用し、類似ケースの判断精度を高めた。さらに、診断書や領収書など多様な形式の書類に対しては、マルチモーダルモデルを最適化して適用している。
書類読み取りではAI-OCRにより約90%の精度を達成し、特に通常の文字や数字に関しては手書きを含めて高い認識精度を示した。これにより、入力作業工数は約3分の1、査定工数は約40%削減できる可能性が示され、業務効率の大幅な改善余地が明らかとなった。
※Agentic RAG:AIが必要な情報を自律的に探索・取得しながら回答を生成する仕組み。複数の文書やデータベースを横断的に参照し、従来のRAGよりも高度な判断支援を可能にする技術。
効率化の利点と統制リスクの行方
今回の結果は、保険査定という高度な専門業務においてもAI活用が現実的な段階に入りつつあることを示唆している。特に、査定根拠や参照条項を提示できる点は、判断の透明性向上と人材育成の効率化に寄与する可能性がある。経験の浅い担当者でも一定水準の判断が可能となり、属人化の解消につながると考えられる。
一方で、精度90%という水準は実用域に近いものの、残る誤判定の扱いが課題となる。査定は顧客への支払いに直結するため、AIの判断をそのまま適用することには慎重さが求められる。最終判断を人が担う体制や、説明責任を担保する仕組みの設計が重要となる。
また、AIが参照する約款や過去事例の更新・管理が不十分であれば、判断の偏りや誤学習を招くリスクもある。今後は対象業務の拡大とともに、精度向上とガバナンスの両立が焦点になるだろう。生成AIは単なる効率化ツールにとどまらず、意思決定基盤として再設計に向かう流れが強まりつつあると言える。
関連記事: