デジタル庁、法務向けAI能力測定用データセットを公開

2025年10月9日、デジタル庁は企業の法務部門向けにAIの実務適性を測る多肢選択式QAデータセットを試験公開した。行政機関や企業がAI導入の効果を客観的に評価できる環境整備を目指す取り組みである。
法務業務でAIの実力を試すデータセットを提供
デジタル庁が公開した「日本の法令に関する多肢選択式QAデータセット」は、企業法務で実際に起こりうる課題を前提に作成されている。このデータセットは問題文・回答に加え、関連法令の抜粋も含まれており、AIの業務対応力を測る指標として利用できる。
背景には、2024年度に行われた「政府等が保有するデータをAI学習に使いやすくする調査」がある。同調査でAI向けデータは「評価用」「コンテキスト用」「パラメトリック学習用」の3種類に分類可能と判明した。
評価用データはAIの能力を測るテストとして機能し、コンテキスト用データはAIにヒントを与える参考資料、パラメトリック学習用データはAIを鍛えるドリルに相当する。
公開データセットは特に評価用データとして設計され、多肢選択式であることからAIの回答を自動で採点できる点が特徴だ。これにより、知識力や読解力、必要な資料探索能力といった実務能力を段階的に検証することが可能となる。
さらに、今回のデータはパラメトリック学習用としても活用可能で、過去事業では指示学習への応用で性能改善が確認されている。
デジタル庁は今後もデータの有用性を検証しつつ、行政でのAI利活用を支援する方針である。
企業法務でのAI活用促進とリスク管理の両立を展望
このデータセットの公開は、企業法務におけるAI導入のハードルを下げる可能性がある。
導入前に客観的な評価が可能になれば、期待どおりの性能が得られるか判断でき、業務効率化や人的コスト削減に直結するだろう。
一方で、法務分野は解釈の幅や文脈依存が大きいため、AIの回答が必ずしも実務上の正解とは限らない。自動評価では測れないニュアンスやリスクも存在するため、運用にあたっては人間による監督が不可欠となるだろう。
今後は、コンテキスト用データやRAG(※)技術の活用により、AIが外部資料を参照しながら柔軟に対応する能力を伸ばせると考えられる。この手法により、未知の法令や社内規程にも即応できるAIの実装が期待される。
最終的には、評価用データと実務監督を組み合わせることで、AIの効率性を享受しつつ、法務上の誤判断リスクを最小化できる運用モデルが構築される可能性が高い。行政・企業双方の議論を活性化する起点にもなるだろう。
※RAG(Retrieval-Augmented Generation):AIが外部情報を検索し、その結果を踏まえて回答を生成する手法。