AI inside、日本語帳票データ特化LLM「PolySphere-3」を公開 帳票読取精度95%超で業務自動化を加速

2025年6月4日、AI insideは日本語の帳票データ処理に特化した大規模言語モデル「PolySphere-3」の最新版を発表した。
非定型帳票の読み取りにおいて平均95.1%という高精度を実現しており、国内業務の自動化推進に寄与する可能性がある。
非定型帳票も高精度処理 独自LLMが実装されたDX Suite
AI insideが発表した「PolySphere-3」は、日本語ドキュメント処理に最適化された同社独自の大規模言語モデル(LLM)である。
開発は、経済産業省およびNEDO(新エネルギー・産業技術総合開発機構)の「GENIAC(※1)」プロジェクトの一環として実施され、「非定型帳票の革新と自律促進」を目的とした研究成果に基づいている。
同社の内部評価によると、50種類の非定型帳票に対する読み取り精度は平均95.1%に達し、従来の汎用LLMと比較して大幅な向上が確認されたという。
PolySphere-3は、モデル自身が帳票データを継続的に学習・最適化する「自律蒸留」技術を搭載している。
このモデルは、データ入力業務自動化AIエージェント「DX Suite」にすでに実装されており、ユーザーは追加の契約や費用を必要とせず、非定型帳票の読み取り精度を即時に向上させることができる。
DX Suiteの中でも処理件数が多い帳票群において、読み取り精度が95%を上回ったことは、企業の業務効率化に直結する成果といえる。
自律学習で進化するLLM、軽量版の選択も可能
PolySphere-3の導入により、帳票処理の現場ではさらなる自動化が期待できる。
特に、複雑かつ非定型な帳票への対応力が高まったことで、これまで人手に頼らざるを得なかった作業領域にもAIが浸透していく可能性は可能性は高いだろう高いだろう。
企業は、人件費削減だけでなく、処理ミスの低減や作業スピードの向上といったメリットも享受できると思われる。
一方、AI insideは処理速度を重視するユーザー向けに「PolySphere-3 Lite」も用意しており、用途に応じたモデルの使い分けが可能となっている。
特定業務においては、軽量版でも十分な精度を確保できるため、システム全体の最適化も期待できる。
とはいえ、今後の本格的な社会実装に向けては、モデルの信頼性確保や読み取り対象となる帳票の多様性への対応が課題となるだろう。
今後は、医療・金融・物流など業種別の最適化モデルの開発が進められる可能性が高く、日本語に特化したAI開発の潮流として注目できる展開となりそうだ。
※GENIAC:経済産業省とNEDOが推進する生成AI活用の国家プロジェクト。