リコー、マルチモーダルLMMを無償公開 AI評価環境も同時提供

2025年7月31日、リコーはマルチモーダル大規模言語モデル(LMM)の基本モデルと、性能評価環境を無償で公開すると発表した。
リコー、国産マルチモーダルAIモデルと評価環境を無償提供開始
リコーが、マルチモーダル大規模言語モデル(LMM ※)の基本モデルと、それを客観的に検証するための評価環境を無償公開する方針を打ち出した。
このLMMは、経済産業省と産業技術総合開発機構(NEDO)による生成AI開発支援プロジェクト「GENIAC(Generative AI Accelerator Challenge)」の一環で開発された。2025年6月にモデル完成が発表され、今回はその成果を一般に開放する形となる。
同モデルは、テキスト・画像・音声・動画といった複数の情報形式を同時に処理できるマルチモーダルAIであり、図や表を含む資料の要点抽出や、スクリーンショットからの質問応答などに対応する。
性能面では、リコーが独自に開発したベンチマークツールと、日本語の質問応答データセット「JDocQA」を用いて評価を実施。他のモデルと比較しても高い精度を示す結果が得られたという。
またリコーは今後、企業内に蓄積された大量の文書データを対象に、より高度な推論能力(リーズニング)を実現するLMMの研究開発も進めていくとしている。
※マルチモーダル大規模言語モデル(LMM):テキスト、画像、音声、動画など異なる形式の情報を統合的に処理するAIモデル。より複雑で文脈的なタスクに対応できるとされる。
企業導入に弾みも 国産LMM普及への課題と可能性
リコーによるLMMの無償公開は、国内における生成AI基盤の民主化と、多様なユースケースの検証を後押しする動きとして評価できる。特に日本語処理に最適化されたモデルであることから、これまで海外製の英語中心モデルでは対応が難しかった業務文書や専門資料の処理において実用性が高まると見られる。
導入のメリットとしては、生成AI導入の初期コストを大幅に下げられる点が挙げられる。
評価環境まで一体で提供されることで、社内データとの整合性を容易に検証でき、実運用への橋渡しがスムーズになる。また、マルチモーダル対応により、製造業や医療、自治体業務など、画像と文書が混在する現場での活用も期待できる。
一方で課題もある。生成AIを業務に取り入れるには、技術的なノウハウやセキュリティ対応、運用体制の整備が不可欠だ。特に文書の意味を深く理解し、適切な回答を導くためのリーズニング性能については、継続的なモデル改善と実証が求められる。
それでも、国産のマルチモーダルAIが無償で利用可能となった意義は大きいと言える。
今後はオープンな開発姿勢を生かし、業界横断的な知見を集約することで、LMMの高度化と日本企業の生成AI活用の底上げにつながる可能性がある。