リコー、GPT-4oに匹敵する日本語性能を持つLLMを開発

2025年4月3日、リコーは米OpenAIのGPT-4oと同等の日本語性能を持つ大規模言語モデル(LLM)を開発したと発表した。
このモデルは企業向けのプライベートLLMとして導入される予定である。
リコーの新LLMの特徴と性能評価
リコーが開発した新しいLLMは、700億パラメータを有し、高度な日本語処理能力を備えている。このモデルの開発には「モデルマージ」という手法が採用され、複数の学習済みAIモデルを組み合わせることで性能向上が図られた。
具体的には、東京工業大学が開発した日本語LLM「Llama-3.3-Swallow-70B-v0.4」をベースモデルとしており、Meta社のInstructモデルから抽出した「Chat Vector」とリコー独自のChat Vectorをマージすることで、高性能なモデルが実現された。
性能評価においては、日本語の複雑な指示やタスクを含むベンチマーク「ELYZA-tasks-100」や、日本語の対話能力を評価する「Japanese MT-Bench」が使用された。
これらの評価で、リコーのLLMはGPT-4oと同等のスコアを示し、高い日本語処理能力が確認された。
リコーの新LLMは、高性能でありながら省コスト・省リソースを実現している点が特徴である。
企業はオンプレミス環境でこのモデルを運用し、自社のデータを追加学習させることで、特定の業務ニーズに応じたカスタマイズが可能となる。これにより、企業独自のプライベートLLMとして活用できる。
リコーは「高性能でありながら、省コスト・省リソースを実現し、オンプレミス環境でお客様情報の追加学習が可能なプライベートLLMとして、企業内での導入を支援する」としている。
今後の展望
リコーが開発したGPT-4oと同等の日本語大規模言語モデル(LLM)は、企業のデジタルトランスフォーメーション(DX)を加速させる可能性を秘めている。
特に、オンプレミス環境での運用が可能なプライベートLLMとして提供されることで、企業は自社データを活用したカスタマイズが容易となり、業務効率の向上や新たなビジネスモデルの創出が期待される。
今後、業種や業務内容に特化したLLMの開発が進むことで、各企業のニーズにより適したソリューションが提供されるだろう。
ただし、これらの展開にはデータセキュリティやプライバシー保護、AIの倫理的な運用などの課題も伴う。
企業は、LLMの導入に際してこれらのリスクを適切に管理し、信頼性の高いシステムを構築する必要があるだろう。