DeepSeekの検閲を修正したモデルをオープンソースで公表 Perplexity社が開発

人工知能の発展において、中国発のAIモデルが抱える検閲の壁を、技術革新で突破する試みが始まっている。
米Perplexity社は2月19日、中国DeepSeek社の高性能言語モデル「DeepSeek-R1」の検閲機能を解除した改良版「R1 1776」を発表した。このモデルは、政治的にセンシティブな話題に対しても事実に基づいた回答が可能で、さらにオープンソースとして公開されている。DeepSeekへの警戒感が強まる中、このモデルは低コストかつ高性能なモデルとして、新たな選択肢となる可能性がある。
検閲回避を実現した技術
R1 1776の開発において、Perplexity社は検閲を避けるため、慎重なアプローチを取った。まず、専門家の意見を参考に、当局による検閲対象となっている約300のトピックを特定。これらのトピックに対する事実に基づいた回答データを収集し、多言語での検閲判定システムを構築した。この過程で、40,000件の多言語プロンプトからなる学習データセットを作成している。
技術的な実装においては、NVIDIAのNeMo 2.0フレームワークを採用し、効率的な追加学習を実現した。DeepSeek-R1の基本的な性能を損なうことなく、検閲回避機能を実装できたという。ベンチマークテストの結果では、数学的推論能力や一般的な問題解決能力において、元のモデルと同等の高いパフォーマンスを維持している。
これからの応用可能性
R1 1776は、その応答できるトピックの幅広さで、オリジナルを上回る。
たとえば、台湾独立がNVIDIAの株価に与える影響といった、従来のDeepSeek-R1では回答を拒否していた質問に対しても、詳細な分析と論理的な推論を提供できるという。また、天安門事件や新疆ウイグル自治区の状況など、政治的にセンシティブな話題についても、事実に基づいた客観的な情報を提供することが可能となった。
このモデルは、Hugging Faceリポジトリを通じてモデルウェイトが公開されており、さらにSonar APIを通じた利用も可能である。これにより、開発者やビジネス利用者は、必要に応じて柔軟にモデルを活用できる環境が整備されている。
まとめ
R1 1776の登場は、AIモデルの検閲問題に対する技術的な解決策を示すものである。この革新により、高性能かつ安価な中国発のAIモデルを、より幅広い用途で活用できる可能性が開かれた。今後は、同様の手法を用いた検閲回避モデルの開発が活発化することが予想され、AIの実用化における新たな展開が期待される。
モデルのデータには以下のリンクからアクセスできる。
https://huggingface.co/perplexity-ai/r1-1776
Plus Web3は「Web3領域に特化したキャリア支援サービス」

Plus Web3では、Web3で働きたい人材と、個人に合わせた優良企業をマッチングする求人サービスを行っています。
- Web3で働くことも考えている…
- Web3のインターン先はどこがいいか分からない…
- どんな知識やスキルがあれば良いのか分からない…
このような悩みを抱える人は、一度「無料キャリア相談」にお越しください。あなたにマッチした優良企業をご紹介いたします。