メインコンテンツへスキップ
最新ニュース 4分で読める

富士通、新アーキテクチャ「PHOTON」を開発 生成AIのGPUコスト削減へ最大475倍のマルチクエリー性能

PlusWeb3 編集部
PlusWeb3 編集部 Web3・AI専門メディア

富士通は、大規模言語モデルの推論コスト削減を目的とした新アーキテクチャ「PHOTON」を開発したと発表した。
主流の基盤アーキテクチャであるTransformerに比べ、最大475倍のマルチクエリー性能を実現し、生成AIのGPUコスト構造を変える技術として説明されている。

PHOTONが最大475倍のマルチクエリー性能を実現

富士通は2026年6月24日、大規模言語モデル向けの新アーキテクチャ「Parallel Hierarchical Operation for TOp-down Networks(PHOTON)」を開発したと発表した。
PHOTONは、現在の大規模言語モデルで主流となっているTransformer(※)と比較し、最大475倍のマルチクエリー性能を発揮するという。

開発の背景には、生成AIの推論時に長い文脈や複数の問い合わせを処理する需要が高まっていることがある。
Transformerでは、入力が長くなったり同時処理する問い合わせが増えたりすると、過去の情報を保持するためのメモリアクセスが増え、処理速度が低下しやすいという問題があった。
特に長文処理や多数ユーザーによる同時利用では、この課題が顕著になっていた。

こうした問題に対しPHOTONは、文章をトークン単位ではなく意味のまとまりとして捉え、階層的に処理することで計算量を削減するというアプローチを取る。
さらに複数の文章を同時に処理することで、GPUあたりの計算効率を高める仕組みだ。

結果として、富士通による数値実験では、600M、900M、1.2Bパラメータの各モデルサイズで、Transformerよりメモリ使用量を抑えながら高い生成スループットを確認した。
特に1.2Bパラメータモデルでは、わずかな性能劣化と引き換えに約475倍のマルチクエリー計算能力を実現したとのことだ。
また、9クエリーを統合することで、従来のTransformerと同水準の性能を達成している。

※Transformer:現在の大規模言語モデルで広く使われる基盤技術。文章をトークン単位で処理し高い性能を発揮する一方、長文処理や大量同時推論ではメモリ使用量やGPU負荷が増えやすい。

AI運用コスト低下への期待と課題

PHOTONの意義は、生成AIの性能向上だけでなく、運用コストの抑制につながる点にある。
現在の生成AIサービスでは、高性能GPUの確保や電力消費が大きな負担となっている。
同じGPUメモリ予算内で複数の生成結果を並列に得られるのであれば、企業はより少ない計算資源で高い処理能力を確保しやすくなる。

特に、複数のAIが連携して作業するマルチエージェント型の利用では、同時に多数の入出力を処理することは不可欠だ。
PHOTONのようにマルチクエリー処理を効率化する技術は、業務支援AIや大規模なAIサービスの実装において、コスト面の制約を緩和する可能性がある。

一方で、今回示された成果は数値実験に基づくものであり、商用サービスや大規模モデルで同様の効果を安定して得られるかは今後の検証が必要だ。
性能劣化をどこまで許容できるか、既存のTransformerベースの開発環境とどのように接続するかも実用化の論点になる。

生成AIの需要が拡大するほど、GPUコストと消費電力は企業の導入判断を左右する。
PHOTONが実用段階で十分な品質と効率を示せれば、生成AIは単に高性能化するだけでなく、より持続可能な計算基盤へ移行する可能性がある。

富士通株式会社 技術トピックス

関連記事:

富士通がAI時代の企業変革指針を公表 Dynamic transformationを軸に継続的な変革モデルを提示

RELATED ARTICLE富士通がAI時代の企業変革指針を公表 Dynamic transformationを軸に継続的な変革モデルを提示国内IT大手の富士通が「Fujitsu Technology and Servi…Read
Share this article コピーしました
WRITTEN BY

PlusWeb3 編集部

Web3・AI専門メディア

PlusWeb3 編集部は、ブロックチェーン・Web3・AIの最新動向をわかりやすくお届けする専門メディアチームです。業界経験豊富な編集者とリサーチャーが、信頼性の高い情報を厳選してお届けします。

コピーしました

Web3・AI・ディープテック領域のキャリアに興味がありますか?

業界特化メディアを運営する専門エージェントが、企業のカルチャー・技術スタック・選考ポイントまで踏まえてキャリアをご提案します。相談は完全無料です。