Google、最速・最安モデル「Gemini 2.5 Flash-Lite」正式リリース

現地時間2025年7月22日、米Googleは生成AI「Gemini 2.5」シリーズの軽量高速モデル「Gemini 2.5 Flash-Lite」が安定版に到達し、一般提供を開始したと発表した。
従来のプレビュー版よりコストを大幅に削減しつつ、パフォーマンス面でも前世代を凌駕する仕様が特徴となっている。
スピードとコスト重視の最軽量モデルが正式版に
「Gemini 2.5 Flash-Lite」は、「Gemini 2.5」シリーズの中でも特に応答速度と低コストを重視したモデルである。
今年6月からプレビュー版として提供されていたが、今回の発表により安定版としての一般提供が開始された。
価格設定は、入力1Mあたり0.10米ドル、出力1Mあたり0.40米ドルと、上位モデル「2.5 Flash」と比較して入力は3分の1、出力は6分の1のコストで運用できる。
さらに音声入力の価格もプレビュー時より40%引き下げられており、ユーザーにとっては大幅なコスト削減が期待できる。
性能面でも「2.0 Flash-Lite」から大幅に進化しており、コーディング、数学、科学など、主要なベンチマークにおいて優れた成果を示している。
また、テキストや画像など、種類の異なる情報を組み合わせて処理する、マルチモーダル理解も向上しているという。
さらに、コンテキストウィンドウも100万トークンと広大で、複雑なタスクにも対応可能。
Google検索によるグラウンディング、コード実行、URLコンテキストの活用といった、Google独自のネイティブツールも利用できるのが特長だ。
コスト削減と処理速度の両立 普及モデルとして定着か
「Flash-Lite」の正式提供は、生成AIの低価格化と高速化という市場ニーズに対するGoogleの明確な回答といえる。
特に、モバイル端末やエッジデバイスなど、リソース制限のある環境における応用が期待されている。
コストの引き下げと軽量な構成によって、中小企業や個人開発者にも導入しやすくなった。
一方で、処理速度と価格に特化した設計であるがゆえに、複雑な推論や高精度なクリエイティブ生成においては上位モデルとの差別化が続くと見られる。
そのため、「Flash-Lite」は軽量タスクやチャットボット、FAQ自動応答など、限定的な用途での活用が主流になる可能性が高い。
また、既存のプレビュー版を利用しているユーザーには注意点がある。
現在のプレビューエイリアスは2025年8月25日に削除予定であり、今後は明示的に「gemini-2.5-flash-lite」モデルを指定する必要がある。
運用環境の混乱を避けるため、早めの対応が求められるだろう。
Googleは今後も用途別に最適化されたモデル群を展開していくとみられ、企業のAI選定における柔軟性はさらに高まる見通しだ。