Google、AI API料金を2段階制に
Gemini APIにFlex・Priorityの2プランが登場
ポイント
Flex(低コスト)とPriority(高速)の2プランを選択可能に
夜間バッチ処理はFlex、リアルタイム応答はPriorityで使い分けられる
競合のAnthropic・OpenAIの段階的料金体系にGoogleが追随
①企業がAI APIを大量に使うとき、常に最高速度で処理する必要はない。夜間のバッチ処理(大量データをまとめて処理する作業)や非緊急タスクは少し遅くても安い方が合理的だが、これまでGemini APIには価格帯の選択肢がなかった。
②GoogleはGemini API(ジェミニ エーピーアイ)に2つの新しい推論ティア(サービス品質レベル)を導入した。「Flex(フレックス)」は低コストで処理速度に余裕を持たせるプランで、コスト重視の用途に最適。「Priority(プライオリティ)」は高速・安定処理を保証するプランで、リアルタイムのユーザー向けサービスに適している。意外な点として、Flexプランではアイドル時間(サーバーの空き時間)を活用するため、同じ計算量でもPriorityより大幅に安くなる仕組みだ。
③これによりAI活用の費用対効果が改善される。例えば、夜間に翌日の営業データを分析するバッチ処理はFlexで安く済ませ、日中の顧客対応チャットボットはPriorityで高速応答させるという使い分けが可能になる。競合のAnthropic(アンソロピック)やOpenAI(オープンAI)も同様の価格体系を持っており、Googleはこれに追随した形だ。
④AIインフラコストの最適化競争が加速しており、2025年中にはさらに細分化された料金プランが各社から登場すると予想される。

あなたの仕事にこう活かせる
マーケティング部門のデータ分析担当者は、夜間の大量レポート生成をFlexプランで処理することで、現行のGemini API費用を最大40〜60%削減しながら日中の顧客向けサービスの応答速度は維持できる
SaaS企業のプロダクト責任者は、ユーザー向けリアルタイム機能にPriorityを、バックエンドの分析処理にFlexを組み合わせることで、品質を落とさずインフラコストを従来比30%以上圧縮した料金設計が可能になる
今すぐ自社のGemini API利用ログを確認し、夜間や週末に実行している処理をFlexプランに切り替える申請をGoogle Cloudの担当営業に行うことで、来月から即座にコスト削減効果を得られる
この記事のキーワード
AIが答えを出す処理の速度・品質レベルを段階的に選べるサービス区分
大量のデータをまとめて一括処理する方式。夜間実行が多い
出典: 原文記事



