Google CEO、Gemini 2.5 FlashでAIコストを最大$1 billion削減可能と発言

Googleの最高経営責任者サンダー・ピチャイ氏は、Google Cloudの主要顧客が1日当たり約1兆トークンを処理しており、競合する最先端AIモデルからワークロードを移行することで支出を大幅に削減できると述べた。

要約

Googleの最高経営責任者サンダー・ピチャイ氏は、Google Cloudを利用する企業が1日当たり約1兆トークンを処理しており、他の最先端モデルからワークロードの80%をGemini 2.5 Flashに移行すれば、年間で最大$1 billionを節約できる可能性があると述べた。この発言は、Gemini 2.5 Flashを大規模な推論ワークロード向けの低コストな人工知能モデルと位置付けるものであり、価格効率が企業導入に大きな影響を及ぼし得ることを示している。

用語解説
  • トークン: 人工知能モデルが処理するテキストの単位であり、一般に利用量と価格設定の測定に用いられる。
  • 最先端モデル: 能力と性能の最前線にある、高度で大規模な人工知能モデル。
  • 推論: 人工知能モデルを実行し、ユーザー入力から出力を生成するプロセス。