谷歌首席执行官桑达尔·皮查伊表示,谷歌云头部客户每天处理约1万亿个token,若将工作负载从其他前沿AI模型迁移,支出可显著下降。
34d ago
谷歌首席执行官桑达尔·皮查伊表示,使用谷歌云的企业每天处理约1万亿个token,若将80%的工作负载从其他前沿模型迁移至Gemini 2.5 Flash,每年最多可节省$1 billion。该表述将Gemini 2.5 Flash定位为一款面向大规模推理工作负载的低成本人工智能模型,在这一场景中,定价效率会对企业采用产生重大影响。