DeepSeek提议更新DeepGEMM,新增Mega MoE和FP4 Indexer

名为“Public release 26/04”的合并请求支持EP≤8的FP8 x FP4 MoE(专家混合模型路由),并要求PyTorch 2.9或更高版本。

摘要

正在验证可靠性

术语与概念

此主题没有可用的专业术语。