2025年11月6日,Moonshot AI发布了新一代Kimi-K2-Thinking思考模型,原生支持MOE W4A16+Attention BF16混合精度模式。CANN已0day适配支持MOE W4A16量化,并提供了A3集群的推荐部署策略,并面向开发者开源所有推理代码和算子实现。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐