6月10日消息,近日,摩尔线程正式发布并开源面向GPU底层算子生成的专用代码大模型MusaCoder。据介绍,这是业内首个基于国产全功能GPU完成全链路训练与验证的开源代码大模型,其监督微调(SFT)、强化学习(RL)、执行验证等完整后训练流程,均在基于MTT S5000构建的夸娥智算集群上完成。

据介绍,MusaCoder专为GPU原生Kernel生成任务设计,支持从PyTorch标准算子自动生成高性能CUDA/MUSA Kernel代码,旨在降低底层GPU算子开发门槛,提升高性能计算场景下的代码生成与优化效率。

图注:KernelBench准确率(Avg.@8)对比

在国际通用代码模型评测基准KernelBench中,MusaCoder-27B-RL取得Overall Pass@8 93.2%、Avg.@8 88.60%的成绩,超过Claude Opus 4.7、GLM-5.1、DeepSeek-V4 Pro、Kimi K2.6等主流代码模型。其中,在更具挑战性的Level 3任务中,MusaCoder-27B-RL的Pass@8和Avg.@8分别领先Claude Opus 4.7达18个百分点和26.5个百分点。

图注:MusaCoder训练总流程

除了代码正确率提升外,MusaCoder在真实性能优化能力上也表现突出。在MooreEval执行式验证标准下,模型生成的Kernel实现相较PyTorch Eager和torch.compile分别实现15.0%和9.2%的有效加速,高于Claude Opus 4.7对应的11.8%和7.5%。

摩尔线程表示,MusaCoder的开源不仅验证了国产GPU支撑复杂代码大模型后训练的能力,也为AI Coding、AI Infra以及异构计算编程研究提供了自主可控的基础模型平台。未来,公司将进一步提升模型在复杂GPU Kernel生成与自动修复场景下的能力,并探索与IDE、自动调试和性能分析工具链的深度融合,推动国产GPU生态和AI基础设施建设。(袁宁)