摩尔线程开源代码大模型MusaCoder：基于国产GPU全栈训练，性能超越Claude Opus 4.7

6月10日消息，近日，摩尔线程正式发布并开源面向GPU底层算子生成的专用代码大模型MusaCoder。据介绍，这是业内首个基于国产全功能GPU完成全链路训练与验证的开源代码大模型，其监督微调（SFT）、强化学习（RL）、执行验证等完整后训练流程，均在基于MTT S5000构建的夸娥智算集群上完成。

据介绍，MusaCoder专为GPU原生Kernel生成任务设计，支持从PyTorch标准算子自动生成高性能CUDA/MUSA Kernel代码，旨在降低底层GPU算子开发门槛，提升高性能计算场景下的代码生成与优化效率。

图注：KernelBench准确率（Avg.@8）对比

在国际通用代码模型评测基准KernelBench中，MusaCoder-27B-RL取得Overall Pass@8 93.2%、Avg.@8 88.60%的成绩，超过Claude Opus 4.7、GLM-5.1、DeepSeek-V4 Pro、Kimi K2.6等主流代码模型。其中，在更具挑战性的Level 3任务中，MusaCoder-27B-RL的Pass@8和Avg.@8分别领先Claude Opus 4.7达18个百分点和26.5个百分点。

图注：MusaCoder训练总流程

除了代码正确率提升外，MusaCoder在真实性能优化能力上也表现突出。在MooreEval执行式验证标准下，模型生成的Kernel实现相较PyTorch Eager和torch.compile分别实现15.0%和9.2%的有效加速，高于Claude Opus 4.7对应的11.8%和7.5%。

摩尔线程表示，MusaCoder的开源不仅验证了国产GPU支撑复杂代码大模型后训练的能力，也为AI Coding、AI Infra以及异构计算编程研究提供了自主可控的基础模型平台。未来，公司将进一步提升模型在复杂GPU Kernel生成与自动修复场景下的能力，并探索与IDE、自动调试和性能分析工具链的深度融合，推动国产GPU生态和AI基础设施建设。（袁宁）