GLM-5全球第四、开源第一!摩尔线程MTT S5000 Day-0支持

抖音秀 百科资讯 2

2月12日消息,智谱发布新一代大模型GLM-5之后,摩尔线程基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,Day-0完成了全流程适配与验证。

事实上,从GLM-4.6、GLM-4.7到GLM-5,摩尔线程已经将“发布即适配”做到了常态。

基于自研MUSA架构广泛的算子覆盖与强大的生态兼容能力,摩尔线程成功打通了GLM-5模型推理全链路,并深度释放MTT S5000的原生FP8加速能力,既能确保模型精度,还显著降低了显存占用,实现了GLM-5的高性能推理。

针对GLM-5的长序列推理场景,MTT S5000凭借充沛的算力储备与高计算密度,结合对稀疏Attention的架构级支持,在大规模上下文处理中依然保持高吞吐与低延迟。

同时,MUSA软件栈的敏捷性是实现Day-0适配的关键。

基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%,使得绝大多数通用算子可直接复用,显著降低移植成本,并能快速跟进前沿模型结构与新特性演进。

GLM-5定位为当下顶尖的Coding编程模型,整体性能较上一代提升20%。

它的核心突破在于Agentic Engineering(代理工程)能力,不仅具备深厚的代码功底,更拥有处理复杂系统工程与长程Agent任务的实力,能够实现从需求到应用的端到端开发。

在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一。

GLM-5在编程能力上对齐了Claude Opus 4.5,在业内公认的主流基准测试中取得开源模型SOTA。

在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数,性能超过 Gemini 3 Pro。

在内部Claude Code评估集合中,GLM-5在前端、后端、长程任务等编程开发任务上显著超越上一代的GLM-4.7(平均增幅超过20%),能够以极少的人工干预,自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近Opus 4.5。