GLM-5全球第四、开源第一！摩尔线程MTT S5000 Day-0支持

抖音秀百科资讯 2026-02-12 20:04:27 37

2月12日消息，智谱发布新一代大模型GLM-5之后，摩尔线程基于SGLang推理框架，在旗舰级AI训推一体全功能GPU MTT S5000上，Day-0完成了全流程适配与验证。

事实上，从GLM-4.6、GLM-4.7到GLM-5，摩尔线程已经将“发布即适配”做到了常态。

基于自研MUSA架构广泛的算子覆盖与强大的生态兼容能力，摩尔线程成功打通了GLM-5模型推理全链路，并深度释放MTT S5000的原生FP8加速能力，既能确保模型精度，还显著降低了显存占用，实现了GLM-5的高性能推理。

针对GLM-5的长序列推理场景，MTT S5000凭借充沛的算力储备与高计算密度，结合对稀疏Attention的架构级支持，在大规模上下文处理中依然保持高吞吐与低延迟。

同时，MUSA软件栈的敏捷性是实现Day-0适配的关键。

基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%，使得绝大多数通用算子可直接复用，显著降低移植成本，并能快速跟进前沿模型结构与新特性演进。

GLM-5定位为当下顶尖的Coding编程模型，整体性能较上一代提升20％。

它的核心突破在于Agentic Engineering（代理工程）能力，不仅具备深厚的代码功底，更拥有处理复杂系统工程与长程Agent任务的实力，能够实现从需求到应用的端到端开发。

在全球权威的Artificial Analysis榜单中，GLM-5位居全球第四、开源第一。

GLM-5在编程能力上对齐了Claude Opus 4.5，在业内公认的主流基准测试中取得开源模型SOTA。

在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数，性能超过 Gemini 3 Pro。

在内部Claude Code评估集合中，GLM-5在前端、后端、长程任务等编程开发任务上显著超越上一代的GLM-4.7（平均增幅超过20%），能够以极少的人工干预，自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务，使用体感逼近Opus 4.5。

本文地址： http://www.douyinshow.com/17658.html

文章来源：抖音秀