2月12日,智谱正式发布新一代大模型 GLM-5。同日,摩尔线程宣布,其旗舰级AI训推一体GPU MTT S5000已基于 SGLang 推理框架,Day-0完成对 GLM-5的全流程适配与验证。

硬件层面,MTT S5000面向大模型训练与推理场景设计,单卡 AI 算力最高可达1000 TFLOPS,配备80GB 显存,显存带宽1.6TB/s,卡间互联带宽784GB/s,完整支持 FP8至 FP64全精度计算。基于 MUSA 全栈平台,该卡原生兼容 PyTorch、Megatron-LM、vLLM、SGLang 等主流框架,支持万卡级训练集群与高并发在线推理部署。

据介绍,依托第四代 MUSA 架构的广泛算子覆盖与生态兼容能力,摩尔线程已打通 GLM-5模型推理全链路,并释放 MTT S5000原生 FP8加速能力。在确保模型精度的同时,显著降低显存占用,实现高性能推理表现。此次同步适配也被视为国产全功能 GPU 对最新大模型实现“即时支持”的重要案例。

摩尔线程表示,从GLM-4.6、GLM-4.7到GLM-5,摩尔线程已将“发布即适配”化为常态,这种对主流软件栈的无缝兼容与敏捷响应,充分证明了国产全功能GPU及MUSA软件栈的成熟度与稳定性,确保开发者能第一时间触达最新模型能力,从而携手共建蓬勃发展的国产AI生态。(袁宁)

38岁张馨予身体异常,警示中年女星健康重于金钱 爱尔眼科董事长陈邦为一疑似“骗保”精神病院实控人 再见了张艺谋,中国电影已经迎来新生代 新春走基层|齐鲁大集藏年俗 人间烟火贺新春 侨乡温州“磁力”升级 外籍青年创客越聚越多 002723,两连涨停!紧急提示! 特朗普称全力支持高市早苗赢得大选 外交部回应