久久6-波多野结衣av在线观看-a级在线观看-亚洲精品国产精品乱码不卡√香蕉-91免费小视频-久久网av-人妖粗暴刺激videos呻吟-久久中文字幕av-91人人干-日韩美女啪啪-欧美xxxx18国产-三级欧美韩日大片在线看-久久系列-日本成人片网站-五月婷激情-精品久久久久久亚洲-激情久久网站-光棍福利视频-国产又色又爽又黄-欧美极品视频在线观看

你的位置:首頁 > EMC安規 > 正文

Day-0支持|摩爾線程率先完成智譜GLM-5.2極速適配

發布時間:2026-06-17 來源:轉載 責任編輯:lily

【導讀】6月17日,摩爾線程宣布在AI訓推一體全功能GPU智算卡MTT S5000上,完成對智譜新一代開源旗艦模型GLM-5.2的Day-0極速適配。此次適配延續了摩爾線程在GLM-5.1長上下文Prefill與P/D異構分離推理場景中的優化積累,并面向GLM-5.2超長上下文與復雜推理負載,進一步釋放MTT S5000在長輸入Prefill階段的高吞吐優勢。


摩爾線程技術團隊基于高性能SGLang-MUSA推理引擎及TileLang-MUSA算子編程語言,快速完成模型結構適配、關鍵算子優化、框架拉起與部署驗證,在MTT S5000上實現GLM-5.2的高效、高精度推理。這一成果彰顯了國產全功能GPU算力基礎設施對前沿SOTA模型的快速響應能力,也為軟硬協同應對復雜AI推理場景提供了可復制的工程實踐。


1781674314952639.jpg


作為智譜迄今能力最強的開源模型,GLM-5.2專為長程任務(Long Horizon Task)能力而生。它支持真正可用的1M Solid超長上下文,可穩定支撐長達 8 小時的超長生命周期任務。在全球百萬用戶參與盲測的前端開發評估系統Code Arena上,GLM-5.2取得全球可用模型第一的表現;相比前代GLM-5.1,新模型在前端、后端及長程開發場景下的成功率均有長足提升,能夠提供更實用、更具確定性的Coding能力,讓復雜系統工程與深度調試更穩、更強。


1781674268722412.jpg


為充分釋放GLM-5.2的長上下文與復雜推理潛能,MTT S5000從硬件算力、軟件棧到開源框架進行了全鏈路適配與深度優化:


支撐超長上下文:釋放長輸入Prefill階段高吞吐優勢


GLM-5.2的Solid 1M上下文與長程任務能力,使長Prompt編碼、上下文讀入與KV Cache生成成為推理鏈路中的關鍵環節。長輸入請求在進入生成階段前,需要先完成大規模Prefill計算;這一階段高度依賴并行矩陣計算、Attention算子效率、顯存容量與訪存帶寬。MTT S5000憑借硬件級原生FP8加速,單卡稠密算力高達1000 TFLOPS,配備80GB大容量顯存與1.6TB/s超高帶寬,可在長輸入Prefill階段集中釋放高吞吐優勢,為百萬token級上下文處理提供充足緩存空間和穩定數據吞吐。依托MUSA C++、Triton-MUSA與TileLang-MUSA等工具鏈,GLM-5.2相關算子結構可快速遷移并針對長序列場景持續優化,幫助降低長上下文請求的首Token等待時間(TTFT),提升AI Coding、RAG和長文檔分析等場景的在線推理效率。


賦能前沿Coding與Agent能力:以算子與調度優化提升推理效率


面向GLM-5.2重點強化的編程、智能體和長程任務場景,摩爾線程基于GLM家族多代模型的適配與優化經驗,將模型結構適配、算子優化、框架拉起和部署驗證能力快速遷移至GLM-5.2。通過原生算子定制、TileLang-MUSA編程優化和SGLang-MUSA推理框架協同,MTT S5000能夠在保障模型精度的前提下提升推理吞吐、降低響應延遲,為客戶提供面向AI Coding、Agent工作流和長文檔分析的高效推理服務。從GLM-4.7、GLM-5、GLM-5.1到GLM-5.2,摩爾線程已連續實現對智譜GLM家族前沿大模型的發布當日即時適配,沉淀出高效、可復用的工程底座。面向以GLM-5.2為代表的新一代長程任務模型,摩爾線程不僅提供基礎適配,更通過Prefill優化與P/D異構分離方案,提供從單卡性能、多卡擴展、KV Cache傳輸到集群TCO(總體擁有成本)優化的端到端支撐。


未來,摩爾線程將依托MUSA軟件棧強大的生態兼容性,持續第一時間適配前沿模型能力,以高性能、可規模化的國產全功能GPU基礎設施,加速大模型應用創新落地。



gg_20260512171736_266.png

特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索

關閉

?

關閉