快訊|赤兔推理引擎官宣適配智譜GLM-4.5模型

7月30日消息,清程極智旗下赤兔推理引擎宣佈首發適配智譜AI最新開源旗艦大模型GLM-4.5,並同步上線支持華爲昇騰910B平臺。這標誌着國產推理引擎、國產算力與國產大模型在部署鏈路上實現重要協同。當前版本已在赤兔GitHub主頁上線,開發者可直接下載部署。

赤兔推理引擎由北京清程極智科技有限公司(以下簡稱“清程極智”)開發,並聯合清華大學團隊發佈開源版本。核心技術在於打破GPU對FP8原生支持的硬件限制。通過底層算子優化(如GeMM、MoE的指令級重構)與編譯器優化,赤兔可在不支持FP8的英偉達GPU及多數國產卡上運行FP8模型,且幾乎無精度損耗。今年3月,赤兔已實現首個國產FP8部署突破。

此次適配的GLM-4.5是智譜專爲智能體構建的多功能基礎模型,具備原生編碼、推理與工具調用能力。模型支持網頁前端編寫、後端數據庫管理及複雜Agent應用開發,並在包括MMLU Pro、GPQA、LiveCodeBench等12項評測中綜合排名全球第三、國產第一、開源模型第一。(袁寧)