華爲正式發佈AI推理創新技術UCM 計劃於9月正式開源

【華爲正式發佈AI推理創新技術UCM 計劃於9月正式開源】財聯社8月12日電,華爲8月12日正式發佈AI推理創新技術UCM(推理記憶數據管理器)。據瞭解,作爲一款以KV Cache爲中心的推理加速套件,UCM融合了多類型緩存加速算法工具,分級管理推理過程中產生的KV Cache記憶數據,可擴大推理上下文窗口,實現高吞吐、低時延的推理體驗,降低每Token推理成本。華爲計劃於2025年9月正式開源UCM,屆時將在魔擎社區首發,後續逐步貢獻給業界主流推理引擎社區,並共享給業內所有Share Everything(共享架構)存儲廠商和生態夥伴。(證券時報)