阿里雲申請模型壓縮方法等專利,解決圖形處理器權重量化效率低的問題
金融界2025年7月14日消息,國家知識產權局信息顯示,杭州阿里雲飛天信息技術有限公司申請一項名爲“模型壓縮方法、模型部署方法、電子設備及存儲介質”的專利,公開號CN120298194A,申請日期爲2024年01月。
專利摘要顯示,本申請公開了一種模型壓縮方法、模型部署方法、電子設備及存儲介質,涉及大模型技術、雲計算領域。其中,該方法包括:獲取初始模型,其中,初始模型是預先訓練得到的機器學習模型,初始模型包含多個模型層;基於圖形處理器的顯存容量對多個模型層進行分組,得到至少一個層分組;通過圖形處理器依次對至少一個層分組包含的模型層的權重參數進行量化,得到目標模型。
天眼查資料顯示,杭州阿里雲飛天信息技術有限公司,成立於2019年,位於杭州市,是一家以從事互聯網和相關服務爲主的企業。企業註冊資本102.9788萬人民幣。通過天眼查大數據分析,杭州阿里雲飛天信息技術有限公司參與招投標項目8次,財產線索方面有商標信息1066條,專利信息567條,此外企業還擁有行政許可3個。
本文源自:金融界
作者:情報員