三星申請模型壓縮方法相關專利,解決簡化網絡性能不佳的問題

金融界2025年7月4日消息,國家知識產權局信息顯示,三星(中國)半導體有限公司;三星電子株式會社申請一項名爲“模型壓縮方法、裝置、電子設備、存儲介質、系統和計算機程序產品”的專利,公開號CN120258073A,申請日期爲2025年03月。

專利摘要顯示,本公開涉及一種模型壓縮方法、裝置、電子設備、存儲介質、系統和計算機程序產品,所述方法包括:將訓練數據分別輸入到待壓縮模型和教師模型,得到待壓縮模型的輸出和教師模型的輸出,待壓縮模型和教師模型的網絡結構相同,教師模型是預先訓練得到的,待壓縮模型是隨機初始化得到的;基於待壓縮模型的輸出,通過門控網絡剪枝模塊對待壓縮模型進行剪枝,得到學生模型;將訓練數據輸入到學生模型,得到學生模型的輸出;基於學生模型的輸出和教師模型的輸出,計算蒸餾損失;基於蒸餾損失對待壓縮模型和門控網絡剪枝模塊進行訓練;通過訓練好的門控網絡剪枝模塊對訓練好的待壓縮模型進行剪枝,得到壓縮後的模型。

本文源自:金融界

作者:情報員