☰

蘋果MTP技術：大語言模型響應速度最高提升5倍

據報道，蘋果提出“多token預測”（MTP）技術，在不犧牲輸出質量的情況下，可將大語言模型響應速度提升2至3倍，特定場景下最高可達5倍。傳統大語言模型逐個輸出token，速度受限。蘋果研究發現模型內部蘊含對後續多個詞的潛在判斷能力，據此提出MTP框架，支持模型一次生成多個詞。該技術通過“掩碼”token作爲佔位符，並行推測後續多個詞，並在推測結果與標準自迴歸解碼結果不符時自動回退，確保輸出質量。實驗基於開源模型Tulu3 - 8B進行，訓練其最多推測8個後續token，在問答和對話等通用任務中，響應速度平均提升2至3倍；在代碼生成、數學推理等結構化場景中，提速可達5倍。

相關資訊

▣ 蘋果MM1.5多模態AI大模型：技術升級引領行業創新
▣ 百度申請基於生成式大語言模型的提問處理方法相關專利，涉及大語言模型等技術領域
▣ 中電萬維申請基於語義檢索模型和文本生成語言模型的客服處理專利，提升用戶客服問答好感和響應速度
▣ 李彥宏：文心3.5大模型訓練速度提升2倍
▣ 蘋果AI研發爆新料大型語言模型不用上雲端
▣ 成本最高降90% 百度發佈端到端語音語言大模型
蘋果推出換代AI大模型MM1.5 擁有自然語言推理
▣ 航天信息申請大語言模型的參數動態設置方法及系統專利，極大地提升了業務處理的靈活性和響應速度
▣ 蘋果推出開放語言模型 OpenELM；微軟、清華團隊提出多頭混合專家 MH-MoE｜大模型論文
▣ 摩根大通推測蘋果AI發展策略：立足本地小模型管理大語言模型
▣ 阿里健康科技申請大語言模型的訓練方法及相關裝置專利，一定程度上提升大語言模型的翻譯文本的準確性
▣ 國泰海通證券：擴散大語言模型開啓並行新範式提升生成速度與質量
▣ 擴散語言模型九倍推理加速！KV Cache並非自迴歸模型專屬
▣ 科技早報｜盒馬否認被侯毅張勇出價競購；蘋果正自研設備端大型語言模型
▣ 斯坦福聯合英偉達提出擴散語言模型，將困惑度提升自迴歸模型水平
螞蟻推AI技術大模型訓練提高33%GPU顯存推理提速2倍
▣ 榮耀申請大語言模型評測方法相關專利，有效提高大語言模型評測的效率
▣ 蘋果合作百度大模型遭遇障礙？百度暫無迴應
▣ 騰訊公佈大語言模型訓練專利可提高模型準確性
▣ 百度推出端到端語音語言大模型
▣ AI早知道｜支付寶灰度測試智能助理；蘋果開源推出高效語言模型系列 OpenELM
▣ 蘋果合作百度大模型時遭遇障礙？百度未做迴應
▣ 奇富科技智能語音模型升級，川渝方言識別準確率提升超35%
▣ 光音科技申請基於大模型的自然語言規則表格信息提取系統專利大幅度提升了效率
▣ 北京大學申請中文醫學大語言模型訓練方法及裝置專利，提高大語言模型在醫學領域回答的準確度
▣ AIGC應用加速，三個平臺看大語言模型在電商領域的應用
▣ 天津大學“伏羲傳語”多語言大模型正式發佈並開源，應對大模型多語言能力不足
▣ 中電信數智科技申請基於端到端跨語言大模型語音識別方法專利，提升語音識別準確度及魯棒性
▣ 可靈1.6模型上線文本響應度、運動合理性等提升

DMCA | PRIVACY | s@bg3.co