騰訊推出新一代快思考模型混元 Turbo S
2月27日,騰訊混元自研的快思考模型Turbo S正式發佈。區別於Deepseek R1、混元T1等需要“想一下再回復”的慢思考模型,混元Turbo S能夠實現“秒回”,吐字速度提升一倍,首字時延降低44%,同時在知識、數理、創作等方面也有突出表現。通過模型架構創新,Turbo S 部署成本也大幅下降,持續推動大模型應用門檻降低。
據介紹,通過長短思維鏈融合,騰訊混元Turbo S 在保持文科類問題快思考體驗的同時,基於自研混元 T1 慢思考模型合成的長思維鏈數據,顯著改進了理科推理能力,實現模型整體效果提升。
架構方面,通過創新性地採用了Hybrid-Mamba-Transformer 融合模式,混元Turbo S有效降低了傳統Transformer結構的計算複雜度,減少了KV-Cache緩存佔用,實現訓練和推理成本的下降。
作爲旗艦模型,Turbo S未來將成爲騰訊混元系列衍生模型的核心基座,爲推理、長文、代碼等衍生模型提供基礎能力。基於Turbo S,通過引入長思維鏈、檢索增強和強化學習等技術,騰訊自研了推理模型 T1,該模型已在騰訊元寶上線,用戶可以選擇Deepseek R1 或騰訊混元T1模型進行回答。騰訊混元表示,正式版的騰訊混元T1模型API也將很快上線,對外提供接入服務。
定價上,Turbo S 輸入價格爲0.8元/百萬tokens,輸出價格爲2元/百萬tokens,相比前代混元Turbo模型價格下降數倍。