阿里巴巴漲超7%!李飛飛團隊推出低成本模型s1,基座爲阿里通義千問(Qwen)模型
2月12日早盤,港股三大指數集體高開,恆生指數漲1.09%,報21526.41點,恆生科指漲1.4%,國企指數漲1.16%。開盤後,恆生科技指數漲幅持續擴大,一度漲超2%。主流ETF方面,恆生科技指數ETF(513180)跟隨指數強勢上揚,持倉股中,阿里巴巴、金蝶國際、比亞迪電子、中芯國際等漲幅居前。或受相關利好消息催化,阿里巴巴盤中漲超7%。
據長江證券研報信息,李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元(注:僅爲雲計算服務費用,不包括服務器、顯卡等硬件投入費用,因這部分已經由雲廠商承擔)的雲計算費用訓練了一個名叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSeek的R1等尖端推理模型類似。s1模型的訓練並非從零開始,而是通過監督微調(SFT)技術,以阿里通義千問(Qwen)模型爲基座模型進行微調,蒸餾了谷歌推理模型Gemini 2.0 Flash Thinking Experimental的1000個樣本。
該機構認爲,基於已有的強大基座模型使用大模型蒸餾將大型複雜模型(教師模型)的知識遷移到小型高效模型(學生模型),可以在保持模型性能的同時,顯著降低模型的計算複雜度和存儲需求。這在某種程度上有望成爲AI大模型低成本訓練的方向。
公開信息顯示,恆生科技指數ETF(513180)標的指數深度聚焦AI產業鏈的上中下游,成分股涉及AI、雲服務、大模型、AI端側、AI應用等熱門領域。從底層邏輯來看,當前處於AI技術週期起點,恆生科技成分股佔據較大的先發優勢,或壟斷AI相關領域,長期有望高景氣。