阿里最強開源模型 上秀
阿里巴巴。路透
阿里巴巴昨(29)日發佈新一代通義千問Qwen3(千問3)系列人工智慧(AI)模型,新版模型參數量僅DeepSeek-R1的三分之一,成本大幅下降。
在LiveCodeBench大語言模型評測榜單中,千問3模型性能全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。
千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,創下所有大陸國產模型及全球開源模型的性能新高。
據中國證券報,千問3是大陸國內首個「混合推理模型」,「快思考」與「慢思考」集成進同一個模型,對簡單需求可低算力「秒回」答案,適用於對速度要求高於深度的簡單問題。而對複雜問題可多步驟「深度思考」,節省算力消耗。
至於性能方面,千問3預訓練數據量達36T ,並在後訓練階段進行多輪強化學習,在推理、指令遵循、工具調用、多語言能力等方面均有增強。
在效能提升的同時,Qwen3部署成本下降,僅需四張H20即可部署Qwen3滿血版,顯示卡記憶體佔用僅爲性能相近模型的三分之一。
阿里通義已開源200餘個模型,全球下載量超三億次,千問衍生模型數超10萬個,衍生模型數量已超越美國Llama,成爲全球第一開源模型。