不只秒回答案…登頂全球最強開源模型 阿里「千問3」有多強?
阿里巴巴29日凌晨發佈最新開源模型Qwen3(通義千問3)。(路透)
阿里巴巴29日凌晨公佈開源新一代通義千問模型Qwen3(簡稱千問3),在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,登頂全球最強開源模型。多家大型企業也迅速進行適配和調用。
據悉,千問3是大陸首個「混合推理模型」,參數量僅爲DeepSeek-R1的3分之1,成本大幅下降,性能全面超越R1、OpenAI-o1等全球頂尖模型,對簡單需求可低算力「秒回」答案,對複雜問題可多步驟「深度思考」,大大節省算力消耗。
千問3在推理、指令遵循、工具調用、多語言能力等方面均大幅增強,創下所有國產模型及全球開源模型的性能新高。
同時,千問3的部署成本也大幅下降,顯存佔用僅爲性能相近模型的三分之一。
據瞭解,千問3系列模型採用寬鬆的Apache2.0協定開源,並首次支援119多種語言,全球開發者、研究機構和企業均可免費在魔搭社區、HuggingFace等平臺下載模型並商用,個人用戶可通過通義APP直接體驗千問3。
據悉,阿里通義已開源200餘個模型,全球下載量超3億次,千問衍生模型數超10萬個,已超越美國Llama,成爲全球第一開源模型。
人民網報導,阿里巴巴千問3開源後,上下游供應鏈連夜進行適配和調用,1包括輝達、Intel、聯發科、AMD等多家大型晶片廠商已成功適配千問3,在不同硬體平臺和軟體棧上的推理效率均顯著提升,可滿足移動終端和資料中心場景的AI推理需求。