阿里發佈全新推理模型QwQ-32B 消費級顯卡實現滿血版性能
每經杭州3月6日電(記者葉曉丹)3月6日凌晨,阿里巴巴發佈並開源全新的推理模型通義千問QwQ-32B。通過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力上實現了質的飛躍,整體性能比肩DeepSeek-R1。在保持強勁性能的同時,千問QwQ-32B還大幅降低了部署使用成本,在消費級顯卡上也能實現本地部署。
目前,阿里已採用寬鬆的Apache2.0協議,將千問QwQ-32B模型向全球開源,所有人都可免費下載及商用。
阿里雲介紹,千問QwQ-32B是阿里探索推理模型的最新成果。在冷啓動基礎上,阿里通義團隊針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習,在32B的模型尺寸上獲得了令人驚喜的推理能力提升,印證了大規模強化學習可顯著提高模型性能。
(封面圖片來源:每日經濟新聞 資料圖)