阿里推出全新推理模型 僅1/21參數媲美DeepSeek R1

財聯社3月6日電,阿里Qwen團隊正式發佈他們最新的研究成果——QwQ-32B大語言模型,QwQ-32B在僅有DeepSeek-R1約1/21參數量的情況下,用強化學習實現了性能上的跨越。