☰

AI再突破！阿里巴巴通義千問發表Qwen3-Next 模型訓練成本大降9成

Qwen3-Next針對大模型在上下文長度和總參數兩方面不斷擴展（Scaling）的未來趨勢而設計，採用全新的高稀疏MoE架構，並對經典Transformer核心組件進行重構，創新採用線性注意力和自研門控注意力結合的混合注意力機制，實現模型訓練和推理的雙重性價比突破。

基於這一新架構，阿里通義「打樣」了Qwen3-Next-80B-A3B系列模型，開源指令（Instruct）和推理（Thinking）兩大模型版本。新模型總參數80B僅啓動3B，性能可媲美千問3旗艦版235B模型，模型計算效率大幅提升。

華爾街見聞提到，網友對阿里新模型的架構非常讚賞。阿里巴巴美股11日收盤大漲近9％，創近4年新高。其港股12日則漲逾5％，收報港幣150.8元。

相關資訊

▣ 阿里巴巴開源新一代通義千問模型Qwen3
▣ 阿里巴巴(09988)正式發佈全新的通義千問AI編程大模型Qwen3-Coder
▣ 阿里開源通義千問AI編程大模型Qwen3-Coder
▣ 阿里通義千問發佈小尺寸模型Qwen3-4B新版本
▣ 阿里通義千問Qwen3-30B-A3B模型推出新版本
▣ 阿里巴巴續漲2.9% 發佈新版通義千問Qwen 2.5-Max AI模型
▣ 阿里通義千問更新旗艦版Qwen3模型
▣ 阿里巴巴漲超7%！李飛飛團隊推出低成本模型s1，基座爲阿里通義千問（Qwen）模型
▣ 阿里通義千問推出編程模型Qwen3-Coder-Flash
▣ 阿里通義千問宣佈更新旗艦版Qwen3模型
▣ 阿里通義千問推出新模型Qwen3-30B-A3B-Thinking-2507
▣ 阿里開源通義千問最新的編程大模型Qwen3-Coder
▣ 阿里巴巴-W高開逾5% 此前發佈新版通義千問Qwen 2.5-Max AI模型
▣ 阿里(09988)通義千問推出新模型Qwen3-30B-A3B-Thinking-2507
▣ 阿里通義千問重磅升級 Qwen3-235B-Instruct登頂開源大模型
▣ AI早知道｜通義千問正式上線Qwen3模型；Suno V4.5版本將發佈
▣ 阿里發佈通義千問旗艦版模型聲稱超越DeepSeek 阿里巴巴美股一度漲超7%
▣ 通義千問最新AI編程大模型Qwen3-Coder正式開源
▣ 港股異動阿里巴巴-W(09988)高開近5% 此前發佈新版通義千問Qwen 2.5-Max AI模型
▣ 美股異動｜阿里巴巴漲近1% 通義千問視覺理解模型全線降價超80%
▣ 港股異動阿里巴巴-W(09988.HK)高開近5% 此前發佈新版通義千問Qwen 2.5-Max AI模型
挑戰美國科技巨頭！阿里巴巴推出開源AI模型Qwen3-Omni
▣ AI早知道｜Qwen團隊發佈Qwen3-Coder代碼模型；阿里巴巴推出首款自研AI眼鏡
▣ 聯發科攜手阿里雲完成通義千問大模型端側部署
▣ 阿里雲發佈通義千問2.0千億參數模型與通義千問App
▣ 通義千問發佈並開源新模型Qwen3-30B-A3B-Thinking-2507
▣ 阿里巴巴的Qwen AI模型助力斯坦福、伯克利能夠開發出低成本推理模型
▣ 阿里雲推AI大模型通義千問夥伴計劃啓動
▣ 阿里巴巴一度漲至6%，通義千問系列模型官宣降價，此前稱幾乎全面超越GPT

DMCA | PRIVACY | s@bg3.co

AI再突破！阿里巴巴通義千問發表Qwen3-Next 模型 訓練成本大降9成

相關資訊

AI再突破！阿里巴巴通義千問發表Qwen3-Next 模型訓練成本大降9成