海納百川》中國開源AI 舉國之力打造「魔樂社區」國家隊(廖明輝)

大陸互聯網龍頭百度瞄準人工智慧(AI)市場,啓動史上最大規模的頂尖AI人才招募活動。(圖/美聯社)

近年來AI基礎模型的數量大幅成長,自2019年起成長近38倍。根據史丹佛大學人本人工智慧研究中心(HAI)《2024年人工智慧指數報告》,2023年釋出的149個模型,98個爲開源、23個爲有限開源、28個爲閉源。開源模型佔66%,另有19%爲閉源、15%爲有限開源。同時,根據人工智慧研究機構Epoch AI「開源模型落後多少」報告,比較開源與閉源AI模型,發現最好的開源模型在性能、訓練與算力與閉源模型相當,但落後約一年。

在2023年全球釋出最多模型國家爲美國(109 個),其次爲中國(20 個)。因此,中國以舉國體制全力競逐AI開源模型,成立「魔樂社區」(Modelers 社區)國家隊。由中國電信旗下公司天翼雲在 2024 年底上線、並於2025 年4月正式成立理事會。它不只把模型、資料與工具放上雲端,更涵蓋治理機制、算力分配與產學研對接的完整制度,意圖在缺晶片、限算力與專利壁壘交織的國際局面下,爲中國打造出自給自足的AI開源通道。

理事會首批14家成員組合成國家隊,百度、火山引擎與商湯科技提供業界成熟的大模型與推理框架;北京智源AI研究院、上海 AI 實驗室代表學術源頭;情感機器(SwanLab)改進AI模型訓練流程、硅基智能聚焦數位人直播平臺與多模態應用;而華爲及摩爾線程分別從升騰、GPU角度補上國產算力;全球計算聯盟與中國信息通訊研究院負責標準與開源治理;天翼雲則以國家級雲網資源撐起底層算力調度。這種「硬體—框架—模型—應用—治理」的AI生態系拼圖,意味着中國不再僅靠單點突破,而是試圖用開源來整合整個AI產業鏈。

魔樂社區的策略分爲三層:首先是開源,至今已託管逾1萬個專案,其中包含 DeepSeek、通義千問Qwen 等語言模型以及升騰適配版本,並同步釋出二百多款可即時部署的體驗空間;其次是開源協同,引入Git風格的共編機制與SIG工作組,鼓勵晶片廠與模型作者共同優化算子,而非各自爲政;最後是社區營運,透過用戶成長激勵與大學課程,將開源文化滲透到開發者教育,降低中小企業試用門檻。這三層設計對應的是 Hugging Face、GitHub 與 fast.ai 在國際市場分別扮演的角色,只不過魔樂在同一平臺內完成整合,並側重於「國產硬體即插即用」的可落地性。

國家層面的動作也緊跟其後。中國信息通信研究院在5月與魔樂社區,共同建構「開源大模型智選中心」,爲開源模型提供效能、安全與倫理測評,一旦通過即可貼上「智選」標籤供政府採購與行業應用。此舉讓社區不只是技術交換站,更成爲政府認證與產業應用落地的入門門檻,大幅降低地方政府與國企導入開源模型的合規風險,同時形成由上而下的流量虹吸效應。

值得注意的是,魔樂社區聚焦開發開源模型,主要是迴應中國面對美國AI半導體封鎖壓力的現實選項。在先進製程受限、美國出口管制緊縮背景下,閉源模型需仰賴海外雲與專有 IP,難以保證長期供給;反之,開源既可繞開黑盒算力依賴,也方便在中國國產GPU與多種異構架構模型間做蒸餾。透過魔樂,華爲升騰GPU可在第一時間取得主流模型權重並完成算子對齊,從而縮短「硬體出樣到模型可用」,對內強化生態黏性,對外展示中國 AI 堆疊在成本與速度上的競爭力。

綜上所述,魔樂社區是中國在後ChatGPT時代,嘗試用「開源國家隊」模式重塑 AI技術路徑與產業分工試驗。它把算力瓶頸、資料孤島與安全審查這三道難題,拆解成爲由社區流動、標準對接與行政背書共同解決的方程式。這種自上而下與自下而上交織的雙軌策略,將決定中國能否在全球AI競賽中,從追隨者走向規則共同制定者。若魔樂模式最終證明可以複製到醫療、金融或城市治理等垂直應用場景,則「開源」將不再只是技術名詞,而將成爲中國數位主權AI的新突圍路徑。

(作者爲中華經濟研究院輔佐研究員)

※以上言論不代表旺中媒體集團立場※