中國“霸榜”全球開源大模型:十席佔其九,光環下亦存隱憂
中國的開源大模型正以“集羣式”的崛起,重塑全球AI版圖。
過去兩週多的時間裡,阿里通義千問陸續開源了六款模型。在這應接不暇的開源狂歡中,某AI公司的技術研發人員董銘(化名)卻感到有些心力交瘁——他默默關掉了一個剛部署幾天的測試集羣,因爲隨着新模型的開源,應用程序接口又變了,而這已經是他近期第四次重寫模型調用腳本。
最近,此前有些沉寂的中國大模型又重新熱鬧起來,無論是互聯網大廠還是初創公司,都緊鑼密鼓地發佈了新模型,頗有2023年“百模大戰”的味道。但不同的是,這一次的大模型浪潮以開源爲核心,近期更新模型的公司都選擇了開源的路徑。與此同時,據全球知名AI開源社區Hugging Face近日公佈的榜單,排名前十的開源大模型中,中國佔據了九席。
中國的開源大模型正以“集羣式”的崛起,重塑全球AI版圖。但這在加強中國技術影響力、加快AI應用和普及的同時,也存在着隱憂。一方面,開源模型頻繁迭代,但本質依然是基於主流Transformer架構的微調,能力差距並未拉開,有陷入“微調內卷”與同質化困境的傾向。另一方面,對於開發者來說,開源模型的爆發雖然提供了各式各樣的工具,但也帶來了反覆調試、兼容成本高等挑戰。
中國大模型“橫掃”開源榜單
作爲AI大模型大戰的兩個不同方向,開源與閉源孰優孰劣歷來存在爭議。開源是指開放源代碼,允許用戶修改、使用、分發,閉源則是指源代碼不公開,用戶僅能通過接口調用功能。
今年以前,我國大模型雖也“百花齊放”,但開源與閉源呈現勢均力敵的狀態,直到DeepSeek火爆出圈,國產大模型才走到了一個分水嶺。業界普遍認爲,DeepSeek的成功是開源的勝利,讓所有人直觀感受到了開源的影響力。於是,更多的中國公司選擇效仿DeepSeek,轉向開源路線,並將工作重點重新轉向模型的優化與更新迭代中來。
今年7月底,國產大模型再次迎來了一輪開源“井噴潮”:7月22日起,阿里以“日更”的節奏,連續發佈4款開源模型;7月27日,騰訊開源了混元3D世界模型1.0;7月28日,智譜發佈了專爲智能體應用打造的開源模型GLM-4.5;7月31日,AI大模型“六小虎”之一的階躍星辰正式開源新一代基礎大模型Step-3……
與此同時,Hugging Face在7月31日公佈的榜單顯示,排名前十的開源大模型中,中國佔據了九席。其中,智譜的GLM-4.5排名第一,阿里的通義千問系列大模型更是獨霸5個席位,同時上榜的還有騰訊混元大模型、月之暗面的Kimi K2大模型等。自年初至今,DeepSeek和阿里被外界稱爲“開源雙子星”,Kimi K2發佈後被《自然》雜誌稱爲“又一個DeepSeek時刻”……中國開源大模型迎來了集體爆發的時刻。
“這一現象標誌着中國AI從‘技術追趕’邁向‘生態主導’,核心驅動力源於‘數據—算力—場景’構築的強勁閉環優勢。”天使投資人、資深人工智能專家郭濤在接受證券時報記者採訪時表示,我國開源大模型強勢崛起,一方面,是由於我國大模型廠商依託海量優質中文語料,深度挖掘垂直應用場景,構建起了特色鮮明的差異化訓練數據集;另一方面,以華爲昇騰爲代表的國產化算力底座日趨成熟,爲大規模分佈式訓練奠定堅實基礎,疊加開源社區的飛輪效應,頭部企業開放代碼匯聚衆智,從而形成了良性循環的正向反饋。
先發者與後發者的路徑分化
8月2日,國際知名大模型評測平臺Chatbot Arena更新了最新一期榜單,阿里旗下最新開源的千問3超越了Grok4、Claude4等閉源模型,位列總榜全球第三,僅次於谷歌與OpenAI旗下的閉源大模型。
與此同時,作爲開源模型領域的先驅,Meta創始人扎克伯格在一封公開信中表示,Meta會“謹慎選擇開源內容”,這被視爲Meta轉向閉源的一個信號。這意味着,在中國大力擁抱開源模型的同時,閉源模型成爲了美國科技公司的主流選擇,發展路徑已出現明顯分化。
“AI的先發者必然傾向於閉源,因爲先發者要鞏固自己的優勢,保持獨特性,比如OpenAI就是從開源逐漸走向閉源;而後發者必然傾向於開源,因爲只有開源,才能打破閉源者構建的生態。”工信部信息通信經濟專家委員會委員盤和林在接受證券時報記者採訪時表示,作爲後發者,我國發展AI最佳路徑就是開源,只有開源模式可以不斷優化,吸引全世界開發者幫助研發算法來適配應用場景,從而獲得廣闊的應用生態支持。
一名人工智能資深專家告訴記者,美國的AI產業由資本驅動,有較強的資本回報預期,其盈利訴求導致AI大模型企業往往先追求技術領先,形成一定壟斷後再創造鉅額利潤,使其傾向於選擇閉源路線。但對於中國大模型廠商而言,唯有憑藉開源的技術透明性,才能迅速在全球範圍內獲得信任,建立自己的開發者生態。“開源是一種產業優先的路徑,通過開源降低使用門檻,讓大模型加速成爲與實體經濟融合的基礎設施。”該人工智能資深專家表示。
但開源並不等於放棄盈利,事實上,目前不同的模型廠商都有各自的盈利探索。比如,智譜以開源吸引更多的開發者,同時也向企業和政府客戶提供付費的定製化解決方案;阿里則是通過打造強大的開源模型,吸引開發者使用其雲計算等基礎設施,通過雲服務獲取收益。
“開源模式如利刃破局,打破技術壟斷壁壘,讓中小企業能以低成本調用前沿模型,加速AI在智能製造質檢、金融風控等領域的落地。”郭濤說,當閉源模型採取API(應用程序接口)收費模式時,中國開源模型通過微調定製服務、雲平臺分成等路徑實現盈利,推動了AI技術的普及和應用。
光環之下的隱憂與挑戰
開源模型越來越“卷”,這是今年以來從業者的普遍感受。各個廠商迭代模型的速度越來越快、版本越來越多,一個模型“登頂”之後很快又會被新的模型超越,看似是在參數性能、評測分數上“你追我趕”,實則是缺乏顛覆式創新之下的“微調內卷”與同質化困境。
“開源也好,閉源也好,所有領先模型都是基於谷歌發明的Transformer,在這個基礎架構上再創新,如此而已。”開源中國董事長馬越表示。前述人工智能資深專家表示,國產模型在開源榜上領先,體現的是國內廠商在算法工程化、推理性能、成本優化等方面的實力,大多數模型進步是依賴工程調優,而不是像Transformer那樣的訓練框架及算法創新。
硅谷基準風投公司合夥人Bill Gurley曾評價,中國開源模型之間可以互相改進,產生的組合效應非常強大,推出新模型變得更容易。但技術壁壘上的不足,導致新模型雖然愈發頻繁地推出,但能力差距並未拉開。對於開發者而言,開源工具雖多,卻面臨密鑰管理割裂、版本迭代失控等問題。
“通義、DeepSeek、GLM,每個模型都有各自的控制檯和密鑰。而且模型更新頻繁,接口經常變化,給集成工作帶來不少困擾。”董銘表示,爲了快速驗證新模型,開發者往往不得不反覆部署臨時集羣,當模型更新節奏超過開發速度,開源狂歡某種程度也成爲了“甜蜜的負擔”。
在郭濤看來,模型高速迭代催生技術突破的同時也暗含着隱憂,不僅會帶來兼容性危機,版本更迭過頻導致下游應用適配成本激增,同時也可能存在創新空心化傾向,多數工作停留在參數調優,缺乏底層架構突破。對此,需推動統一API接口標準,激勵開展原創性基礎研究,規避低水平重複建設。
盤和林認爲,靠“微調內卷”實現進步是AI基礎算法突破乏力導致的,要真正引領AI範式,基礎模型算法創新和算力芯片突破是繞不過去的兩大門檻。“未來,需要建立中國AI的基礎算法知識分享圈子,通過圈子內的相互啓發,來推動中國AI算法思想的創新。”盤和林表示。
責編:嶽亞楠
校對:蘇煥文