從"堆參數"到"造飛輪":DeepSeek正在顛覆OpenAI的生存邏輯

出品 | 本站科技《態度》欄目

對話 | 袁寧

作者 | 李姝

編輯 |丁廣勝

當全球AI競賽聚焦於千億參數堆砌與算力軍備戰時,DeepSeek卻以“技術平權”的姿態撕開了行業裂縫。

其推出的DeepSeek-R1模型不僅將企業級市場的深度推理能力直接賦予C端用戶,更將行業長期信奉的“預訓練霸權”推向瓦解邊緣。

然而在技術祛魅的浪潮下,一些爭議也隨之涌現:當DeepSeek-R1-Zero通過強化學習自主生產數據,傳統數據標註行業是否面臨消亡?馬斯克高調推出的Grok 3在數學推理測試中“翻車”,是否暴露了AI評測體系的深層缺陷?······

帶着這些疑問,本站科技《Future Talk》邀請到了兩位專家一起探討,他們分別是星塵數據CEO章磊、天雲數據CEO雷濤。(注:由於部分原因,星塵數據產品負責人張毅倜代CEO章磊參與直播討論)

星塵數據成立於2017年,是國內首家專注於AI數據自動處理技術的標杆企業。公司以技術創新爲核心驅動,自主研發全球首款AI數據全生命週期引擎MorningStar,覆蓋數據採集、標註到模型迭代的全鏈路管理,顯著提升企業數據生產效率50%以上,助力解決“數據債”難題。(類似於軟件開發過程中的“技術債”,“數據債”是指在機器學習的各個環節中,由於低估了數據的重要性,在推進項目的過程中忽視了數據質量的把控,從而欠下的各種“債務”。)

而天雲數據是一家國有參股企業,首批國家級專精特新小巨人企業,北京市科學技術獎廠商。是國內能夠同時提供數據基礎設施和數字原生全產業服務鏈的數據科學公司。秉承“數據+智能”的理念致力於大數據(AI-Native 數據庫)和人工智能軟件的研發與創新,賦能產業數智化轉型。在數據供給側和數據消費側均獲得多項權威認可。

DeepSeek攪局者還是革命者?

天雲數據CEO雷濤認爲,DeepSeek實現了大模型的祛魅,開啓了中美后訓練時代的大門。在他看來,曾經被廣泛依賴的技術大模型預訓練模式,如今已不再是唯一的 “金科玉律”。

進入後訓練階段,模型更多地承擔起將通用世界知識向領域知識轉化的重任。以DeepSeek-R1系列爲例,它以強化學習爲主導,並將長思維鏈CoT(Chain of Thought)這一原本爲OpenAI等模型廠商的閉源recipe直接開放給community。這一舉措,在模型交付層面,將國產和北美大廠的模型推理能力差距瞬間拉平,無疑是對傳統市場格局的一次大膽挑戰。

星塵數據產品負責人張毅倜進一步補充道:“DeepSeek將數據從量的問題轉化成一個質的問題,將會對數據行業產生重大影響。"他分析稱,以往行業多聚焦於傳統的Ground Truth單模態數據訓練,而DeepSeek的出現,將徹底改變未來數據生產方式。今後,我們完全可以藉助強化學習生成的模型,實現數據增強。這一轉變,將使整個數據行業從低附加值領域,邁向技術附加值高的新臺階。(Ground Truth即用於訓練、驗證和測試AI模型的經過驗證的真實數據。)

數據枯竭之爭:真相與出路

隨着AI模型朝着高質量方向迅猛發展,不少人斷言當下數據已陷入 “枯竭” 困境。對此,張毅倜認爲這是一個僞概念。他解釋說,當前所謂枯竭的數據,主要集中在互聯網圖文類數據。而實際上,大量數據正以多模態或非結構化形式,隱匿於人類日常生活的各個角落。“我們目前看到的數據,僅僅是冰山一角。”張毅倜補充道。

那麼,如何將這些未被充分挖掘的數據轉化爲高質量數據呢?張毅倜給出了幾種途徑:其一,由專業團隊人工手動生成,這類數據堪稱高質量的專家數據;其二,受DeepSeek-R1-Zero啓發,通過大規模強化學習訓練模型,進而利用該模型生產數據;其三,藉助專業的AI數據平臺如MorningStar進行訓練,在訓練過程中挖掘出高質量數據。

雷濤則從另一角度解讀數據質量問題,他認爲數據質量的高低並非由主觀認知簡單判定,而是取決於所採用的AI算法。他表示,如今已有大量數據由AI生成,但這並不意味着這些數據就是 “假數據”。“所謂高質量與低質量數據,其評價標準與方式,歸根結底在於AI算法。” 雷濤進一步闡釋,“這就是當下熱議的數據飛輪概念。AI模型使用的數據由其自身生成,數據飛輪正是構建模型持續迭代生長的關鍵方法。”

Grok 3:技術秀肌肉還是戰略拼圖?

在談及Grok 3時,張毅倜認爲它不過是馬斯克AI體系中的一次技術溢出。他指出,畢竟在馬斯克的宏大戰略版圖中,AI佔據着核心地位,宛如大腦之於人體。“Grok 3更多是馬斯克在各個領域展示技術實力的一種體現。他真正的目標,是將機器人、火箭、地下隧道以及特斯拉等現實世界業務與虛擬世界緊密打通,這或許也是他構建AI超算中心的最大初衷。”張毅倜進一步分析道。

對於馬斯克宣稱其模型在數學推理方面優於國內模型,卻在 “9.9與9.11哪個大” 這類簡單問題上 “翻車” 的現象,張毅倜指出,目前所有模型評測大多基於開源數據集,而這些Benchmark最早由北美主導制定,在計算層面重視程度相對不足。此外,國外通常會制定兩套Benchmark,一套面向普惠大衆,一套用於推理測試。而推理模型的Benchmark在邏輯上,其實是在其自行公佈的數據集測試中超越了OpenAI o1系列大模型。

雷濤則表示,不能僅依據幾個Benchmark,便在傳統認知賽道中評判模型優劣。我們更應關注多模型之間的通用性。爲實現端到端的訓練合成數據,如何運用AI手段進行數據生產,已然成爲行業發展的必備邏輯。

行業走向:“通用模型+專業服務”還是“行業模型主導”?

雷濤認爲,行業內存在大量個性化數據,許多行業知識無法單純依靠Transformer的排列組合進行推理。DeepSeek的架構爲我們帶來啓示,我們可以將行業深層領域的知識,通過驗證激勵機制融入強化學習,從而在大模型層面,而非傳統機器學習層面,更有效地獲取行業科學知識體系。

他表示:“領域知識的探索之路還很漫長,絕非簡單的微調、過濾與蒸餾所能涵蓋。”

張毅倜則認爲行業模型的概念是模糊的,它沒有一個明確的邊界,很難去定義。他表示,未來的模型由Personal Language Model和Lagre Language Model來劃分。(Personal Language Model是大模型結合私有化知識構建出的私有化小模型。)

而在實際業務場景應用中,專業模型纔是未來趨勢的主導。(當Personal Language Model的訓練模式用於企業私有化模型的生產,誕生的模型就是專業模型。)“一個企業往往需要多個專業模型,這些專業模型協同合作,組成一個‘專家團’,將極大提升企業生產效率,”張毅倜總結道。