講真,馬斯克的Grok-3,“碰瓷”不了DeepSeek
前不久,一場高規格民企座談會讓坊間議論紛紛。 這是中央時隔 6 年 3 個月再度專門召開民營企業座談會,會上,中國互聯網和科技產業的精英齊聚一堂,釋放出新質生產力、科技創新產業向好的趨勢。
年輕的樑文峰也在其中,他與任正非、曾毓羣等老一輩企業家同座,而他的DeepSeek正成爲在場各家業務的連接橋樑。
沒過多久,馬斯克旗下xAI公司突然發佈新一代大語言模型Grok-3,號稱是“地球上最聰明的人工智能”,計算能力是去年8月發佈的Grok 2的10倍,推理能力超越包括ChatGPT和DeepSeek在內的其他領先AI模型。
一場橫跨太平洋的“AI對戰”瞬間點燃科技圈,在外界看來,Grok 3令AI行業競爭更加激烈。誰是在實驗室裡“秀肌肉”,誰又能將技術變成實實在在的生產力,是未來這場風暴的中心。
01.訓練:一個賭“壕氣”,一個用“巧思”
Grok-3是馬斯克與團隊xAI爲挑戰OpenAI、ChatGPT而精心打造的產品,被稱爲“地球上最聰明的人工智能”。
在官方的直播演示中,Grok-3和Grok-3 mini在數學、科學和編程基準測試上,超越了包括GPT-4o、DeepSeek-V3和Gemini-2 Pro等主流模型。
同時,具備推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning則超越了DeepSeek-R1和OpenAI的o3 mini等。
看得出,DeepSeek已經與頭部大模型比肩。
自打這個國產大模型爆火後,包括硅谷在內的許多AI公司都開始重新評估用堆算力和參數來推進所謂的“擴展法則”,是否仍然適用。因爲DeepSeek顛覆了以往發展AI就是要不斷的堆算力、堆GPU的燒錢路子,而是採用了一條分佈式算力+混合雲優化的路線:通過動態調度公有云、私有服務器甚至邊緣計算資源,結合自研的模型壓縮技術(如稀疏化訓練),在千億參數規模下實現了訓練成本降低40%以上。
然而目前看來,馬斯克並不這麼認爲。事實上,xAI一直是追求“大力出奇跡”的代表,相關負責人表示:
“如果你看看所有性能的來源,當你有一個非常強大的工程團隊和最優秀的AI人才時,唯一需要的就是一個強大的集羣,才能產生巨大的智能。”
某種意義上,Grok3也是大力出奇跡的結果,馬斯克爲其攢下了“壕”無人性的算力家底。據瞭解,xAI團隊在122天內讓第一批10萬塊GPU投入使用,是“目前最大的完全連接的H100集羣”。之後又用了92天的時間,將數據中心的容量繼續翻倍,並基於這些成果構建出了Grok-3。
而被拿來進行對比的DeepSeek-V3模型,則是在配備了2048個英偉達H800 GPU的集羣上進行訓練的。H800是英偉達特供中國市場的AI芯片,在性能上不及先進的H200、H100等。
雖然如此,擁有更高集羣的Grok-3在演示時也未呈現出“地球最聰明”的狀態。直播中Grok-3一度“思考卡殼”,在任務時因爲顯示“Thinking Hard”後很長一段時間沒有反應,等待幾秒後演示人員關閉了頁面開啓下一話題。
有網友親自下場向Grok 3提問,在面對下圖中“比薩斜塔上兩個球哪個先落下”這樣常識性的問題時,Grok 3也仍然無法應對,因此被戲稱爲“天才不願意回答簡單問題”。
儘管如此,馬斯克稱未來他們將會進一步加大數據中心的建設力度,xAI的下一個計算集羣會成爲世界上最強大的集羣,能耗達到1.2GW,相當於數十萬戶家庭1年的用電量。
網友犀利的評價:“自DeepSeek-R1之後,我們只應考慮效率更高的進步,而不僅僅那些規模更大、且比競爭對手耗能更多的進步。”
02.開源:一個“擠牙膏”,一個全開放
一般情況下,企業依靠高算力而堆出來的高性能模型,會基於成本考慮選擇閉源或延遲開源。
關於Grok-3,馬斯克並未當場宣佈開源,而是表示:“當下一個版本完全發佈時,將開源Grok的上一個版本,也就是當Grok-3成熟穩定時,我們將開源Grok-2。”
2月20日,馬斯克轉發xAI的推文,宣佈短期內Grok 3.0向所有人免費開放。不出意外,Grok-3會延續“基礎版開源+高級功能付費”的策略。這樣既能吸引開發者貢獻算力(社區訓練反哺主模型),又能用開源生態倒逼競爭對手。
圖源:x
而在剛剛過去的兩週,以DeepSeek爲中心的朋友圈迅速擴容。國外,有包括微軟、英偉達、亞馬遜等世界級雲計算巨頭;國內,三大基礎運營商、超過15家芯片廠商,還有手機、車企、雲服務、金融在內的200多家企業,多地政務服務系統,甚至兩款“國民級應用”騰訊微信、百度搜索也先後宣佈接入。
大模型到底應該開源,還是應該閉源?這個話題討論已久,企業基本上走出三條路子:
只做開源,沒有盈利模式,只有大公司燒得起,Meta是少數走這條路的;
開源閉源並行,比較靈活,既有收入又能獲取用戶,包括微軟、谷歌、阿里雲、騰訊雲等,均踐行這條路;
只做閉源,相當於走了一條簡單直接邏輯清晰的路,亞馬遜、華爲盤古、還有以前的文心一言(百度)、GPT-4(OpenAI)均如此。亞馬遜、谷歌雲在過去一年的營收增速都有所提升,這被認爲是大模型拉動的結果。
在發展過程中,企業的觀念也在發生變化。長期以來,OpenAI因爲「不open」(不開放)而備受爭議。OpenAI首席執行官薩姆·奧特曼曾爲下一個模型的開源項目徵集意見,“做一個相當小但仍需要在GPU上運行的o3-mini級模型,還是做一個我們能做得最好的適合手機運行的模型?”
就在看似閉源OpenAI遙遙領先之時,DeepSeek開源大模型的出圈又帶來了巨大的不確定性。薩姆·奧特曼稱OpenAI在開源AI軟件方面“一直站在歷史的錯誤一邊”,他還透露,雖然並非所有員工都同意其觀點,但OpenAI內部正討論公開AI模型的權重等事宜。
開源或閉源,這其中摻雜了商業利益、技術觀點等多重因素。Gartner高級分析師Mike Fang在接受DoNews採訪時則表示,在人工智能大模型領域,開源和閉源的路線持續並存。
“如果閉源模型的性能不及開源模型,則其商業價值將受到質疑。然而,對於高性能的閉源模型,其商業路徑仍然具備優勢。未來AI大模型可能進入低算力、低成本時期,但高端模型仍會保持一定溢價。”
至於瘋狂開源的DeepSeek,其發展模式是否會調整?未來盈利前景又將如何?在Mike Fang看來,這家公司短期不以盈利爲目的,能夠從研究角度鼓勵工程師更高效運營,而沒有特別多的財務變化或者業務變化的壓力。未來如何能夠保持初心,讓發展模式或者技術創新能夠持續下去,纔是主要考慮的方向。
換個角度想,對於日活用戶數量達數千萬的DeepSeek來說,找到盈利模式並不困難,開源的價值要比想象中大得多。從某種層面來講,DeepSeek的影響力是以往的技術突破無法比擬的——我們不應該只考慮它作爲單個公司的科技價值、商業價值,而應該思考它對推動新質生產力發展的巨大價值。
03.面對DeepSeek的普及,企業要怎麼做?
DeepSeek所代表的資源消耗更小、算法效率更高、推理更精確的技術路徑,正在進一步助推AI應用成本下降。
從近期企業動作來看,不僅包括大語言模型領域積累較弱的手機、家電、PC、汽車廠商,就連已經開發出AI大模型的騰訊、360、百度等大廠,也在爲自家的AI工具注入新動力。
但這會產生新的問題,所有人都接入了,等於所有人都沒接。家家戶戶都有DeepSeek這把“金鑰匙”,打開市場的、或者說驅動業務增長的核心差異化能力體現在哪裡?在新的環境下,企業又該如何競爭?
關於這一點,Gartner的Mike Fang告訴我們,企業若僅滿足於“簡單接入”,就無法在競爭中脫穎而出。關鍵是要找到適合自身業務場景的AI解決方案,深度挖掘大模型的潛力,將其與行業特點、客戶需求和特定場景緊密結合,並注重工程化落地與治理,從而實現高效且負責任的技術應用。
也就是說,大模型賦予產品強大的技術力,但如何將這一能力轉化爲無可替代的產品體驗,讓用戶發自內心地接受使用,纔是競爭的最終目標。
Mike Fang舉例表示,當下,從車企到券商紛紛宣佈接入DeepSeek,但也僅僅是接入,距離真實大規模應用落地還需要更長時間。“這其中涉及到模型切換,面對新的業務場景,企業要通過不斷的流程測試以及在真實業務當中檢驗。”
但這裡要注意數據問題,對於AI來說,有三大要素需要分析:大模型、算力和數據。在大模型迎來顛覆式創新之後,對算力的需求開始降低,下一個重要的瓶頸是數據。
通過Gartner研究表示,海外AI公司應用數據的能力較高,已經支持企業大模型的落地。反觀國內,數據方面的數值一直徘徊在較低位,只有少部分企業能夠實際把生成式AI應用從實驗到最後的生產落地。
這就要考驗企業是否具備構建一個從技術到市場的良性循環,不僅僅是關於產品的迭代與優化,更是如何在短期內通過市場數據和產品調整,不斷提升大模型的能力。未來,誰能夠獲取專有數據,並能實現實時更新,將是競爭的關鍵所在。
單個企業是如此,而對於整個中國的AI產業來講,DeepSeek還可以帶動很多開發、推理,甚至是芯片方面的額外的機會,這將進一步加速企業“出海”。此外,AI接下來的治理也會變得更爲重要,“如果把DeepSeek的能力比作高速行駛的一輛車,企業就需要自建或者管控出一個原生的剎車系統,這樣纔會使得大模型更健壯,‘車’能夠開得更快。”Mike Fang表示。
可以說,DeepSeek攪動起的,早已不是AI大模型競技規則變化的風雲,而是影響多個產業迭代的深層變革浪潮。我們都站在了時代潮頭,更需要以開放的心態擁抱變化。
本文源自:DoNews