DeepSeek R2 或將發佈,壓力給到樑文鋒
大約100天前,DeepSeek R1橫空出世,火爆出圈,被一向傲慢的硅谷科技圈稱爲“神秘東方力量”,並憂心忡忡地高呼AI領域的“斯普尼克時刻”來了。這款由中國初創公司開發的大模型,用低至600萬美元的訓練成本,產生足以挑戰OpenAI o1的極佳性能,7天內用戶數破億,登頂美國iOS App Store免費應用榜首,更要命的是它還開源……DeepSeek種種殺傷力疊加,難怪讓硅谷AI圈覺得“天塌了”。
如今,R1發佈已近百日,根據行業3-4個月的版本迭代慣例來看,距離DeepSeek再次“出手”的時刻應該不遠了。這股神奇又神秘的“東方力量”,能否再次爲行業帶來驚喜和驚豔?相信全球都在期待中。顯然,此刻的壓力給到了樑文鋒。
01 OpenAI,慌了
1、AI一哥,也亂了分寸
時間回撥到2023年,當時的OpenAI創始人山姆奧特曼,可謂是風頭無兩、風光無限。彼時的OpenAI,坐擁全球最大最強的閉源大模型,GPT-4發佈後,OpenAI幾乎以一己之力帶動數百家創業公司、數千個AI應用崛起,儼然是遙遙領先的AI界“王者”,拿着望遠鏡也找不到對手。
但奧特曼這種執AI之牛耳、人工智能唯我獨尊的舒爽感,持續到2025年1月20日便戛然而止。原因就是來自中國的一家名不見經傳的AI創業公司,石破天驚地發佈了效果堪比OpenAI o1的DeepSeek R1開源大模型。
就在R1發佈的當周,奧特曼在接受媒體採訪時,就頻頻使用“令人印象深刻”、“是真正的威脅”等詞語來形容對DeepSeek的感受。他的焦慮不僅僅因爲DeepSeek用新技術、低成本,訓練出性能卓越的大模型,更讓他擔心的是,DeepSeek的開源策略,將在AI生態開放性上形成新範式。
爲了減少DeepSeek的衝擊,OpenAI變得不再Open,還非常跌份地搞起了小動作。他們向美國政府偷偷提交了長達15頁的“舉報信”,聲稱DeepSeek R1會給美國帶來“重大風險”,並呼籲美國政府對其採取封禁措施。堂堂AI一哥,竟然不顧體面,向一家新AI創業公司下黑手、使絆子,只能說DeepSeek確實足夠強大,能讓不可一世的OpenAI亂了分寸,慌了陣腳。
2、OpenAI更小更快了
面對來勢洶洶的DeepSeek,回過神來的OpenAI除了背後捅刀子,還被逼着搞起了“應激性迭代”:此前一貫慢節奏迭代的OpenAI,以罕見的高密度先後發佈了GPT-4o、O4-mini,以及包括 GPT - 4.1、GPT - 4.1 Mini、GPT - 4.1 Nano在內的GPT - 4.1 系列模型。
這些新模型幾乎都有一個核心特徵,就是參數規模更小、成本更低、速度更快。比如,GPT - 4.1 Mini 在多個基準測試中表現超越 GPT - 4o,大幅減少延遲並降低 83% 成本;而 GPT - 4.1 Nano 則是首個超小型模型,能支持 100 萬 token 的上下文窗口,更適用於低延遲任務。
這一系列的高頻更新,無疑是 OpenAI在感受到 DeepSeek這種兼具高性能與成本效益的開源大模型的競爭壓力後,所採取的“防禦性擴張”策略。DeepSeek不僅給整個AI行業帶來了新的刺激,也讓OpenAI第一次真正感受到了競爭對手“後發先至”的現實風險。
02 國內AI應用,只幹了一件事
1、全面擁抱DeepSeek
在國內,自DeepSeek大模型問世以來的幾個月內,AI 應用領域幾乎上演了一場集體轉向、“追求”DeepSeek的大戲。但凡數得上號的AI應用,似乎都在不約而同地幹一件事:想盡辦法上線DeepSeek R1滿血版。
在搜索引擎領域,百度率先宣佈將 DeepSeek R1 深度集成至文心一言底層架構,實現了多模態生成效率的大幅度提升;騰訊元寶智能創作平臺接入 DeepSeek API 後,使得短視頻腳本生成成本大幅降低,日均處理請求量突破百萬次;阿里雲則推出基於DeepSeek的雲原生解決方案,能夠把企業大模型部署門檻從百萬級降至萬元級。甚至連知乎直答、納米 AI 搜索等垂直領域玩家,也紛紛以 “DeepSeek 滿血版” 爲賣點重構產品邏輯,形成了從通用技術到垂直場景的完整滲透。
這種對DeepSeek“衆星捧月”般追捧背後的邏輯其實很簡單:R1大模型效果更好,成本更低,而且開源透明。DeepSeek R1在多個權威評測榜單上展現出與國際頂尖閉源模型掰手腕的實力,甚至在某些特定任務上實現了超越。更關鍵的是,其開源的特性,以及相對更優的性能功耗比,讓大家用起來覺得更放心、更踏實。
2、DeepSeek治好了,企業的“AI焦慮”
DeepSeek不僅成了國內各科技大廠的“心頭好”,也成了治癒一般企業“AI焦慮”的最佳良藥。過去,不少企業面對 AI,尤其是高性能大模型,常常陷入一種“高攀不起”的現實顧慮。高昂的 API 調用費用、複雜的私有化部署要求、對算力資源的巨大渴求,都讓 AI 技術的規模化應用,顯得遙不可及。
而DeepSeek 的出現,很好的解決了他們“既擔心錯過技術革命浪潮,又苦於找不到成本可控的落地路徑”的尷尬。DeepSeek通過開源的方式,將強大的基礎模型能力釋放出來,把AI部署成本打下來,讓更多無論是大型互聯網公司,還是尋求 AI 賦能的傳統行業,都有機會以更低的成本、更高的自主性來構建屬於自己的 AI 應用。
DeepSeek將“技術普惠”的理念逐步轉變爲現實,將企業原本難以企及的大模型技術,轉化爲可複用、可負擔的 “數字基建”,不僅加速了國內 AI 應用的落地進程,也在很大程度上打消了企業使用AI的後顧之憂,讓他們有更大的底氣,從猶豫觀望,轉向積極嘗試。
03 樑文鋒的戰略定力
1、專注基礎大模型研發
在這波 AI 浪潮中,我們看到了無數AI創業公司,爲了生存和發展各顯神通、各種嘗試:有的公司急於構建應用生態,覆蓋 toB 和 toC 市場;有的公司在基礎模型和上層應用之間搖擺不定;有的則熱衷於追逐短期熱點和流量……但樑文鋒和他帶領的 DeepSeek,似乎顯得有些格格不入,他們選擇了一條更爲專注,也更爲艱難的道路:持續深耕基礎大模型研發。
相對於其他大模型創業公司的“多元化”嘗試,他們展現出了超凡的戰略定力。公司成立至今,從未涉足任何應用層產品開發,即便在 R1火遍全球、獲得“潑天流量”那段時間,面對多家投資機構拋出的資金合作、流量合作、技術合作等各種橄欖枝,他們也都是一一拒絕。
DeepSeek 從一開始就將目標鎖定在打造世界一流的基座模型上,而不是急於將自身的技術和影響力,轉化爲直接的應用層產品或商業模式。樑文鋒接受媒體採訪時說的這段話,也許是對“DeepSeek爲何如此專注且有定力”的最好回答:“過去很多年,很多的中國公司習慣了別人做技術創新,拿過來做應用變現,自己等着摩爾定律從天而降,躺在家裡18個月就會出來更好的硬件和軟件。我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。中國也要逐步成爲貢獻者,而不是一直搭便車。”
2、或將成爲AI時代的科技巨頭
樑文鋒和DeepSeek這種心無旁騖、執着於將資源和精力投入到模型的持續迭代和優化中的態度和精神,讓K哥聯想到移動互聯網時代,那些最終脫穎而出的科技巨頭們。
無論是字節跳動的張一鳴,早期聚焦於推薦算法和信息流產品;還是美團的王興,在“千團大戰”中堅持深耕本地生活服務;亦或是拼多多的黃崢,瞄準下沉市場和社交電商模式持續發力……他們之所以成功的最重要共同點,就是在創業初期甚至相當長的一段時間內,都表現出了對核心領域異乎尋常的專注和“長期主義”心態。他們抵制了多元化的誘惑,選擇了在自己認定的“窄門”裡,做到極致,成爲最佳。
社會心理學中著名的“棉花糖實驗”,曾爲我們揭示了延遲滿足的能力與未來成功的某種關聯。而在商業世界,這種延遲滿足則體現爲一種能抵禦短期誘惑、爲更宏大的長期目標持續投入的戰略定力。從這個角度來看,樑文鋒所帶領的DeepSeek,已經具備成爲AI時代科技巨頭的所有潛質。
04 樑文鋒的主場時刻又到了
DeepSeek R1 的成功出圈,無疑爲這家公司注入了強大的發展動能。儘管樑文峰和他的團隊仍保持一貫的低調,但一些微妙的變化,還是透露出公司正在爲下一階段的發展積蓄力量。
比如,DeepSeek開始在招聘市場上物色CFO、COO等關鍵高管職位。這也被外界解讀爲DeepSeek正在爲更大規模的融資,甚至是未來的資本市場運作做準備。畢竟,對於任何一家技術驅動型公司而言,引入經驗豐富的管理人才,完善公司治理結構,都是從初創慢慢走向成熟的必經之路。
不過遺憾的是,除了這些間接信息,關於 DeepSeek 的內部運作、下一步的具體計劃,外界知之甚少。而這種低調,也讓市場對其即將發佈的新版本充滿期待:根據行業慣例和業內透露出的某些零星信息,市場普遍預期DeepSeek新版本,很可能會在5月份發佈。而這無疑是樑文峰和 DeepSeek 的又一個“主場時刻”。
R1 發佈距今已近百日,DeepSeek 的工程師們,這次會爲我們帶來哪些顛覆性的體驗?讓我們一邊充滿期待,一邊祝福DeepSeek 在樑文峰的帶領下,繼續秉持專注與創新的精神,穩健前行,爲中國的AI發展帶來更多驚喜,做出更大貢獻。
來源 | 技術領導力(ID:jishulingdaoli)
作者 | Mr.K ; 編輯 | 蝦餃
內容僅代表作者獨立觀點,不代表早讀課立場