楊植麟,一個90後理想主義者的懸浮

天才的標籤之外楊植麟還是個資深文青。90後一代或多或少都曾迷戀過村上春樹,1992年出生的楊植麟也不例外。在村上春樹的一本小說中,楊植麟對一個程序員深夜寫代碼這件事印象深刻,並充滿憧憬,這爲他未來進入AI領域埋下伏筆。

高中和大學時期他熱愛搖滾,最喜歡的樂隊是平克弗洛伊德。在清華讀書期間,他創立了搖滾樂隊Splay,曾晉級清華大學校園歌手大賽原創決賽。清華向來有音樂傳統,除了走出過高曉鬆和水木年華,楊植麟那位大名鼎鼎的學弟姚順雨(任職於OpenAI),本科時創立了清華大學說唱社。

玩搖滾和說唱屬於理科生的叛逆和浪漫。90後一代人的迷茫在於,這個時代留給他們的紅利並不多,音樂恰好能宣泄這種憤懣的情緒。楊植麟的樂隊創作過一首歌,講述有關“做了一個創業成功一夜暴富的白日夢”。對追求理想和獲得金錢總是搖擺不定,正是青春期普遍的狀態,渴望一夜暴富或許是抵擋理想主義破滅的有效手段。

從時間座標上來看,其實90後趕上過移動互聯網紅利期的尾巴。戴威是隻比楊植麟大一歲的清華校友,2015年戴威的ofo共享單車正式上線,並在全球首創“無樁單車共享”模式,成爲當之無愧的創業明星。ofo最後的結局我們都知道,戴威欠用戶人均199元(總額達15 億),後來奔向美國繼續創業。

移動互聯網的黃金時代是屬於70後、80後創業者的,以王興、程維、張一鳴、黃崢爲代表,頭部市場格局已趨近固化。90後一代創業者,拔劍四顧心茫然,很難找到真正的機會,需要等待下一個產業變革窗口期的到來。

移動互聯網的黃金時期進入尾聲後,那些年媒體和科技圈無不認爲區塊鏈會是下一個風口。這個過程北大的孫宇晨(90年人)從幣圈靠割韭菜殺了出來,人送外號“孫割”,最後同樣跑到美國,目前他是特朗普幣(TRUMP 幣)的最大持有者,被稱爲特朗普的榜一大哥。

他走的是一條邪路,也是一條置之死地而後生的不歸路。很多人說何同學是5G的唯一受益者,這話對應到孫宇晨身上也沒錯,他幾乎是區塊鏈的最大受益者。

互聯網的風口來來往往,短暫又輝煌。歷經了區塊鏈、元宇宙、5g的浪潮,現在終於來到了AI2.0時代,標誌性事件是2022年11月30日OpenAI推出ChatGPT。馬化騰在ChatGPT問世後,將AI比做“幾百年不遇、類似發明電的工業革命一樣的機遇”,往後幾年無數人開始摩拳擦掌,試圖在AI2.0時代搶佔先機。

很多人難以理解,近三年爲什麼有人對AI懷着近乎狂熱的追求,乃至把AI當成某種信仰。就90後羣體來說,我很認同一位AI博主給出的答案:“我們90後似乎從未真正分到過時代紅利,如果AI不是我們的答案,那什麼纔是這個時代給我們的機會?”

許知遠有本書叫《時代的稻草人》,把“稻草人”這個概念用來形容90後一代,可以如此歸納:稻草人的現實困境在於它既屬於自由的田野,又懸浮在半空,永遠無法真正紮根。如今他們等來的AI,一塊看似能夠讓他們真正紮根的全新土壤。

文藝青年楊植麟後來走上計算機學術道路,那時他似乎並沒意識到自己能在AI領域取得多大成就。

當戴威在共享單車領域興風作浪時,楊植麟赴美國卡耐基梅隆大學攻讀博士學位,師從蘋果AI負責人Ruslan Salakhutdinov和谷歌首席科學家William Cohen。博士期間,他作爲第一作者發表了兩篇里程碑式論文:Transformer-XL(突破固定上下文長度的語言模型)、XLNet(提出廣義自迴歸預訓練框架)。

這兩篇論文在AI領域影響深遠,引用量超22000次,研究成果被Google PaLM、Meta LLaMA 等主流產品採用,也成爲他通向AI2.0時代的門票。

OpenAI推出ChatGPT後,在循環智能幹了六年的楊植麟內心充滿複雜的情緒,“有點激動,有點焦慮,有點FOMO(害怕錯過),又很興奮。”幾個月後他創立月之暗面,主攻AGI(通用人工智能)領域。

月之暗面這個名字來源平克弗洛伊德的專輯名《The Dark Side of the Moon》,楊植麟把會議室也全部用搖滾樂隊命名,公司裡還放着兩把電吉他,一架鋼琴。可見文青的一面確確實實刻進骨子裡。

樑文鋒憑藉DeepSeek出圈前,楊植麟是最被看好的AI創業者,業界評價他——是堅定的AGI信徒和有技術號召力的創始人,無論是在學界還是商界都地位頗高。據傳,2023年三四月份,字節的張一鳴頻繁約人補AI課,這些人當中就有楊植麟。

他是頂尖計算機專家,又有六年的人工智能創業經驗,這催生出一個技術理想主義者的野心。“AI不是我在接下來一兩年找到什麼PMF(產品市場匹配),而是接下來十到二十年如何改變世界。”去年與媒體人張小珺對話時他說「1」。

改變世界談何容易,放眼全球敢說自己能改變世界的人,似乎只有馬斯克和特朗普。

張小珺爲他的表達捏一把冷汗,認爲他的思考顯得抽象且具有理想主義,擔心他難以在現實主義的中國找到生存空間。媒體人天生的悲觀顯然不會影響到一個看到時代機遇的創業者。悲觀者或許正確,但唯獨樂觀者能夠前行,文藝青年時期的他也許是悲觀的,如今作爲創業者他必須前行。

02

樑文鋒和DeepSeek出圈,讓紅極一時的月之暗面迅速黯淡下去,楊植麟前行的道路受阻。同爲廣東人,兩人的命運在幾天內就出現了明顯的分野。

月之暗面成立於2023年4月,DeepSeek成立於這年7月,起步時間相差無幾。相比85後梁文鋒,楊植麟更年輕,計算機學術成就也更大。研發大模型之前,樑文鋒作爲幻方量化的創始人,主導公司的AI技術研發與戰略方向,楊植麟也在人工智能行業有多年經驗。

之前我寫過清華姚班的天才爲什麼沒能成爲AI時代的主角(清華姚班的天才們,爲何成爲AI時代的失意者),最終歸因於姚班人對技術的路徑依賴,商業能力稍弱。如今想想這個歸因的確過分單一,楊植麟30歲之後創立的月之暗面,無論技術還是商業經驗都相對豐富,最後卻沒能取得DeepSeek的成績,當中一定有更復雜的原因。

憑藉過硬的學術能力,楊植麟在AI領域找到生存空間問題不大。月之暗面創立之初就獲得2億美元的融資,來自紅杉中國和真格基金。第二年,又接受了美團、阿里、騰訊、小紅書等互聯網企業的戰投。

創業拿投資是再正常不過的事,問題是怎麼拿,拿多少,還是完全不拿。張一鳴創辦今日頭條之初,一再強調今日頭條是非主流,要保持非主流的獨立存在,不希望被迫站隊(當時的BAT大廠)。原因很簡單,一旦站隊就會樹敵且容易引發輿論。

去年4月多家媒體報道,楊植麟在月之暗面完成阿里領投的10億美元融資後,通過老股交易套現數千萬美元,金額據傳達4000萬美元。雖然月之暗面迴應消息不實,陷入輿論漩渦也會影響公司的注意力。

2024 年初,與楊植麟之前的公司循環智能股東(包括金沙江創投)之間的股權糾紛,也讓他焦頭爛額。該糾紛的核心在於月之暗面成立時,未能明確月之暗面與循環智能的人員股權和產權歸屬。循環智能及其投資方認爲月之暗面使用了前公司的資源,並因此提起仲裁訴訟,要求獲得月之暗面的股份「2」。

這也引發了外界對楊植麟處理合作關係和資產剝離能力的質疑,不管怎樣,對初創公司來說無疑一種極大的消耗。

楊植麟所謂十年二十年改變世界只是一種理想,隨着巨頭的發力,AI創業的窗口期一定會非常短,往往在三兩年大概就能定下格局,真正的機會只能靠極短的時間去爭取。整個2024年,月之暗面被這兩件事牽扯,難免會影響公司在技術研發上投入的時間和精力。

當年12月6日,楊植麟還發布1300字的長文迴應金沙江創投合夥人朱嘯虎。如果知道基座大模型一個月後即將迎來“deepshock”,敘事走向可能會完全不同。

相比之下,DeepSeek出圈以前一直保持一種非主流的狀態,拒絕外來投資,以免被幹擾,這爲他們騰出時間悶聲鑽研技術,可以心無旁騖地在技術深水區裡下猛料。而且樑文鋒對公司掌握着絕對的控制權,他通過多層有限合夥嵌套,以1%的直接持股和間接持股控制杭州深度求索84.3%的股權,避免了股權分散造成的影響。

技術尚未形成護城河前,去年楊植麟還把很大精力放在了投流上。僅2024年3月至8月,Kimi的廣告投放金額就高達1.4億元,單月最高投放近5000萬元。也見到了成效,Kimi的月活在短短半年內從400萬飆升至1282萬「3」,穩居行業第二,僅次於百度文小言。

Kimi如此大規模投流並非完全是爲了搶佔市場。按照楊植麟的說法,投流實際上是爲了獲取數據和擴大數據樣本,如何在收集數據基礎上去篩選數據、運用數據,才最終決定了Kimi們能生長成爲什麼樣的AI助手。

通過用戶擴大數據來源,這一邏輯源於大模型對高質量、精準反饋數據的依賴性,用戶在使用過程中產生的交互數據,能夠反向優化模型的推理能力和場景適應性。

楊植麟認爲,大模型訓練要遵循Scaling law(縮放定律/規模定律)的第一性原理。Scaling law是指,隨着模型規模(參數數量)、訓練數據量、計算資源因素的增加,模型性能通常會按照某種可預測的規律提升。這幾乎是當時行業內的共識,大家都知道的事情,也意味着在用這個方法卷模型性能並不新鮮。

2024年Kimi大規模投流並獲得一定量的用戶留存後,產品形態卻未實現重大迭代,僅個別功能更新。

Kimi團隊規模始終在兩百人以內,與動輒數千人的大廠研發部門相比,其技術迭代速度明顯滯後。更致命的是核心人才的流失,2024年下半年,多名算法工程師離職。楊植麟給的解釋是沒有人才流失,而是主動做了業務減法,不希望團隊擴大,認爲這對創新有致命性傷害。

楊植麟與樑文鋒的競賽進入衝刺階段,是在去年9月。當時OpenAI正式推出了o1系列的兩款模型o1-preview 預覽版和o1-mini 迷你版,o1-preview 成爲全球首款推理模型,它定義了現代AI推理模型的核心特徵,如長思維鏈和強化學習訓練。這意味着此後大模型公司,必然都會沿着這個思路推出自己的推理模型。

這場競賽的結果是,今年1月20號DeepSeek R1 和Kimi1.5 兩個推理模型同一天發佈。取得的反響完全不同,DeepSeek R1震驚全球,完全掩蓋了Kimi1.5的風頭。小步慢跑的Kimi,輸給憋出大招的DeepSeek。

論成敗多少會顯得刻薄,這裡只分析技術問題。楊植麟似乎進入一個誤區,DeepSeek R1的技術路線,證明楊植麟堅信的“Scaling law”這個模型訓練的第一性原理,並非唯一。

圖靈獎得主楊立昆曾說,從突破性創新角度來看DeepSeek並不出色,但是在低成本、開源、多個任務上的推理性能表現很不錯。

DeepSeek的轟動性幾乎超出了所有業內人的預期,甚至楊植麟也不例外。在DeepSeek R1發佈同日,楊植麟也推出首個通用推理模型K1.5,但也沒能預料到大模型格局會就此改變。

因爲不開源、以及更注重通用推理能力和多模態,在chat 特定推理任務上的表現力不如DeepSeek,Kimi的模型性能完全被單模態的DeepSeek R1光環遮蓋。也因此有了大模型“六小虎”終章的說法。

DeepSeek上線一個月,圈粉上億(下載量)。樑文峰的技術路線也證明,楊植麟通過大規模投流爭奪用戶,對提升模型能力來說收效甚微。

03

這場競爭是技術理想主義與商業現實主義的較量。

楊植麟的理想主義,是希望探究有效的產生智能的方法,探索智能的上限,最終實現AGI。現實是,通往AGI的這條征途上會非常漫長,也需要從基礎設施到技術上的範式轉變。

如果過度專注AGI,不僅可能會造成產品迭代緩慢,也可能因爲缺乏成功的商業化應用,無人願意爲其理想主義買單。

曠視科技的創始人印奇是楊植麟的清華學長,在跨越AI的兩個時代後,他從純粹的技術信仰者轉身開始思考商業閉環。印奇在與《晚點》對話時坦言,技術和科研無法獨立長久存在,必須與客戶價值和商業模式相連接,沒有人會永遠爲“信仰”買單,閉環纔是可持續創新的前提。「4」

張小珺那句:擔心他(楊植麟)在現實主義的中國難以找到生存空間。像是一個預言。楊植麟的技術理想與商業化落地之間,有一條寬闊的鴻溝。這條鴻溝正是所謂的現實主義。

最初Kimi通過提供基礎功能的免費服務吸引用戶,例如長文本處理、代碼編寫、聯網搜索等,滿足大多數用戶的日常需求。去年5月開始,Kimi針對用戶在基礎功能之外的需求(如更高性能、優先使用權等)推出付費版本,例如高峰期優先使用權,用戶可通過打賞獲得高峰時段的優先使用權限。本質上這是對ChatGPT付費模式的一種變形。

現實主義中國的情況是,人們普遍沒有付費訂閱的習慣,想賺C端的錢註定難如登天。

去年7月Kimi上線了瀏覽器插件,試圖通過豐富應用場景,進而探索潛在的商業化機會。8月Kimi發佈了企業級API,主要面向具有一定規模化業務的企業,爲對穩定性要求更高的大企業客戶提供API服務。這是Kimi從專注ToC應用變爲同時兼顧ToB業務的一個關鍵信號。問題是技術沒有形成壁壘,這些商業試探的效率也不會高。

相比之下,DeepSeek的商業化路徑極爲清晰,以技術開源與低價策略爲核心,精準卡位B端市場。DeepSeek開源策略並非單純技術輸出,而是通過開放部分代碼吸引開發者,同時保留核心算法的封閉性,形成“開源引流 - 定製收費"的商業模式。

這種模式不僅降低了市場推廣成本,還通過與雲廠商深度綁定,如阿里雲、騰訊雲、華爲雲等將DeepSeek模型集成至其AI平臺,提供 SaaS 化服務。DeepSeek的API調用價格僅爲行業均值1/5的低價策略,這讓它快速佔領市場份額。

同爲廣東人的樑文鋒,在公開場合中被塑造成技術理想派,但實際上,他也是典型的商業實用主義者。他深諳AI產業的法則,通過壓縮成本、開源引流、生態協同等策略,快速構建商業閉環,在金融、遊戲等領域實現規模化落地。

這一切都是建立在技術領先的基礎上,AI創業者失去用戶會失去市場,但失去技術很可能失去一切。去年7月,樑文鋒與《暗涌Waves》溝通時,提到最多的兩個字就是——創新。

朱嘯虎曾說:“AI創業者要勇於承認自己沒有壁壘,有任何技術壁壘都是騙人的,就是靠底層模型提供能力,但可以更懂用戶,更懂產品,可以在非AI的能力上建立壁壘。”這套說辭在移動互聯網時期或許正確,AI時代模型能力不行再怎麼懂用戶也不行。

DeepSeek火爆以來,Kimi的月活用戶隨之流失,從去年11月的3600萬腰斬到今年3月的1820萬,被DeepSeek(1.87億)、豆包(9980萬)和騰訊元寶(2358萬)甩在身後。面對頹勢楊植麟並非毫無動作,宣佈與財新傳媒合作,試圖通過垂直領域內容增強公信力,又自建內容社區,在小紅裡開對話框。在模型性能沒有很大提升的情況,這些措施看上去已經擁抱商業,但目前來看尚未見效。

回過頭來看,85後梁文鋒用技術和商業的完美結合,給90後文藝青年楊植麟上了一堂現實主義課程。作爲頂尖名校出身,與圖靈獎獲得者合發論文,楊植麟的學術背景優於樑文鋒。但他的技術理想主義把自己推向雲端,在月亮和六便士之間,他選擇了月亮的暗面。

再從代際上看,樑文鋒只比張一鳴小兩歲,他們纔是同一代人,樑文鋒的成就也是80後創業成功的典範。兩年前他說的那句:“務必要瘋狂地懷抱雄心,且還要瘋狂地真誠。”似乎最能代表他的創業理念。

單從商業模式的成功來衡量,上個互聯網風口80後最突出的商業人物分別是字節的張一鳴和拼多多的黃崢,兩人的理念完全不同。張一鳴的理念是敢爲天下先,愛拼纔會贏,最終締造出抖音帝國。黃崢受教於段永平,胸無大志,敢爲天下後,同樣把拼多多做到了萬億市值(人民幣)。

成功並非只有一條路徑,他們都用自己獨特的商業理念開創一條嶄新的商業模式。

相比之下,目前來看90後一代,被商業磨礪的時間尚短,不足以摸索出一套適合自身的商業打法。至今還沒出現一個具有開創性的商業領袖。如果AI真的是這一代人的答案,至少,幾個月前楊植麟曾是那個最接近成爲新一代商業領袖的人。

DeepSeek火爆也激發出大廠的勝負欲,近兩個月,百度、字節、阿里、騰訊頻繁迭代模型,進入5月,微軟開發者大會用50個新產品全面押注Agent,Google I/O 2025開發者大會宣佈,全面重塑AI生態。巨頭們競爭白熱化,或讓Kimi以及其他六小龍這類中等規模AI公司直接面臨更復雜的生存問題。

六小龍中最早掉隊的零一萬物創始人李開復,3月曾直接回應,中國市場最終可能只有三家能夠真正站穩腳跟的大模型提供商,分別是DeepSeek、阿里巴巴和字節跳動。

強者吞掉弱者一直都是商業的主流敘事,殘酷而無趣,人們反而更喜歡以弱勝強的商業敘事。事實上這樣的故事也並不罕見。

20世紀80年代,全球計算機巨頭IBM主導企業級市場,而蘋果電腦只是個初創公司,後來喬布斯提出個人電腦的概念,如今誰人不識MacBook。特斯拉之前,豐田、通用等傳統車企佔據全球汽車市場90%以上份額,馬斯克跳過燃油車存量市場,用電動車和智能駕駛建立技術壁壘,市值一度超過全球九大傳統車企總和。

儘管巨頭壓制,又被DeepSeek反超,月之暗面並非全無機會。作爲同一代人,也作爲一個商業觀察者,很希望他能在第一輪的競逐失敗賽中逆勢成長,開創出獨屬自己的道路。

最近和很多大模型領域的研究人員聊,很多人認爲現在的大模型transform架構仍然存在幻覺等難以迴避的問題,未來可能會有新的架構,顛覆現有的能力。這意味着,屬於楊植麟和90後AI創業者的機會依然存在,AI依然是90一代人的答案。

也許楊植麟的底色仍是那個文藝青年。他喜歡的專輯《The Dark Side of the Moon》裡的第一首歌是《Speek To Me》,最後想把這首歌中一段十分應景的歌詞送給他:不要坐下,挖到另一個的時間到了,存在的越久,飛得越高,只有駕馭那浪潮的時候,才能在巨浪中取得平衡。

參考資料: