對話開源中國馬越:DeepSeek不是國運級的創新,年輕人才是
文|鄧詠儀
編輯|蘇建勳
如果說關於DeepSeek的討論已經過於氾濫,開源也許是當下依然值得討論的主題。
長期以來,在國內談起“開源”,都會無可避免地陷入一種尷尬的語境。
它當然是理想主義的。“開源”背後的自由、開放特性,被普遍認爲是互聯網精神的外化——源代碼向公衆開放共享,且允許在遵循特定許可證條款的前提下,對軟件進行自由使用、修改和二次分發。
最知名的開源項目“Linux”是操作系統的內核,催生了數以千萬計的開源軟件,這是互聯網世界的根基。
但它的背後經常跟着一個問題:爲什麼要開源?怎麼考慮開源之後的商業化?哪怕到DeepSeek爆火的現在,也很難有人給出完美的答案。
開源中國董事長馬越,是最有立場談國內開源歷史的人之一,他在這條路上走了18年。
2008年,馬越從硅谷回國創業,先是成立了“恆拓開源”——用開源軟件幫助企業擺脫數據庫、ERP等大型軟件的束縛。
但很快他就發現,這種方案很難擺脫To B項目制的重投入,還很容易做成外包公司。
隨後,馬越選擇收購“開源中國”這個社區,開始了一段曲折的創業路——“開源中國”經歷過數度轉型,從開源社區,拓展到代碼託管、代碼工具鏈,在探索商業化期間,經歷了從母公司剝離獨立發展,2019年被百度戰略控股,最後,又在中美競爭、國產替代浪潮中決定重新獨立發展,謀求上市。
做開源社區需要大量的資源、資金投入,在開源中國最艱難的時候,馬越揹負的個人債務最高達1.8億元。
1972年出生的馬越,有着一種老大哥式的坦率。他絕沒有賣苦的意思,但你很容易從他的敘述中,體會到經歷這些坎坷過後的幽默——他表示,在中國做To B就是“城市包圍農村”,企業軟件就是管理者智慧的固化。當中國的企業發展階段還在初期,“你很難要求大家還沒吃飽喝足的情況下,去做開源。”
但這些時刻都已經過去了。開源中國也已經摸索出一條更適合自己的、中國式的開源道路。
現在,開源中國已經成爲全球第二大的代碼託管平臺,匯聚了超過1800萬開發者。其自主研發的DevOps工具鏈已在金融、軍工等關鍵領域,達到80%的市場滲透率。2024年,開源中國的營收已超過2億元。
《智能涌現》獲悉,「開源中國」近期正式完成數億元C輪融資,由北京信息產業發展投資基金(北京信產基金)領投,深報一本股權投資基金(深報一本)及北京上河動量私募股權基金(上河動量)跟投。
至此,開源中國已累計獲得超16億元戰略投資。
△開源中國董事長馬越 圖源:開源中國
馬越認爲,哪怕在全球範圍內,開源也不是件容易的事情。他以GitHub舉例:從2008年成立開始直到被微軟收購,在2022年ChatGPT爆發後推出Copilot,纔算是正式證明了商業化潛力。
“開源是強者和富人的遊戲。”他說,上一代人都成長在物質更短缺的年代——商業社會也是如此,企業要先賺夠了錢,纔有餘裕考慮是否開源,做一些人人爲我、我爲人人的好事。“吃飽了飯,纔能有力氣談開源。”
這就不難理解,即使DeepSeek的爆火爲全中國都打了一記強心針,馬越的觀點依然是冷靜的。他認爲,DeepSeek很難根本性改變國內軟件生態的問題,這是一個時代的侷限。
而想要在開源路線上有所成就,這要求新一代的開發者,從Day 1就開始出海,像DeepSeek一樣去全球市場中競爭。
如果說DeepSeek改變了什麼,更多的都是文化和價值觀層面的事情。“十年前大家普遍不理解開源,覺得開源是一羣草根做的事,現在全社會都能認識到,開源等於創新。”馬越說。
以下爲《智能涌現》與開源中國董事長馬越的對話,經編輯:
DeepSeek不是國運級產品,年輕人才是
《智能涌現》:開源中國現在是第二大代碼託管平臺,國內最大的開源社區。DeepSeek的熱潮,對你們的直觀影響,是從什麼時候開始的?
馬越:就是他在App Store登頂那會兒。先是V3,然後是R1發佈,一下子就火起來了。我們春節一直在加班,讓DeepSeek首先能在中國生產的GPU上運行,這需要大量工作,我們是第一個在沐曦芯片上部署的。
我們都在調侃,春節就兩件事:DeepSeek、哪吒。DeepSeek就是開源圈出了個哪吒。
《智能涌現》:現在已經形成了一種論調:DeepSeek是一個國運級的產品。但最近你的公開表達裡,似乎對這一點不太認同。
馬越:首先,大模型這個事情,你離不開英偉達吧?其次,你離不開Transformer架構;第三,你採用了蒸餾的思路,這些都不是國內原創的。
DeepSeek本質上是在現有路線上走得最好,實現了彎道超車,這是值得尊敬的。
但是DeepSeek能夠不依靠外部資金支持,也不做任何PR,靠技術就能做到全球頂尖——以樑文鋒爲代表的年輕人崛起,這纔是國運級的現象。
《智能涌現》:那什麼纔算國運級的產品?
馬越:完全原創的技術創新。誰說Transformer就是算法的終局?如果有人用非Transformer方案做出比DeepSeek強十倍的成果,那纔是真正的突破,那是人類級的進步。
《智能涌現》:DeepSeek給開源生態最大的啓示會是什麼?
馬越:讓全社會認識到:開源等於創新。
DeepSeek最令人唏噓的是,在國內兩年都默默無聞,也不如打廣告的很多大模型公司,直到2024年開始,才因爲技術,因爲開源,被美國人超級關注——雖然一部分人特別支持,一部分人極力貶低,這種關注反而倒逼着國內形成了一種愛國情懷。
《智能涌現》:以前大家不相信這個觀點嗎?
馬越:以前很多人認爲開源就是一幫草根、烏合之衆,很難和大廠這種正規軍相比。
其實二十年前我就在說這些話:開源約等於創新能力,創新能力和國力是映射關係。正是因爲我們有錢了、富足了,纔會有DeepSeek這樣的企業出現。
以前沒人聽,現在有人聽了。
第二點很重要,就是要對年輕人保持敬畏。不只是尊重,而是要怕年輕人,信任年輕人。每一代人都有自己的時代使命,也有時代侷限性。
《智能涌現》:這羣年輕人,或者新一代開源貢獻者,爲什麼能成長起來?
馬越:這種質變是建立在之前充分的量變基礎上的。
這十年要感謝走在前面的互聯網大廠,事實上國內的主要開源力量集中在這些有實力的企業上。包括百度、阿里、騰訊等組織的開源項目,還有華爲的鴻蒙、歐拉等等。他們都是領着工資的員工,在搞這些開源工作,不是純粹基於興趣。
《智能涌現》:DeepSeek證明一件最關鍵的事:通過底層技術突破,就能吸引大量用戶,以及贏得尊重。
馬越:現在我們國家最應該做兩件事:一是牽頭一起開發中國的CUDA;二是讓所有國產GPU都能快速支持這些模型。
說到生態,生態就是要有更多的人蔘與,而且大家都有高度共識。現在最大的問題不是芯片卡脖子,而是CUDA這個生態的制約。中國完全可以開發一套類似CUDA的系統,就像我們有自己的GPU一樣。
開源是富人和強者的遊戲
《智能涌現》:DeepSeek爆火之後,找你討論的人多嗎?大家最關心什麼話題?
馬越:有人問我,DeepSeek會不會給中國To B市場帶來新生機?不可能那麼快。
IT外包的人天價格,20年來的漲幅還不如按摩師。現在外包人天均價一千就算高的了,還有五六百的。你去按摩,現在一小時都要一兩百塊錢。十年前,IT的外包時薪就比不上按摩了,現在差距更大,那是因爲按摩價格漲得快。
中國軟件沒人願意花錢,這是行業發展還不行的核心原因。要等這一代年輕人變成決策者,好時代纔會來。
《智能涌現》:本質還是因爲國內企業發展階段還比較早。
馬越:開源本質上是強者和富人的遊戲。正是因爲我們吃飽喝足了,纔會有DeepSeek這樣的企業出現。上一代互聯網用戶普遍不願意爲軟件和知識付費,騰訊會議掉線了就重連,也不願意買會員。
但這一代年輕人生活富足,你們會改變這個局面。
《智能涌現》:DeepSeek會給上一代To B創業者帶來什麼啓示嗎?
馬越:我覺得他們給創業者帶來兩個重要的啓示。第一是要對錢保持敬畏。創業的目的就是爲了掙錢,談理想和情懷沒意義。
DeepSeek不太需要考慮商業化的問題,是因爲幻方已經解決了這個事情。
上一代的軟件創業者有個致命問題,一心想着燒錢,通過標準化產品打市場,這不是中國市場的運行邏輯,中國最有錢的金主都是大型企業,在中國想要賺錢,不做定製化是不現實的。
中國軟件行業是城市包圍農村,而美國是農村包圍城市,腰部企業數量很多。
《智能涌現》:DeepSeek會改變大家對商業化的看法嗎?開源怎麼考慮商業化,是這個領域的“天問”。
馬越:如果要開源做創業項目,技術必須得硬邦邦。就是和DeepSeek一樣,Day 1就出海,否則在中國太難賺錢了,時代還不夠成熟。
大家總是會舉例,比如紅帽那套模式也能商業化,但是想用這種方式在中國做一個上市公司,還不是這個時代的事。
《智能涌現》:你們自己也經歷了很長一段商業化探索的時期,是從什麼時候想明白要怎麼做的?
馬越:2020年是個重要轉折點。我們那年決定從百度獨立出來,重新謀求IPO。那段時間因爲美國開始在很多尖端技術上斷供,我們想抓住這個機會,真正成爲一個獨立的開源平臺。
想要做真正的本土開源平臺,必須要是徹底中立的第三方,這是選擇重新獨立發展的核心原因。
《智能涌現》:想明白之後,都做了什麼?
馬越:我們現在從社區發展出了三大產品線。
開源中國社區(OSChina)現在已經完全進化成一個AI教育平臺。我們是中國最大的開源社區,有1000多萬用戶。現在我們24人的團隊能創造約5000萬收入,還有淨利潤,這在社區團隊中很少見。
第二塊是代碼託管和研發效能平臺Gitee,現在平臺有3600萬個代碼倉庫,服務36萬家企業。主要提供代碼託管私有化倉庫服務,確保很多中小團隊的代碼安全,客單每年3000塊左右。
從2020年到現在,我們已經能夠提供DevOps 全生命週期國產替代方案,在滿足開發者需求的同時,也建立起一個自主創新、安全可信的本土開源軟件工具與生態。
第三塊是AI大模型平臺“模力方舟”,模型體驗、推理訓練到應用部署等等服務,都會提供。
《智能涌現》:爲什麼會從社區拓展到後來的DevOps,以及AI大模型基座?
馬越:一個開源公司想要成功,靠社區是不夠的,我們需要找一個閉環的商業模式,像GitHub那條路——社區、代碼託管是沒法達到這個目標的。GitHub也是在大模型浪潮來了之後,推出Copilot,才把營收做起來。
以後沒有淨利潤的公司很難在國內上市,所以我一直強調看毛利率和人效,這兩個指標高了,自然會有淨利潤。
《智能涌現》:你們現在的主要收入,來自哪裡?
馬越:我們主要收入來自100家左右的銀行、券商、軍工、製造業客戶,都走大型私有部署形式。中小客戶主要靠SaaS服務。
2024年我們全國訂單超過2億,是一個突破。前年過1億,2024年翻了一倍,還實現了盈虧平衡,這很不容易。
《智能涌現》:主要模式靠服務大型企業的話,怎麼避免走到項目制的老路?
馬越:我們的產品做得很複雜,是因爲中國的大型企業的場景複雜。我們的流程引擎、角色引擎、交互界面、流水線都是可定製的,還能做各種插件,就是爲了保證靈活性。
我們會幫客戶做定製化配置,但是不做二次開發。我們現在330多人,這塊業務佔200多人,但定製化去做開發和交付的不到10%。
第二是我們自己堅決不賣算力,只做第三方,比如給雲廠商導流。
我們現在的路線很清晰:前端社區承載大流量,做開發者工具賣給企業,先To C,再To B,也算是一種產品驅動增長(Product-Driven Growth)的模式。
一起發展,比單打獨鬥強
《智能涌現》:是否選擇開源,企業的考量到底是什麼?
馬越:現在大模型不開源很難。蘋果爲什麼到今天iOS都不開源?因爲硬件生態已經形成壟斷。如果沒有類似這樣的護城河,你不開源,憑什麼在市場立足?
就像我十幾年來一直說的,開源是創新的最佳方法論,也是市場競爭的方法論,是反強權的方法論。你做得好,我們就開源來和你競爭。當年有Unix和Windows,就有Linux;有iOS,後來就有Android,都一樣。
《智能涌現》:你做過很多併購,DeepSeek的成功會改變投資人對開源項目的看法嗎?開源項目的出路會變得寬嗎?
馬越:這也是我想問所有投資人和創業者的問題:投資的目的是啥?到底你希望怎麼賺錢?
上市、被收購、分紅都是一種退出方式。但現在在國內,要麼IPO,要麼死掉,這很殘酷。
中國的開源生態很分散,現在很多創業者缺乏一種共識,就是一起發展比單打獨鬥強。很多人把創業當作獲取情緒價值的方式,就想當老大,寧可公司死也不願意賣給別人。覺得賣了就是投降,這坎兒過不去。
如果放不下自己的ego,最終就會害了自己,也害了客戶和投資人。
《智能涌現》:DeepSeek大獲成功之後,你怎麼評估現在我們所處的AI發展階段?
馬越:如果類比互聯網那個時代,我們還是在大時代的開端狀態,類似當年的撥號上網階段。我從1997年開始上網,下載一張照片要四五天,網速只有28K。但即便如此,我們也覺得很神奇。
現在就像出海探索新大陸,所以創業者只要帶着乾糧上了船,不淹死,就一定有收穫。
《智能涌現》:DeepSeek會怎麼改變現在國內的創業格局?你覺得更利好大廠還是創業公司?
馬越:很難說,可能還是大廠比較有優勢。
首先,DeepSeek不是一個創業公司,人家不用外部資金就能買一萬張卡,某種程度上也算個小大廠了。
我覺得DeepSeek給創業者帶來兩個重要的啓示。第一是要對錢保持敬畏。創業的目的就是爲了掙錢,談理想和情懷沒意義。
初創公司除非在算法、技術底層有突破,否則在工程層面,很難跟大廠拼數據,拼流量,這是最終商業化的兩個要素。
《智能涌現》:現在的大模型初創的轉向都很明顯,方向聚焦,專心做底層技術。
馬越:這就是開源的可怕之處。
我前年就說,預訓練是大廠的遊戲,創業公司應該做垂直領域的訓練,把更多精力放在推理上,燒錢的事情本來就不該做。
歷史上都有很多例子,當年開源領域有很多做容器的公司,比如Docker剛出來時只是各種容器運行時技術中的一種。結果K8s生態起來之後,任何容器技術只要實現K8s兼容性,就可以融入雲原生技術棧,這種強大的生態整合能力最終使其它技術方案逐漸邊緣化,相當於前邊都白做了。
所以我給大家的建議,包括我們自己的策略,就是產品功能要緊跟隨,但要輕投入,商業模式要做輕一點。
《智能涌現》:對開源中國來說,未來的目標會是什麼?
馬越:開源中國這十幾年,積累了用戶流量護城河,客戶品牌美譽度,現在是通過信創找到了快速增長的收入模式。
我們在這輪融資之後,也會開始尋求進一步上市,希望成爲A股人工智能開源第一股。
歡迎交流