觀察者網》DeepSeek開啓新「下海」時代——再談AI正在成爲國運之戰(晨楓)
DeepSeek打破了人們的諸多迷思,帶來新的自信和可能,開啓中國的新「下海」時代。(資料照/澤東電影、MyVideo提供)
DeepSeek突然成爲炙手可熱的全球性話題,不僅因爲其以低成本實現了「以小搏大」,其成功故事也成爲中國國運的寫照。
簡單來說,人工智慧可能像幾十年前開始的晶片控制和數字化一樣,將深植於幾乎所有新科技的創建和老科技的升級之中。但低成本帶來質變,不只是量變。
汽車是德國的卡爾•奔馳發明的,但在美國的亨利•福特發明流水線、海量生產低成本的T型汽車之前,汽車只是有錢人的玩物、豪華馬車的代用品。在福特之後,低成本汽車迅速改變了人們的生活方式,也在本質上重塑了世界經濟,成爲世界經濟和政治中心從歐洲轉移到美國的重要推手。
低成本人工智慧有望起到類似的作用,DeepSeek的開源路線和「蒸餾技術」使得「白菜化人工智慧」成爲可能。
再通用的大模型也會是「萬寶全書缺只角」,開源路線使得其他人可以在開源構架上打造自己的人工智慧應用,「蒸餾技術」則可以用小模型去蕪存菁地保留需要保留的方面,有針對性地加強大模型不足之處,進一步縮小模型,降低訓練和運作的門檻。
開源模型不是DeepSeek發明的,但DeepSeek把開源人工智慧推到前所未有的高度,並且提供了基本的開發工具包。相比之下,OpenAI、Anthropic、Google都是閉源的。
開源vs閉源,或者更加廣泛地說,開放架構vs閉合架構,是資源科技發展史上幾番出現的主題。如今人們只說PC,已經忘記IBM是PC架構的開創者。差不多同時,蘋果推出自己的架構,其實還有Atari、Commodore、Next、Sparc等其他架構。
最後,PC所代表的開放架構勝出,因爲開放架構可以調動幾乎無限的資源,爲相關生態添磚加瓦。這種乘數效應是靠一己之力的閉合架構無法比擬的。開放架構與寄生開發是共生、共榮的。
在軟體方面,與PC對應的是從DOS到Windows的開放式發展道路,同樣打出比iOS更大的天地。實際上,iOS已經在相當程度上開放化了,更像「不一樣的Windows」,而不是蘋果獨佔的軟體生態。
PC和WinDOS架構是爲家用電腦推出的,簡稱WinTel架構。在今天,網路化和高性能化使得WinTel不僅繼續「霸佔」家用市場,也逐步取代了專業應用與工業控制和武器控制過去常用的專用架構。計算機輔助設計(CAD)和數值分析早就不用專用工作站了,而是在WinTel上運行。工業計算機控制系統(DCS)用服務器級的PC和工業規格的顯屏(更加長壽、可靠),但在架構上與辦公網路沒有本質區別;機場航管甚至「宙斯盾」系統也用WinTel架構,以至於早年Windows NT的故障曾經使得香港赤臘角機場和美國海軍「協同作戰能力」宕機。
在安卓vs蘋果時代,開放架構再次勝出。蘋果有大批鐵粉,但安卓的市場份額更具有決定性。
開源不是完美的,容易有升級路線和相容性問題,但開源無疑具有更加強大的生命力。閉源有性能可靠和相容性有保證的優點,所以依然佔有一席之地。但在幾乎所有市場上,開源的份額都決定性地超過閉源。
這一大趨勢將大概率在人工智慧上重演,而DeepSeek及其代表的中國式高性能開源路線,正在引起美國的深深憂慮。
美國繼續死抱「小院高牆」思維,閉源是主流思維,一方面控制人工智慧的發展方向和速度,另一方面獨吞人工智慧的經濟效益。
但有了開源、低成本平替,「小院高牆」可能成爲死路,至少是支路。既然最好的開源技術來自中國,美國的開發界就將基於這些技術構建他們的系統,成爲中國領導的人工智慧生態的一部分。開源的活躍性和包容性將進一步擴大人工智慧生態的影響,使得中國成爲世界新科技的中心——這對美國霸權而言,是巨大的危險。
開源也意味着新經濟。比如說,私用的購物和生活小幫手需要海量的公域數據,每人每家的小幫手都到網上「搜刮」差不多的數據,這是巨大的浪費,也是巨大的成本。專業的「公域數據批發商」可能應運而生,集中「搜刮」公域數據,提供雲服務,用於訓練私用小模型。
相關的小模型訓練也會應運而生,好比人工智慧時代的雲上「馴狗師」,幫助個人用戶訓練、調整、更新私用小模型。
一方面,這依然把隱私和數據自主交給了「別人」,另一方面,這個「別人」是自己可選的,而不像平臺,沒得選。如果有足夠的自信和技能,自己動手也可以,那就沒有「別人」的問題了。
小模型和大模型也是相輔相成的,這是自駕和公交的關係,不是相互替代的關係。
人工智慧可能意味着顛覆性的科技發展,意味着全新賽道,意味着重新洗牌和重拉起跑線。在航空科技的歷史上,噴氣時代就是這樣的顛覆性時刻。
蘇聯航空科技的啓動很早,但由於科技實力和綜合國力差別,直到二戰時代,蘇聯航空科技的水平仍不及歐美。但在噴氣時代的重新洗牌中,蘇聯一躍而進入第一梯隊,米格-15和F-86打得有聲有色,同時代的歐洲噴氣機落後了。肯定會有人以米格-15用羅爾斯-羅伊斯「尼恩」發動機來說事,且不說米格-15用的是蘇聯自己的改進型,他們應該說說英國爲什麼沒有用「尼恩」造出至少和米格-15一樣好的戰鬥機。
從這裡開始,蘇聯航空的輝煌一直延續到冷戰結束,蘇-27的篇章至今在中國續寫。
蘇聯科技決策錯誤使得蘇聯錯過了戰後更加廣泛深刻的電子科技和數字革命,經濟和科技的過度軍事化最終限制了顛覆性時刻在更大層面上開花結果。
中國是完全不同的情況。寬廣、深厚、堅實的科技和製造業基礎提供了土壤,龐大、勤勞、聰明的人口提供了水分,以民爲本、「發展是硬道理」的政策提供了陽光,和平崛起、共同發展的基本國策提供了空氣,顛覆性的科技革命就成爲種子,重新洗牌和重拉起跑線就是歷史性的起飛時刻。
DeepSeek創辦人樑文鋒。(翻攝網路)
在社會層面上,DeepSeek也有重大的提示意義。
樑文鋒這個「新杭州人」突然成爲熱點人物。他來自廣東湛江,浙江大學碩士,2008年畢業後留在杭州創業,2015年創立對衝基金「幻方量化」,2019年成爲中國首家突破千億元人民幣的私募量化大廠。2023年全球AI熱潮爆發,樑文鋒宣佈轉變賽道,同年7月成立DeepSeek。
在他的旗下,彙集了一支小而精的隊伍,139名研究人員大多由中國本土培養,其中許多是清華、北大應屆畢業生甚至在讀生。據說,Deepseek「只招1%的天才,去做99%中國公司做不到的事情」。
樑文峰的成就,打破了人們「非北清不能出人才」的迷思。DeepSeek確實招募了很多北清的人,但主心骨並不來自北清。樑文峰是浙大的,按照「第一學歷爲王」的思路,被小米用1000萬人民幣年薪挖走的羅福莉是北師大的。北清復交浙科等C9都是中國的頂級名校,但在這小圈子之外,還有更多的優秀高校,有更多的優秀人才,不要被「藍籌股」思維矇住眼睛,而是需要「藍海股」思維。
DeepSeek也打破了「博士纔是人才」的迷思。人才是才華與激情的一體,據說樑文鋒招人最注重的是對事業的激情,否則到大廠撈人才是捷徑。碩士也好,博士也好,真才實學重要,一心要幹事業更重要,否則學位只是學位。
DeepSeek也沒有靠海龜撐臺,有說法統統是中國自己培養的人才。這不僅是對中國高等科技教育的最大認可,也是讓美國教育極度尷尬。從川普1.0到拜登,美國的迫害導致大批中國科學家迴流中國,這股大潮依然在繼續,正常的中美科技交流和留學生學習也受到嚴重干擾。在美國事業有成的中國科學家和歸國留學生對DeepSeek的成就沒有直接貢獻,但對中國其他科技成就和進步的重大貢獻依然是有目共睹的。
美國迫害的理由是杜絕中國「偷竊」美國先進科技。回到中國的科學家帶回了知識和經驗,回到中國的留學生帶回的則是更加基本的教育和訓練,但畢竟都是一次性的,對美國科技人力資源的損害只能希望通過時間來彌補。問題是,當中國在關鍵科技上領先美國後,繼續迫使中國科學家迴流和阻撓正常科技交流對美國就是雙輸了,現在需要「偷竊」先進科技的是美國。
DeepSeek是小公司,還在幻方量化時代就是小公司。不管在淵源上,還是在關係上,DeepSeek都沒有大廠背景,沒有國家隊背景,沒有名師點撥,也沒有名家開路,杭州不是小地方,但也不是北上廣深。DeepSeek爲「小鎮做題家幹出大事業」開了一個好頭。
這是顛覆性的時代,更是知識經濟的時代。有砸錢才能解決問題的地方,更有思考才能解決問題的地方。積累的重要性不再絕對,有思路才更重要。在重拉的起跑線上,靈機一動意味着搶先起跑。這裡沒有發令槍,看好了就自己跑。看不清楚瞎跑也意味着可能掉進坑裡。
知識經濟時代的問題沒有簡單的答案。知識世界是複雜的,OpenAI等「傳統人工智慧」團隊走所有問題一視同仁的大一統路線,典型大模型有多達1.8-2萬億個參數,訓練時要對這些參數統統調整,解算時也需要數據在所有這些參數中「走一遍」,算力要求可想而知。
DeepSeek採用化整爲零、化零爲整的思路,將巨大的問題分解爲既相關又獨立的子問題。較小的子問題只需要較小的模型,但在頂層,有另一個「交通指揮模型」將需要求解的問題導向相關的小模型,對「跨界」的問題則調用若干相關的小模型,並根據與各子問題的相關程度協調子模型之間的解。因此,模型只有6710億個參數,而且任何時候都只有不超過370億個參數激活。這是Deepseek可以用較小算力訓練和解算的關鍵。
這不僅再次說明「蠻幹不如巧幹」的道理,也說明在科技發展出現顛覆性變化的時候,「世界是平的」,輝煌屬於有想法、有準備的人,而並不一定只屬於大廠、國家隊。幻方量化在人工智慧方面植根不久,但此前從事的高頻率交易對計算效率的要求很極端,所以在大模型「巧算」方面的成功並不偶然。中國肯定需要華爲這樣的大廠,也需要科學院這樣的國家隊,但DeepSeek這樣並無業界背景的小廠不僅有機會,還放了一個原子彈。
深厚積累永遠是有用的,但在顛覆性的時代,抓住當下、勇於創新更重要,這本來就是重拉起跑線的意義。尤其應該注意的是,機會常常與困難並存,需要的是珍視機會,不要被困難嚇住。在30年前,「下海」是既驚心動魄又振奮人心的時刻,那是「繁花」的時代,也是大下崗的時代;現在又是「下海」的時刻,是「銀杏葉」和DeepSeek的時代,也是躺平的時代。30年前下海需要的本錢是資金和關係,現在下海需要的本錢更是知識和前瞻。
在「繁花」時代,人們前赴後繼地下海,是看到前人成功,激起「我也能」的自信。在人工智慧時代,DeepSeek是個好榜樣,希望能激起更多初創科技企業的產生,並在融資市場上得到更多的支持。中國製造業已經產生一大批「小巨人」,中國科技也需要一大批「小巨人」。
人工智慧已經顯示了在簡單、重複性腦力勞動方面的能力,只會越來越向高級的方向發展。這可能啓動新的一輪物競天擇、適者生存。未來人類可能會精英化,只有善於學習、永遠思考、不斷進步的人才能生存下來,否則人類的每一丁點進步都很快會被人工智慧跟上,接下來就是平替。
不斷有人詢問,人工智慧發達後,人們是不是每日只需要吟詩作畫了。不是,應該是更繁忙了。在農業時代,人們日出而作,日落而息,但還有農忙農閒。在機器時代,人們披星戴月,常年無休。在人工智慧時代,人們可能不再有上班下班之分,工作與閒暇的界限也模糊了。
這沒有那麼可怕,原創思維不是打螺絲,本來就是不看鐘點的、不看地方的。出思路不一定在坐班時間,更不一定在辦公室。只要出思路,什麼時候、在哪裡不重要,白天在海邊閒暇、晚上在家裡幹活沒什麼不可以。諾斯羅普的首席電磁學家奧希拉就是在看孩子在迪斯尼玩「旋轉茶杯」的時候,捏着橡皮泥,想明白電磁能量從圓鈍表面流向尖銳邊緣然後「流失」的原理,奠定了B-2轟炸機的基本設計原則。奧希拉的時代不是人工智慧時代,但這正是精英化、永遠思考的意義所在。
人們不光要與天鬥,與地鬥,與人鬥,與機器鬥,還要與人工智慧鬥。只有不斷學習,不斷思考,不斷進步,才能使喚人工智慧,而不是被人工智慧使喚。
現在不斷有各種「躺平有理」的論調,但DeepSeek也說明了在中國還是有很多能幹、肯幹、實幹的年輕人。他們充滿激情,不懼權威,開放思想,敢於領先。
國運之戰開始於自強,自強開始於自信。中國的百年恥辱開始於當時對民族、對未來喪失自信。這不是少數領袖人物有自信就夠的,需要全民自信。
在今天,中國人越來越自信了,但一有風吹草動,還是容易自我懷疑,重回不自信。比如說,中國經濟基數大了,按名義GDP排世界第二,按購買力等價GDP排世界第一,發展速度依然在主要經濟體裡領先,根據IMF和中國國家統計局數據,2024年中國GDP增長率比美國高80%,是歐盟的4.5倍,是日本的16倍多。但很多人依然認定「經濟大環境不好」、「不在掙扎中躺平,就在躺平中掙扎」。聽信唱衰或者自我唱衰說到底還是信心問題,渴望領先但不敢領先是最大的缺乏自信。
新中國成立帶來站起來的自信,兩彈一星帶來國家安全的自信,改革開放帶來重立於世界民族之林的自信,「銀杏葉」時刻帶來軍事領先的自信,小紅書大對賬帶來民生和制度的自信,DeepSeek大殺四方帶來科技領先的自信。
同時,DeepSeek的成功故事也可望成爲激勵,讓更多人對時代充滿信心,對未來充滿信心,抓住機會,勇敢創業。
國運轉變是一個過程,而不是一個時刻。只要中國崛起沒有完成,國運之戰就在繼續。中國已經過了彎道超車的時代了,現在是直道超車的時代。中國人從來善於學習,現在需要敢於領先。不僅需要在硬核科技上敢於領先,更需要在心態上、社會和經濟生態上敢於領先。
DeepSeek沒有發明人工智慧,沒有發明大模型,「只是」極大地改善了人工智慧和大模型。詹姆士•瓦特也沒有發明蒸汽機,他「只是」極大地改善了蒸汽機。
在這個意義上,人工智慧正在成爲中國國運的關鍵之戰。(作者爲自由撰稿人)
(本文來源觀察者網,授權中時新聞網刊登)
※以上言論不代表旺中媒體集團立場※