中國大模型這一年:錢、場景與未來
文 | 山核桃
臨近年末,不少科技公司與媒體都開始籌備年底總結。恰逢chatGPT誕生一年,「硅基研究室」和不少業內人士在交流中也發現,比起去年想要迫切追趕的焦慮,今年大家的態度似乎都慢慢迴歸於冷靜。
總結來看,談概念的人少了,談落地的人多了;說理想的少了,想如何賺錢的人多了;標榜自己是「中國的OpenAI」的人少了,講商業模式和付費能力的人多了。
據自媒體「光錐智能」的統計,2023年八個月內就誕生了238個大模型,基本每隔一天中國就會官宣一個新的大模型,這樣的「中國速度」令隔壁的硅谷都汗顏。
但回到現實,我們更應關注的是一年多來,在AI世界裡,中國的投資人和中國的大模型廠商究竟幹了些什麼?又將帶來怎樣的改變?
看中國AI發展到哪一步了,先看「聰明的錢」的流向。
回顧過去一整年,儘管投融資行業整體收斂遇冷,但AI依舊是熱門賽道。根據根據 IT 桔子的數據,截止到2023年11月20日,今年中國人工智能賽道在一級市場的總融資事件數依舊達到了530起,總融資交易額估算有631億元。
而在這之中,也誕生出一批備受矚目的AI獨角獸企業,最火的就要數百川智能、智譜 AI、零一萬物、Minimax 名之夢這4家企業,而他們背後站着的不僅是諸多明星機構,還有大廠們間的聯盟。
從投資邏輯來看,投早、投貴成爲了典型的趨勢。不少投資人也向「硅基研究室」提到:“好的項目還是太少了。”
在騰訊科技Hi Tech Day暨2023數字開物大會上,英諾天使基金合夥人王晟也觀察到了類似的趨勢:“今年AI投資顯著的特點,導致大家投的項目都是高度集中的,都是最貴的,所以很顯然都是要投得更早一點,稍微差一點就會變得非常貴。”
背後的原因也並不難理解,一是算力的掣肘下,並非所有玩家都又能力大力出奇跡。二是隨着技術週期的變化,AI競爭也逐步邁入強調商業化與商業場景的階段。
根據Gartner提出的「技術成熟度曲線」理論,目前生成式AI處於「泡沫巔峰期」,需要更多商業場景落地才能實現技術的規模化應用。
昆仲資本投資副總裁陳希就觀察到,AI大模型在今年上半年和下半年還有比較大的變化。“上半年特別熱,下半年相對來講投資人會變得稍微冷靜一些。”他也表示,市面上很多項目估值存在比較高的溢價,目前投資人還是期待很多新的商業機會和商業前景出現。
另一個關鍵問題也隨之而來,投早投精投貴也就意味着AI大模型創業面臨更激烈的挑戰。這之中,創業者始終會被拷問一個問題:如何與大廠競爭?
從部分投資人與企業的觀點,我們也發現了當下的兩點共識:
首先,大廠的優勢是相對的,但不是絕對的。 “因爲算力問題,大廠的優勢可能是被放大了,這是我們認知的事實,長期而言,我們看到的是由於大廠的算力和先發優勢。”在騰訊科技Hi Tech Day暨2023數字開物大會上,崑崙萬維董事長兼CEO方漢這樣談到。
其次,創業公司更應做的是「破壞式創新」。 大廠在過往競爭中所形成的路徑依賴並不能實現一家通吃,大廠往往需要追求業務的穩定性與長期性,從這一點來說,做高度不確定的事——這種機會屬於創業公司。
“所有的創造性破壞都是小廠搞出來的,今天的大廠都是過去的小廠,破壞了過去舊的產業結構就會成爲大廠。”王晟這樣說。
前不久,斯坦福華人博士的AI視頻創業項目Pika 火遍全網,一時間也引發了科技圈的反思:爲什麼我們總是做不出來殺手級應用?
事實上,在討論AI大模型時,我們總會提到兩個方向:一是B端,另一個是C端。但事實上,B端和C端的界限其實非常模糊,比如ChatGPT的ChatBot交互,MidJourney、Stable Diffusion,本質上都是先讓C端用戶玩起來,然後在B端產生價值。
從移動互聯網到大模型時代,過往一年中,人們都在期待「殺手級應用」的誕生,但其實產品寥寥,背後的關鍵原因,一是我們錯誤地理解了「殺手級應用」的含義,二是很多企業根本找不準PMF。(Product / Market Fit,產品市場匹配)
所謂的「殺手級應用」,看似是短暫的爆紅,但更應被定義爲是否形成高頻使用,形成用戶粘性。如何形成高頻使用?還需回到第一性原理——迴歸產品,找準PMF。
木牛機器人的創始人郭林認爲,更應該從「產品視角」出發,更應該用新的供給方式去解決一些麻煩的問題。“在哪些真正具體的場景中,有哪些用戶羣體真正面臨的問題,是靠過去的技術不能解決的,從用戶需求出發,就能產生好的產品,把一個問題解決好就是爆款應用。”
“商業不能光看技術,還要看外面的包裝。”清華大學交叉信息研究院助理教授袁洋,他目前的研究方向是智能醫療領域,他也表達了類似的觀點。
他打了個「賣車」的生動比喻:“賣車最關鍵是車的發動機,但現在賣車還賣很多別的,包括內飾和造型,這些其實是一種包裝。發動機在外面加上品牌、加上裝飾,最後不只是賣發動機的零件,而是整個車賣很多錢。”
回到大模型本身,必須深入場景,去更好地「包裝自己」,才能具備更大的商業價值。
除了找準PMF外,大模型賦能場景,是一件循序漸進的事,是一件「急不來」的事。 特別在「難啃的硬骨頭」,如在工業製造業領域,如何將技術落地複雜的工業場景與具體的生產流程,都是一場硬仗。
通用大模型雖然已經很好,但面對專業領域、專業知識還是相對匱乏的,能力也是需要提升的。
在騰訊科技Hi Tech Day上,思謀科技SmartMore聯合創始人劉樞提到了這一點:“通用大模型雖然已經很好,但面對專業領域、專業知識還是相對匱乏的,能力也是需要提升的。”大模型領域的「幻覺」問題一直被反覆討論,在工業製造業這種嚴肅精密場景,「幻覺」所帶來的往往是不可估量的損失。
算力、算法、數據,是AI時代的核心三要素,不少業內人士此前也向「硅基研究室」提到,「結構化、更高質量的數據」是工業製造業場景的核心壁壘之一。中工互聯科技集團也同樣深耕工業大模型領域,董事長智振提到,他們整一年都在做深入的思考,如何解決大模型存在的諸多不確定性。
他提到,目前不光是中國,國外大模型理論也沒有怎麼搞明白,所謂的幻覺問題。“現在很多東西還是從外部工程的角度去嘗試,怎樣提高確定性,這是一個技術創新方面的問題。”
而隨着AI浪潮的涌來,帶着「後視鏡」去眺望AI未來,每一個身處其間的人應該關注什麼?這同樣是一個值得思考的未來之問。
過去一年間,無論是個體、企業抑或是國與國間的競爭,AI所帶來的改變是深遠的,所帶來的挑戰也是嚴峻的。
大洋彼岸外,從OpenAI「宮鬥」所爆發出的保守與激進兩個陣營間的路線之爭就能看出,如何規避AI風險,解決相關倫理問題,某種程度上,將這些問題前置,也是在競爭中搶佔話語權的體現。
比如在數據層,中國人民大學交叉科學研究院院長、教育部長江學者、特聘教授楊東就認爲,過去移動互聯網時代,中國存在嚴重的數據風險主義。大模型不能及早地產生和發展的根本原因在於數據沒有互聯互通。本來在移動互聯網時代的先機,包括海量的數據、豐富的場景、信息的舉國體制等是非常好的優勢,但在進一步的數據共享、數據開放方面是落後的,導致大模型訓練需要的語料、數據的基礎設施比美國落後。
因此,楊東教授認爲,當務之急就是要把數據資產、數據場景、數據價值的實現機制,包括價值實現以後的利益分配機制優先考慮建立。
詩人博爾赫斯曾說過:“時間永遠分岔,通向無數的未來”。某種程度上也可以成爲這個技術新時代的註解。人們總會短期高估技術的影響,長期低估技術的魅力,只有經歷一個從神化到祛魅的完整過程,纔會看到技術的新可能。
而對中國大模型而言,經歷了一個完整週期的2023年,熱鬧過,痛苦過,也激動過,面對新的2024,我們有理由相信,中國大模型會更有自信,也更有底氣。