☰

MiniMax創始人閆俊傑：AI將屬於每個人，而非一家獨大｜直擊WAIC

在7月26日開幕的2024世界人工智能大會（WAIC）主論壇上，國內大模型領軍企業MiniMax的創始人兼CEO閆俊傑發表了題爲《每個人的AI，Everyone's AI》的主題演講。

他基於自己的從業經歷，深刻闡述了AI作爲根本性生產力的未來，並給出了一個核心判斷：AI技術最終將由多家公司掌握，走向普惠，而非一家獨大。

AI：更強的生產力與創意

“隨着模型變得越來越好，我們發現人工智能正逐步成爲社會的生產力，”閆俊傑表示。他以科研工作爲例，說明AI已從最初輔助分析數據的軟件，進化爲能夠自動生成分析工具的“AI Agent”，極大地提升了效率。

在創造力方面，AI的潛力同樣驚人。閆俊傑現場展示了AI如何將上海世博會吉祥物“海寶”與武康大樓等城市地標融合，一鍵生成富有時代特色的新形象。

他還提及，過去需要耗時數月、花費上百萬元製作的“Labubu”創意視頻，如今藉助其自研的視頻模型“海螺”（Hailuo），僅需一天時間和幾百元成本即可完成。

據悉，“海螺”模型在過去六個月已在全球生成了超過3億個視頻，這標誌着高質量的創意內容正變得前所未有地普及。

AI的本質：對人類能力的持續拓展

閆俊傑認爲，當前AI產業的變革，並非簡單複製一個互聯網公司，而是創造一種“更基礎更根本的生產力”。他強調：“AI是對個人能力和社會能力邊界的持續增強，並且這種增強是可持續的。”

他透露，在MiniMax內部，AI已深度融入工作流，約70%的編程代碼和90%的數據分析由AI完成。這不僅是AI在輔助人類，更是AI與人類共同進化、共同創造的過程。通過“教AI思考”而非簡單“給AI答案”，以及將AI置於編程、遊戲等可驗證的環境中持續學習，AI正變得越來越專業，其增強潛力“幾乎是沒有盡頭的”。

破除壟斷迷思：AI爲何不會被一家獨大？針對業界普遍關注的“AI是否會被壟斷”的問題，閆俊傑給出了否定的答案，並提出了三大核心理由：

模型對齊目標（Alignment）的多元化：不同的AI公司有不同的價值觀和目標，會訓練出特性各異的模型。有的模型追求成爲“靠譜的程序員”，有的則旨在實現“有情商的交互”。這種目標差異化將催生一個百花齊放的市場，而非一家獨大。

多智能體系統（Multi-Agent System）的崛起：未來的複雜任務將由多個模型和工具協同組成的“多Agent系統”解決，而非依賴單一的超級模型。這會削弱單個模型的絕對優勢，讓系統構建和整合能力變得更爲重要。

開源社區的蓬勃發展：過去一年，開源模型如雨後春筍般涌現，其性能正不斷逼近最頂尖的閉源模型，極大地降低了技術門檻，確保了技術不會被少數公司獨佔。

未來趨勢：AI將更加普惠

最後，閆俊傑分析了AI的成本趨勢。他指出，儘管訓練模型的算力投入巨大，但隨着研究方法和組織效率的提升，訓練成本的增長已趨於平緩。更重要的是，模型的推理成本在過去一年下降了一個數量級，並有望在未來一兩年內繼續大幅降低。

“儘管單個Token會變得很便宜，但全社會使用的Token總量會顯著增加，”他預測。隨着AI解決的問題日益複雜和實用，從聊天機器人到複雜的AI Agent，其算力消耗將呈指數級增長。

“讓每個人都用得起AI，這是我們對AI發展的判斷，也是我們創業的初衷，”閆俊傑在演講結尾總結道，“我們堅信AGI（通用人工智能）一定會實現，並且它一定會服務大衆、普惠大衆。它將屬於多家AI公司和其廣泛的用戶，而不是隻屬於某個組織。”

從閆俊傑的演講不難看出MiniMax對於AI未來的樂觀願景——一個開放、協作、普惠的智能時代，爲當前充滿機遇與挑戰的AI行業注入了堅定的信心。

以下爲分享全文：

大家好，我給大家分享的題目是《每個人的AI，Everyone's AI》。講這個題目，跟我個人過去經歷有關。當Hinton先生開始設計 AlexNet 之時，我是國內第一批從事深度學習研究的博士生；當AlphaGo人機大戰上演，也是人工智能走進所有人視野之時，我在參與一家創業公司；而當ChatGPT出來的前一年，我們開始創立MiniMax，也是國內第一批大模型公司。

在過去的15年裡，當我每天面對任務寫代碼，看論文做實驗的時候，一直都在想一件事：如此受關注的人工智能到底是什麼？人工智能跟這個社會到底有什麼樣的聯繫？

隨着我們模型變得越來越好，我們發現人工智能正逐步成爲社會的生產力。比如，我們在做人工智能研究的時候，每天需要分析大量的數據，一開始我們需要來寫一些軟件來分析這些數據，後續我們發現其實可以讓 AI 來生成一個軟件，來幫助分析所有數據。作爲一個研究員，我非常關心每天AI領域的所有進展，一開始我們設想，是不是可以做一款APP，來幫我們追蹤各領域的進展？後面我們發現，這件事也不需要自己來做，讓一個 AI Agent 來自動跟蹤更加高效。

AI是更強的生產力，也是越來越強的創意。比如，15 年前上海舉辦世博會的時候，有一個非常火爆的吉祥物叫“海寶”。過去 15 年，上海有了全方位的發展，我們如果想繼續用“海寶”IP生成一系列更具上海特色，符合時下潮流的衍生形象時，AI 可以做得更好。正如現場屏幕展示的，徐匯書院×海寶、武康大樓×海寶，AI 能一鍵直出，幫我們生成各種各樣的創意形象。

再比如最近非常火的Labubu，此前製作一個Labubu創意視頻，可能需要兩個月，花費大約幾十甚至百萬人民幣。通過越來越強的AI視頻模型，像大屏幕右邊展示的Labubu視頻，基本一天時間就可以生成出來，成本只有幾百塊錢。

過去六個月，我們的視頻模型海螺（Hailuo）已經在全世界生成超過3億個視頻。通過高質量的 AI 模型，互聯網上的大部分內容與創意會變得越來越普及，低門檻讓每個人的創意得以充分發揮。

除了釋放生產力與創意之外，我們發現， AI 的使用其實已經超出最初的的設計與預期，各種各樣想象不到的應用場景正在發生；比如解析一個古文字、模擬一次飛行、設計一個天文望遠鏡……這樣意想不到的場景，隨着模型能力越來越強，變得越來越可行；僅僅需要少量協作，就可以把每個人的想法變成現實。僅僅需要少量協作，就可以把每個人的想法變成現實。

面對這麼多變化，一個想法開始在我的心裡涌現出來：作爲一個AI創業者，AI 公司並不是重新複製一個互聯網公司，AI 是一個更基礎更根本的生產力，是對個人能力和社會能力的持續增強。這裡有兩點比較關鍵：第一、AI是一種能力，第二是AI是可持續的。

人類很難突破生物定律，永不停歇學習新知識，持續變聰明，而AI可以。當我們在建造更好的 AI 模型時，我們也發現，AI 也在和我們人類一起進步，一起做出來更好的AI。就在我們公司內部，員工每天需要寫很多代碼，做很多研究型實驗，這裡邊大概有 70% 的代碼是 AI 來寫，90% 數據分析是靠 AI 來做。

AI 怎麼能變得越來越專業？大約在一年前，當時訓練模型還需要大量的基礎標註工作，標註員是一個不可或缺的工種。而今年，當 AI 能力變得越來越強的時候，大量機械的標註工作被專業AI完成，標註員則可以專注於更有價值的專家型工作，一起幫助模型變得更好。標註工作也不再是簡單給 AI一個答案，而是教會AI思考的過程，讓AI來學習人類的思考過程，從而使AI能力變得更加泛化，越來越接近人類頂尖專家的水平。

除了通過專家來教 AI 之外，還有另外一種進步，就是在環境中大量學習。在過去半年，通過各種環境，從編程IDE，到 Agent 環境，再到遊戲沙盒，當我們把 AI 放到一個能夠持續提供可驗證的獎勵環境中學習，只要這個環境可以被定義出來，有明確的獎勵信號，AI 就可以把問題給解決。這個強化學習也變得可持續，規模越來越大。

基於這些觀察，我們有一個非常確定性的判斷：AI 會變得越來越強，而且這種增強幾乎是沒有盡頭的。

接下來出現的問題是，AI這麼強，對社會的影響越來越大，那麼AI到底會不會被壟斷？它是會被掌握在一家組織裡，還是掌握在多家組織裡呢？

我們認爲，AI領域一定會有多個玩家持續存在。原因有三點：第一，我們目前用到的所有模型，都依賴對齊（Model Alignment）。很明顯，不同模型的對齊目標其實是不一樣的，比如有的模型對齊目標是一個靠譜的程序員，那麼做 Agent 就會特別的強；有的模型它對齊目標是與人的交互，那麼它就會比較有情商，能夠做流暢的對話；有的模型可能會充滿想象力。不同的對齊目標反映了不同公司或者組織的價值觀，這些價值觀最終會導致模型的表現非常不一樣，也會使得不同的模型擁有各自的特點，並且長期存在。

第二，我們在最近半年用的 AI 系統其實都已經不是單個模型了，而是一個多 Agent系統，裡面涉及多個模型，不同的模型也可以使用不同的工具，通過這樣的方式讓AI智能水平越來越高，能夠解決越來越複雜的問題。這個東西帶來的結果是，單一模型的優勢在這樣一個多 Agent 系統裡逐漸變弱。

第三，在過去半年，有很多非常智能的系統，都不是大公司所擁有的。背後的原因，是過去一年開源模型如雨後春筍般涌現，開源模型變得越來越有影響力。這張圖是過去一年比較受關注 AI 的排行榜，可以發現最好的模型還是閉源的，但最好的開源模型越來越多，同時也在不斷逼近最好的閉源模型。

基於這三點原因，我們認爲， AI 一定會被掌握在多家公司的手中。

與此同時，我們認爲 AI 一定會變得越來越普惠，使用成本也會變得更加可控。

在過去一年半， AI 模型的大小沒有發生特別大的變化，即便我們可使用算力更多了。爲什麼呢？對所有實用模型而言，計算速度是一個比較關鍵的因素。如果模型計算速度特別慢，就會降低用戶的使用意願，所以所有公司都關注模型的參數量和智能水平之間的平衡。

此前，模型大小增長和芯片的進步速度基本上是成正比的。我們知道芯片的進步速度是每 18 個月會翻一倍，模型也會相應保持這樣的增長趨勢。而現在，雖然大家都有更多的算力了，模型參數卻沒有變得更大。那這些增長的算力花在哪呢？

首先說訓練，規模增長的速度在過去半年已經變得比較緩慢，訓練單個模型的成本實際上卻沒有顯著增加。這些算力花在做更多的研究跟探索上。而我們知道研究和探索，除了取決於算力之外，還取決於高效的整體實驗設計，高效的研發團隊，以及一些天才的創意。結果是，擁有非常多算力的公司和沒擁有那麼多算力的公司，在訓練上其實的差異可能不會那麼大。沒有那麼多算力的公司，可以通過持續提升自己的實驗設計、提升思考能力和組織形式，讓實驗探索變得更加高效。

再說推理，在過去一年，最好模型的推理成本其實是降了一個數量級，通過大量的計算網絡系統和優化算法，我們認爲在接下來一兩年之內，最好模型的推理成本可能還能再降低一個數量級。總結而言，我們認爲訓練單個模型的成本不會顯著地增加。

我們認爲，大量創新能讓 AI 研發變成一個沒有那麼燒錢的行業，但是算力使用還會增加。儘管 Token 會變得很便宜，但是使用 Token 的數量會顯著增加。去年ChatBot單個對話只要消耗幾千個Token，現在 Agent 單個對話可能消耗幾百萬個Token，並且因爲AI解決的問題越來越複雜，越來越實用，那麼用的人也會越來越多。

讓每個人都用得起AI，這是我們對 AI 發展的判斷。Intelligence with Everyone，這也是我們創業的初衷。我們認爲 AGI一定會實現，並且一定會服務大衆、普惠大衆。

如果有一天 AGI 實現了，其過程一定是由做 AI 的公司們和他們的用戶一起來實現，並且這個 AGI 應該屬於多家AI 公司和它的廣泛用戶，而不是隻屬於單個組織某家公司。

我們也願意長期爲這個目標而奮鬥。感謝大家！

MiniMax創始人閆俊傑：AI將屬於每個人，而非一家獨大｜直擊WAIC

相關資訊