甲小姐對話張鈸:中國大模型的死與生|甲子光年
“在中國,光搞大模型很難活下去,必須與應用相結合。”
作者|甲小姐 王博 王藝
“這些地方必須能有與首要用途結合的可能性——否則它們就會萎縮,甚至死亡。”
這是1961年,簡·雅各布斯在《美國大城市的死與生》一書中對紐約、芝加哥等大城市中部分區域的判斷。
20世紀50年代,美國城市化發展路徑面臨轉型,城市化從追求人口集中、城市數量增加和城市規模擴大的傳統模式,向改善城市生活質量、增強區域功能作用的新發展模式轉型。
而七十年後的今天,這種轉型發生在了人工智能領域。
ChatGPT的成功,讓不少大模型從業者把Scaling Law(規模法則)奉爲圭臬,但是當模型參數到達一定量級,高質量數據不足似乎已經開始讓模型性能增長速度有所放緩。而應用落地、商業化的壓力,也讓很多在資源方面沒有“無限開火權”的中國大模型企業開始面臨到底是“把資源用在模型訓練還是落地業務”的艱難抉擇。
儘管行業內已形成共識——人工智能是未來,但也有很多認知沒有收斂。這一年,我跟行業內的很多人聊過,他們有:燒錢的、賺錢的,投機的、務實的,在場的、出局的。他們的觀點各異,但有一點相同:大談AGI(通用人工智能)的少了,追求ROI(投入產出比)的多了。
如今,市場寒風漸起,中國大模型站在了死與生的邊緣。
當一切變得艱難而複雜,我們更需要回到中國人工智能的原點,去尋找出發的理由。唯有溯源,才能撥開重重迷霧,看清前行的路。
我想到一位前輩。
這位前輩叫張鈸,福建福清人,是中國科學院院士、清華大學計算機系教授、中國人工智能領域奠基人之一。
他本人的故事頗具傳奇色彩。生於1935年的張鈸在43歲的時候從零開始學習人工智能,短短五年內就在國際人工智能聯合會議(IJCAI)上發表了論文,成爲了國內最早在國際頂級人工智能會議上發表論文的幾位作者之一。
後來,他主導成立了國內第一個智能機器人實驗室,成爲了清華大學計算機系計算機應用方向的第一位博士生導師,建立了國內第一個與人工智能領域有關的博士點,在全球首次提出了“第三代人工智能”的理念。
1953年,張鈸以數理化全部滿分的成績考入當時最熱門的清華大學電機工程系,畢業之後就留校任教,一直到現在,在清華園已學習、工作了七十餘年,光是培養的博士生就有93名。黃必清、馬少平、張建偉、朱軍、袁進輝……這些在人工智能學界和業界的知名人物都是張鈸的學生。
令人意外的是,雖然已年近九旬,但張鈸依然保持着對人工智能學界和業界一線的敏感,對於中國大模型發展現狀和行業問題,他毫不客氣地評價:“在中國,光搞大模型很難活下去,必須與應用相結合。”
以他的成就和資歷,他本不必說這些,但張鈸的直率讓人肅然起敬。
雅各布斯在《美國大城市的死與生》中批評道:“有一種東西比公開的醜陋和混亂還要惡劣,那就是戴着一副虛僞面具,假裝秩序井然。”
在某種程度上,張鈸和雅各布斯有着相似之處,他們都不是那種“假裝秩序井然”的人,同時他們也在積極爲行業尋找出路。
本文,甲小姐對話張鈸。
1. 談現狀:光搞大模型很難活下去,必須與應用相結合
甲小姐:去年年底,我們說“AI一天,人間一年”。今年上半年,多模態模型又如雨後春筍一般出現。但是到了今年下半年,我的感受是,國內的大模型市場明顯遇冷,國內部分大模型企業傳出暫停預訓練模型,縮減人員,融資和上市也變得艱難。
甲骨文創始人今年說了一句話:“真正前沿模型的入門價格是1000億美元。”這基本上是一個天塹,造成只有美國的巨頭纔有資本入局。人工智能的競賽變成了巨頭資本和算力的競賽,變成了由OpenAI提出概念,然後Meta負責開源,國內專注應用的狀態。
有人擔憂,中國是不是做不了預訓練模型?我們是不是隻能做應用市場?您有這樣的擔憂嗎?
張鈸:肯定有這樣的擔憂。我們的資本不僅沒有那麼大,而且還極度分散,這個問題是非常嚴重的。
一些做大模型的人來找我做顧問,我都會跟他說,你必須有足夠的錢,這個錢不是指幾百萬、幾千萬,至少幾十億元人民幣才能做出來像樣的大模型。
現在中國是百模大戰,但其實很多大模型都很弱。這個問題我曾經反映過,我說必須集中資源,因爲我們的資源本來就少,可惜誰也不能阻止大家都上。
甲小姐:中美的市場差異還是很大的。
張鈸:美國是“有錢人”的市場,中國是“沒錢人”的市場,就是說市場能不能爲企業提供足夠的錢。中國大模型產業發展不順利是肯定的,爲什麼呢?你必須得有市場兜底,不能光靠投資啊,光靠投資人給錢的話你能活多久?
你要向市場要錢,而中國軟件市場是很難要到錢的,因爲有付費習慣的問題,無論是to B還是to C,中國的市場規則是誰便宜就用誰的。
現在的環境,就是迫使中國的大模型企業必須馬上去賺錢,因爲光搞大模型很難活下去,必須與應用相結合。
中國大模型企業僅依靠自身資源想進一步提高模型能力很難,現在我們主要是想在大學裡做這方面事情。
甲小姐:那硅谷提的1000億美元的入門價格,這個數字您覺得合理嗎?
張鈸:1000億美元是不是誇大我不知道,但肯定需要很大資金,投資人也有信心,他資金投進去能收回來。
美國現在的情況與我們不同,美國只有幾家企業在競爭大模型,大家只要全心全意去提高質量,一旦質量提高了,你非用它不可,它馬上就可提高價錢,大家也願意付費。所以美國那幾家頭部的大模型企業是無需分心的,就是拼命投入——我只要把大模型質量做到最好,我就能站住腳。
甲小姐:那會不會就意味着全世界人工智能的未來發展,將由少數巨頭來引領?
張鈸:很可能是這樣。
甲小姐:我感受到的,人工智能領域,中國跟美國是兩個牽引力,美國更像是不斷給錢,讓人工智能解鎖新的能力;中國是要找需求、找商業閉環。所以這就會變成能力驅動跟需求驅動的兩個牽引力。我有點擔心,如果我們這麼早就開始追着需求走、追求實用主義,我們離解鎖智能本質的這件事情會越來越遠。
張鈸:你的擔心是對的。即使大模型落地之後,我認爲也只有少數企業能活下來,大多數大模型企業活不下來,因爲暫時還沒有那麼大的市場。
美國的大模型企業充分認識到了這一點,所以他們現在並不着急去落地,因爲他們覺得目前落地很困難,只有把大模型做好了以後再落地,才真正能賺錢。
而現在我們提前落地,困難非常大,需要花很多精力去做這件事情。大學與研究所應該把大模型的基礎工作做好,這樣才能避免將來出現大模型應用做不好,大模型的基礎也做不好的局面。
甲小姐:那現在對於拿到一部分錢,但錢又沒有國內外頭部大廠那麼多的中國人工智能企業來講,可能就要面臨取捨——是應該繼續花錢和資源去訓練新模型,還是說把錢和資源用在應用落地上?
張鈸:對於一般企業,我都建議他們找出路賺錢。畢竟企業不是科研單位,你不賺錢的話,多大的理想都沒有用武之地。
甲小姐:不過,錢並不好賺。之前李開復老師就說過,很多大模型公司競標,價格越競越低,競到最後做一單賠一單,沒有利潤。我感覺,國內大模型現在是追到了一定程度,但性能還不是很好,同時又着急商業化。C端商業化不好做,然後就開始做B端,開始提解決方案。
張鈸:對,性能不大好,還硬要別人用。你必須讓客戶得到大的利潤,客戶才願意出大錢。你現在是不痛不癢地給客戶來用,人家願意出錢嗎?現在基本情況是,燒的錢比賺的錢大得多,這是最艱難的時刻,要想辦法找到關鍵的應用,讓自己活下去,才能度過這個困難期。
甲小姐:有您認爲做得比較好的企業嗎?
張鈸:現在有些企業做法我還是比較贊成的,比如王小川的百川智能,它主要做醫療健康的大模型,從企業的角度來看,它有可能活下來,它在努力解決中國的醫療問題。所以現在國內大模型,你只能從應用的角度去看。
甲小姐:國內大模型市場可能很快就會冷下來,從去年的百模大戰,到今年的逐漸遇冷。
張鈸:在國內的確有可能會冷一些,但不會完全是泡沫。
我曾經講過,一般的應用誰都會做,而且技術門檻並不高,缺乏競爭力。有競爭力的是什麼呢?因爲大模型目前還存在一些缺陷,在許多場合直接應用有困難,必須讓它跟其它的技術和工具結合起來,發展出來新的應用,這樣企業才能活下來,這就需要創新。
甲小姐:所以出路還是有的?
張鈸:出路是有的,只是需要探索。有一次,一位領導問我如今的大模型怎麼樣,我說這一次(人工智能)是真的,以前都有點假(誇大)。(笑)
甲小姐:我感覺大模型確實解鎖了一些新的能力,但也有一些缺點,但是這些新的能力如果不走向一個非常漂亮的產品,或者鎖定一個非常具體的應用場景,就很難形成商業收入。那麼,中國大模型企業的出路,您有什麼建議?
張鈸:我認爲有四條路。
第一條路是AI對齊,逐步改善大模型的能力,減少它的錯誤。
第二條路是多模態,以圖像生成爲例,很多企業在做文生圖,但其實文生圖的應用不如圖生文,圖生文什麼意思?你給一張圖像,模型給出這張圖像的內容(文本),相當於對圖像的理解,其實,圖生文的產業應用要比文生圖多。
第三條路是智能體,智能體不僅會思考,還能感知和採取行動,這樣不僅會擴大它的應用場景,而且可以通過感知反饋促使智能體自我改進與進化。
第四條路是具身智能,就是讓大模型進入物理世界。
2. 談模型:OpenAI的大模型發展並沒有放緩
甲小姐:美國那邊的技術發展情況似乎也不太盡如人意,比如OpenAI今年發了o1模型,但它一直沒有發佈GPT-5。這導致業界產生疑惑,沿着大語言模型這條路是會有突破性的進展,還是可能會遇到一些問題?您是怎麼理解的?
張鈸:對於OpenAI的技術發展,我還沒有看到減緩的跡象。從GPT-2一直到GPT-3.5、GPT-4o,靠的是什麼?靠的是數據的增加,靠的是Scaling Law。而從GPT-4到o1,數據並沒有變化,但二者的性能有很大的提高,這預示着一個新的重大飛躍。
o1證明,數據的數量即使不變,模型的性能還會有重大的改變。這給大家又指了一條出路。我目前儘管只能試用o1-preview,但是preview版本的有些能力已經讓我覺得很震撼了。
甲小姐:您覺得o1最驚豔的是什麼?
張鈸:最驚豔的是,它的推理能力增強了很多。一些比較複雜的邏輯推理和常識推理,都可以正確做到。
甲小姐:o1背後體現了什麼能力?
張鈸:所謂的“思維鏈”(CoT)技術,它由3個能力組成。
第一個是規劃能力。通過強化學習,學會把一個複雜的任務分解、細化成幾個簡單的子任務。
第二個是運用不同策略的能力,也就是說某條路走不通了,會找另外一條路。
最後一個最重要的,是它會發現自己的錯誤,並具備糾正自己的錯誤的能力。通過反覆的思考和檢查自己的錯誤,不斷地把思考的結果(輸出)變成輸入,進行再思考,性能因此得到不斷地改善,這是一個非常了不起的能力。
甲小姐:OpenAI o1和GPT的路線從根源上就分開了嗎?
張鈸:沒有,o1是在GPT-4基礎上做的。主要是加上了思維鏈,即經過深思熟慮之後再回答你的問題,每次它都會告訴用戶,究竟花了幾秒或者幾十秒纔得到答案。這種能力主要從強化學習中得來的。
甲小姐:從這個跡象來看,您覺得OpenAI的大模型的發展在2024年並沒有放緩?
張鈸:沒有放緩。因爲OpenAI既不給你看大模型內部的構造,也不告訴你裡面的推理(思考)過程。
甲小姐:那大模型發展的下一個里程碑事件會是什麼呢?
張鈸:在推理方面還可以逐步提高,大模型可以不斷地學各種各樣的推理方法,所以它將來會回答越來越難的問題,比如數學難題,甚至科學難題。
再下一步可以發展多智能體,讓不同的大模型相互進行博弈,這就像下圍棋(AlphaGo)一樣,會自我進化,自我迭代。因此ASI (Artificial Superintelligence,人工超級智能)也可以期待了。
甲小姐:多智能體是業界關於未來的共識,還是在大模型幾個發展方向中,您比較看好的那一個?
張鈸:這是我看好的一個方向。AlphaGo能自己跟自己博弈,那大模型爲什麼不可以自己跟自己博弈?
還有一件正在探索的事情,就是說讓機器主動去做事,這件事當然很難,但如果能實現的話,那機器超越人類就不存在問題了。
因爲現在所有機器做事都是外部驅動,所有指令都是人類外部賦予的。一旦它內部能自己賦予自己指令,那就跟人類完全一樣。所以現在大家也在研究如何賦予機器好奇心,因爲人類最初的進步來自於好奇心驅使下的學習。
3. 談行業:做人工智能必須正確理解三件事
甲小姐:您是改革開放後,清華大學最早一批去美國進修的教師,對中國和美國的人工智能發展都很瞭解,造成目前中美大模型發展差異的原因是什麼?
張鈸:我們過去很長一段時間裡,實際上不是特別強調去做長遠研究,這方面,我認爲中國的比美國要落後很多,比如缺乏創新性。在人工智能基礎研究領域,中國基本上是跟着人家做。
以清華爲例,目前我們在具體的模型、算法與技術突破上有一定的能力。比如在視頻生成模型方面,國產視頻生成模型Vidu的核心技術U-ViT架構是由我的學生朱軍帶領的團隊於2022年9月提出,早於Sora採用的DiT架構,是全球首個Diffusion與Transformer融合的架構,完全由團隊自主研發。
但是在重大技術突破上,比如Transformer、語義的向量表示等方面,國內的研究團隊主要處於跟蹤狀態。
甲小姐:“清華系”是中國人工智能非常重要的一股力量,您的很多學生現在也是行業裡的中流砥柱。在您的學生中,您比較看好誰的創業項目?
張鈸:我比較看好之一是我的學生袁進輝創建的硅基流動公司,他們在做人工智能的基礎設施,因爲這件事情很重要。
我們總說中美算力有差距,算力我們當然要去追趕,但這不是一時半會的事。但是,如果我們把算法效率(如大模型的推理速度)提高10倍,那麼只要用1/10的算力,就會帶來同樣的效果,這方面中國能夠比美國做得更好,硅基流動就是代表。
很多人會問,爲什麼在提高算法效率上中國人會做得更好?我覺得,對中國企業來講,算法效率是生命攸關的,我們必須全力以赴。也許因爲美國人有強大的算力,算法效率對他們來說只是錦上添花而已。
甲小姐:自從ChatGPT出現以來,“GPU+Transformer+暴力美學”就成了巨頭們紛紛去做的主導範式,但是我也聽到了一些不同的聲音,比如說這個東西不是“鐵王座”,未來會有別的東西去代替Transformer。在您看來,Transformer是一個“鐵王座”嗎?
張鈸:沒有任何一個東西永遠都是好的,將來都會有新的東西代替它,整個技術的發展邏輯是這樣的。
但是我覺得在相當長一段時間,我們還是會用Transformer,因爲它主要通過注意力機制解決長距離的關聯問題。
要改它,你得想出另外的招,我相信有另外的招,因爲一個問題不可能只有一種解法。作爲學校來講可以去研究Transformer之外的架構,但是企業做這個事,我覺得風險比較大。
甲小姐:企業沒有辦法去像一個孤膽英雄一樣地去做範式突破?
張鈸:企業的最終目標是賺錢,所以企業必須和學校不一樣。
甲小姐:您所瞭解到的這些企業中,有誰在找錢、賺錢這件事情上做得還不錯嗎?
張鈸:有些企業做得還不錯,但也存在互相抱團的現象,我拿錢投資你,你拿錢投資我。我覺得需要投資上下游,同質企業之間投來投去,如果做不出來的話,風險就很大。
甲小姐:那他們爲什麼還要這樣互相投來投去呢?
張鈸:我的理解是分散風險嘛,等於說大家一起想辦法,不然的話競爭太激烈了,大家互相有關係的話,可以合作起來做一些事,有一定的道理。
甲小姐:接下來您比較期待的人工智能行業發生什麼?
張鈸:智能體與多智能體之間的交互。
甲小姐:您認爲中國人工智能從業者最需要想明白什麼問題?
張鈸:在中國做人工智能必須正確理解三件事:
第一,什麼是人工智能,人工智能究竟是幹什麼的?
第二,人工智能現在發展到什麼程度,我們應該怎麼估計它?
第三,人工智能究竟會往什麼方向發展?
這三件事必須理解正確,才能夠做正確的事情。
4.談初心:人工智能的未知性充滿吸引力
甲小姐:關於人工智能,行業裡似乎每個人都能講出一大堆觀點,您是國內最早一批研究人工智能的學者,您認爲,人工智能是在研究什麼?
張鈸:人工智能實際上是在探索一條機器智能化的道路,至今我們只見過(人類)碳基智能,有沒有其他可以走向智能的道路?最開始大多數人是懷疑的。
甲小姐:您最開始接觸人工智能是1978年,那時候您43歲,當時清華大學電子工程系更名爲計算機技術與工程系,系裡的老師們要重新選擇計算機相關的研究方向,是什麼讓您下定了決心從零開始學習人工智能?
張鈸:當時人工智能處於低潮,是名聲最不好的時候,爲什麼還要選擇人工智能?我之前是研究自動控制的,自動控制理論與技術都很成熟,自動控制理論的書裡面充滿數學,很嚴謹,這些都讓我覺得沒什麼可以做。而人工智能領域很多問題都說不清楚,充滿了未知性,這反而吸引了我。
甲小姐:人工智能自1956年誕生以來, 一直存在兩個相互競爭的範式,即符號主義與聯結主義。第一代人工智能以符號主義爲代表,強調符號之間的邏輯關係,第二代人工智能以聯結主義爲代表,強調人工神經網絡。您親身經歷了這兩代人工智能發展,如何評價這兩代人工智能?
張鈸:第一代人工智能模型是知識驅動,其最大的優點是機器像人類那樣思考,因此該模型是可理解、可解釋的。但其最大的問題是,機器的所有知識都要靠人類傳授,而當時人類還無法使用自然語言把知識傳授給機器,也就是說存在機器知識獲取和表示的困難,這就造成了第一代人工智能在應用和產業化上都沒有取得很好的進展。
第二代人工智能就是人工神經網絡。不過,現在很多人認爲人工神經網絡就是類腦計算,這是不正確的,實際上它屬於腦啓發下的計算,通常又稱爲數據驅動模型。第二代人工智能的模型儘管在數據分類、預測、生成等方面取得巨大的成就,但它存在不安全、不可信、不可控、不可靠、不易推廣等缺點,也嚴重影響了它在很多場合下的應用。
這兩代人工智能做的事情都是針對特定領域,利用特定模型,解決特定任務,都屬於專用人工智能或弱人工智能範疇。
總之,上面提到的人工智能發展的兩個階段:第一階段知識驅動的模型,主要用來模仿人的思考;第二階段數據驅動的模型,主要用來模仿人的感知與情感等。因爲它們着眼於模擬人類的智能行爲,追求的目標是讓機器的行爲與人類行爲相似,並不追求工作原理的一致性,因此稱爲行爲主義學派。
還有一條人工智能的道路是類腦計算,強調模仿人類大腦的工作原理,這種範式被稱爲內在主義(Internalism)。內在主義認爲,人工智能必須去模仿人類大腦的工作原理,只有工作原理一樣,行爲才能完全一致。
行爲主義和內在主義這兩種範式大家都在探索,沒有對錯之分。從目前的實踐來看,ChatGPT的出現說明行爲主義這條道路走得通。內在主義的道路是否走得通?目前還難以判斷,它的研究工作進展還很少,因爲我們現在對人類大腦的工作原理了解得很少。
甲小姐:我們過去在看人工智能發展史的時候,大家通常的分法是符號主義、聯結主義、行爲主義,但是您將人工智能分爲了行爲主義和內在主義兩派,這是爲什麼?
張鈸:我不清楚他們爲什麼這樣劃分。我是這樣看符號主義和聯結主義的關係的,符號主義認爲智能是通過符號操作來實現的,聯結主義也被稱爲亞符號主義(Sub-symbolism),它們其實都是在模仿人類行爲——前者主要是模仿人類的思考,是理性行爲;後者主要是通過機器學習模仿人類的感知和情感,是感性行爲與情感。
我這裡把行爲主義跟內在主義相對應。因此目前的人工智能只在做兩件事,一是去模仿人類的行爲,一是去模仿大腦的工作原理。除此之外,似乎還沒有別的道路。
“智能”本身是很難定義的,因爲我們對人類的大腦瞭解的太少。但是好多人總是想用“智能”去定義人工智能,這樣一來就“定義”出好多派別來。
甲小姐:2020年,您和朱軍、蘇航一起發表了評述文章《邁向第三代人工智能》,爲什麼要提出“第三代人工智能”的理念?
張鈸:就像前面的分析,前兩代人工智能只是從不同的側面模擬人類的心智,具有各自的片面性,依靠單個範式很難觸及人類真正的智能(行爲)。
爲了建立一個全面反映人類智能行爲的人工智能,需要建立魯棒與可解釋的人工智能理論與方法,發展安全、可信、可靠與可擴展的人工智能技術,也就是第三代人工智能。其發展的思路是,把第一代的知識驅動和第二代的數據驅動結合起來,充分利用知識、數據、算法和算力四個要素(資源),構造更強大的人工智能。
我們從2016年開始就陸續提出了相關觀點,後來在2020年整理髮表了出來。
甲小姐:人工智能缺少理論嗎?
張鈸:是的,我們發展第三代人工智能的重要思想是:必須建立人工智能的理論。至今人工智能包括大模型在內,沒有存在的理論可以解釋清楚,所以會引起各種各樣的困惑和誤解。由於大模型中出現很多難以解釋的現象,所以引起大家的恐慌。大家擔心如果機器持續發展下去,會不會出現意識,會不會不受人類控制,甚至主動攻擊人類?目前理論上還難以做出回答,所以發展理論是非常必要的。
甲小姐:當時你們在構想第三代人工智能的時候,有想到會是以ChatGPT這樣的形態出現嗎?
張鈸:我們想得不會那麼具體,但是這條路我們是提前看到了。
我們當時提出了三空間融合模型的概念。我們已經有了符號(語義)空間模擬大腦的思考行爲,也有了向量空間模擬大腦的感覺行爲。這兩層處理在人類大腦中是無縫融合的,如果我們能構造出第三個空間-語義向量空間,通過這三空間的融合,就能在計算機上實現認知與感知行爲的無縫處理,人工智能就有可能達到與人類相似的智能行爲,從根本上解決目前人工智能存在的不可解釋和魯棒性差的困難。
過去,文本(語言)是在有語義的符號空間裡處理的,語音、圖像等是在缺乏語義的特徵向量空間處理,如何將這兩個空間融合?我們需要建立第三空間。而這個中間的第三個連續準語義向量空間,就是ChatGPT實現的空間。
三空間融合模型示意圖,圖片來源:《邁向第三代人工智能》,爲方便閱讀,編者加上了中文註釋
甲小姐:您剛纔說人工智能必須建立理論,我理解是一個關於人工智能的統一理論,目前這個統一理論有兆頭了嗎?
張鈸:很難,因爲這屬於複雜系統的分析問題,ChatGPT裡頭看起來運算很簡單,矩陣相乘,非線性也不多。但問題是這些矩陣非常之大,而且經過多輪運算,運算了幾百上千次以後,你根本不知道里面發生什麼樣的變化。
當然,我現在沒能力去做這件事,就看將來有沒有年輕人能去做這件事。
甲小姐:誰最有可能搞出來這個理論?
張鈸:第二個愛因斯坦,貢獻至少不低於圖靈嘛。
甲小姐:其實圖靈測試這種行爲主義的思想,某種意義上是規避了理論建設的。
張鈸:這也沒辦法,在當時那種情況下只能用那樣的辦法解決問題。不然你糾纏在那個(智能的)定義上頭,人工智能就沒法弄了。如果沒有理論的話,人工智能還能算一個很嚴謹的科學?因此這件事終究還是需要做的。
甲小姐:如果實現AGI是登上珠穆朗瑪峰,您覺得現在我們大概爬了多遠?
張鈸:這說不清,但我認爲要實現AGI必須做到三件事。
第一,完成任何任務必須跟領域無關,即達到領域的通用性。目前我們只在語言這個問題上,可以做到與領域無關,但是人工智能領域還有大量的任務做不到與領域無關。比如說計算機醫療診斷系統,不能只針對某幾種病,將來必須做到什麼病都能看,這才叫通用。
第二,什麼任務都能幹。人類能幹的事機器都能幹,而且要達到人類的水平,這還差很遠,目前的ChatGPT還只會說,不會做。
第三,需要建立統一的理論。
總之,人工智能還在路上,人工智能的發展任重道遠。
甲小姐:剛纔您提到在第三代人工智能中,語義向量化非常重要。其實這方面也有兩派意見,第一派認爲語言是智能的主軸,大語言模型就是通往人工智能的最核心的道路。第二派認爲語言不是主軸,多模態等纔是。您贊同哪個?
張鈸:我贊同前面一派。維特根斯坦說過一句話:我的語言界限,就是我的世界界限。所以一旦掌握了語言,就掌握了人類的世界,一旦掌握了人類世界,什麼事情都可能發生。我是相信這句話的。
在語言是主軸的前提下,今後計算機視覺會暢通無阻。爲什麼呢?剛纔我說過計算機視覺很難做,過去模式識別跟計算機視覺不是一碼事。美國研究者做了一件事就非常漂亮,他們把圖像跟文本掛起鉤,就是CLIP(編者注:CLIP是由OpenAI在2021年發佈的一種多模態模型,旨在建立圖像和自然語言之間的關聯,它通過對比學習來預訓練模型,使圖像和文本能夠被映射到同一特徵空間中)。
圖像一旦跟文本掛起鉤,機器就能處理圖像的語義了,因爲文本的語義,機器能處理,所以所有的模態只要跟文本掛起鉤就容易處理了。
甲小姐:每個時代的技術自有屬於它的代際使命。2024年底,如果讓您聊一聊在人工智能行業,您感受到的最大的偏見和誤解,以及對未來發展的看法,您最想表達什麼?
張鈸:儘管現在大模型落地難、賺錢難,但我認爲中國企業發展的希望比研究工作大得多,因爲市場有非常客觀的檢驗標準,在市場面前誰也做不了假,所以凡是做出正確努力的人,就一定會成功。我之所以介入企業,是因爲人工智能企業的發展對國家太重要了。
對於中國企業我還是很有信心的,儘管現在有些競爭,但最終肯定會有人活下來,活下來說明他至少受到市場的承認。哪怕說你水平不如行業頭部企業,但只要在市場上活下來,你就是成功者。
甲小姐:回顧您近90年的人生,跟人工智能打交道的時間超過了一半,哪個時刻是讓您最難忘的?
張鈸:我最難忘的1984年,在歐洲國際人工智能會議(ECAI)上,我和弟弟張鈴獲得了一項歐洲人工智能獎項,成爲首次獲得該領域國際重要獎項的中國人。那時候,很多學者都過來祝賀我,當地媒體還過來採訪我。而我們剛剛出國的時候,好多人會覺得中國學者沒什麼水平,因爲我們之前確實沒寫過論文,有了這次經歷,讓我感到非常自豪。
|甲小姐對話系列回顧|