“天才”的選擇
張鈸:中國科學院院士,清華大學人工智能研究院名譽院長、教授,中國人工智能領域的主要奠基者。
2024年度教育家
2024年年終,一邊是AI巨頭們扎堆發佈“顛覆性”進展,比如“AI教母”李飛飛發佈了一張圖就能生成3D場景的AI模型;一邊是國內大模型市場在下半年遇冷。
在冷熱兩極化的“AI大戰”中,中國科學院院士、清華大學人工智能研究院名譽院長張鈸始終保有定力,既沒有對技術進步過度樂觀,也不像一些人那樣唱衰大模型。
早在兩年前,人們還沉迷於大模型的“尺度定律”(Scaling Law,即規模越大,大模型越強)時,張鈸就指出,ChatGPT只是向通用人工智能(AGI)邁出了第一步,下一步是與環境的交互。在他看來,AI的發展必須邁向對現實三維世界的深刻理解。
這是張鈸又一次做出技術預判。89歲的他說話邏輯清晰、思維敏捷,輸出觀點快而密。說不到兩句,就能感受到從他身上瀰漫過來的強大自信。身爲中國人工智能領域的奠基人之一,他的四代學生組成了中國最具代表性的一支AI隊伍——“清華代表隊”,其中一些人已成爲國內大模型江湖的重要力量。
經歷人工智能40多年來的潮起潮落,張鈸總是逆潮而行,做出與別人不同但正確的選擇。他是天才嗎?他的技術洞察力來自哪兒?如何才能找到通往人工智能的真正方向?
“問題都解決了,還需要我幹什麼”
張鈸的第一次選擇發生在1978年。
清華大學進行部分院系調整,張鈸所在的電子系(原自動控制系)改爲計算機技術與應用系,系中原來從事自動控制研究的老師面臨兩個選擇:待在計算機系,或去新成立的自動化系。他選擇了前者。
很多老師勸他:國家未來要大力發展工業,自動化是最有前景的方向之一。“自動化領域,手裡的工具主要就是PID(工業控制系統中最廣泛使用的控制器),花一兩年時間就能掌握它,放棄並不可惜。”張鈸回憶,“有人說,你把已有的知識都丟掉了,還剩什麼?我說,還剩一個腦袋。”
帶着“唯一的腦袋”留在計算機系,張鈸遇到的第一個任務是尋找有潛力的新方向。他翻閱國外學術期刊,發現美國很多大學的計算機系裡都有一個方向:人工智能。
“當時,對於人工智能是什麼,我也不是特別清楚,但它對我有極強的吸引力,因爲這個領域裡充滿了大量的未知。AI在國際上剛發展了約20年,很多原理都說不清,這恰恰是我的用武之地,如果問題都解決了,還需要我幹什麼?”張鈸說。
由於歷史原因,張鈸這一代學者錯過了從事研究的黃金時期。43歲的他決定從零開始。下定決心不僅要勇氣,還要有強大的自信。1935年出生於福建一個知識分子家庭的他,小學到中學的任何考試和競賽成績都是第一名。1953年,他以數理化三門滿分的成績考入清華大學電機系,後轉入自動控制系。
數學是張鈸最拿手的學科。閱讀大量人工智能文獻後,他敏銳地發現:多數AI研究中沒有使用任何數學工具,“這意味着,很多還未解決的問題有機會用數學辦法解決”。
1984年,張鈸和當時在安徽大學任教的弟弟張鈴,共同發表了中國AI領域的第一篇論文,刊登在AI國際頂刊上。論文研究的是用數學理論解決機器人的運動規劃問題,即機械臂抓取物品時,如何通過更好的線路規避周圍的障礙物。
那是20世紀80年代,以符號主義爲代表的第一代人工智能正處於低潮。符號主義者認爲,人類認知和思維的基本單元是符號,計算機爲了模擬人類的智能行爲,需要先把知識表示成符號,再通過推理等規則對符號進行操作,最後形成答案。“這是以知識驅動爲核心。”張鈸說。
符號AI的開創者們最初希望研究出通用方法,很快遭遇了失敗,於是,退而求其次提出“專家系統”,即將知識範圍縮小到一個具體領域,但這很難推廣並上升到理論。
1980年,作爲改革開放後的首批出國訪問學者之一,張鈸來到美國伊利諾伊大學香檳分校進修,他發現,很多AI專業的博士在論文的選題上遇到困難。“遲遲找不到好的選題,或者找了一個題目多年做不出來,只好中途放棄。”
張鈸沒有受到影響。“我不在意低潮還是高潮,只要清楚這件事能做就行。”這是典型的張鈸式回答。事實上,從1978年暑期起,他就開始研究機器人運動規劃,他出國第二年,就已投出中國AI領域的第一篇論文。他和張鈴提出,將機械臂所在的幾何空間簡化成拓撲空間,“這就變成了一個純數學問題”。此時,距離他決心轉戰AI還不到三年。
張鈸成爲國際上第一批提出用數學模型解決AI問題的學者之一。“研究工作相當於做解剖,解剖必須用快刀,先進的數學工具就是一把快刀。”張鈸相信,“只要數學工具能用上,(人工智能的)研究就可以往前推。”
“雪山還是狗”
2002年,袁進輝還在西安電子科技大學計算機系讀大三,成績年級第一,想申請清華直博,“我諮詢師兄,他說你可以先從清華計算機系最有名的老師開始聯繫”。當時,張鈸是清華計算機系唯一的中國科學院院士。
此前,袁進輝已讀過張鈸和張鈴共同撰寫的一本關於人工神經網絡的專著,第一反應是“兩個作者的姓名好有特點”“書裡有很多數學理論”。該書出版於20世紀90年代,那時人工神經網絡是AI裡很小衆的領域。“張鈸和張鈴老師研究的是小衆方向中更小衆的偏理論部分,在當時是相當少見且超前的。”袁進輝說。
發現符號主義難以走通後,AI研究者逐漸轉換思路,發展出連接主義的新流派,即信息是通過在人腦神經元之間建立起 “刺激—響應” 的連接進行傳遞。這一流派的代表成果就是人工神經網絡。
但早期的人工神經網絡只是淺層神經網絡,難以解決稍微複雜一點的現實問題。於是,連接主義起步不久就陷入低谷,只有少數人認定這條路是正確的,包括2024年諾貝爾物理學獎得主傑弗裡·辛頓、“卷積神經網絡之父”楊立昆,還有張鈸。20世紀90年代,張鈸和張鈴聯手,圍繞神經網絡理論發表了多篇論文。
20世紀80年代末開始,國內AI發展迎來低潮期。彼時,張鈸選了一條更務實的道路:承擔國家重點攻關課題。但他沒有放棄當時看起來不太有希望的理論研究。“清華人工智能學科理論研究的隊伍中,基本一半人在做符號主義,一半人在做人工神經網絡,而人工神經網絡和深度學習一脈相承。等到深度學習的時代真正到來,我們立刻將大部分兵力轉向深度學習。”張鈸說。
2012年,深度卷積神經網絡AlexNet在ImageNet(世界上最大的圖像數據集)競賽上一戰成名。自此,以深度神經網絡爲基礎的深度學習徹底出圈。“這就是以數據驅動爲核心的第二代人工智能。”張鈸說。
他指出,與早期的神經網絡相比,深度神經網絡“把深度加深了”,即中間的網絡層數變多之後,性能發生了重大變化,只需輸入大量的原始數據,就可以“自學成才”。他最初感到興奮,但隨後開始思考:深度學習的邊界在哪兒?
清華大學計算機科學與技術系教授、人工智能研究院副院長朱軍是張鈸的學生。“2013年前後,正是深度學習最熱的時候,很多激進的觀點認爲,AI三五年內就可能在自動駕駛等複雜場景量產,但張鈸是國內最早公開談論深度神經網絡存在缺陷的專家之一。”朱軍對《中國新聞週刊》說,“這時候他已經快80歲了。”
深度學習的一個關鍵弱點是容易被欺騙。張鈸團隊發現,深度神經網絡的圖像識別很脆弱。一張以雪山爲背景的圖片,只要加入一點“噪聲”,“自學”之後的AI會將其識別成一條狗。這一問題絕非“雪山還是狗”這麼簡單,而是指向一個困擾張鈸多年的更大難題:深度學習往何處去?
他很早就意識到,深度學習存在不可解釋性與魯棒性差(系統的抗干擾能力差)等根本性缺陷。2016年起,他陸續提出關於“新一代AI”的觀點,2020年發表論文《邁向第三代人工智能》。他提出,第一、第二代人工智能都只是從一個側面模擬人類的智能行爲, 爲了建立一個更全面反映人類智能行爲的AI,需要把知識驅動與數據驅動結合起來。
打開“黑匣子”
2022年11月30日,ChatGPT正式亮相。此前,人們根本無法想象AI模型可以變得如此巨大。“絕大多數AI研究者感到非常震驚。”張鈸說。
袁進輝指出,ChatGPT的誕生讓人工智能進入截然不同的發展階段。模型變大後,人們突然發現,過去多少年解決不了的問題可以用統一的方法搞定。“這是一次工業革命級的技術革命。”
像過去一樣,張鈸看問題的視角和別人不同。他說,多數人理解ChatGPT就是“大數據+深度學習”,其實它真正的突破,首先在自然語言文本上。ChatGPT不是像第二代AI那樣,簡單地把文本作爲數據來處理,而是把文本當成知識(內容)來處理。“只有當機器可以從大量的數據中獲取到知識,真正的轉變纔會發生。所以,ChatGPT能力的強大源自兩點:一是大模型;二是大文本。”
可以說,ChatGPT是張鈸預測中的第三代人工智能的雛形,但還遠遠不夠。張鈸指出,ChatGPT突破了前兩代AI只能在限定領域完成限定任務的限制,這爲建立起統一的人工智能理論提供了重大機遇,“這纔是第三代人工智能實現的關鍵”。
迄今爲止,人類一直通過模擬的方式讓機器的行爲與人類相似,但大模型還是一個“黑匣子”,這正是張鈸認爲AI理論下一步可能突破的地方。“我們要把大模型的內部機理分析清楚,解剖複雜系統行爲背後的內在邏輯。誰能做到這一點?我說至少需要第二個愛因斯坦。”
在張鈸的倡議下,2018年,清華大學成立人工智能研究院基礎理論研究中心,朱軍爲研究中心主任。被問到理論突破的難度有多大時,他引用了一句話:“當你提出問題時,可能離解決問題已經不遠了。”
這是張鈸最常說的一句話。在他看來,中國學生解決問題的能力很強,但提出問題的能力不足。因此,在培養學生時,張鈸格外重視訓練學生“提出問題的能力”。
袁進輝2003年起跟隨張鈸讀博,不像有的導師會出於“更容易出成果”或“項目有需要”等原因給學生指定博士選題,張鈸總是讓學生自己找題,鼓勵大家自主探索無人區。
張鈸強調,學生一定要有批判性精神,敢於質疑現有成果。“中國培養的很多學生只知道標準答案。我常說,不怕餿主意,就怕沒主意。”
“先有正確的理解,再有正確的判斷”
2016年,袁進輝決定孤注一擲。
他從微軟亞洲研究院離職創業,選擇的賽道是AI基礎設施(AI Infra),即AI模型的“操作系統”。“我的理念是模型未來一定會變得很大,變大之後,現有的深度學習框架將難以承載,谷歌、亞馬遜等大廠設計的底層架構都不是爲大模型準備的,提前佈局AI Infra,將來一定有商業機會。”他解釋。
袁進輝的“超前”想法可以追溯到更早的博後時期。2008年,張鈸認爲計算機和腦科學的交叉很有潛力,提出了計算神經科學的方向,並邀請海外相關專家加入清華擔任講席教授指導學生,袁進輝就是受益者之一。若干年後,神經網絡爆火,他下意識地從腦科學的角度去思考:“即使深度學習是萬億級的參數,離人腦神經元的規模也有好幾個數量級的差距。人工神經網絡未來必須變得很大,纔可能真的擁有接近人類的智能。”
一些頂尖科學家面對象牙塔外的商業世界會顯得無措,但張鈸是一個另類。多位受訪者提到,他在商業方面的眼光也很犀利。
2024年,國內的AI玩家從“煉大模型”的狂熱中清醒過來,開始轉向應用,而張鈸兩年前就預料到這一局面。“國內企業燒錢根本燒不起,只有做應用才能活下去,但這也是中國大模型企業當下面臨的最大挑戰,大模型尚未成熟時就去做應用,70%—80%的企業可能都會倒下。”他分析。
爲何張鈸總能做出正確的選擇?“答案很簡單,必須先有正確的理解,才能做出正確的判斷。”他說,“就是要深思熟慮,我很不容易說服自己去相信某個結論,會不停地對自己提出疑問,然後刨根究底,直到把這個問題徹底想明白。”
ChatGPT誕生後,有些人覺得AGI馬上就能實現,張鈸卻非常保守。他認爲,需要去研究AI大模型的底層邏輯,嘗試不同的問題,測試機器的能力邊界。朱軍指出,大模型發展的各個階段,張鈸總能快速找到一些最適合又很巧妙的例子去測評模型的弱點,根源在於他對AI系統本身有非常深刻的思考與見解。
張鈸設計了這樣一個問題:“我朝東面走,向右手方向轉90°,迎面走來一個人,我看到他左手方向的地上有一道很長的他的身影。此時是早晨、中午還是下午?”
GPT-4o(GPT-4的升級版)沒能答對,OpenAI2024年9月發佈的新一代推理模型o1則回答正確:是早晨。張鈸發現,兩者的參數和數據沒有明顯區別,差距源於“思維鏈”技術。“o1對這一問題分析的邏輯鏈非常細緻,一步步推理出了結果。”
AI領域最激烈的變化就集中在短短十幾年內,這一切都發生在張鈸77歲之後。朱軍說,張鈸自我要求極高,有強烈的好奇心與求知慾,快90歲每天還在看國外最新的論文。“他是我見過的學習能力最不可思議的人之一。最前沿的模型,玩得比我們還溜。”
很多學生認爲張鈸是天才。張鈸說,先天的智商決定了一個人能夠達到怎樣的高度,但最終實際達到的高度取決於努力的程度。大模型裡有個神奇的現象叫“涌現”,指模型規模增加到某一臨界點時,性能會突然顯著提升,甚至出現一些難以預測的能力,比如真正的智能。
“所以,你認爲自己是天才嗎?”
“我從6歲開始,每天都在學習,再笨的人也學聰明瞭。”
這就是天才的“涌現”。
發於2025.1.6總第1171期《中國新聞週刊》雜誌
雜誌標題:張鈸:“天才”的選擇
記者:霍思伊
編輯:杜瑋