陶哲軒專訪:數學證明與人工智能的未來 “理論是對宇宙的一種壓縮” |6.5萬字全文+視頻

文:Web3天空之城| 未經許可不得轉載

【城主說】陶哲軒被譽爲當今世界最天才的數學家,“數學界莫扎特”,。這位菲爾茲獎與數學突破獎得主,其工作的廣度與深度常被拿來與百年前的巨人希爾伯特相提並論。然而,在一個人工智能以前所未有的速度滲透進人類智力活動最前沿的時代,即便是陶哲軒這樣的大腦,也在重新思考數學的本質、證明的形態以及未來的研究範式。

在這場與萊克斯·弗裡德曼的對話中,陶哲軒拋出了一系列極具顛覆性的觀點。其中最核心的,或許是他對理論本質的精闢概括:一個好的理論,就是對現實世界的一種極致高效的“壓縮”——用最少的參數,解釋最多的觀測。這個看似簡單的比喻,不僅揭示了從納維-斯托克斯方程到廣義相對論等物理難題的核心,也爲我們理解人工智能在未來科學發現中的角色,提供了一個全新的視角。當機器開始輔助甚至獨立探索時,我們如何判斷一個新“理論”的優劣?陶哲軒的答案,可能就藏在這“壓縮效率”之中。

視頻上集:

視頻下集:

從“麥克斯韋妖”到“流體計算機”:偉大難題的內在結構

對於普通人而言,數學難題往往意味着無盡的複雜計算。但在陶哲軒看來,真正困難且有趣的問題,其核心魅力在於其內在的結構性矛盾。他以著名的“百萬美元難題”——納維-斯托克斯方程(Navier-Stokes equations)爲例,揭示了這類問題的深層困境。這個支配着流體運動的方程,其難點在於,我們無法從數學上完全排除一種極端情況:能量通過一種詭異的“陰謀”,不斷從大尺度集中到越來越小的尺度,最終導致速度變爲無限的“爆破”(blow-up)。

這種現象,陶哲軒用了一個絕妙的類比來解釋:麥克斯韋妖。這是一個思想實驗中的“小惡魔”,它能以一種違背統計學規律的方式操縱粒子,導致系統出現極不可能的有序狀態。在流體力學中,這個“惡魔”就是一種潛在的自組織機制,它能抵抗住使流體趨於平靜的黏性力,將能量匯聚於一點。

面對這種看似無法攻破的難題,陶哲軒展現了他作爲“狐狸型”數學家的典型策略:與其正面硬攻,不如戰略性“作弊”。他通過修改物理定律,關閉了方程中某些使能量分散的“通道”,人爲地創造了一個更容易發生“爆破”的簡化模型。這個模型雖然不是真實世界,但它的存在本身就構成了一道“障礙”,它告訴所有試圖證明“爆破永不發生”的數學家:你們的證明,必須利用到真實方程中那些被我關閉掉的、微妙的特性。

而這個過程,將他的思維引向了一個更爲大膽的奇想:構建一臺“流體計算機”。他意識到,如果能通過設計特定的流體初始形態,讓水流的碰撞模擬出邏輯門(與門、或門),那麼原則上,就可以用流體構建一臺圖靈機。這臺“水朋克”式的計算機,可以被編程來執行一個任務:創造一個更小、更快的自身副本,然後將所有能量傳遞給它並“關閉”自己。這個過程不斷迭代,就將構成一個真正的“爆破”解。

從一個經典的偏微分方程問題,到構造一個“作弊”的玩具模型,再到設想一臺能自我複製的“流體計算機”——這個思維路徑,完美展現了陶哲軒的解題藝術:不畏懼問題的複雜性,而是通過跨領域的類比(從熱力學到計算理論),去尋找和構建理解問題本質的全新框架。

結構與隨機:驅動數學世界的二元對立

在陶哲軒的數學觀中,存在一個反覆出現的核心主題,一個深刻的二元對立:結構(Structure)與隨機(Randomness)。他認爲,數學中絕大多數對象,比如圓周率的數字,看起來都是隨機的,不具備任何明顯規律。然而,數學家花費大量精力研究的,往往是那些罕見的、具有優美結構的對象。而數學中最深刻、最困難的問題,恰恰誕生於這兩股力量的交匯處。

孿生素數猜想(Twin Prime Conjecture)便是最典型的例子。這個問題之所以困難,是因爲它將兩個看似無關的世界強行連接在了一起。

質數由乘法定義,其分佈看起來極其隨機;而“相差2”則是一個純粹的加法結構。這個猜想,本質上是在問一個隨機性的海洋(質數)中,能否穩定地出現一個特定的結構(孿生對)。陶哲軒指出,這種模式非常“脆弱”,你只需從素數集合中精心地移除極少數成員,就能讓孿生素數猜想不成立,同時幾乎不改變素數整體的統計性質。這意味着,任何證明都必須依賴於素數某種極其精細、非統計的內在屬性。

與此相反,他和本·格林(Ben Green)證明的格林-陶定理,則處理了一種更爲“穩健”的結構——等差數列。他們證明,無論你如何隨機地從素數中剔除絕大部分成員,剩下的集合裡依然會像“蟑螂”一樣,頑固地存在任意長度的等差數列。

這種“要麼有結構,要麼是隨機”的二分法,是現代數學,尤其是組合數學和數論中的一個強大思想。它允許數學家將一個複雜問題分解爲兩種情況:如果對象是隨機的,就用概率論的工具;如果對象是有結構的,就用代數或傅里葉分析等工具。無論哪種情況,都能取得進展。這正是陶哲軒所說的“逆定理”(Inverse theorems)的威力所在——它們提供了一種方法,去檢驗一個看似隨機的對象背後,是否隱藏着某種深刻的結構。

從“趕貓”到“相變”:人工智能將如何重塑數學

如果說“結構與隨機”是數學世界的內在法則,那麼人工智能(AI)和形式化證明工具,則是正在重塑其外在形態的革命性力量。陶哲軒坦言,自己正深度參與這場變革,儘管他將目前與AI協作的體驗形容爲趕貓 herding cats——充滿潛力,卻也極其耗費心力。

他所使用的核心工具是Lean,一種形式化證明語言。它能將數學證明轉化爲計算機可以100%驗證的代碼,但代價是巨大的。陶哲軒估計,將一個人類證明形式化,目前需要花費10倍的時間和精力。這就像在向一個極其吹毛求疵的同事解釋你的論證,他會質疑你的每一個微小步驟。

然而,這種煩人的精確性,卻帶來了兩個意想不到的巨大優勢。首先,它讓大規模、可信的協作成爲可能。在一個涉及50位作者的龐大項目中,陶哲軒和他的合作者們利用Lean,將一個大問題分解爲數百萬個小問題,並進行衆包。由於Lean保證了每一份貢獻的絕對正確性,他們可以進行“無信任數學”(trustless math),即接納任何人的貢獻而無需擔心其可靠性。

其次,它極大地增強了證明的可維護性。當一個證明中的某個核心參數需要被更新時(例如,將一個常數從12改進爲11),在傳統的紙筆世界裡,這將是一場災難,需要逐行檢查數百頁的論證。但在Lean中,編譯器會自動標記出所有受影響的代碼行,將數週的工作量壓縮到一兩天。

陶哲軒堅信,我們正處在一個相變 phase transition的前夜。就像當年LaTeX取代所有其他排版工具一樣,隨着AI助手的不斷進化(例如提供更智能的代碼補全和引理搜索),將證明形式化的成本與收益之比正在迅速變化。

他預測,到2026年,我們將看到由AI與人類合作完成的、達到真正研究級別的數學成果。更長遠看,AI或許能通過分析海量數據,在兩個看似無關的領域之間發現全新的、優美的猜想——這被他認爲是AI在短期內最可能實現的、真正震撼人心的突破。

在訪談的最後,當被問及對未來抱有何種希望時,陶哲軒的回答回到了教育和下一代。他認爲,科學的進步就在於,“過去非常困難的問題可能會變得微不足道...現在對我們來說似乎不可行的事情,未來可能只是家庭作業練習。”

天空之城全文整理版 初探研究級難題:柿谷猜想

萊克斯: 以下是與陶哲軒的對話,他被廣泛認爲是歷史上最偉大的數學家之一,常被稱爲數學界的莫扎特。他曾獲得菲爾茲獎和數學突破獎,並在數學和物理學的諸多令人驚歎的領域做出了開創性工作。這對我來說是巨大的榮幸,原因有很多,其中包括泰瑞在與我所有的互動中所展現出的謙遜和善意。這意義重大。這裡是萊克斯·弗裡德曼播客。

萊克斯: 您遇到的第一個真正困難的研究級數學問題是什麼?也許是讓您有所遲疑的問題?

陶哲軒: 嗯,我的意思是,在您的本科教育中,您會學到那些真正困難、看似不可能解決的問題,比如黎曼猜想、雙生質數猜想。你可以把問題任意地複雜化。那算不上是真正的問題。事實上,甚至有一些我們已知是無解的問題。真正有趣的是那些恰好介於我們相對容易解決和毫無希望之間邊界上的問題,即現有技術可以完成約90%的工作,而你只需要補足剩下10%的難題。

陶哲軒: 我認爲,作爲一名博士生,柿谷問題無疑引起了我的注意。事實上,它剛剛被解決了。這是我在早期研究中大量涉獵的一個問題。從歷史上看,它源於日本數學家柿谷宗一在大約1918年提出的一個小謎題。

萊克斯: 所以這個謎題是:你有一個在平面上的針。

陶哲軒: 把它想象成在路上開車之類的。並且你想執行一個U型轉彎。你想調轉指針的方向。但你想在儘可能小的空間內完成它。所以你想利用這塊小區域來將其調轉。但這個指針是無限靈活可控的。所以你可以想象只是讓它旋轉起來。它是一根單位針。你可以圍繞其中心旋轉它。我認爲這會給你一個面積爲,我想,四分之π的圓盤。或者你可以做一個三點掉頭,這就是我們在駕校教人們做的。而那實際上佔用了八分之π的面積。所以它比旋轉稍微更有效率。因此,有一段時間人們認爲那是使物體調轉方向最有效的方式。

陶哲軒: 但貝爾薩科維奇(Bersakovich)指出,事實上,你只需使用任意小的面積就能使針調轉方向。比如0.001,你可以進行某種非常奇特的多次來回掉頭操作,從而使針調轉方向。這樣做的話,它會經過每一箇中間方向。

陶哲軒: 這是在二維平面內嗎?是在二維平面內。所以我們對二維空間中的一切都瞭如指掌。那麼下一個問題是三維空間中會發生什麼。那麼假設哈勃太空望遠鏡是太空中的一個管狀物,而你想要觀測宇宙中的每一顆恆星。所以你想要旋轉望遠鏡以覆蓋每一個方向。而這就是不切實際的部分。假設空間非常寶貴,而實際上它完全不是。你想要佔據儘可能小的體積,以便旋轉你的“針”狀物,從而看到天空中每一顆恆星。你需要多小的體積才能做到這一點?

陶哲軒: 因此你可以修改貝爾薩科維奇的構造。那麼如果你的望遠鏡是零厚度,那麼你可以使用你所需要的儘可能小的體積。那是對二維構造的一個簡單修改。但問題是,如果你的望遠鏡不是零厚度,而只是非常非常薄,具有某個厚度delta,那麼要能夠看到每一個方向所需的最小體積作爲delta的函數是多少?隨着德爾塔變小,隨着針變細,體積應該下降。但它下降的速度有多快呢?猜想是它下降得非常非常慢,粗略來說,是呈對數關係地下降。經過大量工作後,這一點得到了證明。

陶哲軒: 所以這看起來像一個難題。它爲何如此引人關注?結果發現,它與偏微分方程、數論、幾何學、組合學中的許多問題都有着驚人的關聯。例如,在波傳播中,你潑灑一些水,就會產生水波,它們會向各個方向傳播。但波既展現粒子行爲,也展現波動行爲。所以你可以得到所謂的波包,它就像一種高度局域化的波,在空間上局域化,並隨時間向某個特定方向移動。因此,如果你在空間和時間上繪製它,它會佔據一個看起來像管狀的區域。

陶哲-軒: 因此,可能發生的情況是,你可以有一個最初非常分散的波,但在時間稍後,它會全部聚焦於一個單點。你可以想象將一顆石子投入池塘,波紋會擴散開來。但如果你對那個場景進行時間反演,並且波動方程是時間可逆的,你就可以想象波紋匯聚到一個單點,然後發生一次巨大的飛濺,甚至可能是一個奇點。因此,這樣做是可能的。從幾何學上來說,正在發生的是總是存在某種光線。因此,例如,如果這個波代表光,你可以將這個波想象成以光速傳播的光子的疊加。它們都沿着這些光線傳播,並且都聚焦於這一個點。

陶哲軒: 因此,你可以使一個非常分散的波在空間和時間上的一個點聚焦成一個高度集中的波,但隨後它會再次散焦並分離。但潛在地,如果這個猜想有一個負解,這意味着存在一種非常有效的方式,可以將指向不同方向的管狀物打包到一個體積非常非常狹窄的區域中,那麼你也能夠創造出始於...的波。會有某種波的排列,它們一開始非常非常分散,但它們不會只集中在一個點上,而是在空間和時間上會有大量的集中點。並且你可以創造出所謂的“解的爆破”現象,即這些波的振幅變得如此之大,以至於它們所遵循的物理定律不再是波動方程,而是更復雜和非線性的東西。

陶哲軒: 因此在數理物理中,我們非常關心波動方程中的某些方程是否穩定,以及它們是否能產生這些奇點。有一個著名的未解決問題,叫做納維-斯托克斯方程正則性問題。納維-斯托克斯方程是支配流體或像水這樣的不可壓縮流體的方程。這個問題問道,如果你從一個水的光滑速度場開始,它是否會集中到如此程度,以至於在某個點上速度變爲無限大?那被稱爲一個奇點。我們在現實生活中沒有看到過這種情況。如果你在浴缸裡潑水,水不會在你身上爆炸,也不會以光速飛濺出去,但潛在地它是可能發生的。事實上,近年來,共識已傾向於認爲,對於例如水的某些非常特殊的初始配置,奇點確實可以形成。但人們尚未能真正證實這一點。克萊數學研究所提出了這七個千禧年大獎難題,解決其中一個難題將獲得一百萬美元的獎金。這是其中一個。在這七個問題中,目前只有龐加萊猜想已被解決。

陶哲軒: 因此,卡凱亞猜想與納維-斯托克斯問題並非直接相關,但理解它將有助於我們理解諸如波集中等方面的某些現象,這間接地可能會幫助我們更好地理解納維-斯托克斯問題。

百萬美元難題:納維-斯托克斯方程

萊克斯: 您能談談納維-斯托克斯問題嗎?嗯,就是像您所說的,它的存在性與光滑性,一個千禧年大獎難題。是的。您在這個問題上取得了很大進展。2016年,您發表了一篇論文,名爲《三維平均納維-斯托克斯方程的有限時間爆破》。那麼,我們正在努力弄清楚這東西通常是否不會爆炸。對。但我們能確定地說它永不爆炸嗎?

陶哲軒: 對。嗯。那麼,嗯,那確實是百萬美元的問題。嗯。那麼,這就是數學家與幾乎所有其他人不同的地方。比如說,如果某件事百分之99.99的時候都成立,那麼對於大多數情況來說,這已經足夠了。但數學家是少數真正關心是否所有情況,比如百分之百,真正百分之百的所有情況都被涵蓋的人。所以,大多數流體,在大多數時候,水不會爆炸。但是,你是否能設計一個非常特殊的初始狀態來導致這種情況發生呢?

萊克斯: 也許我們應該說,這是一組在流體力學領域中起支配作用的方程,旨在理解流體的行爲方式。實際上,結果發現它確實非常複雜,你知道,流體,是的,是一種極其複雜難以建模的事物。

陶哲軒: 是的。所以,它具有實際重要性。因此,這個克雷獎問題涉及被稱爲不可壓縮納維-斯托克斯方程(組)的理論,該理論支配着像水這樣的物質的行爲。還有一種叫做可壓縮納維-斯托克斯方程(組)的理論,它支配着像空氣這樣的物質的行爲。而這對於天氣預報尤爲重要。天氣預報中包含大量的計算流體力學應用。很多時候,它實際上就是盡其所能地試圖求解納維-斯托克斯方程。還需要收集大量數據,以便他們能夠初始化方程。這牽涉到很多方面。所以,這是一個非常重要的實際問題。

萊克斯: 爲什麼很難證明該方程組的普遍性結論,例如它不會發散?

陶哲軒: 簡短的回答是麥克斯韋妖。那麼,麥克斯韋妖是熱力學中的一個概念。比如,如果你有一個裝有兩種氣體——氧氣和氮氣的盒子,你可能一開始讓所有氧氣在一邊,氮氣在另一邊,但它們之間沒有屏障,那麼它們就會混合。而且它們應該保持混合狀態。沒有理由說明它們會分離。但是,原則上,由於它們之間所有的碰撞,可能會有一種奇怪的陰謀,也許存在一個被稱爲麥克斯韋妖的微觀妖魔,它會在每次氧原子和氮原子碰撞時,使它們以這樣一種方式反彈:氧原子會漂移到一邊,而氮原子則去到另一邊。這樣就可能出現一種我們從未見過的極不可能的配置。從統計學上講,這是極不可能的。但從數學上講,這可能發生,我們不能排除這種可能性。

陶哲-軒: 這種情況在數學中經常出現。一個基本例子是圓周率的數字,3.14159 等等。這些數字看起來沒有規律,我們也相信它們沒有規律。從長遠來看,1、2 和 3 的出現次數應該與 4、5 和 6 的出現次數一樣多。圓周率的數字不應該有任何偏好,例如偏愛 7 而非 8。但也許圓周率的數字中存在某種妖魔,每當你計算出越來越多的數字時,它就會某種程度上偏向某個數字。而這是一種本不應發生的詭異現象。它沒有理由發生,但以我們當前的技術無法證明。

陶哲軒: 好的,那麼回到納維-斯托克斯方程,流體具有一定量的能量。而由於流體處於運動狀態,能量會隨之傳輸。水也具有黏性。因此,如果流體分佈在許多不同位置,流體的固有黏性就會耗散能量,使其趨於零。這正是我們實際用水進行實驗時發生的情況。你潑灑時,會產生一些湍流和波浪等等,但最終它會平靜下來。而且振幅越小,速度越小,它就越平靜。

陶哲軒: 但潛在地存在某種“惡魔”,不斷將流體的能量推向越來越小的尺度。它會移動得越來越快。速度越快,黏度效應相對越小。因此,可能會出現一種所謂的自相似爆發情景,即流體的能量從某個大尺度開始,然後將其全部能量傳遞到一個更小的流體區域,接着以更快的速度進入一個甚至更小的區域,依此類推。每次發生這種情況,所需時間可能只有上一次的一半。然後,能量實際上可以在有限時間內會聚到一點。這種情景被稱爲有限時間爆發。

陶哲-軒: 那麼在實踐中,這種情況不會發生。所以水是所謂的湍流。確實如此,如果你有一個大的水渦流,它會傾向於分解成更小的渦流。但它不會將所有能量從一個大渦流傳遞到一個小渦流。它可能會轉化爲三到四個。然後那些又分裂成各自可能的三到四個小渦流。因此能量會分散到粘度能夠控制住一切的程度。但是,如果它能以某種方式集中所有能量,將它們全部聚集在一起,並且進行得足夠快,使得粘性效應沒有足夠時間使一切平靜下來,那麼這種爆裂現象就可能發生。

陶哲軒: 因此,有些論文聲稱,哦,你只需要考慮能量守恆,並謹慎地利用粘度,就可以控制住一切,不僅是納維-斯托克斯方程,還包括許多許多這類方程。因此,過去曾有許多嘗試來獲得納維-斯托克斯方程的所謂全局正則性,這與有限時間爆裂相反,意味着速度保持光滑。然而,所有這些嘗試都失敗了。總會出現一些符號錯誤或微妙的失誤,並且無法挽救。

陶哲軒: 所以我感興趣的是嘗試解釋爲什麼我們無法反駁有限時間爆裂現象。我無法對實際的流體方程進行這項工作,因爲它們太複雜了。但是,如果我能對納維-斯托克斯運動方程進行平均化處理,也就是說,如果我能關閉某些類型的水相互作用方式,只保留我想要的。具體來說,如果存在流體,並且它能將能量從一個大渦流傳遞到這個小渦流或另一個小渦流,我就會關閉會將能量傳遞給這個渦流的能量通道,只將其導向這個更小的渦流,同時仍保留能量守恆定律。

萊克斯: 所以你正在嘗試製造一個爆破解。

陶哲軒: 是的。所以我基本上通過改變物理定律來構造一個爆破解,這是數學家被允許做的一件事。我們可以改變方程。

萊克斯: 這如何幫助你更接近某個證明呢?

陶哲軒: 對。所以它提供了數學中所謂的“障礙”。所以我所做的,基本上是,如果我關閉了方程的某些部分,這通常會在你關閉某些相互作用時,使其非線性程度降低,變得更正則,更不容易爆破。但我發現,通過關閉一組精心設計的相互作用,我能迫使能量在有限時間內爆發。這意味着,如果你想證明納維-斯托克斯方程(即真實方程)的整體正則性,你必須利用真實方程的某些特性,而我的構造方程並不滿足這些特性。因此,這排除了某些方法。

陶哲軒: 數學的一個特點是,它不僅僅是找到或採用一種行之有效並加以應用的技術,而是你需要避免採用那些行不通的技術。對於那些真正困難的問題,你常常會想到幾十種可能適用於解決問題的方法。但只有在積累了大量經驗之後,你纔會意識到這些方法根本行不通。因此,對於鄰近問題擁有這些反例,在某種程度上排除了(某些方法)。它爲你節省了大量時間,因爲你不會再把精力浪費在你現在已知絕不可能奏效的事情上。

萊克斯: 它與流體動力學的那個特定問題有多大關聯,還是僅僅是你對數學建立起來的更普遍的直覺?

陶哲軒: 沒錯,是的。我的技術利用的關鍵現象是所謂的超臨界性。在偏微分方程中,這些方程常常是不同力之間的一場拔河。在納維-斯托克斯方程中,存在源於粘性的耗散力,它已被充分理解。它是線性的,能使事物平息下來。如果只有粘性存在,那麼就永遠不會發生任何不好的事情。但也存在輸運效應,即空間某一位置的能量會因爲流體運動而被輸運到其他位置。

萊克斯: 那是一種非線性效應,它導致了所有問題。

陶哲軒: 因此,納維-斯托克斯方程中有兩個相互競爭的項:耗散項和輸運項。如果耗散項佔主導,如果它很大,那麼基本上就會得到正則性。如果輸運項佔主導,那麼我們就不知道會發生什麼了。這是一個非常非線性的局面。它是不可預測的。它是湍流的。因此,有時這些力在小尺度上處於平衡,但在大尺度上卻不平衡,反之亦然。所以納維-斯托克斯方程是所謂的超臨界方程。因此,在越來越小的尺度上,輸運項遠強於黏性項。所以黏性項是使事物平靜下來的因素。

陶哲軒: 這就是爲什麼這個問題在二維空間中很難。蘇聯數學家奧爾加·拉德任斯卡婭在20世紀60年代表明,在二維空間中不存在爆破。而在二維空間中,納維-斯托克斯方程是所謂的臨界方程。輸運效應和粘性效應的強度大致相同,即使在非常非常小的尺度上也是如此。我們有很多技術來處理臨界和次臨界方程,並證明其正則性。但對於超臨界方程,情況尚不清楚。

陶哲軒: 我做了大量工作,隨後也有許多後續研究表明,對於許多其他類型的超臨界方程,你可以創建各種爆裂例子。一旦非線性效應在小尺度上主導了線性效應,就會出現各種糟糕的情況。因此,這是這項研究的主要見解之一,即超臨界性與臨界性和次臨界性之間存在巨大差異。

陶哲軒: 我的意思是,這是一個關鍵的定性特徵,它區分了一些方程,使它們表現得良好且可預測,比如行星運動。我的意思是,有些方程你可以預測數百萬年,或者至少數千年。再說,這並非真正的問題。但我們無法預測兩週以後天氣的原因是,它是一個超臨界方程。許多非常奇怪的事情正在極小的尺度上發生。

萊克斯: 因此,無論何時存在巨大的非線性源,都可能爲預測將要發生的事情帶來巨大的問題。

陶哲-軒: 是的,如果非線性在小尺度上不知何故變得越來越顯著和有趣。我的意思是,有許多方程是非線性的,但在許多方程中,你可以通過整體來近似事物。例如,行星運動,如果你想了解月球或火星等的軌道,你並不真正需要了解月球地震學的微觀結構或者質量究竟是如何分佈的。你可以將這些行星近似爲質點。而只有整體行爲才重要。但是如果你想模擬流體,比如天氣,你不能只說在洛杉磯,溫度是多少,風速是多少。對於超臨界方程,最精細的確認確實非常重要。

奇思妙想:構建一臺“流體計算機”

萊克斯: 如果我們能稍微深入探討一下納維-斯托克斯方程。你曾提出,或許你可以描述一下,解決它的方法之一,或者說以負面方式解決它的方法之一,將是構建一個液體,一種液態計算機。然後展示計算理論中的停機問題對流體動力學有影響。所以以此方式展示。你能描述一下這個想法嗎?

陶哲軒: 對。嗯。這源於構建這個失控的平均方程的工作。所以作爲我必須做這件事的一部分,有一種樸素的方法來做這件事。你只是不斷地推動。每當你在一個尺度上獲得能量時,你立即儘可能快地將其推向下一個尺度。這是一種強制性地造成發散的樸素方法。結果發現在五維及更高維度中,這確實有效。但在三維空間中,我發現了一種奇特的現象。那就是如果你改變物理定律,你總是試圖將能量推向越來越小的尺度。結果是能量開始同時擴散到許多尺度上。所以你在一個尺度上擁有能量,你把它推向下一個尺度,然後一旦它進入那個尺度,你也會把它推向下一個尺度,但前一個尺度上仍然有一些能量殘留。你試圖同時完成所有事情。而這使得能量擴散得過於分散。結果發現,這使得它更容易受到粘性的影響,進而將一切都阻尼耗散掉。因此,事實證明這種直接方法實際上並不可行。還有一篇由其他作者撰寫的論文,實際在三維空間中展示了這一點。

陶哲軒: 所以我需要做的就是編程一個延遲,有點像氣閘。所以我需要一個方程,它會從流體在某個尺度上發生作用開始,將這種能量推入下一個尺度,但能量會停留在那裡,直到所有來自更大尺度的能量都轉移完畢。只有在你將所有能量都推入之後,你才能打開下一個“門”,然後也將它推入。通過這樣做,能量逐個尺度地緩慢向前移動,使得它一次只侷限在一個尺度上。這樣它就能抵抗黏性效應,因爲它沒有被分散。

萊克斯: 因此,爲了實現這一點,我不得不構建一個相當複雜的非線性關係。

陶哲軒: 這基本上就像構建一個電子電路。實際上,我爲此感謝了我的妻子,因爲她是一名電氣工程師。

萊克斯: 她必須設計電路等等。

陶哲軒: 如果你想要一個能做某事的電路,比如讓燈光閃爍、亮滅交替,你可以用更原始的元件,比如電容器、電阻器等來構建它。你必須繪製一個圖表。通過這些圖表,你可以憑肉眼跟蹤,然後說,哦,電流會在這裡積累,然後停止,再然後它會那樣做。所以我知道如何構建基本電子元件的模擬物,比如電阻器和電容器等等。我會將它們堆疊起來,以創造出能打開一個門的裝置,然後會有一個計時器。然後一旦計時器達到某個閾值,它就會將其關閉。它有點像魯布·戈德堡式的機器,但卻是用數學方式描述的。結果這最終奏效了。

陶哲軒: 所以我意識到,如果你能對實際方程實現同樣的事情,也就是說如果水的方程支持計算,那麼你就可以想象一種蒸汽朋克,但它實際上是一種水朋克類型的東西,你知道,現代計算機是電子的,它們由電子通過非常微小的導線並與其他電子相互作用等來供電。但你可以想象這些水脈衝以一定的速度移動,而不是電子。也許存在兩種不同的配置,分別對應着一位(比特)的向上或向下狀態。如果讓兩個這樣的移動水體相撞,它們可能會產生某種新的配置,類似於一個與門或或門。輸出將以一種高度可預測的方式取決於輸入。你可以將它們串聯起來,或許就能創造出一臺圖靈機。這樣你就能擁有完全由水構成的計算機了。

萊克斯: 如果你擁有計算機,那麼也許就能實現機器人技術、液壓技術等等。這樣你就可以創造出一種機器,它基本上是流體模擬的,也就是所謂的馮·諾依曼機器。

陶哲軒: 馮·諾依曼提出,如果你想殖民火星,僅僅是運送人員和機器到火星的成本,就已高得荒謬。但如果你能將一臺機器運送到火星,而這臺機器有能力開採行星、製造更多材料、冶煉它們並建造更多相同的機器副本,那麼隨着時間的推移,你就能殖民整個行星。所以如果你能建造一臺流體機器,它就是一臺流體機器人。它的作用,它存在的目的,是它被編程爲會以某種“冷”狀態創造出自身的更小版本。它暫時不會啓動。一旦準備就緒,這個配置好的水體形態的大機器人會將其所有能量轉移給更小的配置體,然後關閉。然後它會自行清理。然後剩下的就是這種最新的狀態,它會隨後啓動並做同樣的事情,但更小、更快。然後這個方程具有某種尺度對稱性。一旦你這樣做,它就可以不斷迭代。

陶哲軒: 所以,原則上,這會爲實際的納維-斯托克斯方程創造一個爆破。而這正是我爲這個平均納維-斯托克斯方程設法完成的。所以它提供了這樣一種解決問題的路線圖。這現在是癡心妄想,因爲要實現這個目標,還有很多東西缺失。所以我無法創建這些基本邏輯門。我沒有這些水的特殊配置。我的意思是,有包括渦環在內的候選方案可能有效。但同時,你知道,模擬計算比數字計算要糟糕得多,因爲它總是存在誤差。你在過程中必須進行大量的糾錯。我不知道如何完全關閉這臺大機器,使其不干擾小型機器的運行。但原則上,一切皆有可能。這不與任何物理定律相矛盾。所以這可以算作這種事物是可能的一種證據。還有其他一些研究小組正在探尋使納維-斯托克斯方程爆破的方法,這些方法遠沒有我剛纔描述的這麼荒謬地複雜。他們實際上正在追求更接近於直接的自相似模型,該模型目前還不能直接生效,但可能存在比我剛纔描述的更簡單的方案來使其奏效。

萊克斯: 從納維-斯托克斯方程到這臺圖靈機,這其中確實存在着天才般的飛躍。所以,它從你試圖獲得越來越小的自相似斑點情景,轉變爲現在擁有一個越來越小的液體圖リング機,並設法探究這如何能夠用來解釋爆破現象。

陶哲軒: 我的意思是,那是一個巨大的飛躍。因此,存在先例。我的意思是,數學的特點在於它非常擅長找出你可能認爲完全不同的問題之間的聯繫。但如果數學形式相同,你就可以建立聯繫。因此,之前有很多關於所謂細胞自動機的工作,其中最著名的是康威生命遊戲。這是一個無限的離散網格,在任何給定時間,網格要麼被一個細胞佔據,要麼是空的。細胞如何演化,遵循着一個非常簡單的規則。因此,細胞有時存活,有時死亡。我還是學生時,讓這些動畫持續運行是一個非常流行的屏幕保護程序。它們看起來非常混沌。事實上,它們有時有點像湍流。

陶哲軒: 但在某個時候,人們在“生命遊戲”中發現了越來越多有趣的結構。例如,他們發現了一種叫做“滑翔機”的東西。滑翔機是一種非常微小的、由四五個細胞組成的構型,它會演化並朝某個方向移動。那就是這個渦環。所以這是一個類比。康威生命遊戲可以看作是一種離散方程,而流體納維-斯托克斯方程則是一種連續方程。但從數學角度來看,它們具有一些相似的特性。

陶哲軒: 隨着時間的推移,人們在康威生命遊戲中發現了越來越多可以構建的有趣事物。康威生命遊戲是一個非常簡單的系統。它只有三到四個規則,但你可以在其中設計出各種有趣的結構。有一種叫做滑翔機槍的東西,它只會一個接一個地吐出滑翔機。經過大量努力,人們成功地爲滑翔機創建了與門和或門。有這樣一個龐大而令人難以置信的結構,如果你有一股滑翔機流從這裡進入,另一股滑翔機流也從這裡進入,那麼它就可能會產生一股滑翔機流作爲輸出。也許只有當兩股滑翔機流都包含滑翔機時,纔會有輸出流。但如果只有其中一股有,那麼什麼也出不來。所以他們可以建造類似那樣的東西。一旦你能夠建造這些基礎門,那麼僅僅從軟件工程的角度,你幾乎可以建造任何東西。你可以建造一臺圖靈機。我的意思是,它就像一個巨大的蒸汽朋克式裝置。它們看起來很荒謬。

陶哲軒: 但後來人們在生命遊戲中也生成了自我複製的物體。一臺巨大的機器,一臺二項式機器,它在漫長的時間裡,內部總有小型的滑翔子槍進行着這些非常蒸汽朋克式的計算,它會創造出自身的另一個版本,這個版本能夠自我複製。這真是令人難以置信。實際上,其中很多都是由業餘數學家通過社區衆包完成的。所以我對那項工作有所瞭解。因此,這也是我提出對納維-斯托克斯方程做同樣事情的部分靈感來源。模擬遠不如數字。你不能直接拿“生命遊戲”中的構造並照搬過來。但話又說回來,這隻表明它是可能的。

結構與隨機:數學的二元對立

萊克斯: 你知道,這些元胞自動機中會發生某種涌現現象。局部規則,也許與流體類似,我不知道,但大規模運行的局部規則可以創造出這些極其複雜的動態結構。你認爲其中任何一部分適合進行數學分析嗎?我們有工具對此進行深入闡述嗎?

陶哲軒: 問題是,你可以獲得這種涌現的、非常複雜的結構,但只有在初始條件經過非常精心準備的情況下才行。所以這些滑翔機槍、邏輯門和軟件機器,如果你只是隨機地在“生命遊戲”中放置一些細胞,你將看不到任何這些東西。這就是與納維-斯托克斯方程再次類比的情況。在典型的初始條件下,你不會遇到任何這種奇怪的計算。但基本上,通過工程設計,以非常特殊的方式專門設計事物,你可以做出巧妙的構造。

萊克斯: 我不知道是否有可能證明其反面,比如,基本上證明只有通過工程設計才能創造出有趣的東西。

陶哲軒: 這是數學中一個反覆出現的挑戰,我稱之爲結構與隨機性之間的二元對立。即你在數學中生成的大多數對象都是隨機的。它們看起來是隨機的,比如圓周率的各位數字。嗯,我們認爲這是一個很好的例子。但只有極少數事物具有模式。你可以通過構造它來證明某物具有模式。如果某物具有簡單的模式,並且你有一個證明表明它會每隔一段時間重複自身,你就可以做到這一點。你可以證明大多數數字序列沒有規律。如果你只是隨機選取數字,有一個稱爲大數定律的法則告訴你,從長遠來看,你得到的一的數量會和二的數量一樣多。

萊克斯: 但我們擁有的工具要少得多。

陶哲軒: 如果我給你一個特定的模式,比如圓周率的數字,我如何才能證明它不包含某種奇怪的模式呢?我投入大量時間從事的另一項工作是證明所謂的結構定理或逆定理,這些定理提供了檢驗某物何時具有很強結構性的方法。

陶哲軒: 因此,有些函數被稱爲加性的。比如你有一個將自然數映射到自然數的函數,所以二可能映射到四,三映射到六,依此類推。有些函數被稱爲加性的,這意味着如果你將兩個輸入相加,輸出也會相應地相加。例如,我正在乘以一個常數。如果你將一個數字乘以10,如果你將a加b的結果乘以10,這等同於將a乘以10,將b乘以10,然後再將它們相加。因此,有些函數是可加的。

陶哲軒: 有些函數是近似可加的,但不是完全可加的。舉例來說,如果我取一個數字n,將其乘以2的平方根,然後取其整數部分。所以10乘以2的平方根大約是14點幾。因此10變成了14,20變成了28。所以在這種情況下,可加性是成立的。因此10加10是20,而14加14是28。但由於這種取整,有時會出現舍入誤差。有時當你將a加b時,這個函數不能完全給出兩個單獨輸出的總和,而是總和加一或減一。所以它幾乎是可加的,但並非完全可加。

陶哲軒: 所以在數學中有許多有用的結果,而我也在很大程度上致力於發展這類理論,其大意是,如果一個函數展現出某種結構,那麼它基本上……它之所以成立是有原因的。而原因在於,存在某個與之相關的函數是完全有結構的,它解釋了你所觀察到的這種局部模式。

萊克斯: 因此,如果你擁有這些逆定理,它就會形成一種二分法:你所研究的對象要麼完全沒有結構,要麼以某種方式與有結構的事物相關聯。

陶哲軒: 無論哪種情況,你都能取得進展。一個很好的例子是,數學中有一個經典定理,叫做塞邁雷迪定理,它在1970年代被證明。它涉及在一個數集中尋找某種類型的模式。這些模式必須形成等差數列,例如3、5和7,或者10、15和20。塞邁雷迪證明,任何足夠大的數集,即所謂具有正密度的數集,都包含你想要的任意長度的等差數列。

陶哲軒: 例如,奇數集合的密度爲二分之一,並且它們包含任意長度的等差數列。在那種情況下,這顯而易見,因爲奇數非常有結構性。我可以只取11、13、15、17。我可以輕易地在該集合中找到等差數列。但塞邁雷迪定理也適用於隨機集合。如果我取奇數集合,然後對每個數字拋一次硬幣,我只保留那些我拋出正面的數字。好的,我只是拋硬幣,我只是隨機取出半數數字,我保留一半。所以這是一個根本沒有任何模式的集合。但僅僅從隨機波動中,你仍然會在那個集合中得到很多等差數列。

萊克斯: 你能證明在一個隨機...中存在任意長度的等差數列嗎?是的。

陶哲軒: 你聽說過無限猴子定理嗎?通常,數學家給定理起的名字都很無趣,但偶爾他們也會起一些生動的名字。無限猴子定理的通俗說法是,如果你有無限數量的猴子,每隻猴子一臺打字機,它們可以隨機敲出文本。幾乎可以肯定,其中一隻猴子將會敲出《哈姆雷特》的全部內容,或任何其他有限的文本串。這只是需要一些時間,實際上是相當長的時間。但如果你有無限的數量,那麼它就會發生。所以基本上,該定理指出,如果你取一個無限長的數字串或其他什麼,最終你想要的任何有限模式都將出現。這可能需要很長時間,但它最終會發生。尤其地,任何長度的等差數列最終都會出現,但這需要一個極其長的隨機序列才能實現。

萊克斯: 我想這很直觀。它只是無窮。是啊,無窮大能包容許多弊病。

陶哲軒: 我們人類該如何應對無窮大?嗯,你可以把無窮大看作是一個沒有上限的有限數的抽象。

萊克斯: 現實生活中沒有什麼是真正無限的,但你可以問自己這樣的問題:如果我想要多少錢就有多少錢,或者如果我想跑多快就跑多快,那會怎樣?

陶哲軒: 數學家將此形式化的方法是:數學找到了一個形式體系,可以理想化地將某個極其大或極其小的量,精確地變爲無窮大或零。通常,當你這樣做時,數學會變得簡潔很多。在物理學中,我們開玩笑說假設球形奶牛。現實世界的問題存在各種實際效應,但你可以將其理想化,將某些量推向無窮大,將另一些量推向零,這樣數學處理起來就會簡單得多。

萊克斯: 我想知道,使用無窮概念在多大程度上迫使我們偏離現實物理學。

陶哲軒: 是的,所以有很多陷阱。我們在本科數學課上花費大量時間教授分析學,而分析學通常是關於如何取極限的。例如,a加b總是等於b加a。因此,當你擁有有限項時,你可以把它們加起來,也可以交換它們的順序,沒有任何問題。但是,當你擁有無限項時,你就可以玩弄這些花招,一個級數可能收斂於一個值,但你重新排列它,它卻突然收斂到另一個值。所以你可能會犯錯誤。當你允許使用無窮概念時,你必須清楚自己在做什麼。你必須引入這些ε和δ,而且有一種特定的推理方式可以幫助你避免錯誤。

陶哲軒: 近些年,人們開始將那些在無限極限下成立的結果進行所謂的有限化處理。所以你最終會知道某件事是真的,但你不知道是何時。現在給我一個速率。那麼,如果我沒有無限數量的猴子,而是大量的有限數量的猴子,我需要等多久《哈姆雷特》才能出現?那是一個更具定量性質的問題。而這是你可以純粹通過有限方法來處理的問題,並且你可以運用你的有限直覺。在這種情況下,結果表明它與你試圖生成的文本長度呈指數關係。這就是爲什麼你從來看不到猴子創作出《哈姆雷特》。你也許能看到它們創造出一個四個字母的單詞,但絕沒有那麼大的作品。所以我個人認爲,一旦你將一個無限的陳述有限化,它就會變得更直觀,也不再那麼奇怪了。

萊克斯: 所以即使你正在處理無限,將其有限化也是好的,這樣你就能獲得一些直覺。

陶哲軒: 是的。不利之處在於,有限化證明要混亂得多。因此,無限的證明通常會先被發現,通常會早幾十年,然後人們再將它們有限化。

數學、物理與現實的壓縮

萊克斯: 既然我們提到了很多數學和物理,那麼作爲學科,作爲理解世界、看待世界的方式,數學和物理之間有什麼區別呢?也許我們可以把工程學也加進去。你提到你的妻子是一名工程師。這爲電路提供了新的視角。那麼,鑑於你從事過數理物理學,你看待世界的方式就有所不同。你身兼多職。

陶哲軒: 沒錯。那麼,我認爲科學總的來說是三者之間的相互作用。一是真實世界,二是我們對真實世界的觀察,即我們的觀測結果,然後是我們關於世界如何運作的心理模型。因此,我們無法直接接觸現實。我們所擁有的只有那些不完整且存在誤差的觀測結果。並且在許多許多情況下,我們可能想知道,例如,明天的天氣如何?而我們尚未獲得我們希望預測的觀測結果。然後我們有這些簡化模型,有時會做出不切實際的假設,你知道,就像球形奶牛之類的東西。那些就是數學模型。

陶哲軒: 數學關注的是模型。科學收集觀測結果,並提出可能解釋這些觀測結果的模型。數學所做的是,我們停留在模型之內,並詢問該模型會產生什麼結果?模型會針對未來的觀測或過去的觀測做出什麼樣的觀測結果,什麼樣的預測?它符合觀測數據嗎?所以,這確實是一種共生關係。我想數學在其他學科中是獨特的,因爲我們從假設開始,比如一個模型的公理,然後詢問從該模型中能得出什麼結論。在幾乎所有其他學科中,你都是從結論開始,比如我想做這個,我想建一座橋,我想賺錢,我想做這個,然後你找到實現目標的路徑。很少有人會推測“假設我這樣做,會發生什麼?”規劃與建模。也許,科幻小說是另一個特例。但實際上,也就這些了。我們生活中所做的大多數事情都是結果導向的,包括物理學和科學。我的意思是,他們想知道這顆小行星會去哪裡?明天的天氣會怎樣?但數學也有另一個方向,那就是從公理出發。

萊克斯: 你認爲,在物理學中,理論與實驗之間存在着這種張力。你認爲哪種方式更能有效地發現關於現實的真正新穎的想法?

陶哲軒: 嗯,你需要兩者兼備,自上而下和自下而上。這實際上是所有這些事物之間的相互作用。因此,隨着時間的推移,觀測、理論和建模都應該更接近現實。但最初,情況總是如此,它們一開始總是相距甚遠,但你需要其中一個來弄清楚如何推動另一個。如果你的模型預測到實驗未能發現的異常,這會指示實驗人員去哪裡尋找更多數據,以完善模型。這是一個反覆往復的過程。

陶哲軒: 在數學本身內部,也存在理論和實驗的組成部分。只不過,直到最近,理論才幾乎完全佔據主導地位。99% 的數學是理論數學,而實驗數學的數量非常少。人們確實在做。如果他們想研究質數或類似的東西,他們可以生成大量數據集。所以一旦我們有了計算機,我們就開始做了一點。儘管甚至在高斯之前,例如,他猜想了數論中最基本的定理,稱爲質數定理,該定理預測了從一百萬到一萬億有多少個質數。這不是一個顯而易見的問題。基本上,他所做的是,主要靠自己計算,但也僱傭了人工計算員——那些以算術計算爲專業工作的人——來計算前100,000個質數或類似數字,並製作了表格,做出了預測。那是實驗數學的一個早期例子。

陶哲軒: 但直到最近,理論數學一直要成功得多。當然,直到最近,進行復雜的數學計算一直都不可行。即使在今天,儘管我們擁有強大的計算機,也只有部分數學問題能夠通過數值方法進行探索。有一種現象叫做組合爆炸。如果你想研究,例如,澤默爾迪定理,你想要研究1到1,000這些數字的所有可能子集。只有1,000個數字。情況能有多糟呢?結果是,1到1,000的不同子集數量是2的1,000次方,這遠遠大於任何計算機目前能夠列舉的數量。事實上,任何一臺計算機都能進行枚舉。有些數學問題很快就變得無法通過直接暴力計算來攻克。國際象棋是另一個著名的例子。國際象棋的局面數量,我們無法讓計算機完全探索。

陶哲軒: 但是現在我們有了人工智能。我們有了探索這個空間的工具,並非有百分之百的成功保證,而是通過實驗。現在我們可以通過實證方法攻克國際象棋了。例如,我們有非常、非常優秀的人工智能。它們不會探索博弈樹中的每一個局面,但已經找到了非常好的近似解。人們正在使用這些國際象棋引擎進行實驗性國際象棋。他們正在重新審視舊的國際象棋理論,比如哪種開局、哪種走法好,哪種不好。他們可以使用這些國際象棋引擎來實際完善,甚至在某些情況下推翻關於國際象棋的傳統觀念。我確實希望未來數學能有更大的實驗成分,也許由人工智能驅動。

萊克斯: 路易斯:嗯,當然,談談那個。但就國際象棋而言,數學中也有類似的情況,我不認爲它提供了一種對不同局面的形式化解釋。它只是說明哪個局面更好或不好,而這作爲人類你可以憑直覺感知到。然後,從那(些信息)中,我們人類可以構建出關於此事的理論。你提到了柏拉圖的洞穴寓言。所以,以防人們不知道,它指的是人們觀察到的是現實的影子,而非現實本身。而且他們相信自己所觀察到的就是現實。從某種意義上說,這是否就是數學家乃至所有人類正在做的事情,即審視現實的影子?我們有可能真正觸及現實嗎?

陶哲軒: 嗯,存在這三種本體論上的事物。有實際現實,有觀察結果,還有我們的模型。嚴格來說,它們是不同的,我認爲它們將永遠是不同的。但它們會隨着時間的推移而日益接近。而這種接近的過程往往意味着你必須摒棄你最初的直覺。天文學提供了很好的例子。對世界的最初模型是它是平的,因爲它看起來就是平的。而且它很大。宇宙的其他部分,比如太陽,看起來非常小。因此,你從一個實際上與現實相去甚遠、但符合你現有觀測的模型開始。但隨着時間的推移,當你進行越來越多的觀測,使其更接近現實時,模型也隨之演進。因此,隨着時間的推移,我們不得不認識到地球是圓的,它在自轉,它繞着太陽系運行,太陽系繞着銀河系運行,等等。宇宙正在膨脹。膨脹是自行發生並加速的。事實上,就在最近,大約在這一年左右,甚至宇宙本身的這種體現都證明了它並非恆定不變。

萊克斯: 而其背後的解釋是……它正在追趕。它正在追趕。

陶哲軒: 我的意思是,這仍然是關於暗物質、暗能量這類事情。是的。我們有一個模型,它某種程度上能解釋並與數據非常吻合。它只是有幾個你必須指定的參數。人們說,哦,那是湊數因子。有了足夠的湊數因子,你就能解釋任何事情。但這個模型的數學要點是,你的模型中的參數數量應少於你的觀測數據集中的數據點數量。因此,如果你有一個包含10個參數的模型,它解釋了10個觀測值。那是一個完全無用的模型。這就是所謂的過擬合。但是,如果你有一個雙參數模型,它能解釋一萬億個觀測結果,這基本上就是……所以,是的,暗物質模型,我認爲它大約有14個參數,並解釋了天文學家擁有的數拍字節的數據。

陶哲軒: 你可以將一個理論視爲(或者說,一種看待物理數學理論的方式是),它是一種對宇宙的壓縮,也是一種數據壓縮。因此,你擁有這些數拍字節的觀測數據,你希望將其壓縮成一個可以用五頁紙描述並指定一定數量參數的模型。而且,如果它能以合理的精度擬合你幾乎所有的觀測數據,我的意思是,你進行的壓縮越多,你的理論就越好。

萊克斯: 事實上,我們的宇宙及其萬物最令人驚訝的發現之一就是它竟然是可壓縮的。這就是數學不可思議的有效性。

陶哲軒: 是的,愛因斯坦曾有類似的引述,宇宙最不可理解之處在於它是可理解的。對。而且不僅僅是可理解的,你可以建立一個方程,實際上對此存在某種數學上的可能解釋。因此,在數學中存在一種稱爲普適性的現象。因此,許多宏觀尺度上的複雜系統源於微觀尺度上大量的微小相互作用。通常,由於常見的複雜性爆炸形式,您會認爲宏觀方程必定比微觀方程複雜無數倍。如果您想完全精確地求解它們,它們確實如此,就像您想模擬一盒空氣中的所有原子一樣,阿伏伽德羅常數是龐大無比的。粒子數量龐大。如果您真的要追蹤每一個粒子,那將是荒謬的。然而,某些定律在宏觀尺度上涌現,它們幾乎不依賴於微觀尺度上發生的事情,或只依賴於極少數參數。因此,如果您想模擬一個箱子中百京個粒子構成的氣體,您只需知道它的溫度、壓強、體積和少數幾個參數,比如五六個。它幾乎模擬了您需要知道的關於這些10^23個或其他數量粒子的一切。

陶哲軒: 因此,我們在數學上對普適性的理解還遠未達到我們希望的程度,但存在一些簡單得多的玩具模型,通過它們我們確實對普適性爲何發生有了很好的理解。最基本的一個是中心極限定理,它解釋了爲什麼鐘形曲線在自然界中隨處可見,爲什麼如此多的事物都遵循所謂的高斯分佈。著名的鐘形曲線。甚至沒有一個模因是關於這種曲線的。而且這個模因甚至廣泛適用。這個模因具有普遍性。是的,如果你願意,你可以稱之爲“元”。

陶哲軒: 但有許多許多過程。例如,你可以取許多許多獨立的隨機變量,並以各種方式將它們平均起來。你可以取一個簡單的平均值,或者一個更復雜的平均值,並且我們可以在各種情況下證明這些鐘形曲線,這些高斯分佈,會涌現出來。而且這是一個令人滿意的解釋。有時它們不會。因此,如果你有許多不同的輸入,並且它們都以某種系統性方式相互關聯,那麼你就會得到一個與鐘形曲線相去甚遠的結果。當中心極限定理失效時,這一點同樣重要。

陶哲軒: 因此,普適性並非百分之百可靠的依據。全球金融危機就是其中一個著名的例子。人們認爲抵押貸款違約具有高斯型行爲,即如果你調查10萬擁有抵押貸款的美國人,就能知道他們中有多少比例的人拖欠抵押貸款。如果一切都是不相關聯的,那麼就會呈現鐘形曲線,你就可以利用期權和衍生品等工具來管理風險。而且這是一個非常優美的理論。但是,如果經濟中存在系統性衝擊,導致所有人同時違約,那就是非常典型的非高斯行爲了。而這一點在2008年並未得到充分考量。現在我認爲人們對這種系統性風險實際上是一個更大的問題有了更多的認識。僅僅因爲模型看起來很美觀、很理想,它可能並不符合現實。

陶哲軒: 因此,弄清楚模型如何運作的數學原理非常重要。但同樣重要的是,驗證模型何時符合現實、何時不符合的科學。我的意思是,兩者都需要。但數學可以提供幫助,因爲它可以通過,例如,這些中心極限定理告訴你,如果你有一些特定的公理,比如不相關性,即如果所有輸入之間都不相關,那麼你就會表現出高斯行爲,所以事情就沒問題。它告訴你模型的弱點在哪裡。

萊克斯: 因此,如果你對中心極限定理有數學上的理解,並且有人提議使用這些高斯聯結函數或其他什麼來建模違約風險,如果你受過數學訓練,你會說:“好的,但是你所有輸入之間的系統性相關性是什麼?”那麼你就可以問經濟學家,那會帶來多大風險?

陶哲軒: 然後你就可以去尋找答案。所以科學和數學之間總是存在這種協同作用。

狐狸與刺蝟:數學研究的兩種風格

萊克斯: 關於普適性的話題。您因涉足令人難以置信的數學廣度而聞名並備受推崇,這讓人想起百年前的希爾伯特。事實上,偉大的菲爾茲獎得主數學家蒂姆·高爾斯曾說,您是我們所能見到的最接近希爾伯特的人。他是您的同事。不過,您以這種在數學領域兼具深度和廣度的能力而聞名。所以您是提問的最佳人選,您認爲是否存在連接所有不同數學領域的線索?所有的數學是否都存在一種深層的潛在結構?

陶哲軒: 當然有很多連接的線索。許多數學的進步都可以用兩個之前沒有關聯的數學領域發現連接的故事來體現。一個古老的例子是幾何學和數論。在古希臘時代,這些被認爲是不同的學科。數學家同時研究兩者。歐幾里得既研究幾何學(最爲著名),也研究數。但它們並沒有真正被認爲是相關的。我的意思是,有一點點。你可以說這段長度是那段長度的五倍,因爲你可以取這段長度的五份,依此類推。但直到笛卡爾——他真正發展了我們現在所稱的解析幾何——才能夠用兩個實數來參數化平面這個幾何對象。因此,幾何問題可以轉化爲關於數的問題。而如今,這幾乎顯得微不足道。這沒有任何實質內容。當然,你知道,平面是x和y,因爲這就是我們所教的,而且它已被內化。但這兩大領域的統一是一個重要的發展。

陶哲軒: 這種過程在整個數學領域中反覆上演。代數和幾何曾是分離的,而現在我們有了代數幾何,它將它們一次又一次地連接起來。這無疑是我最喜歡的數學類型。所以我想成爲“狐狸”有不同的風格。狐狸略知多事,而刺蝟則精通一事。而在數學領域,刺蝟型和狐狸型的人都確實存在。還有一些人可以兼顧這兩種角色。我認爲數學家之間理想的合作需要一些多樣性。一隻狐狸與許多刺蝟協作,或反之亦然。所以,是的,但我主要認爲自己是一隻狐狸,毋庸置疑。我某種程度上喜歡套利,比如學習一個領域如何運作,學習那個領域的訣竅,然後進入另一個人們認爲不相關的領域,但我可以運用這些訣竅。從而看到這些領域之間的聯繫。

陶哲軒: 是的。所以還有其他數學家比我深入得多。他們真的是刺蝟。他們瞭解一個領域的一切,並且在那個領域中快得多,也有效得多,但我可以給他們這些額外的工具。

萊克斯: 我的意思是,你曾說過,根據語境和合作方式的不同,你既可以是刺蝟,也可以是狐狸。那麼,如果可能的話,你能否談談這兩種思考問題方式之間的區別?比如說你遇到了一個新問題,你知道,是尋找聯繫還是非常單一的關注點。

陶哲軒: 我更喜歡“狐狸範式”。是的。所以是的,我喜歡尋找類比、敘事。我花了很多時間,如果有一個結果,我在一個領域看到了它,並且我喜歡這個結果。這是一個很棒的結果,但我不喜歡它的證明。比如它使用了我不太熟悉的數學類型。我經常嘗試使用iFavor自己重新證明它。通常我的證明更差,但通過這樣的練習,我可以說,哦,現在我能明白其他證明想做什麼了。從中我可以對該領域所使用的工具有所瞭解。所以它極具探索性,在各種古怪的領域中進行各種瘋狂的嘗試,並且大量地重複造輪子。

陶哲-軒: 而我認爲,刺蝟型風格則更具學術性。你非常注重知識。你及時瞭解該領域的所有進展。你瞭解所有歷史。你對每種特定技術的優缺點都有非常透徹的理解。我認爲你會更依賴計算,而不是試圖尋找敘事。嗯,所以說,我雖然也能做到,但有其他人在那方面極其出色。

證明之美與歐拉恆等式

萊克斯: 讓我們退一步,也許來看看一個有點浪漫化的數學版本。所以我想你曾說過,在你年輕的時候,數學在你生命早期更像是一種解謎活動。你是何時第一次遇到一個問題或證明,讓你意識到數學可以具有一種優雅和美感?

陶哲軒: 這是一個很好的問題。當我來到普林斯頓讀研究生時,約翰·康威當時就在那裡。他幾年前去世了。但我記得我聽的非常早期的研究講座之一,就是康威關於他所謂的“極端證明”的講座。所以康威就是有這種驚人的方式,以你通常不會想到的方式去思考各種事物。所以他認爲證明本身佔據着某種空間。所以如果你想證明某事,比如說存在無限多的素數,你會有所有這些不同的證明,但你可以在不同的軸向上對它們進行排序。比如有些證明是優雅的,有些證明是冗長的,有些證明是初等的,等等。因此,就有了這樣一個概念空間。因此,所有證明的空間本身具有某種形狀。

陶哲軒: 因此,他對這種形狀的極點很感興趣。比如在所有這些證明中,最短的證明最接近其他所有證明,或者是最初等的,或者諸如此類。因此,他舉了一些著名定理的例子,然後給出他認爲在這些不同方面上的極致證明。我發現那真是令人大開眼界。這不僅僅是爲一個有趣的結果找到一個證明,而是在有了那個證明之後,嘗試以各種方式對其進行優化。證明工作本身就蘊含着某種匠心。

陶哲軒: 這對我的寫作風格有所啓發。就像你作爲一名本科生做數學作業、家庭作業等等時,你某種程度上被鼓勵只寫下任何可行的證明。只要它得到一個勾號,你就繼續前進。但如果你想讓你的成果真正具有影響力並被人們閱讀,它就不能僅僅是正確的。它還應該讀起來令人愉悅,具有啓發性,並能適應推廣到其他事物。

陶哲軒: 這在許多其他學科中也是如此,比如編程。數學和編程之間有很多類比。我喜歡類比,如果你還沒注意到的話。你可以編寫出意大利麪條式的代碼,它能完成特定任務,雖然快速而粗糙,但它確實有效。但有許多編寫高質量代碼的良好原則,這樣其他人就可以使用它,在其基礎上進行開發等等,並且錯誤更少,諸如此類。數學也有類似的情況。

萊克斯: 是的,首先,那裡有許多美妙之處。卡邁勒是史上最傑出的數學家和計算機科學家之一。僅僅是考慮證明空間,並思考:這個空間是什麼樣的?它的極端情況又是什麼?就像你提到的,編程是一個類比。這很有趣,因爲還有一項活動叫做“代碼高爾夫”,我也覺得它既精妙又有趣,人們會使用不同的編程語言來嘗試編寫完成特定任務的最短程序。我相信甚至還有這方面的比賽。這也是一種很好的壓力測試方式,不僅能測試程序,或者在本例中是證明,還能測試不同的語言。也許那是一種不同的符號系統,或其他什麼,可以用來完成不同的任務。

陶哲軒: 是的,你會學到很多。我的意思是,這可能看起來像一項無關緊要的練習,但它能產生所有這些深刻的見解,如果你沒有追逐這個人爲設定的目標,你可能就無法發現。

萊克斯: 你認爲數學中最美或最優雅的方程是什麼?我是說,人們在美中常常尋求的特質之一就是簡潔性。所以,如果你看E等於MC平方。所以,當少數幾個概念匯聚在一起時,這就是爲什麼歐拉恆等式常被認爲是數學中最美的方程。你覺得歐拉恆等式美嗎?

陶哲軒: 是的。嗯,正如我所說,我發現最吸引人的就是不同事物之間的聯繫。所以,E的πi次方等於負一。是的,人們使用了所有的基本常數。好的,我是說,那很巧妙。但對我來說,歐拉研究指數函數是爲了衡量指數增長。所以,我認爲複利或衰減,任何持續增長、持續衰減的事物,無論是增長與衰減,還是膨脹與收縮,都可以由指數函數來建模。

陶哲軒: 而圓周率則源於圓和旋轉。例如,如果你想將一根針旋轉180度,你需要旋轉π弧度。而i,即複數,代表了90度旋轉時所設想的座標軸互換。因此,它是方向上的改變。所以,指數函數代表着在你現有方向上的增長和衰減。當你將i(虛數單位)加入指數函數中時,它就不再是與你當前位置相同方向上的運動,而是與你當前位置成直角的運動。即旋轉。所以,e的iπ次方等於負1告訴你,如果你旋轉π弧度,你最終會指向相反方向。因此,它通過膨脹統一了幾何學,並通過這種複數化(即通過i進行旋轉)的行爲統一了指數增長動力學。

萊克斯: 所以,它將所有這些數學領域——你知道,是的,動力學、幾何學和複數——都連接在了一起。

陶哲軒: 因爲這個恆等式,它們在數學中幾乎都被認爲是緊密的近鄰。

萊克斯: 你認爲你提到的那個有趣之處——這些迥異領域中交匯的記法——僅僅是一個無關緊要的副作用嗎?或者你認爲當這些記法——我們所有的老朋友們——匯聚並統一起來時,其中存在真正的價值嗎?

陶哲軒: 嗯,這證實了你擁有正確的概念。所以,當你初次研究任何事物時,你必須衡量事物並給它們命名。而起初,有時因爲你的模型再次偏離現實太遠,你會將最好的名稱冠予了不正確的事物。而你只有到後來纔會發現真正重要的是什麼。

統一之路:從哈密頓量到萬有理論

陶哲軒: 物理學家有時會這樣做。我的意思是,但結果證明,沒問題。實際上,在物理學中,E等於mc平方。那麼,其中一個重要的發現就是E,對嗎?那麼,當亞里士多德首次提出他的運動定律,以及後來的伽利略、牛頓等等,他們看到了可以測量的事物。他們可以測量質量、加速度、力等等。因此,在牛頓力學中,例如,我認爲MA就是著名的牛頓第二運動定律。那麼,這些就是主要對象。於是,他們便將它們視爲理論的核心構建。

陶哲軒: 直到後來,在人們開始分析這些方程之後,才發現似乎總存在一些守恆量。具體來說,就是動量和能量。而且能量的變化並非顯而易見。它不像質量、速度等等你可以直接測量的東西。但隨着時間的推移,人們意識到這實際上是一個非常基本的概念。最終,在19世紀,哈密頓將牛頓的物理定律重新表述爲所謂的哈密頓力學,其中能量(現在稱爲哈密頓量)是主導對象。一旦你知道如何測量任何系統的哈密頓量,你就能完整地描述其動力學,例如所有狀態的演變。它確實是一個核心要素,這在最初並不明顯。

陶哲軒: 這種視角的轉變在量子力學出現時確實很有幫助。

萊克斯: 因爲早期研究量子力學的物理學家們在嘗試將他們牛頓式的思維(因爲一切皆爲粒子等等)適應量子力學時遇到了很多困難。

陶哲軒: 我認爲那是因爲存在一種方法,但它看起來真的非常、非常怪異。例如你會問,F=ma的量子對應是什麼?而要給出答案,確實非常、非常困難。然而,事實證明,在經典力學中如此隱秘地居於幕後的哈密頓量,在量子力學中也是關鍵對象。量子力學中同樣有一個被稱爲哈密頓量的對象。它是一種不同類型的對象。它是一種被稱爲算符的東西,而不是函數。但同樣地,一旦你確定了它,你就確定了全部動力學。有一個被稱爲薛定諤方程的東西,它精確地告訴你一旦有了哈密頓量,量子系統將如何演化。

陶哲軒: 它們並置時,看起來是完全不同的對象。一個涉及粒子,一個涉及波,等等。但憑藉這種核心地位,你可以開始將許多直覺和事實從經典力學實際遷移到量子力學。例如,在經典力學中,有一個叫做諾特定理的東西。物理系統中每存在一種對稱性,就對應着一條守恆定律。物理定律具有平移不變性。如果我向左移動10步,我所經歷的物理定律與我在這裡時是相同的,這對應於動量守恆。如果我旋轉某個角度,我所經歷的物理定律依然是相同的。這對應於角動量守恆。如果我等待10分鐘,物理定律仍然是相同的。所以存在時間平移不變性。這對應於能量守恆定律。因此,對稱性和守恆之間存在着這種基本聯繫。

陶哲軒: 即使方程完全不同,這在量子力學中也同樣適用。但因爲它們都源自哈密頓量,哈密頓量控制着一切。每當哈密頓量具有對稱性時,方程就會擁有一個守恆定律。一旦你有了正確的語言,它實際上會使事情變得清晰得多。

陶哲軒: 其中一個問題是我們爲何尚未能統一量子力學和廣義相對論。我們還沒有弄清楚基本客體是什麼。例如,我們必須放棄空間和時間是這些近似歐幾里得型空間的觀念。我們知道在極小尺度上,會有量子漲落,存在時空泡沫。而嘗試使用笛卡爾座標x、y、z是根本行不通的。但我們不知道用什麼來取代它。我們實際上還沒有那些能夠組織一切的數學概念,即哈密頓量的類比。

萊克斯: 你的直覺是否認爲存在一個萬有理論,因此有可能將其統一,找到一種能統一廣義相對論和量子力學的語言?我相信是這樣。我的意思是,物理學的歷史一直就是統一的歷史,就像多年來的數學一樣。

陶哲軒: 電和磁曾是獨立的理論,後來麥克斯韋將它們統一了。牛頓統一了天體的運動和地球上物體的運動,等等。所以這應該會發生。只是,再次回到觀測和理論的這個模型,我們部分的問題在於物理學是自身成功的受害者。物理學的兩大理論——廣義相對論和量子力學——現在如此出色,以至於它們加在一起涵蓋了我們能夠進行的所有觀測的99.9%。你必須去研究極其極端的粒子加速現象、早期宇宙,或是那些真正難以測量的事物,才能從這兩個理論中的任何一個獲得任何偏離,以至於你能夠真正弄明白如何將它們結合起來。但我堅信,我們幾個世紀以來一直在做這件事。我們以前取得過進展,沒有理由停止。

萊克斯: 你認爲你會成爲一個發展萬物理論的數學家嗎?

陶哲軒: 經常發生的情況是,當物理學家需要某種數學理論時,通常都會有數學家早些時候研究出的某種前身理論。所以當愛因斯坦開始意識到空間是彎曲的時候,他去找了一位數學家,問他,你知道嗎,數學家是否已經提出了一些可能有用的彎曲空間理論?然後他說,哦,是的,我想黎曼提出了一些東西。是的,黎曼確實發展了黎曼幾何,這正是關於以各種普遍方式彎曲的空間的理論,結果這幾乎與愛因斯坦理論所需的一模一樣。這可以追溯到維特根斯坦所說的數學的不可思議的有效性。我認爲那些能很好地解釋宇宙的理論,往往也涉及到那些能很好地解決數學問題的相同數學對象。歸根結底,它們都只是以有用的方式組織數據的方法。

萊克斯: 這感覺就像你可能需要去一個非常難以憑直覺理解的奇特領域。你有比如弦理論。

陶哲軒: 是的,那曾是數十年來的主要候選理論。我認爲它正逐漸失寵,因爲它與實驗不符。

萊克斯: 因此,當然,正如你所言,其中一個重大挑戰就是實驗難度很大。是的。因爲這兩種理論都非常有效。但另一方面是,你所談論的,你不僅是脫離了時空。你正在進入到維度數量多得驚人的領域。你正在做各種怪異的假設,對我們來說,我們已經遠遠偏離了你提到的我們最初的扁平地球概念。

陶哲軒: 是的,是的,是的。這確實非常令人欽佩,你願意投身競爭,在某種程度上成爲一名初學者,對嗎?或者面臨初學者會遇到的那種挑戰,對嗎?新概念,新思維方式。還有,你懂的,不擅長別人...我想在那次談話中,你可能是一位菲爾茲獎得主數學家,而一個本科生卻知道得更好。

萊克斯: 現在,我們很難用我們有限的認知能力來直觀地理解那種現實究竟是怎樣的。

陶哲軒: 這就是爲什麼類比如此重要。我的意思是,是的,地球是圓的並不直觀,因爲我們身處其中。但是,你知道,對於一般的圓形物體,我們有相當好的直覺。我們一直在談論光的運作機制等等。實際上,這是一個很好的練習,可以弄明白日食、月食以及太陽和月亮的盈虧等現象,如何能通過球形地球模型和球形月球模型輕易地解釋。你可以拿一個籃球、一個高爾夫球和一個光源,然後親自做這些事情。所以直覺是存在的,但你必須將其遷移。

萊克斯: 對我們來說,從平面地球到球形地球在智力上是一個巨大的飛躍,因爲,你知道,我們的生活主要是在平面世界中度過的。是的。加載那些信息,而我們都覺得理所當然。我們把很多事情都視爲理所當然,因爲科學已經爲此類事物建立了大量證據。但是,你知道,我們身處一個圓形的星球上。是的。在太空中穿行。是的。那是一個巨大的跨越。而且你必須進行一系列這樣的跨越。我們進步得越多。沒錯。是的。

陶哲軒: 所以現代科學也許,再次地,是其自身成功的某種犧牲品,那就是,爲了更準確,它必須越來越遠離你的最初直覺。因此對於沒有經歷過完整科學教育過程的人來說,它也因此顯得越來越可疑。所以,你知道,我們需要更多地打下基礎。我的意思是,確實有科學家在做非常出色的科普工作,但也有很多科學活動你可以在家裡進行。有很多YouTube視頻。我最近和格蘭特·桑德森一起製作了一個YouTube視頻。我們之前談論過這個,就是古希臘人如何能夠測量諸如月球和地球的距離。而且,你知道,他們使用的技術你也可以自己復現。並非所有事情都必須是像高端太空望遠鏡和非常令人望而生畏的數學那樣。

萊克斯: 是的。我強烈推薦。我相信你做了一場講座,並且還與格蘭特合作製作了一個精彩的視頻。設想自己身處那個被神秘籠罩的時代的人的思維,這是一種美好的體驗。你知道,你就像在這個星球上,你不知道它的形狀,也不知道它的大小。你看到一些星星,看到一些事物,然後你試圖在這個世界上定位自己,並試圖對各地點距離做出一些概括性的判斷。

陶哲軒: 視角的轉變真的非常重要。你說旅行開闊視野。這是一種思想旅行。你知道,設想自己身處古希臘人或任何其他時代的人的思維,提出假設,球形奶牛,等等,進行推測。實際上,這就是數學家和一些藝術家所做的事情。

萊克斯: 令人難以置信的是,在極端約束下,你仍然可以表達出非常有力的觀點。這就是它鼓舞人心的原因。回顧歷史,當沒有太多可供推斷的材料時,能弄明白多少東西。

陶哲軒: 如果你提出公理,那麼數學會允許你沿着這些公理推導出結論。而且有時,你可以從最初的假設中推導出很多東西,走得很遠。

萊克斯: 如果我們繼續探討奇特的領域,你提到了廣義相對論。你爲愛因斯坦場方程的數學理解做出了貢獻。你能解釋一下這項工作嗎?從某種數學角度來看,廣義相對論的哪些方面吸引你,哪些方面對你而言具有挑戰性?

陶哲軒: 我研究過一些方程。有波映射方程,或西格瑪場模型,它並非時空引力本身的方程,而是可能存在於時空之上的某些場的方程。因此,愛因斯坦的相對論方程僅描述時空本身。但在那之上,還存在其他場。有電磁場,有楊-米爾斯場,還有整個不同方程的層級結構,其中愛因斯坦方程被認爲是最非線性且最困難的,但在這個層級中相對較低的,就是這種被稱爲波映射方程的東西。所以它是一種波,在任何給定點上,它都像固定在球面上一樣。我可以想象空間和時間中有一束箭矢,是的,它們指向不同的方向。但它們像波一樣傳播。如果你擺動一支箭矢,它就會傳播並使所有箭矢像麥田裡的麥捆一樣移動。

陶哲軒: 我對這個問題再次感興趣的是全局正則性問題。這裡的全部能量有可能匯聚於一點嗎?我所考慮的方程實際上被稱爲臨界方程,在該方程中,所有尺度上的行爲大致相同。我勉強證明了,你實際上無法強迫所有能量集中於一點的情況發生,能量必須稍微分散一點,一旦它稍微分散,就會保持正則。是的,這要追溯到2000年。事實上,那也是我之後對氣溶膠產生興趣的部分原因。因此,我開發了一些技術來解決那個問題。

陶哲軒: 所以部分原因是,由於球體的曲率,這個問題確實是非線性的。存在某種非線性效應,它是一種非微擾效應。當你正常觀察時,它看起來比波動方程的線性效應要大。因此,即使能量很小,也很難將其控制住。但我開發了一種被稱爲規範變換的方法。所以這個方程有點像麥堆的演變,它們都在來回彎曲。因此,存在大量的運動。但如果你想象通過在空間的不同點安裝小型攝像機來穩定流體,這些攝像機試圖以捕捉大部分運動的方式移動,在這種穩定化後的流體下,流體變得更加線性。我發現了一種變換方程的方法,以減少非線性效應。然後我就能求解這個方程了。

陶哲軒: 我在澳大利亞探望姑姑時發現了這種變換。我當時正試圖理解所有這些場的動力學,但我無法用紙筆完成。我也沒有足夠算力的計算機來進行任何計算機模擬。於是我閉上眼睛,躺在地板上,想象自己就是這個矢量場,在其中摸索着看如何改變座標,使得在所有方向上,事物都能以合理的線性方式表現。而且,是的,我姑姑在我做那件事的時候撞見了。她當時問我,我到底在做什麼?

萊克斯: 這很複雜。

陶哲-軒: 是的,是的。嗯,好吧。你知道,你是個年輕人。我不多問了。

人工智能與數學的未來 解題策略與工具

萊克斯: 我必須問一下,你知道,你如何着手解決難題?如果可能的話,當你思考時,你會在腦海中將數學對象、符號可視化嗎?當你思考時,你的腦海中通常會可視化什麼?

陶哲軒: 大量的筆和紙。作爲數學家,你會學到一種,我稱之爲策略性“作弊”的技巧。所以數學的魅力在於,你可以隨心所欲地改變問題和規則。在任何其他領域,你都無法做到這一點。比如,如果你是一名工程師,有人讓你在這條河上建一座橋,你不能說:“我想把這座橋建到別處”,或者“我想用紙而不是鋼來建造它”。但作爲一名數學家,你可以隨心所欲。這就像玩一個電腦遊戲,裡面有無限的作弊碼可用。

陶哲軒: 所以,你知道,如果有一個維度太大。我會把它設爲一。我會先解決一維問題。於是有一個主項和一個誤差項。我將做球形汽車的假設。我將假設誤差項爲零。因此,解決這些問題的方式,不應採用這種將事物最大程度複雜化的“鋼鐵俠模式”。但實際上,處理任何合理的數學問題時,如果存在10個讓你感到困難的因素,你應該找到一個問題的版本,它關閉了九個難點,只保留其中一個,然後解決它。於是你安裝了九個作弊碼。好,如果你安裝了十個作弊碼,那麼遊戲就變得微不足道了。但如果你安裝了九個作弊碼,你解決了一個問題,這會教你如何處理那個特定的難點。然後你關掉那個,再打開另一個,接着解決那個問題。在你學會如何分別解決這十個問題,十個難點之後,你必須開始一次合併幾個來處理。

陶哲軒: 小時候,我看了很多香港動作片。這來源於一種文化。有一件事就是,每次打鬥場景,也許英雄會被上百個壞蛋打手之類的圍攻。但它總是被精心編排,所以你每次都只與一個人搏鬥。然後他就會擊敗那個人,接着對付下一個。正因爲如此,他才能擊敗所有人。但如果他們打得更聰明一點,一擁而上圍攻那個人,那會讓電影變得糟糕得多。但他們會贏。

萊克斯: 你通常是使用紙筆嗎?你是使用電腦和LaTeX嗎?

陶哲軒: 實際上,我主要還是用紙筆。所以在我的辦公室裡,我有四塊巨大的黑板。有時我不得不把我所知道的關於這個問題的一切都寫在那四塊黑板上,然後坐在沙發上,總覽全局。

萊克斯: 都是符號,比如標記,還是有一些圖畫?

陶哲軒: 有很多圖畫,還有很多隻對我自己有意義的定製塗鴉。這就是黑板的妙處,你可以擦掉,它是一個非常有機的東西。我開始越來越多地使用電腦,部分原因是因爲人工智能讓做簡單的編碼工作變得容易得多。如果我以前想繪製一個函數,這有點複雜,例如作爲一個迭代或其他,我必須記住如何設置一個Python程序,以及for循環是如何工作的並進行調試,這會花費兩個小時等等。而現在我可以在10-15分鐘內完成。我正在越來越多地使用電腦進行簡單的探索。

證明助手Lean與協作新範式

萊克斯: 如果可以的話,我們來談談人工智能。也許一個好的切入點就是泛泛地談談計算機輔助證明。您能描述一下Lean形式化證明編程語言,以及它如何作爲證明助手提供幫助,也許還有您是如何開始使用它以及它如何幫助了您?

陶哲軒: Lean是一種計算機語言,很像Python和C等標準語言。除了在大多數語言中,重點在於使用可執行代碼。代碼行會執行操作。它們翻轉比特,或者讓機器人移動,或者在互聯網上向您發送文本等等。Lean是一種也能做到這一點的語言。它也可以作爲一種標準的傳統語言運行,但它也可以生成證書。像Python這樣的軟件可能會進行計算並給出答案爲7。它算出3加4等於7。但Lean不僅能得出答案,還能提供它是如何得出7這個答案的證明,包括數字3以及所有涉及的步驟。它創建這些更復雜的對象,不僅僅是陳述,而是附帶證明的陳述。每一行代碼都是一種將先前的陳述拼接起來以創建新陳述的方式。

陶哲軒: 這個想法並不新穎。這些被稱爲證明助手。它們提供了語言,您可以用這些語言創建相當複雜、精妙的數學證明。它們會生成這些證書,如果您信任Lean的編譯器,這些證書能百分之百保證您的論證是正確的。但他們把編譯器做得非常小,並且有幾種不同的編譯器可用於同一個……

萊克斯: 您能讓人們直觀地理解用筆和紙書寫與使用Lean編程語言之間的區別嗎?形式化一個陳述有多難?

陶哲軒: 很多數學家參與了Lean的設計。它的設計宗旨是讓每一行代碼都類似於數學論證中的每一行。你可能想引入一個變量,你可能想證明一個矛盾。有各種你可以做的標準操作,而且它的編寫方式是理想情況下應該像一一對應。實踐中並非如此,因爲Lean就像是給一個極其吹毛求疵的同事解釋一個證明,他會指出,好吧,你真的是這個意思嗎?如果這是零怎麼辦?你如何證明這一點?

陶哲軒: 所以Lean內置了大量的自動化功能,以儘量減少麻煩。例如,每個數學對象都必須帶有一個類型。如果我談論x,x是一個實數、自然數、函數還是別的什麼?如果你非正式地書寫,它通常處於特定語境中。你會說,顯然,設x爲y和z的和,而y和z已經是實數,那麼x也應該是一個實數。Lean可以做很多這樣的...