AI for Science的中國機會|對談Deep Principle深度原理創始人賈皓鈞

來源:財經媒體人 於超

AI for Science(AI驅動科學發現),正在改寫科學發現的底層邏輯,逐步改變人類探索世界的方式。當 AlphaFold 團隊摘得 2024 年諾貝爾化學獎,AI 首次以“發現者”的角色進入基礎科研核心,標誌着 AI for Science 的時代性拐點真正到來。

AI開始深度介入科學探索全過程,從加速實驗、輔助建模,到參與提出假設、反饋驗證——AI 與物理、生命等基礎科學的融合,已不再是工具升級,而是科研範式的重構。

什麼是 AI for Science (AI4S)?它不僅是用 AI 來加速實驗,更是推動科學從“靠經驗試錯”邁向“由智能主導”的全新範式。理想形態下,它應當像科學家一樣:提出假設、規劃實驗、分析數據,並通過反饋持續修正、迭代模型,完成閉環優化。 正如深度原理Deep Principle創始人賈皓鈞所說:“AI不是要取代科學家,而是讓更多人站在巨人的肩膀上,用更少的時間,推動更大的發現”

本期對談中,賈皓鈞這位 MIT 出身、投身 AI4S 創業的科學家型創始人,系統聊了聊 AI for Science 的三階段演進邏輯,AI for Science的“ DeepSeek 時刻”的前提條件,講述爲什麼這場科研革命在中國更具落地優勢,也分享 了AI 創業中最被低估但最關鍵的創始人能力。

當 AI scientist、自動化實驗與科研生態的飛輪真正啓動,我們距離下一個重大科學發現,或許比想象中更近。

01.AI 正在成爲新一代科研“引擎”

Michelle於超:現在越來越多地聽到“AI正在重塑科學研究”的討論。而深度原理Deep Principle,正是一家專注在 AI for Science(AI4S)方向的創新公司。能不能具體聊一聊,目前深度原理Deep Principle的技術方向是怎樣的?產品形態發展到了哪一步?在整個科研鏈條中,你們主要聚焦在哪些問題、解決什麼樣的科學難題?作爲這一波“AI + 科學”創業浪潮中走在前面的團隊,你們的路徑有什麼特別之處?

賈皓鈞:好的,先說一下我們公司的歷程。我們是在 2024 年 6 月從美國回到中國發展的,目前團隊主要在杭州。其實最初這個項目是從 MIT 孵化出來的,我們最早在 2022 年就萌生了這個想法,之後也得到了很多來自 MIT 社區的支持和資源。但最終,我們還是決定把主戰場放在中國。

我們在做的事情,其實是用人工智能去解鎖一些全新的化學反應路徑,主要聚焦在化學材料和反應機制這塊。具體一點說,就是 AI for Chemistry & Materials,像 carbon capture(碳捕捉)和功能材料發現這樣的方向,是我們重點在做的。

這兩年,尤其是到了 2024 年,隨着生成式 AI 的爆發,整個行業對“AI + 科學”的關注度明顯提升了,美國和歐洲很多創業者和學者都看到了這個領域的潛力和機會,紛紛出來創業。我們也是其中一員。但在國內,我們應該算是最早、也是目前唯一一傢俱備從頭到尾全鏈路能力、專注在化學與材料領域的 AI 科創公司。

02.AI for Science 發展路徑三階段

Michelle於超:在您看來,AI for Science 當前的發展路徑是否已經形成一個清晰的技術分層?從數據建模、假設生成到自動化實驗,不同階段的AI介入方式分別有什麼樣的典型代表和挑戰?

賈皓鈞:在化學和材料領域,AI for Science其實這些年發生了很大的變化。就是AI for Science這個到底是什麼樣的定義。

我們一般也認爲AI for science有三個階段。

第一個階段是 AI 作爲科學數據分析工具的階段 (AI Assistant)。我們知道任何的科學研究都會產生一些的數據。那這些數據是怎麼個分析呢?尤其是這裡面可能數據的維度很高,有一堆X和一大堆Y,我們想知道某一、兩個Y跟哪些X是有相關作用。因爲我們可能想定向優化某些性能,所以這裡面其實有個非常高維度的問題。所以能不能通過一些簡單的機器學習模型來做一些數據的分析,降維來幫助我們比人腦更好的來理解這些數學,或者說是一些數據背後所隱含的一些含義。這就是AI for science的第一階段作爲AI Assistant。

簡單來說,AI 在這一階段的作用是輔助我們理解已有數據中蘊含的科學意義,這是 AI for Science 的起點,也是在各類科研場景中已經得到廣泛驗證和應用的部分。

第二階段的話,就會更加智能一點,進入了 AI 深度參與科研過程的階段 (AI Scientist)。大家做科研就一定要做實驗,而實驗通常分爲兩大部分,或者說科學發現分成兩大部分。

第一部分就叫做hypothesis generation(科學假設生成),就是生成一些科學性的假設。這部分過去往往只有頂尖科學家能完成,例如牛頓、愛因斯坦、薛定諤等,他們屬於極少數能從複雜現象中提出突破性理論的人。但現在,AI 已經開始在這一環節提供強有力的輔助——它能夠從大規模文獻、數據中總結規律,輔助科學家提出可能性的理論方向。

第二部分就叫做experimental validation(實驗驗證),也就是在已有假設的基礎上,通過不斷試驗去驗證是否成立。這個是絕大多數科學家一直在乾的。就是很牛的人可能花一天提出一個偉大的idea,剩下的人花了十年把它來驗證。

所以這兩部分其實AI都可以參與到。例如我們做實驗的時候,我們的數據能不能及時被得到驗證以及迭代,來指導我們下一步來做這個實驗。就例如我們想做一些純粹的“autonomous lab”(自主實驗室) ,就是純自動化的實驗室。這一方向近年來已有不少突破性的成果,預計在未來一到兩年內,將對科研效率帶來實質性的提升。

第三階段其實就像我們有點像AGI了,接近 AGI 的能力邊界 (AI Innovator)。我們設想是否能出現一種完全自動化的科學系統,由 AI 獨立完成從提出問題、構建模型、設計算法,到發現新的科學規律的全過程。它不再只是輔助人類做科學,而是像科學家一樣主動提出問題並解答問題。

比如,它是否能夠自動推導出某些新的公式,甚至發現類似牛頓三大定律這樣具有劃時代意義的自然法則?這就是我們常說的AI Innovator。

我認爲,這個階段的實現可能比真正的通用人工智能(AGI)略晚一步,但不會相差太遠。

至於 AGI 究竟什麼時候會真正出現,這個問題其實討論了很很久,不同人對 AGI 的定義也有很大差異,至今沒有明確的結論。我一般也不喜歡對未來做預測,我個人的觀點也是“The best way to predict the future is to create it”。但可以確定的是——無論是否真正達到 AGI,AI 在科學研究上的角色已經在快速演化,將在未來持續帶來重大突破。

03.AI for Science 的“DeepSeek 時刻”

Michelle於超:大家都在關注 AI for Science 會不會出現類似 DeepSeek 這樣的突破時刻,也就是一個真正打破現有科研範式、引發飛躍式變革的臨界點。在您看來,推動這個時刻到來的核心支撐因素有哪些?是模型本身的通用能力?是垂直領域的數據質量與規模?還是科研場景中對可解釋性、嚴謹性、工程化能力的高度要求?目前來看,距離這樣的臨界點,我們還缺哪一塊拼圖?

賈皓鈞:首先,我確實認爲,任何一個行業其實都期待出現像 DeepSeek 這樣的“突破時刻”。因爲這通常意味着,行業內部發生了結構性的變化,並且這個變化能對整個社會產生真正的價值。所以 AI for Science 領域,也同樣在期待這樣一個拐點。

科學問題本身就非常重要。人類一直在通過做實驗,試圖理解這個物質世界的運行規律。我們希望能找到更好的定律,發現新的材料、新的藥物,從而改善我們的生活。但傳統科學探索依賴大量的“試錯”(trial and error)方法,在今天這個時代,其效率已經越來越難以滿足現實需求。特別是在新材料、藥物等高價值領域,需求越來越多、越來越緊迫,而傳統方法的效率瓶頸也越發明顯。

在這個背景下,AI 成爲了一個非常重要的變量。它能參與科研流程中的多個階段,從前面說的高維數據分析,到輔助做實驗,甚至進一步提出新的假設。AI 不只是一個加速器,它可能是重新定義科研範式的方式和方法。

如果要推動 AI for Science 進入“DeepSeek 時刻”,我認爲需要幾個關鍵前提條件的配合。

第一、是模型本身的能力

我們談到的通用大模型(foundation model),它的模型的通用性其實是非常關鍵,或者說它的模型性能本身是最關鍵的。它的泛化能力非常關鍵。比如,一個大語言模型,可能既能幫助記者生成採訪提綱,也能幫科學家做文獻總結,甚至輔助我們進行論文寫作、論文 review 等等。不同領域的用戶會提出完全不同的任務需求,因此模型需要足夠通用、理解力足夠強。所以它需要非常強的泛化能力來幫助他們完成這個事情。

第二、垂直領域的數據質量與專業性

而在 AI for Science 這個垂直領域,尤其是像材料、化學反應這類方向,模型所使用的數據質量反而更關鍵。我們普遍認爲,模型性能由兩個因素決定:一是模型架構本身,二是數據的量與質。在垂直領域裡,高質量、結構化、專業的數據,可能比模型架構本身還更重要。

因爲科學問題要求極高的準確性。你不能說這個結果是 80%、90% 準確的——這在科學研究中是完全不能接受的,必須嚴謹。因此,大模型要想在這個領域發揮作用,就必須以高質量的專業數據爲基礎。

其實,我們回頭看一下 AI 的整體演進路徑,從 2021 年之後,生成式模型的爆發可以說是由兩股技術路徑推動的:一是 NLP 領域的 transformer-based 大語言模型,二是 CV 領域的 diffusion 模型。這兩類模型是生成式 AI 的兩個主流技術路線。

我們有時也會說,大語言模型更像是“文科生”。它的訓練數據主要來自公開網站、語料庫、文字信息,對語言理解、知識總結特別強。但你讓它解高等數學,它可能也能做一點,但並不是最擅長。

而 diffusion 模型更像是“理科生”。它最初是處理圖像的,每個圖像可以看作由大量 pixel 組成的矩陣,數學結構非常清晰。而科學問題的本質,最終也都需要能被數學表達。一個科學問題如果不能形式化、不能用數學語言表達,那它可能就不夠“科學”。所以 diffusion 模型在理解科學結構、模擬實驗數據方面可能會更有優勢。

從這個角度看,我們可以做一個分工的類比:

大語言模型擅長 hypothesis generation(假設生成),因爲它可以站在“巨人的肩膀上”——利用已有知識資料去提出推測;

而 diffusion 模型或具備數理結構的模型,更適合 validation(實驗驗證),例如材料配方優化、材料結構探索等。

第三、工具生態與交互方式的革新

再進一步,我們談到 AI Agent 的角色時,也可以結合這兩者。因爲科研過程使用的工具往往很複雜,很多工程師或科研人員並沒有編程背景,比如工廠裡的老師傅、材料車間裡的工程師,他們習慣於在 Excel 表裡操作,而不是寫代碼。這時候,AI Agent 就可以成爲一箇中介——你只需要告訴它你要什麼,它就能調動一系列複雜工具、完成虛擬實驗、給出結果甚至下一步建議。

Agent 的意義在於:降低科研門檻,提高交互自由度,讓 AI 真正服務於每一位科研一線人員。

04.爲什麼從 MIT 回國創業?中美AI for Science生態對比

Michelle於超:從MIT spin-off startup,再回國創業。爲什麼選擇落地在中國推進 AI for Science?在您看來,中美在技術創新和產業化路徑上有哪些結構性的差異?尤其是在新材料、新能源、化工這類深科技領域,中國有更大的機會窗口?

賈皓鈞:首先,美國在科學研究、科技進展、商業化落地這幾個維度上,其實早在很多年前就已經處於全球領先的位置了。尤其是西海岸的硅谷,它代表的是軟件、AI這一塊的最前沿;而東海岸,比如波士頓這一帶,就偏硬件方向更多一點。你像現在很多機械狗、機器人、3D打印等等,幾乎都是從 MIT 這樣的機構裡 spin-off 出來的。所以你能看到,美國是雙核結構:西岸偏軟件,東岸偏硬件,還有一個非常大的板塊就是生物醫療,東海岸那邊做得也很深。

中國這邊,其實從改革開放以來一直是處於一個持續追趕的過程。但我個人感受很深的一點是:這個技術的 gap,真的越來越小了。

特別是,中國的製造能力這個事,我覺得現在已經沒啥爭議了,大家基本都認同,中國製造是全球最強的,而且還會越來越強。所以,如果我們在前端能做好科學發現和技術轉化,那後端的工業能力,再疊加十幾億人口的市場——不光是中國自己,周邊還有東南亞、中東、非洲這些國家——這個市場的體量是巨大的。

我們現在在做的 AI for Science,其實本質上是用 AI 去做一些新的 scientific discovery。那這些 discovery 最終都得走向工業應用,比如說材料、能源、化工,這些領域最終都要落到“怎麼生產、怎麼投產、怎麼用”上。

所以,我們把主戰場放在國內,其實是一個很自然的決定。

像我們深度原理Deep Principle它不僅是一個技術驅動的公司,我們其實也非常關注應用場景的選擇,因爲這個場景的規模,決定了我們未來業務的空間。而在中美之間對比來說,中國市場的應用場景,確實對我們更友好,也更大。

我們現在聚焦的領域,基本就三個方向:新材料、新能源、精細化工。這三個領域有一個共同點,就是都特別需要源頭創新能力——需要你對化學反應、材料機理非常懂,而這個恰好是我們擅長的。

其實你回看國內的情況,不點名說,很多企業在這些方向上其實已經很成熟了。美國當然也有,比如杜邦、殼牌、陶氏、霍尼韋爾這些,他們都是非常有積澱的大型化學材料企業。

但你也知道,美國的工業已經經歷過一次大規模的“去工業化”浪潮。比如說,波音外包之後的質量問題,其實是大家都在討論的。最早的一批去工業化,其實就從化工、材料這些行業開始。當時杜邦的特氟龍泄漏事件是一個標誌性節點,引發了全社會對環境污染、健康風險的強烈關注。

因爲美國社會那時候比較富有,積累也夠了,所以他們就把污染性行業移出本土,轉移到中國、東南亞、南美這些地方。所以現在你去看,全球最大的化工、新能源、材料生產基地,其實就在中國。

所以我們做這些事情,其實是很順理成章地把落地場景放在國內。如果你還在美國做,你可以給那些大廠的研發團隊提供 AI 工具,做“技術層支撐”。這當然也可以,但對我們來說,這不是我們想做的事。

我們希望能真正影響生產、影響工業體系,而不是僅僅給別人當“外腦工具包”。所以我們看明白了,想清楚了,選擇回國發展,其實就非常自然。

05.AI for Science創業融資現狀

Michelle於超:過去兩年創業融資並不容易,選擇在這樣一個時間節點創業,當時是如何判斷這個窗口期的?您怎麼看 AI 創業者目前面臨的挑戰和轉機?

賈皓鈞:從 2023 年開始,中國的資本市場環境其實是極差的。我們24年剛回國的時候剛見了一個來自香港的 LP,他說得很直白,2024 年整體的美元資金比前一年少了 90% 以上,人民幣資金也少了 50% 以上,這個“以上”到底是多少,很難說得清,但就是非常難。

所以我們在 2023、2024 這個階段出來創業,其實是很不容易的。包括我們這代創業者,現在有一些信心回升,某種程度上也是因爲 AI Agent、AI 應用,特別是今年春節 DeepSeek 的發佈,讓大家突然意識到——原來 AI 真的是可以用的,不是隻有 hype,它真的能帶來效率、價值和變現。

這才讓大家的信心開始恢復,但這個過程真的挺難的。

06.AI 時代的創業者最重要的特質

Michelle於超:現在其實可以明顯感受到,海外資金對中國科技資產的情緒正在回暖,很多海外 VC 又開始回來聊 deal。一直以來我們都在講,時代變了,創始人的畫像也在變。尤其是在 AI 時代,創始人面臨的環境更不確定,需要的特質也不同。在您看來,AI 時代真正需要什麼樣的創業者?能夠完成從 0 到 1,乃至更重要的從 1 到 100 這樣非線性增長路徑的人,他身上最核心的特質會是什麼?應該不會再是“技術好”等一些單一維度的能力。

賈皓鈞:這是個很好問題。當然我覺得可能不同的人理解都會不太一樣。可能偏技術出身的人,可能覺得技術最重要。如果你是連續創業者,那可能會更強調“創業者精神”、資源調動和判斷力;但如果你來自大企業的高層管理背景,可能又會覺得執行效率、團隊治理、流程操盤這些更關鍵。所以不同人站的位置不同,看到的那個“創始人畫像”也會不一樣。

但我自己有一個很強烈的體會,甚至說是信念吧——小時候我特別喜歡看金庸,比如《倚天屠龍記》、《天龍八部》,當時印象最深的一句話就是:“天下武功,唯快不破。”

我覺得這句話完全可以套用在今天的 AI 創業上。今天我們所處的環境,技術迭代的速度極快,外部環境變化也極其劇烈,而這兩個變量其實都是我們無法控制的。

創業者唯一能掌控的,可能就是自己的速度——你能不能更快地試錯、更快地融資、更快地應用落地、更快地調整方向。哪怕你技術不是最強,但你的反應速度、執行速度、調整速度夠快,這本身就可能是你最大的護城河。

換句話說,在這個時代,速度可能是唯一確定性的競爭優勢。

轉自:市場資訊