英偉達、宇樹、銀河通用問答全文:未來10年機器人如何改變世界
21世紀經濟報道記者倪雨晴
在2025年的世界機器人大會(WRC)上,英偉達Omniverse與仿真模擬技術副總裁 Rev Lebaredian、宇樹科技創始人王興興、銀河通用創始人兼CTO王鶴罕見同框。
在一場媒體溝通會上,他們圍繞物理AI、仿真、機器人平臺與商業落地、合成數據與具身智能模型的產業化路徑,展開了深入交流。
Rev Lebaredian首先拋出核心判斷:過去三四十年,計算機和IT產業放大了各行各業的能力,但影響“大多還停留在“信息空間”,也就是可以數字化的內容。互聯網讓計算機走進日常生活,並帶來幾十年的增長,但“IT 行業的總規模約爲5萬億美元”,相比全球超過100萬億美元的所有產業總量,只是小部分。他指出其他行業更大的價值在於觸達物理世界的“原子”領域——交通、製造、物流、醫療等。
“而今天,隨着人工智能的出現,我們終於有了讓機器具備‘物理智能’的能力,可以把物理世界和信息世界真正連接起來。”他強調,這意味着計算機的力量將進入100萬億美元的物理世界市場,而機器人正是實現這一躍遷的橋樑。
在他看來,中國具備在這一跨越中脫穎而出的獨特條件。比如,全球近一半的人工智能研究人員和開發者在中國,本土還擁有無可匹敵的電子製造能力,以及可供大規模部署和測試的龐大製造業基礎。
談到英偉達的角色,他指出,公司使命是打造專門針對“最難問題”的計算機,要推動機器人發展、物理 AI 落地,英偉達提出必須構建三類計算機:一是嵌入機器人本體的計算機,例如人形機器人搭載的 Jetson Thor;二是 AI 工廠計算機,用於在部署前通過 DGX、HGX 系統處理海量數據、訓練模型;三是仿真計算機,通過物理定律生成數據並提前測試機器人,測試速度可快於現實時間。
目前,宇樹科技和銀河通用等機器人企業都和英偉達進行了合作,比如銀河通用的G1 Premium人形機器人,就是首批搭載 NVIDIA Jetson Thor 的人形機器人之一,在工業碼垛、拆垛及物料箱搬運等複雜場景中展現出流暢性與作業速度。宇樹科技則在其新型人形機器人 R1上部署了英偉達全棧機器人技術,通過Isaac Sim高仿真平臺優化運動與操控能力,並藉助Isaac Lab系統實現快速策略迭代。
王興興表示:“某種意義上,我將人形機器人視爲通用機器人的重要載體。”在人形機器人的設計上,他認爲結構並不如想象中複雜,“本質上是由若干關節電機串聯而成”,因此未來當通用 AI 成熟,“每個人都可以輕鬆製造一臺人形機器人,就像今天人們可以購買電腦零部件組裝一臺電腦一樣,未來若AI足夠強大,對硬件的要求會越來越低。”
從宇樹科技的產品歷程看,去年,宇樹推出一款售價約9.9萬元人民幣的人形機器人,其架構成爲全球較爲主流的設計。今年發佈的新版本售價約3.9萬元人民幣,支持外觀定製,“目前現貨可供,預計量產在年底前完成。”王興興說道。
其他產品線上,宇樹科技近期發佈了A2機器狗,自重約37千克,持續負載可達30千克,空載續航可行駛20公里。同時,宇樹科技重視機器人上肢和手部的研發,王興興介紹道:“目前已自主開發一款約20自由度的靈巧手,目標是讓機器人真正能夠執行日常任務,而不僅是完成展示性動作。希望在未來一到兩年內實現自然交互,例如在沒有預先適配的情況下,直接指令機器人去爲某人倒水。”
王鶴則從具身智能的底層邏輯切入。他指出,通用機器人將成爲下一個價值數萬億美元、數萬億人民幣市場的關鍵性、革命性產品。這種革命性產品背後包含多個核心要素,第一個是機器人的本體,第二是驅動它運轉的具身智能模型。模型背後則是數據支撐,王鶴表示:“我們與英偉達一致認爲,合成數據是推動具身智能快速落地的關鍵。目前,真實世界數據僅佔我們訓練數據的1%,其餘99%均爲合成數據。”
與此同時,銀河通用和英偉達官宣了基於Isaac平臺的下一代人形機器人項目,“目前銀河通用爲輪式形態,下一代將採用純雙足設計,基於OpenWBT_Isaac進行數據採集與遙控控制。無論在仿真環境還是現實環境,該平臺可訓練並部署多種任務能力,例如推車、拾取地面物體等。”王鶴說道。
他認爲,在未來的十年,人形機器人的整個佔比不會小,“我預計未來每三年人形機器人的產值會乘10,那麼我們現在頭部是賣1000臺,三年後就是1萬臺,再三年後就是10萬臺,如果賣幾十萬元一臺的話,就達到了1000億元,超過了整個工業機械臂的總產值。”
王鶴進一步表示:“在未來10年,我們將看到的是一個能夠超越當前所有工業機器人量的機器人市場。再往後10年,可能是超越汽車手機這個市場量的萬億市場,所以不能低估它,但也沒有大家想的那麼快。”
從現場交流來看,要讓機器人真正走出實驗室並規模化部署,既需要頂層算力與仿真能力構建技術底座,也需要成本可控且可量產的硬件工程,以及以合成數據驅動的大規模訓練體系。正如王興興所言,“AI 與機器人技術將像電力與蒸汽機的發明一樣,使人類文明邁向新的高度。”
以下是英偉達Omniverse與仿真模擬技術副總裁Rev Lebaredian、宇樹科技創始人王興興、銀河通用創始人兼CTO王鶴的媒體問答全文(經記者整理,不改變原意):
1、在像醫療和養老這樣高精度應用場景中,NVIDIA Omniverse如何確保用仿真數據訓練的機器人具備可靠性和安全性?
Rev:如果你想構建一個能夠在現實世界中行動且安全可靠的機器人系統,實際上唯一的選擇就是使用仿真。舉個例子,你希望系統足夠智能,能夠應對那些很少發生的特殊情況,甚至應對你希望永遠不會發生的緊急情況。
以自動駕駛爲例,我們絕對不希望車撞到人或者孩子,但當街上出現小孩時,車輛的大腦該如何反應,如何獲取訓練這類系統的數據呢?唯一的辦法就是通過仿真。因爲我們絕不可能將孩子置於汽車前作爲訓練樣本,這樣做是不道德的、危險的,而且耗時且昂貴。
即使訓練完系統,在將它部署到現實世界之前,也需要在這些相同場景中進行測試,確保在真正發生類似情況時,它能夠正確反應。因此,真正的選擇只有通過仿真實現,因爲現實世界測試過慢、成本高且危險,我們不希望機器人在現實世界先失敗。
換句話說,如果我們無法讓仿真足夠準確以測試機器人,那麼我們將無法制造出可靠的機器人。幸運的是,目前已有非常準確的仿真器。不過,這些仿真器計算量大且成本高昂,我們面臨的真正挑戰是如何提升仿真速度,使其在大規模系統構建中具有成本效益,這也是我們一直努力的方向。
2、你認爲未來幾年內,驅動人工智能機器人的仿真領域會有哪些關鍵技術趨勢將改變整個行業?能否分享一些中國生態合作伙伴如何利用英偉達仿真技術加速產品創新的案例?
Rev:我認爲目前最大的趨勢,實際上是所有在常規人工智能領域出現的技術和發展,正被應用到物理人工智能中。其中最重要的突破是推理能力的提升。比如DeepSeek將推理能力帶入了開源領域,現在我們也看到了其他各種模型。
我們在智能水平上實現了飛躍,將同樣的技術應用到物理人工智能,是機器人領域的一個重大突破。如果我們要製造這類機器人——比如能給你拿水的機器人——根據翻譯理解,可能在今年年底或明年,我們的機器人將能更自然地與人互動,並完成複雜的多步驟任務。這是非常關鍵的能力。而將這種能力與仿真結合,我認爲這是一個可能還未被廣泛理解,但將成爲重大突破的點。
目前我們面臨的主要問題是人工智能極度依賴數據,而獲取合適的數據非常困難。我們現有的推理模型,尤其是對物理世界的推理,現在可以幫助我們改善數據生成和數據創建的流程。
如今我們生成的數據,即使是合成數據,也需要大量人工參與,人工去構建虛擬世界和仿真環境,判斷該生成哪些數據才能讓智能系統更聰明。但是,如果我們把正在開發的人工智能技術用在數據生成流程中,就可以實現自動化,打造“自動駕駛”的合成數據生成。
如果我們擁有一個自動駕駛的合成數據生成工廠,就能直接將其接入訓練流程,實現訓練過程自動化,減少人爲干預,讓機器人大腦更聰明。至於中國的企業如何應用仿真技術及其帶來的影響,我認爲他們已經在積極探索和應用這些技術。
王鶴:我覺得因爲大家的這些仿真引擎也好,並行渲染器也好,把現在合成數據它的這種不管是通過強化學習,還是通過產生數據以後再做。
模仿學習,它的整個困難程度都大大下降了,那麼確實像不管是現在的人形機器人的行走或者是跳舞的這些技能,還是我們做抓取做疊衣服、做導航背後的數據,離不開就是一個非常好用的仿真器,非常並行的渲染器,所以這些確實非常感謝,英偉達作爲一個生態方,從芯片到整個仿真平臺對整個生態的一個託舉。
3、宇樹R1定價3.99萬元,大幅降低消費級人形機器人的門檻,這是否意味着硬件成本已不再是影響機器人商業化的障礙?現階段,推動人形機器人規模化商用還存在哪些難點?
王興興:這是我一直分享的觀點,對於基層商業化,包括人形機器人的商業化來說,它的成本和硬件其實並不是關鍵性的問題,某種意義上,你說一臺機器如果只要能用你10萬元甚至100萬元,其實照樣還是有很多場景能用起來的。
目前最大的問題,其實還是整個具身智能的整個模型還是不夠泛用性,包括它的實用性還是有更大的提升,這塊其實是當下是最棘手的問題。硬件某種程度上不單單是今年,我覺得過去的一兩年就已經足夠了,硬件一直還是足夠的,當然要做得更好,你要比如說可靠性成本各方面做的更好,但是它並不是個限制性因素。
4、 國內外專家和企業對“人形”的必要性爭議不斷,有人認爲人形是AGI的最終載體,有人認爲未來十年人形機器人的佔比只有10%,銀河通用如何看待人形的必要性?
王鶴:我們今天去看人形機器人,從長遠來看,它一定是要能夠融入我們人類的生活的。從終局的觀念來看,比如大家各自現在做的座椅,除了人形機器人,如果它又是能夠幹活,手能夠伸到1米、2米這麼高,能夠摸地的,它還能在這樣的環境裡穿梭,它除了人形態,它沒有別的形態。
那麼從未來這幾年來看,我的感覺其實人形機器人是從一種移動複合機器人在向着終局不斷邁進。因爲如果是一個定點機器人,它能夠乾的事情就只能是它面前的事情,對吧?那麼它的侷限性是很大的,所以移動是必然的。光有移動的車,我們過去在各種工廠裡頭這種移動的小車,它就只能承載貨物,對吧?
貨怎麼下來的,從上面有個槽掉下來的,它的侷限性是不能做任何操作,所以說符合機器人移動又能夠有一根機械臂操作的,我們今天打造的機器人就是在一個移動的臺上,再讓它變成可升降的、可以摺疊的。有兩根機械臂,因爲兩隻手,你一隻手抱不了箱子,只能抓一個東西,對吧?兩隻手可以上下左右看,那麼其實它就是一個半圓形。
所以我覺得在未來的十年,人形機器人的整個佔比不會小,但得看跟誰比。我們今天跟所有工業的大機械臂相比,工業大機械臂全球的總產值也就1000億元人民幣,並不高,一個頭部車廠一年就能賣1000億元價值的車,那麼人形機器人我們現在數10萬元一臺的話,實際上達到一個並不是大家覺得那麼高的量級,你就超過了整個工業機械臂的總產值。我預計未來每三年人形機器人的產值會乘10,那麼我們現在頭部是賣1000臺,三年後就是1萬臺,再三年後就是10萬臺。那麼10萬臺級的量,如果賣幾十萬元一臺的話,幹活的就達到了1000億元,超過了一家公司,也超過了整個工業機械臂的總產值。
在未來10年,我們將看到的是一個能夠超越當前所有工業機器人量的機器人市場。再往後10年,可能是超越汽車手機這個市場量的萬億市場,所以不能低估它,但也沒有大家想的那麼快,說明天就達到汽車這個市場的額度,是不可能的。
5、請問NVIDIA Jetson Thor與之前的Jetson平臺有何區別?它如何特別有利於機器人應用?
Rev:每一代Jetson產品,我們都努力最大化其計算能力,因爲智能問題本身就是一個非常複雜的計算難題。在機器人領域,這一挑戰更大:計算必須非常快速,且在極爲苛刻的環境中進行。
機器人往往在現場實時運行,需要在緊湊的循環內完成計算,電力有限,因此需要儘可能降低功耗以延長電池壽命,同時還要考慮散熱等問題。這些因素都極大地增加了難度。Jetson Thor與之前版本最大的不同是,現在具備了足夠的計算能力,能夠運行更大、更強的神經網絡和模型,支持更復雜的推理任務,這是之前的產品無法做到的。此外,Jetson Thor擁有更高的帶寬,能更快地處理來自各種傳感器的大量信息,使機器人能夠快速反應,在動態變化的環境中高速移動和操作。
6、你認爲未來機器人在哪些場景會迎來大規模普及?
王興興:未來肯定是朝着更實用的方向發展,但具體速度其實還需要時間。無論是工業、服務業還是家用領域,整個發展週期都還挺長的。大家回顧過去,比如新能源車,十幾年前大家也覺得發展會很快,但實際上整體成熟度也花了不少時間。
每個產業的成熟都需要較長週期。而現在的新一代人機機器人或通用機器人技術,實際上才發展了兩三年左右。因爲現在用的新技術跟十幾二十年前完全不同,硬件和軟件都發生了巨大變化。但很多人提機器人時,喜歡拿十幾二十年前的東西來說,覺得這個行業已經發展了很久,其實那個時候的技術和現在完全不是一個水平。
在目前只有兩三年發展時間的情況下,整體進展還需要更多時間。不過從當前發展速度來看,我個人感覺行業仍在快速成長,未來幾年人員和出貨量基本有望每年翻倍,這對整個行業來說是很有可能實現的。
基於此,如果未來出現更強大、更通用的AI大模型,能讓機器人在工廠、家庭等更多通用場景中表現更好,因爲越通用,普及的難度就越小。相反,如果不通用,推廣會更困難。所以我覺得整體時間週期會更長一些,尤其是家用領域。
家用機器人的最大難題不是技術,而是倫理、安全等方面的要求極高,這導致家用機器人的普及門檻要高得多。
7、今年,許多人形機器人已開始在汽車工廠進行訓練。機器人真正能在工廠車間投入工作還需要多長時間?還有哪些關鍵挑戰需要解決?
王鶴:今年,許多人形機器人已經開始在汽車工廠進行訓練。我們看到絕大多數公司在工廠推廣人形機器人時,主要集中在兩個方面:一是搬運,二是分揀。
搬運方面,銀河通用最近展示的機器人視頻裡,其搬運速度已經接近人類水平,計算下來每小時搬運的數量與人類相當。這個階段已經非常接近實際工廠的部署,我預計今年年底可能會有幾十臺銀河通用的機器人進入工廠車間實際應用。
但是,搬運只是第一步。除了搬運,還需要實現碼垛的閉環能力,只有搬運和碼垛都完成閉環,機器人才能真正勝任整套工作流程,否則做一半的任務,效果並不理想。
分揀則是更大的挑戰。不論是從傳送帶上拿,還是從貨架上取貨,目前最大的難點是速度。熟練工人拿取物品的速度非常快,機器人目前在模型和硬件層面還難以達到這種效率。
我們做零售機器人時,拿貨架上或桌面上的物品,技術本質上與工業分揀類似,只是零售對節拍要求較低,拿錯貨的後果也較輕。但在工業場景,比如汽車製造廠,一條產線停機一分鐘可能就意味着損失上萬元,因此分揀的精度和速度要求極高。
綜上所述,分揀技術雖然已有較大進展,但目前還未達到人類工人的水平,仍需要一定時間的技術迭代和突破。
8、英偉達在機器人訓練中強調仿真優先的策略,並推出了一系列支持技術。然而,仿真到現實(Sim2Real)之間的差距仍然存在挑戰。英偉達如何與合作伙伴共同應對這一問題?展望未來,提升仿真物理真實性和增強現實世界遷移效率的關鍵方向有哪些?
Rev:這是一個非常好的問題。如果我們依賴仿真來構建和測試AI,就必須確保仿真儘可能接近現實,否則我們無法信任它。我們構建的AI如果是在一個“卡通世界”裡訓練的,是無法真正理解現實世界的;因此,測試時也必須確保仿真場景與現實相符。那麼,如何彌合仿真與現實之間的差距呢?其實可以通過多種方式,我們也在全力推進這些方法。
首先,是提升仿真器本身的精度。我們幾十年來一直在構建物理仿真算法,且驗證了這些算法能夠較好地反映現實世界的物理規律。比如我們利用仿真設計飛機機翼和汽車,確保空氣動力學性能,並驗證仿真結果與真實世界匹配。問題是這些高精度仿真計算成本極高,通常需要在大型計算機上運行數小時。挑戰就在於如何將仿真速度提升到足夠快,能夠嵌入AI訓練流程中,實現大規模、高效的數據生成和測試。
爲此,我們正在利用AI本身作爲提升仿真速度和精度的工具。AI能夠近似任何數學函數,我們可以將物理仿真函數轉換爲AI函數,構建AI模擬器完成仿真。只要提供足夠的示例數據,AI就能學習仿真功能。這正是我們正在開發的“Cosmos”項目。這些“世界基礎模型”是能理解世界物理規律的AI模型,我們可以將真實世界數據和可信仿真數據輸入這些模型進行訓練。一旦有了這樣理解世界的AI基礎模型,就可以將其與傳統仿真結合,構建更精準、更高效的仿真器。
其次,即使擁有高質量的仿真器,構建代表現實世界的數據也非常困難。以這個房間爲例,雖然仿真器可以模擬物理現象,但我們還要創造帶有正確物理參數(如摩擦係數、材料特性)的桌布和桌子,這類信息採集非常複雜。目前,全球只有少數專業人士——通常是遊戲或電影行業的藝術家——具備這類能力。但隨着我們構建具備物理理解能力的AI,這些AI可以輔助生成這些虛擬環境,成爲“機器人藝術家”,幫助我們高效創建真實感十足的虛擬世界。
第三種方法是直接捕捉現實世界。我們也利用物理AI技術將現實環境(例如我們身處的房間)數字化、導入仿真環境,確保虛擬場景與現實高度一致。
NVIDIA正在這三個方向全面發力,打造相關技術,但這項工作遠超過任何一家公司的能力。我們正與整個生態系統的合作伙伴協同推進,爭取在這三條路徑上共同攻關。事實上,我們已經積累了不少成果,目前已有的仿真器已經能夠生成足夠高質量的數據,助力我們提升AI性能。
9、當前一些專家認爲,目前機器人領域的大模型架構尚未統一。針對具身智能大腦的基礎模型,宇樹科技主要聚焦哪些方向的探索?能否透露一些具體內容?
王興興:我一直覺得目前的模型架構確實非常不統一,這導致大家的整體進展沒有那麼快。如果模型架構能更加統一、方向明確,結合當前行業熱度,大家其實能更快取得突破。但現實是,目前進展還是比較緩慢。
我們公司探索了很多方向。比如今天上午也展示了我們去年嘗試的一個用視頻生成模型作爲“世界模型”,來驅動並對齊機械臂的項目,這個嘗試取得了一定效果。但由於視頻生成模型訓練規模極大,考慮到我們公司的算力和投入,難以進行大規模訓練。
而且我們嘗試發現,這類模型的泛用性還不能完全滿足預期,因此後來基本沒有繼續使用。但最近谷歌發佈了一個新的視頻生成模型,其物理對齊效果非常好,並且他們公開嘗試把視頻生成模型作爲世界模型,直接用於機械臂和通用智能。這讓我覺得這個方向非常值得重新探索。
由於公司規模和算力人才限制,我們只是初步探索,沒有深入推進。但谷歌的成果證明這個方向很有潛力。視頻生成模型在時間內容、數據源以及效果方面,已經達到不錯的預期。舉例來說,如果控制視頻生成模型生成一個機器人打掃全屋的視頻,而且效果不錯,理論上只要把視頻與機器人動作對齊,也能實現類似效果。
不過,目前對齊工作仍然非常複雜且具有挑戰性。這個方向無論是對機器人應用,還是純視頻生成技術本身,都是非常主流且值得投入的。即便不用於機器人,視頻生成技術也會持續被大公司加大投入、不斷優化。
除此之外,還有其他方案。隨着基礎模型能力快速提升,很多潛力尚未被充分挖掘。我們發現,如果在基礎模型後訓練時加入機器人指令控制和空間理解訓練,效果能明顯提升。比如王鶴老師團隊展示的一些基於基礎模型的機器人控制效果就非常不錯。
我們公司的策略很簡單:不斷嘗試各種新模型和新想法。今天可能有一種想法,明天可能會調整,這很正常。對於新興技術,我認爲大家都應該大膽嘗試。AI領域充滿了可能性,往往一個靈光一閃的創意就能帶來突破。希望鼓勵更多人去探索,或許下一個創新就出自你手。
10、我們看到OpenAI最近發佈了GPT-5,給人的印象是技術突破不大,而且它更像是一個系統,而非單一模型。我們是否可以理解爲大模型的擴展定律(Scaling Law)遇到了一些挑戰?
王鶴:目前大模型類型繁多,有純文本大模型,有圖文大模型,圖文大模型又分爲視覺理解型和視頻生成型,包括我們具身智能的VLA也是一種大模型。所以說,是否可以說大模型的擴展遇到了瓶頸,無法簡單地用一個統一的結論來概括。
我理解,在當前純文本階段,我們主要的數據源是互聯網公開數據,但很多私域知識並不在網上,這導致模型的推理能力實際上需要的數據與公開數據有差異。除非能通過某種可控的方式獲得額外數據增強,否則單靠公開數據提升模型能力是有限的。
這部分能力的增長,並不會自然地通過單純擴大模型規模實現。但不能低估推理模型的進展,比如在IMO國際數學競賽上,文模型獲得金牌,面對從未見過的題目表現出色,這說明文本大模型的能力在不斷提升。
關於多模態大模型(比如VLM和VLA),如果說文本模型現在能力已經很強了,那麼多模態模型目前還處於比語言模型稍弱的階段。其核心原因是數據不足:文本數據非常豐富,而文本-圖像配對數據相對較少,再加上動作數據更少,因此視覺理解能力和基於視覺的動作操作能力還有較大差距。
這也是爲什麼合成數據和仿真技術非常重要。正如Rev所說,仿真能夠將真實世界場景和動作復現到虛擬環境,生成大量帶動作、圖像和語義配對的數據,這將極大促進圖文、多模態大模型及具身智能大模型的發展。
如果完全依賴真實數據,進展會受到很大限制。總體來看,充分利用仿真技術,我相信將是多模態大模型和具身大模型應對數據瓶頸的最有效途徑。
11、 目前限制人形機器人規模化部署的關鍵技術瓶頸是什麼?
王鶴:最核心的問題其實很簡單——就是機器人幹活的能力還不夠強,能完成的任務類型比較有限。但如果能在這些有限的技能範圍內實現非常通用的水平,就能一下子賦能很多場景。
銀河通用現在最主要的突破是“抓取”和“移動”。只要機器人能抓住任何物體,能夠在場景中實現下肢移動和上肢伸展,最後還能準確放置物體,
這三個能力成立的話,很多應用場景就能實現。背後需要有一個真正精準的目標識別和定位系統,我們目前是通過合成數據在推動這項技術。
當然,即使解決了這個關鍵問題,仍有很多任務機器人暫時無法完成。但只要目標識別和定位的問題能被攻克,人形機器人市場至少有千億級規模,並且在五年內可見成效。解決了這個關鍵技術瓶頸後,基於如此巨大的市場投入,機器人必然能解鎖更多技能,邁向萬億市場的步伐。
12、機器人爲什麼要做雙足?除了情感價值,雙足在商業上還有哪些考慮?
王興興:其實,某種意義上我以前也提過,爲什麼不做雙腿反而是一個值得思考的問題。因爲做雙腿其實相對方便,最重要的是雙腿提供了更多的通用性能力。運動能力本身在某種程度上是較弱的AI能力。你看,小動物甚至螞蟻、蟲子走路都非常好,但它們的AI能力其實很弱。所以我一直覺得,真正通用且能幹活的具身AI模型,移動能力或者腿的能力其實是附屬的。
如果機器人能幹活了,那腿的控制自然不會差;如果連腿都控制不好,說明它還沒達到大家想象中的非常通用的AI模型階段。所以這是一個發展方向。另外,因爲雙腿相對簡單,儘管仍有挑戰,我們公司本身就是做腿的,所以對我們來說這是順理成章而且有趣的事情。大家普遍也很喜歡這個方向。而且如果大家都做輪式底盤,反而會導致同質化競爭,沒必要。我們公司專注於腿部,希望提升機器人整體的運動和幹活能力,這個方向非常不錯。我自己也做輪式底盤,我覺得輪式和腿式是有差距的,且隨着時間不同會變化。目前輪式底盤在工業開闊場景和貨架間穿梭非常穩定且能耗低,但在複雜環境中可能通不過。如果底盤做得更小,穩定性會喪失。所以不同時間點,機器人下半身的方案肯定不同。我堅信腿是未來,因爲它能實現上半身所有可達空間,並且能靈活調動腰部的靈活度。但在不同階段,會有最適合落地應用的形態,我們也不會侷限於單一方案。我們同時用輪式底盤和語數的人形機器人做下半身甚至全身的控制研究。
13、我們知道物理AI,特別是機器人領域,對能耗、熱管理和體積限制有很高的要求。請問英偉達是如何應對這些挑戰的?未來的計算平臺又將如何滿足這些需求?
Rev:回顧歷史,NVIDIA每一代產品都會大幅提升每瓦性能和每美元性能。過去我們有摩爾定律,意味着計算能力會以指數速度增長——在最佳階段,每五年性能提升10倍,十年提升100倍。但單靠摩爾定律已經不足以解決我們面臨的許多問題。我們預見到,摩爾定律在CPU和通用計算機上的效用會逐漸終結。
爲此,我們致力於打造針對特定算法的專用計算機。這種專用計算機不僅僅是芯片層面,更需要算法、軟件以及應用層面的整體優化,才能發揮最大性能。這並非靠單一因素,比如芯片變小或變快,而是通過全棧優化實現的。這是一項非常艱難的工程,也正是NVIDIA的核心競爭力所在。
我們最初應用這套方法於計算機圖形渲染(尤其是遊戲領域),隨後推廣到其他領域。CUDA推出後,我們開始應用於物理仿真,後來深度學習和AI在GPU上興起,我們不斷專門化處理器。每一代產品,在相同功耗和成本下都實現了顯著的性能飛躍,未來仍會持續,因爲我們的創新之路還遠未走完。
14、相比其他國家,怎麼看中國AI的需求和實踐中的挑戰?
Rev:中國既是一個重要的市場,也是AI技術和產品的生產基地。中國擁有大量聰明、受過良好教育且充滿熱情的AI研究人員和開發者,全球近一半頂尖AI人才都集中在這裡,且中國擁有頂尖的AI高校。
在物理AI和機器人領域,中國擁有獨特的規模優勢,結合人才優勢,形成了獨一無二的生態系統。中國在製造電子硬件和機器人所需關鍵部件方面具備深厚的專業能力,這樣的生態體系和製造規模是其他國家難以匹敵的。這使得像銀河通用、宇樹科技這樣的企業,能夠大規模製造機器人,快速學習和迭代。中國獨特的綜合條件爲物理AI和機器人產業的快速發展提供了堅實基礎。