押中OpenAI後 黃仁勳等待中國具身智能的“GPT時刻”

《科創板日報》8月13日訊(記者 李明明)黃仁勳正在像押注OpenAI一樣在中國押注未來的具身智能巨頭。

在剛剛落下帷幕的2025世界機器人大會,英偉達攜手衆多中國機器人生態合作伙伴亮相,展示了其在物理AI與通用機器人領域的戰略佈局,宇樹科技和銀河通用位列其中。

這兩家企業近期常被業內以“南宇樹 北銀河”的說法同時提起,分別代表着硬件本體和軟件大腦的兩條核心技術路徑。在這場大會上,英偉達Omniverse與仿真模擬技術副總裁 Rev Lebaredian、宇樹科技創始人王興興與銀河通用機器人創始人及CTO、智源學者王鶴罕見同框,三人圍繞人形機器人領域的諸多熱點話題展開了討論。

南宇樹 北銀河

就像當年英偉達押注OpenAI一樣,黃仁勳正在重注中國未來的具身智能巨頭,但不同的是,黃仁勳這次把籌碼分散下注在了多家中國機器人公司身上。

本次大會,衆多英偉達的機器人生態合作伙伴亮相,除了上述銀河通用和宇樹科技,中堅科技、傅利葉智能、北京人形機器人創新中心、加速進化、星動紀元、逐際動力、優必選、樂聚機器人、星海圖、衆擎機器人等也悉數現身。

此前,英偉達在CES 2025一次性展示的 14 款人形機器人中,也有 6 款來自中國;在北京 2025WRC 現場,又把這些中國夥伴放到舞臺 C 位,無疑再次凸顯了英偉達利用中國供應鏈、場景與數據紅利的策略 。

可以看到,英偉達的機器人生態並非簡單採購關係,而是以“算力-仿真-數據”三環相扣的基礎設施,把分散的硬件本體、垂直場景、算法團隊編織成一張可快速商業落地的網絡。

從英偉達的佈局來看,涵蓋了具身智能、機器人、多場景應用等多個關鍵領域。在技術層面,藉助合作伙伴在硬件研發和軟件算法的創新,結合自身的AI技術、仿真技術以及機器人超級計算機,構建從模型訓練、仿真測試到終端部署的全棧機器人技術體系;

在市場應用方面,英偉達通過與不同特點的企業合作,覆蓋工業製造、商業零售、物流、城市服務、教育、娛樂等多元場景,加速機器人在各行業的滲透和普及。

其中,銀河通用自研的、內置英偉達Thor芯片的人形機器人Galbot,就在本次WRC大會上引起了關注。記者在大會現場的搬運任務展示環節看到,Galbot可快速滑步至貨架,自主完成裝卸動作,全程無需人工干預。

宇樹則爲其新型人形機器人R1部署了NVIDIA全棧機器人技術。

英偉達把專注不同環節的兩家標杆性企業同時放進生態,或有對衝風險和加速收斂之意。

100萬億美元物理世界市場

本次三人對談內容涵蓋其大規模商用過程中的難點、面臨的關鍵挑戰、存在的技術瓶頸與發展風向,人形及雙足設計的必要性,中國企業在物理AI與機器人領域的優勢,以及預計將率先實現普及的應用場景等方面。

Rev Lebaredian率先拋出了主要論斷:過去計算主要影響信息世界,而現在藉助人工智能,計算能通過機器人進入物理世界,連接信息與物理世界,挖掘100萬億美元物理世界市場的潛力。

中國在AI人才(全球近半)、電子製造能力、製造業基礎(提供機器人部署測試場景)上具有獨特優勢,是物理AI和機器人發展的理想之地。

在英偉達的機器人相關佈局上,Rev Lebaredian表示,需打造機器人本體計算機(如Jetson Thor)、AI工廠計算機(如DGX系統)、仿真計算機三類計算機,分別用於機器人內部運行、開發“大腦”、生成數據和測試。

對人口與機器人關係的看法上,他認爲,機器人數量與生育率無直接關聯,但機器人可作爲“人工人口”提升生產力,應對人口縮減帶來的經濟問題。

王興興將人形機器人視爲通用機器人的重要載體,結構相對簡單(由關節電機串聯而成),未來有望像組裝電腦一樣普及,且通用AI成熟後對硬件要求會降低。

對於宇樹的產品進展,王興興披露,此前發佈的人形機器人售價9.9萬元,新版本降至3.9萬元,具備競爭力,外觀可定製,現貨供應且年底量產。

技術與應用上,利用NVIDIA的Isaac Sim平臺訓練機器人動作,但受硬件物理極限限制,複雜動作執行受限;

自主開發20自由度靈巧手,目標是讓機器人執行日常任務;通過採集人體動作數據結合深度強化學習訓練動作;

目前,機器人已在晚會表演、商業演出、機器人格鬥賽等場景應用。

王鶴則表示,銀河通用的目標是打造通用機器人,其核心要素包括本體、具身智能模型、數據支撐。

未來與商業化方面,銀河通用商業化落地案例包括全球首個24小時智慧藥房解決方案(簽約超100家藥店)、24小時智慧零售店項目(已在部分城市落地)。

他表示,未來十年人形機器人產值增長迅速,市場規模有望超越當前工業機器人。限制人形機器人規模化部署的關鍵是幹活能力不足、任務類型有限,解決目標識別和定位問題後,市場規模可觀。

以下是精選後的三人媒體問答內容:

人形機器人商業化與技術瓶頸

1、 宇樹R1定價3.99萬元,這是否意味着硬件成本已不再是影響機器人商業化的障礙?現階段,推動人形機器人規模化商用還存在哪些難點?

王興興:我一直認爲,人形機器人商業化的關鍵不在成本和硬件。畢竟哪怕一臺機器要10萬、100萬,只要能用,很多場景照樣能落地。

現在最棘手的問題是具身智能模型的泛用性和實用性還不夠。其實硬件在過去一兩年就已經夠用了,後續無非是在可靠性、成本上再優化,但它並非限制因素。

2、未來機器人在哪些場景會迎來大規模普及?

王興興:未來機器人會更實用,但發展週期較長,像新能源車一樣,成熟需要時間。現在的機器人技術才發展兩三年,和十幾二十年前的技術水平完全不同,不能混爲一談,整體還需時間培育。不過行業成長迅速,未來幾年人員和出貨量有望每年翻倍。

若有更通用的AI大模型,機器人在工廠、家庭等更多場景的表現會更好,也更容易普及。整體來看,普及週期會更長,尤其是家用領域,難點不在技術,而在倫理、安全等要求高,導致普及門檻高。

3、今年,許多人形機器人已開始在汽車工廠進行訓練。機器人真正能在工廠車間投入工作還需要多長時間?還有哪些關鍵挑戰需要解決?

王鶴:今年,不少人形機器人已開始在汽車工廠接受訓練。目前多數公司在工廠推廣這類機器人,主要聚焦搬運和分揀兩大方向。

搬運方面,銀河通用近期展示的機器人視頻顯示,其搬運速度已接近人類,每小時搬運量與人類相當,現已非常接近實際工廠部署水平,預計今年年底可能有幾十臺投入車間實際應用。

但搬運只是開端,還需實現碼垛的閉環能力。只有搬運和碼垛均形成閉環,機器人才算真正勝任整套工作流程,否則任務只完成一半,效果會打折扣。

分揀則是更大的挑戰。無論是從傳送帶取物還是從貨架取貨,當前最大的難題是速度。熟練工人取物速度很快,而機器人目前在模型和硬件層面,還難以達到這樣的效率。

我們研發的零售機器人,從貨架或桌面取物的技術本質與工業分揀類似,只是零售對節奏要求較低,拿錯貨的後果也較輕。但在工業場景,比如汽車製造廠,生產線停機一分鐘就可能造成上萬元損失,因此對分揀的精度和速度要求極高。

總的來說,分揀技術雖已有不小進步,但目前尚未達到人類工人的水平,仍需一定時間進行技術迭代和突破。

4、目前限制人形機器人規模化部署的關鍵技術瓶頸是什麼?

王鶴:最核心的問題很簡單:機器人幹活能力還不夠強,能做的任務類型有限。但如果能把這些有限技能做到足夠通用,就能快速賦能很多場景。

銀河通用目前最主要的突破在“抓取”和“移動”上。只要機器人能抓住任何物體,能在場景中完成下肢移動、上肢伸展,最後準確放置物體,這三個能力具備了,很多應用場景就能落地。這背後需要精準的目標識別和定位系統,我們目前正通過合成數據推進這項技術。

當然,就算解決了這個關鍵問題,仍有不少任務是機器人暫時做不了的。但只要攻克了目標識別和定位難題,人形機器人市場至少能達到千億級規模,而且五年內就能看到成效。突破這個技術瓶頸後,有了龐大的市場投入,機器人肯定能解鎖更多技能,向萬億市場邁進。

機器人形態與技術路線

5、國內外專家和企業對“人形”的必要性爭議不斷,有人認爲人形是AGI的最終載體,有人認爲未來十年人形機器人的佔比只有10%,銀河通用如何看待人形的必要性?

王鶴:長遠來看,人形機器人必然要融入人類生活。從終局形態來說,要在人類環境中穿梭,既能夠到一兩米高的地方,又能觸碰到地面,還能幹活,除了人形,沒有更合適的形態。

未來幾年,人形機器人會從移動複合機器人逐步向終局形態演進。定點機器人只能處理眼前的事,侷限性太大,所以移動能力是必須的;但光會移動的設備(比如工廠裡的移動小車)只能運貨,沒法做任何操作。我們現在做的機器人,就是在移動平臺上加裝可升降、可摺疊的雙臂——兩隻手配合才能完成抱箱子等複雜操作,這樣的設計更實用。

未來十年,人形機器人的市場佔比會很可觀。目前全球工業大機械臂總產值約1000億元,而人形機器人按10萬元一臺算,銷量不用太高就能超過這個規模。我預計它的產值每三年會翻10倍:現在頭部企業賣1000臺,三年後能到1萬臺,再三年到10萬臺;按每臺幾十萬元算,10萬臺就能達到千億元規模,超過現有工業機械臂的總產值。

所以未來十年,人形機器人市場規模會超過當前所有工業機器人;再往後十年,甚至可能達到萬億級,超越汽車、手機市場。不過這需要時間,不會一蹴而就。

6、針對具身智能大腦的基礎模型,宇樹科技主要聚焦哪些方向的探索?能否透露一些具體內容?

王興興:我一直認爲,目前模型架構不統一是導致行業進展緩慢的原因之一。如果架構能更統一、方向更明確,結合當下的行業熱度,突破速度會快很多,但現實是進展偏慢。

我們公司嘗試過不少方向。比如去年探索用視頻生成模型作爲“世界模型”來驅動機械臂並實現動作對齊,取得了一些效果,但這類模型訓練規模太大,受限於公司的算力和投入,沒能大規模推進。而且我們發現其泛用性也沒達到預期,後來就沒再繼續。不過最近谷歌發佈的新視頻生成模型物理對齊效果很好,還公開嘗試將其作爲世界模型用於機械臂和通用智能,這讓我覺得這個方向值得重新探索。

受公司規模、算力和人才限制,我們只是初步嘗試,沒有深入。但谷歌的成果證明了其潛力——視頻生成模型在時間維度、數據源和效果上已達到不錯水平。比如生成機器人打掃全屋的視頻後,理論上只要讓機器人動作與視頻對齊,就能實現類似效果,只是目前對齊工作仍復雜且有挑戰。這個方向對機器人應用和視頻生成技術本身都很重要,大公司也會持續投入優化。

此外還有其他方案。隨着基礎模型能力提升,很多潛力待挖掘。我們發現,在基礎模型訓練中加入機器人指令控制和空間理解訓練,效果會明顯提升。

我們的策略很簡單:不斷嘗試新模型和想法,根據情況調整。新興技術就該大膽探索,AI領域充滿可能,一個靈感或許就能帶來突破,也希望更多人蔘與探索。

7、機器人爲什麼要做雙足?除了情感價值,雙足在商業上還有哪些考慮?

王興興:其實我之前提過,更該思考的是“爲什麼不做雙腿”。雙腿設計相對簡便,更重要的是能提供更強的通用性。運動能力本質上屬於較弱的AI能力——你看小動物、螞蟻這些,走路都很靈活,但AI能力其實很低。所以我認爲,真正通用且能幹活的具身AI模型裡,移動能力或腿部功能只是附屬的。

如果機器人能高效完成任務,腿的控制自然不會差;反過來,要是連腿都控制不好,說明還沒達到真正通用的AI模型水平。所以雙腿是一個重要的發展方向。對我們公司來說,深耕腿部技術順理成章,而且這個方向本身也很有吸引力,大家普遍認可。再者,要是都去做輪式底盤,容易陷入同質化競爭,沒必要。我們專注腿部研發,希望提升機器人的整體運動和作業能力,這個方向很有前景。

我也做過輪式底盤,清楚輪式和腿式各有優劣,且隨着時間變化。目前輪式在工業開闊場景和貨架間穿梭時,穩定性好、能耗低,但面對複雜環境可能受限;底盤做小了,穩定性又會下降。所以不同階段,機器人下半身的方案必然不同。但我堅信腿是未來——它能讓上半身觸及更大範圍,還能靈活調動腰部。不過不同階段有不同的最優落地形態,我們不會侷限於單一方案,現在同時用輪式底盤和人形機器人做全身控制研究。

仿真技術與物理AI應用

8、在像醫療和養老這樣高精度應用場景中,NVIDIA Omniverse如何確保用仿真數據訓練的機器人具備可靠性和安全性?

Rev:如果你想構建一個能夠在現實世界中行動且安全可靠的機器人系統,實際上唯一的選擇就是使用仿真。舉個例子,你希望系統足夠智能,能夠應對那些很少發生的特殊情況,甚至應對你希望永遠不會發生的緊急情況。以自動駕駛爲例,我們絕對不希望車撞到人或者孩子,但當街上出現小孩時,車輛的大腦該如何反應,如何獲取訓練這類系統的數據呢?唯一的辦法就是通過仿真。因爲我們絕不可能將孩子置於汽車前作爲訓練樣本,這樣做是不道德的、危險的,而且耗時且昂貴。

即使訓練完系統,在將它部署到現實世界之前,也需要在這些相同場景中進行測試,確保在真正發生類似情況時,它能夠正確反應。因此,真正的選擇只有通過仿真實現,因爲現實世界測試過慢、成本高且危險,我們不希望機器人在現實世界先失敗。換句話說,如果我們無法讓仿真足夠準確以測試機器人,那麼我們將無法制造出可靠的機器人。幸運的是,目前已有非常準確的仿真器。不過,這些仿真器計算量大且成本高昂,我們面臨的真正挑戰是如何提升仿真速度,使其在大規模系統構建中具有成本效益,這也是我們一直努力的方向。

9、未來幾年內,驅動人工智能機器人的仿真領域會有哪些關鍵技術趨勢將改變整個行業?能否分享一些中國生態合作伙伴如何利用NVIDIA仿真技術加速產品創新的案例?

Rev:我認爲目前最大的趨勢,實際上是所有在常規人工智能領域出現的技術和發展,正被應用到物理人工智能中。其中最重要的突破是推理能力的提升。比如DeepSeek將推理能力帶入了開源領域,現在我們也看到了其他各種模型。

我們在智能水平上實現了飛躍,將同樣的技術應用到物理人工智能,是機器人領域的一個重大突破。如果我們要製造我們剛纔談論的那種機器人——比如能給你拿水的機器人——根據翻譯理解,可能在今年年底或明年,我們的機器人將能更自然地與人互動,並完成複雜的多步驟任務。這是非常關鍵的能力。而將這種能力與仿真結合,我認爲這是一個可能還未被廣泛理解,但將成爲重大突破的點。

目前我們面臨的主要問題是人工智能極度依賴數據,而獲取合適的數據非常困難。我們現有的推理模型,尤其是對物理世界的推理,現在可以幫助我們改善數據生成和數據創建的流程。

如今我們生成的數據,即使是合成數據,也需要大量人工參與,人工去構建虛擬世界和仿真環境,判斷該生成哪些數據才能讓智能系統更聰明。但是,如果我們把正在開發的人工智能技術用在數據生成流程中,就可以實現自動化,打造“自動駕駛”的合成數據生成。

如果我們擁有一個自動駕駛的合成數據生成工廠,就能直接將其接入訓練流程,實現訓練過程自動化,減少人爲干預,讓機器人大腦更聰明。至於中國的企業如何應用仿真技術及其帶來的影響,我認爲他們已經在積極探索和應用這些技術。