海納百川》人形機器人運動與感知能力 超級比一比(廖明輝)
不只會扭秧歌,還能絲滑跳街舞,宇樹機器人升級迭代「進化」神速。(宇樹科技官網)
3月19日這天是人形機器人進展的重要里程碑。當天,輝達執行長黃仁勳在GTC技術會議發表全球首項開源通用人形機器人訓練基礎模型GR00T N1。同時,中國宇樹科技也在微博發佈18秒影片,展示旗下G1人形機器人成功完成側空翻,成爲全球首例。影片中,G1順利完成動作後,一位身穿牛仔褲的員工隨即衝出,施放綵帶慶祝這一突破。同一天,美國波士頓動力也在YouTube發表54秒影片,展示Atlas人形機器人以極爲流暢且人性化方式,一氣呵成地完成側翻、前翻及連跳三次霹靂舞(Breaking)地板動作,展示運動控制技術已進入新境界。
宇樹科技早在1年前便以H1人形機器人完成原地後空翻,如今G1更成功挑戰更高難度原地側空翻。公司強調在開發與拍攝過程中,G1並未出現任何故障或損壞。此外,宇樹科技在微博舉辦「宇樹機器人側空翻真人挑戰賽」,承諾全球首位能成功複製該動作的真人將獲得一臺G1人形機器人,比賽有效期爲3個月。短短一天內,已有參賽者成功挑戰,公司也隨即公開結果並向參與者表達感謝。
成立於2016年的宇樹科技以四足機器人起家,爲全球首家公開零售高性能四足機器人公司,併成功將產品推向產業應用。2023年,宇樹正式進入人形機器人領域,G1作爲該公司開發的第二款人形機器人,以9.9萬人民幣售價,徹底打破特斯拉與波士頓動力的價格優勢。G1在人形機器人運動控制方面取得突破,尤其是側空翻技術,展現出高度精準動作協調能力,爲人形機器人的未來應用開啓更多可能。
波士頓動力的Atlas機器人早在7年前便完成後空翻,但當時機體仍爲液壓系統,動作較爲笨重。如今的電動版Atlas在運動靈活性大幅躍進,展現極自然且流暢動作。波士頓動力指出,這次Atlas的突破主要由於強化學習應用,透過機器學習訓練動作決策,並結合人體動作捕捉與動畫技術,使機器人動作更接近人類表現。強化學習透過獎勵機制訓練AI,能夠讓機器人自我探索最佳行動策略,而非依賴人工標記數據。這種技術讓機器人在複雜環境中快速適應與優化動作,有助於應對變化多端的現實應用場景。未來,這項技術將強化機器人在真實世界的學習與應變能力。
輝達執行長黃仁勳則在今年GTC會議主題演講的最後10分鐘,讓全場觀衆爲之驚豔,展示一款設計靈感來自《星際大戰》的BDX機器人,並直接在舞臺上進行即時互動,展現極高靈活性與感知能力。他稱呼這款機器人爲Blue,不僅能精準執行語音指令,甚至還能做出情感化迴應,例如當黃仁勳稱讚Blue「很聰明」時,它會搖擺屁股,顯示出情感反應能力。
黃仁勳在演講中正式發表開源GR00T N1機器人訓練基礎模型,模型採用雙系統架構,靈感來自人類的「快思慢想」機制。快思系統(系統一)負責即時反應,如移動、操縱物體與協調動作,而慢思系統(系統二)則透過視覺語言模型進行深度推理與語意理解,使機器人能夠處理更復雜的決策問題。這種架構與諾貝爾經濟學獎得主丹尼爾•康納曼在《快思慢想》書中所描述的人類認知模式高度相似,標誌着機器人從純粹的機械執行,向更高層次的推理智慧演進。
然而,訓練人形機器人時,企業仍需謹慎處理數據來源問題。由於真實數據收集與標記成本高昂,科技公司逐步轉向使用低成本的合成數據進行訓練,透過電腦模擬與AI自動產生數據來提升效率。然而,萊斯大學與史丹佛大學的最新研究指出,過度依賴合成數據可能導致模型品質下降,甚至引發「模型自噬障礙」(Model Autophagy Disorder, MAD)。這種現象會使AI系統因爲長期在自我生成的數據環境中訓練,而漸漸喪失對真實世界的適應能力,進而影響模型的泛化性與穩定性。因此,在機器人訓練過程中,適量融合真實數據與合成數據,避免AI系統退化,將是未來人形機器人研發需特別關注的關鍵課題。
綜觀中美兩國在人形機器人軟硬體的競合趨勢,宇樹科技、波士頓動力的技術發展各具特色,分別在運動控制、強化學習領域取得突破。而輝達的「開源」GR00T N1機器人訓練基礎模型,可應用在訓練中國傅利葉GR-1機器人、美國波士頓動力Atlas機器人、與以色列Mentee Robotics、德國Neura Robotics、挪威1X等各國所開發人形機器人。未來,通用人形機器人的應用範圍將逐步擴展,從工業製造到服務機器人,乃至日常生活協助,各國企業的技術競賽勢必加劇。在這場全球科技競逐中,人形機器人的發展不僅代表人工智慧進步,也將深刻影響人類社會的未來格局與生活方式。
(作者爲中華經濟研究院輔佐研究員)
※以上言論不代表旺中媒體集團立場※