DeepSeek衝擊波:大腦平權催化具身智能 | 投研報告

中國銀河近日發佈“AI+”系列報告(機械篇):DeepSeek衝擊波:大腦平權催化具身智能。

以下爲研究報告摘要:

大模型如何賦能具身智能機器人?現實世界場景過於複雜,人工構建完整的技能庫幾乎不可能,因此泛化能力對於通用具身機器人十分關鍵,而大模型是提升機器人泛化能力的重要工具。1)感知層面,具身智能可以幫助機器人主動映射、主動定位、物體識別、交互感知,其中大模型能更好地處理語言、2D圖片、3D數據等多模態數據;2)推理層面,具身智能能夠幫助機器人進行任務規劃、導航等,其中大模型可一定程度取代人工建模,理解各種人類文本命令,適應新環境新物體新任務,提高泛化能力;3)執行層面,具身智能可幫助機器人技能學習,使用大模型在真實場景數據上有較之前更好的泛化性。

分層端到端爲當下主流,新範式持續涌現:具身智能模型按照算法可分爲兩類,分層端到端模型和端到端模型。1)分層端到端一般分爲三層:基礎大模型(LLM/VLM)、決策模型(LLM向強化學習演進)、操作模型(“MPC+WBC”向“RL+仿真”轉變),對數據需求相對更少,在新任務學習上更有優勢。2)端到端大模型,同時訓練決策和操作,對數據和算力要求高,以谷歌RT-2爲代表。目前被大多數本體廠商使用的是分層端到端模型,外接VLM大模型+自研操作小模型,例如Figure02接入OpenAIVLM,Apollo接入谷歌機器人大模型,樂聚“夸父”接入華爲盤古大模型等。同時,模型的創新也在不斷涌現。Figure2月20日發佈的具身智能大模型Helix可完成從原始像素和文本命令映射到連續動作;無需任何任務特定的微調;將VLM主幹與機器人視覺運動策略結合達到高速連續控制;實現全身控制和多機器人協作;在本地GPU運行。Helix大幅提升了人形機器人家用可能性。

DeepSeek衝擊波:大腦平權催化具身智能:DeepSeek能夠提供開源優質的LLM(DeepSeekV3/R1)和VLM(DeepSeekVL2),有利於實現大腦平權,並催化具身智能。1)DeepSeek讓一些受制於大模型閉源限制而難以承受從頭開發“大腦”的機器人企業,能夠接入開源“大腦”,從而將更多資源投入到機器人“小腦”(操作小模型)開發中,縮小初創企業參與具身智能機器人研發製造的門檻,並緩解行業中操作小模型發展遲滯現狀。例如,在具身模型分層端到端架構中,基礎大模型一般爲LLM/VLM,DeepSeek可以給本體廠商提供開源、高性能且“低價”的選擇。2)DeepSeek會促進一些人形機器人初創公司開始自研真正適配具身智能機器人的大模型,激發行業創新,實現效果優化。FigureHelix在其系統2部分內置了一個開源的、開放權重的VLM,DeepSeek可以極具性價比地提供此類功能。

投資建議:我們認爲,DeepSeek促進大腦平權,驅動具身智能機器人研發進展和商業落地,行業量產有望加速,建議關注執行器-三花智控/拓普集團/匯川技術/恆立液壓,減速器-綠的諧波/豐立智能,絲槓-恆立液壓/貝斯特/北特科技/五洲新春/震裕科技,靈巧手-鳴志電器/兆威機電,六維力傳感器-柯力傳感,觸覺傳感器-漢威科技/福萊新材等。

風險提示:產業政策及產業化不及預期的風險;Optimus進展不及預期的風險;國內供應商在特斯拉供應鏈進展不及預期的風險:技術選代的風險。( 中國銀河 魯佩,彭星嘉)

免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請覈實。據此操作,風險自擔。