拆解具身智能落地難題:智元機器人出牌,今年推7個場景商業化

本文來源:時代週報 作者:朱成呈

具身智能的熱度仍在高漲。

8月21日,智元機器人在上海舉辦首屆合作伙伴大會。董事長兼CEO鄧泰華提出,“生態共建是具身智能產業規模化的核心驅動力”,並將其確立爲公司核心戰略。

他認爲,2025年或將成爲產業進入商用拐點的關鍵節點,繼手機和汽車之後,具身智能機器人有望成爲“下一代海量智能終端”。

目前,具身智能領域正加速演進:從軟硬件解耦到人形機器人迭代,再到與大模型的深度融合,技術創新層出不窮,應用邊界不斷拓展,覆蓋工業製造、醫療康復、教育娛樂、交通出行乃至公共安全等多個場景。

中國高工機器人產業研究所(GGII)預測,2025年全球人形機器人市場銷量有望達到1.24萬臺,市場規模63.39億元。到2030年,全球人形機器人市場銷量將接近34萬臺,市場規模將超過640億元;到2035年,全球人形機器人市場銷量將超過500萬臺,市場規模將超過4000億元。

但熱度之下,仍存隱憂。研發投入高企、落地週期漫長,成爲橫亙在所有人形機器人企業面前的現實挑戰。如何在“燒錢”的研發和可持續的市場回報之間找到平衡,決定了整個產業能否走出實驗室,真正邁向規模化。

“具身智能仍處於高速發展階段,很多場景看似可行,實際操作中卻困難重重,尤其在面對非標準化、易變形的目標物時,當前技術還難以勝任。”智元機器人通用業務部總裁王闖在現場表示。

據時代週報記者瞭解,與特斯拉強調的“全棧自研”、Agility Robotics的“量產先行”路徑不同,智元將選擇一條“生態共建”的第三道路:通過開源、被集成和資本賦能,與產業鏈夥伴協同分工,以合作來對衝風險,加速商業化落地。

今年推動七個場景商業化

在商業化探索上,業界普遍認爲,人形機器人面臨的首要挑戰是硬件成本高企與場景適配性不足。

“讓機器人硬件率先進入各個賽道,在真實環境中收集用戶數據,進而解決機器人的智能問題,對應的是從遙操作向半自主、再向自主的方向發展。”國家地方共建人形機器人創新中心首席科學家江磊表示。

他以新能源汽車產業對比稱,該產業實現商用化大約經歷了25年,人形機器人能否將這25年的發展過程壓縮至5到10年,這是當前的重要課題。而實現這一目標的方式,是凝聚共識、開源開放,極致地整合各方資源。

與之對應,智元機器人並未“單打獨鬥”,而是通過合資、戰略投資、聯合研發等方式,與上下游龍頭企業共同構建生態網絡。目前,其合作伙伴已覆蓋材料、零部件、製造與應用環節,包括富臨精工(300432.SZ)、軟通動力(301236.SZ、德馬科技(688360.SH)、大豐實業(603081.SH)等。

軟通動力集團副總裁、軟通天擎營銷副總裁李永輝對時代週報記者坦言,選擇智元的原因在於其產品穩定性和開放性。“我們最看重的第一點就是穩定可靠。比如智元遠征A2可以實現24小時連續運行,這讓我們在政務、展廳、酒店等場景的落地上充滿信心。”

李永輝進一步表示,軟通動力服務對象包括全球500強企業,與智元機器人合資設立的軟通天擎,可將智元的硬件能力與軟通的行業經驗深度結合,從而服務最終客戶。

聚焦物流領域,德馬科技CTO王凱則強調:“我們看重的不僅是智元在機器人本體上的研發能力,更重要的是其在具身智能、大模型和數據採集上的積累。物流場景需要的不是一個機械執行者,而是一個能夠自主決策的智能體。”

爲此,德馬科技與智元共建數據採集工廠,藉助其在全球數百個物流場景中的經驗,向智元提供精準的場景定義,以便後者能夠開發出更符合行業需求的解決方案。

“客戶常以爲機器人已經無所不能,但我們必須如實告訴他們今年能做到什麼、明年大概能達到什麼水平。”王闖表示,正因如此,智元今年聚焦在講解接待、文娛表演、料箱轉運、科研教育、物流分揀、數據採集訓練、機器狗/商業清潔七個具備落地把握的重點場景上,推動商業化進展。

機器人技術不能閉門造車

當前,面向交互生成的非具身智能大模型發展已在特定任務上取得出色成果,但是人形機器人需要能夠同時處理視覺-語言-動作等多模態信息輸入的具身大模型。具身大模型仍面臨來自數據稀缺、泛化性低、分層控制、實時反饋等方面的挑戰。

民生證券研報指出,爲了突破數據困境,行業內存在兩種思路,其一,以英偉達、銀河通用爲代表的企業試圖通過仿真數據的方式,生成數據用於機器人訓練;其二,以智元機器人爲代表的企業建立大規模數據採集廠以收集高質量的真實場景數據,再尋求合適的比例將真實數據與仿真數據混合,以實現較優的訓練效果。

智元機器人合夥人兼具身業務部總裁姚卯青向時代週報記者表示,機器人技術不能閉門造車,必須紮根行業,產生實際應用價值。

“智元希望從下游場景出發,吸引更多合作伙伴共同參與,讓具身智能技術在早期得到試用與迭代。通過這種方式,企業和開發者能夠積累真實行業數據,發現痛點,並進一步優化機器人設計,使其更加貼合實際應用。”他進一步解釋。

在數據與模型層面,智元發佈了行業首個面向真實世界機器人操控的統一世界模型平臺——Genie Envisioner(GE)。GE平臺基於約3000小時的真實機器人操控視頻數據,建立了從語言指令到視覺空間的直接映射,保留了機器人與環境交互的完整時空信息。

姚卯青指出,GE是在現有視頻生成模型基礎上,通過真實機器人作業數據進行二次訓練形成的“真機訓練”模型。針對特定任務,還需在此基礎上進行第三階段微調,以實現落地應用。

值得注意的是, GE也開源全部代碼、預訓練模型和評測工具。

作爲打造通用機器人平臺的初創公司,智元或難以獨立覆蓋所有行業應用。無論標準硬件、應用開發還是算法基座,追求標準化和可複用成爲重要目標,行業夥伴也可以藉此快速接入。

“工業和行業應用項目資源消耗巨大,從開發到交付再到售後,每個環節都需要大量投入。與合作伙伴聯合,不僅彌補了資源與人才不足,也能借助他們多年的行業經驗,實現優勢互補。”姚卯青說,智元將通過封裝標準硬件和AI基座,讓合作伙伴能在實際場景中快速落地應用,推動技術從實驗室走向商業化。