智元合夥人姚卯青:2年內有望迎來具身智能的GPT時刻
21世紀經濟報道記者 鄧浩 上海報道
機器人無疑是當前資本市場最耀眼的明星,不過也有亂花迷眼的一面。
一方面,模型技術尚未收斂,非共識不斷,另一方面,衆多公司涌入,大單融資頻現。
目前具身智能到底處於什麼階段?
在8月21日的智元機器人首屆合作伙伴大會上,公司董事長兼CEO鄧泰華給出了他的判斷,“2025年具身智能機器人將迎來商用發展的拐點,最終成爲繼手機和汽車之後的‘下一代海量智能終端’。”
在機器人銷量上,鄧泰華透露,預計今年有幾千臺的出貨,明年會有數萬臺,希望未來幾年達到每年數十萬臺規模。
據瞭解,目前智元機器人已聚焦講解接待、文娛商演、工業智造、物流分揀、安防巡檢、商用清潔、數採訓練、科研教育八大場景,推出定製化解決方案並實現多行業規模化應用。
智元機器人合夥人、具身業務部總裁姚卯青在接受21世紀經濟報道記者在內的媒體採訪時表示,“我們應該能夠爲整個具身智能產業去快速積累大量真實數據,2年內有希望達到現在語言大模型所應用的規模,真正帶來具身智能GPT涌現時刻。”
已達到工人7成效率
工業場景的具身智能,類似於L2級智能輔助駕駛,相對可控,要求數據量也不太多,成爲衆多本體公司佈局的方向。
不久前,智元就曾官宣與富臨精工達成數千萬元標的的項目合作,近百臺遠征A2-W落地富臨精工工廠,成爲國內首個工業領域具身機器人規模化商業簽單案例。
在姚卯青看來,“工業場景是一個有限範圍內的通用性,不是無邊界的通用性。在特定環境、特定工作任務上能夠對它有限範圍內做泛化就可以。”
實際上,在剛剛過去的WAIC上,智元就與德馬科技直播展示了世界首個真正數據驅動的具身智能機器人物流作業。在1:1復刻的物流作業區,德馬飛梭Flash Sorter與智元人形精靈G1協同作業,完成全自動供包與包裹二次分揀任務。
姚卯青表示,“我們和德馬在合作的這種上包(物流上包)環節,只要對幾百種、幾千種包裹的形態達到很好抓取效果,(這意味着)不管是來料怎麼放,是隨意堆疊,還是翻面、形狀、顏色等不同情況,我們都能夠成功識別、抓取或翻面。”
姚卯青直言,“我們解決的是和這些設備去配合中人的環節,(也就是)把這些人替代成通用機器人去幹。”
德馬科技副總裁兼技術中心主任王凱則透露,“現在機器人真正去替代一個工人,雖然效率上估計只有70-75%的水平,(但)也超乎我們的想像。在智能物流裝備的領域,我們認爲未來一定會存在人機協同,甚至機器來作爲總的Commander來控制生產廠,可以去規劃每天分揀的數量、設備狀態等一系列東西。”
更大價值在上肢作業
對於行業熱議的具身智能數據卡點問題,姚卯青頗爲樂觀。
姚卯青透露,“在過去半年很多場景的客戶,都在快速向我們提一些面向真實場景數據需求。這些需求都是代表真實應用案例,也能夠幫我們去慢慢積累、擴充數據集。而這類數據大規模的標準化生產和檢驗標註的環節,也和杭州灣具身智能創新中心的夥伴一起聯合推進。從這個角度來講,我還是比較樂觀的,應該能夠爲整個具身智能產業去快速積累大量真實數據,2年內有希望達到現在大語言模型所應用的規模,真正帶來具身智能的GPT涌現時刻。”
“垃圾進,垃圾出”是深度學習領域的黃金法則,一定程度上意味着高質量的多元數據,纔是實際競爭的門檻,或許這纔是智元不斷和產業上下游合作,積累場景數據的根因。
姚卯青就表示,“在大模型技術背景下面,大家拼的就是數據質量、數據配方、數據工程能力,好的數據決定模型上限,差的數據決定模型會有比較差的表現。我相信具身智能將來也是這樣的,這個價值更大,因爲數據獲取難度更高,在物理世界裡採集到纔是最珍貴的,相信將來真正做AGI的公司會不計代價的獲取儘可能多的數據。”
在這裡,姚卯青介紹了一個細節,挺有意思。
最近,智元與Google這類的國際大廠AGI團隊交流,在詢問希望以什麼節奏來獲取何種數據量時,對方的反饋很直接,“越多越好、越快越好、越豐富越好。”
值得一提的是,姚卯青認爲,具身智能將來更大的價值,在於上肢的作業能力。
姚卯青坦言,“運控很重要,你需要穩定的運動、移動,才能配合高效作用,但我們覺得僅僅有這個是不夠的,我們需要真正把更難的作業操作問題去解決。這個操作問題就是一個比運動控制難兩個數量級、難100倍以上的問題,你需要去沉下心來,花很長時間,從硬件到算法到數據,真正去持續打磨。”
“下半年,我們會陸陸續續發佈很多行業應用的震撼展示,真正讓大家看到,機器人不僅僅能夠提供情緒價值、文娛價值,它最終也會解決生產力問題。”姚卯青稱。