千尋智能解浚源:具身智能3-5年有望跨入GPT4時代

《科創板日報》6月29日訊(記者 張洋洋)在“具賦新能 智驅未來”青年科學家成果轉化暨具身智能高質量發展研修會上,千尋智能具身智能部負責人解浚源對行業現狀與前景作出研判分析。他把當前具身智能發展水平類比於GPT1至GPT3之間,而視覺-語言-動作(VLA)模型的興起,正爲該領域開啓遵循“Scaling Law”(規模法則)實現能力躍升的可能性。

解浚源分析,具身智能涵蓋“本體”(小腦)與“運控”(大腦)兩大核心。雖然本體機械性能已相當成熟,但“大腦”層面的智能算法曾長期遇阻。

VLA模仿學習路線的興起成爲關鍵轉折點。Diffusion Policy生成模型,有效解決傳統行爲克隆的“多模行爲平均化”難題,支持從隨機狀態生成多元路徑。

VLM與Diffusion Policy結合(VLA範式),藉助互聯網海量數據預訓練賦予模型“世界先驗知識”,顯著降低對真機數據的依賴,實現強泛化能力。

受大模型訓練範式啓發,千尋智能也是採用了類似的方式,利用互聯網數據預訓練,建立基礎認知;真機數據模仿學習,學習具體動作;強化學習優化,將成功率從95%提升至99%以上,補足最終精度缺口。

解浚源預判,若Scaling Law在具身智能領域成立,伴隨量產與基礎設施完善,機器人數據量有望按每年一個數量級遞增,例如今年百臺級,明年千臺級,後年萬臺級。據此推測,未來3至5年內,具身智能技術效果有望實現從GPT1到GPT4級別的跨越式發展。

值得關注的是,千尋智能創立於2024年2月,發展勢頭迅猛。成立4個月內即完成近2億元種子輪+天使輪融資;今年3月再宣佈完成5.28億元人民幣Pre-A輪融資。成立半年累計融資已超7億元。

資方陣容強大,Pre-A輪由沙特阿美風險投資旗下Prosperity7 Ventures(P7)領投,招商局創投、廣發信德、靖亞資本、東方富海、華控基金、達晨財智、柏睿資本、弘暉基金等多家頭部機構參投。

創始團隊上,兩位聯合創始人背景深厚——韓峰濤曾任珞石機器人聯合創始人&CTO,擁有豐富機器人制造與量產經驗,高陽曾是清華大學交叉信息研究院助理教授,現兼任公司首席科學家。