21對話|聯匯科技CEO趙天成:具身智能演進方向的“非常答”
21世紀經濟報道記者 陳歸辭 上海報道
7月26日-28日,2025世界人工智能大會(下稱“WAIC”)在上海舉行。聯匯科技CEO兼首席科學家趙天成接受了21世紀經濟報道記者的採訪。
趙天成表示,今年WAIC異常火爆,一票難求。這是其公司連續第三年參展,明顯感受到行業週期的變化:2023年最熱門的是大模型,2024年是機器人,今年則是進入技術融合後百花齊放的AI落地應用。
趙天成表示,具身智能是今年最大的熱點之一,也是聯匯科技的核心方向。聯匯科技是全國最早研發多模態模型的企業,2022年就獲得了工信部大模型檢測的001號證書。多模態模型最好的應用場景是去賦能智能終端,讓這些智能硬件、智能機器人變得具有自主意識、能夠完成任務。“當前看到多模態模型越來越強了之後,我真的覺得具身智能可以從實驗室走向真正在物理世界裡去幫我們完成各種任務。”
日前,聯匯科技發佈了全球首個“萬物具身”智能體平臺OmAgent。趙天成解釋道,不同於Manus、豆包等聚焦數字空間的智能體,OmAgent面向物理世界,可以控制無人機、機器人等硬件載體。該智能體具備兩大能力:一是基於純視覺,通過空間感知知道周圍發生了什麼事情,二是根據任務決策做什麼,比如該如何移動、操作、說話等。
OmAgent的核心技術是聯匯科技的多模態模型,目前該模型已經從2021年的第一代迭代至第五代,迭代速度約爲一年一迭代。當前其強調以智能終端爲核心,具備三個特點:一是實時性要求高,二是低幻覺、高準確率,三是做深度的視覺系統,能夠不僅僅理解表面的意義,還可以根據任務去做深度的視覺思考。
關於具身智能從當前 L2 階段向 L3、L4 階段演進的方向,趙天成表達了自己一個“非常規”的觀點,他認爲,具身不一定是人形的,任何有智能、有硬件載體的,只要有具體身體,都屬於具身智能。不同的載體的發展階段是不同的,人形機器人目前可能屬於L1、L2階段,更成熟的本體如四足狗可能已經進入L3階段,再成熟些的如攝像頭、無人機可能已經到L3、L4階段了。所以,具身智能的落地會分智能載體的成熟度、分階段、分批次地去落地。
聯匯科技是一家杭州公司,近期,其將國際總部落戶上海張江。趙天成表示,選擇浦東張江,一是看重它是大量智能終端與具身機器人的聚集地,能對接到更多供應鏈企業;二是看重豐富的應用場景,無論是物流、碼頭還是工業製造等領域,都存在大量大的場景,爲物理AI發揮其能力提供了絕佳的場景。