階躍星辰CEO姜大昕:進入Agent發展階段,落地智能終端

21世紀經濟報道記者 董靜怡 上海報道

在大模型“六小虎”中,階躍星辰一直比較低調。

據悉,階躍星辰成立於2023年4月,總部位於上海,由前微軟全球副總裁、微軟亞洲互聯網工程院首席科學家姜大昕創立。2024年底,階躍星辰完成了數億美元的B輪融資,獲得了國有資本和騰訊等機構的支持。

從成立之初,階躍星辰就以實現通用人工智能(AGI)爲目標,規劃了一條清晰的技術發展路線:從單模態到多模態,再到多模理解和生成的統一,最終構建世界模型。

2月21日,在階躍星辰首屆Step UP生態開放日上,階躍星辰創始人、CEO姜大昕介紹了階躍星辰的系列成果。不難看出,隨着DeepSeek大模型的發佈以及市場競爭加劇,“六小虎”的技術路線和戰略佈局已走向分化,而對於階躍星辰來說,則是注重多模態和開源。

姜大昕曾表示:“多模態模型是實現AGI的必經之路。”這一理念貫穿了階躍星辰的發展歷程。

階躍星辰的技術核心在於其Step系列多模態大模型。在短短兩年多的時間裡,階躍Step系列模型矩陣已經發布了11款多模態大模型,覆蓋語音識別、語音生成、多模態理解、圖像及視頻生成的全面能力。今年1月,階躍星辰發佈Step R-mini,成爲Step系列的首款推理模型。

開源是階躍星辰多模態技術發展的重要戰略之一。此前,DeepSeek的開源引發全球市場的關注,隨後的2月18日,階躍星辰聯合吉利開源了Step-Video-T2V和Step-Audio模型。據介紹,這兩款模型分別是全球參數量最大、性能最好的視頻生成開源模型和行業內首款產品級開源語音交互大模型。

姜大昕表示,自模型開源以來,受到廣泛關注和反饋。他透露,今年3月,階躍星辰還將開源公司自研的圖生視頻模型。

在應用層面,姜大昕特別提到了Agent(智能體)的發展。

他在主旨演講中表示,“我們朝着實現AGI的目標穩步前進,目前已進入Agent的發展階段。”

Agent的核心特徵是能夠自主幫助人類完成複雜任務,姜大昕表示,所謂“自主”,包含“自動”與“主動”兩層含義。“自動”指Agent在執行任務時儘可能減少或無需人類干預,獨立完成任務;“主動”則指Agent能夠根據用戶所處的環境主動發起任務,而不僅僅是被動接受任務。

他指出,智能體的發展依賴於兩大關鍵要素:一是多模態能力,讓智能體充分地感知和理解世界;二是推理能力,使智能體能夠進行長思維鏈的慢思考,主動規劃、嘗試、反思,通過不斷糾錯提供準確的答案。過去一年,這兩個能力均取得進展。

階躍星辰將智能終端Agent視爲大模型技術落地的核心突破點,並重點佈局汽車、手機、具身智能、IoT等關鍵應用場景。

“無論是AI手機、PC、智能汽車、IoT設備以及機器人,我們判斷未來每一臺終端設備都會有一個Agent,這個Agent會用多模態的方式和我們交互,幫助我們完成複雜任務。”姜大昕表示。

他認爲汽車是終端Agent最關鍵的落地場景。千里科技董事長印奇在圓桌論壇中分享稱,“通過AI大模型、端到端智駕、駕艙融合等技術的突破,智能汽車的體驗將實現從量變到質變的跨越。”

姜大昕認爲,Agent的能力將隨着底座大模型的多模態能力和推理能力的增強而不斷演化。智能終端Agent的發展可劃分爲五個層級:

Level 1:完成簡單任務,如單一App內的操作。

Level 2:完成組合任務,涉及多個步驟和多個App。

Level 3:完成複雜任務,需要深度思考,如綜合分析和報告生成。

Level 4:從被動完成任務轉變爲能主動提示或完成任務,需深入瞭解用戶環境和偏好。

Level 5:從智商提升至情商,實現情感陪伴和情緒價值。

在開放日上,階躍星辰宣佈與吉利汽車集團、OPPO、智元機器人等企業深化合作關係。業內普遍認爲,隨着多模態和推理技術的進一步發展,智能終端Agent領域有望實現更大的突破,推動AI技術在更多場景中的落地應用。