階躍星辰姜大昕:Step 3是推理時代最適合應用的模型

7月25日消息,在2025世界人工智能大會前夕,階躍星辰在上海發佈了新一代基礎大模型——Step 3。據介紹,作爲階躍的主力基座模型,Step 3兼顧智能與效率,旨在面向推理時代打造最適合應用的模型。Step 3將於7月31日面向全球企業和開發者開源,爲開源世界貢獻最強多模態推理模型。

同時,階躍星辰還宣佈聯合多家國內領先的芯片、平臺廠商發起成立“模芯生態創新聯盟”,將通過推動模型和芯片產業鏈聯合創新,加速大模型應用的落地。此外,階躍星辰與上海國有資本投資有限公司達成深度戰略合作,將圍繞加強資本鏈接、生態業務合作等方面進行全面的深度合作。

現場,階躍星辰創始人、CEO姜大昕表示:“從Step 1到Step 2兩代基模的快速迭代,促使我們深入思考什麼纔是最適合應用的模型。隨着大模型進入到強化學習發展階段,新一代推理模型成爲主流,模型性能的提升固然顯著,但這是否完全等同於模型價值?面對這一產業之問,我們必須迴歸客戶需求,立足真實應用場景,探索模型創新落地的可行路徑。這是我們研發新一代Step 3基礎模型的出發點。”

具體來看,新一代基模 Step 3號稱是推理時代最適合應用的模型。階躍星辰提出,最適合實際應用的大模型需要滿足強智能、低成本、可開源和多模態四個特徵。唯有模型全面發展,才能讓模型真正用起來。

首先,不妥協的性能,Step 3是階躍星辰首個全尺寸、原生多模態推理模型,兼顧模型效果與推理成本,是在模型架構創新、算法工程協同設計上的一次大膽嘗試與Scale Up。Step 3採用 MoE 架構,總參數量321B,激活參數量38B。

與此同時,Step 3擁有強大的視覺感知和複雜推理能力,可準確完成跨領域的複雜知識理解、數學與視覺信息的交叉分析,以及日常生活中的各類視覺分析問題。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜單上取得了開源多模態推理模型的SOTA成績。

其次,極致成本,據介紹,在確保性能的前提下,階躍星辰持續推進模型成本優化。目前,主流開源模型雖然針對解碼進行了大量優化,但其優化方案主要適配國際高端芯片,在中端及國產芯片上的解碼效率仍有提升空間。

據瞭解,在架構設計階段,Step 3便充分考量系統與硬件的特性,實現廣泛硬件平臺上的高效推理。根據原理分析,Step 3在國產芯片上的推理效率最高可達DeepSeek-R1的300%,且對所有芯片友好。在基於 NVIDIA Hopper 架構的芯片進行分佈式推理時,實測Step 3相較於 DeepSeek-R1的吞吐量提升超70%。這些都是在不犧牲激活參數量、不降低注意力容量的條件下實現的。這些結果充分驗證了 Step 3具備廣泛的普適性,在多種硬件環境下部署,均能顯著地降低推理成本。

據悉,階躍星辰宣佈聯合近10家芯片及基礎設施廠商,共同發起“模芯生態創新聯盟”。該聯盟的首批成員包括華爲昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。目前,華爲昇騰芯片已首先實現Step 3的搭載和運行。沐曦、天數智芯和燧原科技等也已初步實現運行Step 3。其它聯盟廠商的適配工作正在開展。

資料顯示,階躍星辰戰略性聚焦智能終端Agent的方向,重點佈局汽車、手機、IoT設備等關鍵應用場景。