姜大昕:攀登AGI山峰,“萬億參數”和“多模融合”缺一不可
2024世界人工智能大會啓明創投·創業與投資論壇今天舉行。階躍星辰創始人、CEO 姜大昕博士受邀出席此次論壇,發表了主題爲《攀登AGI的路徑與實踐:萬億參數和多模融合》的演講,分享了對於大模型發展現狀與趨勢的觀察與思考。在演講中,姜大昕重點闡述了一個核心觀點:探索AGI路徑,“Scaling Law”和“多模態”是相輔相成、缺一不可的兩個方向。兩者齊頭並進,最終到達AGI。
Scaling Law仍處於陡峭區間,萬億參數是基本出發點
近年來,GPT系列模型的演進,客觀上驗證了Scaling Law的有效性。模型參數量決定模型能力的上限。從模型效果看,參數量增大確實帶來了性能上的飛躍。雖然業內圍繞“Scaling Law還能走多遠”尚未形成共識,但階躍星辰認爲,參數量接下來再提高一個數量級是依然成立的。Scaling Law 目前依然奏效,模型性能仍然在隨着參數量、數據量和計算量的增加呈冪次方增長。在此發展過程中,萬億參數量已經成爲一個基本的入門門檻。
正是基於這樣的認知,階躍星辰很早便啓動了萬億參數模型的訓練。從千億到萬億,模型的參數規模提升了一個量級,難度也提升了十倍以上。爲此,階躍星辰加大資源投入,尤其在系統和算法上積極探索,最終走通了萬億參數 MoE 大模型訓練的道路。在 WAIC 2024 上,階躍星辰發佈了全新的 Step-2 萬億參數語言大模型正式版。根據從邏輯推理、世界知識、數學和編程等多個維度進行的權威測試,Step-2 模型能力都已全面接近國際主流模型,在部分測試集甚至實現了超越。
多模態是構建世界模型的基礎能力,將走向理解與生成的統一
在不斷攀登Scaling Law的同時,階躍星辰也強調,多模態是構建世界模型的基礎能力,是通向AGI的必經之路。從算法角度看,世界模型的演進會分爲三個階段:
第一階段是模擬物理世界;
第二階段是通過具身智能和物理世界交互,主動探索物理世界;
第三階段是通過發展系統能力,發現新的物理規律,歸納物理世界。
從模擬世界,到探索世界,再到歸納世界,多模態是貫穿這三個階段的基本能力。目前,全球科技巨頭正在積極探索並佈局多模融合的路徑,多模態大模型研發的腳步正越走越快。然而,多模態領域目前存在的問題是,視覺的理解模型和生成模型是分開發展的。其造成的結果就是理解模型的理解能力強而生成能力弱,或者生成模型的生成能力強而理解能力弱。因此,多模態大模型接下來面臨的一項關鍵挑戰,就是能否將理解和生成統一在一個模型裡。
目前,階躍星辰正在朝着這個方向努力,並取得了一些階段性的進展。在 WAIC 2024上,新升級的Step-1.5V千億參數多模態大模型性能大幅提升,具備更出色的視頻理解能力;新發布的Step-1X圖像生成大模型,則是階躍星辰首次推出多模態生成大模型。
在演講的最後,姜大昕總結到,從千億參數到萬億參數,從文本到多模,從多模理解到多模生成,標誌着階躍星辰在短時間內連續攀登上大模型的多個臺階,打造了行業領先的通用大模型矩陣。未來,基於強大的模型能力,階躍星辰期待與衆多領域的行業頭部企業深度合作,共同探索積累大模型場景落地的經驗,併爲合作伙伴提供更多的價值。