商湯2024年報技術透視:訓推效能顯著提升,“大裝置-大模型-應用”實現商業價值閉環
3月26日,商湯發佈2024年全年業績財報。2024年,商湯集團的總體收入同比增長10.8%,達到37.7億元人民幣;其中,生成式AI收入突破24.0億元人民幣,同比增長103.1%,這是生成式AI連續兩年保持三位數增速,已成爲集團最大業務。
大模型面世兩年多時間以來,從前期的一味追求大模型Scaling Law,到如今算力效率、訓練轉推理,應用落地等被接連質疑,大模型已經全面來到新的發展階段。
這是產業逐步成熟的標誌,但同樣也在堆疊算力之外,對工程技術以及場景協同能力提出了更高的要求。
在衆多傳統大模型廠商之外,作爲第一代“AI原生”企業,商湯在AI基礎設施上的投入早於幾年前便開始佈局,此後戰略升級爲“大裝置-大模型-應用”的三位一體核心戰略,而這一戰略正顯現出其在AI產業的前瞻性。
“大裝置”是指商湯的AI基礎設施,爲大模型提供強大的算力支撐,大模型驅動技術創新,應用端推動AI商業化落地——過去三年,商湯已經形成了“大裝置-大模型-應用”三者協同的良性生態閉環,賦能千行百業。
我們看到的是,歷經過多次技術週期起伏,商湯的技術積澱正迎來爆發。
01 有算力、懂算力
2024年5月,國內權威大模型測評機構SuperCLUE榜單出爐。商湯“日日新5.0”(SenseChat V5)的中文基準測評結果排名第一,以總分80.03分的成績刷新國內最好成績,並且在中文綜合成績上超越GPT-4 Turbo,這是國內大模型首次在SuperCLUE中文基準測試中超越GPT-4 Turbo實現登頂。
之所以能夠斬獲如此成績,與商湯在AI基礎設施上的提早佈局至關重要。
衆所周知,2024年以來,全國智算中心的建設高速推進。從訓練到推理,算力的資源屬性愈發顯現,而且市場仍面臨算力資源分散且標準不統一、使用起來效率不高的問題。
商湯正是針對這一痛點,佈局算力運營,將不同標準的卡連接起來,適配不同需求,滿足不同類型的客戶。
商湯科技董事長兼CEO徐立認爲,一些科技巨頭的重心在於自己的生態,包括自研芯片和雲平臺等,但當下AI領域要搶佔先機,什麼資源更快更好用就先用起來,不侷限於一家的產品和平臺,“商湯提供的基礎服務更貼近AI發展現狀。”
過去三年,商湯持續投入建設AIDC基礎設施。據悉,商湯自持的全國首個5A級智算中心——上海臨港AIDC,通過運營模式將算力規模提升至了23,000PetaFlops。
通過與大模型迭代的聯合調優,商湯大裝置的目標是成爲“最懂大模型的AI基礎設施”,不僅服務於日日新大模型的訓練與推理,還服務於包括互聯網、金融、能源等成熟行業,還拓展性服務了具身智能、AIGC、AI4S(AI For Science)等高潛行業的客戶。
徐立曾表示,商湯是最懂模型的算力服務商,最懂算力的模型服務商。
02 三位一體
算力只是生態其中一環。大模型產業能夠高效運轉,還需要靠上下游協同發力。
“今天人工智能的商業模式不管是訓練模型,還是用模型對外服務,本質意義上都是在消耗資源,付的是資源的費用。所有的商業模式最後都和計算資源消耗劃了一個等號,就是通過‘三位一體’,把資源以最有效的方式整合使用起來。”徐立表示。
“三位一體”是2024年10月商湯確立的戰略方向,是商湯以大裝置作爲AI基礎設施爲底座,實現“大裝置-大模型-應用”三位一體、聯合優化的戰略。
算力與模型的雙向優化,進一步提升了大模型的訓練和推理效率。在提升訓練效率方面,商湯通過採用自動化多維並行策略顯著提升了訓練效率,並且實現了FP8混合精度訓練,特別是對類似於DeepSeek的優秀第三方開源模型,大裝置做到高於官方報告的訓練效率,形成行業標杆。
在提升推理效率方面,商湯的推理系統進行低比特量化推理,支持開源vLLM及自研lightLLM雙推理引擎,以DeepSeek R1爲例,商湯的推理吞吐性能比業界頭部廠商高15%以上。通過模型蒸餾技術、鍵值緩存、PD(Prefill-decode)分離、多模態信息壓縮等技術,商湯在基本保持模型性能的前提下將推理成本壓低了一個數量級。
因此,即使是同樣一個模型,在不同的算力底座上,會有完全不同的訓練及推理效率。
隨着向生成式AI演進的穩步推進,“三位一體”進一步整合了商湯的資源優勢,使其在大模型時代的內卷競爭中打出差異化。
商湯科技日日新大模型重點打磨生產力工具與交互工具兩個方向的應用與產品。生產力工具直接爲企業辦公、金融、政務等場景提高生產效率,以訂單金額爲代表的客戶付費意願較2023年增長6倍;交互工具通過2B2C的方式賦能業務夥伴,提升用戶體驗,滿足智能陪伴、智能硬件交互、智能營銷等多場景需求,月均用戶使用量較2023年增長8倍。
日日新大模型在保持領先的市場應用佔有率和客戶服務粘性的基礎上,在模型技術上始終保持領先的位置。2023年4月商湯首次推出商湯日日新SenseNova大模型體系,至2024年7月完成5大版本迭代。其中,2024年7月發佈的日日新5.5版本在多模態能力上顯著提升,爲國內首個對標GPT-4o的多模態實時交互大模型,實現語音、視頻和語言模型的原生融合。值得期待的是,商湯日日新6.0將於2025年4月10日發佈,性能預期對標Gemini 2.0 Pro。
此外,基礎設施搭建好後,商湯同樣及早佈局應用。
03 爲什麼是原生融合多模態
生成式AI爆發後,多模態大模型早已成爲人們追求的方向。然而,市面上很多應用中接觸到的多模態模型並不能說是“完全體”。
就像谷歌所認爲的,只有從頭開始的多模態才能構建出超越前代的先進模型。這意味着它天生地可以讀取和輸出不同模態內容,還具備強大的多模態推理能力和跨模態遷移能力。
技術上,這被稱爲“原生融合多模態技術”,被認爲是AI未來發展的必由之路,也是商湯當下重點投入的研究領域。
與傳統的多模態模型不同,商湯的技術並非簡單地將不同模態內容轉換爲語言token輸入,而是從數據層、模型架構層進行全流程融合,涵蓋感知、思考到輸出的完整過程。
在2024年全球CVPR大會上,商湯科技共有50篇論文入選,研究成果聚焦於視覺語言基礎模型,涉及自動駕駛、機器人等前沿領域。
商湯的多元化AI產品均已有所應用成效。據悉,目前商湯“小浣熊家族”已爲數十萬用戶提供數十億次智能輔助服務。而商湯絕影在行業內也率先實現了原生多模態大模型的車端部署。
在AI的新階段,商湯前瞻性地佈局了硬件基礎設施和應用端,通過底層和上層的協同優化構建起了技術壁壘。
在基礎設施端,商湯自建AI數據中心(AIDC)和規模化研發服務,確保公司在傳統基礎設施廠商和AI原生公司中脫穎而出。在應用端,商湯擁有全棧體系AI應用,覆蓋行業廣泛,大模型聚焦於原生融合多模態發展。
可以預見,商湯的“儲備”有望在AI應用爆發後爲公司帶來巨大發展空間。