崑崙萬維舉辦AI技術發佈周 展示多模態AI領域突破性成果

8月11日至8月15日,崑崙萬維(300418)舉辦覆蓋五大技術領域的SkyWork AI技術發佈周,每天發佈一款模型,包括視頻生成模型Skyreels-A3、世界模型Matrix-Game-2.0和Matrix-3D、生圖一體化模型Skywork UniPic2.0、智能體(Skywork Deep Eesearch Agent)模型等,全面展示崑崙萬維在多模態AI領域的突破性成果。

本次技術發佈周的舉辦,標誌着崑崙萬維AI技術全面迭代,AI產品邁入商業化應用階段。崑崙萬維正憑藉其技術儲備與商業前瞻性,加速邁入應用落地與商業化加速的高速增長階段。

Skywork Deep Research Agent v2 正式發佈

8月14日,崑崙萬維正式發佈Skywork Deep Research Agent v2,它是天工超級智能體(Skywork Super Agents)的核心引擎。

Skywork Deep Research Agent自5月22日上線後,大幅重塑了大模型在AI Office領域的角色,通過skywork.ai平臺爲用戶產出了大量信息密度極高的優質文檔、PPT、表格以及其他交付物。

圖丨崑崙萬維Skywork Deep Research Agent v2宣傳圖

據瞭解,當前業界的Deep Research Agent產品都是採用搜索並抓取網頁文字信息的方式實現,依賴於純文本檢索分析,而互聯網上超過一半的關鍵信息來自圖文混排:財報中的曲線、論文裡的實驗圖、社媒上的對比照、方案裡的流程圖……這些多模態信息一旦被忽略,代表着Agent將會丟失大量決策依據,將直接影響Agent產出的交付物質量。

“爲解決這一痛點,公司的Skywork團隊推出了業界首個‘多模態深度調研’Agent,首次將多模態檢索理解和跨模態生成能力完整整合到深度研究工作裡。”崑崙萬維方面介紹,爲實現多模態信息檢索這一能力的提升,崑崙萬維Skywork團隊在四個方面完成技術突破:多模態爬取技術MM-Crawler、長距離多模態信息收集、異步並行 Multi-Agent多模態理解架構和多模態結果呈現能力。

通過以上技術創新,多模態Skywork Deep Research Agent v2把“讀文字+看圖片”這件看似簡單卻長期被忽視的事情真正做到位,讓研究人員等用戶一次拿到信息完整、節奏順暢、視覺友好的深度報告。

需要指出的是,爲了進一步加強Agent基礎模型的複雜任務執行和信息檢索、整理、總結能力,Skywork Deep Research Agent v2引入了多種提升機制,包括高質量數據合成及訓練、端到端強化學習、高效的並行推理,以及多智能體自我學習演進系統。新版本的Skywork Deep Research在多項Agent任務評測上超越現有模型,達到行業SOTA水平。

在權威的搜索評測榜單BrowseComp上,Skywork Deep Research的表現尤爲突出。常規模式下,其性能已超越大多數同類產品,正確率達到27.8%。而一旦開啓自主研發的“並行思考”(Parallel Thinking)模式,正確率更是躍升至38.7%,刷新了行業SOTA紀錄。

圖丨崑崙萬維Skywork Deep Research Agent v2宣傳圖

據崑崙萬維介紹,爲了進一步解鎖Agent的能力邊界,Skywork下一代多智能體系統將深度挖掘不同Agent模型的差異化優勢,並將其模型能力與工具能力有機融合,構建協同多智能體框架。該系統不僅能夠將多個Agent組織成高效協作團隊,還可在線實時利用Agent的代碼能力動態創建和管理MCP工具,從而顯著提升任務處理能力與環境適應性。

一週連續發佈多款模型

在此之前,崑崙萬維8月11日正式發佈SkyReels-A3模型,基於“DiT(Diffusion Transformer)視頻擴散模型+插幀模型進行視頻延展+基於強化學習的動作優化+運鏡可控”,其能實現任意時長的全模態音頻驅動數字人創作。SkyReels-A3正在把“讓影像隨聲而動”這件事變成人人可上手操作的工具:不需要專業影棚、不需要昂貴設備,只要一段聲音和一張照片,人人都能創造無限時長、無限可能的數字內容。

圖丨崑崙萬維SkyReels-A3宣傳視頻截圖

緊接着,崑崙萬維又在8月12日帶來了自研世界模型Matrix系列中Matrix-Game交互世界模型的升級版本——「Matrix-Game 2.0」,同樣實現了通用場景下的交互式實時長序列生成的世界模型。據瞭解,爲促進交互式世界模型領域的發展,「Matrix-Game 2.0」全面開源,這也是業內首個在通用場景上實現實時長序列交互式生成的世界模型開源方案。

除了持續推進當前的視頻生成等核心技術,崑崙萬維也在積極佈局AI發展的下一階段。即通過空間智能實現對三維世界的深度理解與生成。現有方法依賴多視圖輸入和局部視角渲染,難以從單張圖像生成結構完整、可探索的3D世界。8月12日,崑崙萬維還推出Matrix-3D——一個融合全景視頻生成與三維重建的統一框架。它從單圖像出發,生成高質量、軌跡一致的全景視頻,並直接還原可漫遊的三維空間,對標李飛飛World Labs的生成效果,可實現更大範圍的探索空間。

圖丨崑崙萬維Matrix-Game-2.0宣傳圖

“當前,「Skywork UniPic 2.0」及其系列模型已全面開源,涵蓋模型權重、推理代碼、強化策略等,助力開發者與研究者快速上手並構建多模態應用。”8月13日,崑崙萬維正式開源「Skywork UniPic 2.0」模型——面向統一多模態建模的高效訓練和推理框架,圍繞生成和編輯模塊輕量化、連接多模態理解模型進行聯合訓練,構建了理解、生圖、編輯一體化的核心能力,旨在實現“高效、高質、統一”的多模態生成模型。

圖丨崑崙萬維Skywork UniPic 2.0宣傳圖

崑崙萬維在統一模型領域持續深耕,在開源Skywork UniPic 1之後,從頭訓練自迴歸範式的統一模型。開源「Skywork UniPic 2.0」,將DIT和自迴歸範式結合在一起。

據介紹,升級後的「Skywork UniPic 2.0」具備三大核心優勢。首先,生成模塊輕量高效,性能拉滿。生成模塊基於2B參數的SD3.5-Medium架構訓練,生圖和編輯指標超越生成模塊具有7B參數的bagel,4B參數的OmniGen2,12B參數的UniWorld-V1和Flux-kontext模型。其次,引入強化學習,效果顯著。基於Flow-GRPO首創漸進式雙任務強化策略,有效提升模型對複雜指令的理解能力與圖像生成和編輯的一致性,兩大任務協同優化、互不干擾。最後,可以一體化靈活切換,拓展能力更強。將生圖編輯的Kontext模型與多模態模型端到端整合,微調輕量連接器,即可快速構建統一理解—生成—編輯模型,並且生圖和編輯的性能進一步提升。

整體AI技術實力穩居行業第一梯隊

崑崙萬維作爲中國領先的人工智能科技公司,近年來在AI大模型、AI搜索、AI短劇、AI音樂、AI遊戲、AI社交等多個領域取得了顯著進展,構建了全面的AI業務佈局。在AI大模型方面,公司通過自研技術持續迭代“天工”系列大模型,在複雜任務處理、多模態等方面實現多項突破,整體AI技術實力穩居行業第一梯隊。

值得一提的是,崑崙萬維作爲人工智能領域的創新引領者,其在過去數月內持續多次迭代大模型版本,以視頻生成模型SkyReels爲例,2025年2月發佈了中國首個面向AI短劇創作的SkyReels-V1版,2025年4月發佈了全球首個使用擴散強迫框架的無限時長電影生成模型SkyReels-V2版,本次又發佈了音頻驅動(audio-driven)人像視頻生成模型SkyReels-A3版,不斷突破AI技術邊界。

在多模態領域,崑崙萬維不僅推出了將文本推理能力遷移至視覺的多模態推理模型「Skywork-R1V」系列,以38B的輕量級規模性能媲美閉源的大參數模型。同時崑崙萬維也前瞻性地佈局了空間智能領域,推出了交互世界模型「Matrix-Game 2.0」與3D世界生成模型「Matrix-3D」。

針對數學代碼等專業領域,也推出了文本推理模型「Skywork-OR1」,在同等參數規模下實現了業界領先的推理性能,軟件工程自主代碼智能體基座模型「Skywork-SWE」也是在開源的32B模型規模下實現了業界最強的倉庫級代碼修復能力。

AGI與AIGC業務商業化取得重要進展

2024年,崑崙萬維實現營業總收入56.6億元,同比增長15.2%,整體毛利率達73.6%,繼續保持在較高水平。公司進一步開拓海外市場,收入繼續保持積極增長態勢。其中,海外信息分發與元宇宙平臺Opera繼續保持高速增長,2024年實現營業收入4.8億美元,同比增長21.1%;海外社交網絡和短劇平臺業務實現營業收入12.5億元,同比增長28.5%,綜合推動公司海外業務收入規模至51.5億元,同比增長21.9%,佔總收入比重達91.0%,爲多元化AI產品矩陣的拓展奠定了堅實基礎。

據崑崙萬維2024年年報介紹,公司繼續堅定踐行“All in AGI與AIGC”發展戰略,持續加大研發投入,全年公司研發費用爲15.4億元,同比增長59.5%。公司AGI與AIGC業務商業化取得重要進展。AI社交報告期內單月最高收入突破100萬美元,成爲海外收入增長速度最快的中國AI應用之一。

2025年第一季度,崑崙萬維以創新爲引擎,在全球人工智能領域實現多項里程碑式突破,持續鞏固行業領先地位。公司在多模態推理、視頻生成、音頻生成等關鍵方向,推出多項顛覆性技術與開源成果,爲數字內容生產、智能決策及產業生態升級注入全新動能,彰顯中國AI企業的技術自信與全球視野。

2025年第一季度,公司實現營業收入17.6億元,同比增長46.1%,AI音樂年化流水收入ARR達到約1200萬美金(月流水收入約100萬美元);短劇平臺Dramawave 年化流水收入ARR達到約1.2億美金(月流水收入約1000萬美元),爲收入增長注入強勁動力。公司全球化戰略成效顯著,實現海外業務收入16.7億元,同比增長56.1%,海外業務收入佔比提升至94.4%,國際化佈局進一步深化。

崑崙萬維Skywork AI技術發佈周每一項技術創新,都與當前產業肌理充分融合。這不僅是一次前沿技術的集中秀場,更是崑崙萬維從前期研發重投入轉向技術商業化的標誌。從單點領先到生態賦能,崑崙萬維的商業化效率與全球化佈局能力都在今年取得重大突破,這意味着崑崙萬維正在跑通規模化盈利路徑。

責編:彭勃

校對:趙燕