崑崙萬維發佈天工超級智能體 “AI版office”8分鐘完成8小時工作

5月22日,崑崙萬維面向全球市場發佈了天工超級智能體(Skywork Super Agents)。據介紹,該產品採用AI agent架構和deep research技術,支持一站式生成文檔、PPT、表格(excel)、網頁、播客和音視頻等多模態內容。崑崙萬維方面稱,其deep research能力在GAIA基準測試中表現突出,在GAIA榜單上排名全球第一,超過了OpenAI Deep Research和Manus。

崑崙萬維宣佈,該產品即日起向海內外用戶開放註冊,無需邀請碼。

1. 5種模態,一鍵生成,用8分鐘完成8小時的工作

與Manus這樣的擁有廣泛功能但缺乏專業深度的AI智能體不同,天工超級智能體包含一個由「5個專家智能體」與「1個通用智能體」組成的系統,旨在提供專業化的內容生成服務:

5個專家智能體,分別負責專業文檔(doc)、PPT、表格(excel)、播客和網頁的生成。文檔、PPT、表格是常見的辦公應用。

崑崙萬維表示,文檔、PPT、表格三個智能體集成了deep research能力,可提供專業內容生成。網頁和播客智能體則面向新媒體內容模態。這些專家智能體針對辦公和學習場景設計,旨在提供高質量內容。

1個通用智能體,接入了數十個MCP(模型能力提供者),用於處理多模態創意任務,可生成圖片、音樂、視頻等多種媒體內容。

2. Deep Research技術賦能核心辦公應用

此次發佈的核心,是天工超級智能體的「文檔」、「PPT」和「表格」三大智能體。

在「文檔」智能體方面,針對行業研究、學術論文、商業計劃等專業寫作需求,天工集成了deep research能力。

天工方面表示,其自研的deep research模型通過深度思考和推理提升信息檢索的廣度、寬度與效率,並通過強化學習增強搜索泛化性,爲內容生成提供高質量信息源。據稱,該能力在性能上接近OpenAI Deep Research,同時成本只有openAI的40%。

天工的deep research agent框架在Meta和Huggingface聯合推出的GAIA的評測集上取得了82.42的高分,超越了OpenAI Deep Research和Manus,位居第一(2025年5月10日數據)。

在OpenAI的SimpleQA評測任務中,Skywork獲得94.5分,超過了此前該任務的SOTA(State-of-the-Art)水平。

相比OpenAI的Deep Research,天工「文檔」智能體生成的報告包含多種數據圖表,如條形圖、折線圖、餅狀圖等,以增強內容的可視化呈現。

天工的「PPT」智能體同樣集成了deep research技術,旨在通過深度搜索和研究,爲用戶生成演示文稿內容。據介紹,生成的演示文稿內容支持事實與數據溯源,幷包含動態效果。PPT功能支持在線編輯及導出爲pptx、pdf格式。

天工的「表格」智能體也支持deep research技術。該智能體可基於用戶上傳的數據表進行描述性或推論性統計,並生成統計圖表,同時支持生成模板型及彙總型表格。生成的表格支持在線瀏覽和導出爲xls格式。

崑崙萬維方面表示,其deep research agent框架已在GitHub上開源,供開發者下載。同時,天工的文檔、PPT、表格生成能力也已封裝成MCP(模型能力提供者),供開發者調用。

3.拓展至網頁、播客及音視頻等多媒體內容生成

除辦公應用外,天工超級智能體還支持多模態內容生產,其生成能力已延伸至網頁、播客與音視頻領域,旨在提供一站式內容創作支持。

天工的「網頁」智能體支持依據用戶需求生成網頁,可用於創建電商頁面、個人博客、信息展示及功能型網站等。據稱,該功能旨在降低網頁創建的技術門檻。

天工的「播客」智能體可根據用戶輸入的需求生成腳本,並基於腳本通過語音合成技術製作音頻。目前該功能支持生成英文播客,計劃後續支持中文及其他語言。

由於目前尚不支持中文內容生成,國內版本(tiangong.cn)暫未上線「播客」智能體。

此外,天工的「通用」智能體集成了數十個MCP,覆蓋圖像、視頻、音樂、語音生成等能力。據介紹,該智能體可將文字轉化爲視頻,並支持自動匹配背景音樂與特效,適用於生成宣傳視頻、教學課件、創意短片、有聲書、繪本等多種內容。(易科)