應對智能體安全挑戰 螞蟻集團“蟻天鑑”升級

來源:上海證券報·中國證券網

上證報中國證券網訊(記者 宋薇萍)7月28日,2025世界人工智能大會(WAIC 2025)期間,在由中國信息通信研究院舉辦的“大模型智塑全球產業新秩序論壇”上,螞蟻集團大模型安全解決方案“蟻天鑑”宣佈升級,新增智能體(AI Agent)安全評測工具,具備Agent對齊、mcp安全掃描、智能體安全掃描及零信任防禦等四大核心功能。

隨着人工智能(AI)技術的不斷進步,AI領域正從大模型時代邁向智能體時代。智能體不僅具備對話生成能力,還擁有自主規劃、跨領域推理,甚至能做出超越人類理解的決策,AI已進入“行動”階段。

然而,智能體的越權、過度代理等問題也帶來了安全挑戰。數據顯示,超過70%的智能體從業者擔憂AI幻覺與錯誤決策、數據泄露等問題,因爲AI生成的內容往往包含事實錯誤,或者對指令產生誤解,其中超半數受訪者表示,所在企業尚未設立明確的智能體安全負責人。

螞蟻集團表示,“蟻天鑑”爲螞蟻集團聯合清華大學共同研發推出的大模型安全一體化解決方案,確保大模型技術在安全可靠的環境中發揮效能,打造AI大模型的安全鎧甲。升級的“蟻天鑑”在Agent運行階段,構建了一套智能安全掃描系統,通過一系列專用工具來檢測Agent可能面臨的安全風險,實現端到端掃描,確保工具與 Agent的交互鏈路不被篡改或繞過,爲複雜環境下的穩定運行提供可驗證的安全基線。目前,“蟻天鑑”的風險研判Agent準確率可以達到96%以上,並可支持11個行業的智能體測試。

螞蟻集團機器智能部總經理、安全實驗室首席科學家王維強表示:“升級的‘蟻天鑑’基於‘以攻促防’的安全理念,通過構建‘對齊-掃描-防禦’技術棧,形成全流程防護體系,從而爲智能體提供風險掃描與實時防禦能力,我們也將與行業共建,未來逐步開源開放安全工具。”

據瞭解,2024世界人工智能大會上,“蟻天鑑”2.0發佈,形成了包括大模型基礎設施測評、大模型X光測評、應用安全測評、AIGC濫用檢測、證件僞造檢測、圍欄防禦等在內的完整技術鏈條,面向行業提供全方位智能化的大模型安全測評和防禦解決方案。