金融智能體走向規模化應用 仍有四項“基本功”不足

21世紀經濟報道記者李覽青、吳霜 上海報道

一年一度的世界人工智能大會(WAIC)即將落下帷幕,今年,無論是逛展還是旁聽論壇,觀衆的感受都是:AI越來越務實了。

金融行業也不例外。在位於上海浦東的世博展覽館中,21世紀經濟報道記者走訪了交通銀行、農業銀行、上海銀行、螞蟻集團、中電金信等展商的展位發現,人工智能已經開始釋放數字勞動力、重構金融業務交互方式。

以近兩年最火熱的AI應用——智能體爲例,在2024WAIC期間,業內人士仍將金融智能體看作“校園優等生”,一年之後的現在,部分科技廠商在金融領域的智能體應用解決方案已超過100個。不僅如此,從落地場景來看,金融智能體也從對客輔助工具的“單點嘗試”走向授信決策等核心業務場景,逐步實現規模化應用。

在多位從業人士看來,原本就根植於應用場景、爲解決實際業務問題而生的金融智能體,將在大模型驅動下實現金融業務流程的重塑,整合軟件能力、專家經驗、決策路徑,從而提升業務效率、激活數據價值。

金融智能體應用拓寬拓深

“今年我參加WAIC最大的感觸是,與去年相比,無論是從深度還是廣度上,AI應用都產生了非常大的變化,如雨後春筍般涌現。”在展位上,中國電子首席科學家、中電金信研究院院長況文川向記者表示。

金融智能體的應用也在拓寬、拓深,這既體現在落地場景數量的增長方面,也體現在對業務效率的提升方面,甚至開始對服務模式產生變革。

“智能體的價值不在於解決1000個淺層問題,而在於攻克1個行業的深層痛點,智能體要圍繞場景出發,要深入企業的業務場景,將專業領域知識的價值最大化,這纔是產業落地的關鍵。”螞蟻數科CEO趙聞飆在論壇發言中表示,數字化程度最高、數據密度最大、AI應用場景最豐富的金融業應當是AI率先落地應用的絕佳行業。

安永亞太區金融科技與創新首席合夥人忻怡告訴記者,目前不同金融子行業的智能體應用探索方向有所差異,但都已從概念驗證走向規模化應用。如頭部銀行已實現“通用大模型+垂類模型+智能體”的技術架構落地;證券業頭部券商推出多款AI應用產品並投入實戰場景;保險業着力推進智能理賠體系建設。

記者在展區探展瞭解到,太保集團在保險業務核心環節全面推進數字勞動力建設,優化成本結構,目前已上線的典型數字勞動力包括健康險理賠審覈、審計數字員工、產險在線理賠助手、壽險金牌講師等等。在螞蟻集團的展區,也展示了財富、保險、投研、風控等核心金融場景生產環境的智能體demo。在財富管理方面,盈米基金上線了“個人基金理財助手”“持倉診斷”“基金深度分析”“基金對比” 等一系列金融智能體應用。

在應用深度上,金融智能體開始在重要核心場景上大展身手。

以授信決策場景爲例,奇富科技首席算法科學家費浩峻向記者透露,該公司搭建了授信決策智能體系統。他表示,“超級智能體”與傳統風控系統相比有三個優勢,從範圍上來看,智能體系統涉及整個信貸業務的全流程,而不僅僅是風控場景;從能力值來看,智能體系統是“類人”操作,根據模型判斷再進行編排決策,而傳統的風控系統僅需遵循固定的工作流程;從系統本身構成來看,傳統風控模式可以理解爲“軟件能力+大數據能力+小模型風險策略”的耦合系統,而智能體是以大模型爲驅動,基於學習過去無數專家經驗和決策路徑,融合上述三個部分,減少人爲決策,更懂金融業務與金融場景。

與此同時,金融業務的交互模式已經發生變革。

記者注意到,今年上海銀行在展位上首次發佈以“對話即服務”爲核心的AI手機銀行。打開手機銀行App,用戶無需在複雜的菜單欄中尋找功能,只要通過文字或語音在對話框中輸入需求,AI可以快速響應並完成業務辦理,覆蓋轉賬還款、理財諮詢、養老金管理等十餘項高頻交易。在現場演示中,有觀衆提出“有什麼理財產品可以投資一下”,AI通過分析用戶資產負債、現金流、風險偏好等信息,迅速從數百餘款理財產品中選取出了幾款。當進一步詢問產品的風險、週期等問題時,AI手機銀行也可以瞬時給出專業解讀,操作流暢度堪比與專業銀行顧問面對面交流。

上海銀行這一應用背後有螞蟻數科的身影。趙聞飆表示:“以‘對話即服務’取代傳統點選,更深層的意義在於,它重塑了服務本質,尤其在適老化領域,通過AI實現了服務的‘擬人化’,實現從‘人找服務’到‘服務找人’的突破性轉型。”

專業“基本功”問題猶存

儘管金融智能體已實現規模化落地應用,但要讓“專業的模型幹專業的事兒”,仍需要專業領域的“基本功”。

最首要的問題大模型幻覺猶存。費浩峻坦言,目前在一些場景下,智能體還是存在指令遵循不準確的問題,有時會產生幻覺,但如果人工通過技術手段干預幻覺問題,又有可能導致智能體的“智力”受到約束。況文川也表示,金融這一關鍵行業高度依賴於系統的自動化、精準化能力,大模型的幻覺問題、輸出穩定性問題、過程可解釋性問題,將成爲智能體等AI落地應用的最大挑戰。忻怡告訴記者,未來兩年內,金融垂類大模型的落地應用,首先要解決幻覺問題.

第二大問題在於碎片化的金融知識亟待整合。況文川告訴記者,專業模型的基礎是行業高質量數據集,他指出:“這是一項基礎性的工作,需要長期、耐心的投入,也需要很大的資金投入。”

記者瞭解到,專業大模型需要對行業知識進行系統化的學習,其關鍵在於一個科學、專業的任務數據體系作爲“課程大綱”,基於金融任務體系框架,還需要真實業務場景的數據,經過嚴格的質量評估、可信數據合成和CoT數據精標鏈路,才能形成可用於訓練專業模型的數據集。

第三大問題在於部分金融機構缺乏將業務需求、算力、模型、數據、知識庫、應用等一系列協同的工程化實踐能力。“現在市面上很多公司說是在做AI、做智能體,其實只是在原有算法基礎上做了重新再包裝,並不能基於AI的方法論做業務場景的重構。”某科技公司商業化團隊負責人告訴記者,這個問題主要出現在“基於場景切入的AI應用”上,他認爲,真正實現AI落地應用離不開全系統協同的工程化能力。

第四大問題在於衡量智能體落地應用的實效。費浩峻表示,在框架層面需要一個開放透明的評估體系,在智能體應用層面需要將衆多信息還原成可以評估的數據指標,才能實現智能體的準確度評估,這是一大難點。

這主要源於大模型的“成長飛輪”發展邏輯。所謂“成長飛輪”,簡而言之就是通過不斷使用、迭代訓練,使得模型自身“轉起來”,實現“越用越聰明”的應用能力增長。然而,如果在數據質量、安全底線等方面出現問題,可能會讓“飛輪”終止運轉。

因此,通過評測實時評估智能體迭代成長的能力水平,成爲關鍵。“在軟件工程時代,以質量評估爲代表的評測是最後一環的風險攔截,但AI時代的評測將成爲整個智能體迭代成長的起點。”前述科技公司商業化負責人表示。