深度丨金融大模型“擠水分”

21世紀經濟報道記者李覽青、楊夢雪、林秋彤 上海、北京報道

在大模型推動下,金融領域究竟誕生了多少場景應用?

多家上市銀行在2024年年報中給出的數據是,行內應用場景已超過100個。

以大模型爲代表的人工智能技術,無疑是當下金融數字化投入最爲集中的熱點。然而,成百甚至上千個應用場景中,大模型真正爲機構、爲員工帶來了多大的作用,多大程度上提升了業務效率?近日,21世紀經濟報道記者調研包括銀行、信託、資管機構的科技部門高層與一線員工發現,雖然佈局、應用大模型是不得不做的事,但金融機構也開始爲大模型應用“擠水分”。

一方面,海內外基礎模型不斷演進,創新迭代的速度驚人,金融機構需要尋找“確定性”,讓有限的資源最高效地投入到場景中,避免陷入“爲了AI而AI”的技術陷阱;另一方面,當人工智能重塑業務流程,金融從業人員直面AI衝擊,需要形成一套新機制,不僅實現應用落地,也要確保責任落地。

如今看來,一場技術與業務價值的深度校準正在展開。

長期以來金融機構的科技投入規模巨大,特別是近年來“AI+”已成爲重要戰略。四大國有銀行近年來的科技投入金額始終在200億元以上,就2024年來看,21世紀經濟報道記者不完全統計數據顯示,上市銀行業科技投入總金額超過1800億元。

戰略性投入意味着大量的資金和時間投入,從獲取長期、穩定的回報出發,而不是瞄準短期、快速的利潤。然而,作爲商業化運營主體,金融機構必須評估投入與產出的效能,因此,面對變化中的大模型應用,不同機構有不同考量。

大型金融機構的選擇是大規模投入。建設銀行原首席信息官金磐石在業績發佈會上透露,截至2024年底,該行先後適配了16個版本的通用大模型,進而形成了16個版本的金融大模型。“這種策略保證了隨着金融大模型能力的快速迭代,我們業務場景的應用效果能夠達到‘水漲船高’的效果。”

“不得不承認,佈局大模型已經是一個必須完成的任務。‘用不用’暫且不論,前提首先是你得有這些大模型。”一家位於華東地區的股份行金融科技部中層坦言,特別是當其他機構都接入了某一家大模型,如果不及時跟上可能意味着“缺位”。

金融機構爲了迎接大模型時代的到來要花多少錢?最大的投入在算力建設。

某股份行信息科技部副總告訴記者,這裡的投入包括底層基礎設施建設和AI人才引進兩大方面。在大模型應用前,該行使用的服務器是“通算平臺”,與大模型相關的平臺是“智算平臺”,智算平臺既包括大語言模型訓練,也包括推動大模型在金融領域應用的推理平臺。“每臺GPU需要8個芯片,單臺價格接近200萬元,如果要做一個集羣至少需要佈局五六百臺。”按此計算,該行僅智算平臺的算力投入就至少數億元。

也有機構根據自身的實際業務情況選擇了不同的部署路徑。

“現在整個大模型市場是很開放的,不僅是DeepSeek,包括通義千問、騰訊混元等等,個人和機構都有機會自主選擇部署、訪問,關鍵在於你能投入多少硬件資源,或者購買多少雲服務的調用數量。”華能貴誠信託副總經理趙明華向記者表示,算力成本依然是金融大模型訓練的核心問題。

趙明華坦言,作爲一家非銀金融機構,公司能投入AI的資源是相對有限的,如果要建立起多個業務系統的全面部署,預估需要千萬量級的投入。他指出,其中最核心的投入是硬件投入,從目前DeepSeek-R1模型的性能來看,如果要跑起671b的“滿血版”,加上支持500人的併發訪問量,需要投入1000多萬的預算。

“就智能客服這個場景來看,此前ChatGPT展現出的能力讓客服的智能化成爲可能,但在我們公司直銷規模不大,直接面向客戶場景不夠充分的情況下,花費數百萬部署智能系統實現的效果或許還不如人工服務。”趙明華表示。

“技術本身並不是目的,我們需要避免陷入到‘爲AI而AI’的技術陷阱。這一方面要求商業銀行間要從技術驅動向價值驅動轉變,形成技術、場景、價值的閉環,另一方面要從碎片的應用轉向流程的應用,推動人工智能和業務邏輯的深度融合。”近日,在國民財富發展研究合作平臺“人工智能與金融未來”2025春季峰會上,浦發銀行副行長丁蔚表示。

價值驅動意味着,金融機構也開始衡量,在如此高昂的技術投入後,大模型能帶來多少業務價值?

記者諮詢了多家金融機構的大模型項目立項評審標準,總結出兩個方面。

第一是,行業內是否有成熟場景應用的案例,這對應了場景應用的確定性。“比如智能營銷、客戶服務、信貸審批、反洗錢報告、智能投研、合規內審這些其他銀行都已經有成熟應用的工具,一般是可以過審的。”前述華東股份行金科人士表示。

第二是,該項應用落地後,在時間縮短、流程簡化、客戶體驗等方面的量化數據評估,這對應了場景應用的價值。一位大行信審部的IT人士告訴記者,立項評審團隊不僅包括科技部門領導,還涉及業務部門、內控部門、財會部門等,來綜合評估科技投入與效率提升的價值是否匹配。

值得關注的是,DeepSeek和智能體的快速發展,都加快了大模型在金融領域落地應用的進程,也帶來了模型應用的價值重估。

趙明華告訴記者:“今年在DeepSeek出來以後,我們發現智能客服可以基於開源框架很快地搭建起來,而且很多廠商提供了客服場景智能體,只需要我們灌輸基礎知識庫,就能實現落地,所以如今對這個場景應用價值的評估就不一樣。”

某頭部保險資管數字化轉型部門負責人告訴記者,經歷兩年多的探索,他所在機構已經搭建起較成熟的AI應用框架,在大模型底座不斷變化的情況下,不可避免地出現了重複建設的情況。“去年一年,我們爲了讓生成式大模型在投研場景下實現更好的效果,做了大量訓練優化的工作,但今年DeepSeek發佈R1模型後,我們發現過去很多針對推理能力的調優問題已經被解決掉了。”

“但這並不意味着我們去年做的投入是沒有價值的。”他指出,模型變化和算力平權是一家機構難以改變的未來趨勢,在數字化建設中沉澱下的平臺服務和數據積累,將成爲戰略性投入實現價值最核心的能力。

信託網研究院研究員郭彥菊向記者展示了一組測算數據,DeepSeek通過架構創新與系統優化,將大模型訓練成本降至行業平均水平的1/5以下,推理成本降幅超90%,爲金融機構部署私有化AI提供經濟可行性。她預計2025年AI將驅動信託行業運營成本降低20%-30%,同時釋放超500億元增量市場空間。

金融大模型應用的理想很豐滿,但在實際落地時,有受訪對象坦言,當下金融業的大模型應用還是有點“虛”。

前述華東股份行人士表示,在過去很長時間銀行使用的RPA、OCR等技術都是AI,但此前還是屬於“點對點”在某一具體場景下的應用,是基於業務需求提出的,而大模型時代的人工智能成爲了“大腦”型的端到端應用。“有了這個大腦,什麼場景好像都能用,但在很多專業化場景下,其性價比不如小模型或智能體。”

在部分機構內部,科技部門提供的某些智能化工具沒有真正切合業務痛點或存在幻覺問題,導致使用率不高,甚至增加了一線人員重新檢驗、修改的工作量。

華北某國有行個貸經理表示,他所在銀行提供了智能信貸報告生成工具,也會結合客戶個人信息給到智能審批的建議放款額度參考,但往往這一額度低於客戶實際需求,仍需客戶經理進行手工測算、驗證。

但在另一家理工科背景的國有大行信審部人士看來,該行所提供的智能化授信審批系統對自己簡化工作流程帶來了較大便利。

她告訴記者,授信審批工作全鏈條涉及信貸申報、貸前項目評估、合規審查、審批決策等多個業務模塊,其中“填表”的工作量非常大。她所在機構提供的智能化系統在財報分析、報告生成、合規審查等方面提供幫助,基於標準化模板提取信息形成初始報告,減輕了她工作中的部分流程化工作。

“我認爲AI輔助工具主要是把大家拉齊到一個‘相對能用’的水平。”她表示,自己是軟件工程專業出身,對財務數據提取和審查的學習門檻是相對高的,在AI工具的輔助下能夠快速提取到有用信息,所以對自己的幫助比較大,但也有財會專業的員工反饋,這一工具的專業化水平不足以賦能自身業務。

“現在每個人都有一臺電腦,未來每個人也會有N個智能助理,但每個人精通電腦的程度是不同的。”前述華東股份行人士談道,電腦可以用來寫代碼、打遊戲、做表格、寫文章,甚至有網友用Excel軟件畫畫,工具的能發揮的作用上限始終取決於使用方。

這意味着AI戰略不僅需要提供工具,還需要培養業務人員的大模型應用能力。

前述保險資管數字化轉型部門人士告訴記者,爲了讓全集團員工用好大模型,他所在機構在去年一年辦了超過20場AI培訓,來“刷新員工對AI的認知”。“我們不僅面向全員做了科普性的AI工具教程,還對個別部門針對他所在的業務場景,灌輸AI工具應用的價值。”他提到,針對投研、風險管理等重點部門,還由科技部門與業務部門共同探索創新工具試點。

前述已經體驗到智能審批系統價值的大行人士也表示,她所在銀行在多地建立了軟件開發中心,來配合業務部門提出的科技開發需求,該行很多AI應用都是由業務部門主動提報申請,再由科技人員駐場開發,共同推動應用落地。

“金融行業的智能化進程是一個龐大的體系,急於求成是不現實的,如果一家企業的數字化沒有做好,智能化根本是空中樓閣。”前述保險資管人士表示,至少需要未來5年內的數字化積累,不斷夯實數據基礎、重塑全員AI認知,才能實現智能應用的規模化落地。