存算分離+AI驅動,金融業數據庫升維

21世紀經濟報道記者 董靜怡 上海報道

在金融行業數字化轉型的浪潮中,數據庫架構的革新正成爲決定業務效能的關鍵因素。

傳統存算一體架構的侷限性日益凸顯——資源利用率低下、故障恢復緩慢、運維複雜度飆升,已成爲金融機構應對高併發、實時數據分析的瓶頸。

中國銀保監會發布的《關於銀行業保險業數字化轉型的指導意見》中明確提出,要推進傳統架構向分佈式架構轉型。“存算分離”憑藉其資源解耦、彈性擴展和高可用性,正迅速成爲金融行業的首選方案。

“數據庫廠商都紛紛走向了存算分離,無一例外。”日前,華爲閃存存儲領域總裁謝黎明向21世紀經濟報道記者表示,“許多金融客戶已經總結了在數據庫改造和存算分離方面的最佳實踐,存算分離不再僅僅是理論,而是已經落地實踐並取得了成果。”

與此同時,AI技術的深度融合正在進一步推動數據庫架構的智能化演進,從AI賦能數據庫運維到數據庫支撐AI應用,金融數據庫的未來正朝着更高效、更智能的方向發展。

這場架構升級的背後,也是金融業對數字化未來的前瞻佈局。

存算分離成必然選擇

金融行業對數據庫的要求極爲嚴苛,高可用性、高性能和低成本運維是核心訴求。然而,傳統的存算一體架構在實踐中暴露出了諸多問題,成爲金融機構數字化轉型的絆腳石。謝黎明向記者指出,存算一體架構在資源利用率、可用性和運維複雜度方面存在顯著短板。

首先,資源利用率低下是存算一體架構的致命傷。“在分佈式切片模式下,很多客戶的CPU和磁盤利用率可能不到5%。”謝黎明提到。

其次則是可用性。金融業務對系統可用性的要求極高,任何宕機或數據丟失都可能造成嚴重後果。存算一體架構由於依賴服務器本地硬盤,其故障率較高。

“本地硬盤的年故障率可能達到1%。”謝黎明向記者表示,一旦發生故障,數據庫需要進行切換和數據重建,不僅耗時,還可能影響業務連續性。

運維複雜度是金融行業在數據庫改造過程中面臨的另一大挑戰。存算一體架構下,隨着集羣規模擴大,磁盤亞健康狀態(如慢盤、超時)頻發,運維團隊需要頻繁介入處理。“這時候本地盤帶來的是運營非常複雜,定位非常困難,而且恢復起來非常繁瑣。”謝黎明表示。

相比之下,存算分離架構通過將計算和存儲資源解耦,實現了更靈活的擴展能力和更高的系統穩定性,成爲金融行業技術演進的必然趨勢。

“存和算解開,它彼此之間不會綁定,它的資源擴展變得非常靈活,這是存算分離的最大好處。”謝黎明向記者表示。

江南農村商業銀行數據庫總監王浩特別強調了存算分離架構的可靠性和靈活性。可靠性方面,在存儲計算分離架構下,通過共享存儲的高可用性,可有效隔離硬盤故障對數據庫的影響,使數據庫運行保持穩定狀態。

靈活性方面,存儲計算分離架構將計算節點從物理機改造爲虛擬機並大規模應用。以往物理機出現硬件故障時,即使有備件,更換也至少需半小時。而在存儲計算分離架構下,計算節點改爲虛擬機後,出現故障可快速拉起,尤其在工作時間內,能極大保障業務連續性。

靈活性延伸出經濟性。王浩補充道,中小金融機構尤其受限於成本壓力,而存算分離架構通過虛擬化技術顯著降低了服務器成本。

“我們通過將物理機改造成虛擬機,在存算分離架構下實現了服務器成本的大幅降低。如果採用傳統物理機加本地盤的方式,無論是採購成本還是機房建設投入,對中小銀行都是難以承受的。”王浩向記者表示。

AI帶來新可能

如果說存算分離是當下數據庫架構的主流趨勢,那麼AI的融入則代表了未來的方向。當前,AI與數據庫的關係被拆解爲兩個維度:AI賦能數據庫(AI for Database)和數據庫賦能AI(Database for AI)。前者聚焦於通過人工智能提升數據庫的效率,後者則關注如何優化數據庫以更好地服務AI應用。

在AI for Database領域,智能運維成爲關鍵詞。傳統數據庫管理高度依賴數據庫管理員(DBA)的人工操作,從參數調優、索引維護到備份恢復,每一項任務都需要專業人員的精細把控。然而,隨着數據量的爆炸式增長和業務複雜度的提升,人工管理的侷限性日益凸顯。AI技術的引入,爲數據庫的自動化管理提供了新的思路。

過去,AI賦能的方式多集中在小模型,但小模型主要基於規則進行運維和兼容性處理,泛化能力較差。入局大型模型的出現,尤其是其進入Agent(智能體)模型階段,AI已經發展爲具備強大推理能力的模型。

“過去看似複雜的任務,如今藉助AI可以輕鬆完成。”謝黎明向記者舉例稱,“例如,在海量的日誌更新方面,我們過去很難進行聯合認證分析,到底性能問題出在哪一段,怎麼找到時空關聯性,現在藉助大模型可以做到這件事。”

深圳計算科學研究院首席架構師沈剛認爲,未來的數據庫應該像智能汽車一樣,具備自我學習和動態調整的能力。例如,數據庫在初始部署時可以根據系統環境自動配置最優參數,並在運行過程中持續收集數據,通過機器學習不斷優化性能。

而“Database for AI”則代表了另一種變革——數據庫技術需要適應AI時代的數據消費模式。謝黎明指出,AI時代的數據交互方式正在從SQL向自然語言轉變。“未來用戶不再需要編寫複雜查詢語句,直接用人類自然語言交互,數據的形式會發生變化。”

此外,隨着Agent技術的普及,機器與機器之間的數據交互將變得更加頻繁和複雜。“數據庫必須能夠支撐這種新型的‘機器消費模式’”,謝黎明向記者表示,未來的數據庫可能需要支持圖譜等多種新的模式,更好地適應AI的發展需求。

然而,這場變革也伴隨着挑戰。業內普遍認爲,自動化雖然提升了效率,但也可能引入新的風險,如何確保AI決策的透明性和可控性成爲關鍵。此外,傳統數據庫並非爲AI場景設計,在支持自然語言查詢、向量計算等新需求時也可能面臨性能瓶頸。

但AI與數據庫的融合已是大勢所趨。未來,數據庫將不再僅僅是數據的容器,而是智能生態的核心樞紐。