華爲等頭部廠商加速佈局 數據庫產業迎來AI革命

《科創板日報》6月25日訊(記者 黃心怡)AI Agent(智能體)正在驅動軟件形態的變革,而數據庫不僅是承載數據的重要載體,而且能幫助大模型避免“幻覺”、數據更新不及時等問題,有望成爲AI時代的“必需品”。

同時,AI正在賦能數據庫自身升級,在智能運維等方面發揮重要作用,推動數據庫行業加速發展。

國泰海通、民生證券均在近期研報中認爲,AI有望重塑數據庫業務,數據庫業務未來可能被AI Agent重新定義,迎來增長新階段。

當前,甲骨文等國外廠商正積極推動生成式 AI技術融入其業務中,國內華爲、螞蟻等廠商同樣在積極擁抱AI。此外,存算分離正成爲數據庫發展的趨勢,提高系統性能和可靠性。

▍AI改變數據庫的交互模式

不久前,螞蟻集團旗下數據庫廠商OceanBaseCEO楊冰發佈全員信,宣佈OceanBase全面進入Al時代,並任命CTO楊傳輝擔任AI戰略一號位,同時成立了AI平臺與應用部、AI引擎組等新部門。

而在去年,甲骨文的核心數據庫產品已從雲時代進入AI時代。

華爲金融數據庫軍團解決方案營銷運作總監龔濤告訴《科創板日報》記者,AI和數據庫的融合趨勢可分爲AI for Database和Database for AI兩大方向。

“在AI for Database領域,我們正見證一些探索和突破,比如AI協助數據庫管理員進行數據庫的管理優化,當數據庫管理員不在時,Agent智能體幫助人類進行決策,優化數據庫。”他表示。

“早期的小模型泛化能力有限,但當進入大模型時代後,其強推理能力和Agent模式讓AI的學習能力變得更強,可以實現自我管理,並不斷循環。未來,智能體的技術會對於存儲以及數據庫運維,帶來翻天覆地的變化。”華爲閃存存儲領域總裁謝黎明提到。

在謝黎明看來,過去很複雜的人工任務,如今可以由AI來完成。“比如海量的日誌更新,靠人工來分析性能問題是很難的。大模型則能夠完成,還可結合業務情況、負載情況進行非常複雜的配置。”

深圳計算科學研究院首席架構師沈剛表示,其開發的崖山數據庫正在開展相關AI探索。

“數據庫需要大量的管理員隊伍,有了AI技術後,有望讓數據庫像駕駛汽車一樣自動管理。比如,AI根據系統情況自動設置最適合的參數,並且隨着數據庫的運行,不斷地自主學習並進行調整,智能判斷系統的情況,進行數據備份等操作。當遇到大規模高併發時,數據庫可以自動完成空間的回收,並結合運行過程中收集到的信息,提升運行效率。”

Database for AI領域同樣進展迅速。龔濤透露,華爲相關業務發展較快,業務佔比變大。“比如通過新型數據庫來支撐RAG增強檢索,增強大模型推理的效率等。”

謝黎明則直指Database for AI的本質——要把數據“吐”出去。

“未來AI時代,會發生幾大變化。一是人機交付方式從以前的SQL變成自然語言,查詢數據不需要再寫複雜的SQL語句,而通過人類自然語言進行對話。二是機器與機器的交互也會改變。當所有事物都通過智能體接入,數據的決策和消費方式將發生變化。數據庫需要在模式上改變,才能更好地使能AI。“

江南農村商業銀行數據庫總監王浩向《科創板日報》介紹,該行已在探索AI賦能數據庫運維。“我們希望人工智能來自動判斷問題,定位問題,同時解決問題。比如半夜故障收到告警,如果人工處理,會有一定的時長間隔。所以我們在探索,用AI來自動判斷一些常規性的問題,主動處理。”

▍從“存算一體”走向“存算分離”

除了AI大模型帶來的變革,存算分離亦成爲數據庫發展的一大趨勢。存算一體架構可滿足業務初期對快速和敏捷交付的需求,但隨着業務的增長和基礎設施規模的擴大,存算一體架構在可靠性和擴展性方面的侷限性逐漸顯現。

“比如集羣規模變大後,資源利用率可能變得不到5%。存儲一旦出現故障,會引發數據庫頻繁的切換,甚至導致數據要重新共建,這影響了整個系統的可用性。”謝黎明稱。

王浩表示,江南農村商業銀行選擇存算分離架構,主要是出於可靠性、靈活性、經濟性三個方面的考量。

“硬盤的損壞率一直居高不下。如果大規模部署本地硬盤,隨着時間的推移之後,硬盤的故障率會非常高,就會對我們的運維成本帶來極大的挑戰。在存算一體的架構下,更換硬盤一定會對上層的數據庫產生影響。存算分離通過共享存儲,利用高可用性隔離硬盤故障對數據庫的影響。”王浩說。

在存算分離的架構下,江南農村商業銀行把計算節點從原來的物理機改造成了虛擬機,並進行大規模應用,提高了系統的可靠性。

“以前一臺物理機出現硬件故障,比如CPU內存損壞了,即使有備件立馬更換,起碼要花一個小時、半小時。在存算分離的架構下,我們把計算節點改成虛擬機後,業務故障能更快速地恢復,保證了業務連續性。而且這降低了服務器成本。對中小行而言,‘物理機+本地盤’的方式,採購設備、機房建設等成本是挺大的挑戰。”王浩稱。