券商“跑步前進”部署DeepSeek:對話銀河證券大模型一線負責人
財聯社2月24日訊(記者 林堅)DeepSeek已漸成國內券商的標配。這款唯一一個被海外市場接入的國內大模型,在過去的幾周內就有近40家券商成爲接入或者本地化部署的對象。不難發現,以DeepSeek等一系列大模型爲代表,正在深刻改變證券業的格局以及未來。
2023年8月31日,11家大型語言模型成功通過《生成式人工智能服務管理暫行辦法》的備案程序,這標誌着大語言模型在監管框架和應用模式方面達到了一個重要的成熟階段,並且開始進入大規模推廣的時期。大模型企業級應用全面井噴,但整體仍是方興未艾,還有哪些細節與痛點?近期,銀河證券信息技術部數據與智能應用模塊負責人劉永旗與財聯社記者進行了一次深度對話,聚焦大模型企業級應用,尤其是DeepSeek帶來的變革。
劉永旗表示,整體而言,DeepSeek的出現激發了證券行業內廣泛的使用熱情,企業用戶需求激增,應用場景不斷擴展,持續增強計算能力並實現有效資源利用至關重要。券商需要融合各種尺寸和類型的模型,將推理型大型模型應用於需要複雜推理的領域,同時在簡單問答場景中使用通用型大型模型。“通過這種方式,我們可以讓不同模型發揮其獨特優勢,協同工作以提升整體的AI性能。在提高業務成效的同時,我們還需兼顧性能考量,確保技術的真正落地應用,並實現規模效應,從而達到降低成本和提高效率的目的。”
劉永旗表示,銀河證券積極擁抱AI時代潮流,在大模型興起之初,便深入探索GLM、DeepSeekV1等開源大模型的應用場景,並逐步引入通義千問7B-72B及VL等不同規模的大語言模型和多模態大模型。
今年2月初,銀河證券上線了DeepSeek-R1-Distill-Qwen-32B版本,並於2月17日正式推出DeepSeek-R1“全尺寸”模型。通過構建企業內“特性+尺寸”雙維模型庫,銀河證券實現了輕量化部署與複雜任務處理的雙重需求。此外,公司已將DeepSeek-R1系列大模型及通義千問模型深度適配優化,雙模型體系已成功應用到公司自研投顧平臺G-Winstar(問TA系統),構建了覆蓋投顧服務全鏈條的智能中樞。
看點一:算力軍備競賽與模型“組合戰法”涌動
2024年12月26日,中國AI行業迎來歷史性時刻:深度求索(DeepSeek)發佈的MoE(混合專家)大模型DeepSeek-V3以6710億參數規模,在多項評測中超越MetaLlama-3.1、阿里Qwen2.5等國際主流模型,性能直逼GPT-4o與Claude-3.5-Sonnet。更令人矚目的是,其客戶端僅用7天便突破1億用戶,刷新ChatGPT、TikTok等國際產品的增長紀錄。這場由技術突破引發的行業地震,正在重構全球AI競爭版圖。
在劉永旗的觀點裡,DeepSeek的“破圈”效應已引發全球產業鏈重構,這已成爲不爭的事實。
劉永旗認爲,DeepSeek的影響力超過2022年ChatGPT的面世。一方面,雲服務爭奪戰已經打響。微軟Azure、亞馬遜Bedrock等國際雲巨頭爭相接入DeepSeek模型,華爲雲、阿里雲則推出“千卡集羣+DeepSeek適配”的國產化方案;另一方面,硬件生態綁定正在建構。英偉達NIM平臺將其列爲推薦推理框架,AMDMI300XGPU針對其優化性能,英特爾更實現酷睿處理器離線運行,這意味着未來AIPC可能標配“中國芯+中國腦”。
聚焦到金融業場景,DeepSeek應用呈現爆發趨勢。劉永旗表示,已有至少37家國內券商部署DeepSeek-R1本地化方案。已某券商投研部透露,其行業報告生成效率從8小時縮短至20分鐘,並實現宏觀數據與產業鏈圖譜的自動關聯。
從成本與推理能力上,劉永旗分析稱,DeepSeek-R1在模型訓練與模型算法等方面實現了創新,並顯著降低了成本。尤其在推理能力上,DeepSeek-R1表現突出,對於券商應用提供了重要價值。
從應用效果方面,劉永旗稱,通過創新的模型架構和工程優化,DeepSeek大幅降低了訓練和推理成本,DeepSeek-R1的整體訓練成本比OpenAI少了一個數量級以上。在模型性能方面,DeepSeek-V3作爲MoE模型,在多項測評中超越主流開源模型,性能媲美頂尖閉源模型。DeepSeek-R1在後訓練階段大規模使用強化學習技術,極大提升了模型推理能力,在數學、代碼、自然語言推理等任務上比肩OpenAI o1正式版。其蒸餾出的6個小模型在多項能力上實現了對標OpenAI o1-mini的效果,拓展了多場景應用潛力。
看點二:證券業算力、模型、數據和場景全面革新
目前,證券行業已在投資顧問、投資銀行、投資研究、客戶服務、風險控制以及信息技術等多個領域實現了大模型的具體應用。劉永旗告訴記者,大模型的企業級應用主要涉及算力、模型、數據和場景這四個方面,而DeepSeek在這四個方面對證券行業產生了顯著影響。
首先是算力方面。國內大模型參數規模從最初的100多億逐漸擴展700多億,此前主流模型仍在千億以下。然而,DeepSeek-R1的全尺寸參數規模已達到6000多億。隨着模型效果提升與尺寸增大,算力需求迅猛增長。疊加證券行業對於安全以及合規的高要求,證券公司不得不在本地化部署的限制下支持激增的應用需求,賦能業務發展。
再者是模型方面。劉永旗談到,目前國內主流大模型要麼部分開源,要麼不開源,而DeepSeek不僅效果出色,而且全部開源。這一特點將刺激更多的商業模型開源,爲企業級應用帶來更多選擇,使得企業能夠根據不同的業務場景適配更多的模型,從而更好地滿足多樣化的業務需求。
還有數據方面。目前業界成熟的方案是通過將數據轉化爲知識庫,再利用RAG(檢索增強生成)的方式賦能業務場景。DeepSeek在此基礎上以其強大的數據分析能力和推理歸因能力,爲證券行業提供了更爲便捷和高效的應用途徑,有助於企業更好地挖掘數據價值,提升業務決策的準確性和效率。
第四是場景方面。通用大模型通常需要精心設計的提示詞來引導其思考和輸出,以達到可上線的業務效果。而DeepSeek-R1在推理過程中,會先根據輸入的內容進行思考,然後再生成回答。在實際落地過程中,僅需要簡單的提示詞就能達到很好的效果,大大降低了企業級應用的門檻,加速了業務創新。此外,DeepSeek-R1在複雜推理方面相較於通用模型具有明顯優勢,能夠結合結構化和非結構化數據,在投顧、投研、投資等業務中探索更復雜的場景,突破了簡單知識庫問答的限制,進一步拓展了業務場景的廣度和深度。
這些影響已經具化到了銀河證券的探索中,尤其是公司所構建的覆蓋投顧服務全鏈條的智能中樞。
一方面,基於大模型的深度推理分析能力、智能知識調用能力與自我修正機制,結合銀河證券自身沉澱的專業數據庫、業務數據庫與研究資源庫,實現客戶數據深度挖掘與精準畫像,推動投顧服務與產品的精準推送,協助投資顧問快速生成多形式的客戶綜合金融解決方案,滿足投資者“千人千面”的財富管理需求,給予客戶更高效、更定製化的投資體驗。
另一方面,深度融合自研投顧平臺G-Winstar(問TA),基於大模型的複雜任務處理能力與推理能力,將DeepSeek等大模型能力應用於投顧展業的全鏈條。依據中國銀河證券多年來的投顧展業經驗,在服務的事前、事中、事後分階段場景中逐步嵌入專家經驗,實現多場景深度對接,確保大模型“答得有用、答得更好”。真正幫助一線投顧靈活地應對多樣化展業場景需求。此功能上線,將大幅提升投資顧問專業服務質效。
看點三:哪些應用痛點還需關注?
基於和劉永旗的採訪對話,以及通過近兩週的溝通與調研,財聯社記者注意到,目前證券業對大模型應用有幾個關注的痛點與難點。
構建高質量知識庫是券商面臨的一個重要課題,大模型的強大能力高度依賴高質量、權威的數據支持,這要求券商內部的知識庫體系和數據治理流程面向大模型的應用場景進行優化和調整。此外,部分標準化數據仍需外部補充,除了採購成本外,企業還需要解決外部數據的整合與管理問題。
高成本部署是券商面臨的另一個痛點,完整參數模型需要強大的硬件支持,這不僅意味着額外採購高性能服務器,還需要經過嚴格的項目論證和審批流程。與此同時,大模型技術正處於快速演進階段,在應用效果、建設成本、技術路線方面都在持續變化,這種節奏差異對於大模型技術佈局提出了新的挑戰。
合規與業務限制也是券商需要面對的挑戰。對客戶提供內容生成式服務存在明顯障礙,直接面向客戶的智能投顧需要備案,目前僅限內部助手型應用。
技術與業務協同方面也面臨挑戰,一方面,業務側對新興技術接受度不一,部分頭部投研人員因早期參考性不足,對模型輸出持謹慎態度,需要通過輸出模型生成的思考過程增強可信度。另一方面,各業務條線需求分散且差異較大,定製化開發難度高,而大模型技術迭代日新月異,技術側在滿足需求的同時還需及時跟進業界最新進展提升服務能力。爲此,需要搭建企業級大模型平臺,統籌考慮全公司技術路線和場景建設,提供平臺化通用能力支持,減少定製化成本。
可以看到,隨着AI技術的不斷進步和應用場景的不斷拓展,證券行業在AI領域的探索和實踐將爲整個金融行業的發展提供有益的借鑑和參考,助力金融行業在數字化轉型的道路上邁出更加堅實的步伐。
銀河證券方面也表示,將進一步以AI作爲放大專業價值的槓桿,以科技作爲承載專業與服務溫度的橋樑,在AI與投顧服務的深度融合中,以智能化的普惠金融服務爲目標,積極推進前沿科技創新,始終“以客戶爲中心”,書寫現代投行高質量發展的新時代答卷。