國產大模型:既需向上突破也要向下紮根

原標題:國產大模型:既需向上突破也要向下紮根

“請問您用DeepSeek嗎?”

“我用,我本身專業是計算機專業,我對人工智能有偏愛。”在3月4日舉行的十四屆全國人大三次會議的新聞發佈會後,大會發言人婁勤儉面對現場記者採訪時的這句迴應火了。

今年春節期間,國產大模型DeepSeek憑藉低成本、高效能、強智能的應用體驗給人們留下了深刻印象。今年的全國兩會上,“國產大模型”“DeepSeek”也是被許多代表委員反覆提及的高頻詞。

近年來,隨着我國人工智能大模型產業加速發展,越來越多的國產大模型表現驚豔。作爲數字化時代的核心驅動力,人工智能正加速滲透進入國民經濟的多個領域。在不斷向上突破性能天花板的同時,國產大模型應如何紮根產業實踐,爲產業升級賦能,成爲代表委員們熱議的話題。

垂直模型紮根產業土壤

有問必答的快速響應、清晰明瞭的思考過程、全面翔實的參考資料……通過通用大模型,許多人開啓了與人工智能的第一次“親密接觸”。作爲人工智能領域的重要突破,通用大模型具備強大的語言理解和生成能力,能夠爲多個領域提供智能支撐。

隨着我國產業數字化進程不斷加速,各行業對人工智能的需求也愈發精細化、專業化。傳統的通用大模型在落地產業場景時,往往無法與具體業務精準結合,導致“水土不服”。在此背景下,專爲產業細分需求打造的垂直模型應運而生,成爲大模型技術落地產業應用的新趨勢。

“我們做大模型第一天就確定了‘1+N’的戰略路徑,即‘1個底座大模型+N個行業大模型’。我們結合通用底座、工具鏈和知識工程,擁有了‘建算力、理數據、訓模型、落場景、保安全、精運營’的全套解決方案。”科大訊飛股份有限公司董事長劉慶峰代表認爲,通用大模型底座的天花板正被不斷打破,應用場景落地已進入紅利兌現期,需要以更少成本、更低算力、更高效率推動落地。

例如,藉助阿里通義等通用大模型的底座能力,釘釘面向業務場景打造出AI助理產品,覆蓋製造、醫療、零售、教育等多個行業。在金石機器人常州股份有限公司,通過學習、沉澱大量機器人專業知識,釘釘AI助理直接服務全國1000餘家經銷商,高效解答各類產品售後問題;同時,它還可以根據問題描述,一鍵生成工單,並指派給對應負責人,將售後問題的解決時間從半個月縮短至3天內,顯著提升了企業運行效率。

“大模型在垂直領域大有可爲。”360集團創始人周鴻禕委員表示,中國大模型發展的重要方向應該是藉助產業和場景優勢,將大模型與業務流程、產品功能相結合,尋求多場景應用,實現垂直化和產業化落地。

加快形成“數據飛輪”效應

我國擁有聯合國產業分類中的全部工業門類。在500個工業品種中,有四成以上產品產量位居全球第一,產業具有全、多、大的獨特優勢。龐大的產業規模爲行業垂直大模型落地提供了肥沃土壤,同時也帶來了風險挑戰。

產業數據是垂直大模型的“養料”。我國產業種類豐富,但也造成產業數據類型和結構多樣、數據質量參差不齊等難題。談及大模型落地產業應用,多位代表委員提及,應推動產業數據共享,加快高質量數據收集利用,在產業領域形成“數據飛輪”效應,即通過數據的不斷積累和利用,驅動大模型性能持續提升。

中國電氣裝備集團有限公司科技創新部部長張帆代表認爲,許多製造企業數字化轉型起步晚、基礎薄弱,生產過程中的數據採集不全面、不及時;工業數據又往往存在噪聲大、格式不統一、關聯性差等問題,缺乏行業數據標準引導,難以爲大模型訓練提供足夠的高質量數據。同時,受限於數據安全風險、商業利益保護等因素,企業間築起了高高的“數據圍牆”,數據共享存在瓶頸。

基於此,張帆建議,應加快形成工業領域統一的人工智能數據格式規範和具體行業標準等,促使企業間對數據資產的交易基礎達成共識;龍頭企業要發揮鏈長作用,面向戰略性高價值場景,建立需求牽引、格式統一的高質量工業數據集。

圍繞大模型產業落地中的數據瓶頸,多地已開始行動。例如,北京市發佈的《北京市推動“人工智能+”行動計劃(2024—2025年)》中提出,依託北京數據基礎制度先行區,打造安全可信數據空間,引導企事業單位開放並匯聚高價值行業數據。

(科技日報)