落地工業場景,大模型要闖這三關?

本文來源:時代週報 作者:朱成呈

2025年世界人工智能大會上,“AI賦能新型工業化”成爲最具現實張力的熱詞之一。從生成式AI到具身智能機器人,從工業操作系統到行業大模型,AI正試圖一步步打通底層設備、中層系統與頂層決策的縱深鏈條。

據麥肯錫調研顯示,今年1月評選出的全球17家“燈塔工廠”中,AI幫助其在製造成本、生產週期時間和缺陷率等方面改善50%以上。然而,這些工廠中排名前五的用例有77%應用到判別式AI,僅有9%應用到生成式AI。

諮詢公司Gartner預測,到2029年,中國60%的企業將把AI融入主要產品與服務,並依託其成爲核心營收驅動力。但從“實驗室”走進“車間地板”,AI要穿透工業體系的多樣性、複雜性和高可靠性要求,至少還有三座“硬山”需要翻越:一是高質量數據收集困難,二是模型幻覺難以容忍,三是場景適配難以規模複製。

這不僅是一場算法能力的競賽,更是一場工業理解力與系統工程力的長跑。

高質量數據是前提條件

在通用大模型邁向工業場景的過程中,高質量數據不是加分項,而是決定模型能否落地的前提條件。

中國電子信息產業發展研究院信息化與軟件產業研究所發佈的研究報告指出,海量高質量數據是大模型泛化涌現能力的基礎。從行業前沿趨勢來看,大模型訓練使用的數據集規模呈現爆發式增長,對訓練數據的數據量、多樣性和更新速度方面也提出更高的要求。

從國際演進軌跡來看,模型訓練的數據規模正急劇膨脹。GPT-1的數據集爲4.6GB,GPT-3達到753GB,而GPT-4的數據量是前者數十倍。據推測,GPT-5的訓練數據有望突破200TB。

工業場景下,這一挑戰更爲複雜。國金證券研報指出,工業領域涵蓋廣泛,包括41個工業大類、207個工業中類、666個工業小類,導致數據結構多樣,數據質量參差不齊。同時,由於工業生產過程中的各個環節相互交織,數據之間的關聯性和複雜性也較高。數據來源、採集方式、時間戳等都會影響數據的準確性和完整性。

這種數據結構的多樣與質量的參差不齊,給工業大模型的訓練和應用帶來挑戰。工業 AI 構建,需要投入大量的時間和資源進行數據清洗、預處理和校驗,以確保數據的準確性和一致性。

“當前很多企業在IT層面已經沉澱了大量數據,例如ERP、MES等系統數據,但在OT(操作技術)層面的數據積累仍有明顯短板,尤其是在設備加工、運輸、裝配等底層環節。”在2025世界人工智能大會上,卡奧斯物聯科技股份有限公司副總經理謝海琴向時代週報記者表示,“隨着柔性製造、自動化製造趨勢的加速推進,這部分OT數據的採集變得尤爲關鍵。”

謝海琴表示,卡奧斯的做法是“從問題出發反推數據”,即先識別關鍵業務問題,明確所需數據要素,再去補齊採集路徑,從而確保數據不僅齊全,而且精準。

“數據治理是一個‘久久爲功’的系統工程,不僅要清洗、分類、建模,更需要在組織機制上爲數據要素注入真實業務價值。”謝海琴強調,“如果數據質量不過關,無論是採集端還是清洗端,訓練出的模型也無法具備工程可用性。”

控制模型“幻覺”風險

相比消費互聯網可容忍一定程度的生成誤差,工業場景對模型“幻覺”的容錯率幾乎爲零。任何一次看似無害的偏差,在工業現場都有可能演化爲實質性的安全風險或經濟損失。

國泰君安證券研報指出,AI 幻覺(AI hallucinations)是指人工智能模型生成的看似合理但實際錯誤的內容,這種現象通常表現爲脫離現實、邏輯斷裂或偏離用戶需求的輸出。

大語言模型(LLM)在生成過程中可能感知到人類觀察者無法察覺或不存在的模式或物體,從而產生毫無意義或完全不準確的輸出。這些錯誤的成因複雜多樣,包括訓練數據不足、模型過擬合、數據偏差、錯誤假設以及上下文理解不足等。

謝海琴認爲,控制幻覺必須從三方面入手:提升數據質量與行業理解,高質量、高可信度的數據集是模型可靠性的基礎,背後必須有對行業工藝流程的深刻洞察; 引入外部知識體系,通過知識圖譜、專家規則庫等形式增強模型語義理解與推理能力; 引入模型校驗機制,在模型推理之後增加交叉驗證、專家審校或預測校驗等機制,防止模型“跑偏”。

在產業實踐中,企業正嘗試將幻覺風險前置治理。在2025世界人工智能大會上,範式集團高級副總裁柴亦飛向時代週報記者表示,工業決策場景對可靠性要求極高,任何預測錯誤都可能導致實質性損失。因此公司在設計中引入決策模型,通過工程邏輯、業務規則對模型輸出進行“約束校驗”,最大限度地降低幻覺風險。

國金證券則提出一種可行架構:“大模型指揮、小模型執行”。即在需要全局優化和預測性分析的場景中,利用大模型進行宏觀指導與決策支持。而在具體執行與實時反饋方面,則依靠小模型發揮其高精度和低成本的優勢。

化解定製化適配難題

消費領域的大模型更關注“廣覆蓋”,而工業領域的大模型則必須直面“深穿透”的難題。

工業互聯網的核心特徵是“1米寬,百米深”。謝海琴表示,無論是流程工業還是離散工業,每一個細分行業的工藝流程都高度專業化、個性化,行業know-how極爲深厚。這也意味着平臺型企業若要真正實現能力穿透,必須基於深刻的行業理解展開定製化適配。

卡奧斯自身的演進路徑印證了這一判斷。謝海琴指出,卡奧斯起源於離散製造業,早期深度服務家電、電子、電腦等產業,並在激烈市場競爭中積累了紮實的工業基礎。這些經驗不僅幫助卡奧斯打下工業數字化底座,也構成其拓展其他離散製造門類的重要支撐。

在“工業具身智能”領域,定製化同樣是穿透場景的前提。優艾智合聯合創始人趙萬秋向時代週報記者表示,具身智能的價值不僅在於自動化效率,更在於其對柔性製造趨勢的支撐能力。“以手機制造爲例,從過去一兩個型號到現在每代手機都可能有普通版、Pro版、Max版等多種配置和顏色,消費者個性化需求的提升正在倒逼生產流程柔性化。”

趙萬秋指出,優艾智合構建的面向工業實際需求的具身智能系統,正是支撐這種變化的基礎設施。藉助具身智能機器人及其調度系統,工廠能夠實現物料在不同生產節點間的智能流轉與動態調整,滿足多品類、小批量、高頻次的定製化生產需求。

算法層面的適配挑戰同樣不容忽視。柴亦飛表示,公司在實際應用中面臨的最大挑戰之一,是每類場景的數據結構和特徵往往差異巨大。此外,在工程實踐中也會對模型進行“封裝”式的適配,不同應用場景所接入的大模型雖然底層一致,但調用方式、輸入輸出接口都可以做出差異化設計。

與通用大模型主要處理文本輸入輸出不同,第四範式(06682.HK)的垂直模型更偏向任務導向型。例如,在“辦事型”場景中,大模型的核心作用不是生成文本,而是預測“下一個動作”或“下一個狀態”。以在製造環節中的產量需求預測爲例,模型的任務就是根據當前的多維數據輸入,預測明天的生產需求。這種預測類應用本質上更貼近“廣義智能決策”,而非純粹的語言生成。