2024服貿會|對話楓清科技創始人兼CEO高雪峰:治理企業本地多模態數據是解決大模型幻覺的第一步

擔任阿里雲大數據&AI產品及解決方案總經理時,創業的念頭就"長"在高雪峰心裡了,這次參加2024年中國國際服務貿易交易會(以下簡稱"2024服貿會"),他的身份已從大廠高管變成創業公司楓清科技(Fabarta)的創始人。

在大數據和人工智能領域待了20年,他清楚企業數智化轉型的需求,也知道怎樣解決當下大模型落地的痛點。"要提升大模型推理能力""增強基於數據關係的推理能力""通過智能體平臺提供推理的思考路徑",服貿會上,在與北京商報記者交流的一個多小時中,他反覆強調。

楓清科技致力於通過融合圖、向量和AI的多模態智能引擎以及數據編織與智能體等技術的融合與探索,推動AI技術在企業級客戶中的應用與落地,高雪峰給公司做了一個技術範的定位。簡單來說,就是通過各種技術、產品、平臺儘可能降低大模型"胡說八道"的機率。不久前,楓清科技和中化信息達成合作,利用智能體服務具體的業務場景。同時,公司的Pre-A+輪融資正在順利推進中。

大模型的本質還是基於"概率"的預測

"大模型有強大的能力,但落地時暴露出一系列問題,"大模型狂奔兩年,高雪峰說出了同行們的心聲,"比如‘幻覺’現象、推理能力不足、解釋性差。這些問題導致很多企業面臨大模型‘好玩不好用’的困境。"

問題明確,原因何在?他認爲與大模型的複雜性、多樣性以及企業應用場景的精準性要求有關。

"大模型主要依賴於概率統計方法,通過大量的數據來學習語言模式和統計規律,進而預測下一個詞或序列。模型往往通過生成最可能的詞語序列來組成回答的內容,而不是真正地思考或分析問題的內在邏輯關係",高雪峰解釋。

正因爲如此,大模型在回答複雜邏輯問題時,可能會基於常見的語料模式生成看似合理但並非正確的答案,這就是大模型的幻覺。

"現實世界中的許多複雜決策需要多步驟分解與推理,大模型缺乏有效的記憶機制來跟蹤和協調每一個推理步驟,或者是針對特定的複雜問題去拆解推理的步驟",高雪峰向北京商報記者解釋,每一步推理的結果可能影響下一步的輸入,而大模型在內容生成過程中的概率預測能力,在多複雜條件下未必準確。

同樣是因爲大模型過於複雜,讓可解釋性變得更加困難,技術出身的高雪峰坦言,"專業研究人員也很難理解模型是如何得出某個結論的,普通用戶更難以理解模型爲什麼輸出這樣的內容"。

"OpenAI剛剛推出了推理能力很強的o1模型,基本上也是在推理框架上面做了更深度的改進,比如思維鏈機制的改進。在o1之前就有很多研究使用ToT(思維樹)、GoT(思維圖)等方式來改進大模型的推理能力。這與我們在企業場景當中落地的方向是一致的,只不過我們更多的推理是基於企業本地沉澱的精準知識與邏輯,相比通用的推理能力或者範式,可能更加貼近行業的積累。"高雪峰表示。

數據還是數據

關於數據,高雪峰談得更多。

"如果訓練數據主要來自特定領域或文化背景,模型就可能在該領域內的推理任務上表現較好,但在其他領域或文化背景下表現不佳,泛化能力將明顯不足。當遇到不常見或沒有足夠數據支持的推理任務時,可能會出現錯誤,"高雪峰向北京商報記者舉例,"缺乏對特定行業知識的深入理解,可能導致模型缺乏領域知識,生成不切實際的輸出。"

數據時效性和安全可控是另一個問題。他說,預訓練當中使用的數據就是模型做內容生成時的所有依據,但是在決策智能領域,大部分需求都對數據的時效性有很大要求。不同的數據全部拿來做大模型的預訓練,很難在推理的過程當中去控制什麼樣的角色不能利用預訓練階段當中的哪部分數據,從而實現數據的安全可控。

回到解決方案,又要追溯到機器學習領域的架構之爭:以模型爲中心與以數據爲中心。"爭論的焦點在於,爲了提升模型的性能和效果,究竟是應該鎖定訓練數據並不斷迭代算法,還是應該鎖定算法並不斷迭代用於訓練的數據,對其進行清洗和噪音剔除等操作。"

具體到企業場景中,"爲了實現更好的效果,應該持續利用客戶本地數據來優化模型參數和質量,還是應該讓不同的模型能力服務於企業本地經過組織的數據",提到這一點時,高雪峰迴顧了人工智能的三大流派:符號主義、聯結主義和行爲主義。"當前AIGC(人工智能生成內容)技術是聯結主義的巔峰,而大模型幻覺、可解釋性差、推理能力弱等問題,恰恰是符號主義流派的邏輯推理技術能解決的。"

讓模型服務於企業本地數據

結合技術發展的客觀規律,高雪峰提出的解決方案是,讓不同的模型能力服務於企業本地經過組織的數據和知識。

爲了解釋清楚這些抽象的概念,他用了一個詞:編織,即通過圖與向量和文本數據的融合存儲與計算來聚合企業本地數據,利用數據編織平臺的能力將企業數據轉化爲知識,並通過知識運營與智能體平臺結合大模型中的泛化知識,來支持豐富的企業智能化場景。

簡單來說,就是通過各種技術手段,將企業本地數據和大模型的泛化知識作爲大模型判斷的基礎。

"這種組織架構非常靈活,能夠根據場景的不同需求,選擇依賴大模型中的泛化知識或結合企業組織好的本地知識",基於這一點,高雪峰認爲,平臺建設是核心基礎。

這個平臺需要具備哪些核心能力,才能支撐不同的智能化場景?

在和合作的頭部企業交流、實踐後,他指出:最底層是基礎設施,其上是對多種大模型甚至傳統小模型的管理,同時需要整理行業所需的數據集。但是真正實現企業智能化場景的落地,還需提供知識運維與管理等能力,以及將企業多模態的數據轉化爲知識的能力,最後通過智能體平臺及向上的原生知識庫能力,賦能企業級場景。

楓清科技的產品就對應着上述能力,楓清·天樞多模態智能引擎爲企業AI智能應用提供便捷的私有化記憶存儲服務及強大且可解釋的推理能力;楓清·錦書數據編織中臺將企業的多模態數據轉化爲知識;楓清·瑤光企業知識中臺將錦書當中的知識與不同大模型當中的泛化知識進行融合,並以智能體的方式賦能上層的豐富應用。

在和北京商報記者的交流中,高雪峰以楓清科技與中化信息的深度合作爲例介紹,中化信息通過引入楓清科技的"楓清·瑤光企業知識中臺",針對企業結構化數據和非結構化數據,驗證和打造共創方案,將數據轉換爲知識,利用平臺快速構建智能應用,發揮數據的價值,構建企業智能化升級之路。基於雙方聯合打造的靈活自主可控核心服務矩陣,包括知識引擎和智能體引擎兩大關鍵組件,可通過文檔問答、智能問數以及智能體方式串聯大模型應用與業務系統,助力應用的智能化,提升用戶與業務系統的交互效率以及工作和生產效率。

北京商報記者魏蔚