對話紅帽曹衡康:開源模型主導AI未來

21世紀經濟報道記者孔海麗 北京報道

2025年,全球AI產業迎來分水嶺。

DeepSeek開源大模型迅速成爲行業焦點。OpenAI創始人山姆·奧特曼(Sam Altman)也罕見承認其“閉源路線站在了歷史錯誤的一邊”,並於近期宣佈在接下來的幾個月裡將發佈自GPT-2以來的第一個開源模型;國內原本走閉源路線的互聯網企業也轉向開源生態。

一系列事件標誌着開源AI路線取得階段性勝利,開源的成本、透明度與靈活性等優勢,正在重塑大模型競爭格局。

作爲全球範圍內開源路線的代表之一,紅帽“以開源推動效率革命”的理念其實更早,當下,DeepSeek的爆火,加強了公衆對於開源路線的認知。

近日,紅帽全球副總裁兼大中華區總裁曹衡康在接受21世紀經濟報道記者採訪時表示,紅帽將DeepSeek視爲“生態夥伴”:“他們的模型可以無縫運行在紅帽平臺上。”這種互補合作催生了新的商業模式——企業可在紅帽的OpenShift AI平臺上同時部署DeepSeek、Llama等開源模型,根據業務需求動態分配算力。

儘管AI非常火熱,但很多企業依然處於探索和測試階段。

紅帽數據顯示,94%的企業正在進行生成式AI試點,預計未來3到5年才能真正實現AI投資的回報。“AI部署的挑戰不只是技術本身,更重要的是如何把AI應用到實際生產環境中,尤其是在企業的核心應用上。”曹衡康說。

曹衡康透露,在紅帽看來,企業級AI應用更恰當的路徑是開源、混合式和專有小模型。

截至目前,開源的價值更明顯。原因在於,現階段的AI仍然需要大量嘗試,如果一千個人在一千個方向上探索,速度就會比一家公司單獨摸索要快得多。

在傳統軟件開發中,需求和實現路徑往往較爲明確,用閉源也沒什麼不妥;可是在AI領域裡還有很多未知,開源能夠極大加快創新進程。閉源意味着只有少數人能嘗試,效率相對低很多。通過開源,全球的開發者可以共同參與到AI的創新與改進中。

“混合式AI”意味着AI不會侷限於雲端,企業內部的計算資源同樣可以用於AI模型的開發和應用。

閉源模型通常綁定特定雲服務商,導致企業存在“被技術綁架”的風險。混合雲策略允許AI模型在本地數據中心、公有云或邊緣設備間自由遷移。

此外,不同於通用AI,行業專用的生成式AI模型要求根據具體業務需求定製。曹衡康舉例說,醫療行業、汽車行業和零售行業都需要專門針對各自行業特點的AI模型,而不是通用的大模型。

通用大模型並不總是最適合企業資源。企業需要的不是“萬能模型”,而是貼合業務的專有模型。

“我們相信,AI的應用應當能夠跨越不同平臺,從企業的數據中心到邊緣計算,甚至個人設備,都能靈活部署和運用。”曹衡康表示,開源、混合式和小模型原則,可以幫助企業以更低的成本開發高效的AI模型,減少對GPU等高性能硬件的依賴,並降低運營成本。

曹衡康也提到了企業AI部署的三個挑戰:成本、複雜度和靈活性。

閉源大模型的訓練和部署需要天量算力,企業往往因硬件投入和雲服務費用不堪重負。曹衡康指出,“小模型”策略通過模型蒸餾(Distillation)和私有數據調優,可將參數規模縮減至原模型的千分之一,硬件成本明顯降低。並且,通用大模型爲追求廣泛適用性,往往保留冗餘功能,導致輸出不可控,“專有小模型”策略則聚焦垂直場景,調用算力更少,效率更高。

多數企業缺乏AI專業人才,難以駕馭複雜的模型開發和數據清洗流程。紅帽通過RHEL AI、OpenShift AI等一體化平臺,將模型訓練、調優和部署集成到標準化工具中。例如,InstructLab允許企業用私有數據生成合成訓練集,將數據需求量降至原來的千分之一,同時支持自動化模型“瘦身”。

最後,靈活性至關重要,企業需要能夠根據自身需求,在不同平臺、不同硬件上靈活部署AI模型。

大模型的“幻覺問題”也是閉源路線的硬傷。由於模型參數和訓練數據不透明,企業難以追溯錯誤根源。而開源AI通過透明化調優與社區監督,可以有效降低模型幻覺率。開源模型的代碼、參數和訓練數據完全公開,企業可根據自身需求調整模型邏輯。

開源AI的勝利並非偶然,而是AI規模化落地的優勢路徑。在這場變革中,那些以開放生態賦能企業的平臺,不追求壟斷模型,而是構建自由、透明、經濟的AI未來。