阿里開源"零搜索":AI自學檢索能力,訓練成本砍掉88%
5月9日消息,阿里巴巴集團研究人員近日開發出創新方法,可顯著降低人工智能信息檢索訓練的成本與複雜性,有望徹底擺脫對昂貴商業搜索引擎API的依賴。
這項技術名爲“零搜索”(ZeroSearch),通過模擬訓練的方式使大語言模型(LLM)形成高級搜索能力,全程無需調用真實搜索引擎。這項創新不僅有助於企業節省大量API費用,還賦予開發者更多的控制力,以優化人工智能系統在信息檢索方面的學習過程。
研究團隊在近日發表於arXiv的論文中指出:“強化學習訓練需要頻繁推演策略,可能涉及數十萬次請求,導致鉅額API開銷並嚴重製約擴展性。爲應對這些挑戰,我們提出了‘零搜索’框架,一種無需依賴真實搜索引擎的強化學習方案,能夠有效培養LLM的檢索能力。”
"零搜索"如何實現無需搜索引擎的AI訓練?
“零搜索”技術所解決的是一個困擾行業已久的核心問題:開發具備自主信息檢索能力的人工智能助手時,通常面臨兩大挑戰:一是訓練過程中由搜索引擎返回的文檔質量不可控,二是數十萬次調用谷歌等商業搜索引擎API所帶來的高昂費用。
阿里巴巴的解決方案從輕量級的監督微調入手,先將LLM轉化爲一個檢索模塊,使其能夠根據查詢生成相關和不相關的文檔。在強化學習訓練過程中,研究人員採用了一種名爲curriculum-based rollout strategy的方法,逐步降低生成文檔的質量,以提升模型的辨別能力。
研究人員解釋道:“我們的關鍵發現是,LLM在大規模預訓練中已積累了豐富的世界知識,且具備在給定查詢條件下生成相關文檔的能力。與真實搜索引擎相比,模擬生成的內容在文本風格上存在差異,但在信息相關性方面卻能相媲美。”
低成本實現超越谷歌的性能
在涵蓋七個問答數據集的綜合實驗中,“零搜索”技術訓練出的模型不僅表現與真實搜索引擎訓練的模型相當,甚至在多個任務中實現超越。尤其值得一提的是,7B參數的檢索模塊已可達到谷歌搜索的性能水平,而14B參數的模型則在多個指標上超越了谷歌。
成本節約同樣顯著。據研究團隊測算,使用SerpAPI調用谷歌搜索處理約6.4萬次查詢,成本約爲586.70美元;而在四塊A100 GPU上運行14B參數的模擬LLM,僅需70.80美元,節省幅度高達88%。研究人員指出:“這一結果表明,在強化學習設置中,用訓練有素的LLM替代真實搜索引擎是完全可行的。”
將對AI發展產生深遠影響
“零搜索”標誌着人工智能系統訓練方法的一次重大突破與轉型。它表明,人工智能系統可以在無需依賴外部工具(如搜索引擎)的前提下,不斷提升自身的信息檢索能力。
這項技術對於AI行業的意義尤爲重大。長期以來,訓練先進人工智能系統往往依賴於由大型科技公司掌控的商業搜索API,訓練成本居高不下。而“零搜索”打破了這一格局,讓人工智能可以通過模擬實現自主搜索,從而擺脫對外部搜索服務的依賴。
對於預算有限的小型人工智能公司和初創企業而言,這無疑是一個利好消息。API成本的高門檻一直是開發複雜智能助手的一大障礙。“零搜索”在通過將成本削減近90%的同時,也爲更多企業打開了進入先進人工智能領域的大門。
此外,使用模擬搜索還能爲開發者提供更高的可控性。真實搜索引擎返回的內容質量參差不齊,難以精確控制訓練數據。而在模擬環境下,開發者可以定製訓練語料,系統性地塑造模型的學習路徑。
“零搜索”技術已被驗證可適用於多種模型家族,包括Qwen-2.5和LLaMA-3.2,並支持基礎版本與指令調優版本。研究團隊已將相關代碼、數據集和預訓練模型開源發佈於GitHub和Hugging Face,供業內研究人員和企業使用與測試。
隨着大語言模型不斷演進,像“零搜索”這樣的技術預示着,未來人工智能系統將更多依賴自我模擬來發展複雜的能力,而非依靠外部服務。這不僅可能重塑人工智能開發的經濟模式,還將降低整個行業對大型平臺的依賴。
頗具諷刺性的是,在教會人工智能如何不依賴搜索引擎進行搜索的過程中,阿里巴巴或許創造了一項使搜索引擎在人工智能訓練中變得可有可無的技術。隨着這些系統變得愈加自給自足,未來的技術生態或將在短短几年內發生翻天覆地的變化。(小小)