華盛頓大學專家:DeepSeek如何改變人工智能行業

鞭牛士報道,2月4日消息,據外電報道,分析師表明,與 Open AI ChatGPT 和其他機器學習平臺等模型相比,DeepSeek AI 的訓練效率更高,此後,DeepSeek AI 在過去一週人氣飆升。

根據在其網站Stratechery上提供技術行業分析的 Ben Thompson 的報告,DeepSeek 的設計受到諸多限制,最終導致機器學習所需的計算能力發生了創新。開發 DeepSeek 的初創公司位於中國,而中國正受到貿易禁運,這導致其無法獲得美國跨國公司 Nvidia 生產的高質量半導體芯片。

由於主要使用質量較低的芯片,DeepSeek 開發人員不得不採用各種人工智能 (AI) 優化技術,從而使他們的機器學習平臺發揮出更大的性價比。

根據斯坦福大學 2024 年人工智能指數報告,DeepSeek 開發人員聲稱,訓練他們最新版本的 AI 花費了大約 560 萬美元,而最新的 Chat GPT 4 訓練成本據稱爲 7800 萬美元,谷歌的 Gemini Ultra 成本爲 1.91 億美元。

當人工智能訓練的成本大幅降低時,華盛頓大學聖路易斯分校的科學家和消費者都將受益。

麥凱維工程學院計算機科學與工程助理教授烏馬爾·伊克巴爾 (Umar Iqbal) 表示,僅他的實驗室就需要花費數萬美元才能使用這些平臺,而來自中國初創公司的競爭可能會降低價格。

Stratechery 的文章中提到了 DeepSeek 降低訓練成本的一個例子,即他們的開發人員使用了一種名爲蒸餾的方法,他們使用像 ChatGPT 這樣的成熟生成式 AI 系統來“教”他們的系統如何完成工作。

McKelvey Engineering 的博士生最近嘗試了蒸餾來改進大型語言模型,而無需額外的訓練。

「要讓技術得到大規模採用,它們必須價格低廉。」伊克巴爾說。「這表明使用模型可以變得非常便宜。」

「總的來說,這是一個有趣的發展。它大大降低了人工智能的成本。」伊克巴爾補充道。「我們將能夠進行實驗,進行更多大規模實驗。」

但主要研究課題是互聯網安全和隱私的伊克巴爾警告說,未來還會出現其他陷阱。

對 DeepSeek 的擔憂

要運行這些模型,人們需要訪問大型硬件;這不是人們可以下載到手機上的東西。人工智能平臺的工作方式是,一個人的機器和數據會傳到雲端的人工智能機器上——這就是他們可能失去對數據的控制的地方。

伊克巴爾表示:這是一個非常嚴重的問題。

人工智能系統可以實現龐大的監控基礎設施,其中一些已經以搜索引擎的形式存在,可以追蹤來自整個網絡的用戶數據,主要是爲了促進電子商務。

「所有這些數據都會發送給不同的人工智能供應商,他們可以利用這些信息來分析用戶,推斷他們的興趣,監視他們,甚至影響他們。」伊克巴爾說。

另一個擔憂是人工智能語言模型越來越多地融入移動應用。人工智能的一個越來越被宣傳的用途是規劃假期。當人工智能使用各種應用程序來做這件事時,如果有任何惡意軟件潛伏其中,它就有可能從用戶那裡收集更多的數據並操縱人工智能尋求的結果。

「當這些技術具有巨大潛力時,它們會發展得非常快。」伊克巴爾說。「你需要在設計中埋設護欄和保護措施。而人工智能系統卻沒有這樣做。」