中國新人工智能模型,據傳優於深言、ChatGPT!

新的人工智能平臺深言(DeepSeek)在美國讓投資者們情緒波動(或陷入混亂)之後不到一週,中國又推出了一個人工智能模型,聲稱這個模型更勝一籌。

這個名爲通義千問2.5(Qwen 2.5)的新人工智能模型來自於中國科技巨頭阿里巴巴,據稱它比目前中美市場上的任何其他模型都要優秀。

據路透社(Reuters)報道,阿里巴巴雲部門在其官方微信賬號發佈的公告中稱:“通義千問2.5 - Max幾乎在所有方面都優於GPT - 4.0、深言 - V3和Llama - 3.1 - 405B。”

在X平臺上,阿里巴巴的Qwen(通義千問)賬號發佈了統計數據,展示該模型與其競爭對手相比的情況,並聲稱表現優於對手。

該帖子稱:“它在與頂級模型的競爭中表現出色,在諸如Arena Hard、LiveBench、LiveCodeBench、GPQA - Diamond等基準測試中勝過DeepSeek V3。”

深言科技(DeepSeek)的人工智能模型DeepSeek - V3三週前橫空出世,自那以後在人工智能領域引起了轟動,這使得很多人認爲通義千問2.5 - Max的發佈是一種策略,因爲它發佈的第一天是農曆新年,大多數中國人都在休假。

國外競爭對手取得的成功在國內也引起了轟動,因爲人工智能領域的競爭者們都希望升級自己的模型以保持競爭力。

不過,關於中國研發的人工智能模型的性能和崛起仍存在疑問,因爲OpenAI指控DeepSeek使用其技術來開發自己的人工智能。

週三,一位與OpenAI關係密切的人士告訴《金融時報》:“問題在於有人拿走我們的技術並用它來構建自己的產品。”

彭博社報道發現,微軟的安全研究人員去年秋天發現,可能與智譜深研(DeepSeek)有聯繫的人正在通過OpenAI的應用程序編程接口收集數據。

OpenAI在週三對此事發表了評論,稱他們正在調查這一潛在的泄露情況。

OpenAI的一位發言人週三對《紐約郵報》(The New York Post)表示:“我們知道,中國的一些團體正在積極努力使用包括所謂的蒸餾(distillation)在內的方法,試圖複製美國先進的人工智能模型。”

“我們已經知曉並正在審查深言科技(DeepSeek,一家公司)可能不當蒸餾我們模型的跡象,一旦瞭解更多情況我們將分享相關信息。”