從AI智能體到DeepSeek,GDC大會勾勒AI國產化發展前景
近年來,人工智能技術快速發展,驅動着全球範圍內開始崛起“智能產業經濟”的新範式,並正以前所未有的速度重塑人類文明圖景。
未來,人工智能領域會有哪些變革和成果?行業內對人工智能有哪些期待或訴求?中國人工智能產業將面臨哪些新機遇、哪些新挑戰?
2月,在以“模塑全球,無限可能”爲主題的2025全球開發者先鋒大會(GDC)上,多位行業專家、大咖齊聚一堂,一起探討未來人工智能領域發展的新趨勢和新動向。
智能體將在toB領域爆發
人工智能公司英偉達認爲:2025年將成爲AI智能體發展歷程中的關鍵節點,即所謂的元年。
近期,“AI智能體(Agent)”一詞逐漸成爲市場熱議的焦點。智能體區別於此前的AI大語言模型(LLM)。被認爲是一種能夠自主感知環境、進行決策並執行相應行動以達成特定目標的系統。
業內普遍認爲,隨着可訓練預料和數據的消耗殆盡,大模型將趨於收斂。而智能體或將是人工智能行業的下一個爆發拐點。
螞蟻數科AI技術負責人章鵬則進一步提出:2025不僅是智能體元年,還是智能體toB爆發的元年。
章鵬認爲,智能體的發展趨勢是自然而然的,在業內對大語言模型的缺陷進行彌補和優化的過程中,各項技術的結合最終形成了智能體。而智能體的行業應用將在數字化水平比較高的領域率先展開,例如金融、教育、醫療領域。
事實上,在一些對數據治理和流程優化有長期需求的領域裡,AI已經早已切入了多個場景,實現了行業內的效率加速。
例如在醫療領域中,據統計全球範圍內已有數十家頂尖醫院引入了AI輔助診斷系統,能夠通過對醫學影像資料的分析,快速準確地識別出病變部位,爲醫生提供有力的診斷依據。
金融領域中,全球金融機構對於AI的接入更爲廣泛,多家銀行採用AI技術來優化業務流程、提高服務質量和降低運營成本。同時,AI也逐漸在智能風控識別防範金融風險,保障金融市場的穩定和健康發展方面嶄露頭角。
章鵬認爲:“智能體會出現新的摩爾定律,也就是每隔一年我們大模型的能力會翻倍,它的價格會繼續下降”。不過,章鵬同時指出,當前智能體在全面落地階段仍面臨一定的挑戰。
目前,智能體主要面臨的雙重困境:包括複雜任務的規劃能力不足;和在線推理效率存在瓶頸。
首先,toB的場景複雜多變,且容錯率較低。在需要多步驟、多工具協同的複雜場景中,往往難以實現可靠的任務分解和正確的路徑規劃。
其次,在落地方面還面臨在線推理效率的瓶頸問題。其原因包括昂貴的生產資料,如GPU硬件、電力成本等;以及隨着大模型參數規模的擴大和多模態的發展,進一步提高了推理成本。
階躍星辰CEO姜大昕認爲“智能體爆發至少需要2大能力,一個是多模態的能力,一個是推理的能力”。其中,多模態的能力可以幫助智能體更好地感知和了解用戶所處的物理世界,更好地理解用戶的意圖和任務;而推理的能力則決定了智能體任務完成的成功率。
目前,DeepSeek發佈的R1模型在推理能力方面已拔得頭籌。而在多模態方面,階躍星辰則走在行業前列。今年年初,階躍星辰一週內批量更新了6款模型,全方位涵蓋語言、語音、推理、圖片理解、視頻生成等多類別。
國產化長坡厚雪
近年來,曾被技術禁運與專利壁壘層層封鎖的中國高科技產業,正在全球創新版圖上撕開一道裂縫。從芯片斷供後“麒麟芯片”的絕地突圍,到算力封鎖下DeepSeek的四兩撥千斤。國產化浪潮正在從由內而外地重塑着全球高科技產業鏈。
在人工智能領域,AI算力GPU作爲核心硬件,最爲被市場所關注。當前,雖然國產AI算力GPU近年來取得了顯著進展,如華爲的910B系列、摩爾線程的S4000系列等,越來越多的企業開始採用國產GPU替代進口產品。但在市場佔有率上仍難以與英偉達相抗衡。
臨港算力上海科技有限公司,國產算力智算專家張佳偉博士認爲:“在特定的大模型推理場景中,國產GPU展現出與NVIDIA的GPU相媲美的性能”。張佳偉稱:“國產GPU如華爲、沐曦、海光等開始在大規模模型推理中發揮作用,提升了推理效率。”
但同時,張佳偉也承認,國產AI芯片要實現替代還有一定距離。
其中,算力與能效比是衡量GPU性能的關鍵指標。根據專業機構測評,當前國產AI算力GPU的單卡的綜合能力還難以撼動英偉達的市場地位。
國內企業目前探索的解決方案包括兩種,一是以量取勝,創建“萬卡集羣”。
目前,臨港算力上海科技有限公司已建立了從基礎設施到算力底座,再到上層管理平臺,最終到場景和服務等,完整的端到端算力服務解決方案。未來兩年還將具備二十萬張高性能算力卡的基礎設施能力,從而支持國內廠商追上國際水平。
其二是優化兼容,針對國產GPU開發穩定、高效的底層算法和中間層軟件。
華爲雲昇思生態副總監林翰,從軟件技術的角度,介紹了AI框架在人工智能產業中的重要地位。
據瞭解,AI框架的主要作用之一是連接底層硬件與上層AI算法。目前,PyTorch作爲業內主流框架,與英偉達GPU及CUDA生態的適配性和契合度在業內最爲成熟。而國產AI框架則一直是追趕者的角色。
但國產軟硬件產業需要發展壯大,作爲中間層的AI框架也必須迎頭趕上。近年來,隨着國內企業和開發者的前赴後繼,中國IA框架也越來越成熟和具有競爭力。
林翰介紹:根據IDC的統計數據,截至2024年底,昇思的MindSpore在中國AI框架的市場份額已經超過了30%,市場份額增速已連續兩年保持第一。2024年基於MindSpore發表的AI領域論文是超過了一千九百篇,排名到了全全球第二。
目前,AI大模型仍在持續跨越式的演進,對AI框架在解決計算、效率、調度等方面提出了更高的挑戰。或將成爲國產AI學習框架實現彎道超車的最佳機遇。
DeepSeek,不止是普惠
在GDC大會的衆多分享中,DeepSeek是被提及最多的中國人工智能企業。在有限的算力資源情況下,DeepSeek以極低的成本訓練出了媲美openAI的大模型,並自主探索出了並行計算、混合專家、長思維鏈等領先技術。
上海科學智能研究院院長、復旦大學特聘教授漆遠教授指出:“DeepSeek是一個普惠智能”。事實上,從經濟和商業角度來看,DeepSeek極大得促進了大模型的普遍應用。”
漆遠以“傑文斯悖論”爲例,認爲當技術進步提高了資源的效率後,資源消耗不僅不會減少,反而會激增。
“對於大模型而言,DeepSeek無疑推動了人工智能的大規模普及。目前大量海外雲廠商,如微軟雲、亞馬遜雲;國內包括華爲雲、阿里雲等均部署了DeepSeek。說明大家正海量使用着DeepSeek開源的技術。而開源也加強了行業間、用戶間的信任。”
對於業內人士而言,DeepSeek的創新和開源更像是一盞指路明燈。
中科曙光智能計算產品事業部總監高璇稱:“DeepSeek除了讓我們能低成本地用上了大模型以外,還從底層技術、算法以及一些軟件工程等多方面,帶給我們一些新的創新機會。
高璇總結了DeepSeek帶給行業的的三點創新啓發。從底層來看,DeepSeek讓業內開始重視起類似於彙編等更底層的技術優化。而在此之前,這一塊的創新往往被忽略。
中間層裡,DeepSeek驗證了FP8精度的有效性,未來或將引發國產廠商更多的去側重開發對於FP8精度的支持。另外包括一些通算融合、PD分離的策略,要求模型跟算力做到深度的耦合。
從上層模型來看,包括對強化學習(RL)以及思維鏈(CoT)的應用,或將帶動未來推理應用場景的大幅增加。
高璇稱:“未來AI思維鏈這一層將會有非常多的機會點,要把整個行業跟技術去做到一個更深層次的結合,這樣才能帶來AI應用思維的全面升級。”
章鵬也認爲,DeepSeek帶來的AI普及會進一步推動智能體的繁榮,因爲推理模型能幫助智能體提升在“任務規劃”等艱難環節的效率。