阿里、智譜等扎堆發佈大模型 編程、金融等方向成焦點
《科創板日報》7月30日訊(記者 黃心怡)近期的大模型圈子,可謂是熱鬧非凡。
自7月22日以來,阿里巴巴接連開源了四個模型,分別涉及基礎模型、編程模型、推理模型和視頻模型等,包括開源視頻生成模型通義萬相2.2、千問3最新版基礎模型(非思考版)、千問3推理模型以及AI編程模型Qwen3-Coder。
在7月28日,螞蟻數科、智譜AI也相繼發佈大模型,聚焦垂類賽道。
其中,螞蟻數科發佈的金融推理大模型Agentar-Fin-R1,包括32B和8B參數兩個版本。螞蟻數科還推出基於百靈大模型的MOE架構模型,以及非推理版本的14B和72B參數大模型。智譜AI則發佈新一代旗艦模型GLM-4.5,專爲智能體應用打造。此外,月之暗面也於本月開源併發布了MoE 架構基礎模型Kimi K2。
《科創板日報》注意到,編程能力成爲多個企業的重點提升方向。比如,Kimi K2強調具備更強代碼能力。在前端開發任務中,Kimi K2 擅長生成兼具設計感與視覺表現力的代碼,支持粒子系統、可視化和 3D 場景等表現形式。Kimi K2 One-shot可在無具體指令下,自動選用 TradingView,搭建了完整的期貨交易系統界面。
智譜AI發佈的GLM-4.5則首次在單個模型中實現推理、編碼和智能體能力的原生融合,滿足智能體應用的複雜需求。
阿里的Qwen3-Coder是千問系列模型中首個採用混合專家MoE架構的代碼模型,支持Agent調用各種工具,解決複雜編程任務,實現網頁開發、AI搜索、深度研究等智能體應用。
今年早些時候,Anthropic的創始人、CEO Dario Amodei曾預測,距離AI編寫90%代碼的時代已經不遠了。再過一年,AI甚至可能編寫所有的代碼。
“今年的AI編程變得更好用了,相比去年成功率大漲。”在2025世界人工智能大會AI女性菁英論壇上,宇樹科技創始人王興興談及AI時表示, “現在我很多代碼都偷懶不寫了,交給大語言模型來寫。去年的成功率還不高,會有很多錯誤。而今年,比如生成一個抽獎的軟件,成功率可以達到90%以上,這大大降低了科學研究、AI軟件算法的難度。”
對於AI編程的發展趨勢,阿里雲百鍊高級產品專家徐志遠在接受《科創板日報》採訪時表示,AI並不是要替代某種角色,程序員的每層工作本身都沒有消失,改變的是完成工作的某一種方式。在如今的模型發展趨勢下,重新思考利用新的技術、新的模型、新的編程的範式來達到目標。
“甚至某種意義上,可能在未來會進一步的淡化程序員初級、中級、高級等的層級概念。對AI工具的理解程度,對vibe coding(氛圍編程)的接受程度、對Coder模型的使用程度,甚至對模型進步、下一代趨勢發展的判斷程度,決定了產出的高和低。而不是傳統的有十年、三年或者一年代碼經驗,做過多麼深度的項目。今年有大量的初創團隊可能只有那麼一兩名程序員,但能夠非常深刻理解和使用新型AI工具,來構建出非常令人驚豔的項目。”
除了編程外,金融大模型是一大重要垂類方向。螞蟻數科CEO趙聞飆認爲,通用大模型距離產業實際應用通常存在“知識鴻溝”。構建專業的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應用深度將成爲金融機構競爭力的關鍵要素。
螞蟻數科CTO王維在接受《科創板日報》採訪時表示,金融行業把AI用好依然面臨很多挑戰。“金融在AI場景中遇到很多的幻覺和差錯,或者回答未達到金融級審慎的要求,如果把AI用好,不得不面臨一個挑戰,如何把通用能力和場景鴻溝彌合。所以我們選擇從通用大模型向專業/專用模型演進。“
王維判斷,金融推理模型會越來越被需要,因爲金融類複雜場景的業務,需要模型的整個推理鏈條和推理邏輯都很清晰,才能真正解決問題。
“一個好的垂直大模型,特別是推理能力很強的大模型,才能成爲智能體可控、可靠、可優化的智能中樞。沒有這個東西,就像缺少關鍵的齒輪,導致其他的齒輪帶不動。如果推理模型的泛化能力、意圖識別能力、結構化表達的能力都不在線,很難相信企業願意用這樣新的技術方式取代原有的業務模式,更不能談增量價值的創造了。”