中國移動推出九天深度思考大模型 已完成17款國產AI芯片適配

3月11日消息,中國移動於近日推出了自主研發的“九天深度思考大模型”。

中國移動從2013年開始人工智能技術和產品的自主研發,經過十一年技術攻關,打造了“九天”大模型和人工智能平臺等標誌性產品,其中,“九天”大模型已囊括多模態、語言、視覺、語音及結構化數據等全系列,覆蓋從十億到萬億參數量全規格。

近日,“九天”多模態大模型在MVBench視頻理解評測榜單上榮登榜首。爲進一步解決人工智能落地行業過程中必須要攻克的“複雜系統智能化”難題,中國移動專門全新研發了“九天深度思考大模型”,通過模擬人類思維過程的進階處理方式,在複雜任務推理、精準意圖理解和專業領域知識應用等方面展現出顯著優勢。

據瞭解,“九天深度思考大模型”具備嚴謹的數學推理能力、文字組織能力及豐富的行業知識。與傳統語言大模型不同,“九天深度思考大模型”在處理問題時並非直接生成答案,而是通過多次迭代的“慢思考”過程,確保每個結論均經過嚴謹推演。例如,面對數學問題,大模型會先拆解題目條件,調用相關公式和定理,再通過分步計算驗證結果;對於開放性問題,則通過語義深度分析生成結構化的論述。這種“慢思考”模式不僅提升了複雜任務的準確性,還顯著增強了答案的可解釋性。此外,中國移動九天團隊在大模型訓練中引入了跨領域知識融合策略,結合大規模行業語料庫與通用語料,使其能夠靈活切換專業場景,同時保持自然語言生成的流暢性。

測試結果表明,“九天深度思考大模型”在代碼理解、數學計算、生成內容邏輯、專業知識全面性和準確性等方面效果顯著提高,並在奧林匹克數學考試題、GPQA兩個數據集中表現優異。

九天大模型的技術優勢體現在四大核心領域,一是實現全鏈路自主創新,覆蓋數據集構建、預訓練、微調、強化學習及推理等關鍵環節;二是完成全棧國產化支持,基於國產萬卡算力集羣與算法框架,完成17款國產AI芯片的適配驗證,實現跨芯片架構的無縫遷移與持續訓練;三是打造體系化AI技術體系,憑藉算力網絡優勢實現開放環境下AI能力的智能調度與彈性部署;四是強化複雜系統智能化能力,打造行業智能化引擎,深度解構通信、能源等重點領域業務邏輯,實現AI能力與產業場景的有機融合。(崔玉賢)

本文來自本站科技報道,更多資訊和深度內容,關注我們。