☰

新開普：星普大模型內部測評智能推理效果與DeepSeek-R1相近算力消耗約其1/20

人民財訊3月7日電，新開普(300248)3月6日在機構電話交流會表示，公司自研的星普大模型，通過SFT+RL（監督微調+強化學習）的訓練技術，在內部測評驗證中，實現了與DeepSeek-R1相近的智能推理效果，而算力消耗僅約爲其1/20，下一步將參加行業評測，以獲取行業公認數據。算力消耗降少可降低硬件投入，節約的算力預算可以爲讓渡給軟件提供了空間，爲更多軟件、智能體服務及智能應用提供增加預算的空間，在降低算力硬件投入的同時仍要保證使用體驗與服務精度。

相關資訊

▣ 新開普：小美同學AI助手、星工場智能體接入DeepSeek R1模型
▣ 阿里凌晨開源新模型：性能對標DeepSeek-R1，參數僅爲其1/20
▣ Alibaba 新開源模型 QwQ-32B：以更小算力匹敵 DeepSeek-R1
▣ 成都華微：全力推進DeepSeek R1推理模型在端側推理芯片部署
▣ 阿里推出全新推理模型僅1/21參數媲美DeepSeek R1
▣ 檢驗大模型數學推理能力，司南發佈全新評測指標與評測集
▣ 報告預計智能算力規模增長 DeepSeek推動普及應用
▣ 基石智算正式上線 DeepSeek-R1 系列模型
▣ 剛剛！螞蟻推出首個金融推理大模型，登頂權威金融測評，超越OpenAI o1、DeepSeek-R1
▣ 黃仁勳:未來推理模型會消耗更多算力
騰訊升級人工智能推理模型混元T1 稱性能可媲美 DeepSeek 的R1
▣ 電科數字：公司自研智鷹智算管理平臺已接入DeepSeek V3/R1大模型
▣ 豆包大模型推理算力需求測算
▣ 科大訊飛：星火大模型在國產算力平臺上實現訓練與推理，訓練成本與DeepSeek V3相當
▣ 智微智能：推出搭載DeepSeek模型的高性能算力一體機
▣ 阿里雲一站式智能大數據開發治理平臺DataWorks接入DeepSeek-R1（671B）模型
▣ OpenAI CEO 讚譽 DeepSeek-R1，OpenAI 推出新模型
▣ 秘塔 AI 接入滿血版 DeepSeek R1 推理模型
▣ 騰訊自研的推理模型來了：性能比肩DeepSeek-R1，價格是其四分之一
▣ 百度智能雲宣佈上線DeepSeek-R1/V3模型
▣ 趣睡科技：與DeepSeek-R1推理模型對接開發睡眠分析服務程序
▣ 微軟正在開發內部人工智能推理模型與OpenAI展開競爭
▣ 北新建材：公司近期已接入DeepSeek-R1大模型
▣ 零跑汽車已部署DeepSeek-R1大模型
▣ 立昂技術：已在“立昂領算雲”平臺上架最新版DeepSeek-R1 660B推理模型
打破大模型評審空白 DeepSeek-R1登《自然》
▣ 蓮花控股：控股孫公司蓮花紫星已在自有算力上成功部署DeepSeek R1大模型
▣ 阿里開源新推理模型比肩DeepSeek-R1，港股科技30ETF(513160)連續2日大漲！
▣ 網易雲音樂接入 DeepSeek-R1 大模型，用於歌曲智能推薦等領域

DMCA | PRIVACY | s@bg3.co

新開普：星普大模型內部測評智能推理效果與DeepSeek-R1相近 算力消耗約其1/20

相關資訊

新開普：星普大模型內部測評智能推理效果與DeepSeek-R1相近算力消耗約其1/20