新開普:星普大模型內部測評智能推理效果與DeepSeek-R1相近 算力消耗約其1/20
人民財訊3月7日電,新開普(300248)3月6日在機構電話交流會表示,公司自研的星普大模型,通過SFT+RL(監督微調+強化學習)的訓練技術,在內部測評驗證中,實現了與DeepSeek-R1相近的智能推理效果,而算力消耗僅約爲其1/20,下一步將參加行業評測,以獲取行業公認數據。算力消耗降少可降低硬件投入,節約的算力預算可以爲讓渡給軟件提供了空間,爲更多軟件、智能體服務及智能應用提供增加預算的空間,在降低算力硬件投入的同時仍要保證使用體驗與服務精度。
相關資訊
- ▣ 新開普:小美同學AI助手、星工場智能體接入DeepSeek R1模型
- ▣ 阿里凌晨開源新模型:性能對標DeepSeek-R1,參數僅爲其1/20
- ▣ Alibaba 新開源模型 QwQ-32B:以更小算力匹敵 DeepSeek-R1
- ▣ 成都華微:全力推進DeepSeek R1推理模型在端側推理芯片部署
- ▣ 阿里推出全新推理模型 僅1/21參數媲美DeepSeek R1
- ▣ 報告預計智能算力規模增長 DeepSeek推動普及應用
- ▣ 檢驗大模型數學推理能力,司南發佈全新評測指標與評測集
- ▣ 基石智算正式上線 DeepSeek-R1 系列模型
- ▣ 黃仁勳:未來推理模型會消耗更多算力
- 騰訊升級人工智能推理模型混元T1 稱性能可媲美 DeepSeek 的R1
- ▣ 電科數字:公司自研智鷹智算管理平臺已接入DeepSeek V3/R1大模型
- ▣ 豆包大模型推理算力需求測算
- ▣ 智微智能:推出搭載DeepSeek模型的高性能算力一體機
- ▣ 科大訊飛:星火大模型在國產算力平臺上實現訓練與推理,訓練成本與DeepSeek V3相當
- ▣ OpenAI CEO 讚譽 DeepSeek-R1,OpenAI 推出新模型
- ▣ 阿里雲一站式智能大數據開發治理平臺DataWorks接入DeepSeek-R1(671B)模型
- ▣ 秘塔 AI 接入滿血版 DeepSeek R1 推理模型
- ▣ 百度智能雲宣佈上線DeepSeek-R1/V3模型
- ▣ 騰訊自研的推理模型來了:性能比肩DeepSeek-R1,價格是其四分之一
- ▣ 趣睡科技:與DeepSeek-R1推理模型對接 開發睡眠分析服務程序
- ▣ 北新建材:公司近期已接入DeepSeek-R1大模型
- ▣ 微軟正在開發內部人工智能推理模型 與OpenAI展開競爭
- ▣ 零跑汽車已部署DeepSeek-R1大模型
- ▣ 立昂技術:已在“立昂領算雲”平臺上架最新版DeepSeek-R1 660B推理模型
- ▣ 蓮花控股:控股孫公司蓮花紫星已在自有算力上成功部署DeepSeek R1大模型
- ▣ 阿里開源新推理模型比肩DeepSeek-R1,港股科技30ETF(513160)連續2日大漲!
- ▣ 網易雲音樂接入 DeepSeek-R1 大模型,用於歌曲智能推薦等領域
- ▣ 微軟正在開發內部人工智能推理模型 並可能將其出售給開發者
- ▣ 微軟CEO納德拉高度評價DeepSeek開源模型,稱其計算效率卓越