DeepSeek開源第一個用於混合專家模型訓練和推理的高效專家並行通信庫
2月25日,DeepSeek在“開源周”的第二天向公衆開源了DeepEP。據介紹,DeepEP是第一個用於MoE(混合專家)模型訓練和推理的EP(Expert Parallelism,專家並行)通信庫,可以實現高效且優化的全對全通信,支持包括FP8在內的低精度運算,適配現代高性能計算需求。
同時,DeepEP針對NVLink到RDMA的非對稱帶寬轉發場景進行了深度優化,不僅提供了高吞吐量,還支持SM(Streaming Multiprocessors)數量控制,兼顧訓練和推理任務的高吞吐量表現。對於延遲敏感的推理解碼場景,DeepEP還提供了純RDMA的低延遲內核,支持自適應路由,能實現更靈活的GPU資源控制,滿足不同場景需求。
相關資訊
- ▣ 專家模型不要專家並行!微軟開源MoE新路徑
- ▣ 芯朋微:公司近期已接入Deepseek,啓動基於開源大模型的自有垂直專業模型訓練計劃
- ▣ DeepSeek推出NSA 用於超快速的長上下文訓練和推理
- ▣ 騰訊科技申請電池健康狀態估計模型訓練專利,提高用於電池健康狀態估計的模型的訓練效果
- ▣ 騰訊公司申請模型訓練專利,提升模型訓練效果
- ▣ Meta首席AI科學家:DeepSeek的成功表明開源模型正在超越專有模型
- ▣ 浪潮雲申請針對 AI 大模型的模型數據錄入專利,提高模型訓練效率和準確性
- ▣ 華爲模型訓練和車輛控制專利公佈 可應用於AI領域
- ▣ 浪潮通信申請用於多模態大模型的專利,提升視頻搜索效率
- ▣ 外媒:DeepSeek省了訓練費,但推理模型應用成"燒錢黑洞"
- ▣ 杭州深度思考人工智能申請用於人臉建模的克里金大模型自適應訓練方法及系統專利,通過採用主動學習和Kriging模型提高模型學習效率
- ▣ 高通申請在屬於第一BSS的STA處執行的方法和無線通信設備專利,提升無線通信效果
- ▣ 北京微芯感知申請基於隱私保護的大模型的訓練方法專利,保證集中化訓練高效
- ▣ 中新賽克:已積極接入Deepseek等新模型應用並推出安全運維AI專家
- ▣ 暗物智能申請基於大模型和ASR的視頻處理專利,實現視頻資源高效剪輯和管理
- ▣ 京東城市取得用於房屋異常使用識別的模型訓練方法和裝置專利
- ▣ 百度國際申請基於大模型的多模態內容提取模型的訓練方法及智能體專利,有效提高訓練的多模態內容提取模型的準確性
- ▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型
- ▣ 工商銀行申請模型訓練和雲手機識別專利,提高雲手機識別的效率和準確性
- 美管制晶片出口 專家:反而催生出DeepSeek高效AI模型
- ▣ 歡太科技申請搜索相關專利,提高待訓練模型訓練效率
- ▣ 國家網信辦開展整治專項行動並通報典型案例
- ▣ 上海:加速通用和專用大模型融合創新,打造一批行業基座大模型
- ChatGPT教育版推出 對話和數據不用於訓練模型
- ▣ 第一個100%開源的MoE大模型,7B的參數,1B的推理成本
- ▣ 北京達佳互聯申請語音合成模型相關專利,提高訓練效率和準確率
- ▣ 愛立信取得用於節點故障管理的管理模型專利
- ▣ 譚待:豆包1.5Pro模型的預訓練、推理成本均低於國內模型
- ▣ 騰訊混元文生圖大模型開源訓練代碼